CN102542014B - 基于内容的图像检索反馈方法 - Google Patents
基于内容的图像检索反馈方法 Download PDFInfo
- Publication number
- CN102542014B CN102542014B CN 201110423978 CN201110423978A CN102542014B CN 102542014 B CN102542014 B CN 102542014B CN 201110423978 CN201110423978 CN 201110423978 CN 201110423978 A CN201110423978 A CN 201110423978A CN 102542014 B CN102542014 B CN 102542014B
- Authority
- CN
- China
- Prior art keywords
- image
- class label
- feedback
- training sample
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种基于内容图像检索反馈方法,包括:从图像库中选择训练样本,并利用支持向量机对训练样本进行训练,以得到特征分类模型,根据特征分类模型将图像划分到视觉类别中,根据特征分类模型确定用户提交的图像的视觉类别,在视觉类别中检索与用户提交的图像相似的图像,并返回检索结果,在检索结果中选择反馈图像,根据反馈图像与用户提交的图像的相关性将其分别标注为正、负反馈图像,并将标注结果反馈给检索***,根据反馈图像的文本关键字、类别标签以及映射表判断用户提交的图像的准确类别,在准确类别中检索与用户提交的图像相似的图像,并返回二次检索结果。本发明可快速准确定位用户提交的图像的所属类别,并提高了二次检索精度。
Description
技术领域
本发明属于图像检索与识别领域,更具体地说,本发明涉及一种基于内容的图像检索反馈方法。
背景技术
传统的基于内容的图像检索技术的检索精度通常不是很理想,相关反馈技术能够在一定程度上弥补这样的缺点。人们做了许多相关反馈方面的研究工作,也取得了不少成绩。比较典型的有Rui等提出的查询点移动方法,该方法仿照文本检索中的Rachio公式对用户提交的图像的特征向量进行修改,使得其朝着用户期望的方向移动。修改后的特征向量是用户提交的图像的原特征向量、正反馈图像的特征向量以及负反馈图像的特征向量的加权和,使其偏向正反馈图像的特征向量,偏离负反馈图像的特征向量,从而在二次检索时朝着用户期望的结果方向移动。近年来,机器学习方法逐渐成为相关反馈方法的主流,其思想是将相关反馈看做一个带监督的分类问题:将正负反馈样本作为机器学习的正负训练样本,训练一个分类器,并以此作为新的相似性度量函数对图像库中所有图像与用户提交的图像之间进行相似性计算,排序后输出检索结果。
然而,现有的图像检索反馈方法存在以下问题:由于语义鸿沟的存在,传统的改变用户提交的图像特征的方法对二次检索的结果精度提升作用不大;反馈的作用只是针对当次检索,在下次提交相同的图像进行检索时精度依然很低;机器学习的反馈方法在检索时引入了机器学习,实时性难以保证,同时由于样本数量较少,训练效果不明显,对检索精度提升作用不大。
发明内容
本发明的目的在于提供一种基于内容的图像检索反馈方法,该方法在检索***中引入了支持向量机(SVM)对图像进行分类,得到类别标签,并根据反馈图像的类别标签、文本关键字、以及文本关键字与反馈图像类别标签的映射关系,进行图像检索的相关反馈,弥补了初次检索结果精度偏低的缺点,提升了二次检索的精度,同时在多次反馈中提升***检索的精度,自动修改训练样本,缩减人力成本。
本发明是通过以下技术方案实现的:
一种基于内容的图像检索反馈方法,包括以下步骤:
(1)获取图像库中的所有图像,定义图像的视觉类别,并确定视觉类别的数量,每个视觉类别由一个类别标签表示;
(2)提取图像的文本关键字,并建立从文本关键字到类别标签的映射表;
(3)从图像库中选择训练样本,并利用支持向量机对训练样本进行训练,以得到特征分类模型;
(4)根据特征分类模型将图像划分到视觉类别中;
(5)根据特征分类模型确定用户提交的图像的视觉类别,在视觉类别中检索与用户提交的图像相似的图像,并返回检索结果;
(6)在检索结果中选择反馈图像,根据反馈图像与用户提交的图像的相关性将其分别标注为正、负反馈图像,并将标注结果反馈给检索***;
(7)检索***根据反馈图像的文本关键字、类别标签以及映射表判断用户提交的图像的准确类别;
(8)根据准确类别修正反馈图像中分类错误的类别标签、训练样本中有误的反馈图像以及用户提交的图像;
(9)在准确类别中检索与用户提交的图像相似的图像,并返回二次检索结果;
(10)判断二次检索结果是否满足检索要求;
(11)若二次检索结果不满足检索要求,则返回步骤(6),若二次检索结果满足检索要求,则进入步骤(12);
(12)判断训练样本的修正数量是否达到训练样本中的图像总数的10%,若达到,则进入步骤(13),否则过程结束;
(13)按修正的训练样本重新训练特征分类模型,对图像库中的图像分类,并更新其分类标签。
步骤(2)包括以下子步骤:提取图像库中的图像的网页文本,分析网页文本,剔除其中所含的超文本标记语言标签,并提取其正文文本,利用中科院计算所的汉语词法分析***对正文文本进行分词,并剔除无关词语,得到图像的文本关键字,将文本关键字根据其语义划分到视觉类别中,建立文本关键字到视觉类别标签的映射表。
步骤(7)包括以下子步骤:根据映射表获得正反馈图像的文本关键字对应的类别标签,统计类别标签中不同类别标签的数量,并获得类别标签数量最多的类别标签,若数量最多的类别标签种类唯一,则判断该类别标签作为用户提交的图像的准确类别。
步骤(7)还包括以下子步骤:若数量最多的类别标签种类不唯一,则根据映射表获得负反馈图像的文本关键字对应的类别标签,统计类别标签中不同类别标签的数量,并根据数量由多到少将类别标签排序,并存放到负反馈类别列表中,从数量最多的类别标签中顺次剔除在负反馈类别列表中出现的类别标签,直到数量最多的类别标签种类唯一,并判断该类别标签作为用户提交的图像的准确类别。
步骤(8)包括以下子步骤:若正反馈图像的类别标签与用户提交的图像的准确类别标签不一致,则将正反馈图像的类别修正为用户提交的图像的准确类别,并将正反馈图像添加到准确类别的训练样本中,若负反馈图像的类别标签与用户提交的图像的准确类别标签一致,且准确类别的训练样本中包含负反馈图像,则从准确类别的训练样本中删除负反馈图像,若用户提交的图像的视觉类别与用户提交的图像的准确类别不一致,则将用户提交的图像添加到准确类别的训练样本中。
本发明具有以下的优点和有益效果:
(1)由于引入了文本关键字与图像类别标签的映射关系,利用文本关键字进行反馈,反馈检索的精度将比单纯修改用户提交的图像的底层特征的反馈方法精度提升很多;
(2)在反馈过程中,图像库中的图像的类别有一个自修正的过程,每一次反馈不仅提升了当次检索结果的精度,而且修正了图像库中的分类错误的图像类别,提升了下次检索的精度。随着用户使用次数的增加,检索精度将会越来越高;
(3)反馈过程中主要是利用文本关键字与图像类别标签的映射关系进行简单的计算,判定用户提交的图像的类别,计算量小,实时性高,比基于机器学习的反馈方法速度快很多;
(4)反馈过程中对图像库的训练样本进行自修正,提升了下次训练的精度,同时缩减了挑选样本的人力成本。
附图说明
图1为本发明基于内容的图像检索反馈方法的流程图。
图2为本发明方法中步骤(2)的细化流程图。
图3为本发明方法中步骤(7)的细化流程图。
具体实施方式
首先对本发明中的技术术语进行解释和说明:
视觉类别:在视觉上具有某种意义上相似性的图像的集合定义为一个视觉类别。
类别标签:每一个视觉类别用一个唯一的数字标号表示,该数字标号定义为该视觉类别的类别标签。类别标签是视觉类别的一个别名,主要用于简化视觉类别的表示。
文本关键字:本***图像库中的图像的来源为网络,网络上的图像都有一定的网页文本说明,文本关键字定义为网页文本中最能表征图像语义的那些词语。
训练样本:机器学习理论中的分类算法支持向量机需要一个事先学习的过程,该学习过程需要人工标记过视觉类别的一定数量的样本,将该样本定义为训练样本。
特征分类模型:利用支持向量机根据图像底层特征对训练样本进行训练后得到的分类模型,该模型用来对所有图像进行分类。
反馈图像:用户对检索结果中部分图像标注后反馈给检索***的图像定义为反馈图像。
如图1所示,本发明基于内容的图像检索反馈方法包括以下步骤:
(1)获取图像库中的所有图像,定义图像的视觉类别,并确定视觉类别的数量,每个视觉类别由一个类别标签表示;
(2)提取图像的文本关键字,并建立从文本关键字到类别标签的映射表,具体包括以下子步骤(见图2):
(21)提取图像库中的图像的网页文本;
(22)分析网页文本,剔除其中所含的超文本标记语言标签,并提取其正文文本;
(23)利用中科院计算所的汉语词法分析***对正文文本进行分词,并剔除无关词语,得到图像的文本关键字;
(24)将文本关键字根据其语义划分到视觉类别中;
(25)建立文本关键字到视觉类别标签的映射表。
(3)从图像库中选择训练样本,并利用支持向量机对训练样本进行训练,以得到特征分类模型;
(4)根据特征分类模型将图像划分到视觉类别中;
(5)根据特征分类模型确定用户提交的图像的视觉类别,在视觉类别中检索与用户提交的图像相似的图像,并返回检索结果;
(6)在检索结果中选择反馈图像,根据反馈图像与用户提交的图像的相关性将其分别标注为正、负反馈图像,并将标注结果反馈给检索***;
(7)检索***根据反馈图像的文本关键字、类别标签以及映射表判断用户提交的图像的准确类别,具体包括以下子步骤(见图3):
(71)根据映射表获得正反馈图像的文本关键字对应的类别标签;
(72)统计类别标签中不同类别标签的数量,并获得类别标签数量最多的类别标签;
(73)若数量最多的类别标签种类唯一,进入步骤(77),否则进入步骤(74);
(74)若数量最多的类别标签种类不唯一,则根据映射表获得负反馈图像的文本关键字对应的类别标签;
(75)统计类别标签中不同类别标签的数量,并根据数量由多到少将类别标签排序,并存放到负反馈类别列表中;
(76)从数量最多的类别标签中顺次剔除在负反馈类别列表中出现的类别标签,直到数量最多的类别标签种类唯一;
(77)判断数量最多的类别标签作为用户提交的图像的准确类别。
(8)根据准确类别修正反馈图像中分类错误的类别标签、训练样本中有误的反馈图像以及用户提交的图像。具体包括以下子步骤:
(81)若正反馈图像的类别标签与用户提交的图像的准确类别标签不一致,则将正反馈图像的类别修正为用户提交的图像的准确类别,并将正反馈图像添加到准确类别的训练样本中;
(82)若负反馈图像的类别标签与用户提交的图像的准确类别标签一致,且准确类别的训练样本中包含负反馈图像,则从准确类别的训练样本中删除负反馈图像;
(83)若用户提交的图像的视觉类别与用户提交的图像的准确类别不一致,则将用户提交的图像添加到准确类别的训练样本中。
(9)在准确类别中检索与用户提交的图像相似的图像,并返回二次检索结果;
(10)判断二次检索结果是否满足检索要求;
(11)若二次检索结果不满足检索要求,则返回步骤(6),若二次检索结果满足检索要求,则进入步骤(12);
(12)判断训练样本的修正数量是否达到训练样本中的图像总数的10%,若达到,则进入步骤(13),否则过程结束;
(13)按修正的训练样本重新训练特征分类模型,对图像库中的图像分类,并更新其分类标签。
值得说明的是,本反馈方案建立在对用户充分信任的基础之上,即用户的每个反馈图像标注都准确无误。实际中用户可能会由于疏忽大意等原因对反馈图像标识错误,为了防止这种情况对图像库中的图像信息的错误修改,可以暂缓修改反馈图像的类别标签以及训练样本,给它们加上一个统计数,在用户多次反馈(比如3次)同样的信息后,确认该反馈准确无误,然后修正对反馈图像的类别标签以及训练样本标签。
Claims (1)
1.一种基于内容的图像检索反馈方法,其特征在于,包括以下步骤:
(1)获取图像库中的所有图像,定义所述图像的视觉类别,并确定所述视觉类别的数量,每个视觉类别由一个类别标签表示;
(2)提取所述图像的文本关键字,并建立从所述文本关键字到所述类别标签的映射表;
(3)从所述图像库中选择训练样本,并利用支持向量机对所述训练样本进行训练,以得到特征分类模型;
(4)根据所述特征分类模型将所述图像划分到所述视觉类别中;
(5)根据所述特征分类模型确定用户提交的图像的视觉类别,在所述视觉类别中检索与所述用户提交的图像相似的图像,并返回检索结果;
(6)在所述检索结果中选择反馈图像,根据所述反馈图像与所述用户提交的图像的相关性将其分别标注为正、负反馈图像,并将标注结果反馈给检索***;
(7)所述检索***根据所述反馈图像的文本关键字、类别标签以及所述映射表判断所述用户提交的图像的准确类别;所述步骤(7)包括以下子步骤:
根据所述映射表获得所述正反馈图像的文本关键字对应的类别标签;
统计所述类别标签中不同类别标签的数量,并获得所述类别标签数量最多的类别标签;
若所述数量最多的类别标签种类唯一,则判断该类别标签作为所述用户提交的图像的准确类别;
若所述数量最多的类别标签种类不唯一,则根据所述映射表获得所述负反馈图像的文本关键字对应的类别标签;
统计所述类别标签中不同类别标签的数量,并根据数量由多到少将所述类别标签排序,并存放到负反馈类别列表中;
从数量最多的类别标签中顺次剔除在负反馈类别列表中出现的类别标签,直到所述数量最多的类别标签种类唯一,并判断该类别标签作为所述用户提交的图像的准确类别;
(8)根据所述准确类别修正所述反馈图像中分类错误的类别标签、所述训练样本中有误的反馈图像以及所述用户提交的图像;所述步骤(8)包括以下子步骤:
若所述正反馈图像的类别标签与所述用户提交的图像的准确类别标签不一致,则将所述正反馈图像的类别修正为所述用户提交的图像的准确类别,并将所述正反馈图像添加到所述用户提交的图像的准确类别对应的训练样本中;
若所述负反馈图像的类别标签与所述用户提交的图像的准确类别标签一致,且准确类别的训练样本中包含所述负反馈图像,则从所述准确类别的训练样本中删除所述负反馈图像;
若所述用户提交的图像的视觉类别与所述用户提交的图像的准确类别不一致,则将所述用户提交的图像添加到所述准确类别的训练样本中;
(9)在所述准确类别中检索与所述用户提交的图像相似的图像,并返回二次检索结果;
(10)判断所述二次检索结果是否满足检索要求;
(11)若所述二次检索结果不满足检索要求,则返回步骤(6),若所述二次检索结果满足检索要求,则进入步骤(12);
(12)判断所述训练样本的修正数量是否达到所述训练样本中的图像总数的10%,若达到,则进入步骤(13),否则过程结束;
(13)按修正的所述训练样本重新训练所述特征分类模型,对所述图像库中的图像分类,并更新其分类标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110423978 CN102542014B (zh) | 2011-12-16 | 2011-12-16 | 基于内容的图像检索反馈方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110423978 CN102542014B (zh) | 2011-12-16 | 2011-12-16 | 基于内容的图像检索反馈方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102542014A CN102542014A (zh) | 2012-07-04 |
CN102542014B true CN102542014B (zh) | 2013-09-18 |
Family
ID=46348901
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110423978 Expired - Fee Related CN102542014B (zh) | 2011-12-16 | 2011-12-16 | 基于内容的图像检索反馈方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102542014B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064900A (zh) * | 2012-12-17 | 2013-04-24 | 北京奇虎科技有限公司 | 图片配置装置和方法 |
CN103605992B (zh) * | 2013-11-28 | 2018-01-19 | 国家电网公司 | 一种电力内外网交互中的敏感图像识别方法 |
CN105022752B (zh) * | 2014-04-29 | 2019-04-05 | 中国电信股份有限公司 | 图像检索方法与装置 |
CN104102699B (zh) * | 2014-07-01 | 2018-01-26 | 华中科技大学 | 一种聚簇图集合中的子图检索方法 |
CN105653723B (zh) * | 2016-01-19 | 2019-03-01 | 中国科学技术大学 | 一种用于图像检索的查询图像特征裁剪方法 |
CN107577682B (zh) * | 2016-07-05 | 2021-06-29 | 上海交通大学 | 基于社交图片的用户兴趣挖掘和用户推荐方法及*** |
CN106250916B (zh) * | 2016-07-22 | 2020-02-21 | 西安酷派软件科技有限公司 | 一种筛选图片的方法、装置及终端设备 |
CN107918624B (zh) * | 2016-10-11 | 2022-03-15 | 富士通株式会社 | 图像检索装置及方法、电子设备 |
CN107133280A (zh) * | 2017-04-14 | 2017-09-05 | 合信息技术(北京)有限公司 | 反馈的响应方法及装置 |
CN109447937B (zh) * | 2017-08-29 | 2021-07-06 | ***通信有限公司研究院 | 一种图像处理模型的确定方法及其相关装置 |
CN107818160A (zh) * | 2017-10-31 | 2018-03-20 | 上海掌门科技有限公司 | 表情标签更新和实现表情获取的方法、设备及*** |
CN110020078B (zh) * | 2017-12-01 | 2021-08-20 | 北京搜狗科技发展有限公司 | 一种生成相关性映射字典及其验证相关性的方法和相关装置 |
CN108563683A (zh) * | 2018-03-08 | 2018-09-21 | 北京达佳互联信息技术有限公司 | 标签添加方法、装置及终端 |
CN112074827A (zh) * | 2018-04-27 | 2020-12-11 | 上海趋视信息科技有限公司 | 图像归档的***和方法 |
CN108563792B (zh) * | 2018-05-02 | 2020-02-07 | 百度在线网络技术(北京)有限公司 | 图像检索处理方法、服务器、客户端及存储介质 |
US11704487B2 (en) * | 2019-04-04 | 2023-07-18 | Beijing Jingdong Shangke Information Technology Co., Ltd. | System and method for fashion attributes extraction |
CN110210535B (zh) * | 2019-05-21 | 2021-09-10 | 北京市商汤科技开发有限公司 | 神经网络训练方法及装置以及图像处理方法及装置 |
CN110163296B (zh) * | 2019-05-29 | 2020-12-18 | 北京达佳互联信息技术有限公司 | 图像识别的方法、装置、设备及存储介质 |
CN110909776A (zh) * | 2019-11-11 | 2020-03-24 | 维沃移动通信有限公司 | 一种图像识别方法及电子设备 |
CN111783903B (zh) * | 2020-08-05 | 2023-11-28 | 腾讯科技(深圳)有限公司 | 文本处理方法、文本模型的处理方法及装置、计算机设备 |
CN113989610B (zh) * | 2021-12-27 | 2022-04-05 | 广州思德医疗科技有限公司 | 一种图像智能标注方法、装置及*** |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101833565A (zh) * | 2010-03-31 | 2010-09-15 | 南京大学 | 一种主动选择代表性图像的相关反馈方法 |
-
2011
- 2011-12-16 CN CN 201110423978 patent/CN102542014B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101833565A (zh) * | 2010-03-31 | 2010-09-15 | 南京大学 | 一种主动选择代表性图像的相关反馈方法 |
Non-Patent Citations (3)
Title |
---|
En Cheng et al.USING IMPLICIT RELEVANE FEEDBACK TO ADVANCE WEB IMAGE SEARCH.《2006IEEE》.2006,第1773-1776页. |
USING IMPLICIT RELEVANE FEEDBACK TO ADVANCE WEB IMAGE SEARCH;En Cheng et al;《2006IEEE》;20061231;第1773-1776页 * |
姜文超 等.Web图像搜索***中用户交互及反馈***模型.《华中科技大学学报(自然科学版)》.2006,第34卷第108-111页. * |
Also Published As
Publication number | Publication date |
---|---|
CN102542014A (zh) | 2012-07-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102542014B (zh) | 基于内容的图像检索反馈方法 | |
CN108121829B (zh) | 面向软件缺陷的领域知识图谱自动化构建方法 | |
US20210382878A1 (en) | Systems and methods for generating a contextually and conversationally correct response to a query | |
US11030199B2 (en) | Systems and methods for contextual retrieval and contextual display of records | |
CN112035653B (zh) | 一种政策关键信息提取方法和装置、存储介质、电子设备 | |
US10366093B2 (en) | Query result bottom retrieval method and apparatus | |
WO2016179938A1 (zh) | 题目推荐方法和题目推荐装置 | |
CN106202380B (zh) | 一种分类语料库的构建方法、***及具有该***的服务器 | |
CN112182148B (zh) | 一种基于全文检索的标准辅助编写方法 | |
WO2020233344A1 (zh) | 一种搜索方法、装置及存储介质 | |
Malik et al. | Accurate information extraction for quantitative financial events | |
CN112035675A (zh) | 医疗文本标注方法、装置、设备及存储介质 | |
CN110134799B (zh) | 一种基于bm25算法的文本语料库的搭建和优化方法 | |
CN111930933A (zh) | 一种基于人工智能的检务案件处理方法及装置 | |
CN109857957B (zh) | 建立标签库的方法、电子设备及计算机存储介质 | |
Feng et al. | Practical duplicate bug reports detection in a large web-based development community | |
CN112597283A (zh) | 通知文本信息实体属性抽取方法、计算机设备及存储介质 | |
CN112380848B (zh) | 文本生成方法、装置、设备及存储介质 | |
CN108038099A (zh) | 基于词聚类的低频关键词识别方法 | |
CN106294786A (zh) | 一种代码搜索方法和*** | |
CN106339459A (zh) | 基于关键词匹配进行中文网页预分类的方法 | |
CN109948015B (zh) | 一种元搜索列表结果抽取方法及*** | |
CN109871429B (zh) | 融合Wikipedia分类及显式语义特征的短文本检索方法 | |
CN114003750B (zh) | 物料上线方法、装置、设备及存储介质 | |
CN110362694A (zh) | 基于人工智能的文献数据检索方法、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130918 Termination date: 20151216 |
|
EXPY | Termination of patent right or utility model |