CN102609458A - 一种图片推荐方法和装置 - Google Patents

一种图片推荐方法和装置 Download PDF

Info

Publication number
CN102609458A
CN102609458A CN2012100090437A CN201210009043A CN102609458A CN 102609458 A CN102609458 A CN 102609458A CN 2012100090437 A CN2012100090437 A CN 2012100090437A CN 201210009043 A CN201210009043 A CN 201210009043A CN 102609458 A CN102609458 A CN 102609458A
Authority
CN
China
Prior art keywords
picture
keyword
speech
text
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012100090437A
Other languages
English (en)
Other versions
CN102609458B (zh
Inventor
路晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sogou Technology Development Co Ltd
Beijing Sogou Information Service Co Ltd
Original Assignee
Beijing Sogou Technology Development Co Ltd
Beijing Sogou Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sogou Technology Development Co Ltd, Beijing Sogou Information Service Co Ltd filed Critical Beijing Sogou Technology Development Co Ltd
Priority to CN201210009043.7A priority Critical patent/CN102609458B/zh
Publication of CN102609458A publication Critical patent/CN102609458A/zh
Application granted granted Critical
Publication of CN102609458B publication Critical patent/CN102609458B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了一种图片推荐方法和装置,其中的方法具体包括:接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。本申请能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。

Description

一种图片推荐方法和装置
技术领域
本申请涉及图片处理技术领域,特别是涉及一种图片推荐方法和装置。
背景技术
目前随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的搜索,很多用户还希望可以通过搜索引擎对网络图片进行搜索。
目前的图片搜索引擎大都采用基于文本的搜索技术,该技术将图片作为数据库存储的对象,用关键字对其进行描述。然而对于图片中包含的视觉特征,如颜色或形状等,无法用文本进行描述,这样,当需要根据图片中包含的视觉特征搜索图片时,基于文本的搜索技术将不再适用。例如,用户经常遇到这样的问题,在网站或电脑上看到一张包含物品的图片,但并不知道该图片中的物品是什么,故很难将该物品的视觉特征用语言描述出来,即便表达能力好的用户将其视觉特征描述出来了,也很难在现有的搜索引擎中找到与该图片相似的图片,导致搜索效率低下,使用网络流量较大。
针对上述搜索效率低下、使用网络流量较大的问题,一些图片搜索引擎提供以图搜图功能,该以图搜图功能将视觉内容一致的图片返回给用户,以满足用户的某些搜索需求。例如某些用户爱好搜集图片,最不能容忍的就是美图上面有水印,只要上传图片到图片搜索引擎,轻轻一点便能搜出不带水印的图片;又如,可以上传小图片,搜到这个小图片的各个版本,如清晰大图等。
还有一些图片搜索引擎在提供以图搜图功能的同时提供图片推荐功能,参照图1,示出了现有技术一种图片搜索引擎中图片推荐方法的流程图,具体可以包括:
步骤101、用户提交查询图片;
步骤102、抽取查询图片的颜色、纹理、形状等视觉特征;
步骤103、将查询图片的视觉特征与数据库中图片的视觉特征进行相似性比对;
步骤104、将视觉相似图片推荐给用户。
由于图片推荐结果依据的颜色、纹理、形状等视觉特征比对得到,故这里的视觉相似主要指外观相似,例如用户上传妮可基德曼的图片,图片中妮可基德曼的头发颜色为金色,则图片搜索引擎可能会返回视觉相似的含有金色头发的图片,如金发女郎的图片,有时甚至会返回金毛犬的图片,等等。
但有些用户存在一些个性化需求,如用户上传刘德华的图片,还可能希望看到刘德华的电影海报、个人写真等图片。此时,现有技术中视觉内容一致的搜索结果和视觉相似的图片推荐结果均不能满足用户的个性化需求。
总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够提供契合用户个性化需求的图片。
发明内容
本申请所要解决的技术问题是提供一种图片推荐方法和装置,能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。
为了解决上述问题,本申请公开了一种图片推荐方法,包括:
接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。
优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,包括:
依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;
抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述词或短语;所述实体词库存储有具有实际意义的实体词。
优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括:
在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述词或短语。
优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还包括:
依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
优选的,所述方法还包括:
在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
所述将与关键词匹配的相应目标图片推荐给用户的步骤为,将所述剩余图片推荐给用户。
优选的,所述将与关键词匹配的相应目标图片推荐给用户的步骤,包括:
依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;
按照在线查询请求数目的降序将与关键词匹配的相应目标图片推荐给用户。
优选的,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
另一方面,本申请还公开了一种图片推荐装置,包括:
图片搜索模块,用于接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
关键词抽取模块,用于依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
匹配模块,用于在搜索日志中进行关键词的匹配;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词;及
图片推荐模块,用于将与关键词匹配的相应目标图片推荐给用户。
优选的,所述关键词抽取模块包括:
去除子模块,用于依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;及
抽取子模块,用于抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
优选的,所述装置还包括:
第一实际意义抽取模块,用于调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语;所述实体词库存储有具有实际意义的实体词。
优选的,所述装置还包括:
第二实际意义抽取模块,用于依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括:在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述剩余文本中的词或短语。
优选的,所述关键词抽取模块还包括:
边缘词统计子模块,用于依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
优选的,所述装置还包括:
滤除模块,用于在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
所述图片推荐模块,具体用于将所述剩余图片推荐给用户。
优选的,所述图片推荐模块包括:
数目统计子模块,用于依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;
降序推荐子模块,用于按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。
优选的,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
与现有技术相比,本申请具有以下优点:
相对于现有技术采用视觉特征描述查询图片,本申请采用关键词描述查询图片的图片语义特征,并在搜索日志中记录全网在线查询请求对应的目标图片及相应的关键词;由于关键词所描述的图片语义特征能够反映用户的兴趣爱好,这样,在一个用户提交查询请求时,本申请能够依据所得到目标图片的关键词和所述搜索日志中目标图片的关键词,匹配得到具有相同兴趣爱好的其它用户查询请求对应的目标图片,也即与关键词匹配的相应目标图片能够契合用户的兴趣爱好,因此,将从搜索日志中提取出来的与关键词匹配的相应目标图片推荐给当前用户,提供了契合用户个性化需求的图片,扩展了用户感兴趣信息的获取渠道。
附图说明
图1是现有技术一种图片搜索引擎中图片推荐方法的流程图;
图2是本申请一种图片推荐方法实施例的流程图;
图3是本申请一种图片推荐装置实施例的结构图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
用户个性化需求往往是源自用户的兴趣爱好的,例如,某用户有追星的爱好,其是刘德华的粉丝,则他在上传刘德华的图片时,很有可能还希望看到刘德华的电影海报、个人写真等图片;又如,另一用户是电影爱好者,其对《当幸福来敲门》这部电影有着由衷的爱好,则他在上传《当幸福来敲门》的电影海报时,很有可能还希望看到更多该电影的其它不同海报。现有技术视觉相似的搜索结果是无法满足在上述情形下的用户个性化需求。
本申请实施例的核心构思之一在于,根据当前用户输入图片的局部特征得到目标图片和与其特征内容相似或相同的多个结果图片,对结果图片所在页面分别进行分析,综合各页面中标题、文本等文字信息,得到的关键词与目标图片关联;由于关键词所描述的图片语义特征能够反映用户的兴趣爱好,这样,在一个用户提交查询请求时,本申请能够依据所得到目标图片的关键词和所述搜索日志中目标图片的关键词,匹配得到具有相同兴趣爱好的其它用户查询请求对应的对应目标图片,也即与关键词匹配的相应目标图片能够契合用户的兴趣爱好,因此,将与关键词匹配的相应目标图片推荐给用户能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。
参照图2,示出了本申请一种图片推荐方法实施例的流程图,具体可以包括:
步骤201、接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
本申请可以应用于图片搜索引擎中,用以扩充图片搜索引擎的功能,也即,使得图片搜索引擎具备原有的以图搜图功能,同时具备本申请的图片推荐功能。实际上,本申请还可以应用于其它搜索引擎或搜索装置,本申请对具体的应用环境不加以限制。
在实际中,用户可在浏览器中提交在线查询请求,这里的提交在线查询请求的方式可以包括直接上传本地图片,或者提供图片的网络地址,由服务器自动下载图片,本申请对具体的提交在线查询请求的方式不加以限制。也即,本申请实施例中,与该查询请求直接对应的图片可以包括用户直接上传的本地图片,也可以包括依据用户提供的图片的网络地址得到图片。
在具体实现中,服务器可根据该查询请求直接对应的图片的视觉内容,抽取出局部特征,然后进行图片搜索,与数据库中各图片的局部特征进行匹配,如果匹配率在一定阈值范围(如>90%)内,可认为二者的视觉内容一致。
对于该查询请求直接对应的图片和匹配结果而言,二者仅有细微的差别,如是否带水印、小图片和大图片的差别等;刨除这些细微的差别,二者就是相同的图片。
考虑到该查询请求直接对应的图片可能为带水印的图片或者是小图片等质量不好的图片,如果将其作为搜索日志的存储对象,而最终向用户推荐的图片源自搜索日志,这样,向用户推荐带水印或小图片等质量不好的图片会影响用户的搜索体验。因此,在本申请的一种优选实施例中,将与查询请求对应的查询策略最匹配的图片作为目标图片,并将该目标图片作为搜索日志的存储对象。在实际中,匹配所用的数据库往往存储一些不带水印且尺寸较大的图片,这样,向用户推荐不带水印且尺寸较大的图片能够提高用户的搜索体验。
本申请的一种优选实施例中,结果图片为数据库中除目标图片外大于匹配阈值的其他图片,即结果图片与查询请求对应的查询策略的相符程度小于目标图片与查询请求对应的查询策略的相符程度。本实施例中,得到的目标图片和结果图片按匹配度进行排序,与查询请求最匹配的图片为目标图片,其余的图片作为结果图片按匹配度进行排序展示。在其他实施例中,用户的查询请求的对应结果可按图片大小或发布时间进行排序,将尺寸最大或最近发布的图片作为目标图片,其余的图片作为结果图片按尺寸由大至小或发布时间由近至远进行排序展示。在通常情况下,结果图片和目标图片仅有细微的差别,如是否带水印、小图片和大图片的差别等;刨除这些细微的差别,二者就是相同的图片。
可以理解,在本申请应用于图片搜索引擎时,服务器还可以将所述结果图片作为搜索结果返回给用户,以满足用户的某些搜索需求。例如某些用户爱好搜集图片,最不能容忍的就是美图上面有水印,只要上传图片到图片搜索引擎,轻轻一点便能搜出不带水印的图片;又如,可以上传小图片,搜到这个小图片的各个版本,如清晰大图等。
在本申请的一种应用示例中,所述根据该查询请求直接对应的图片的视觉内容,抽取出局部特征的步骤具体可以包括:
首先,对该查询请求直接对应的图片的尺寸进行归一化,将尺寸过大或过小的图片变换为640*640~300*300之内;然后使用二维局部特征检测矩阵与归一化后的图片进行卷积操作;再者,在卷积后的图片中扫描定位出其中的局部极值(最大值与最小值)点的位置;最后,根据局部极值点附近区域的明暗对比,抽取该查询请求直接对应的图片的局部特征。需要说明的是,为了实现匹配目的,该查询请求直接对应的图片与数据库中具有与其相同原始尺寸的图片在归一化后的尺寸应一致,例如,同为300*300。
参照表1,示出了本申请一种归一化前后的图片尺寸示意。
表1
Figure BDA0000130469010000081
在其他实施例中,所述结果图片也可以为对目标图片进行特征抽取,在数据库中进行搜索,与数据库中各图片的局部特征进行匹配所得到的图片。
步骤202、依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
由于结果图片来自于网络,故搜索引擎或搜索装置的数据库中会记录有每一幅结果图片的网页文本,这些网页文本通常包括网页的文本信息,如页面标题,图片周边的描述文本等。
由于结果图片是与目标图片相同或近似的图片,在通常情况下,二者仅有细微的差别,如是否带水印、小图片和大图片的差别等;刨除这些细微的差别,二者就是相同的图片,也就是说,结果图片可以完全代表目标图片。
这样,依据结果图片的网页文本,抽取的关键词能够客观描述目标图片的图片语义特征,而目标图片的图片语义特征又能够在一定程度上反映用户的兴趣爱好,例如,用户搜索得到刘德华的图片,很有可能说明该用户是刘德华的粉丝,又如,用户搜索得到《当幸福来敲门》的电影海报,很有可能说明该用户是《当幸福来敲门》的爱好者等等。
在本申请的一种优选实施例中,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,可以进一步包括:
子步骤A1、对所述网页文本进行聚类分析;
子步骤A2、依据聚类分析结果,去除所述网页文本中孤立的网页文本,得到剩余文本;
在具体实现中,可将每幅结果图片的网页文本视为一个文档,对所有结果图片的网页文本进行聚类分析,将那些未聚集在一起的孤立文本视为噪音去除掉。聚类分析的原理是最近邻二叉树聚类,应用于网页文本时,其根据网页文本的重复程度,将重复最多的两份网页文本视为一个类进行合并,并将合并后的类视为一个网页文本,迭代重复下去,直至重复最多的两个网页文本之间的重复程度不能达到合并阈值为止。
参照表2和表3,分别示出了本申请一种原始网页文本和聚类分析后剩余文本的示例,其中,原始网页文本包括1-9九份网页对应的文本,聚类分析去除了其中的编号为2、4、9噪音文本,得到剩余文本。
表2
Figure BDA0000130469010000091
Figure BDA0000130469010000111
表3
Figure BDA0000130469010000112
在理想情况下,结果图片的网页文本能够真实准确地描述相应图片的语义内容,但是,由于网页文本的质量参差不齐,在某些特殊情况下,网页文本与图片的语义内容并不相关。例如表2中原始网页文本的2,9。(文本4虽然与图片语义内容相关,但与其他文本的重复程度未达到合并阈值,因此也被去除了。)
在实际中,上述理想情况下的结果图片占大多数,特殊情况下的结果图片极为个别,这样,在聚类分析时理想情况下的结果图片的网页文本能够聚集在一起,而特殊情况下的结果图片的网页文本被孤立;因此,上述聚类分析能够将那些未聚集在一起的与目标图片中的物体或场景不相关的孤立文本视为噪音去除掉,以提高关键词抽取的准确性。
子步骤A3、抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
本申请可以提供如下抽取所述剩余文本中具有实际意义的词或短语的方案:
方案一、
可以通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
依据预先构造的实体词库,抽取所述剩余文本中具有实际意义的词或短语,所述实体词库存储有具有实际意义的实体词,所述抽取过程可以包括:
调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语。
这里的实体词主要指表示单个或者多个实体概念的词语,其主要包括旧称名词,如人名、电影名、物品名等。在实际中,可以搜集兴趣爱好类别下的实体词,并预先构造相应的实体词库,这里的兴趣爱好类别既可以包括;电影、电视、明星、音乐、动漫等娱乐类别,也可以图书、电子产品、服装、鞋帽等休闲类别等的。本申请对具体的兴趣爱好类别及实体词库的构造方式不加以限制。
方案二、
可以通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程具体可以包括:
在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述剩余文本中的词或短语。
由于叹词、代词或语气助词等为常用词,通常没有实际意义,故在抽取时,可以对其进行丢弃处理。需要说明的是,除了叹词、代词或语气助词外,本方案还可以根据实际情况,丢弃所述剩余文本中其它词性的词或短语,如副词、介词、连词、结构助词、动态助词、拟声词中的任一种等等,本申请对具体丢弃的词性不加以限制。
需要说明的是,为了减轻抽取所述剩余文本中具有实际意义的词或短语的工作量,在本申请实施例中,优选的是,可以首先抽取所述剩余文本中词频最高的词或短语得到初步抽取结果,然后,从所述初步抽取结果中抽取具有实际意义的词或短语,得到最终抽取结果。当然,本领域技术人员也可以根据需要,首先抽取所述剩余文本中具有实际意义的词或短语,然后抽取词频最高的词或短语,本申请对具体的前后次序不加以限制。
另外,上述两种抽取所述剩余文本中具有实际意义的词或短语的方案可以单独使用或者结合使用,或者,本领域技术人员还可以根据实际需要,采用其他抽取所述剩余文本中具有实际意义的词或短语的方案,本申请对此不加以限制。
在本申请的另一种优选实施例中,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还可以包括:
依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
假设用户上传了刘德华的图片,且步骤201-203抽取得到描述图片语义特征的关键词——“刘德华”;实际上该用户还希望看到刘德华的电影海报、个人写真等图片的,于是,可以“刘德华”为关键词,统计所述剩余文本中与“刘德华”相邻共现次数较多的其他词汇,如“电影”、“经典电影”、“写真”等,这样,最终得到的关键词可以包括:“刘德华电影”、“刘德华经典电影”、“刘德华写真”等等。
步骤203、在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。
网络操作***通常设计有各种各样的日志文件,如应用程序日志,安全日志、***日志等等,当用户在网络***上进行一些操作时,这些日志文件通常会记录下操作的一些相关内容,如用户所用的IP(网络之间互连的协议,Internet Protocol)、时间、用户名等。
本申请的搜索日志是针对全网用户的在线查询请求而生成的,与已有技术不同的是,会在所述搜索日志中记录该在线查询请求对应的目标图片及相应的关键词,其中,所述关键词是通过执行步骤201-202而得到的。这里的全网用户可以包括互联网的用户,也即互联网的用户在搜索引擎或搜索装置中提交在线查询请求时,搜索引擎或搜索装置的服务器都可以生成相应的搜索日志,而本申请可以从互联网中所有搜索引擎或搜索装置的服务器收集搜索日志,得到搜索日志。本申请仅对搜索日志的存储内容进行了规定,而不会对具体的收集方式或者搜索日志的获取方式加以限制。
在具体实现中,匹配所依据的搜索日志应是全网用户的搜索日志,以查询到与该目标图片的关键词相匹配的其他用户查询得到对应的目标图片,这里的关键词匹配主要指搜索日志中记录的目标图片的关键词与当前目标图片的关键词相同、包含该目标图片的关键词,或彼此重叠,等等。
本申请提供的图片推荐功能可以较好地满足用户个性化需求,因为本申请中关键词所描述的图片语义特征能够反映用户的兴趣爱好,这样,在一个用户提交查询请求时,本申请能够依据所得到目标图片的关键词和所述搜索日志中目标图片的关键词,匹配得到具有相同兴趣爱好的其它用户查询得到的对应目标图片,也即与关键词匹配的相应目标图片能够契合用户的兴趣爱好。
在本申请的一种优选实施例中,在将与关键词匹配的相应目标图片推荐给用户前,所述方法还可以包括:
在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
所述将与关键词匹配的相应目标图片推荐给用户的步骤可以为,将所述剩余图片推荐给用户。
前面提到,在理想情况下,在与关键词对应的各目标图片中,相同或近似的两幅图片通常仅具有是否带水印、小图片和大图片的差别等细微差别相同或近似;另外,与关键词匹配的相应各目标图片是依据描述图片语义特征的关键词匹配得到的;因此,可以认为,与关键词匹配的相应各目标图片中如果存在两幅或两副以上相同或近似的图片,则没有推荐的意义,故对其进行滤除。
在本申请的另一种优选实施例中,所述将与关键词匹配的相应目标图片推荐给用户的步骤,可以进一步包括:
依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;
按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。
在某些情况下,所述与关键词匹配的相应各目标图片的数目可能为大数目,如100幅以上,这些大数目的图片是否契合用户个性化需求难以预料,且需要分多页将这些大数目的图片在浏览器中显示,使用户需要从多页中提取自己所需要的内容。
本优选实施例按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户,在线查询请求数目越多表明相应的图片越被具有相同兴趣爱好的用户所关注,也即,本申请能够优先推荐在线查询请求数目多关注度高的图片,因此,优先推荐的图片能够更好地契合用户个性化需求,增加用户的使用体验。
本申请可以提供如下场景中的应用示例:
应用示例1、
步骤B1、接收用户上传的刘德华的图片,并以该图片进行搜索得到该图片对应的目标图片和与目标图片相同或近似的结果图片;
步骤B2、依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为刘德华的图片的关键词,例如“刘德华电影”、“刘德华经典电影”、“刘德华写真”等;
步骤B3、在搜索日志中进行关键词的匹配,得到其他同样喜欢刘德华的用户上传的反映兴趣爱好对应的目标图片(如刘德华的电影海报、个人写真等更多的刘德华的相关图片),并推荐给用户。
应用示例2、
步骤C1、接收用户上传的《失恋33天》电影海报;通过该电影海报搜索得到对应的目标图片和与目标图片相同或近似的结果图片;
步骤C2、依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词,如“失恋33天”等;
步骤C3、在搜索日志中进行关键词的匹配,得到其他喜欢《失恋33天》这部电影的用户上传的反映兴趣爱好对应的目标图片(例如该电影的不同海报),并推荐给用户。
为使本领域技术人员更好地理解本申请,以下提供本申请一种图片搜索引擎中推荐明星图片的方法示例的流程图,具体可以包括:
步骤1、接收用户上传的金发的妮可基德曼照片;
步骤2、从金发的妮可基德曼照片中抽取视觉特征,与数据库中图片的视觉特征进行比对,得到与金发的妮可基德曼照片的视觉内容一致的目标图片和结果图片;
步骤3、对结果图片的网页文本进行聚类分析,将那些未聚集在一起的孤立文本视为噪音去除掉,抽取剩余文本中词频最高并具有实际意义的词或短语,作为关键词;
例如,表4示出了本申请一种剩余文本中的词频示例。
表4
  词   文本中的词频
  他们   12
  妮可基德曼   10
  电影节   5
  威尼斯   4
   ...   ...
其中,词频最高的“他们”没有实际意义,因此最终得到的关键词为“妮可基德曼”。
步骤4、图片搜索引擎的搜索日志中记录有全网用户提交的在线查询请求对应的目标图片及相应的关键词;
步骤5、抽取到目标图片的关键词后,通过关键词匹配(是否相同,互相包含或有所重叠),查询得到与各关键词有语义关联的目标图片;
步骤6、在滤除掉查询结果中与当前查询对应的目标图片相同或近似的目标图片后,统计搜索日志中剩余图片的在线查询请求数目,并将在线查询请求数目最多的部分图片推荐给用户。
例如,当关键词为“妮可基德曼”时,搜索日志中与“妮可基德曼”相关联的关键词及这些关键词对应图片的在线查询请求数目如表4所示,
表4
  关键词   对应的目标图片   对应的在线查询请求数目
  美女妮可基德曼   图片a   22
  妮可基德曼   图片b   19
  妮可基德曼剧照   图片c   8
  ...    ...   ...
如果为用户推荐2幅图片,那么本申请将推荐图片a与图片b。
首先,上述方法示例能够通过图片搜索引擎抽取出关键词以描述目标图片的图片语义特征,如照片中明星的名字。
其次,上述方法示例能够为用户提供具有相同语义特征的图片作为推荐内容,也即能够提供契合用户个性化需求的图片素材。这样,当目标图片为金发的妮可基德曼照片时,可推荐关于该明星的不同图片,如该明星其他头发颜色的照片;而不是仅推荐视觉相似的图片。
与前述方法实施例相应,本申请还提供了一种图片推荐装置,参照图3,具体可以包括:
图片搜索模块301,用于接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
关键词抽取模块302,用于依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
匹配模块303,用于在搜索日志中进行关键词的匹配;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词;及
图片推荐模块304,用于将与关键词匹配的相应目标图片推荐给用户。
在本申请实施例中,优选的是,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为服务器端的数据库中除目标图片外大于匹配阈值的其他图片。
在本申请的一种优选实施例中,所述关键词抽取模块302可以进一步包括:
去除子模块,用于依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;及
抽取子模块,用于抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
在本申请的另一种优选实施例中,所述装置还可以包括:
第一实际意义抽取模块,用于依据预先构造的实体词库,抽取所述剩余文本中具有实际意义的词或短语,所述实体词库存储有具有实际意义的实体词,所述抽取过程包括:在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语。
在本申请的再一种优选实施例中,所述装置还可以包括:
第二实际意义抽取模块,用于调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语;所述实体词库存储有具有实际意义的实体词。
在本申请的一种优选实施例中,所述关键词抽取模块302还可以包括:
边缘词统计子模块,用于依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
在本申请实施例中,优选的是,所述装置还可以包括:
滤除模块,用于在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
此时,所述图片推荐模块304,可具体用于将所述剩余图片推荐给用户。
在本申请实施例中,优选的是,所述图片推荐模块304具体可以包括:
数目统计子模块,用于依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;及
降序推荐子模块,用于按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
以上对本申请所提供的一种图片推荐方法和装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (16)

1.一种图片推荐方法,其特征在于,包括:
接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。
2.如权利要求1所述的方法,其特征在于,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,包括:
依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;
抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
3.如权利要求2所述的方法,其特征在于,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述词或短语;所述实体词库存储有具有实际意义的实体词。
4.如权利要求2所述的方法,其特征在于,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语:
依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括:
在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述词或短语。
5.如权利要求2所述的方法,其特征在于,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还包括:
依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
6.如权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
所述将与关键词匹配的相应目标图片推荐给用户的步骤为,将所述剩余图片推荐给用户。
7.如权利要求1至5中任一项所述的方法,其特征在于,所述将与关键词匹配的相应目标图片推荐给用户的步骤,包括:
依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;
按照在线查询请求数目的降序将与关键词匹配的相应目标图片推荐给用户。
8.如权利要求1至5中任一项所述的方法,其特征在于,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
9.一种图片推荐装置,其特征在于,包括:
图片搜索模块,用于接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
关键词抽取模块,用于依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;
匹配模块,用于在搜索日志中进行关键词的匹配;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词;及
图片推荐模块,用于将与关键词匹配的相应目标图片推荐给用户。
10.如权利要求9所述的装置,其特征在于,所述关键词抽取模块包括:
去除子模块,用于依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;及
抽取子模块,用于抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
11.如权利要求10所述的装置,其特征在于,还包括:
第一实际意义抽取模块,用于调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语;所述实体词库存储有具有实际意义的实体词。
12.如权利要求10所述的装置,其特征在于,还包括:
第二实际意义抽取模块,用于依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括:在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述剩余文本中的词或短语。
13.如权利要求10所述的装置,其特征在于,所述关键词抽取模块还包括:
边缘词统计子模块,用于依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
14.如权利要求9至13中任一项所述的装置,其特征在于,还包括:
滤除模块,用于在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;
所述图片推荐模块,具体用于将所述剩余图片推荐给用户。
15.如权利要求9至13中任一项所述的装置,其特征在于,所述图片推荐模块包括:
数目统计子模块,用于依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;
降序推荐子模块,用于按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。
16.如权利要求9至13中任一项所述的装置,其特征在于,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
CN201210009043.7A 2012-01-12 2012-01-12 一种图片推荐方法和装置 Active CN102609458B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210009043.7A CN102609458B (zh) 2012-01-12 2012-01-12 一种图片推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210009043.7A CN102609458B (zh) 2012-01-12 2012-01-12 一种图片推荐方法和装置

Publications (2)

Publication Number Publication Date
CN102609458A true CN102609458A (zh) 2012-07-25
CN102609458B CN102609458B (zh) 2015-08-05

Family

ID=46526830

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210009043.7A Active CN102609458B (zh) 2012-01-12 2012-01-12 一种图片推荐方法和装置

Country Status (1)

Country Link
CN (1) CN102609458B (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831176A (zh) * 2012-07-30 2012-12-19 东莞宇龙通信科技有限公司 推荐好友的方法及服务器
CN102902771A (zh) * 2012-09-27 2013-01-30 百度国际科技(深圳)有限公司 一种图片搜索方法、装置及服务器
CN103064903A (zh) * 2012-12-18 2013-04-24 厦门市美亚柏科信息股份有限公司 图片检索方法和装置
CN103886506A (zh) * 2012-12-20 2014-06-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN103902678A (zh) * 2014-03-21 2014-07-02 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104090929A (zh) * 2014-06-23 2014-10-08 吕志雪 一种个性化图片推荐方法及装置
CN104156694A (zh) * 2014-07-18 2014-11-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备
CN104239457A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104504111A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片物料的推荐方法和装置
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN104994404A (zh) * 2015-07-06 2015-10-21 无锡天脉聚源传媒科技有限公司 一种为视频获取关键词的方法及装置
CN105159938A (zh) * 2015-08-03 2015-12-16 百度在线网络技术(北京)有限公司 检索方法和装置
WO2016107190A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 搜索方法和装置
CN106791912A (zh) * 2016-12-28 2017-05-31 Tcl集团股份有限公司 一种海报图片匹配方法及***
WO2017181663A1 (zh) * 2016-04-21 2017-10-26 北京搜狗科技发展有限公司 一种为搜索信息匹配图片的方法及装置
CN107423318A (zh) * 2017-03-27 2017-12-01 北京珠穆朗玛移动通信有限公司 一种图片标注的方法及移动终端
CN107862561A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种基于图片属性提取建立用户兴趣库的方法及设备
CN107909088A (zh) * 2017-09-27 2018-04-13 百度在线网络技术(北京)有限公司 获取训练样本的方法、装置、设备和计算机存储介质
CN108027836A (zh) * 2015-09-24 2018-05-11 高通股份有限公司 用捕获的查询图像访问图像的***和方法
CN108230220A (zh) * 2016-12-15 2018-06-29 百度在线网络技术(北京)有限公司 水印添加方法和装置
CN110019675A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 一种关键词提取的方法及装置
WO2019150416A1 (ja) * 2018-01-30 2019-08-08 株式会社オプティム 電子データの変換システム、方法及びプログラム
CN110134850A (zh) * 2018-02-09 2019-08-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN110309324A (zh) * 2018-03-09 2019-10-08 北京搜狗科技发展有限公司 一种搜索方法及相关装置
CN110941766A (zh) * 2019-12-10 2020-03-31 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN111831847A (zh) * 2020-07-08 2020-10-27 嘉兴智设信息科技有限公司 相似图片集推荐方法及其***
CN111859095A (zh) * 2019-04-02 2020-10-30 搜狗(杭州)智能科技有限公司 一种图片识别方法及装置
CN113468414A (zh) * 2021-06-07 2021-10-01 广州华多网络科技有限公司 商品搜索方法、装置、计算机设备及存储介质
CN113590861A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种图片信息的处理方法、装置及电子设备
CN113590862A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种图片信息的处理方法、装置及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267740A1 (en) * 2000-10-30 2004-12-30 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
CN101241512A (zh) * 2008-03-10 2008-08-13 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
CN102270234A (zh) * 2011-08-01 2011-12-07 北京航空航天大学 一种图像搜索方法及其搜索引擎

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040267740A1 (en) * 2000-10-30 2004-12-30 Microsoft Corporation Image retrieval systems and methods with semantic and feature based relevance feedback
CN101241512A (zh) * 2008-03-10 2008-08-13 北京搜狗科技发展有限公司 一种重新定义查询词的搜索方法及装置
CN102270234A (zh) * 2011-08-01 2011-12-07 北京航空航天大学 一种图像搜索方法及其搜索引擎

Cited By (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102831176A (zh) * 2012-07-30 2012-12-19 东莞宇龙通信科技有限公司 推荐好友的方法及服务器
CN102831176B (zh) * 2012-07-30 2016-12-21 东莞宇龙通信科技有限公司 推荐好友的方法及服务器
CN102902771A (zh) * 2012-09-27 2013-01-30 百度国际科技(深圳)有限公司 一种图片搜索方法、装置及服务器
CN103064903A (zh) * 2012-12-18 2013-04-24 厦门市美亚柏科信息股份有限公司 图片检索方法和装置
CN103064903B (zh) * 2012-12-18 2017-08-01 厦门市美亚柏科信息股份有限公司 图片检索方法和装置
CN103886506A (zh) * 2012-12-20 2014-06-25 联想(北京)有限公司 一种信息处理方法及电子设备
CN103886506B (zh) * 2012-12-20 2018-08-10 联想(北京)有限公司 一种信息处理方法及电子设备
WO2015139487A1 (zh) * 2014-03-21 2015-09-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN103902678A (zh) * 2014-03-21 2014-07-02 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104090929A (zh) * 2014-06-23 2014-10-08 吕志雪 一种个性化图片推荐方法及装置
CN104156694A (zh) * 2014-07-18 2014-11-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备
CN104239457A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
CN104239457B (zh) * 2014-09-02 2019-03-12 百度在线网络技术(北京)有限公司 搜索推荐方法和装置
WO2016107190A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 搜索方法和装置
CN104504111A (zh) * 2014-12-30 2015-04-08 百度在线网络技术(北京)有限公司 图片物料的推荐方法和装置
US10296541B2 (en) 2014-12-30 2019-05-21 Baidu Online Network Technology (Beijing) Co., Ltd. Searching method and apparatus
CN104504111B (zh) * 2014-12-30 2018-12-21 百度在线网络技术(北京)有限公司 图片物料的推荐方法和装置
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN104994404A (zh) * 2015-07-06 2015-10-21 无锡天脉聚源传媒科技有限公司 一种为视频获取关键词的方法及装置
CN105159938A (zh) * 2015-08-03 2015-12-16 百度在线网络技术(北京)有限公司 检索方法和装置
CN105159938B (zh) * 2015-08-03 2018-11-30 百度在线网络技术(北京)有限公司 检索方法和装置
CN108027836A (zh) * 2015-09-24 2018-05-11 高通股份有限公司 用捕获的查询图像访问图像的***和方法
WO2017181663A1 (zh) * 2016-04-21 2017-10-26 北京搜狗科技发展有限公司 一种为搜索信息匹配图片的方法及装置
CN108230220A (zh) * 2016-12-15 2018-06-29 百度在线网络技术(北京)有限公司 水印添加方法和装置
CN108230220B (zh) * 2016-12-15 2022-04-26 百度在线网络技术(北京)有限公司 水印添加方法和装置
CN106791912A (zh) * 2016-12-28 2017-05-31 Tcl集团股份有限公司 一种海报图片匹配方法及***
CN106791912B (zh) * 2016-12-28 2020-07-03 Tcl科技集团股份有限公司 一种海报图片匹配方法及***
CN107423318A (zh) * 2017-03-27 2017-12-01 北京珠穆朗玛移动通信有限公司 一种图片标注的方法及移动终端
CN107862561A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种基于图片属性提取建立用户兴趣库的方法及设备
CN107909088A (zh) * 2017-09-27 2018-04-13 百度在线网络技术(北京)有限公司 获取训练样本的方法、装置、设备和计算机存储介质
CN110019675A (zh) * 2017-12-01 2019-07-16 北京搜狗科技发展有限公司 一种关键词提取的方法及装置
CN110019675B (zh) * 2017-12-01 2021-10-15 北京搜狗科技发展有限公司 一种关键词提取的方法及装置
WO2019150416A1 (ja) * 2018-01-30 2019-08-08 株式会社オプティム 電子データの変換システム、方法及びプログラム
CN110134850A (zh) * 2018-02-09 2019-08-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN110134850B (zh) * 2018-02-09 2024-05-14 北京搜狗科技发展有限公司 一种搜索方法及装置
CN110309324B (zh) * 2018-03-09 2024-03-22 北京搜狗科技发展有限公司 一种搜索方法及相关装置
CN110309324A (zh) * 2018-03-09 2019-10-08 北京搜狗科技发展有限公司 一种搜索方法及相关装置
CN111859095A (zh) * 2019-04-02 2020-10-30 搜狗(杭州)智能科技有限公司 一种图片识别方法及装置
CN110941766A (zh) * 2019-12-10 2020-03-31 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN110941766B (zh) * 2019-12-10 2023-10-20 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、计算机设备及存储介质
CN113590862A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种图片信息的处理方法、装置及电子设备
CN113590861A (zh) * 2020-04-30 2021-11-02 北京搜狗科技发展有限公司 一种图片信息的处理方法、装置及电子设备
CN111831847B (zh) * 2020-07-08 2023-08-18 嘉兴智设信息科技有限公司 相似图片集推荐方法及其***
CN111831847A (zh) * 2020-07-08 2020-10-27 嘉兴智设信息科技有限公司 相似图片集推荐方法及其***
CN113468414A (zh) * 2021-06-07 2021-10-01 广州华多网络科技有限公司 商品搜索方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN102609458B (zh) 2015-08-05

Similar Documents

Publication Publication Date Title
CN102609458B (zh) 一种图片推荐方法和装置
US11238066B2 (en) Generating personalized clusters of multimedia content elements based on user interests
US10860811B2 (en) Method and device for generating review article of hot news, and terminal device
Begelman et al. Automated tag clustering: Improving search and exploration in the tag space
CA2727537C (en) System and method for compending blogs
CN104573054B (zh) 一种信息推送方法和设备
US20090254540A1 (en) Method and apparatus for automated tag generation for digital content
JP2017508214A (ja) 検索推奨の提供
US20110125791A1 (en) Query classification using search result tag ratios
CN102007492A (zh) 用于搜索多幅存储的数字图像的方法和设备
Petkos et al. Two-level Message Clustering for Topic Detection in Twitter.
CA3217721A1 (en) Commodity short title generation method and apparatus
Zaharieva et al. Automated social event detection in large photo collections
US20140006369A1 (en) Processing structured and unstructured data
JP2017535860A (ja) マルチメディア内容の提供方法および装置
WO2017113592A1 (zh) 模型生成方法、词语赋权方法、装置、设备及计算机存储介质
CN104008180A (zh) 结构化数据与图片的关联方法与关联装置
CN106294358A (zh) 一种信息的检索方法及***
US20170185690A1 (en) System and method for providing content recommendations based on personalized multimedia content element clusters
Celikyilmaz et al. Leveraging web query logs to learn user intent via bayesian latent variable model
CN115905489A (zh) 一种提供招投标信息搜索服务的方法
Figueiredo et al. Evidence of quality of textual features on the web 2.0
Shah et al. A review: Web content mining techniques
Tan et al. Placing videos on a semantic hierarchy for search result navigation
Choi et al. Consento: a new framework for opinion based entity search and summarization

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant