CN103136228A - 一种图片搜索方法以及图片搜索装置 - Google Patents

一种图片搜索方法以及图片搜索装置 Download PDF

Info

Publication number
CN103136228A
CN103136228A CN201110380442XA CN201110380442A CN103136228A CN 103136228 A CN103136228 A CN 103136228A CN 201110380442X A CN201110380442X A CN 201110380442XA CN 201110380442 A CN201110380442 A CN 201110380442A CN 103136228 A CN103136228 A CN 103136228A
Authority
CN
China
Prior art keywords
picture
label
searched
descriptor
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110380442XA
Other languages
English (en)
Inventor
金华兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110380442XA priority Critical patent/CN103136228A/zh
Priority to TW101107352A priority patent/TW201322021A/zh
Priority to EP12794621.8A priority patent/EP2783310A1/en
Priority to PCT/US2012/066251 priority patent/WO2013078307A1/en
Priority to JP2014543557A priority patent/JP6141305B2/ja
Priority to US13/683,384 priority patent/US9460117B2/en
Publication of CN103136228A publication Critical patent/CN103136228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本申请公开了一种图片搜索方法以及图片搜索装置,针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;在进行图片搜索时,根据接收的图片搜索请求,获取该请求中包括的待搜索图片的描述信息,根据该描述信息生成对应该图片的标签,其中,生成对应该待搜索图片的标签的方式与分别生成对应图片搜索库中的各图片的标签的方式相同,进一步根据保存的标签与图片的对应关系,确定出与该待搜索的图片的标签对应的图片,并将确定出的图片发送给图片搜索请求的发送端。根据该技术方案实现的基于标签的图片搜索技术能够利用现有的文本搜索引擎,从而提高了服务器资源的利用率。

Description

一种图片搜索方法以及图片搜索装置
技术领域
本申请涉及网络搜索技术领域,尤其涉及一种图片搜索方法以及图片搜索装置。
背景技术
随着图片搜索技术的应用以及不断发展,基于视觉特征的搜索技术是目前主流的搜索技术,该搜索技术的实现需要预先建立基于视觉特征的图片搜索库,具体地,图1示出了建立基于视觉特征的图片搜索库的流程示意图,该建立过程主要包括如下步骤:
步骤101、建立特征提取***,该特征提取***中定义了需要从图片中提取的视觉特征模板。
步骤102、利用建立的特征提取***,从图片搜索库中的各图片中提取视觉特征,即将一个图片通过从该图片中提取的视觉特征来表示。
步骤103、以各图片对应的视觉特征为索引关键字,建立倒排索引,生成基于视觉特征的图片搜索库。
至此,建立基于视觉特征的图片搜索库的流程结束。
通过上述步骤101至步骤103对应的流程,能够建立基于视觉特征的图片搜索库,服务器能够基于该图片搜索库进行图片搜索,图2示出了服务器基于该图片搜索库进行图片搜索的流程示意图,该搜索过程主要包括如下步骤:
步骤201、服务器接收用户终端提交的图片搜索请求。
该步骤201中,服务器中包括上述基于视觉特征的图片搜索库,或该服务器能够对上述基于视觉特征的图片搜索库进行访问。该图片搜索请求中包括用户请求搜索的图片。
步骤202、服务器从接收的图片搜索请求包括的图片中提取该待搜索的图片的视觉特征。
该步骤202中,服务器提取该待搜索的图片的视觉特征的方法与建立基于视觉特征的图片搜索库时从图片中提取视觉特征的过程相同。
步骤203、服务器根据提取的视觉特征,根据建立的倒排索引表,从基于视觉特征的图片搜索库中搜索对应该提取的视觉特征的图片集合。
步骤204、服务器将搜索结果提供给发送该图片搜索请求的用户终端。
至此,服务器搜索图片的流程结束。
通过上述步骤201至步骤204对应的流程,服务器能够根据基于视觉关键字的图片搜索库向用户终端反馈用户请求搜索的图片集合。
实际应用中,要采用上述基于视觉特征的图片搜索技术,主要基于重新建立基于视觉特征的搜索引擎实现,而不能利用现有具备搜索功能的服务器一般都具备的文本搜索引擎,从而不能有效地利用服务器资源。
发明内容
有鉴于此,本申请实施例提供一种图片搜索方法以及图片搜索装置,采用该技术方案,能够提高服务器资源的利用率。
本申请实施例通过如下技术方案实现:
根据本申请实施例的一个方面,提供了一种图片搜索方法,针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;所述搜索方法包括:
根据接收的图片搜索请求,获取所述图片搜索请求中包括的待搜索图片对应的描述信息;
根据所述待搜索图片对应的描述信息,生成对应所述待搜索图片的标签,其中,生成对应所述待搜索图片的标签的方式与分别生成对应所述图片搜索库中的各图片的标签的方式相同;
根据保存的标签与图片的对应关系,确定出与所述待搜索的图片的标签对应的图片;
将确定出的所述图片发送给所述图片搜索请求的发送端。
根据本申请实施例的另一个方面,还提供了一种图片搜索装置,包括:
对应关系生成单元,用于针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;
描述信息获取单元,用于根据接收的图片搜索请求,获取所述图片搜索请求中包括的待搜索图片对应的描述信息;
标签生成单元,用于根据所述描述信息获取单元获取的所述待搜索图片对应的描述信息,生成对应所述待搜索图片的标签,其中,生成对应所述待搜索图片的标签的方式与所述对应关系生成单元分别生成对应所述图片搜索库中的各图片的标签的方式相同;
图片确定单元,用于根据所述对应关系生成单元保存的标签与图片的对应关系,确定出与所述标签生成单元生成的所述待搜索的图片的标签对应的图片;
图片提供单元,用于将所述图片确定单元确定出的所述图片发送给所述图片搜索请求的发送端。
通过本申请实施例提供的上述至少一个技术方案,首先针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;在进行图片搜索时,首先根据接收的图片搜索请求,获取该图片搜索请求中包括的待搜索图片对应的描述信息,然后根据该待搜索图片对应的描述信息,生成对应该待搜索图片的标签,其中,生成对应所述待搜索图片的标签的方式与分别生成对应所述图片搜索库中的各图片的标签的方式相同,进一步根据保存的标签与图片的对应关系,确定出与该待搜索的图片的标签对应的图片,并将确定出的图片发送给图片搜索请求的发送端。根据该技术方案,根据图片对应的描述信息生成的对应该图片的标签一般都是基于文本形式存在的,因此,基于该标签进行图片的搜索能够利用现有的文本搜索引擎,从而提高了服务器资源的利用率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中:
图1为背景技术提供的建立基于视觉特征的图片搜索库的流程示意图;
图2为背景技术提供的服务器基于该图片搜索库进行图片搜索的流程示意图;
图3为本申请实施例一提供的一个针对图片搜索库中的各图片建立标签的流程示意图;
图4为本申请实施例一提供的又一个针对图片搜索库中的各图片建立标签的流程示意图;
图5为本申请实施例一提供的生成与图片对应的标签的流程示意图;
图6为本申请实施例一提供的根据从图片对应的描述信息中提取出的关键字生成对应当前图片的标签的流程示意图;
图7为本申请实施例一提供的一个服务器进行图片搜索的流程示意图;
图8为本申请实施例一提供的又一个服务器进行图片搜索的流程示意图;
图9为本申请实施例二提供的商品的文本标签提取***的结构示意图;
图10为本申请实施例三提供的一个图片搜索装置的结构示意图;
图11为本申请实施例三提供的又一个图片搜索装置的结构示意图。
具体实施方式
为了给出提高服务器资源的利用率的实现方案,本申请实施例提供了一种图片搜索方法以及图片搜索装置,该技术方案可以应用于图片搜索的过程,既可以实现为一种方法,也可以实现为一种装置。以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例一
本申请实施例一提供了一种图片搜索方法,该搜索方法可以应用于互联网中具备信息搜索功能的服务器中,以利用该服务器的文本搜索引擎进行图片搜索,从而提高服务器资源的利用率。
为实现上述利用服务器的文本搜索引擎进行图片搜索的目的,本实施例一提供的图片搜索方法中,需要预先针对图片搜索库中的各图片建立标签,以作为服务器搜索图片的依据,以下给出了针对图片搜索库中的各图片建立标签的两个优选实施方式。
针对图片搜索库中的各图片建立标签的优选实施方式一
该优选实施方式一中,主要针对图片搜索库中的各图片生成标签,并主要保存标签和图片的对应关系。
图3示出了针对图片搜索库中的各图片建立标签的流程示意图,如图3所示,该过程主要包括如下步骤:
步骤301、从图片搜索库中选择一个图片,并获取该图片对应的描述信息。
该步骤301中,获取的图片的描述信息的过程包括:确定该图片对应的实体,并获取该实体的描述信息作为该图片对应的描述信息。具体地,图片对应的描述信息主要用于表征该图片对应的实体的属性,该描述信息一般包括该图片所对应的实体的描述信息,其中,图片对应的实体可以包括图片中的具体内容,例如,在电子商务领域中,图片对应的实体一般为商品,相应地,该图片对应的描述信息可以包括该商品的各种描述信息,如商品名称、商品属性(如实际颜色、实际大小等)、商品用途、商品所在类目等。
步骤302、根据获取的当前图片对应的描述信息,生成对应该图片的标签。
该步骤302中,当前图片对应的描述信息一般为文本形式,相应地,根据获取的当前图片对应的描述信息生成的标签也一般以文本形式存在,该标签主要用于标识图片对应实体的属性特征,实际应用中,同一标签可能对应不同的图片。
步骤303、保存生成的标签和当前图片的对应关系。
该步骤303中,保存生成的标签和当前图片的对应关系时,可以通过索引的方式保存,以提高图片的查找速度,具体地,可以以图片搜索库中的各图片分别对应的标签为索引,采用倒排索引法保存生成的标签以及图片的对应关系。应当理解,此处对于保存生成的标签和当前图片的对应关系的方式仅为举例,实际应用中可以灵活设置该对应关系的保存方式,例如,以列表的方式保存,此处不再一一列举。
步骤304、确定图片搜索库中是否还有未生成标签的图片,若是,返回步骤301,若否,结束流程。
该步骤304中,确定图片搜索库中是否还有未生成标签的图片,即确定该确定图片搜索库中是否还有未被选过的图片。
至此,针对图片搜索库中的各图片建立索引的流程结束。
通过上述步骤301至步骤304的执行过程,能够针对图片搜索库中的各图片分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系。
针对图片搜索库中的各图片建立标签的优选实施方式二
该优选实施方式二中,除了针对图片搜索库中的各图片生成标签外,还进一步提取图片的视觉特征,在保存标签和图片的对应关系时还一并保存标签与视觉特征的对应关系,即保存针对图片生成的标签、该标签对应的图片以及从该图片中提取的图片特征的对应关系。
图4示出了针对图片搜索库中的各图片建立标签的流程示意图,如图4所示,该过程主要包括如下步骤:
步骤401、从图片搜索库中选择一个图片,并获取该图片对应的描述信息。
该步骤401的具体实现过程与上述步骤301的具体实现过程基本相同,此处步骤详细描述。
步骤402、根据获取的当前图片对应的描述信息,生成对应该图片的标签。
该步骤402的具体实现过程与上述步骤302的具体实现过程基本相同,此处步骤详细描述。
步骤403、提取当前图片的图片特征。
该步骤403中,提取当前图片的图片特征可以根据预先设定的图片特征模板提取,该图片特征可以为图片的视觉特征或者其他能够表征图片的信息,如,图片的截图。具体提取过程可以通过图片处理技术实现。
上述步骤402以及步骤403无先后执行顺序,可以并行执行,也可以先执行步骤403,再执行步骤402。
步骤404、保存针对当前图片生成的标签、从当前图片中提取的图片特征以及当前图片的对应关系。
该步骤404中,保存针对当前图片生成的标签、从当前图片中提取的图片特征以及当前图片的对应关系时,可以通过索引的方式保存,以提高图片的查找速度,具体地,可以以图片搜索库中的各图片分别对应的标签为索引,采用倒排索引法保存针对当前图片生成的标签、从当前图片中提取的图片特征以及当前图片的对应关系。应当理解,此处对于保存生成的标签和当前图片的对应关系的方式仅为举例,实际应用中可以灵活设置该对应关系的保存方式,例如,以列表的方式保存,此处不再一一列举。
步骤405、确定图片搜索库中是否还有未生成标签的图片,若是,返回步骤401,若否,结束流程。
至此,针对图片搜索库中的各图片建立索引的流程结束。
通过上述步骤401至步骤405的执行过程,能够针对图片搜索库中的各图片分别生成对应各图片的标签以及提取各图片的图片特征,并保存生成的标签、提取的图片特征以及图片的对应关系。
上述图片搜索库中的各图片建立标签的优选实施方式一以及优选实施方式二分别对应的流程,可以由具备搜索功能的服务器控制执行,也可以直接由图片搜索库执行,或者由其他具备对图片搜索库具备访问功能的实体执行。
本申请进一步针对上述图片搜索库中的各图片建立标签的优选实施方式一对应流程包括的步骤302以及优选实施方式二对应流程包括的步骤402给出了优选实现方式,即根据获取的当前图片对应的描述信息,生成对应该图片的标签的优选实现方式。图5示出了生成与图片对应的标签的流程示意图,如图5所示,主要包括如下步骤:
步骤501、从当前图片对应的描述信息中提取设定类别的关键字。
该步骤501中,可以根据图片所对应实体的具体类别,设置需要从获取的描述信息中提取的用于生成标签的关键字,例如,类别为商品的实体对应的描述信息一般包括商品名称、商品属性、商品用途、商品所在类目等,可以设置“商品名称”以及“商品属性”作为要从图片对应的描述信息中提取的用于生成标签的关键字,提取“商品名称”以及“商品属性”对应的信息。应当理解,此处对于从图片对应的描述信息中提取用于生成标签的关键字仅为举例,实际应用中,根据图片对应实体的具体类型,可以设置不同的从图片对应的描述信息中提取用于生成标签的关键字,此处不再一一赘述。
步骤502、根据提取出的关键字生成对应当前图片的标签。
该步骤502中,可以预先设定生成图片的标签的算法,并以从图片对应的描述信息中提取出的关键字为依据,生成当前图片的标签。实际应用中,该算法可以灵活设置。
至此,生成与图片对应的标签的流程结束。
本申请实施例一进一步针对上述步骤502给出了优选实施方式,即根据从图片对应的描述信息中提取出的关键字生成对应当前图片的标签的优选实施方式。图6示出了根据从图片对应的描述信息中提取出的关键字生成对应当前图片的标签的流程示意图,如图6所示,主要包括如下步骤:
步骤601、选择一个从图片对应的描述信息中提取的关键字。
该步骤601中,选择关键字可以从提取出的所有关键字中随机选择,也可以按照设定顺序选择。
步骤602、确定选择出的关键字的类别,将该该关键字采用设定的与其类别对应的算法生成该关键字对应的标签向量。
该步骤602中,与关键字的类别对应的算法可以灵活设定,例如,将提取出的关键字进行归一化处理、将该关键字对应的信息进行抽样处理等,本申请不对此进行具体限定。
步骤603、判断从图片对应的描述信息中提取的每个关键字是否被选择,若是,执行步骤604,若否,返回步骤601。
步骤604、根据每个关键字分别对应的标签向量以及每个关键字的类别对应的权值,生成对应该图片的标签。
该步骤604中,生成对应该图片的标签时,可以将每个关键字对应的标签向量乘以其权重,然后将各关键字的标签向量和权值的乘积相加得到的和,确定为对应该图片的标签,也可以将各关键字的标签向量和权值的乘积的平均值,确定为对应该图片的标签。实际应用中,根据每个关键字分别对应的标签向量以及每个关键字的类别对应的权值,生成对应该图片的标签的算法可以灵活设置,此处不再一一列举。其中,关键字的类别对应的权值可以设为1,表示不对此类别进行加权。
至此,根据从图片对应的描述信息中提取出的关键字生成对应当前图片的标签的流程结束。
在通过上述实施例提供的技术方案针对图片搜索库中的各图片建立标签并保存标签与图片的对应关系后,服务器能够基于该对应关系进行图片搜索。图7示出了服务器进行图片搜索的流程示意图,如图7所示,服务器执行图片搜索的过程主要包括:
步骤701、服务器接收用户终端发送的图片搜索请求。
该步骤701中,图片搜索请求中一般包括的用户请求搜索的图片(后续称为待搜索图片)。
步骤702、服务器根据接收的图片搜索请求,获取该图片搜索请求中包括的待搜索图片对应的描述信息。
该步骤702中,服务器获取待搜索图片的图片对应的描述信息的过程与上述步骤301中获取选择的图片对应的描述信息的过程一致,此处不再赘述。
步骤703、根据获取的待搜索图片对应的描述信息,生成对应该待搜索图片的标签。
该步骤703中,生成对应待搜索图片的标签的方式与上述步骤302中生成图片搜索库中的各图片的标签的方式相同,此处不再赘述。
步骤704、根据保存的标签与图片的对应关系,确定出与该待搜索的图片的标签对应的图片。
该步骤704中,根据保存的标签与图片的对应关系,确定出与该待搜索的图片的标签对应的图片,即根据该待搜索的图片的标签,搜索保存的标签与图片的对应关系,从中搜索到与该待搜索的图片的标签对应的图片。其中,保存的标签与图片的对应关系,可以为通过上述针对图片搜索库中的各图片建立标签的优选实施方式一保存的对应关系,也可以为通过上述针对图片搜索库中的各图片建立标签的优选实施方式二保存的对应关系。
步骤705、服务器将确定出的图片发送给该图片搜索请求的用户终端。
该步骤705中,服务器将确定出的图片发送给用户终端之前,可以对确定出的图片按照设定规则进行处理,该设定规则可以灵活设置,可以由服务器设置,也可以由用户终端设置,例如,可以按照图片的分辨率由高到低排列,也可以按照图片对应的实体的设定属性由好到差排列等,此处不再一一列举。
至此,服务器进行图片搜索的流程结束。
基于上述流程,服务器能够通过待搜索图片的标签进行图片搜索,由于该标签根据图片对应的描述信息生成,该标签一般为文本格式,因此可以复用现有服务器的文本搜索引擎实现图片搜索,从而提高了服务器资源的利用率。
上述图片搜索过程中,进行图片搜索所依据的标签与图片的对应关系,可以通过上述针对图片搜索库中的各图片建立标签的优选实施方式一生成,也可以通过上述针对图片搜索库中的各图片建立标签的优选实施方式二生成。
本申请实施例一提供了一个进行图片搜索的优选实施方式,该优选实施方式基于上述针对图片搜索库中的各图片建立标签的优选实施方式二生成的对应关系实现。图8示出了该服务器进行图片搜索的又一个流程示意图,如图8所示,服务器进行图片搜索,主要包括如下步骤:
步骤801、服务器接收用户终端发送的图片搜索请求。
该步骤801中,图片搜索请求中一般包括的待搜索图片。
步骤802、服务器根据接收的图片搜索请求,获取该图片搜索请求中包括的待搜索图片对应的描述信息。
该步骤802中,服务器获取待搜索图片的图片对应的描述信息的过程与上述步骤301中获取选择的图片对应的描述信息的过程一致,此处不再赘述。
步骤803、根据获取的待搜索图片对应的描述信息,生成对应该待搜索图片的标签。
该步骤803中,生成对应待搜索图片的标签的方式与上述步骤302中生成图片搜索库中的各图片的标签的方式相同,此处不再赘述。
步骤804、服务器从该待搜索图片从提取图片特征。
该步骤804中,服务器从该待搜索图片从提取图片特征过程与上述步骤403中提取当前图片的图片特征的过程一致,此处不再赘述。并且,该步骤804可以在上述步骤802或者步骤803之前执行。
步骤805、将提取出的待搜索图片的图片特征,与确定出的图片分别对应的图片特征进行相似度比较。
步骤806、将确定出的图片按照与待搜索图片的图片特征的相似性由高到底的顺序排序。
步骤807、服务器将确定出的图片发送给该图片搜索请求的用户终端。
该步骤807的具体执行过程与上述步骤705的具体执行过程一致,此处不再赘述。
至此,服务器进行图片搜索的流程结束。
基于上述流程,服务器能够通过待搜索图片的标签进行图片搜索,由于该标签根据图片对应的描述信息生成,该标签一般为文本格式,因此可以复用现有服务器的文本搜索引擎实现图片搜索,从而提高了服务器资源的利用率。并且,由于向用户终端反馈的搜索结果是经过相似度排序处理,因此,能够将与用户搜索的图片最相关的图片优先展示给用户。
实施例二
本申请实施例二提供了上述实施例一所提供方案中,生成标签的一个具体应用场景。
电子商务网站拥有大量的商品信息库,每个商品一般对都应文本描述信息,该文本描述信息与该商品的图片具有较强的相关性,即都是针对商品的描述,可以等效认为商品的文本描述信息即为对该商品的图片的描述信息。那么,就可以用文本标签代表图片内容,商品图片搜索就可以先用文本标签检索得到相关图片,然后再按照图片相似排序。
描述商品图片的文本标签的生成过程
商品对应的文本描述信息(如简要描述、关键字、层级类目、属性等),也可能包含人工审阅后添加的标签,本实施例就从这些信息中提取关键字生产文本标签,并可以优选地给按照文本标签的相关性进行排序。该实施例中,一个商品的各维度的标签形成的标签全集张成一个向量空间,此处,所涉及的维度即上述实施例一包括的图5的步骤501中涉及的设定类别。为便于后续描述,以下定义如下符号:
T:表示商品对应的文本标签;
T1:表示根据人工为商品添加的标签生成的标签;
T2:表示根据商品的简要描述中生成的标签;
T3:表示根据商品的关键字中生成的标签;
T4:表示根据商品的类目生成的标签;
T5:表示根据商品的属性生成的标签;
w1、w2、w3、w4、w5分别表示T1、T2、T3、T4、T5的权重。
那么,商品的文本标签的计算公式为:
T=w1*T1+w2*T2+w3*T3+w4*T4+w5*T5
其中,人工为商品添加的标签、商品的简要描述、商品的关键字、商品的类目、根据商品的属性分别对应上述步骤501中的设定类别。
图9示出了本实施例二涉及的商品的文本标签提取流程的示意图,如图9所示,商品的文本标签提取过程,主要包括:
步骤901、人工标注录入。
电子商务网站上的商品由于各种各样的原因,用户填写的信息不规范,机器识别常常有误,运营过程中往往会有不少人工审阅商品信息后给出来的标签。把人工标签录入***,作为机器自动标注的重要纠正,一个商品可能有多个标签,按照相关性从高到低的顺序录入。并以商品ID作为唯一的索引key,标签序列作为索引值,储入高性能的检索数据结构,如Trie数据库等。
步骤902、根据商品ID查询人工标签,并根据该人工标签生成标签T1。
该步骤902可以对应上述步骤602,具体地,人工标签在录入时已经按相关性从高到底排序,T1的计算公式可以为:
T1=1/log(rank+1)
其中,rank表示标签在相关性排序中的排名,根据上述公式,可以归一化得到标签T1。
步骤903:根据商品简要描述生成标签T2。
该步骤903可以对应上述步骤602,具体地,商品的简要描述一般比较短,可以利用NLP技术对简要描述预处理后,得到三类词(中心词,名词,其它词),每个词作为一个标签,词的重要性顺序为:中心词>名词>其它词,每种类型可以设置一个经验权重。
标签T2=类别权重*该类别词出现的词频,归一化得到标签T2。
步骤904、根据商品关键字生成标签T3。
该步骤904可以对应上述步骤602,具体地,用户填写的关键字往往有多个,每个关键字一般比较短,填写顺序在统计上是按照从重要到次要的顺序填写,重要性计算公式为:
1/log(rank+1)
其中,对每个关键字用NLP技术进行预处理,得到三类词(中心词,名词,其它词),每个词作为一个标签,词的重要性顺序为:中心词>名词>其它词,每种类型有一个经验权重。
T3=排序权重*类别权重*词频,归一化得到标签T3。
步骤905、根据商品类目生成标签T4。
该步骤905可以对应上述步骤602,具体地,每个商品都属于一个类目***,所在类目有一个层级,从每个层级的类目名称中提取标签,层级重要性为越细越重要,标签的层级重要性计算公式:
1/log(grain+1),
其中,粒度grain=1、2……,值越小越细。
标签T4=层级重要性分数*词频,归一化得到标签T4。
步骤906、根据商品属性生成标签T5。
该步骤906可以对应上述步骤602,具体地,商品会有很多属性维度,每个属性维度是一个标签,各个标签的重要性分数等同,归一化得到标签向量T5。
应当理解,上述流程中,除步骤901和步骤902存在执行顺序外,步骤902至步骤906的标号仅为区分各步骤,步骤902至步骤906的执行互相独立。
步骤907、根据各标签生成商品的文本标签T。
该步骤907可以对应上述步骤603,具体地,该步骤907中,可以根据上述的公式确定出T,即:
T=w1*T1+w2*T2+w3*T3+w4*T4+w5*T5
在确定出商品的标签T后,保存标签T和该商品的对应关系。
进一步地,在上述处理的基础上,还可以进一步从商品图片中提取图片特征,例如,利用图片处理技术,提取图片特征(形状特征,颜色特征,局部特征,分布式特征等等),图片特征提取技术可参考通用的图片处理技术。
在确定图片对应的标签以及提取图片特征后,可以保存与图片的对应关系,即建立索引,该过程将文本标签和图片特征构建到索引之中,文本标签是作为倒排索引的键,图片内容随同商品ID作为索引的值。
本实施例中描述的文本标签生成方法,适合于每个实体对应图片和文本描述信息的场景,而且文本描述信息和图片都集中描述某种单一概念,如在电子商务领域中,这个概念就是商品。实际应用中,用户点击某个图片,***先找到关联的文本描述信息,生成文本标签,然后利用文本搜索引擎根据文本标签检索相关的商品,最后按照图片相似性排序。
实施例三
本申请实施例三提供了一种图片搜索装置,该图片搜索装置可以位于搜索服务器中,通过在搜索服务器中应用该图片搜索装置,能够提高服务器的资源利用率。
图10示出了该实施例三提供的图片搜索装置的结构示意图,如图10所示,该图片搜索装置主要包括:
对应关系生成单元1001、描述信息获取单元1002、标签生成单元1003、图片确定单元1004以及图片提供单元1005;
其中:
对应关系生成单元1001,用于针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;
描述信息获取单元1002,用于根据接收的图片搜索请求,获取图片搜索请求中包括的待搜索图片对应的描述信息;
标签生成单元1003,用于根据描述信息获取单元1002获取的待搜索图片对应的描述信息,生成对应待搜索图片的标签,其中,生成对应待搜索图片的标签的方式与对应关系生成单元1001分别生成对应图片搜索库中的各图片的标签的方式相同;
图片确定单元1004,用于根据对应关系生成单元1001保存的标签与图片的对应关系,确定出与标签生成单元1003生成的待搜索的图片的标签对应的图片;
图片提供单元1005,用于将图片确定单元1004确定出的图片发送给图片搜索请求的发送端。
本申请实施例三提供的一个优选实施方式中,图10所示装置包括的描述信息获取单元1002,具体用于根据图片搜索请求中包括的待搜索图片,确定待搜索图片对应的实体,并获取实体的描述信息作为待搜索图片对应的描述信息。
本申请实施例三提供的一个优选实施方式中,图10所示装置包括的标签生成单元1003,具体用于从待搜索图片对应的描述信息中提取设定类别的关键字,并根据提取出的关键字生成对应待搜索图片的标签。
本申请实施例三提供的一个优选实施方式中,图10所示装置包括的标签生成单元1003,具体用于针对提取出的每个设定类别的关键字,将该关键字采用设定的与其类别对应的算法生成该关键字对应的标签向量,并根据每个关键字分别分别对应的标签向量以及每个关键字的类别对应的权值,生成对应待搜索图片的标签。
本申请实施例三提供的一个优选实施方式中,图10所示装置包括的对应关系生成单元1001,具体用于以生成的对应各图片的标签为索引,采用倒排索引法保存生成的标签以及图片的对应关系。
本申请实施例三提供的一个优选实施方式中,图10所示装置包括的对应关系生成单元1001,具体用于提取图片搜索库中的各图片的图片特征,并保存生成的标签、该标签对应的图片以及从该图片中提取的图片特征的对应关系。
如图11所示,本申请实施例三提供的一个优选实施方式中,图10所示装置还可以进一步包括:
图片排序单元1006,用于在图片提供单元1005将确定出的图片发送给图片搜索请求的发送端之前,根据接收的图片搜索请求,提取图片搜索请求中包括的待搜索图片的图片特征,并将提取出的待搜索图片的图片特征,与确定出的图片分别对应的图片特征进行相似度比较,将确定出的图片按照与待搜索图片的图片特征的相似性由高到底的顺序排序。
上述各单元的功能可对应于上述实施例一中图片搜索流程中的相应处理步骤,在此不再赘述。
本申请的实施例三所提供的图片搜索装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的单元划分方式仅是众多单元划分方式中的一种,如果划分为其他单元或不划分单元,只要图片搜索装置具有上述功能,都应该在本申请的保护范围之内。
进一步地,本申请实施例三通过的上述图片搜索装置还可以具备能够实现上述实施例一中功能的各单元,此处不再一一划分。
通过本申请实施例提供的上述至少一个技术方案,能够复用现有的文本搜索引擎,从而提高了服务器资源的利用率。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (14)

1.一种图片搜索方法,其特征在于,针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;所述搜索方法包括:
根据接收的图片搜索请求,获取所述图片搜索请求中包括的待搜索图片对应的描述信息;
根据所述待搜索图片对应的描述信息,生成对应所述待搜索图片的标签,其中,生成对应所述待搜索图片的标签的方式与分别生成对应所述图片搜索库中的各图片的标签的方式相同;
根据保存的标签与图片的对应关系,确定出与所述待搜索的图片的标签对应的图片;
将确定出的所述图片发送给所述图片搜索请求的发送端。
2.如权利要求1所述的方法,其特征在于,获取所述图片搜索请求中包括的待搜索图片对应的描述信息,包括:
根据所述图片搜索请求中包括的待搜索图片,确定所述待搜索图片对应的实体,并获取所述实体的描述信息作为所述待搜索图片对应的描述信息。
3.如权利要求1所述的方法,其特征在于,根据所述待搜索图片对应的描述信息,生成对应所述待搜索图片的标签,包括:
从所述待搜索图片对应的描述信息中提取设定类别的关键字,并根据提取出的关键字生成对应所述待搜索图片的标签。
4.如权利要求3所述的方法,其特征在于,根据提取出的关键字生成对应所述待搜索图片的标签,包括:
针对提取出的每个设定类别的关键字,将该关键字采用设定的与其类别对应的算法生成该关键字对应的标签向量;
根据每个关键字分别对应的标签向量以及每个关键字的类别对应的权值,生成对应所述待搜索图片的标签。
5.如权利要求1所述的方法,其特征在于,保存生成的标签以及图片的对应关系,包括:
以生成的对应各图片的标签为索引,采用倒排索引法保存生成的标签以及图片的对应关系。
6.如权利要求1或5所述的方法,其特征在于,保存生成的标签以及图片的对应关系,包括:
提取所述图片搜索库中各图片的图片特征,并保存生成的标签、该标签对应的图片以及从该图片中提取的图片特征的对应关系。
7.如权利要求6所述的方法,其特征在于,将确定出的所述图片发送给所述图片搜索请求的发送端之前,还包括:
根据接收的图片搜索请求,提取所述图片搜索请求中包括的待搜索图片的图片特征;并
将提取出的所述待搜索图片的图片特征,与确定出的所述图片分别对应的图片特征进行相似度比较;
将确定出的所述图片按照与所述待搜索图片的图片特征的相似性由高到底的顺序排序。
8.一种图片搜索装置,其特征在于,包括:
对应关系生成单元,用于针对图片搜索库中的各图片,根据各图片对应的描述信息分别生成对应各图片的标签,并保存生成的标签以及图片的对应关系;
描述信息获取单元,用于根据接收的图片搜索请求,获取所述图片搜索请求中包括的待搜索图片对应的描述信息;
标签生成单元,用于根据所述描述信息获取单元获取的所述待搜索图片对应的描述信息,生成对应所述待搜索图片的标签,其中,生成对应所述待搜索图片的标签的方式与所述对应关系生成单元分别生成对应所述图片搜索库中的各图片的标签的方式相同;
图片确定单元,用于根据所述对应关系生成单元保存的标签与图片的对应关系,确定出与所述标签生成单元生成的所述待搜索的图片的标签对应的图片;
图片提供单元,用于将所述图片确定单元确定出的所述图片发送给所述图片搜索请求的发送端。
9.如权利要求8所述的装置,其特征在于,所述描述信息获取单元,具体用于根据所述图片搜索请求中包括的待搜索图片,确定所述待搜索图片对应的实体,并获取所述实体的描述信息作为所述待搜索图片对应的描述信息。
10.如权利要求8所述的装置,其特征在于,所述标签生成单元,具体用于从所述待搜索图片对应的描述信息中提取设定类别的关键字,并根据提取出的关键字生成对应所述待搜索图片的标签。
11.如权利要求10所述的装置,其特征在于,所述标签生成单元,具体用于针对提取出的每个设定类别的关键字,将该关键字采用设定的与其类别对应的算法生成该关键字对应的标签向量,并根据每个关键字分别分别对应的标签向量以及每个关键字的类别对应的权值,生成对应所述待搜索图片的标签。
12.如权利要求8所述的装置,其特征在于,所述对应关系生成单元,具体用于以生成的对应各图片的标签为索引,采用倒排索引法保存生成的标签以及图片的对应关系。
13.如权利要求8或12所述的装置,其特征在于,所述对应关系生成单元,具体用于提取图片搜索库中的各图片的图片特征,并保存生成的标签、该标签对应的图片以及从该图片中提取的图片特征的对应关系。
14.如权利要求13所述的装置,其特征在于,还包括:
图片排序单元,用于在所述图片提供单元将确定出的所述图片发送给所述图片搜索请求的发送端之前,根据接收的图片搜索请求,提取所述图片搜索请求中包括的待搜索图片的图片特征,并将提取出的所述待搜索图片的图片特征,与确定出的所述图片分别对应的图片特征进行相似度比较,将确定出的所述图片按照与所述待搜索图片的图片特征的相似性由高到底的顺序排序。
CN201110380442XA 2011-11-25 2011-11-25 一种图片搜索方法以及图片搜索装置 Pending CN103136228A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201110380442XA CN103136228A (zh) 2011-11-25 2011-11-25 一种图片搜索方法以及图片搜索装置
TW101107352A TW201322021A (zh) 2011-11-25 2012-03-05 圖片搜索方法以及圖片搜索裝置
EP12794621.8A EP2783310A1 (en) 2011-11-25 2012-11-21 Image searching
PCT/US2012/066251 WO2013078307A1 (en) 2011-11-25 2012-11-21 Image searching
JP2014543557A JP6141305B2 (ja) 2011-11-25 2012-11-21 画像検索
US13/683,384 US9460117B2 (en) 2011-11-25 2012-11-21 Image searching

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110380442XA CN103136228A (zh) 2011-11-25 2011-11-25 一种图片搜索方法以及图片搜索装置

Publications (1)

Publication Number Publication Date
CN103136228A true CN103136228A (zh) 2013-06-05

Family

ID=47263610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110380442XA Pending CN103136228A (zh) 2011-11-25 2011-11-25 一种图片搜索方法以及图片搜索装置

Country Status (6)

Country Link
US (1) US9460117B2 (zh)
EP (1) EP2783310A1 (zh)
JP (1) JP6141305B2 (zh)
CN (1) CN103136228A (zh)
TW (1) TW201322021A (zh)
WO (1) WO2013078307A1 (zh)

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699679A (zh) * 2013-12-31 2014-04-02 上海华勤通讯技术有限公司 目标对象的信息检索方法及信息检索设备
CN103714125A (zh) * 2013-12-11 2014-04-09 广州亿码科技有限公司 一种搜索方法
CN103744860A (zh) * 2013-12-12 2014-04-23 中国科学院深圳先进技术研究院 一种查找图片的方法、装置及手机
CN103995848A (zh) * 2014-05-06 2014-08-20 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN104239336A (zh) * 2013-06-19 2014-12-24 华为技术有限公司 一种图像筛选方法、装置及终端
CN104424257A (zh) * 2013-08-28 2015-03-18 北大方正集团有限公司 信息检索装置和信息检索方法
CN104462590A (zh) * 2014-12-30 2015-03-25 百度在线网络技术(北京)有限公司 信息搜索方法及装置
CN104484438A (zh) * 2014-12-23 2015-04-01 小米科技有限责任公司 图片处理方法及装置
CN105138681A (zh) * 2015-09-15 2015-12-09 成都品果科技有限公司 基于空间坐标定位的图片搜索方法及***
CN105389333A (zh) * 2015-10-13 2016-03-09 林炮勤 一种检索***构建方法及服务器架构
CN105468716A (zh) * 2015-11-19 2016-04-06 努比亚技术有限公司 图片查找装置、方法及终端
CN105518661A (zh) * 2013-08-12 2016-04-20 微软技术许可有限责任公司 经由挖掘的超链接文本的片段来浏览图像
CN105528428A (zh) * 2015-12-09 2016-04-27 深圳市金立通信设备有限公司 一种图像显示方法及终端
WO2016107126A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 图片搜索方法和装置
WO2016107190A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 搜索方法和装置
CN106126647A (zh) * 2016-06-24 2016-11-16 宇龙计算机通信科技(深圳)有限公司 图片搜索方法及装置
CN106202316A (zh) * 2016-07-01 2016-12-07 传线网络科技(上海)有限公司 基于视频的商品信息获取方法及装置
CN106570714A (zh) * 2015-10-08 2017-04-19 阿里巴巴集团控股有限公司 一种搭配对象图片的推荐方法、映射关系建立方法及装置
CN106779791A (zh) * 2015-11-25 2017-05-31 阿里巴巴集团控股有限公司 一种搭配对象图片组合的生成方法及装置
CN106779304A (zh) * 2016-11-24 2017-05-31 广州宝钢南方贸易有限公司 一种面向钢材贸易的内部抢单***及方法
CN107004122A (zh) * 2014-11-18 2017-08-01 索尼公司 补充信息的基于屏幕截图的指示
CN107590291A (zh) * 2017-10-30 2018-01-16 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107679208A (zh) * 2017-10-16 2018-02-09 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107741972A (zh) * 2017-10-12 2018-02-27 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107861971A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品搜索方法和装置
CN107862239A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种结合文本与图片进行图片识别的方法及其装置
CN107861970A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品图片搜索方法和装置
CN108228826A (zh) * 2018-01-02 2018-06-29 联想(北京)有限公司 一种信息查找方法及电子设备
CN108256010A (zh) * 2018-01-03 2018-07-06 阿里巴巴集团控股有限公司 内容推荐方法及装置
CN108268571A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种特征筛选方法及装置
CN108596280A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 用于文献搜索的图片识别方法
CN108848270A (zh) * 2018-06-29 2018-11-20 维沃移动通信(深圳)有限公司 一种截屏图像的处理方法和移动终端
CN109635135A (zh) * 2018-11-30 2019-04-16 Oppo广东移动通信有限公司 图像索引生成方法、装置、终端及存储介质
CN109840288A (zh) * 2019-02-21 2019-06-04 北京一品智尚信息科技有限公司 图片检索方法、设备和存储介质
CN110019903A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 图像处理引擎组件的生成方法、搜索方法及终端、***
CN110309464A (zh) * 2018-03-01 2019-10-08 北京京东尚科信息技术有限公司 信息展示***、方法及装置
CN110598038A (zh) * 2019-09-27 2019-12-20 京东方科技集团股份有限公司 画作标签生成方法及电子设备
CN110765301A (zh) * 2019-11-06 2020-02-07 腾讯科技(深圳)有限公司 图片处理方法、装置、设备及存储介质
TWI693524B (zh) * 2018-05-22 2020-05-11 正修學校財團法人正修科技大學 專屬個性化圖片搜尋優化方法
CN111753181A (zh) * 2019-03-28 2020-10-09 北京京东尚科信息技术有限公司 基于图像的搜索方法、装置、服务器、客户端及介质
CN112131417A (zh) * 2019-06-25 2020-12-25 北京百度网讯科技有限公司 图像标签生成方法及装置
CN112860929A (zh) * 2021-02-09 2021-05-28 北京百度网讯科技有限公司 一种图片搜索方法、装置、电子设备及存储介质
CN115168637A (zh) * 2022-06-17 2022-10-11 杭州晶彩数字科技有限公司 一种图片添加标签方法、***及存储介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9111012B2 (en) * 2012-11-26 2015-08-18 Accenture Global Services Limited Data consistency management
US10831820B2 (en) * 2013-05-01 2020-11-10 Cloudsight, Inc. Content based image management and selection
US10223454B2 (en) * 2013-05-01 2019-03-05 Cloudsight, Inc. Image directed search
WO2015130185A1 (ru) * 2014-02-26 2015-09-03 Андрей Юрьевич ЩЕРБАКОВ Способ индексирования, сравнения и поиска изображений в компьютерной системе
US10013436B1 (en) * 2014-06-17 2018-07-03 Google Llc Image annotation based on label consensus
US9922271B2 (en) 2015-03-20 2018-03-20 Netra, Inc. Object detection and classification
US9760792B2 (en) 2015-03-20 2017-09-12 Netra, Inc. Object detection and classification
US9852131B2 (en) 2015-05-18 2017-12-26 Google Llc Techniques for providing visual translation cards including contextually relevant definitions and examples
CN104899744B (zh) * 2015-06-29 2018-03-16 汪新淮 钱币邮票收藏品交易***与交易方法
CN105138680A (zh) * 2015-09-14 2015-12-09 郑州悉知信息科技股份有限公司 关键词分类方法、装置及产品搜索方法、装置
US10599731B2 (en) * 2016-04-26 2020-03-24 Baidu Usa Llc Method and system of determining categories associated with keywords using a trained model
CN107895050A (zh) * 2017-12-07 2018-04-10 联想(北京)有限公司 图片搜索方法及***
US10592782B2 (en) * 2018-01-22 2020-03-17 International Business Machines Corporation Image analysis enhanced related item decision
CN108717464A (zh) * 2018-05-31 2018-10-30 中国联合网络通信集团有限公司 照片处理方法、装置及终端设备
CN112347289A (zh) * 2019-08-06 2021-02-09 Tcl集团股份有限公司 一种图像管理方法及终端
CN111522967B (zh) * 2020-04-27 2023-09-15 北京百度网讯科技有限公司 知识图谱构建方法、装置、设备以及存储介质
CN114741550B (zh) * 2022-06-09 2023-02-10 腾讯科技(深圳)有限公司 图像搜索方法、装置、电子设备和计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6584223B1 (en) * 1998-04-02 2003-06-24 Canon Kabushiki Kaisha Image search apparatus and method
JP2007134934A (ja) * 2005-11-10 2007-05-31 Matsushita Electric Ind Co Ltd 映像情報検索システムおよび映像監視システム
CN101458711A (zh) * 2008-12-30 2009-06-17 国家电网公司 一种图形描述和变换方法及***
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用
CN101694657A (zh) * 2009-09-18 2010-04-14 浙江大学 面向Web2.0标签图片共享空间的图片检索聚类方法
CN101782904A (zh) * 2009-01-21 2010-07-21 神达电脑股份有限公司 自动替照片加入标签的个人导航装置及方法
CN101826102A (zh) * 2010-03-26 2010-09-08 浙江大学 一种图书关键字自动生成的方法
US8032483B1 (en) * 2004-12-03 2011-10-04 Google Inc. Using game responses to gather data

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100367932B1 (ko) 1999-11-26 2003-01-14 주식회사 메디슨 초음파영상검색장치
US7076498B2 (en) 2002-06-10 2006-07-11 International Business Machines Corporation Method and apparatus for processing user input selecting images from a web page in a data processing system
US7660468B2 (en) * 2005-05-09 2010-02-09 Like.Com System and method for enabling image searching using manual enrichment, classification, and/or segmentation
US8341112B2 (en) * 2006-05-19 2012-12-25 Microsoft Corporation Annotation by search
JP2008004081A (ja) * 2006-05-23 2008-01-10 Hitachi High-Technologies Corp 画像検索装置、画像検索システム、画像検索方法、および画像検索方法を実行するためのプログラム
JP5098253B2 (ja) * 2006-08-25 2012-12-12 コニカミノルタエムジー株式会社 データベースシステム、プログラム、及びレポート検索方法
US20080126191A1 (en) 2006-11-08 2008-05-29 Richard Schiavi System and method for tagging, searching for, and presenting items contained within video media assets
US20090024577A1 (en) 2007-07-20 2009-01-22 Gregory Prestel System and method for organizing, posting and searching information on a network
US8452794B2 (en) * 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
CN102341824B (zh) 2009-03-04 2016-05-18 奥林巴斯株式会社 图像数据库编辑方法、图像数据库编辑装置和图像检索方法
CN102483745B (zh) 2009-06-03 2014-05-14 谷歌公司 共同选择图像分类
US9384214B2 (en) * 2009-07-31 2016-07-05 Yahoo! Inc. Image similarity from disparate sources
US8503739B2 (en) 2009-09-18 2013-08-06 Adobe Systems Incorporated System and method for using contextual features to improve face recognition in digital images
US20110072047A1 (en) * 2009-09-21 2011-03-24 Microsoft Corporation Interest Learning from an Image Collection for Advertising
US9710491B2 (en) * 2009-11-02 2017-07-18 Microsoft Technology Licensing, Llc Content-based image search
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
CN102110122B (zh) 2009-12-24 2013-04-03 阿里巴巴集团控股有限公司 一种建立样本图片索引表和图片过滤、搜索方法及装置
US8631004B2 (en) * 2009-12-28 2014-01-14 Yahoo! Inc. Search suggestion clustering and presentation
US8401282B2 (en) 2010-03-26 2013-03-19 Mitsubishi Electric Research Laboratories, Inc. Method for training multi-class classifiers with active selection and binary feedback
CN101853297A (zh) 2010-05-28 2010-10-06 英华达(南昌)科技有限公司 一种在电子设备中快速获得期望图像的方法
US8898169B2 (en) * 2010-11-10 2014-11-25 Google Inc. Automated product attribute selection

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6584223B1 (en) * 1998-04-02 2003-06-24 Canon Kabushiki Kaisha Image search apparatus and method
US8032483B1 (en) * 2004-12-03 2011-10-04 Google Inc. Using game responses to gather data
JP2007134934A (ja) * 2005-11-10 2007-05-31 Matsushita Electric Ind Co Ltd 映像情報検索システムおよび映像監視システム
CN101458695A (zh) * 2008-12-18 2009-06-17 西交利物浦大学 基于关键词和内容特征的混合图片索引构建和查询方法及其应用
CN101458711A (zh) * 2008-12-30 2009-06-17 国家电网公司 一种图形描述和变换方法及***
CN101782904A (zh) * 2009-01-21 2010-07-21 神达电脑股份有限公司 自动替照片加入标签的个人导航装置及方法
CN101694657A (zh) * 2009-09-18 2010-04-14 浙江大学 面向Web2.0标签图片共享空间的图片检索聚类方法
CN101826102A (zh) * 2010-03-26 2010-09-08 浙江大学 一种图书关键字自动生成的方法

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239336B (zh) * 2013-06-19 2018-03-16 华为技术有限公司 一种图像筛选方法、装置及终端
CN104239336A (zh) * 2013-06-19 2014-12-24 华为技术有限公司 一种图像筛选方法、装置及终端
CN105518661A (zh) * 2013-08-12 2016-04-20 微软技术许可有限责任公司 经由挖掘的超链接文本的片段来浏览图像
US11250203B2 (en) 2013-08-12 2022-02-15 Microsoft Technology Licensing, Llc Browsing images via mined hyperlinked text snippets
CN105518661B (zh) * 2013-08-12 2018-11-30 微软技术许可有限责任公司 经由挖掘的超链接文本的片段来浏览图像
CN104424257A (zh) * 2013-08-28 2015-03-18 北大方正集团有限公司 信息检索装置和信息检索方法
CN103714125A (zh) * 2013-12-11 2014-04-09 广州亿码科技有限公司 一种搜索方法
WO2015085665A1 (zh) * 2013-12-11 2015-06-18 广州亿码科技有限公司 一种搜索方法
CN103744860A (zh) * 2013-12-12 2014-04-23 中国科学院深圳先进技术研究院 一种查找图片的方法、装置及手机
CN103699679A (zh) * 2013-12-31 2014-04-02 上海华勤通讯技术有限公司 目标对象的信息检索方法及信息检索设备
CN103995848B (zh) * 2014-05-06 2017-04-05 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN103995848A (zh) * 2014-05-06 2014-08-20 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN107004122A (zh) * 2014-11-18 2017-08-01 索尼公司 补充信息的基于屏幕截图的指示
CN104484438A (zh) * 2014-12-23 2015-04-01 小米科技有限责任公司 图片处理方法及装置
US10296541B2 (en) 2014-12-30 2019-05-21 Baidu Online Network Technology (Beijing) Co., Ltd. Searching method and apparatus
WO2016107190A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 搜索方法和装置
CN104462590B (zh) * 2014-12-30 2019-03-12 百度在线网络技术(北京)有限公司 信息搜索方法及装置
WO2016107126A1 (zh) * 2014-12-30 2016-07-07 百度在线网络技术(北京)有限公司 图片搜索方法和装置
CN104462590A (zh) * 2014-12-30 2015-03-25 百度在线网络技术(北京)有限公司 信息搜索方法及装置
CN105138681A (zh) * 2015-09-15 2015-12-09 成都品果科技有限公司 基于空间坐标定位的图片搜索方法及***
CN106570714B (zh) * 2015-10-08 2021-01-15 阿里巴巴集团控股有限公司 一种搭配对象图片的推荐方法、映射关系建立方法及装置
CN106570714A (zh) * 2015-10-08 2017-04-19 阿里巴巴集团控股有限公司 一种搭配对象图片的推荐方法、映射关系建立方法及装置
CN105389333B (zh) * 2015-10-13 2019-04-09 深圳市红坚果科技有限公司 一种检索***构建方法及服务器架构
CN105389333A (zh) * 2015-10-13 2016-03-09 林炮勤 一种检索***构建方法及服务器架构
CN105468716A (zh) * 2015-11-19 2016-04-06 努比亚技术有限公司 图片查找装置、方法及终端
CN106779791B (zh) * 2015-11-25 2021-01-15 阿里巴巴集团控股有限公司 一种搭配对象图片组合的生成方法及装置
CN106779791A (zh) * 2015-11-25 2017-05-31 阿里巴巴集团控股有限公司 一种搭配对象图片组合的生成方法及装置
CN105528428A (zh) * 2015-12-09 2016-04-27 深圳市金立通信设备有限公司 一种图像显示方法及终端
CN106126647A (zh) * 2016-06-24 2016-11-16 宇龙计算机通信科技(深圳)有限公司 图片搜索方法及装置
CN106202316A (zh) * 2016-07-01 2016-12-07 传线网络科技(上海)有限公司 基于视频的商品信息获取方法及装置
CN106779304A (zh) * 2016-11-24 2017-05-31 广州宝钢南方贸易有限公司 一种面向钢材贸易的内部抢单***及方法
CN108268571A (zh) * 2017-01-04 2018-07-10 腾讯科技(深圳)有限公司 一种特征筛选方法及装置
CN107861971A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品搜索方法和装置
CN107861970A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种商品图片搜索方法和装置
CN107862239A (zh) * 2017-09-15 2018-03-30 广州唯品会研究院有限公司 一种结合文本与图片进行图片识别的方法及其装置
CN110019903A (zh) * 2017-10-10 2019-07-16 阿里巴巴集团控股有限公司 图像处理引擎组件的生成方法、搜索方法及终端、***
CN107741972A (zh) * 2017-10-12 2018-02-27 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107679208A (zh) * 2017-10-16 2018-02-09 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN107590291A (zh) * 2017-10-30 2018-01-16 广东欧珀移动通信有限公司 一种图片的搜索方法、终端设备及存储介质
CN108228826A (zh) * 2018-01-02 2018-06-29 联想(北京)有限公司 一种信息查找方法及电子设备
CN108256010A (zh) * 2018-01-03 2018-07-06 阿里巴巴集团控股有限公司 内容推荐方法及装置
CN110309464A (zh) * 2018-03-01 2019-10-08 北京京东尚科信息技术有限公司 信息展示***、方法及装置
CN108596280A (zh) * 2018-04-27 2018-09-28 佛山市日日圣科技有限公司 用于文献搜索的图片识别方法
TWI693524B (zh) * 2018-05-22 2020-05-11 正修學校財團法人正修科技大學 專屬個性化圖片搜尋優化方法
CN108848270A (zh) * 2018-06-29 2018-11-20 维沃移动通信(深圳)有限公司 一种截屏图像的处理方法和移动终端
CN109635135A (zh) * 2018-11-30 2019-04-16 Oppo广东移动通信有限公司 图像索引生成方法、装置、终端及存储介质
CN109840288A (zh) * 2019-02-21 2019-06-04 北京一品智尚信息科技有限公司 图片检索方法、设备和存储介质
CN111753181A (zh) * 2019-03-28 2020-10-09 北京京东尚科信息技术有限公司 基于图像的搜索方法、装置、服务器、客户端及介质
CN112131417A (zh) * 2019-06-25 2020-12-25 北京百度网讯科技有限公司 图像标签生成方法及装置
CN112131417B (zh) * 2019-06-25 2024-04-02 北京百度网讯科技有限公司 图像标签生成方法及装置
CN110598038A (zh) * 2019-09-27 2019-12-20 京东方科技集团股份有限公司 画作标签生成方法及电子设备
CN110765301A (zh) * 2019-11-06 2020-02-07 腾讯科技(深圳)有限公司 图片处理方法、装置、设备及存储介质
CN112860929A (zh) * 2021-02-09 2021-05-28 北京百度网讯科技有限公司 一种图片搜索方法、装置、电子设备及存储介质
CN115168637A (zh) * 2022-06-17 2022-10-11 杭州晶彩数字科技有限公司 一种图片添加标签方法、***及存储介质

Also Published As

Publication number Publication date
US20130138636A1 (en) 2013-05-30
JP2014533868A (ja) 2014-12-15
US9460117B2 (en) 2016-10-04
WO2013078307A1 (en) 2013-05-30
EP2783310A1 (en) 2014-10-01
TW201322021A (zh) 2013-06-01
JP6141305B2 (ja) 2017-06-07

Similar Documents

Publication Publication Date Title
CN103136228A (zh) 一种图片搜索方法以及图片搜索装置
US9146915B2 (en) Method, apparatus, and computer storage medium for automatically adding tags to document
US20150278359A1 (en) Method and apparatus for generating a recommendation page
US11580181B1 (en) Query modification based on non-textual resource context
US20170212899A1 (en) Method for searching related entities through entity co-occurrence
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
JP2013541793A (ja) マルチモード検索クエリー入力手法
US20140379719A1 (en) System and method for tagging and searching documents
US9552415B2 (en) Category classification processing device and method
JP2013531289A (ja) 検索におけるモデル情報群の使用
WO2014206151A1 (en) System and method for tagging and searching documents
CN109255000B (zh) 一种标签数据的维度管理方法及装置
WO2013192093A1 (en) Search method and apparatus
CN111563382A (zh) 文本信息的获取方法、装置、存储介质及计算机设备
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN107085568A (zh) 一种文本相似度判别方法及装置
CN111666383A (zh) 信息处理方法、装置、电子设备及计算机可读存储介质
CN114330329A (zh) 一种业务内容搜索方法、装置、电子设备及存储介质
CN112579729A (zh) 文档质量评价模型的训练方法、装置、电子设备和介质
CN104881447A (zh) 搜索方法及装置
JP5324677B2 (ja) 類似文書検索支援装置及び類似文書検索支援プログラム
CN116186198A (zh) 信息检索方法、装置、计算机设备及存储介质
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
JP2018088182A (ja) モデル生成装置、クリックログ正解尤度算出装置、文書検索装置、方法、及びプログラム
US9183251B1 (en) Showing prominent users for information retrieval requests

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1181481

Country of ref document: HK

RJ01 Rejection of invention patent application after publication

Application publication date: 20130605

RJ01 Rejection of invention patent application after publication