CN115795147A - 用于进行搜索的方法和*** - Google Patents

用于进行搜索的方法和*** Download PDF

Info

Publication number
CN115795147A
CN115795147A CN202211417212.0A CN202211417212A CN115795147A CN 115795147 A CN115795147 A CN 115795147A CN 202211417212 A CN202211417212 A CN 202211417212A CN 115795147 A CN115795147 A CN 115795147A
Authority
CN
China
Prior art keywords
item
listing
list
listings
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211417212.0A
Other languages
English (en)
Inventor
瓦姆西·克里希纳·萨拉卡
马尔科·彭纳奇奥蒂
达维德·利本奇
蒂莫西·贝西娅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
eBay Inc
Original Assignee
eBay Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by eBay Inc filed Critical eBay Inc
Publication of CN115795147A publication Critical patent/CN115795147A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本文描述的示例实施例公开了用于在来自在线市场的搜索结果内进行近似相同多面实体识别的***和方法。在线市场可以是或包括具有一个或多个服务器机器的群组,该一个或多个服务器机器被配置为提供一个或多个在线市场服务,包括近似相同多面实体识别***。用户设备可以基于提交的搜索标准相应地向在线市场请求并接收物品列表集合。然后,在线市场可访问该物品列表集合,并识别该物品列表集合中的一个或多个类似物品列表,以便降级该集合内类似物品列表的排名。

Description

用于进行搜索的方法和***
本申请是于2016年5月19日递交的题为“MULTI-FACETED ENTITY IDENTIFICATIONIN SEARCH”的PCT国际申请PCT/US2016/033253的中国阶段申请(申请号为201680042360.5)的分案申请。
优先权声明
本申请要求2015年5月20日提交的美国临时申请序列号62/164,406的优先权,其全部内容通过引用并入本文。
技术领域
本申请通常涉及数据处理***,并且在一个具体示例中涉及用于搜索中的近似相同多面实体识别的技术和应用。
背景技术
网站已使用户能够搜索和购买各种产品和服务。个人通过在线市场购买和销售产品变得越来越普遍。在线市场(或电子商务市场)是一种电子商务网站,其中产品或服务信息由多个第三方提供,而交易由市场运营商处理。在线市场通常适合于能够手动输入和跟踪少量商品的非常小规模的卖家,或者适合于与所选择的在线市场形成合作关系的非常大规模的卖家。
卖家可以创建物品的列表,该物品列表然后可以由在线市场响应于从买家接收到的搜索请求而在搜索结果集合中调用和显示。通常,为了在在线市场内获得优于其他卖家的优势,卖家可以为单个物品创建多个列表以获得更多的关注和查看。因此,搜索结果可能会因重复物品列表而被拥塞,并从而可能无法准确指示可从所有卖家购得的所有物品。
发明内容
提供了用于进行搜索的方法和***,以及对应的机器可读介质。
根据一个方面,提供了一种用于进行搜索的方法,包括:从客户端设备接收搜索请求;基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;从多个搜索结果中识别涉及所述有形物品的第二物品列表;基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,修改排名包括将所述第二物品列表在所述搜索结果集合中降级;使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
根据另一个方面,提供了一种用于进行搜索的***,包括:搜索模块,包括一个或多个处理器,且被配置为从客户端设备接收搜索请求;所述搜索模块还被配置为基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;类似物品识别模块,包括一个或多个处理器,且被配置为访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;所述类似物品识别模块还被配置为从多个搜索结果中识别涉及所述有形物品的第二物品列表;所述类似物品识别模块还被配置为基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;排名模块,包括一个或多个处理器,且被配置为基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,所述排名模块对排名的修改包括:将所述第二物品列表在所述搜索结果集合中降级;通信模块,包括一个或多个处理器,且被配置为使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
根据另一个方面,提供了一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:从客户端设备接收搜索请求;基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;从多个搜索结果中识别涉及所述有形物品的第二物品列表;基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,修改排名包括将所述第二物品列表在所述搜索结果集合中降级;使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
附图说明
在附图中通过举例说明而非限制性的方式示出了一些实施例,在附图中:
图1是描绘在其中可以部署一个示例实施例的客户端-服务器***的网络示图。
图2是示出了根据一些示例实施例的近似相同多面实体识别***的各种模块的方框图。
图3是示出了方法300的流程图,该方法根据各种示例实施例用于检索包括物品列表的搜索结果集合,并识别该搜索结果集合中的重复物品列表。
图4是示出了根据各种示例实施例的用于生成分配给物品列表的签名的方法400的流程图。
图5A描绘了示出根据各种示例实施例的包括多个重复物品列表的搜索结果集合的图。
图5B描绘了示出根据各种示例实施例的在重复物品列表已经被降级之后的搜索结果集合的图。
图6是示出了具有计算机***的示例形式的机器的示图表示,在所述计算机***中,可以执行一组指令以使所述机器执行本文讨论的方法中的任一个或多个方法。
具体实施方式
本文描述的示例实施例公开了用于在来自在线市场的搜索结果内进行近似相同多面实体识别的***和方法。在线市场可以是或包括具有一个或多个服务器机器的群组,该一个或多个服务器机器被配置为提供一个或多个在线市场服务,包括近似相同多面实体识别***。用户设备可以基于提交的搜索标准相应地向在线市场请求并接收物品列表集合。然后,在线市场可访问该物品列表集合,并识别该物品列表集合中的一个或多个类似物品列表,以便降级类似物品列表的排名。示例只是代表可能的变化。除非另行明确声明,否则组件和功能是可选的,且可被合并或细分,且操作可以在顺序上变化或被组合或细分。在以下描述中,出于解释的目的,对多个具体细节进行阐述,以提供对示例实施例的透彻理解。然而,对于本领域技术人员将显而易见的是:本主题可以在没有这些具体细节的情况下实施。
在线市场被配置为(例如,通过包括一个或多个处理器的一个或多个合适的模块)在图形用户界面中检索和呈现搜索结果(例如,物品列表)。例如,通过将一个或多个搜索标准输入到图形用户界面中,用户通过在用户设备上的图形用户界面与在线市场进行交互,该搜索标准标识用户期望购买的物品。作为响应,在线市场基于物品列表与接收到的搜索标准的相关性来检索要在有序列表中呈现的对应搜索结果。在使搜索结果显示在客户端设备上之前,在线市场从搜索结果中识别一个或多个等效物品列表,并且降级该一个或多个等效列表,使得它们显示在有序列表的末尾。在已经降级了等效搜索结果后,在线市场使搜索结果显示在客户端设备上。
此外,在线市场被配置为(例如,通过包括一个或多个处理器的一个或多个合适的模块)基于从卖家接收到的一个或多个用户输入来创建物品列表。例如,卖家可以向在线市场提供定义物品列表的组件的一个或多个输入,包括例如列表标题、类别、图像、价格和描述。作为响应,在线市场应用适当的算法(例如,局部敏感散列算法)来针对物品列表的每一个组件生成散列。在这种背景下,散列定义为描述物品列表的单独组件的比特序列。在一些示例实施例中,可以为每一个组件写入多个散列。在线市场然后可以通过组合物品列表的每一个散列来生成物品列表的签名。然后对签名编索引并分配给物品列表。
作为从用户角度来看的说明性示例,假设第一用户访问在线市场以生成针对他想要发布以供销售的单个物品的第一物品列表。第一用户可以向在线市场提供一个或多个物品组件,诸如列表标题、列表图像、描述和价格值。作为响应,在线市场生成签名并将其附加到该单个物品的第一物品列表。在线市场然后可以对该物品列表编索引并存储,以便基于搜索标准,响应于接收到标识该物品列表的搜索请求来检索该物品列表。
现在,假设为了增加供销售的该单个物品的可见性,第一用户决定生成第一物品列表的十个等效物品列表。第一用户可以例如向在线市场提供类似列表标题、类似列表图像、类似价格值以及类似描述。作为响应,在线市场为每一个等效物品列表生成并附加签名,并对物品列表编索引并存储。
第二用户(例如,买方)然后向在线市场提供标识或以另外方式描述她期望购买的物品(例如,第一物品)的搜索标准。响应于接收到搜索标准,在线市场检索包括多个物品列表的搜索结果集合。该多个物品列表可以包括由第一用户创建的第一物品列表以及由第一用户创建的十个重复物品列表。在检索到搜索结果时,在线市场访问第一物品列表的签名,并通过应用局部敏感散列(LSH)技术,确定十个重复列表实际上类似于第一物品列表。LSH是可用于检测近似重复的算法。LSH的一般方案是对项目进行多次“散列”,这样类似项目比不同项目更可能被散列到相同的桶(bucket)。存在若干LSH函数,每一个函数都能够估计特定的相似性度量(例如,Jaccard、余弦)。因此,LSH的优点是:依靠散列,可以按照O(n)而不是O(n)2来执行n个项目之间的相似度计算。
在已经识别出十个重复列表类似于第一物品列表之后,在线市场可以通过例如将等效物品列表降级到该搜索结果集合的末尾来修改搜索结果的顺序。因此,可以在呈现给客户端设备的搜索结果集合中仅显示每一个实体物品的单个物品列表。
参考图1,示出了高级的基于客户端-服务器的网络架构100的示例实施例。具有基于网络的市场或支付***的示例形式的联网***102经由网络104(例如互联网或广域网(WAN))向一个或多个客户端设备110提供服务器侧功能。图1示出了例如在客户端设备110上执行的web客户端112(例如浏览器,比如由华盛顿州雷德蒙德的
Figure BDA0003938752480000061
公司开发的Internet
Figure BDA0003938752480000062
浏览器)、应用114和编程客户端116。
客户端设备110可以包括但不限于:移动电话、台式计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、笔记本计算机、多处理器***、基于微处理器或可编程的消费电子产品、游戏机、机顶盒或用户可以用来访问联网***102的任何其他通信设备。在一些实施例中,客户端设备110可以包括显示模块(未示出)以显示信息(例如,以用户接口的形式)。在另一些实施例中,客户端设备110可以包括触摸屏、加速度计、陀螺仪、相机、麦克风、全球定位***(GPS)设备等中的一个或多个。客户端设备110可以是用于执行涉及联网***102内的数字物品的交易的用户设备。在一个实施例中,联网***102是基于网络的市场,其响应于对产品列表的请求,发布包括在基于网络的市场上可用的产品的物品列表的公告,并且管理这些市场交易的支付。一个或多个用户106可以是人、机器或与客户端设备110交互的其它装置。在实施例中,用户106不是网络架构100的一部分,但可以经由客户端设备110或另一装置与网络架构100进行交互。例如,网络104的一个或多个部分可以是自组织(ad hoc)网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网的一部分、公共电话交换网(PSTN)的一部分、蜂窝电话网、无线网络、WiFi网络、WiMax网络、另一类型的网络或两个或更多个这样的网络的组合。
客户端设备110中的每个可以包括一个或多个应用114(也称作“app”),例如但不限于web浏览器、消息传送应用、电子邮件(email)应用、电子商务网站应用(也称作市场应用)等。在一些实施例中,如果电子商务网站应用被包括在给定客户端设备110中的一个中,则该应用114被配置为本地提供用户接口以及如下情况下的至少一些功能,所述情况为:所述应用114被配置为根据需要与联网***102通信,以获得本地不可获得的数据和/或处理能力(例如,访问可供销售的物品的数据库、认证用户、验证支付方法等)。相反,如果电子商务网站应用未被包括在客户端设备110中,则客户端设备110可以使用其web浏览器来访问联网***102上容纳的电子商务网站(或其变型)。
一个或多个用户106可以是人、机器或与客户端设备110交互的其他装置。在示例实施例中,用户106不是网络架构100的一部分,但可以经由客户端设备110或其它装置与网络架构100进行交互。例如,用户106向客户端设备110提供输入(例如,触摸屏输入或字母数字输入),并且该输入经由网络104传送给网络***102。在该实例中,联网***102响应于接收到来白用户106的输入,经由网络104将信息传送给客户端设备110以呈现给用户106。以这种方式,用户106可以使用客户端设备110与联网***102交互。
应用程序接口(API)服务器120和网络服务器122耦合至一个或多个应用服务器140,并分别向一个或多个应用服务器418提供编程接口和网络接口。应用服务器140可以主控(host)一个或多个发布***142和支付***144,发布***142和支付***144中的每个可以包括一个或多个模块或应用,并且该模块或应用中的每个可以体现为硬件、软件、固件或它们的任意组合。相应地,应用服务器140被示为耦合到一个或多个数据库服务器124,所述数据库服务器促进对一个或多个信息存储库或数据库126的访问。在示例实施例中,数据库126是存储要公告到发布***142的信息(例如,发布或列清单)的存储设备。根据示例实施例,数据库126还可以存储数字物品信息。
另外,在第三方服务器130上执行的第三方应用132被示为具有经由API服务器120提供的编程接口对联网***102的编程访问。例如,第三方应用132利用从联网***102获取的信息,支持第三方所拥有的网站上的一个或多个特征或功能。例如,第三方网站提供由联网***102的相关应用支持的一个或多个促销、市场或支付功能。
发布应用142可以向访问联网***102的用户提供多个发布功能和服务。支付***144同样可以提供多个功能以执行或有助于支付和交易。虽然发布***142和支付***144在图1中都被示为形成联网***102的一部分,但是应当理解,在备选实施例中,每个***142和144可以形成与联网***102分离且不同的支付服务的一部分。在一些实施例中,支付***144可以形成发布***142的一部分。
根据一些示例实施例,近似相同多面实体识别***150可以提供可用于执行各种功能以识别搜索结果集合中的类似物品列表的功能。例如,近似相同多面实体识别***150可以访问来自数据库126、第三方服务器130、发布***142和其它源的搜索结果集合。在一些示例实施例中,近似相同多面实体识别***150可以分析该搜索结果集合以便识别和降级类似物品列表。在备选实施例中,近似相同多面实体识别***150可以是发布***142的一部分。
此外,虽然图1示出的基于客户端-服务器的网络架构100采用了客户端-服务器架构,但是本发明主题当然不限于此种架构,并且可以同样良好地应用于例如分布式或对等架构***。各种发布***142、支付***144和近似相同多面实体识别***150也可以被实现为独立软件程序,其不一定具有联网能力。
web客户端112可以经由web服务器122所支持的web接口来访问各个发布***142和支付***144。类似地,编程客户端116通过API服务器120所提供的编程接口访问由发布***142和支付***144提供的各种服务和功能。例如,编程客户端116可以是销售者应用(例如,由加利福尼亚州圣何塞的
Figure BDA0003938752480000081
公司开发的Turbo Lister应用),其用于使销售者能够以离线方式编写和管理联网***102上的列表,并且执行编程客户端116与联网***102之间的批处理模式通信。
图2是示出了与一些实施例一致的近似相同多面实体识别***150的各种功能模块的方框图。近似相同多面实体识别***150被示出为包括:搜索模块210;排名模块220;物品列表模块230;局部敏感散列模块240;签名模块250;类似物品识别模块260;以及通信模块270。此外,近似相同多面实体识别***150的各种模块可以经由数据库服务器124访问数据库126,并且近似相同多面实体识别***150的各种模块中的每一个可以与一个或多个第三方应用132(例如,社交网络平台)进行通信。此外,尽管对图2的模块在单数意义上进行了讨论,应当理解,在其它实施例中可以采用多个模块。
所描述的任何一个或多个模块可以单独使用硬件(例如机器的一个或多个处理器)或使用硬件与软件的组合来实现。例如,所描述的近似相同多面实体识别***150的任何模块可以物理地包括被配置为执行本文描述的针对该模块的操作的处理器中的一个或多个的布置(例如,机器的一个或多个处理器的子集或其中的部分)。作为另一个示例,近似相同多面实体识别***150的任何模块可以包括软件、硬件或两者,其配置具有一个或多个处理器(例如,机器的一个或多个处理器中的一个)的布置以执行本文描述的针对该模块的操作。因此,近似相同多面实体识别***150的不同模块可以包括并且配置这样的处理器的不同布置或者在不同的时间点配置这样的处理器的单个布置。此外,近似相同多面实体识别***150的任何两个或更多个模块可以被组合成单个模块,并且本文中针对单个模块描述的功能可以在多个模块之间进行细分。此外,根据各种示例实施例,本文描述为在单个机器、数据库126或设备中实施的模块可以分布在多个机器、数据库126或设备中。
搜索模块210被配置为从客户端设备(例如,客户端设备110)接收搜索请求,并且基于搜索请求来检索将在客户端设备110处呈现的搜索结果。搜索请求可以包括描述或识别物品(例如在线市场中的产品或服务)的搜索标准。例如,用户106可以经由客户端设备110(例如,移动设备)向市场应用的图形用户界面提供一个或多个搜索标准(例如,物品类型、价格、描述)。搜索模块210被配置为接收搜索标准,并且基于搜索标准来检索搜索结果集合(例如,来自数据库126或第三方服务器130)。在一些示例实施例中,该搜索结果集合可以包括由市场应用和支付应用的各种模块生成的一个或多个物品列表。
排名模块220被配置为对由搜索模块210检索的搜索结果集合进行排序。例如,排名模块220可以被配置为基于搜索结果与接收到的搜索标准的相关性来自动地对该搜索结果集合进行排序。在其它示例实施例中,排名模块220可以使用户106能够提供附加的排序标准,并且可以基于所提供的排序标准来对搜索结果集合进行排序,排序标准例如是价格(例如,从高到低或从低到高)、位置(例如,最近到最远或最远到最近)和时间(例如,倒序)。另外,如以下将更详细地讨论,排名模块220被配置为基于从近似相同多面实体识别***150的各种模块接收到的反馈来修改(例如,通过降级物品列表)搜索结果集合的顺序。
物品列表模块230被配置为基于从客户端设备(例如,客户端设备110)接收到的一个或多个输入来生成物品列表。例如,列表模块230可以允许卖家撰写和管理产品或服务的列表。具体地,用户106(例如卖家)可以向物品列表模块230提供多个物品特征和描述,包括例如列表标题、图像、物品描述和价格。响应于接收到物品特征和描述,物品列表模块230生成物品列表。
局部敏感散列(LSH)模块240被配置为接收由物品列表模块230生成的物品列表,并且将LSH算法技术应用于物品列表来为每个物品特征和组件生成和分配散列。LSH模块240可以在创建时接收物品列表,并针对物品列表内所包括的每一个物品组件生成两个或更多个散列。散列值(例如散列)是由一串文本或一段数据生成的数字。散列比文本本身小得多,并且以使得一些其它文本将非常不可能产生相同的散列值的方式来生成。因此,散列可被表达为描述物品的单独元素(例如,物品组件)的比特序列。例如,LSH模块240可以为物品图像生成两个或更多个散列,为物品描述生成两个或更多个散列等等。然后,LSH模块240可以对散列编索引并存储在数据库(例如,数据库126)内。
签名模块250被配置为接收由LSH模块240生成的对应于物品列表的散列,并且基于散列来生成签名。签名可以被定义为散列的集合,其中,签名中的所有散列描述了物品列表的各种组件。例如,签名可能包括对应于物品列表的图像的散列集合、对应于物品列表的标题的散列集合等等。因此,签名可以定义物品列表的内容。签名模块250对生成的签名编索引并分配给物品列表。
类似物品识别模块260被配置为基于散列和对应的签名来识别类似或等效物品列表。类似物品识别模块260可以被配置为响应于接收到(例如,从搜索模块210)对搜索请求已被接收到并且搜索模块210已经检索到搜索结果集合的指示来识别类似或等效物品列表。当在客户端设备(例如,客户端设备110)处显示搜索结果集合之前,类似物品识别模块260识别搜索结果集合内的任何类似或等效物品列表。例如,类似物品识别模块260识别与同一有形对象有关的两个或更多个列表,并将重复列表标记为等效物。
在一些示例实施例中,类似物品识别模块260将LSH算法应用于物品列表以确定物品列表是否类似。例如,如果满足以下条件,则可以通过类似物品识别模块260将两个文档(例如物品列表的组件)A和B视为类似:
AND(
OR(A.dup0==B.dup0,A.dup1==B.dup1,A.dup2==B.dup2),
OR(A.dup3==B.dup3,A.dup4==B.dup4)
)
其中dup0、dup1和dup2表示对应于物品列表的单个物品组件的散列,并且是通过在列表创建时由LSH模块240向物品列表应用LSH算法而获得的。因此,上述条件表达了:为了使文档(例如,诸如列表标题的物品组件)被视为类似的,在文档A与B之间至少一个散列必须是等效的。
因此,如果从另一文档(例如,另一物品组件,诸如图像)获得附加散列,例如dup3和dup4,则上述表达陈述了:为了使附加物品组件被认为是类似的,在散列之间必须存在至少一个匹配。因此,当基于上述表达确定正被比较的两个或更多个物品列表之间的每一个物品组件是类似的时,类似物品识别模块260可以将两个物品列表视为类似。因此,如果满足以下条件,则类似物品识别模块260可以将两个或多更个物品列表视为类似的:
IF(
AND(
OR(A.dup0==B.dup0,A.dup1==B.dup1,A.dup2==B.dup2),
OR(A.dup3==B.dup3,A.dup4==B.dup4)
),
AND(
OR(A.dup0==B.dup0,A.dup1==B.dup1),
OR(A.dup3==B.dup3,A.dup4==B.dup4)
)
)
因此,根据上述表示,当两个或更多物品列表的所有物品组件被确定为类似的时,物品列表本身被确定为类似。
在一些示例性实施例中,在识别搜索结果集合中的两个或更多个类似物品列表之后,类似物品识别模块260可以将类似物品列表标记为类似或等效,并将指令发送给排名模块220以便修改搜索结果的顺序。例如,排名模块220可以从搜索模块210接收搜索结果集合,其中所有类似或等效物品列表由类似物品识别模块260标记。响应于接收到搜索结果集合包括类似或等效物品列表的指令,排名模块220可以“降级”重复物品列表,使得它们处于该搜索结果集合内的较低排名处。然后,已修改的搜索结果集合可以被路由给通信模块270,该通信模块被配置为使搜索结果集合在客户端设备(例如,客户端设备110)处显示在市场应用的图形用户界面内。
图3是示出了方法300的流程图,该方法根据各种示例实施例用于检索包括物品列表的搜索结果集合,并识别该搜索结果集合中的重复物品列表。方法300中的操作可以由如上参考图2所述的模块来执行。如图3所示,方法300可包括操作310、320、330、340、350、360和370。
在操作310中,搜索模块210从客户端设备(例如,客户端设备110)接收包括一个或多个搜索标准的搜索请求。在操作320处,搜索模块210然后可基于接收到的搜索标准中的至少一些来检索搜索结果集合。这可以通过以下方式来执行:在数据库126中搜索搜索结果(例如,特定物品列表),基于搜索标准中的至少一些来选择搜索结果,以及检索搜索结果的集合。在一些示例实施例中,在已经检索到搜索结果集合之后,搜索模块210将该搜索结果集合传送给类似物品识别模块260,以便识别该搜索结果集合中所包括的任何物品列表是否相互“类似”或等效。
在操作330中,类似物品识别模块260接收搜索结果集合,并访问该搜索结果集合中的物品列表(例如,第一物品列表),以便访问物品列表的对应签名并且确定该搜索结果集合中是否有任何其它物品列表是相似的,或者指示等效物品列表已被创建且被包括在该搜索结果集合内。如果没有物品列表被确定为等效的,则可以将搜索结果集合发送给通信模块270,通信模块然后可以将该搜索结果集合传递给客户端设备110。
在操作340中,类似物品识别模块260识别搜索结果集合中类似于第一物品列表的一个或多个物品列表(例如,第二列表),并且因此指示搜索结果集合中的重复物品列表。已经识别了一个或多个类似物品列表后,在操作350处,类似物品识别模块260将该一个或多个重复物品列表(例如,第二列表)标记为类似或等效物品列表。
在操作360中,排名模块220从类似物品识别模块260接收对搜索结果集合包括一个或多个类似物品列表的指示。响应于接收到对搜索结果集合包括一个或多个类似物品列表的指示,排名模块220修改搜索结果集合的顺序。在一些示例实施例中,排名模块220可以“降级”类似物品列表,使得它们被呈现在搜索结果集合中指示较低相关性水平的位置处(例如,朝向列表的底部或末尾)。
在操作370中,通信模块270接收已修改的搜索结果集合,并使搜索结果集合显示在客户端设备(例如,客户端设备110)处。
图4是示出了根据各种示例实施例的用于生成在列表创建时分配给物品列表的签名的方法400的流程图。方法400中的操作可以由如上参考图2所述的模块来执行。如图4所示,方法400可包括操作410、420、430和440。
在操作410中,物品列表模块230从客户端设备110接收一个或多个用户输入,该一个或多个用户输入定义要在在线市场(例如,市场应用)中呈现的物品列表(例如,第一物品列表)的组件。组件可以包括列表标题、列表图像、列表描述以及与待售物品相关联的价格。
在操作420中,LSH模块240接收对物品列表(例如,第一物品列表)已经由物品列表模块230创建的指示。LSH模块240检索物品列表以及每一个定义的物品组件,并针对每一个物品组件生成具有两个或多更个散列的集合。在一些示例实施例中,LSH模块240可以被配置为基于物品组件类型来针对每一个物品组件生成不同预定数量的散列。例如,LSH模块240可被配置为针对所有物品列表标题生成四个散列,并且针对所有物品列表价格生成两个散列,或任何其它预定义数量。在针对物品列表的每一个物品组件生成散列之后,LSH模块240对散列编索引并存储在数据库(例如,数据库126)内。
在操作430中,在LSH模块240已经针对物品列表(例如,第一物品列表)的每一个物品组件定义了散列集合之后,签名模块250检索散列并将其分配给签名。因此,签名包括对应于物品列表的散列集合。在操作440处,在将散列分配给签名之后,可以将签名分配给物品列表。
图5A描绘了示出在降级任何类似物品列表之前由搜索模块210检索并由通信模块270在客户端设备110处呈现的搜索结果集合501A的图。根据各种示例实施例,该搜索结果集合501A被示出为包括多个重复物品列表(例如,类似物品列表)502A、503A、504A、505A和506A。物品列表还被示出为包括对应物品组件,包括物品列表图像512A、513A、514A、515A和516A以及物品列表标题522A、523A、524A、525A和526A。
物品列表502A、503A和505A代表一组类似物品列表,而物品列表504A和506A代表第二组类似物品列表。如图5A所示,物品列表502A、503A和505A被示出为包括重复列表图像512A、513A和515A。对应的列表标题522A、523A和525A被示出为是类似的,但不相同。
图5B描绘了示出在已经降级类似物品列表之后,由搜索模块210检索并由通信模块270在客户端设备110处呈现的搜索结果集合501B的图。搜索结果集合501B被示出为包括不同的物品列表502B、504B、507B、508B和509B。每一个不同的物品列表包括不同的物品组件集合,例如物品列表图像512B、514B、517B、518B和519B以及物品列表标题522B、524B、527B、528B和529B。
如图5B所示,图5A中所示的类似物品列表由近似相同多面实体识别***150的模块来识别和降级。例如,类似物品识别模块260访问第一物品列表(例如,物品列表502A)的签名,并且通过应用LSH算法,确定物品列表503A和505A是类似的。在识别搜索结果集合501A中的一个或多个物品列表是类似的之后,排名模块220通过降级类似物品列表(例如,503A和505A)来修改包括搜索结果集合501A的物品列表的排名。因此,搜索结果501B示出了在已经降级所有类似物品列表之后的搜索结果集合。
示例机器架构和机器可读介质
图6是示出了根据一些示例实施例的能够从机器可读介质(例如,机器可读存储介质)中读取指令并执行本文所讨论的方法中的任何一个或多个的机器600的组件的框图。具体地,图6示出了计算机***的示例形式的机器600的示意图,其中可以执行指令616(例如,软件、程序、应用、小应用、app或其他可执行代码)以使机器600执行本文讨论的任何一种或多种方法。例如,指令可以使机器执行图3-图4的流程图。另外或备选地,所述指令可以实现图2的模块。指令将通用的未编程的机器转换成被编程为以所描述的方式执行所描述和示出的功能的特定机器。在备选实施例中,机器600作为独立设备操作或可以耦合(例如,联网)到其他机器。在联网部署中,机器600可以在服务器-客户端网络环境中以服务器机器或客户端机器的容量操作,或者作为对等(或分布式)网络环境中的对等机器操作。机器600可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体***、蜂窝电话、智能电话、移动设备、可穿戴设备(例如智能手表)、智能家居设备(例如智能家电)、其它智能设备、web设备、网络路由器、网络交换机、网络桥接器、或能够顺序地或以其它方式执行指定机器600要采取的动作的指令616的任意机器。此外,尽管仅示出了单个机器600,但是术语“机器”也将被认为包括机器600的集合,其单独地或联合地执行指令616以执行本文讨论的方法中的任何一个或多个。
机器600可以包括可被配置为诸如经由总线602彼此通信的处理器610、存储器630和I/O组件650。在示例实施例中,处理器610(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、其他处理器或其任何适当组合)可以包括例如可以执行指令616的处理器612和处理器614。术语“处理器”旨在包括可以包括可以同时执行指令的两个或更多个独立处理器(有时称为“核”)的多核处理器。尽管图6示出了多个处理器,但是机器600可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理)、具有单个核的多个处理器、具有多个核的多个处理器或其任意组合。
存储器/存储设备630可以包括存储器632(比如,主存储器或其它存储储存设备)、以及存储单元636,存储器器632和存储单元636两者都可例如经由总线602由处理器610访问。存储单元636和存储器632存储体现本文所述的任何一种或多种方法或功能的指令616。在机器600执行指令616期间,指令616还可以完全地或部分地驻留在存储器632内、存储单元636内、处理器610中的至少一个内(例如,处理器的高速缓存存储器内)、或其任何合适的组合内。因此,存储器632、存储单元636和处理器610的存储器是机器可读介质的示例。
如本文所使用,“机器可读介质”是指能够暂时或永久地存储指令和数据的设备,并且可以包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪速存储器、光学介质、磁性介质、高速缓冲存储器、其它类型的存储器(例如,可擦除可编程只读存储器(EEPROM))和/或其任何合适的组合。术语“机器可读介质”应被视为包括能够存储指令616的单个介质或多个介质(例如集中式或分布式数据库、或相关联的缓存和服务器)。术语“机器可读介质”还将被视为包括能够存储由机器(例如,机器600)执行的指令(例如,指令616)的任何介质或多个介质的组合,使得指令在由机器600的一个或多个处理器(例如,处理器610)执行时,使机器600执行本文所描述的方法中的任何一个或多个。因此,“机器可读介质”指单个存储装置或设备、以及包括多个存储装置或设备的“基于云”的存储***或存储网络。
I/O组件650可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕捉测量等的各种各样的组件。包括在特定机器中的特定I/O组件650将取决于机器的类型。例如,诸如移动电话的便携式机器将可能包括触摸输入设备或其他这样的输入机构,而无头服务器机器将可能不包括这样的触摸输入设备。应当理解,I/O组件650可以包括图6中未示出的许多其他组件。I/O组件650根据功能被分组,以便简化以下讨论,并且分组不以任何方式进行限制。在各种示例实施例中,I/O组件650可以包括输出组件652和输入组件654。输出组件652可以包括视觉组件(例如,显示器,诸如等离子体显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学组件(例如扬声器)、触觉组件(例如振动马达、电阻机构)、其他信号发生器等。输入组件654可以包括字母数字输入组件(例如,键盘、配置为接收字母数字输入的触摸屏、光-光学键盘或其他字母数字输入组件)、基于点的输入组件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他定点仪器)、触觉输入组件(例如,物理按钮、提供触摸或触摸手势的位置和/或力的触摸屏或其他触觉输入组件)、音频输入组件(例如,麦克风)等。
在另一些示例实施例中,I/O组件650可以包括生物测定组件656、运动组件658、环境组件660或位置组件662、以及许多其他组件。例如,生物测定组件656可包括用于检测表达(例如,手表达、面部表情、语音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、汗水或脑波)、识别人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的组件。运动组件658可包括加速度传感器组件(例如,加速度计)、重力传感器组件、旋转传感器组件(例如,陀螺仪)等。环境组件660可以包括例如照度传感器组件(例如,光度计)、温度传感器组件(例如,检测环境温度的一个或多个温度计)、湿度传感器组件、压力传感器组件(例如气压计)、声学传感器组件(例如,检测背景噪声的一个或多个麦克风)、接近传感器组件(例如,检测附近物体的红外传感器)、气体传感器(例如,为安全而检测有害气体浓度或测量大气中的污染物的气体检测传感器)、或可以提供对应于周围物理环境的指示、测量或信号的其他组件。定位组件662可以包括位置传感器组件(例如,全球定位***(GPS)接收机组件)、高度传感器组件(例如,高度计或检测气压的气压计(根据气压可以导出高度))、取向传感器组件(例如,磁力计)等。
可以使用各种各样的技术来实现通信。I/O组件650可以包括通信组件664,通信组件664可操作以分别经由耦接682和耦接672来将机器600耦接到网络680或设备670。例如,通信组件664可以包括网络接口组件或与网络680接口连接的其他合适设备。在另一些示例中,通信组件664可以包括有线通信组件、无线通信组件、蜂窝通信组件、近场通信(NFC)组件、
Figure BDA0003938752480000184
组件(例如
Figure BDA0003938752480000182
低能耗)、
Figure BDA0003938752480000181
组件、以及经由其他模态提供通信的其他通信组件。设备670可以是另一机器或各种***设备中的任一种(例如,经由通用串行总线(USB)耦合的***设备)。
此外,通信组件664可以检测标识符或包括可操作以检测标识符的组件。例如,通信组件664可以包括射频识别(RFID)标签读取器组件、NFC智能标签检测组件、光学读取器组件(例如,用于检测以下各项的光学传感器:一维条形码(例如通用产品代码(UPC)条形码)、多维条形码(例如快速响应(QR)码)、阿兹台克码、数据矩阵、Dataglyph、MaxiCode、PDF417、超码、UCC RSS-2D条形码和其他光学码)、或声学检测组件(例如,用于识别标记的音频信号的麦克风)。此外,可以经由通信组件664来导出各种信息,例如经由互联网协议(IP)地理位置的位置、经由
Figure BDA0003938752480000183
信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等等。
传输介质
在各种示例实施例中,网络680的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网,互联网的一部分、公共交换电话网络(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、
Figure BDA0003938752480000191
网络、另一类型的网络、或两个或更多个这样的网络的组合。例如,网络680或网络680的一部分可以包括无线或蜂窝网络,并且耦合682可以是码分多址(CDMA)连接、全球移动通信***(GSM)连接或其他类型的蜂窝或无线耦合。在该示例中,耦接682可以实现各种类型的数据传输技术中的任何一种,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、GSM演进增强数据速率(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、***无线(4G)网络、通用移动电信***(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他标准、其他远程协议或其他数据传输技术。
指令616可以经由网络接口设备(例如,包括在通信组件664中的网络接口组件)使用传输介质并且利用多个公知的传输协议(例如,超文本传输协议(HTTP))通过网络680发送或接收。类似地,可以使用传输介质经由耦合672(例如,对等耦合)向设备670发送或从其接收指令616。术语“传输介质”应被认为包括能够存储、编码或承载用于被机器600执行的指令616的任意无形介质,并且包括用于促进该软件的通信的数字或模拟通信信号或其他无形介质。传输介质是机器可读介质的一个实施例。
下面的编号示例是实施例。
1.一种方法,包括:
从客户端设备接收搜索请求;
基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
访问所述多个物品列表中的第一列表,所述第一物品列表涉及有形物品;
从所述多个搜索结果中识别涉及所述有形物品的第二物品列表;
基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名;以及
使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
2.根据示例1所述的方法,其中,修改排名包括将所述第二物品列表在所述搜索结果集合中降级。
3.根据示例1或示例2所述的方法,还包括:
从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
针对所述第一物品列表的所述一个或多个组件中的各个组件生成散列;
将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
将所述第一签名分配给所述第一物品列表。
4.根据示例3所述的方法,其中,针对所述第一物品列表的所述一个或多个组件中的每个组件生成多个散列。
5.根据示例3或示例4所述的方法,其中,所述第二物品列表包括第二签名,且识别所述第二物品列表涉及所述第一物品列表的有形物品包括:
确定所述第一签名类似于所述第二物品列表的所述第二签名。
6.根据示例3至5中任一项所述的方法,其中,所述多个物品列表中的各个物品列表包括卖家、物品和对应的签名,并且识别所述多个物品列表中的一个或多个等效物品列表包括:
当所述第一卖家与所述多个物品列表中的一个或多个物品列表以及所述多个物品列表中的一个或多个物品列表的所述物品的卖家相同时,确定所述第一物品列表是所述多个物品列表中的一个或多个物品列表的重复。
7.根据示例3至6中任一项所述的方法,所述一个或多个物品组件包括:
标题;
图像;
描述;
类别;以及
价格值。
8.根据示例5所述的方法,其中,确定所述第一签名类似于所述多个物品列表中的一个或多个对应签名包括:
确定所述第一物品的所述一个或多个第一物品组件中的各个组件类似于所述多个物品列表中的物品列表的一个或多个物品组件的全部。
9.根据示例3至8中任一项所述的方法,其中,生成散列包括向所述第一物品列表应用局部敏感散列算法。
10.一种***,包括:
搜索模块,包括一个或多个处理器,且被配置为从客户端设备接收搜索请求;
所述搜索模块还被配置为基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
类似物品识别模块,包括一个或多个处理器,且被配置为访问所述多个物品列表中的第一列表,所述第一物品列表涉及有形物品;
所述类似物品识别模块还被配置为从多个搜索结果中识别涉及所述有形物品的第二物品列表;
所述类似物品识别模块还被配置为基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
排名模块,包括一个或多个处理器,且被配置为基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名;以及
通信模块,包括一个或多个处理器,且被配置为使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
11.根据示例10所述的***,其中,
所述排名模块对排名的修改包括:将所述第二物品列表在所述搜索结果集合中降级。
12.根据示例10或示例11所述的***,还包括:
物品列表模块,包括一个或多个处理器,且被配置为从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
局部敏感散列LSH模块,包括一个或多个处理器,且被配置为针对所述第一物品列表的所述一个或多个组件中的各个组件生成散列;
签名模块,包括一个或多个处理器,且被配置为将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
所述签名模块还被配置为将所述第一签名分配给所述第一物品列表。
13.根据示例12所述的***,其中,
所述LSH模块还被配置为针对所述第一物品列表的所述一个或多个组件中的各个组件生成多个散列。
14.根据示例12或示例13所述的***,其中:
所述第二物品列表包括第二签名,且所述类似物品识别模块还被配置为确定所述第一签名类似于所述第二物品列表的所述第二签名。
15.根据示例12至14中任一项所述的***,其中:
所述多个物品列表中的各个物品列表包括卖家、物品和对应的签名,且所述类似物品识别模块还被配置为:当所述第一卖家与所述多个物品列表中的一个或多个物品列表以及所述多个物品列表中的一个或多个物品列表的所述物品的卖家相同时,确定所述第一物品列表是所述多个物品列表中的一个或多个物品列表的重复。
16.根据示例12至15中任一项所述的***,其中:
由所述物品列表模块接收的所述一个或多个物品组件包括:
标题;
图像;
描述;
类别;以及
价格值。
17.根据示例14至16中任一项所述的***,其中:
所述类似物品识别模块还被配置为:确定所述第一物品的所述一个或多个第一物品组件中的各个组件类似于所述多个物品列表中的物品列表的一个或多个物品组件的全部。
18.根据示例12至17中任一项所述的***,其中:
所述LSH模块还被配置为通过向所述第一物品列表应用局部敏感散列算法来生成散列。
19.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:
从客户端设备接收搜索请求;
基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
访问所述多个物品列表中的第一列表,所述第一物品列表涉及有形物品;
从所述多个搜索结果中识别涉及所述有形物品的第二物品列表;
基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名;以及
使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
20.根据示例19所述的机器可读介质,还包括:
从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
针对所述第一物品列表的所述一个或多个组件中的各个组件生成散列;
将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
将所述第一签名分配给所述第一物品列表。
21.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时,使得所述机器执行示例1至9中任一项所述的方法。
语言
在整个说明书中,复数实例可以实现如单个实例所描述的部件、操作或结构。虽然一个或多个方法的各个操作被示意和描述为分离的操作,但是各个操作中的一个或多个可以同时执行,并且无需按所示顺序执行操作。在示例配置中被示为分离组件的结构和功能可以被实现为组合结构或组件。类似地,被示为单个组件的结构和功能可以被实现为分离的组件。这些和其他变型、修改、添加和改进落入本文中主题的范围内。
尽管已经参考具体示例实施例描述了本发明主题的概述,但是在不脱离本公开的实施例的更宽范围的情况下,可以对这些实施例进行各种修改和改变。本发明主题的这些实施例在本文中可以单独地或共同地由术语“发明”提及,以仅仅为了方便,并且不旨在自动地将本申请的范围限制为任何单个公开或发明构思(如果事实上公开了一个以上)。
充分详细地描述了本文示出的实施例以使本领域技术人员能够实现所公开的教导。可以利用其他实施例并根据这些实施例导出其他实施例,从而可以在不脱离本公开的范围的情况下做出结构和逻辑上的替换和改变。因此,该“具体实施方式”不应当看做是限制意义,并且各种实施例的范围仅通过所附权利要求以及权利要求的等同物的全部范围来限定。
如本文所使用的,术语“或”可以被解释为包括性或排他性的意义。此外,可以针对本文中描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、模块、引擎和数据存储之间的边界在某种程度上是任何的,并且在具体说明性配置的上下文中示出了特定操作。设想了功能的其他分配,并且这些分配可以落入本公开的各种实施例的范围内。一般来说,在示例配置中作为分离资源呈现的结构和功能可以被实现为组合的结构或资源。类似地,作为单个资源呈现的结构和功能可以被实现为分离的资源。这些和其他变型、修改、添加和改进落入由所附权利要求表示的本公开的实施例的范围内。因此,说明书和附图应当被看做说明性的而不是限制意义的。

Claims (19)

1.一种用于进行搜索的方法,包括:
从客户端设备接收搜索请求;
基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;
从多个搜索结果中识别涉及所述有形物品的第二物品列表;
基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,修改排名包括将所述第二物品列表在所述搜索结果集合中降级;
使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
2.根据权利要求1所述的方法,还包括:
从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
针对所述第一物品列表的所述一个或多个组件中的各个组件生成多个散列;
将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
将所述第一签名分配给所述第一物品列表。
3.根据权利要求2所述的方法,其中,针对所述第一物品列表的所述一个或多个组件中的各个组件生成不同预定数量的散列。
4.根据权利要求2所述的方法,其中,所述第二物品列表包括第二签名,且识别所述第二物品列表涉及所述第一物品列表的有形物品包括:
确定所述第一签名类似于所述第二物品列表的所述第二签名。
5.根据权利要求2所述的方法,其中,所述多个物品列表中的各个物品列表包括卖家、物品和对应的签名,并且识别所述多个物品列表中的一个或多个等效物品列表包括:
当所述第一卖家与所述多个物品列表中的一个或多个物品列表以及所述多个物品列表中的一个或多个物品列表的所述物品的卖家相同时,确定所述第一物品列表是所述多个物品列表中的一个或多个物品列表的重复。
6.根据权利要求2所述的方法,其中,所述一个或多个物品组件包括:
标题;
图像;
描述;
类别;以及
价格值。
7.根据权利要求4所述的方法,其中,确定所述第一签名类似于所述多个物品列表中的一个或多个对应签名包括:
确定所述第一物品的所述一个或多个第一物品组件中的各个组件类似于所述多个物品列表中的物品列表的一个或多个物品组件的全部。
8.根据权利要求2所述的方法,其中,生成散列包括向所述第一物品列表应用局部敏感散列算法。
9.一种用于进行搜索的***,包括:
搜索模块,包括一个或多个处理器,且被配置为从客户端设备接收搜索请求;
所述搜索模块还被配置为基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
类似物品识别模块,包括一个或多个处理器,且被配置为访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;
所述类似物品识别模块还被配置为从多个搜索结果中识别涉及所述有形物品的第二物品列表;
所述类似物品识别模块还被配置为基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
排名模块,包括一个或多个处理器,且被配置为基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,所述排名模块对排名的修改包括:将所述第二物品列表在所述搜索结果集合中降级;
通信模块,包括一个或多个处理器,且被配置为使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
10.根据权利要求9所述的***,还包括:
物品列表模块,包括一个或多个处理器,且被配置为从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
局部敏感散列LSH模块,包括一个或多个处理器,且被配置为针对所述第一物品列表的所述一个或多个组件中的各个组件生成多个散列;
签名模块,包括一个或多个处理器,且被配置为将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
所述签名模块还被配置为将所述第一签名分配给所述第一物品列表。
11.根据权利要求10所述的***,其中,
所述LSH模块还被配置为针对所述第一物品列表的所述一个或多个组件中的各个组件生成预定数量的散列。
12.根据权利要求10所述的***,其中,
所述第二物品列表包括第二签名,且所述类似物品识别模块还被配置为确定所述第一签名类似于所述第二物品列表的所述第二签名。
13.根据权利要求10所述的***,其中,
所述多个物品列表中的各个物品列表包括卖家、物品和对应的签名,且所述类似物品识别模块还被配置为:当所述第一卖家与所述多个物品列表中的一个或多个物品列表以及所述多个物品列表中的一个或多个物品列表的所述物品的卖家相同时,确定所述第一物品列表是所述多个物品列表中的一个或多个物品列表的重复。
14.根据权利要求10所述的***,其中,
由所述物品列表模块接收的所述一个或多个物品组件包括:
标题;
图像;
描述;
类别;以及
价格值。
15.根据权利要求12所述的***,其中,
所述类似物品识别模块还被配置为:确定所述第一物品的所述一个或多个第一物品组件中的各个组件类似于所述多个物品列表中的物品列表的一个或多个物品组件的全部。
16.根据权利要求10所述的***,其中,
所述LSH模块还被配置为通过向所述第一物品列表应用局部敏感散列算法来生成散列。
17.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:
从客户端设备接收搜索请求;
基于所述搜索请求来检索搜索结果集合,所述搜索结果集合包括多个物品列表,所述多个物品列表是基于与所述搜索请求的相关性来排名的;
访问所述多个物品列表中的第一物品列表,所述第一物品列表涉及有形物品;
从多个搜索结果中识别涉及所述有形物品的第二物品列表;
基于所述第二物品列表涉及所述第一物品列表所涉及的有形物品,将所述第二物品列表标记为重复物品列表;
基于所述第二物品列表被标识为重复物品列表来修改所述第二物品列表的排名,其中,修改排名包括将所述第二物品列表在所述搜索结果集合中降级;
使所述搜索结果集合显示在所述客户端设备处,所述搜索结果集合被根据所述第二物品列表的已修改排名来排名。
18.根据权利要求17所述的机器可读介质,其中,所述操作还包括:
从第一卖家接收第一物品列表,所述第一物品列表包括一个或多个组件;
针对所述第一物品列表的所述一个或多个组件中的各个组件生成多个散列;
将所述一个或多个组件中的各个组件的散列分配给第一签名;以及
将所述第一签名分配给所述第一物品列表。
19.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时,使得所述机器执行根据权利要求1-8中任一项所述的方法。
CN202211417212.0A 2015-05-20 2016-05-19 用于进行搜索的方法和*** Pending CN115795147A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201562164406P 2015-05-20 2015-05-20
US62/164,406 2015-05-20
CN201680042360.5A CN108140026B (zh) 2015-05-20 2016-05-19 搜索中的多面实体识别
PCT/US2016/033253 WO2016187417A1 (en) 2015-05-20 2016-05-19 Multi-faceted entity identification in search

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201680042360.5A Division CN108140026B (zh) 2015-05-20 2016-05-19 搜索中的多面实体识别

Publications (1)

Publication Number Publication Date
CN115795147A true CN115795147A (zh) 2023-03-14

Family

ID=57320652

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211417212.0A Pending CN115795147A (zh) 2015-05-20 2016-05-19 用于进行搜索的方法和***
CN201680042360.5A Active CN108140026B (zh) 2015-05-20 2016-05-19 搜索中的多面实体识别

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201680042360.5A Active CN108140026B (zh) 2015-05-20 2016-05-19 搜索中的多面实体识别

Country Status (4)

Country Link
US (1) US10360621B2 (zh)
EP (1) EP3298516A4 (zh)
CN (2) CN115795147A (zh)
WO (1) WO2016187417A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795147A (zh) 2015-05-20 2023-03-14 电子湾有限公司 用于进行搜索的方法和***
US12020174B2 (en) 2016-08-16 2024-06-25 Ebay Inc. Selecting next user prompt types in an intelligent online personal assistant multi-turn dialog
US10860898B2 (en) * 2016-10-16 2020-12-08 Ebay Inc. Image analysis and prediction based visual search
US11004131B2 (en) 2016-10-16 2021-05-11 Ebay Inc. Intelligent online personal assistant with multi-turn dialog based on visual search
US11748978B2 (en) 2016-10-16 2023-09-05 Ebay Inc. Intelligent online personal assistant with offline visual search database
US10970768B2 (en) 2016-11-11 2021-04-06 Ebay Inc. Method, medium, and system for image text localization and comparison
US11080615B2 (en) 2017-06-15 2021-08-03 International Business Machines Corporation Generating chains of entity mentions
CN111783808B (zh) * 2019-07-23 2024-06-18 北京沃东天骏信息技术有限公司 用于生成信息的方法和装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6658423B1 (en) 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US7216124B2 (en) * 2001-03-23 2007-05-08 International Business Machines Corporation Method for generic list sorting
US20030126130A1 (en) * 2001-12-31 2003-07-03 Koninklijke Philips Electronics N.V. Sort slider with context intuitive sort keys
US7966327B2 (en) * 2004-11-08 2011-06-21 The Trustees Of Princeton University Similarity search system with compact data structures
US7689615B2 (en) * 2005-02-25 2010-03-30 Microsoft Corporation Ranking results using multiple nested ranking
CN100481077C (zh) * 2006-01-12 2009-04-22 国际商业机器公司 用于增强搜索结果导航的可视化方法及装置
US7899818B2 (en) * 2006-03-29 2011-03-01 A9.Com, Inc. Method and system for providing focused search results by excluding categories
CN100458786C (zh) * 2006-06-15 2009-02-04 Ut斯达康通讯有限公司 基于应用定制解析xml文档的方法及装置
US8099415B2 (en) * 2006-09-08 2012-01-17 Simply Hired, Inc. Method and apparatus for assessing similarity between online job listings
US7630972B2 (en) * 2007-01-05 2009-12-08 Yahoo! Inc. Clustered search processing
US7881984B2 (en) * 2007-03-30 2011-02-01 Amazon Technologies, Inc. Service for providing item recommendations
US9058378B2 (en) 2008-04-11 2015-06-16 Ebay Inc. System and method for identification of near duplicate user-generated content
US20090299853A1 (en) * 2008-05-27 2009-12-03 Chacha Search, Inc. Method and system of improving selection of search results
WO2009151640A1 (en) * 2008-06-13 2009-12-17 Ebay Inc. Method and system for clustering
US20110004608A1 (en) * 2009-07-02 2011-01-06 Microsoft Corporation Combining and re-ranking search results from multiple sources
CN103793388B (zh) * 2012-10-29 2017-08-25 阿里巴巴集团控股有限公司 搜索结果的排序方法和装置
CN115795147A (zh) 2015-05-20 2023-03-14 电子湾有限公司 用于进行搜索的方法和***

Also Published As

Publication number Publication date
US20160342600A1 (en) 2016-11-24
WO2016187417A1 (en) 2016-11-24
CN108140026B (zh) 2022-11-18
US10360621B2 (en) 2019-07-23
CN108140026A (zh) 2018-06-08
EP3298516A4 (en) 2018-10-24
EP3298516A1 (en) 2018-03-28

Similar Documents

Publication Publication Date Title
CN108140026B (zh) 搜索中的多面实体识别
US10783565B2 (en) Method, manufacture, and system of transferring authenticated sessions and states between electronic devices
CN107077320B (zh) 用于自动完成功能的改进的***和方法
US10936632B2 (en) Enhanced search query suggestions
US20170293695A1 (en) Optimizing similar item recommendations in a semi-structured environment
CN109074368B (zh) 使用异构社交网络的图形框架
US20220035826A1 (en) Generating personalized user recommendations using word vectors
US11301510B2 (en) Obtaining item listings matching a distinguishing style of an image selected in a user interface
US11640633B2 (en) Enhanced shopping actions on a mobile device
KR102236889B1 (ko) 결과 피드백을 이용하는 검색 시스템
US11681768B2 (en) Search and notification in response to a request
US11847128B2 (en) Flexibly managing records in a database to match searches
US10672064B2 (en) On-line session trace system
CN112825180A (zh) 经验证的视频评论
US20220114631A1 (en) Social network initiated listings
EP3430789B1 (en) System and method for delegating content processing
US20190295172A1 (en) Transmitting data to select users
US20160335312A1 (en) Updating asset references
CN108292318B (zh) 用于生成目标页面的***和方法
US20160314513A1 (en) Automatic negotiation using real time messaging

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination