CN110930208B - 对象搜索方法及装置 - Google Patents

对象搜索方法及装置 Download PDF

Info

Publication number
CN110930208B
CN110930208B CN201811094922.8A CN201811094922A CN110930208B CN 110930208 B CN110930208 B CN 110930208B CN 201811094922 A CN201811094922 A CN 201811094922A CN 110930208 B CN110930208 B CN 110930208B
Authority
CN
China
Prior art keywords
language
search
search results
version
searching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811094922.8A
Other languages
English (en)
Other versions
CN110930208A (zh
Inventor
王金刚
陈博兴
骆卫华
司罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811094922.8A priority Critical patent/CN110930208B/zh
Publication of CN110930208A publication Critical patent/CN110930208A/zh
Application granted granted Critical
Publication of CN110930208B publication Critical patent/CN110930208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • G06Q30/0643Graphical representation of items or shoppers

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Machine Translation (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种对象搜索方法及装置。其中,该方法包括:接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果。本发明解决了相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。

Description

对象搜索方法及装置
技术领域
本发明涉及对象搜索领域,具体而言,涉及一种对象搜索方法及装置。
背景技术
随着电商的发展,现在的电商平台越来越国际化,在建设外文网站时,通常是将中文商品信息准确翻译为目标外文语言进行展示。由于语言具有较大的区域性,语言种类繁多,语言习惯多种多样。而且,现有的人工翻译成本高效率低,难以满足高速更新的商品展示需要。尤其在进行翻译时,有时候一个中文商品,有可能会翻译出多种外文版本,但是对不同地区的用户而言,在十多个翻译中可能有不被接受的版本。例如,中文的“橙汁”,可能被转换成的英语译文有“Orange Juice”,“Orange Squash”,“Tang”等;再例如,对于中文商品标题“女式长款连衣裙”,可能被转换成的英文译文有“Women’s long skirt”,“Women’slong dress”,“Women’s long-length dress”等。对于不同地区的用户接受的版本不同,因此,多个翻译中有不被接受的版本,而将不被接受的版本展示给用户时,则会表现出翻译的准确率下降,从而导致用户使用体验明显下降。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种对象搜索方法及装置,以至少解决相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。
根据本发明实施例的一个方面,提供了一种对象搜索方法,包括:接收以第一语言输入的搜索对象;将所述搜索对象由所述第一语言转换成第二语言;对所述第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将所述第二语言的搜索结果转换成多版本的所述第一语言,得到多版本的第一语言的搜索结果;至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果。
根据本发明实施例的另一方面,还提供了一种对象搜索方法,包括:接收搜索语句,其中,所述搜索语句的语言类型为第一语种;转换所述搜索语句的语言类型为多版本的第二语种,并获取到与所述多版本的第二语种对应的搜索结果,其中,所述搜索结果的语言类型为第二语种;基于搜索结果的历史操作日志,对所述多版本的第二语种对应的所述搜索结果进行重排序,得到排序后的搜索结果。
根据本发明实施例的另一方面,还提供了一种对象搜索方法,包括:接收搜索语句,其中,所述搜索语句的语言类型为第一语种;转换所述搜索语句的语言类型为第二语种,并基于转换结果获取到与所述搜索语句对应的搜索结果,其中,所述搜索结果的语言类型为第二语种;转换所述搜索结果的语言类型为多版本的第一语种;基于多版本的第一语种的搜索结果的历史操作日志,对所述多版本的第一语种的搜索结果进行重排序,得到排序后的搜索结果。
根据本发明实施例的另一方面,还提供了一种对象搜索方法,包括:接收搜索请求,其中,所述搜索请求中携带有以第一语言输入的搜索对象;响应于所述搜索请求,对所述搜索对象由所述第一语种转换为第二语种后进行搜索,得到搜索结果;在在将所述第二语种的搜索结果转换成多版本的第一语种后,基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序后,展示排序后的搜索结果。
根据本发明实施例的另一方面,还提供了一种对象搜索装置,包括:接收模块,用于接收以第一语言输入的搜索对象;第一转换模块,用于将所述搜索对象由所述第一语言转换成第二语言;搜索模块,用于对所述第二语言的搜索对象进行搜索,得到第二语言的搜索结果;第二转换模块,用于将所述第二语言的搜索结果转换成多版本的第一语言,得到所述多版本的第一语言的搜索结果;排序模块,用于至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示模块,用于展示重排序后的搜索结果。
根据本发明实施例的另一方面,还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述中任意一项所述的对象搜索方法。
根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的对象搜索方法。
在本发明实施例中,采用接收以第一语言输入的搜索对象;将所述搜索对象由所述第一语言转换成第二语言;对所述第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将所述第二语言的搜索结果转换成所述多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果的方式,通过对第二语言的搜索结果的多种不同版本的第一语言对应的搜索结果进行排序,并且根据搜索结果的历史操作日志为依据进行排序,达到了针对使用者的历史语言习惯确定最合适该使用者的翻译版本的目的,从而实现了提高在搜索过程中,翻译的准确率和用户体验度的技术效果,进而解决了相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是一种用于实现数据处理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本发明实施例1的一种对象搜索方法的示意图;
图3是根据本发明实施例1的另一种对象搜索方法的流程图;
图4是根据本发明实施例1的另一种对象搜索方法的流程图;
图5是根据本发明实施例1的编码器-解码器翻译模型的结构示意图;
图6是根据本发明实施例1的商品标题翻译方法的流程图;
图7是根据本发明实施例2的一种对象搜索方法的流程图;
图8是根据本发明实施例3的一种对象搜索方法的流程图;
图9是根据本发明实施例4的一种对象搜索方法的流程图;
图10是根据本发明实施例5的一种对象搜索装置的结构示意图;
图11是根据本申请实施例6的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,还提供了一种对象搜索方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现对象搜索方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104。除此以外,还可以包括:传输模块、显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的对象搜索方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的对象搜索方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述传输模块用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输模块包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
图1示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,使用上述图1所示的计算机终端10(或移动设备)作为一种实施例(例如发送端、接收端等)。计算机终端10(或移动设备)可以经由数据网络连接或电子连接到一个或多个服务器(例如安全服务器、资源服务器、游戏服务器等)。一种可选实施例中,上述计算机终端10(或移动设备)可以是任意移动计算设备等。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。计算机终端10(或移动设备)可以执行以连接到由一个服务器(例如安全服务器)或一组服务器执行的网络服务。网络服务器是基于网络的用户服务,诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。
电商(即电子商务)已经是一种常见的交易方式,随着电商和互联网的发展,电商平台也逐渐国际化,国内电商平台要发展跨境业务,首先需要建设外文(如英语、俄语、西班牙语)网站,并将中文商品信息(标题和详情页)准确地翻译为目标语言进行展示。常用的翻译方式,是人工翻译,通过人工翻译将需要展示的中文商品信息提前翻译成目标语言的信息,然后在使用者点击查询时,已经预存的翻译成目标语言的信息弹出,以供使用者查阅。但是面对电商网站动辄上千万的商品数量和内容频繁更新,人工翻译远远无法满足需求。人工翻译的方式不仅更新速度慢,难以跟上电商平台上频率超高的更新频率,而且人工翻译的成本过高。
随着人工智能的发展和研究,基于神经网络的机器翻译技术取得了极大的发展,在新闻等领域,神经网络翻译模型已经接近人类翻译水平。使用机器翻译技术来完成商品标题的翻译不仅能够节约大量人力成本,效率上也是人工翻译无法比拟的。当海外用户使用当地语言(以下以英文为例进行详细说明)进行商品搜索时,由于电商网站后台的商品索引库基于中文构建,首先需要将用户的英文query(查询指令)翻译成中文的查询指令进行检索,返回检索到的商品列表并展示英文版本的商品信息。对于同一份中文商品标题,因为语义(同义词/多义词/近义词)、语序、时态等变化,可能存在多种不同的英文的翻译版本,如何选择最精准的译文进行展示,关系到网站的用户体验以及最终的成交转化。神经网络机器翻译通过束搜索(beam search)来为同一份原文产生多版本译文,并根据语言模型等信息进行重排序选择其中最好的版本作最终展示。
在上述运行环境下,本申请提供了如图2所示的对象搜索方法。图2是根据本发明实施例1的一种对象搜索方法的示意图,如图2所示,本申请实施例所提供的对象搜索方法可以通过如下方法步骤来实现:
步骤S202,接收以第一语言输入的搜索对象。
作为一种可选的实施例,上述步骤的执行主体为搜索工具,上述搜索工具可以是专门用于搜索的搜索网站,还可以是具有电商平台或者其他网站中使用的搜索工具,用于用户快速找到与搜索对象有关的商品,或内容。
作为一种可选的实施例,上述搜索对象可以是以第一语言输入的关键词,该关键词可以是目标对象的种类,属性,大小,名称等等。
作为一种可选的实施例,将上述关键词以第一语言输入,说明用户希望得到以第一语言表现的目标对象的文本信息,例如,种类,属性,大小名称等。
作为一种可选的实施例,上述第一语言可以是任何一种语言种类,例如,英语,法语,德语等。
步骤S204,将搜索对象由第一语言转换成第二语言。
作为一种可选的实施例,上述步骤的执行主体为搜索工具,上述搜索工具可以是专门用于搜索的搜索网站,还可以是具有电商平台或者其他网站中使用的搜索工具,用于用户快速找到与搜索对象有关的商品,或内容。
作为一种可选的实施例,上述搜索工具一般以第二语言作为基础语言,例如,中国的电商平台,基础语言一般为中文,在上述电商平台的外文网站中以第一语言进行搜索时,先将以第一语言输入的搜索对象翻译成中文,然后根据上述中文的搜索对象进行搜索,得到相关的目标对象的中文信息,将上述目标对象的中文信息,再翻译成对应的第一语言信息。
作为一种可选的实施例,上述将搜索对象由第一语言转换成第二语言,便于以第二语言为基础语言的网站进行搜索。上述搜索工具为以第二语言为基础语言的搜索工具。
步骤S206,对第二语言的搜索对象进行搜索,得到第二语言的搜索结果。
作为一种可选的实施例,上述步骤以第二语言的搜索对象在上述以第二语言为基础语言的搜索工具中搜索,得到第二语言的搜索结果。
作为一种可选的实施例,上述搜索结果包括多个第二语言的对象,而且,上述搜索结果,可以根据多种不同的排序标准进行排序。以不同的排序标准进行排序的搜索结果可以不同,也可以相同,上述排序标准可以是默认,还可以是用户选择。
作为一种可选的实施例,上述用户选择排序标准可以是由用户选择,用户通过第一语言的排序规则进行选择,第一语言的排序规则与第二语言的排序规则对应,选中第一语言的第一排序规则,则触发第二语言的排序规则,并依据上述第二语言的排序规则进行排序。
步骤S208,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果。
作为一种可选的实施例,上述第二语言的搜索结果,可能不能让使用第一语言的用户接受,因此在将第二语言的搜索结果进行展示之前,将上述第二语言的搜索结果转换成第一语言的搜索结果。
上述第二语言的搜索结果在转换成第一语言的搜索结果的过程中,一个第二语言的搜索结果可能会翻译出多个不同的第一语言的搜索结果,例如,中文的“橙汁”,可能被转换成的英语译文有“Orange Juice”,“Orange Squash”,“Tang”等;再例如,对于中文商品标题“女式长款连衣裙”,可能被转换成的英文译文有“Women’s long skirt”,“Women’s longdress”,“Women’s long-length dress”等。
作为一种可选的实施例,上述第一语言可以为除第二语言外的任何语言,但是,语言随着传播的时间和空间的差别,会发生一定的变化,例如,英语作为世界上使用最广泛的语言,但是,英语也被分为很多种类,主要分为美式英语和英式英语,还有其他的,例如,印度英语,等等,不同的语言子类,对同一事物的描述也不尽相同。因此,需要选取与用户最合适的搜索结果的翻译,向用户展现,从而提高用户的体验度。
步骤S210,至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果。
作为一种可选的实施例,上述向用户展现用户最合适的搜索结果的翻译之前,需要确定对搜索结果的排序标准。
作为一种可选的实施例,对搜索结果进行重排序可以基于多种因素,例如,可以基于搜索结果的历史操作日志,因为搜索结果的历史操作日志可以在一定程度上显示该搜索对象之前所产生的一些搜索记录,而搜索记录又可以在一定程度上体现搜索对象普遍的搜索特点,因此,基于搜索结果的历史操作日志对搜索结果进行重排序,可以在一定程度上有效提高搜索的准确度。
步骤S212,展示重排序后的搜索结果。
作为一种可选的实施例,在对上述各个搜索结果的各个翻译结果,根据上述历史操作日志进行排序后,可以将排序后的搜索结果展示给用户,也可以选择排序靠前的翻译结果向用户展示。也即是,上述搜索结果均为按照历史操作日志进行排序的最优翻译结果,可以有效提高翻译准确率和用户的体验度。
在本发明实施例中,采用接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果的方式,通过对第二语言转换成的多版本的第一语言排序,并且根据搜索结果的历史操作日志为依据进行排序,达到了针对使用者的历史语言习惯确定最合适该使用者的翻译版本的目的,从而实现了在搜索过程中,提高翻译的准确率和用户体验度的技术效果,进而解决了相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。
作为一种可选的实施例,上述历史操作日志包括以下至少之一:对搜索结果进行浏览的浏览记录,对搜索结果进行点击的点击记录,对搜索结果进行购买的购买记录。
作为一种可选的实施例,上述对搜索结果进行浏览的浏览记录,可以说明用户在该搜索工具中的浏览意向,和寻找范围等,可以一定程度上反映用户的需求。例如,在用户搜索“男裤”之后,浏览大部分为牛仔裤,则可以认为用户需要寻找牛仔裤。
作为一种可选的实施例,上述对搜索结果进行点击的点击记录,可以说明用户在该搜索工具中的了解意向,和感兴趣的内容范围等,可以一定程度上反映用户的兴趣。例如,在用户频繁点击“手机”,则认为用户对手机的购买兴趣较大。
作为一种可选的实施例,上述对搜索结果进行购买的购买记录,可以说明用户在该搜索工具中的购买意向,和已购买的商品范围等,可以一定程度上反映用户的购买需求。例如,用户在购买多种“糖果”后,则认为用户对糖果有一定的购买需求。
作为一种可选的实施例,浏览记录至少包括:浏览的次数,浏览的时长;点击记录包括:点击的次数;购买记录包括:购买的次数。
作为一种可选的实施例,上述对搜索结果进行浏览的浏览记录,可以通过浏览次数和浏览时长来体现;上述对搜索结果进行点击的点击记录,可以通过点击次数来体现;上述对搜索结果进行购买的购买记录,可以通过购买次数,还可以购买数量来体现。
作为一种可选的实施例,还包括:获取针对地理区域的历史操作日志。
需要说明的是,在获取历史操作日志时,由于获取不同范围内的历史操作日志,对于搜索结果的排序也会不同。例如,对于在一个国家范围内的历史操作日志而言,由于范围较为广泛,排序的搜索结果也会相对宽泛一些;再例如,对于在一个国家范围下面的地区性地理区域的历史操作日志而言,相对于国家范围而言,排序的搜索结果也会相对集中一些。因此,如果选择的历史操作日志是相对于较小地理区域而言的话,虽然搜索结果会相对少一些,但也会相对准确。
上述历史操作日志包括位置信息,也即是,用户所在的地理区域,明确用户所在的地理区域,可以更准确的确定用户的语言习惯和种类,有效提高对多种不同的翻译版本的排序的准确性。
作为一种可选的实施例,图3是根据本发明实施例1的另一种对象搜索方法的流程图,如图3所示,上述获取针对地理区域的历史操作日志包括:
步骤S302,确定输入的第一语言的搜索对象的表现形式;
步骤S304,确定表现形式对应的地理区域;
步骤S306,获取地理区域内的历史操作日志。
作为一种可选的实施例,上述确定输入的第一语言的搜索对象的形式,可以是搜索对象的具体的用词,逻辑,等等,例如,不同英语国家虽然表示的是同一对象,但会采用不同的习惯用语,不同的习惯用语可以在一定程度上直接表现语言种类和使用地区的用词。通过特殊的用词和表现形式,可以确定该表现形式对应的地理区域。
作为一种可选的实施例,上述确定表现形式对应的地理区域,可以是上述搜索对象的表现形式对应的地理区域,需要说明的是,可以通过上述搜索对象的表现形式对应的地理区域,没有大小限定,而且不同的表现形式对应的地理区域可以重叠。
作为一种可选的实施例,上述获取地理区域内的历史操作日志,可以是用户在该地理区域内的历史操作日志,将用户所在的地理区域结合历史操作日志,可以有效增加对不同版本翻译结果排序的准确率。
作为一种可选的实施例,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果包括:采用束搜索的方法,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果。
作为一种可选的实施例,在将第二语言转换成多版本的第一语言时,所采用的方式可以使用本文的束搜索方法,也可以同时训练多个翻译***来产生,上述采用束搜索的方法,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果,可以有效提高搜索效率和搜索准确率。
作为一种可选的实施例,图4是根据本发明实施例1的另一种对象搜索方法的流程图,如图4所示,该对象搜索方法还包括:
步骤S402,采用翻译模型对多版本的第一语言的搜索结果进行评价,得到评价结果;
步骤S404,依据评价结果对多版本的第一语言的搜索结果进行预排序。
作为一种可选的实施例,上述将第一语言翻译为第二语言,或者将第二语言翻译为第一语言,均采用翻译模型进行翻译,该翻译模型可以为神经网络深度学习模型,具有一定的误翻率,因此采用对上述翻译模型翻译的搜索结果进行评价打分。
例如,用同样的训练数据训练一个反向的英到中翻译模型,对当前正向的翻译结果打分,例如,Target-to-Source打分。
再例如,将训练语料中的译文逆序训练翻译模型,然后对正序翻译模型数据结果打分,例如,Right-to-Left打分。
作为一种可选的实施例,采用翻译模型对多版本的第一语言的搜索结果进行评价,得到评价结果,之后,依据评价结果对多版本的第一语言的的搜索结果进行预排序。上述评价结果加上用户的搜索、点击和成交等额外信息作为新的特征,进行有监督学习,使得翻译结果更贴近用户搜索对象,可以有效提升用户体验。
作为一种可选的实施例,上述对象搜索方法还包括:接收对展示的搜索结果所进行的操作;根据操作记录操作日志;采用记录的操作日志更新历史操作日志。
上述将新的操作日志融合进入历史操作日志,影响下一次的翻译操作,从而形成闭环,产生良性循环,商品名翻译模块产生的翻译提供给用户,用户的点击反馈又可以用来优化翻译模块,整条链路得以不断迭代优化。
下面对本实施例中的一个可选方式进行详细说明。
本实施方式装置主要包含4个模块,分别是query(搜索对象)翻译模块,商品名称翻译模块,用户日志挖掘模块以及多版本翻译重排序模块。下面对上述几个模块进行详细说明。
query翻译模块:主要实现用户英文query到中文的翻译,因为电商网站已有商品资源全部是中文的,包括产品名称、介绍详情、用户评价等前台展示信息,和后台用于检索的索引,重新建立一套英文索引工程量大,维护成本高,通常的做法是将用户query翻译为中文,在中文索引库上做检索。因为query长度通常较短(3-5个词),query翻译模块使用统计机器翻译方法,如moses SMT***实现。
商品标题翻译模块:图5是根据本发明实施例1的编码器-解码器翻译模型的结构示意图,图6是根据本发明实施例1的商品标题翻译方法的流程图,如图5和图6所示,使用翻译好的中文query在索引库上检索到相关商品列表,因为商品名称是中文的,没法直接展示给用户,需要经过商品标题翻译模块将其转换成中文。商品名称翻译模块使用基于编码器-解码器架构的神经网络翻译方法,如RNN,Transformer等。
用户日志挖掘模块:将翻译好的中文商品列表返回给用户后,用户会浏览,点击自己感兴趣的商品并进入商品详情页,而对于不感兴趣的商品或者翻译有问题的商品名称会略过,基于此,用户的点击日志可以作为我们优化商品名称翻译的有监督学习数据。本方法中使用三元组格式存储用户浏览、点击、购买日志,<query,product translation,view#>,<query,product translation,click#>,<query,product translation,purchase>其中query表示用户搜索query,product translation表示商品英文翻译,view#表示用户浏览次数,click#表示该翻译被用户点击次数,purchase表示用户是否购买该商品。
多版本翻译重排序模块:如图5所示,商品名称翻译使用神经网络翻译***,以transformer为例,翻译的过程是一个解码过程,通过设定不同的束大小(beam size),使用束搜索(beam search)的方法,可以产生多个版本的翻译。因为束搜索不是全局最优算法,除了模型本身对每个版本翻译的打分外,通常还需要经过重排序模块对所有的翻译候选进行重排序,选出当前场景下最准确的翻译展示给用户。重排序方法可以使用排序学习(learning to rank)方法,如RankSVM、LamdaMart等。本方法将挖掘到的用户日志作为特征加入排序学习中。以上四个步骤形成一个闭环,商品名翻译模块产生的翻译提供给用户,用户的点击反馈又可以用来优化翻译模块,整条链路得以不断迭代优化。
实施例2
根据本发明实施例,还提供了另一种对象搜索方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或所描述的步骤。
需要说明的是,本申请实施例2所提供的方法实施例可以在如图1所示的计算机终端10(或移动设备10)或者类似的运算装置中执行。
作为一种可选的实施例,与采用翻译模型对多版本的第一语言的搜索结果进行评价类似的,在将第一语言转换为第二语言时,也可以考虑将第一语言转换为多版本的第二语言,之后,采用对应的翻译模型对多版本的第二语言的搜索对象进行评价,基于评价结果从多版本的第二语言的搜索对象中选择将要进行搜索的搜索对象,之后,依据选择的搜索对象进行搜索,得到上述搜索结果。即在本发明实施例中,在将第一语言转换为第二语言时,考虑过一次翻译的准确性;在将第二语言翻译成第一语言时也考虑了一次翻译的准确性,多次考虑翻译的准确性,能够在一定程度上提高向用户展示的搜索结果的准确性。
图7是根据本发明实施例2的一种对象搜索方法的流程图,如图7所示,本申请实施例所提供的对象搜索方法可以通过如下方法步骤实现:
步骤S702,接收搜索语句,其中,搜索语句的语言类型为第一语种。
作为一种可选的实施例,上述搜索语句可以包括采用第一语言输入的关键词,该关键词可以是目标对象的种类,属性,大小,名称等等。将上述关键词以第一语言输入,说明用户希望得到以第一语言表现的目标对象的文本信息,例如,种类,属性,大小名称等。
步骤S704,转换搜索语句的语言类型为多版本的第二语种,并获取到与多版本的第二语种对应的搜索结果,其中,搜索结果的语言类型为第二语种。
作为一种可选的实施例,上述搜索工具一般以第二语言作为基础语言,例如,中国的电商平台,基础语言一般为中文,在上述电商平台的外文网站中以第一语言进行搜索时,先将以第一语言输入的搜索语句转换成中文,然后根据上述中文的搜索语句进行搜索,得到相关的目标对象的中文信息,将上述目标对象的中文信息,再转换成对应的第一语言信息。
作为一种可选的实施例,上述将搜索语句由第一语言转换成第二语言,便于以第二语言为基础语言的网站进行搜索。上述搜索工具为以第二语言为基础语言的搜索工具。
步骤S706,基于搜索结果的历史操作日志,对多版本的第二语种对应的搜索结果进行重排序,得到排序后的搜索结果。
作为一种可选的实施例,上述对搜索结果包含的多条对象进行重排序之前,需要确定对搜索结果的排序标准。
作为一种可选的实施例,对多版本的第二语种对应的搜索结果进行重排序可以基于多种因素,例如,可以基于搜索结果的历史操作日志,因为搜索结果的历史操作日志可以在一定程度上显示该搜索对象之前所产生的一些搜索记录,而搜索记录又可以在一定程度上体现搜索对象普遍的搜索特点,因此,基于搜索结果的历史操作日志对搜索结果进行重排序,可以在一定程度上有效提高搜索的准确度。
实施例3
根据本发明实施例,还提供了另一种对象搜索方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或所描述的步骤。
需要说明的是,本申请实施例3所提供的方法实施例可以在如图1所示的计算机终端10(或移动设备10)或者类似的运算装置中执行。图8是根据本发明实施例3的一种对象搜索方法的流程图,如图8所示,本申请实施例所提供的对象搜索方法可以通过如下方法步骤实现:
步骤S802,接收搜索语句,其中,搜索语句的语言类型为第一语种。
作为一种可选的实施例,上述搜索语句可以包括采用第一语言输入的关键词,该关键词可以是目标对象的种类,属性,大小,名称等等。将上述关键词以第一语言输入,说明用户希望得到以第一语言表现的目标对象的文本信息,例如,种类,属性,大小名称等。
步骤S804,转换搜索语句的语言类型为第二语种,并基于转换结果获取到与搜索语句对应的搜索结果,其中,搜索结果的语言类型为第二语种。
作为一种可选的实施例,上述搜索工具一般以第二语言作为基础语言,例如,中国的电商平台,基础语言一般为中文,在上述电商平台的外文网站中以第一语言进行搜索时,先将以第一语言输入的搜索语句转换成中文,然后根据上述中文的搜索语句进行搜索,得到相关的目标对象的中文信息,将上述目标对象的中文信息,再转换成对应的第一语言信息。
作为一种可选的实施例,上述将搜索语句由第一语言转换成第二语言,便于以第二语言为基础语言的网站进行搜索。上述搜索工具为以第二语言为基础语言的搜索工具。
步骤S806,转换搜索结果的语言类型为多版本的第一语种。
作为一种可选的实施例,上述转换搜索结果的语言类型为第一语种,或者其他非第二语言的语种,本实施例中,将搜索结果转换为第一语种与第一语言相对应,因为一般用户在进行搜索时,都会采用自己擅长的语种进行搜索。这样可以保证搜索效率。上述搜索结果的语言类型还可以进行预设。从而保证用户体验。
步骤S808,基于多版本的第一语种的搜索结果的历史操作日志,对多版本的第一语种的搜索结果进行重排序,得到排序后的搜索结果。
作为一种可选的实施例,上述对多版本的第一语种的搜索结果进行重排序之前,需要确定对搜索结果的排序标准。
实施例4
根据本发明实施例,还提供了另一种对象搜索方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或所描述的步骤。
需要说明的是,本申请实施例4所提供的方法实施例可以在如图1所示的计算机终端10(或移动设备10)或者类似的运算装置中执行。图9是根据本发明实施例4的一种对象搜索方法的流程图,如图9所示,本申请实施例所提供的对象搜索方法可以通过如下方法步骤实现:
步骤S902,接收搜索请求,其中,搜索请求中携带有以第一语言输入的搜索对象。
上述步骤的执行主体为搜索工具,上述搜索工具可以是专门用于搜索的搜索网站,还可以是具有电商平台或者其他网站中使用的搜索工具,用于用户快速找到与搜索对象有关的商品,或内容。
作为一种可选的实施例,上述搜索请求中携带有以第一语言输入的搜索对象。搜索对象可以是以第一语言输入的关键词,该关键词可以是目标对象的种类,属性,大小,名称等等。将上述关键词以第一语言输入,说明用户希望得到以第一语言表现的目标对象的文本信息,例如,种类,属性,大小名称等。
作为一种可选的实施例,上述第一语言可以是任何一种语言种类,例如,英语,法语,德语等。
作为一种可选的实施例,上述搜索工具一般以第二语言作为基础语言,例如,中国的电商平台,基础语言一般为中文,在上述电商平台的外文网站中以第一语言进行搜索时,先将以第一语言输入的搜索对象转换成中文,然后根据上述中文的搜索对象进行搜索,得到相关的目标对象的中文信息,将上述目标对象的中文信息,再转换成对应的第一语言信息。
步骤S904,响应于搜索请求,对搜索对象由第一语种转换为第二语种后进行搜索,得到搜索结果。
作为一种可选的实施例,上述步骤以第二语言的搜索对象在上述以第二语言为基础语言的搜索工具中搜索,得到第二语言的搜索结果。
作为一种可选的实施例,上述搜索结果包括多个第二语言的对象,而且,上述搜索结果,可以根据多种不同的排序标准进行排序。以不同的排序标准进行排序的搜索结果可以不同,也可以相同,上述排序标准可以是默认,还可以是用户选择。
作为一种可选的实施例,上述用户选择排序标准可以是由用户选择,用户通过第一语言的排序规则进行选择,第一语言的排序规则与第二语言的排序规则对应,选中第一语言的第一排序规则,则触发第二语言的排序规则,并依据上述第二语言的排序规则进行排序。
作为一种可选的实施例,上述第一语言可以为除第二语言外的任何语言,但是,语言随着传播的时间和空间的差别,会发生一定的变化,例如,英语作为世界上使用最广泛的语言,但是,英语也被分为很多种类,主要分为美式英语和英式英语,还有其他的,例如,印度英语,等等,不同的语言子类,对同一事物的描述也不尽相同。因此,需要选取与用户最合适的搜索结果的翻译,向用户展现,从而提高用户的体验度。
步骤S906,在将第二语种的搜索结果转换成多版本的第一语种后,基于多版本的第一语种的搜索结果的历史操作日志对多版本第一语种的搜索结果进行重排序后,展示排序后的搜索结果。
上述向用户展现用户最合适的搜索结果的翻译之前,需要确定搜索结果的排序标准。
作为一种可选的实施例,基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序包括:接收输入的地理区域;基于地理区域对应的历史操作日志对多版本的第一语种搜索结果进行重排序。
作为一种可选的实施例,上述接收输入的地理区域,是指上述搜索对象的表现形式对应的地理区域,需要说明的是,可以通过上述搜索对象的表现形式对应的地理区域,没有大小限定,而且不同的表现形式对应的地理区域可以重叠。
作为一种可选的实施例,上述基于地理区域对应的历史操作日志对搜索结果进行重排序,上述地理区域内的历史操作日志,为用户在该地理区域内的历史操作日志,将用户所在的地理区域结合历史操作日志,可以有效增加对不同版本翻译结果排序的准确率。
作为一种可选的实施例,上述对象搜索方法还包括:接收对展示的搜索结果所进行的操作;对接收的操作记录操作日志。
作为一种可选的实施例,上述将新的操作日志融合进入历史操作日志,影响下一次的翻译操作,从而形成闭环,产生良性循环,商品名翻译模块产生的翻译提供给用户,用户的点击反馈又可以用来优化翻译模块,整条链路得以不断迭代优化。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例5
根据本发明实施例,还提供了一种用于实施上述实施例1的对象搜索方法的装置实施例,图10是根据本发明实施例5的一种对象搜索装置的结构示意图,如图10所示,该装置包括:接收模块1001,第一转换模块1002,搜索模块1003,第二转换模块1004,排序模块1005和展示模块1006。下面对该装置进行详细说明。
接收模块1001,用于接收以第一语言输入的搜索对象;第一转换模块1002,与上述接收模块1001相连,用于将搜索对象由第一语言转换成第二语言;搜索模块1003,与上述第一转换模块1002相连,用于对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;第二转换模块1004,与上述搜索模块1003相连,用于将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;排序模块1005,与上述第二转换模块1004相连,用于至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示模块1006,与上述排序模块1005相连,用于展示排序后的搜索结果。
此处需要说明的是,上述接收模块1001,第一转换模块1002,搜索模块1003,第二转换模块1004,排序模块1005和展示模块1006对应于实施例1中的步骤S202至步骤S212,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
实施例6
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的对象搜索方法中以下步骤的程序代码:接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示排序后的搜索结果。
可选地,图11是根据本申请实施例6的一种计算机终端的结构框图,如图11所示,该计算机终端110可以包括:一个或多个(图中仅示出一个)处理器112、存储器114、以及外设接口116。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的安全漏洞检测方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的***漏洞攻击的检测方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端100。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:搜索结果的历史操作日志包括以下至少之一:对搜索结果进行浏览的浏览记录,对搜索结果进行点击的点击记录,对搜索结果进行购买的购买记录。
可选的,上述处理器还可以执行如下步骤的程序代码:浏览记录至少包括:浏览的次数,浏览的时长;点击记录包括:点击的次数;购买记录包括:购买的次数。
可选的,上述处理器还可以执行如下步骤的程序代码:还包括:获取针对地理区域的历史操作日志。
可选的,上述处理器还可以执行如下步骤的程序代码:获取针对地理区域的历史操作日志包括:确定输入的第一语言的搜索对象的表现形式;确定表现形式对应的地理区域;获取地理区域内的历史操作日志。
可选的,上述处理器还可以执行如下步骤的程序代码:将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果包括:采用束搜索的方法,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:还包括:采用翻译模型对多版本的第一语言的搜索结果进行评价,得到评价结果;依据评价结果对多版本的第一语言的搜索结果进行预排序。
可选的,上述处理器还可以执行如下步骤的程序代码:还包括:接收对展示的搜索结果所进行的操作;根据操作记录操作日志;采用记录的操作日志更新历史操作日志。
可选的,上述处理器还可以执行如下步骤的程序代码:另一种对象搜索方法,包括:接收搜索语句,其中,搜索语句的语言类型为第一语种;转换搜索语句的语言类型为多版本的第二语种,并获取到与多版本的第二语种对应的搜索结果,其中,搜索结果的语言类型为第二语种;基于搜索结果的历史操作日志,对多版本的第二语种对应的搜索结果进行重排序,得到排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:另一种对象搜索方法,包括:接收搜索语句,其中,搜索语句的语言类型为第一语种;转换搜索语句的语言类型为第二语种,并基于转换结果获取到与搜索语句对应的搜索结果,其中,搜索结果的语言类型为第二语种;转换搜索结果的语言类型为多版本的第一语种;基于多版本的第一语种的搜索结果的历史操作日志,对多版本的第一语种的搜索结果进行重排序,得到排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:另一种对象搜索方法,包括:接收搜索请求,其中,搜索请求中携带有以第一语言输入的搜索对象;响应于搜索请求,对搜索对象由第一语种转换为第二语种后进行搜索,得到搜索结果;在将第二语种的搜索结果转换成多版本的第一语种后,基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序后,展示排序后的搜索结果。
可选的,上述处理器还可以执行如下步骤的程序代码:基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序包括:接收输入的地理区域;基于地理区域对应的历史操作日志对多版本的第一语种的搜索结果进行重排序。
可选的,上述处理器还可以执行如下步骤的程序代码:还包括:接收对展示的搜索结果所进行的操作;对接收的操作记录操作日志。
采用本发明实施例,提供了一种对象搜索方法的方案。采用接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果的方式,通过对第二语言的搜索结果翻译成的多种不同版本的第一语言进行排序,并且根据搜索结果的历史操作日志为依据进行排序,达到了针对使用者的历史语言习惯确定最合适该使用者的翻译版本的目的,从而实现了提高在搜索过程中,翻译的准确率和用户体验度的技术效果,进而解决了相关技术中的外文搜索方法,在翻译过程中,翻译准确率低,用户体验差的技术问题。
本领域普通技术人员可以理解,图11所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图11其并不对上述电子装置的结构造成限定。例如,计算机终端110还可包括比图11中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图11所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例7
本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例一所提供的对象搜索方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收以第一语言输入的搜索对象;将搜索对象由第一语言转换成第二语言;对第二语言的搜索对象进行搜索,得到第二语言的搜索结果;将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果;至少基于多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;展示重排序后的搜索结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:历史操作日志包括以下至少之一:对搜索结果进行浏览的浏览记录,对搜索结果进行点击的点击记录,对搜索结果进行购买的购买记录。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:浏览记录至少包括:浏览的次数,浏览的时长;点击记录包括:点击的次数;购买记录包括:购买的次数。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:还包括:获取针对地理区域的历史操作日志。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取针对地理区域的历史操作日志包括:确定输入的第一语言的搜索对象的表现形式;确定表现形式对应的地理区域;获取地理区域内的历史操作日志。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果包括:采用束搜索的方法,将第二语言的搜索结果转换成多版本的第一语言,得到多版本的第一语言的搜索结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:还包括:采用翻译模型对多版本的第一语言的搜索结果进行评价,得到评价结果;依据评价结果对多版本的第一语言的搜索结果进行预排序。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:还包括:接收对展示的搜索结果所进行的操作;根据操作记录操作日志;采用记录的操作日志更新历史操作日志。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:另一种对象搜索方法,包括:接收搜索语句,其中,搜索语句的语言类型为第一语种;转换搜索语句的语言类型为多版本的第二语种,并获取到与多版本的第二语种对应的搜索结果,其中,搜索结果的语言类型为第二语种;基于搜索结果的历史操作日志,对多版本的第二语种对应的搜索结果进行重排序,得到排序后的搜索结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:另一种对象搜索方法,包括:接收搜索语句,其中,搜索语句的语言类型为第一语种;转换搜索语句的语言类型为第二语种,并基于转换结果获取到与搜索语句对应的搜索结果,其中,搜索结果的语言类型为第二语种;转换搜索结果的语言类型为多版本的第一语种;基于多版本的第一语种的搜索结果的历史操作日志,对多版本的第一语种的搜索结果进行重排序,得到排序后的搜索结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:另一种对象搜索方法,包括:接收搜索请求,其中,搜索请求中携带有以第一语言输入的搜索对象;响应于搜索请求,对搜索对象由第一语种转换为第二语种后进行搜索,得到搜索结果;在将第二语种的搜索结果转换成多版本的第一语种后,基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序后,展示排序后的搜索结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:基于多版本的第一语种的搜索结果的历史操作日志对多版本的第一语种的搜索结果进行重排序包括:接收输入的地理区域;基于地理区域对应的历史操作日志对多版本的第一语种的搜索结果进行重排序。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:还包括:接收对展示的搜索结果所进行的操作;对接收的操作记录操作日志。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种对象搜索方法,包括:
接收以第一语言输入的搜索对象;
将所述搜索对象由所述第一语言转换成第二语言;
对所述第二语言的搜索对象进行搜索,得到第二语言的搜索结果;
将所述第二语言的搜索结果转换成多版本的所述第一语言,得到多版本的第一语言的搜索结果;
至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;
展示重排序后的搜索结果。
2.根据权利要求1所述的方法,其中,所述历史操作日志包括以下至少之一:
对搜索结果进行浏览的浏览记录,对搜索结果进行点击的点击记录,对搜索结果进行购买的购买记录。
3.根据权利要求2所述的方法,其特征在于,所述浏览记录至少包括:浏览的次数,浏览的时长;所述点击记录包括:点击的次数;所述购买记录包括:购买的次数。
4.根据权利要求2所述的方法,其中,还包括:
获取针对地理区域的历史操作日志。
5.根据权利要求4所述的方法,其中,获取针对地理区域的历史操作日志包括:
确定输入的第一语言的搜索对象的表现形式;
确定所述表现形式对应的地理区域;
获取所述地理区域内的历史操作日志。
6.根据权利要求1所述的方法,其中,将所述第二语言的搜索结果转换成多版本的所述第一语言,得到多版本的第一语言的搜索结果包括:
采用束搜索的方法,将所述第二语言的搜索结果转换成多版本的所述第一语言,得到多版本的第一语言的搜索结果。
7.根据权利要求1所述的方法,其中,还包括:
采用翻译模型对所述多版本的第一语言的搜索结果进行评价,得到评价结果;
依据所述评价结果对所述多版本的第一语言的搜索结果进行预排序。
8.根据权利要求1到7中任一项所述的方法,其中,还包括:
接收对展示的搜索结果所进行的操作;
根据所述操作记录操作日志;
采用记录的操作日志更新所述历史操作日志。
9.一种对象搜索方法,包括:
接收搜索语句,其中,所述搜索语句的语言类型为第一语种;
转换所述搜索语句的语言类型为多版本的第二语种,并获取到与所述多版本的第二语种对应的搜索结果,其中,所述搜索结果的语言类型为第二语种;
基于搜索结果的历史操作日志,对所述多版本的第二语种对应的所述搜索结果进行重排序,得到排序后的搜索结果。
10.一种对象搜索方法,包括:
接收搜索语句,其中,所述搜索语句的语言类型为第一语种;
转换所述搜索语句的语言类型为第二语种,并基于转换结果获取到与所述搜索语句对应的搜索结果,其中,所述搜索结果的语言类型为第二语种;
转换所述搜索结果的语言类型为多版本的第一语种;
基于多版本的第一语种的搜索结果的历史操作日志,对所述多版本的第一语种的搜索结果进行重排序,得到排序后的搜索结果。
11.一种对象搜索方法,包括:
接收搜索请求,其中,所述搜索请求中携带有以第一语言输入的搜索对象;
响应于所述搜索请求,对所述搜索对象由所述第一语种转换为第二语种后进行搜索,得到搜索结果;
在将所述第二语种的搜索结果转换成多版本的第一语种后,基于多版本的第一语种的搜索结果的历史操作日志对所述多版本的第一语种的搜索结果进行重排序后,展示排序后的搜索结果。
12.根据权利要求11所述的方法,其中,基于多版本的第一语种的搜索结果的历史操作日志对所述多版本的第一语种的搜索结果进行重排序包括:
接收输入的地理区域;
基于所述地理区域对应的历史操作日志对所述多版本的第一语种的搜索结果进行重排序。
13.根据权利要求11所述的方法,其中,还包括:
接收对展示的搜索结果所进行的操作;
对接收的操作记录操作日志。
14.一种对象搜索装置,包括:
接收模块,用于接收以第一语言输入的搜索对象;
第一转换模块,用于将所述搜索对象由所述第一语言转换成第二语言;
搜索模块,用于对所述第二语言的搜索对象进行搜索,得到第二语言的搜索结果;
第二转换模块,用于将所述第二语言的搜索结果转换成多版本的第一语言,得到所述多版本的第一语言的搜索结果;
排序模块,用于至少基于所述多版本的第一语言的搜索结果的历史操作日志,对多版本的第一语言的搜索结果进行重排序,得到重排序后的搜索结果;
展示模块,用于展示重排序后的搜索结果。
15.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至13中任意一项所述的对象搜索方法。
16.一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至13中任意一项所述的对象搜索方法。
CN201811094922.8A 2018-09-19 2018-09-19 对象搜索方法及装置 Active CN110930208B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811094922.8A CN110930208B (zh) 2018-09-19 2018-09-19 对象搜索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811094922.8A CN110930208B (zh) 2018-09-19 2018-09-19 对象搜索方法及装置

Publications (2)

Publication Number Publication Date
CN110930208A CN110930208A (zh) 2020-03-27
CN110930208B true CN110930208B (zh) 2023-05-05

Family

ID=69855926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811094922.8A Active CN110930208B (zh) 2018-09-19 2018-09-19 对象搜索方法及装置

Country Status (1)

Country Link
CN (1) CN110930208B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728134A (zh) * 2004-07-30 2006-02-01 国际商业机器公司 基于超文本的多语言网络信息搜索方法和***
JP2010072909A (ja) * 2008-09-18 2010-04-02 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
WO2012116561A1 (zh) * 2011-03-02 2012-09-07 北京百度网讯科技有限公司 一种跨语言搜索中的网页排序方法和***
CN103049474A (zh) * 2011-10-25 2013-04-17 微软公司 搜索查询和文档相关数据翻译
US8577910B1 (en) * 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN105760531A (zh) * 2016-03-03 2016-07-13 华南师范大学 多语言搜索引擎方法及***
CN108304412A (zh) * 2017-01-13 2018-07-20 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645289B2 (en) * 2010-12-16 2014-02-04 Microsoft Corporation Structured cross-lingual relevance feedback for enhancing search results
US8918308B2 (en) * 2012-07-06 2014-12-23 International Business Machines Corporation Providing multi-lingual searching of mono-lingual content
US8914395B2 (en) * 2013-01-03 2014-12-16 Uptodate, Inc. Database query translation system

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1728134A (zh) * 2004-07-30 2006-02-01 国际商业机器公司 基于超文本的多语言网络信息搜索方法和***
JP2010072909A (ja) * 2008-09-18 2010-04-02 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、および文書検索プログラム
US8577910B1 (en) * 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
WO2012116561A1 (zh) * 2011-03-02 2012-09-07 北京百度网讯科技有限公司 一种跨语言搜索中的网页排序方法和***
CN103049474A (zh) * 2011-10-25 2013-04-17 微软公司 搜索查询和文档相关数据翻译
CN105320706A (zh) * 2014-08-05 2016-02-10 阿里巴巴集团控股有限公司 搜索结果的处理方法和装置
CN105760531A (zh) * 2016-03-03 2016-07-13 华南师范大学 多语言搜索引擎方法及***
CN108304412A (zh) * 2017-01-13 2018-07-20 北京搜狗科技发展有限公司 一种跨语言搜索方法和装置、一种用于跨语言搜索的装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王末等."地学数据共享网用户Web行为预测及数据推荐方法".《地球信息科学学报》.2017,第19卷(第5期),第595-604页. *

Also Published As

Publication number Publication date
CN110930208A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
US10552548B2 (en) Methods for automatic generation of parallel corpora
CN103970857B (zh) 推荐内容确定***和方法
US8700621B1 (en) Generating query suggestions from user generated content
US8583685B2 (en) Determination of category information using multiple stages
US20150254714A1 (en) Systems and methods for keyword suggestion
KR20170018832A (ko) 사용자 관계 데이터 결합에 기초하는 검색
KR20190067165A (ko) 콘텐츠 추천 및 디스플레이
US9953061B2 (en) Similarity engine for facilitating re-creation of an application collection of a source computing device on a destination computing device
US9990442B2 (en) Method for determining relevant search results
US10795938B2 (en) Spell checker
CN107545451B (zh) 一种广告推送方法及装置
WO2016007382A1 (en) Methods for automatic query translation
KR101647087B1 (ko) 자연어 처리에 기반한 재화 제공 서버 및 방법
US11556969B2 (en) Method for performing sequence labelling on queries
US20230044789A1 (en) Indexing Native Application Data
KR20220026255A (ko) 빅데이터를 이용한 건강식품 추천시스템
CN110930208B (zh) 对象搜索方法及装置
US11256703B1 (en) Systems and methods for determining long term relevance with query chains
CN115618126A (zh) 搜索处理方法、***、计算机可读存储介质及计算机设备
CN112148988B (zh) 用于生成信息的方法、装置、设备以及存储介质
CN111222918B (zh) 关键词挖掘方法、装置、电子设备及存储介质
CN112749316B (zh) 翻译质量的确定方法、装置、存储介质和处理器
CN112559732A (zh) 文本处理方法、装置和***
CN111831130A (zh) 输入内容的推荐方法、终端设备以及存储介质
CN111737550B (zh) 搜索结果处理方法及装置、存储介质和处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40026856

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant