CN107315841A - 一种信息搜索方法、装置及*** - Google Patents

一种信息搜索方法、装置及*** Download PDF

Info

Publication number
CN107315841A
CN107315841A CN201710596879.4A CN201710596879A CN107315841A CN 107315841 A CN107315841 A CN 107315841A CN 201710596879 A CN201710596879 A CN 201710596879A CN 107315841 A CN107315841 A CN 107315841A
Authority
CN
China
Prior art keywords
search
strange land
information
search result
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710596879.4A
Other languages
English (en)
Inventor
汤彪
张弓
苏婧
张涛
祝升
侯培旭
于志安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201710596879.4A priority Critical patent/CN107315841A/zh
Publication of CN107315841A publication Critical patent/CN107315841A/zh
Priority to KR1020197035369A priority patent/KR102301899B1/ko
Priority to EP17918687.9A priority patent/EP3617952A4/en
Priority to JP2019565394A priority patent/JP6967612B2/ja
Priority to CA3066832A priority patent/CA3066832C/en
Priority to PCT/CN2017/119765 priority patent/WO2019015262A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种信息搜索方法、装置及***,其中,该方法包括:接收用户通过客户端发送的搜索词;根据该搜索词的特征信息和/或搜索上下文特征信息,识别用户的搜索意图,并生成相应的识别结果;采用与该识别结果相应的搜索策略并根据上述搜索词进行搜索,获取与该搜索词相关的信息搜索结果;将该信息搜索结果发送至上述客户端,以使该客户端展示上述信息搜索结果。本发明通过识别用户的搜索意图,以及根据相应的搜索策略进行搜索,如同时进行本地搜索和异地搜索、或只进行异地搜索,从而能够得到更符合用户意图的搜索结果,使用户在存在异地搜索意图时不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。

Description

一种信息搜索方法、装置及***
技术领域
本发明涉及信息搜索技术领域,具体而言,涉及一种信息搜索方法、装置及***。
背景技术
目前,物联网技术的快速发展,使得线下景点、商户等能够通过互联网线上被更多的人发现和了解,用户利用电脑、手机等终端即可通过O2O(Online To Offline,将线下的商务机会与互联网结合的物联网理念)搜索引擎搜索到线下的景点、商户等,进而了解景点信息、商户促销活动、已消费用户的评论等信息,或者进行线上订票、下单以及支付等业务。
当前,相关技术中提供的O2O搜索引擎,主要基于本地信息进行检索,如用户搜索某一全国连锁酒店,则只能得到本地的搜索结果,即只能为用户提供当前定位城市下的相关搜索结果。
然而,在实际应用中,用户往往存在较多的异地搜索需求,比如,旅游前往往需要查询目的城市的景点信息、酒店信息以进行订票、订酒店等业务,现有的O2O搜索引擎往往无法满足用户需求,例如,在用户在上海搜索“华山”时,得到的都是“华山医院”的相关结果;如果用户想要搜索“华山”景点,需要手动切换城市,操作繁琐且效率较低。
因此,目前迫切需要一种能够解决用户异地搜索需求的技术方案,以提高用户异地搜索的效率,提升用户体验。
发明内容
有鉴于此,本发明实施例的目的在于提供一种信息搜索方法、装置及***,以解决现有技术中进行异地搜索时操作繁琐、效率较低的问题。
第一方面,本发明实施例提供了一种信息搜索方法,用于服务器,所述方法包括:
接收用户通过客户端发送的搜索词;
根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
可选的,所述根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,包括:
获取所述搜索词的特征信息和/或搜索上下文特征信息;
根据所述搜索词的特征信息和/或所述搜索上下文特征信息及预先训练好的异地搜索偏好度确定模型,确定所述用户的异地搜索偏好度;
根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图。
可选的,所述异地搜索偏好度确定模型是通过如下方式训练得到的:
以搜索词的特征变量和/或搜索上下文特征变量为自变量,以异地搜索偏好特征为因变量,构建异地搜索偏好度确定模型;
获取根据多个搜索点击历史记录生成的训练样本;
利用所述训练样本训练所述异地搜索偏好度确定模型。
可选的,所述构建异地搜索偏好度确定模型,包括:
采用逻辑回归模型构建异地搜索偏好度确定模型。
可选的,所述采用逻辑回归模型构建异地搜索偏好度确定模型,具体包括:
采用以下公式构建异地搜索偏好度确定模型:
remoteprob=sigmoid(w1x1+w2x2+...+wnxn)
式中,remoteprob表示异地搜索偏好特征,xn表示第n个特征变量的特征值,wn表示第n个特征变量对应的权重,每个特征变量对应的权重是根据选取的训练样本训练确定的,函数sigmoid为神经网络的阈值函数,该阈值函数用于将变量映射到0至1之间。
可选的,在根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤前,还包括:
将所述搜索词与预设的本异地实体词库进行匹配,根据匹配结果判断所述搜索词是否有异地搜索可能性,若有,则执行根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤。
可选的,所述采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,包括:
若所述识别结果为用户同时具有本地和异地搜索意图,则根据所述搜索词进行本地搜索和异地搜索,获得包括多个本地搜索结果和多个异地搜索结果的信息搜索结果。
可选的,在将所述信息搜索结果发送至所述客户端的步骤前,还包括:
将所述多个本地搜索结果归并为本地搜索结果展示区,以及将所述多个异地搜索结果归并为异地搜索结果展示区;
根据用户的异地搜索偏好度和/或本异地搜索结果质量确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序;
根据所述展示顺序,生成包含所述本地搜索结果展示区和所述异地搜索结果展示区的信息搜索结果。
可选的,所述本地搜索结果展示区为可折叠展示区,在将所述多个本地搜索结果归并为本地搜索结果展示区后,还包括:
根据各所述本地搜索结果的预估点击率,确定所述本地搜索结果展示区中各所述本地搜索结果的顺序,以及确定所述本地搜索结果展示区在折叠状态下展示的本地搜索结果的数量。
可选的,所述异地搜索结果展示区为可折叠展示区,在将所述多个异地搜索结果归并为异地搜索结果展示区后,还包括:
根据各所述异地搜索结果的预估点击率,确定所述异地搜索结果展示区中各所述异地搜索结果的顺序,以及确定所述异地搜索结果展示区在折叠状态下展示的异地搜索结果的数量。
可选的,所述信息搜索方法,还包括:
获取用户对所述信息搜索结果的点击操作日志;
根据所述点击操作日志对所述异地搜索偏好度确定模型进行迭代优化。
第二方面,本发明实施例还提供了一种信息搜索方法,用于客户端,所述方法包括:
监听用户输入的搜索词;
将所述搜索词发送至服务器;
接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
展示所述信息搜索结果。
可选的,所述信息搜索结果包括本地搜索结果展示区、异地搜索结果展示区及展示顺序,其中,所述本地搜索结果展示区中包括多条本地搜索结果,所述异地搜索结果展示区中包括多条异地搜索结果;
所述展示所述信息搜索结果,包括:
按照所述展示顺序同屏展示所述本地搜索结果展示区和所述异地搜索结果展示区。
第三方面,本发明实施例还提供了一种信息搜索装置,用于服务器,该装置包括:
搜索词接收模块,用于接收用户通过客户端发送的搜索词;
搜索意图识别模块,用于根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
策略搜索模块,用于采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果发送模块,用于将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
可选的,所述搜索意图识别模块,具体用于:
获取所述搜索词的特征信息和/或搜索上下文特征信息;
根据所述搜索词的特征信息和/或所述搜索上下文特征信息及预先训练好的异地搜索偏好度确定模型,确定所述用户的异地搜索偏好度;
根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图。
可选的,所述异地搜索偏好度确定模型是通过如下方式训练得到的:
以搜索词的特征变量和/或搜索上下文特征变量为自变量,以异地搜索偏好特征为因变量,构建异地搜索偏好度确定模型;
获取根据多个搜索点击历史记录生成的训练样本;
利用所述训练样本训练所述异地搜索偏好度确定模型。
可选的,所述异地搜索偏好度确定模型采用逻辑回归模型构建。
可选的,所述异地搜索偏好度确定模型具体采用以下公式构建:
remoteprob=sigmoid(w1x1+w2x2+...+wnxn)
式中,remoteprob表示异地搜索偏好特征,xn表示第n个特征变量的特征值,wn表示第n个特征变量对应的权重,每个特征变量对应的权重是根据选取的训练样本训练确定的,函数sigmoid为神经网络的阈值函数,该阈值函数用于将变量映射到0至1之间。
可选的,所述信息搜索装置还包括:
实体词匹配模块,用于将所述搜索词与预设的本异地实体词库进行匹配,根据匹配结果判断所述搜索词是否有异地搜索可能性,若有,则执行根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤。
可选的,所述策略搜索模块具体用于:
若所述识别结果为用户同时具有本地和异地搜索意图,则根据所述搜索词进行本地搜索和异地搜索,获得包括多个本地搜索结果和多个异地搜索结果的信息搜索结果。
可选的,所述信息搜索装置,还包括:
结果归并模块,用于将所述多个本地搜索结果归并为本地搜索结果展示区,以及将所述多个异地搜索结果归并为异地搜索结果展示区;
展示顺序确定模块,用于根据用户的异地搜索偏好度和/或本异地搜索结果质量确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序;
搜索结果生成模块,用于根据所述展示顺序,生成包含所述本地搜索结果展示区和所述异地搜索结果展示区的信息搜索结果。
可选的,所述本地搜索结果展示区为可折叠展示区,所述信息搜索装置,还包括:
本地顺序确定模块,用于根据各所述本地搜索结果的预估点击率,确定所述本地搜索结果展示区中各所述本地搜索结果的顺序,以及确定所述本地搜索结果展示区在折叠状态下展示的本地搜索结果的数量。
可选的,所述异地搜索结果展示区为可折叠展示区,所述信息搜索装置,还包括:
异地顺序确定模块,用于根据各所述异地搜索结果的预估点击率,确定所述异地搜索结果展示区中各所述异地搜索结果的顺序,以及确定所述异地搜索结果展示区在折叠状态下展示的异地搜索结果的数量。
可选的,所述信息搜索装置,还包括:
操作日志获取模块,用于获取用户对所述信息搜索结果的点击操作日志;
迭代优化模块,用于根据所述点击操作日志对所述异地搜索偏好度确定模型进行迭代优化。
第四方面,本发明实施例还提供了一种信息搜索装置,用于客户端,包括:
输入监听模块,用于监听用户输入的搜索词;
搜索词发送模块,用于将所述搜索词发送至服务器;
搜索结果接收模块,用于接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果展示模块,用于展示所述信息搜索结果。
可选的,所述信息搜索结果包括本地搜索结果展示区、异地搜索结果展示区及展示顺序,其中,所述本地搜索结果展示区中包括多条本地搜索结果,所述异地搜索结果展示区中包括多条异地搜索结果;
所述搜索结果展示模块,具体用于:
按照所述展示顺序同屏展示所述本地搜索结果展示区和所述异地搜索结果展示区。
第五方面,本发明实施例还提供了一种信息搜索***,该***包括:服务器和客户端,所述服务器包括第三方面所述的装置,所述客户端包括第四方面所述的装置。
第六方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。
第七方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第二方面所述的方法的步骤。
第八方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。
第九方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第二方面所述的方法的步骤。
在本发明实施例提供一种用于服务器的信息搜索方法,该方法包括:接收用户通过客户端发送的搜索词;根据该搜索词的特征信息和/或搜索上下文特征信息,识别用户的搜索意图,并生成相应的识别结果;采用与该识别结果相应的搜索策略并根据上述搜索词进行搜索,获取与该搜索词相关的信息搜索结果;将该信息搜索结果发送至上述客户端,以使该客户端展示上述信息搜索结果。本发明通过识别用户的搜索意图,以及根据相应的搜索策略进行搜索,如同时进行本地搜索和异地搜索、或只进行异地搜索,从而能够得到更符合用户意图的搜索结果,使用户在存在异地搜索意图时不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明第一实施例所提供的一种用于服务器的信息搜索方法的流程示意图;
图2示出了本发明第一实施例所提供的一种用于服务器的信息搜索装置的结构示意图;
图3示出了本发明第一实施例所提供的一种计算机设备的模块组成示意图;
图4示出了本发明第二实施例所提供的一种用于客户端的信息搜索方法的流程示意图;
图5示出了本发明第二实施例所提供的一种用于客户端的信息搜索装置的结构示意图;
图6示出了本发明第二实施例所提供的一种计算机设备的模块组成示意图;
图7示出了本发明第三实施例所提供的一种信息搜索***的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到相关技术中的O2O搜索引擎主要基于本地信息进行检索,导致用户在进行异地搜索时操作繁琐、效率低下且用户体验较差的问题。本发明实施例提供了一种信息搜索方法、装置、***、计算机设备及计算机可读存储介质。下面通过实施例进行描述。
实施例一:
如图1所示,本发明第一实施例提供了一种信息搜索方法,该方法的执行主体为服务器,该方法包括步骤S101-S104,具体如下:
步骤S101:接收用户通过客户端发送的搜索词;
步骤S102:根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
步骤S103:采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
步骤S104:将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
在本发明第一实施例中,用户在客户端中输入搜索词,所述客户端在监听到输入的搜索词后,将该搜索词发送至服务器进行检索,服务器在接收到所述搜索词后,首先要进行搜索意图识别,以确定该用户的搜索意图,然后再根据用户的搜索意图识别的识别结果采用相应的搜索策略进行搜索。
需要说明的是,在本发明实施例中,本地、异地都是针对客户端的当前定位城市而言的,即将客户端的当前定位城市或区域作为本地,非本地区域视为异地。
上述识别结果可以包括:用户有异地搜索需求和用户没有异地搜索需求两种,以确定是否进行异地搜索并显示异地搜索结果;其中,用户有异地搜索需求的识别结果还可以进一步细分为用户同时具有本地搜索需求和异地搜索需求(例如用户具有较强的异地搜索意图则可以得出该识别结果),以及用户只具有异地搜索需求(例如用户具有非常强烈的异地搜索意图则可以得出该识别结果)两种情形,用户没有异地搜索需求也可以视为用户只具有本地搜索需求(例如用户没有或具有较弱的异地搜索意图则可以得出该识别结果)。
上述搜索意图是用来描述用户想要查询本地商户、异地商户、或者是同时查询本地商户和异地商户的,由于实际生活中用户对本地商户的搜索更多一些,因此在对用户的搜索意图进行识别时,可以根据用户异地搜索意图的强弱判断用户的搜索意图,其中,用户异地搜索意图的强弱可以采用异地搜索偏好度进行度量,根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图,比如,当异地搜索偏好度低于第一偏好度阈值时,可以确定用户只具有本地搜索需求;当异地搜索偏好度大于第一偏好度阈值且小于第二偏好度阈值时,可以确定用户同时具有本地搜索需求和异地搜索需求;当异地搜索偏好度大于第二偏好度阈值时,可以确定用户只具有异地搜索需求。
用户的搜索意图可以从两方面进行判断,一方面是用户输入的搜索词本身具有的异地搜索意图的强弱,另一方面是根据搜索的上下文判断用户异地搜索意图的强弱。
因此,在本发明第一实施例提供的一个示例中,首先获取能够反映搜索词本身具有的异地搜索意图的该搜索词的特征信息和/或搜索上下文特征信息,然后根据所述搜索词的特征信息和/或搜索上下文特征信息识别用户的搜索意图。
所述搜索词的特征信息可以是该搜索词历史搜索结果中异地搜索结果的点击率、该搜索词在异地的搜索量等,例如,当一个搜索词的历史搜索记录中,异地搜索结果的点击率高于预设阈值时,可以认为该搜索词本身即具有较高的异地搜索意图;又如,当一个搜索词在异地城市的搜索量高于预设阈值,则同样可以认为该搜索词本身即具有较高的异地搜索意图。
所述搜索上下文特征信息可以包括用户特征信息,所述用户特征信息可以是根据用户的历史搜索行为(如是否搜索过异地信息)、常驻城市及最近活跃城市、当前位置信息、历史点击行为、历史购买行为、历史浏览行为等抽象出来的特征信息,如指定时间段内的所在城市变化次数、异地搜索结果点击率或点击次数、异地下单次数等等,根据以上至少一项用户特征信息即可判断用户异地搜索意图的强弱,进而确定用户的搜索意图。
另外,所述搜索上下文特征信息也可以包括当前本地搜索结果质量,其中,本地搜索结果质量可以根据本地搜索结果数量、本地搜索结果历史点击率、或本地搜索结果的预估点击率中的至少一项进行确定,根据以上至少一项本地搜索结果质量即可判断用户异地搜索意图的强弱,进而确定用户的搜索意图。例如在接收到搜索词后,首先进行本地搜索,如果本地搜索结果数量低于预设的本地搜索结果数量阈值或者本地搜索结果历史点击率低于预设的历史点击率阈值,则可以判断当前本地搜索结果质量较差,用户可能更需要进行异地搜索,则可以判断该用户具有异地搜索需求(包括用户同时具有本地和异地搜索需求、及用户只具有异地搜索需求两种情形,可以通过进一步设定阈值条件进行区分)。
需要说明的是,以上搜索词的特征信息和搜索上下文特征信息既可以分别单独作为用户搜索意图的识别依据,也可以共同作为用户搜索意图的识别依据,例如,步骤S102可以只根据所述搜索词的特征信息识别用户的搜索意图,如果用户输入的搜索词本身即具有较高的异地搜索意图(如大于第一搜索词异地意图阈值),则可以直接判断该用户具有异地搜索需求(包括用户同时具有本地和异地搜索需求、及用户只具有异地搜索需求两种情形,可以通过进一步设定阈值条件进行区分);又如,步骤S102也可以只根据搜索上下文特征信息识别用户的搜索意图,如果以上至少一项搜索上下文特征信息达到相应的预设阈值条件,即可判断该用户异地搜索需求(包括用户同时具有本地和异地搜索需求、及用户只具有异地搜索需求两种情形,可以通过进一步设定阈值条件进行区分);再如,步骤S102还可以结合所述搜索词的特征信息和搜索上下文特征信息共同识别用户的搜索意图,可以为各识别依据设定相应的权重,将各识别结果加权计算后确定最终的识别结果。容易理解的是,进行用户的搜索意图识别时,识别依据越多,获得的识别结果相对而言越准确,即越能准确的识别用户的搜索意图,进而为用户提供更加符合用户需求的搜索结果,提升用户体验。
在本发明提供的一个实施例中,采用逻辑回归模型识别用户的搜索意图,首先利用基于逻辑回归模型训练得到的异地搜索偏好度确定模型计算用户的异地搜索偏好度,然后根据所述异地搜索偏好度确定用户的搜索意图。所述根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,包括:
获取所述搜索词的特征信息和/或搜索上下文特征信息;
根据所述搜索词的特征信息和/或所述搜索上下文特征信息及预先训练好的异地搜索偏好度确定模型,确定所述用户的异地搜索偏好度;
根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图。
其中,上述偏好度阈值条件可以包括第一偏好度阈值,预设的偏好度阈值条件可以是:异地搜索偏好度小于该第一偏好度阈值则确定所述用户的搜索意图为用户没有异地搜索需求,异地搜索偏好度大于该第一偏好度阈值则确定所述用户的搜索意图为用户有异地搜索需求。为了进行更为精准的划分,上述偏好度阈值条件也可以包括第一偏好度阈值和第二偏好度阈值,预设的偏好度阈值条件可以是:当异地搜索偏好度低于第一偏好度阈值时,可以确定用户只具有本地搜索需求;当异地搜索偏好度大于第一偏好度阈值且小于第二偏好度阈值时,可以确定用户同时具有本地搜索需求和异地搜索需求;当异地搜索偏好度大于第二偏好度阈值时,可以确定用户只具有异地搜索需求。这样,根据用户的所述异地搜索偏好度与预设的偏好度阈值条件,即可确定所述用户的搜索意图。其中,所述异地搜索偏好度确定模型即为逻辑回归模型,可以通过以下训练得到:
以搜索词的特征变量和/或搜索上下文特征变量为自变量,以异地搜索偏好特征为因变量,构建异地搜索偏好度确定模型;
获取根据多个搜索点击历史记录生成的训练样本;
利用所述训练样本训练所述异地搜索偏好度确定模型。
在上述异地搜索偏好度确定模型中,因变量异地搜索偏好特征对应的特征值为异地搜索偏好度,搜索词的特征变量对应的特征值为搜索词的特征信息,搜索上下文特征变量对应的特征值为搜索上下文特征信息。
在本发明提供的一个实施例中,采用逻辑回归模型构建异地搜索偏好度确定模型,具体的,采用以下公式构建异地搜索偏好度确定模型:
remoteprob=sigmoid(w1x1+w2x2+...+wnxn)
式中,remoteprob表示异地搜索偏好特征,xn表示第n个特征变量的特征值,wn表示第n个特征变量对应的权重,每个特征变量对应的权重是根据选取的训练样本训练确定的,函数sigmoid为神经网络的阈值函数,该阈值函数用于将变量映射到0至1之间。
基于逻辑回归模型,可以采用多种识别依据(在上述公式中为特征变量)构建异地搜索偏好度确定模型,然后利用大量的搜索点击历史记录进行训练,确定所述异地搜索偏好度确定模型中各特征变量的权重,训练完成后即可用于用户的异地搜索偏好度的识别,具体的,根据训练时选择的识别依据(即上述搜索词的特征信息和搜索上下文特征信息中的至少一项),输入相应的识别依据(与上述模型中的特征变量一致),所述异地搜索偏好度确定模型即可根据所述识别依据和训练好的权重,计算并输出相应的异地搜索偏好度,将该异地搜索偏好度与预设的偏好度阈值条件进行对比,即可确定用户的搜索意图。
基于上述实施例说明,采用逻辑回归模型识别用户的搜索意图,可以结合更多的识别依据进行识别,可以获得更加准确的识别结果,从而能够更准确的识别用户的搜索意图,进而为用户提供更加符合用户需求的搜索结果,提升用户体验。
在本发明提供的一个实施例中,结合用户查询关键词和商户信息等数据来源,采用统计规则和机器学习算法模型,建立本异地实体词库,挖掘潜在具有异地消费可能性的实体词,如星级酒店、知名景点和知名品牌商户等等。在根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤前,还包括:
将所述搜索词与预设的本异地实体词库进行匹配,根据匹配结果判断所述搜索词是否有异地搜索可能性,若有,则执行根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤。
通过上述步骤,可以对搜索词进行初步的筛选,有异地搜索可能性的情况下再进一步识别用户的搜索意图,如果没有异地搜索可能性,则不必再对用户的搜索意图进行识别而直接进行本地搜索,可以从整体上提高搜索效率。
在已确定用户是否具有异地搜索意图的情形下,可以进一步采用与识别结果相应的搜索策略进行搜索,例如,若用户没有异地搜索意图,则相应的搜索策略为只进行本地搜索;若用户有异地搜索意图,则相应的搜索策略可以是既进行本地搜索也进行异地搜索;其中,若用户异地搜索意图非常强烈(异地搜索偏好度超过预设的第二偏好度阈值,可认为异地搜索意图非常强烈),相应的搜索策略也可以为只进行异地搜索。
在本发明提供的一个实施例中,所述采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,包括:
若所述识别结果为用户同时具有本地和异地搜索意图,则根据所述搜索词进行本地搜索和异地搜索,获得包括多个本地搜索结果和多个异地搜索结果的信息搜索结果。
考虑到所述信息搜索结果中既有本地搜索结果,又有异地搜索结果,如果将本地搜索结果与异地搜索结果混排,那么势必会对用户造成迷惑,同时提高排序算法的复杂度,因此,在本发明提供的一个实施例中,采用将本地搜索结果和异地搜索结果分块展示的技术方案,具体的,在将所述信息搜索结果发送至所述客户端的步骤前,还包括:
将所述多个本地搜索结果归并为本地搜索结果展示区,以及将所述多个异地搜索结果归并为异地搜索结果展示区;
根据用户的异地搜索偏好度和/或本异地搜索结果质量确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序;
根据所述展示顺序,生成包含所述本地搜索结果展示区和所述异地搜索结果展示区的信息搜索结果。
其中,所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序可以根据用户的异地搜索偏好度和/或本异地搜索结果质量确定,其中,本异地搜索结果质量包括本地搜索结果质量和异地搜索结果质量,所述本地搜索结果质量和异地搜索结果质量均可采用对应的搜索结果数量、历史点击率、预估点击率等至少一项进行表征。例如,若用户的异地搜索偏好度大于第三偏好度阈值且小于等于第二偏好度阈值,那么可以将异地搜索结果展示区排在本地搜索结果展示区之前,使整个信息搜索结果的展示界面更加贴合用户需求;类似的,若信息搜索结果中,本地搜索结果数量多且历史点击率也较高,而异地搜索结果数量少且历史点击率较低,例如,若用户的异地搜索偏好度大于第一偏好度阈值且小于等于第三偏好度阈值,那么,可以将本地搜索结果展示区排在异地搜索结果展示区之前;当然,也可以结合用户的异地搜索偏好度和本异地搜索结果质量,采用加权计算法确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序,这样得到的信息搜索结果展示界面会更加贴合用户需求,进一步提升用户体验。
考虑到搜索结果中,本地搜索结果的数量和/或异地搜索结果的数量可能会比较多,如果全部同时展示给用户的话,可能给用户的阅读带来不便、造成用户的困扰,因此,在本发明提供的一个实施例中,将所述本地搜索结果展示区设置为可折叠展示区,所述可折叠展示区在折叠状态下只显示部分本地搜索结果,在伸展状态下可以显示更多的本地搜索结果,所述可折叠展示区上设有可控制所述可折叠展示区伸展或折叠的控件,当用户点击所述控件时,可以切换所述可折叠展示区的伸缩状态。
相应的,还可以根据预设的规则确定所述本地搜索结果展示区中本地搜索结果的排列顺序以及折叠状态下展示的本地搜索结果的数量,例如,在本发明提供的一个实施例中,在将所述多个本地搜索结果归并为本地搜索结果展示区后,还包括:
根据各所述本地搜索结果的预估点击率,确定所述本地搜索结果展示区中各所述本地搜索结果的顺序,以及确定所述本地搜索结果展示区在折叠状态下展示的本地搜索结果的数量。
具体的,可以计算各本地搜索结果的预估点击率,然后根据预估点击率对本地搜索结果进行排序,可以选择指定数量的多个排序靠前的本地搜索结果作为折叠状态下展示的信息。
其中,所述预估点击率可以采用点击率预估算法计算而得,点击率(CTR,ClickThrough Rate),通过选择合适的预测模型和影响用户点击的特征因素,结合历史点击日志数据作为训练集合,训练出模型的参数,以应用于一个新项目的点击率预估,从而排序位置。
在本发明提供的另一个实施例中,还可以将所述异地搜索结果展示区设置为可折叠展示区,所述可折叠展示区在折叠状态下只显示部分异地搜索结果,在伸展状态下可以显示更多的异地搜索结果,所述可折叠展示区上设有可控制所述可折叠展示区伸展或折叠的控件,当用户点击所述控件时,可以切换所述可折叠展示区的伸缩状态。
相应的,还可以根据预设的规则确定所述异地搜索结果展示区中异地搜索结果的排列顺序以及折叠状态下展示的异地搜索结果的数量,例如,在本发明提供的一个实施例中,在将所述多个异地搜索结果归并为异地搜索结果展示区后,还包括:
根据各所述异地搜索结果的预估点击率,确定所述异地搜索结果展示区中各所述异地搜索结果的顺序,以及确定所述异地搜索结果展示区在折叠状态下展示的异地搜索结果的数量。
具体的,可以计算各异地搜索结果的预估点击率,然后根据预估点击率对异地搜索结果进行排序,可以选择指定数量的多个排序靠前的异地搜索结果作为折叠状态下展示的信息。
考虑到,信息搜索结果的展示效果越贴合用户需求,用户体验越好,因此,在具体实施时,还可以根据用户异地搜索偏好度和搜索上下文特征信息以及本异地搜索结果质量,自适应决定本异地结果摆放顺序和展示个数,例如在本发明提供的一个具体实施例中,假设根据用户的异地搜索偏好度和本异地搜索结果质量确定优先展示本地搜索结果展示区时,那么本地搜索结果展示区在折叠状态下展示多少个结果可以通过以下方法进行估算:
设定三部分约束条件:
第一部分是:本地搜索结果各个位置的预估点击率;
第二部分是:异地搜索结果第一个位置(预估点击率最高的)的预估点击率;
第三部分是:α平滑参数。
基于上述约束条件,优先展示本地搜索结果展示区时,可以将本地搜索结果中最靠后且预估点击率大于异地搜索结果中第一个结果预估点击率α倍的位置数作为本地搜索结果展示个数,即待展示的本地搜索结果的数量。
同样的,优先展示异地搜索结果展示区时,可以将异地搜索结果中最靠后且预估点击率大于本搜索结果中第一个结果预估点击率α倍的位置数作为异地搜索结果展示个数,即待展示的异地搜索结果的数量。
通过上述实施方式,可以灵活确定折叠状态下展示区中展示的搜索结果的数量,使其更加符合用户需求,以进一步优化信息搜索结果页面展示效果以及提升用户体验。
具体的,在向客户端发送信息搜索结果之前,先对多个本地搜索结果和异地搜索结果进行排序并确定分别展示的数量,以便客户端接收到信息搜索结果后按序展示多个本地搜索结果和异地搜索结果,信息搜索结果的排序顺序(即客户端对信息搜索结果的展示顺序)为:
(1)在识别出用户存在异地搜索意图且优先展示本地搜索结果时,按照各本地搜索结果的预估点击率由大到小的顺序优先展示第一预设数量的本地搜索结果,再按照各异地搜索结果的预估点击率由大到小的顺序展示第二预设数量的异地搜索结果,其中,展示的最后一个本地搜索结果的预估点击率与展示的第一个异地搜索结果的预估点击率α倍之间的差值大于0,考虑到搜索过程中主要提供本地搜索服务,可以预先设定第二预设数量对应的展示数量阈值,从而控制最多可展示的异地搜索结果的数量。
(2)在识别出用户存在异地搜索意图且优先展示异地搜索结果时,按照各异地搜索结果的预估点击率由大到小的顺序优先展示第三预设数量的异地搜索结果,再按照各本地搜索结果的预估点击率由大到小的顺序展示第四预设数量的本地搜索结果,其中,展示的最后一个异地搜索结果的预估点击率与展示的第一个本地搜索结果的预估点击率α倍之间的差值大于0,考虑到搜索过程中主要提供本地搜索服务,可以预先设定第三预设数量对应的展示数量阈值,从而控制最多可展示的异地搜索结果的数量。
考虑到基于上述发明实施例获得的信息搜索结果未必能够百分百符合用户的实际需求,因此,在本发明提供的一个实施例中,在将信息搜索结果发送至客户端后,还可以获取用户对所述信息搜索结果的点击操作日志,然后根据所述点击操作日志对所述异地搜索偏好度确定模型进行迭代优化。其中所述迭代优化可以是根据所述点击操作日志提取搜索上下文特征信息,然后将其添加入所述异地搜索偏好度确定模型的训练样本中,利用新的训练样本对所述异地搜索偏好度确定模型进行迭代训练,当根据大量的点击操作日志进行迭代优化后,会形成累积效应,从而优化所述异地搜索偏好度确定模型在后续使用过程中输出的异地搜索偏好度的准确性。通过不断优化,可以不断提高本发明第一实施例对用户异地搜索意图识别的准确性,以及使信息搜索结果的展示形式(如优化后可能导致本地结果展示区和异地结果展示区的展示顺序发生变化等)更加符合用户需求。
对应于图1中的方法,如图2所示,本发明第一实施例还提供了一种信息搜索装置,该装置设置于服务器中,该装置包括:
搜索词接收模块101,用于接收用户通过客户端发送的搜索词;
搜索意图识别模块102,用于根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
策略搜索模块103,用于采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果发送模块104,用于将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
在本发明提供的一个实施例中,所述搜索意图识别模块102,具体用于:
获取所述搜索词的特征信息和/或搜索上下文特征信息;
根据所述搜索词的特征信息和/或所述搜索上下文特征信息及预先训练好的异地搜索偏好度确定模型,确定所述用户的异地搜索偏好度;
根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图。
在本发明提供的一个实施例中,所述异地搜索偏好度确定模型是通过如下方式训练得到的:
以搜索词的特征变量和/或搜索上下文特征变量为自变量,以异地搜索偏好特征为因变量,构建异地搜索偏好度确定模型;
获取根据多个搜索点击历史记录生成的训练样本;
利用所述训练样本训练所述异地搜索偏好度确定模型。
在本发明提供的一个实施例中,所述异地搜索偏好度确定模型采用逻辑回归模型构建。
在本发明提供的一个实施例中,所述异地搜索偏好度确定模型具体采用以下公式构建:
remoteprob=sigmoid(w1x1+w2x2+...+wnxn)
式中,remoteprob表示异地搜索偏好特征,xn表示第n个特征变量的特征值,wn表示第n个特征变量对应的权重,每个特征变量对应的权重是根据选取的训练样本训练确定的,函数sigmoid为神经网络的阈值函数,该阈值函数用于将变量映射到0至1之间。
在本发明提供的一个实施例中,所述信息搜索装置还包括:
实体词匹配模块,用于将所述搜索词与预设的本异地实体词库进行匹配,根据匹配结果判断所述搜索词是否有异地搜索可能性,若有,则执行根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤。
在本发明提供的一个实施例中,所述策略搜索模块103具体用于:
若所述识别结果为用户同时具有本地和异地搜索意图,则根据所述搜索词进行本地搜索和异地搜索,获得包括多个本地搜索结果和多个异地搜索结果的信息搜索结果。
在本发明提供的一个实施例中,所述信息搜索装置,还包括:
结果归并模块,用于将所述多个本地搜索结果归并为本地搜索结果展示区,以及将所述多个异地搜索结果归并为异地搜索结果展示区;
展示顺序确定模块,用于根据用户的异地搜索偏好度和/或本异地搜索结果质量确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序;
搜索结果生成模块,用于根据所述展示顺序,生成包含所述本地搜索结果展示区和所述异地搜索结果展示区的信息搜索结果。
在本发明提供的一个实施例中,所述本地搜索结果展示区为可折叠展示区,所述信息搜索装置,还包括:
本地顺序确定模块,用于根据各所述本地搜索结果的预估点击率,确定所述本地搜索结果展示区中各所述本地搜索结果的顺序,以及确定所述本地搜索结果展示区在折叠状态下展示的本地搜索结果的数量。
在本发明提供的一个实施例中,所述异地搜索结果展示区为可折叠展示区,所述信息搜索装置,还包括:
异地顺序确定模块,用于根据各所述异地搜索结果的预估点击率,确定所述异地搜索结果展示区中各所述异地搜索结果的顺序,以及确定所述异地搜索结果展示区在折叠状态下展示的异地搜索结果的数量。
在本发明提供的一个实施例中,所述信息搜索装置,还包括:
操作日志获取模块,用于获取用户对所述信息搜索结果的点击操作日志;
迭代优化模块,用于根据所述点击操作日志对所述异地搜索偏好度确定模型进行迭代优化。
上述信息搜索装置与上述信息搜索方法基于相同的发明构思,具有相同的有益效果,此处不再赘述。
对应于图1中的方法,如图3所示,本发明第一实施例还提供了一种计算机设备,该设备包括存储器1000和处理器2000,存储器1000上存储有可在处理器2000上运行的计算机程序,处理器2000运行该计算机程序时,执行上述的信息搜索方法。
具体地,存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述的信息搜索方法,从而解决相关技术中进行异地搜索时操作繁琐、效率较低的问题,进而使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
对应于图1中的方法,本发明第一实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时,执行上述的信息搜索方法。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述的信息搜索方法,从而解决相关技术中进行异地搜索时操作繁琐、效率较低的问题,进而使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
实施例二:
如图4所示,本发明第二实施例提供了一种信息搜索方法,该方法的执行主体为客户端,该方法是与上述第一实施例提供的用于服务器的信息搜索方法配合实施的,相关之处请参见上述第一实施例的说明,此处不再赘述,本发明第二实施例仅作示例性说明。本发明第二实施例提供的信息搜索方法包括步骤S201-S204,具体如下:
步骤S201:监听用户输入的搜索词;
步骤S202:将所述搜索词发送至服务器;
步骤S203:接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
步骤S204:展示所述信息搜索结果。
在本发明提供的一个实施例中,所述信息搜索结果包括本地搜索结果展示区、异地搜索结果展示区及展示顺序,其中,所述本地搜索结果展示区中包括多条本地搜索结果,所述异地搜索结果展示区中包括多条异地搜索结果;
所述展示所述信息搜索结果,包括:
按照所述展示顺序同屏展示所述本地搜索结果展示区和所述异地搜索结果展示区。
本发明第二实施例提供的上述信息搜索方法,是与上述第一实施例提供的信息搜索方法配合实施的,属于同一个发明构思,与上述第一实施例配合实施,可以得到更符合用户意图的搜索结果,使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
对应于图4中的方法,如图5所示,本发明第二实施例还提供了一种信息搜索装置,该装置设置于客户端中,该装置包括:
输入监听模块201,用于监听用户输入的搜索词;
搜索词发送模块202,用于将所述搜索词发送至服务器;
搜索结果接收模块203,用于接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果展示模块204,用于展示所述信息搜索结果。
在本发明提供的一个实施例中,所述信息搜索结果包括本地搜索结果展示区、异地搜索结果展示区及展示顺序,其中,所述本地搜索结果展示区中包括多条本地搜索结果,所述异地搜索结果展示区中包括多条异地搜索结果;
所述搜索结果展示模块204,具体用于:
按照所述展示顺序同屏展示所述本地搜索结果展示区和所述异地搜索结果展示区。
本发明第二实施例提供的上述信息搜索装置与本发明第二实施例提供的上述信息搜索方法基于相同的发明构思,具有相同的有益效果,此处不再赘述。
对应于图4中的方法,如图6所示,本发明第二实施例还提供了一种计算机设备,该设备包括存储器3000和处理器4000,存储器3000上存储有可在处理器4000上运行的计算机程序,处理器4000运行该计算机程序时,执行上述的信息搜索方法。
具体地,存储器3000和处理器4000能够为通用的存储器和处理器,这里不做具体限定,当处理器4000运行存储器3000存储的计算机程序时,能够执行上述的信息搜索方法,从而解决相关技术中进行异地搜索时操作繁琐、效率较低的问题,进而使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
对应于图4中的方法,本发明第二实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时,执行上述的信息搜索方法。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述的信息搜索方法,从而解决相关技术中进行异地搜索时操作繁琐、效率较低的问题,进而使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
实施例三:
如图7所示,本发明第三实施例提供了一种信息搜索***,该***包括:服务器1和客户端2,该服务器1包括实施例一中所述的信息搜索装置,上述客户端2包括实施例二中所述的信息搜索装置。
在本发明实施例提供的信息搜索***基于上述第一实施例提供的信息搜索装置和上述第二实施例提供的信息搜索装置实现,可以解决相关技术中进行异地搜索时操作繁琐、效率较低的问题,进而使用户在有异地搜索意图时,不需要切换当前定位城市即可得到异地搜索结果,可以有效提高搜索效率及提升用户体验。
本发明实施例所提供的信息搜索装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的***、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (20)

1.一种信息搜索方法,用于服务器,其特征在于,所述方法包括:
接收用户通过客户端发送的搜索词;
根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,包括:
获取所述搜索词的特征信息和/或搜索上下文特征信息;
根据所述搜索词的特征信息和/或所述搜索上下文特征信息及预先训练好的异地搜索偏好度确定模型,确定所述用户的异地搜索偏好度;
根据所述异地搜索偏好度与预设的偏好度阈值条件,确定所述用户的搜索意图。
3.根据权利要求2所述的方法,其特征在于,所述异地搜索偏好度确定模型是通过如下方式训练得到的:
以搜索词的特征变量和/或搜索上下文特征变量为自变量,以异地搜索偏好特征为因变量,构建异地搜索偏好度确定模型;
获取根据多个搜索点击历史记录生成的训练样本;
利用所述训练样本训练所述异地搜索偏好度确定模型。
4.根据权利要求3所述的方法,其特征在于,所述构建异地搜索偏好度确定模型,包括:
采用逻辑回归模型构建异地搜索偏好度确定模型。
5.根据权利要求4所述的方法,其特征在于,所述采用逻辑回归模型构建异地搜索偏好度确定模型,具体包括:
采用以下公式构建异地搜索偏好度确定模型:
remoteprob=sigmoid(w1x1+w2x2+...+wnxn)
式中,remoteprob表示异地搜索偏好特征,xn表示第n个特征变量的特征值,wn表示第n个特征变量对应的权重,每个特征变量对应的权重是根据选取的训练样本训练确定的,函数sigmoid为神经网络的阈值函数,该阈值函数用于将变量映射到0至1之间。
6.根据权利要求1所述的方法,其特征在于,在根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤前,还包括:
将所述搜索词与预设的本异地实体词库进行匹配,根据匹配结果判断所述搜索词是否有异地搜索可能性,若有,则执行根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图的步骤。
7.根据权利要求1所述的方法,其特征在于,所述采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,包括:
若所述识别结果为用户同时具有本地和异地搜索意图,则根据所述搜索词进行本地搜索和异地搜索,获得包括多个本地搜索结果和多个异地搜索结果的信息搜索结果。
8.根据权利要求7所述的方法,其特征在于,在将所述信息搜索结果发送至所述客户端的步骤前,还包括:
将所述多个本地搜索结果归并为本地搜索结果展示区,以及将所述多个异地搜索结果归并为异地搜索结果展示区;
根据用户的异地搜索偏好度和/或本异地搜索结果质量确定所述本地搜索结果展示区和所述异地搜索结果展示区的展示顺序;
根据所述展示顺序,生成包含所述本地搜索结果展示区和所述异地搜索结果展示区的信息搜索结果。
9.根据权利要求8所述的方法,其特征在于,所述本地搜索结果展示区为可折叠展示区,在将所述多个本地搜索结果归并为本地搜索结果展示区后,还包括:
根据各所述本地搜索结果的预估点击率,确定所述本地搜索结果展示区中各所述本地搜索结果的顺序,以及确定所述本地搜索结果展示区在折叠状态下展示的本地搜索结果的数量。
10.根据权利要求8所述的方法,其特征在于,所述异地搜索结果展示区为可折叠展示区,在将所述多个异地搜索结果归并为异地搜索结果展示区后,还包括:
根据各所述异地搜索结果的预估点击率,确定所述异地搜索结果展示区中各所述异地搜索结果的顺序,以及确定所述异地搜索结果展示区在折叠状态下展示的异地搜索结果的数量。
11.根据权利要求2所述的方法,其特征在于,还包括:
获取用户对所述信息搜索结果的点击操作日志;
根据所述点击操作日志对所述异地搜索偏好度确定模型进行迭代优化。
12.一种信息搜索方法,用于客户端,其特征在于,所述方法包括:
监听用户输入的搜索词;
将所述搜索词发送至服务器;
接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
展示所述信息搜索结果。
13.根据权利要求12所述的方法,其特征在于,所述信息搜索结果包括本地搜索结果展示区、异地搜索结果展示区及展示顺序,其中,所述本地搜索结果展示区中包括多条本地搜索结果,所述异地搜索结果展示区中包括多条异地搜索结果;
所述展示所述信息搜索结果,包括:
按照所述展示顺序同屏展示所述本地搜索结果展示区和所述异地搜索结果展示区。
14.一种信息搜索装置,用于服务器,其特征在于,包括:
搜索词接收模块,用于接收用户通过客户端发送的搜索词;
搜索意图识别模块,用于根据所述搜索词的特征信息和/或搜索上下文特征信息,识别所述用户的搜索意图,并生成相应的识别结果;
策略搜索模块,用于采用与所述识别结果相应的搜索策略并根据所述搜索词进行搜索,获取与该搜索词相关的信息搜索结果,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果发送模块,用于将所述信息搜索结果发送至所述客户端,以使所述客户端展示所述信息搜索结果。
15.一种信息搜索装置,用于客户端,其特征在于,包括:
输入监听模块,用于监听用户输入的搜索词;
搜索词发送模块,用于将所述搜索词发送至服务器;
搜索结果接收模块,用于接收所述服务器反馈的在根据所述搜索词的特征信息和/或搜索上下文特征信息识别所述用户的搜索意图后采用与识别结果相应的搜索策略搜索获得的信息搜索结果;其中,所述信息搜索结果包括:本地搜索结果和/或异地搜索结果;
搜索结果展示模块,用于展示所述信息搜索结果。
16.一种信息搜索***,其特征在于,所述***包括:服务器和客户端,所述服务器包括如权利要求14所述的装置,所述客户端包括如权利要求15所述的装置。
17.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至11任一项所述的方法的步骤。
18.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求12或13所述的方法的步骤。
19.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1至11任一项所述的方法的步骤。
20.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求12或13所述的方法的步骤。
CN201710596879.4A 2017-07-20 2017-07-20 一种信息搜索方法、装置及*** Pending CN107315841A (zh)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CN201710596879.4A CN107315841A (zh) 2017-07-20 2017-07-20 一种信息搜索方法、装置及***
KR1020197035369A KR102301899B1 (ko) 2017-07-20 2017-12-29 정보 검색 방법, 장치 및 시스템
EP17918687.9A EP3617952A4 (en) 2017-07-20 2017-12-29 INFORMATION SEARCHING METHOD, APPARATUS AND SYSTEM
JP2019565394A JP6967612B2 (ja) 2017-07-20 2017-12-29 情報検索方法、装置及びシステム
CA3066832A CA3066832C (en) 2017-07-20 2017-12-29 Information search method, apparatus and system
PCT/CN2017/119765 WO2019015262A1 (zh) 2017-07-20 2017-12-29 一种信息搜索方法、装置及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710596879.4A CN107315841A (zh) 2017-07-20 2017-07-20 一种信息搜索方法、装置及***

Publications (1)

Publication Number Publication Date
CN107315841A true CN107315841A (zh) 2017-11-03

Family

ID=60179210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710596879.4A Pending CN107315841A (zh) 2017-07-20 2017-07-20 一种信息搜索方法、装置及***

Country Status (6)

Country Link
EP (1) EP3617952A4 (zh)
JP (1) JP6967612B2 (zh)
KR (1) KR102301899B1 (zh)
CN (1) CN107315841A (zh)
CA (1) CA3066832C (zh)
WO (1) WO2019015262A1 (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832468A (zh) * 2017-11-29 2018-03-23 百度在线网络技术(北京)有限公司 需求识别方法和装置
CN107992602A (zh) * 2017-12-14 2018-05-04 北京百度网讯科技有限公司 搜索结果展示方法和装置
CN108346166A (zh) * 2018-02-02 2018-07-31 成都科木信息技术有限公司 一种旅游虚拟现实***
CN108509499A (zh) * 2018-02-27 2018-09-07 北京三快在线科技有限公司 一种搜索方法及装置,电子设备
WO2019015262A1 (zh) * 2017-07-20 2019-01-24 北京三快在线科技有限公司 一种信息搜索方法、装置及***
CN110209765A (zh) * 2019-05-23 2019-09-06 武汉绿色网络信息服务有限责任公司 一种按语义搜索关键词的方法和装置
CN110543592A (zh) * 2019-08-27 2019-12-06 北京百度网讯科技有限公司 信息搜索方法、装置以及计算机设备
CN111782947A (zh) * 2020-06-29 2020-10-16 北京达佳互联信息技术有限公司 一种搜索内容展示方法、装置、电子设备及存储介质
CN111797312A (zh) * 2020-06-22 2020-10-20 北京三快在线科技有限公司 模型训练的方法及装置
CN113282830A (zh) * 2021-06-09 2021-08-20 维沃移动通信有限公司 展示方法和展示装置
CN113297456A (zh) * 2021-05-20 2021-08-24 北京三快在线科技有限公司 搜索方法、装置、电子设备及存储介质
CN113449050A (zh) * 2020-03-24 2021-09-28 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN113486170A (zh) * 2021-08-02 2021-10-08 国泰新点软件股份有限公司 基于人机交互的自然语言处理方法、装置、设备及介质
US11397772B2 (en) 2017-07-20 2022-07-26 Beijing Sankuai Online Technology Co., Ltd. Information search method, apparatus, and system
WO2022262621A1 (zh) * 2021-06-17 2022-12-22 华为技术有限公司 信息点搜索的方法和装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109962983B (zh) * 2019-03-29 2021-11-23 北京搜狗科技发展有限公司 一种点击率统计方法及装置
CN111080339B (zh) * 2019-11-18 2024-01-30 口口相传(北京)网络技术有限公司 基于场景的类目偏好数据生成方法及装置
CN111078760B (zh) * 2019-12-20 2023-08-08 贵阳货车帮科技有限公司 货源搜索方法、装置、设备及存储介质
JP7420851B2 (ja) 2022-03-18 2024-01-23 Lineヤフー株式会社 情報処理装置、情報処理方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264654A1 (en) * 2007-01-17 2011-10-27 Google Inc. Presentation of Local Results
CN104077324A (zh) * 2013-03-29 2014-10-01 百度在线网络技术(北京)有限公司 一种地图搜索方法及***
CN105264528A (zh) * 2014-03-26 2016-01-20 微软技术许可有限责任公司 集成搜索环境中的客户端意图
CN106919641A (zh) * 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8359300B1 (en) * 2007-04-03 2013-01-22 Google Inc. System and method for displaying both localized search results and internet search results
JP5450017B2 (ja) * 2009-12-08 2014-03-26 株式会社Nttドコモ 情報処理装置、情報処理システムおよび情報処理方法
DE112013006463B4 (de) * 2013-01-21 2021-10-21 Mitsubishi Electric Corporation Zielvorhersagevorrichtung
CN118171657A (zh) * 2014-09-28 2024-06-11 北京三星通信技术研究有限公司 基于关注点信息提供服务的方法和装置
CN106202260B (zh) * 2016-06-29 2021-07-27 百度在线网络技术(北京)有限公司 搜索方法、装置和搜索引擎
CN107315841A (zh) * 2017-07-20 2017-11-03 北京三快在线科技有限公司 一种信息搜索方法、装置及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110264654A1 (en) * 2007-01-17 2011-10-27 Google Inc. Presentation of Local Results
CN104077324A (zh) * 2013-03-29 2014-10-01 百度在线网络技术(北京)有限公司 一种地图搜索方法及***
CN105264528A (zh) * 2014-03-26 2016-01-20 微软技术许可有限责任公司 集成搜索环境中的客户端意图
CN106919641A (zh) * 2017-01-12 2017-07-04 北京三快在线科技有限公司 一种兴趣点搜索方法及装置、电子设备

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019015262A1 (zh) * 2017-07-20 2019-01-24 北京三快在线科技有限公司 一种信息搜索方法、装置及***
US11397772B2 (en) 2017-07-20 2022-07-26 Beijing Sankuai Online Technology Co., Ltd. Information search method, apparatus, and system
CN107832468A (zh) * 2017-11-29 2018-03-23 百度在线网络技术(北京)有限公司 需求识别方法和装置
CN107992602A (zh) * 2017-12-14 2018-05-04 北京百度网讯科技有限公司 搜索结果展示方法和装置
CN108346166A (zh) * 2018-02-02 2018-07-31 成都科木信息技术有限公司 一种旅游虚拟现实***
CN108509499A (zh) * 2018-02-27 2018-09-07 北京三快在线科技有限公司 一种搜索方法及装置,电子设备
CN110209765A (zh) * 2019-05-23 2019-09-06 武汉绿色网络信息服务有限责任公司 一种按语义搜索关键词的方法和装置
CN110543592A (zh) * 2019-08-27 2019-12-06 北京百度网讯科技有限公司 信息搜索方法、装置以及计算机设备
CN110543592B (zh) * 2019-08-27 2022-04-01 北京百度网讯科技有限公司 信息搜索方法、装置以及计算机设备
CN113449050A (zh) * 2020-03-24 2021-09-28 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN113449050B (zh) * 2020-03-24 2024-04-16 北京四维图新科技股份有限公司 位置搜索方法、装置及存储介质
CN111797312A (zh) * 2020-06-22 2020-10-20 北京三快在线科技有限公司 模型训练的方法及装置
CN111797312B (zh) * 2020-06-22 2024-03-01 北京三快在线科技有限公司 模型训练的方法及装置
CN111782947A (zh) * 2020-06-29 2020-10-16 北京达佳互联信息技术有限公司 一种搜索内容展示方法、装置、电子设备及存储介质
CN113297456A (zh) * 2021-05-20 2021-08-24 北京三快在线科技有限公司 搜索方法、装置、电子设备及存储介质
CN113282830A (zh) * 2021-06-09 2021-08-20 维沃移动通信有限公司 展示方法和展示装置
WO2022262621A1 (zh) * 2021-06-17 2022-12-22 华为技术有限公司 信息点搜索的方法和装置
CN113486170A (zh) * 2021-08-02 2021-10-08 国泰新点软件股份有限公司 基于人机交互的自然语言处理方法、装置、设备及介质
CN113486170B (zh) * 2021-08-02 2023-12-15 国泰新点软件股份有限公司 基于人机交互的自然语言处理方法、装置、设备及介质

Also Published As

Publication number Publication date
CA3066832A1 (en) 2019-01-24
JP6967612B2 (ja) 2021-11-17
JP2020523663A (ja) 2020-08-06
KR20200003106A (ko) 2020-01-08
WO2019015262A1 (zh) 2019-01-24
KR102301899B1 (ko) 2021-09-14
EP3617952A1 (en) 2020-03-04
CA3066832C (en) 2024-01-02
EP3617952A4 (en) 2020-05-06

Similar Documents

Publication Publication Date Title
CN107315841A (zh) 一种信息搜索方法、装置及***
US11397772B2 (en) Information search method, apparatus, and system
CN104992347B (zh) 一种视频匹配广告的方法及装置
CN104951428B (zh) 用户意图识别方法及装置
CN109189904A (zh) 个性化搜索方法及***
CN105868847A (zh) 一种购物行为的预测方法及装置
CN107507016A (zh) 一种消息推送方法和***
CN106776869A (zh) 基于神经网络的搜索优化方法、装置以及搜索引擎
CN103631801B (zh) 一种提供商品信息的方法及装置
CN108446351A (zh) Ota平台的基于用户偏好的酒店筛选方法及***
CN108664515A (zh) 一种搜索方法及装置,电子设备
CN107203558A (zh) 对象推荐方法和装置、推荐信息处理方法和装置
CN113724039A (zh) Ota网站的酒店推荐方法、***、设备及可读存储介质
CN115203311A (zh) 一种基于数据大脑的行业数据分析挖掘方法及***
CN103186604A (zh) 用于确定用户对搜索结果满意度的方法、装置和设备
CN111523315B (zh) 数据处理方法、文本识别方法、装置及计算机设备
CN108717436A (zh) 一种基于显著性检测的商品目标快速检索方法
CN111814050A (zh) 旅游场景强化学习模拟环境构建方法、***、设备和介质
CN116662509A (zh) 大规模语言模型的开放域问答实现方法、装置及设备
CN111445280A (zh) 模型生成方法、餐馆排序方法、***、设备和介质
CN110503306A (zh) 一种满意度指标可视化处理方法及装置
CN115481325A (zh) 基于用户全局兴趣迁移感知的个性化新闻推荐方法及***
US11776011B2 (en) Methods and apparatus for improving the selection of advertising
CN109447682A (zh) 确定店铺的营业状态的方法、***、电子设备及存储介质
Tudor et al. Data mining algorithms and techniques research in CRM systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20171103

RJ01 Rejection of invention patent application after publication