CN102810117A - 一种用于提供搜索结果的方法与设备 - Google Patents

一种用于提供搜索结果的方法与设备 Download PDF

Info

Publication number
CN102810117A
CN102810117A CN201210226803XA CN201210226803A CN102810117A CN 102810117 A CN102810117 A CN 102810117A CN 201210226803X A CN201210226803X A CN 201210226803XA CN 201210226803 A CN201210226803 A CN 201210226803A CN 102810117 A CN102810117 A CN 102810117A
Authority
CN
China
Prior art keywords
search results
result
search
confirm
order models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210226803XA
Other languages
English (en)
Other versions
CN102810117B (zh
Inventor
于佃海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210226803.XA priority Critical patent/CN102810117B/zh
Publication of CN102810117A publication Critical patent/CN102810117A/zh
Application granted granted Critical
Publication of CN102810117B publication Critical patent/CN102810117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种用于提供搜索结果的方法与设备。计算机设备获得与用户输入的查询序列相对应的初始搜索结果;利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;将所述最优搜索结果提供给所述用户。与现有技术相比,本发明通过多个排序模型,对搜索结果进行分级筛选,实现了将最优搜索结果提供给用户,从而兼顾搜索结果的精度和效率,达到搜索效率和效果的最优化。进一步地,利用机器学习的方法确定排序模型,并利用子模型通过机器学习来生成上层模型,从而优化了排序模型的设置,保证了***排序模型的实时性、可理解性和可控性。

Description

一种用于提供搜索结果的方法与设备
技术领域
本发明涉及计算机领域,尤其涉及一种用于提供搜索结果的技术。
背景技术
当前,对于搜索结果的提供大多采用一次排序的方式,即根据用户的查询请求,通过对后台数据库的查询,利用预置的排序模型,将对应用户查询请求的搜索结果提供给用户。这种方式存在着一定的问题,即一次排序不容易达到效率和效果上的最优化。从效率优先角度,可以利用精度较低的查询方式进行,但是无法保证查询结果的高准确度;从效果优先角度,可以利用精度较高的查询方式进行,但是同时无法保证查询效率。
发明内容
本发明的目的是提供一种用于提供搜索结果的方法与设备。
根据本发明的一个方面,提供了一种由计算机实现的用于提供搜索结果的方法,该方法包括以下步骤:
a获得与用户输入的查询序列相对应的初始搜索结果;
b利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;
c利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;
d将所述最优搜索结果提供给所述用户。
根据本发明的另一方面,还提供了一种用于提供搜索结果的结果提供设备,该设备包括:
结果获取装置,用于获得与用户输入的查询序列相对应的初始搜索结果;
第一筛选装置,用于利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;
第二筛选装置,用于利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;
结果提供装置,用于将所述最优搜索结果提供给所述用户。
根据本发明的再一方面,还提供了一种搜索引擎,包括如上述的用于提供搜索结果的结果提供设备。
根据本发明的再一方面,还提供了一种搜索引擎插件,包括如上述的用于提供搜索结果的结果提供设备。
根据本发明的再一方面,还提供了一种浏览器,包括如上述的用于提供搜索结果的结果提供设备。
根据本发明的再一方面,还提供了一种浏览器插件,包括如上述的用于提供搜索结果的结果提供设备。
与现有技术相比,本发明通过多个排序模型,对搜索结果进行分级筛选,实现了将最优搜索结果提供给用户,从而兼顾搜索结果的精度和效率,达到搜索效率和效果的最优化。进一步地,利用机器学习的方法确定排序模型,并利用子模型通过机器学习来生成上层模型,从而优化了排序模型的设置,保证了***排序模型的实时性、可理解性和可控性。此外,当前对于排序模型的特征选择,大多是将各种角度的所有底层特征放在一起,这样带来的问题在于削弱了实时性、可理解性和可控性,不利于问题的定位,也不利于以前规则***积累的复用;鉴于此,本发明还对于不同排序模型使用不同的特征,在保证搜索效率和效果的最优化的同时,优化排序模型的特征选择,进一步改善了搜索效率与效果的优化。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个方面的一种用于提供搜索结果的结果提供设备示意图;
图2示出根据本发明一个优选实施例的一种用于提供搜索结果的结果提供设备示意图;
图3示出根据本发明另一个方面的一种由结果提供设备实现的用于提供搜索结果的方法流程图;
图4示出根据本发明一个优选实施例的一种由结果提供设备实现的用于提供搜索结果的方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个方面的一种用于提供搜索结果的结果提供设备示意图;其中,该结果提供设备包括结果获取装置11、第一筛选装置12、第二筛选装置13、结果提供装置14。结果获取装置11获得与用户输入的查询序列相对应的初始搜索结果;第一筛选装置12利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;第二筛选装置13利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;结果提供装置14将所述最优搜索结果提供给所述用户。其中,结果提供设备不仅可以独立工作,还可以集成于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(AdHoc网络)等。本领域技术人员应能理解,其他的结果提供设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,结果获取装置11获得与用户输入的查询序列相对应的初始搜索结果。具体地,结果获取装置11例如通过页面技术,如JSP、ASP、PHP等页面技术,或者,通过调用用户设备或其他能够提供所述查询序列的设备所提供的应用程序接口(API),或http、https等其他约定的通信方式,与用户进行交互,获取用户输入的查询序列,并通过诸如对用户输入的查询序列进行分词,并在查询数据库中针对分词后的查询序列进行搜索的方式,获得与用户输入的查询序列相对应的初始搜索结果,其中,用户可通过诸如键盘、触摸屏、语音输入装置与结果获取装置11进行交互,输入其希望查询的查询序列,从而发起搜索;或者,结果获取装置11通过基于各种通信协议(Communications Protocol),在此“通信协议”指计算机通信的传送协议,如:TCP/IP、UDP、FTP、ICMP、NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如:面向对象编程里面对象之间的通信;操作***内不同程序或计算机不同模块之间的消息传送协议,与其他能够提供所述初始搜索结果的设备,如搜索引擎,进行交互以获取与用户输入的查询序列相对应的初始搜索结果。优选地,结果获取装置11还可以在所获取的与用户输入的查询序列相对应的搜索结果中截取一定数量的搜索结果,以作为所述初始搜索结果。例如,用户通过页面技术向结果获取装置11提出了“最好吃川菜”的查询序列,结果获取装置11对“最好吃川菜”进行分词,在数据库中分别对“最好吃”和“川菜”进行检索,获得了1000条初始搜索结果。本领域技术人员应理解上述获取初始搜索结果的方式以及几种通信传输协议仅为举例,其他现有的或今后可能出现的获取初始搜索结果的方式或通信传输协议如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
第一筛选装置12利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果。具体地,第一筛选装置12对于结果获取装置11所提供的所述初始搜索结果,利用所述第一排序模型,计算每个初始搜索结果的优先级或排序信息;再根据这些优先级或排序信息,对所述初始搜索结果进行筛选,以获得所述优选搜索结果,如将优先级或排序信息满足一定阈值要求的初始搜索结果作为优选搜索结果,或者将这些初始搜索结果按其优先级或排序信息降序排列,并将排在前N个初始搜索结果作为优选搜索结果。其中,所述第一排序模型中包括但不限于排序算法、排序特征向量等。
在此,利用第一排序模型计算初始搜索结果的优先级或排序信息的方式包括但不限于:利用第一排序模型,例如包含一个或多个特征分量及其权重的特征向量,确定初始搜索结果所对应的各特征分量的赋值,从而得到该初始搜索结果所对应的特征向量,即该特征向量包括该等特征分量的赋值及其权重,以作为该初始搜索结果的优先级或排序信息;优选地,还可以根据该特征向量所包括的各特征分量的赋值及其权重来加权确定该特征向量的赋值,以作为该初始搜索结果的优先级或排序信息。
在此,将初始搜索结果按其优先级或排序信息进行排列的方式包括但不限于:不是一般性,可假设初始搜索结果的优先级或排序信息包括与该初始搜索结果相对应的特征向量,该特征向量包括一个或多个特征分量的赋值及其权重,可根据每个特征向量的赋值(如由其特征分量的赋值加权确定)的大小,来确定对应的搜索结果的排序;或者,根据每个特征向量的各个特征分量的权重及其赋值大小(如字典排序),来确定对应的搜索结果的排序,例如首先按权重最高的特征分量的赋值来进行排序,然后对于其权重最高的特征分量的赋值相同的初始搜索结果,可按权重次高的特征分量的赋值来进行排序,直至完成所有初始搜索结果的排序。例如,用户通过页面技术向结果获取装置11提出了“最好吃川菜”的查询序列,结果获取装置11提供了1000条初始搜索结果,第一排序模型定义为对用户查询序列的初始搜索结果进行基于权重各50%的两个分量,权威性分析和语义分析,来进行排序,第一筛选装置12获得结果获取装置11所提供的1000条所述初始搜索结果,并利用权威性和语义排序的方法对所述1000条进行筛选,获得语义和权威性排序的前100条结果,作为所述优选搜索结果。
第二筛选装置13利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果。具体地,第二筛选装置13在第一筛选装置12所提供的所述优选搜索结果中,利用所述第二排序模型对所述用户的查询序列进行进一步筛选处理,以获得所述最优搜索结果。本领域技术人员应能理解,除了第二排序模型与第一排序模型的差异外,第二筛选装置13的实现方式与第一筛选装置12相同或基本相似,故简明起见,不再赘述,仅以引用的方式包含于此。例如,用户通过页面技术向结果获取装置11提出了“最好吃川菜”的查询序列,结果获取装置11提供了1000条初始搜索结果,第一筛选装置12提供了100条优选搜索结果,第二排序模型定义为对用户查询序列的优选结果进行基于权重各为25%的四个分量:用户需求分析、用户行为统计结果分析、权威性分析和语义分析来进行排序,第二筛选装置13获得第一筛选装置12提供了100条优选搜索结果,并利用第二排序模型,对所述100条优选搜索结果进行4个分量的综合排序,获得进一步的排序结果,并将排序前10条的结果作为所述最优搜索结果。
结果提供装置14将所述最优搜索结果提供给所述用户。具体地,结果提供装置14获取第二筛选装置13所筛选出的最优搜索结果,并利用与用户进行交互,或者按照用户设备所提供的应用程序接口(API)或http、https等其他约定的通信方式的格式要求,将所述最优搜索结果提供给所述用户。例如,将第二筛选装置13所获得的10条所述最优搜索结果作为用户搜索结果的首页呈现给用户,或者将第二筛选装置13所获得的10条所述最优搜索结果做为用户搜索结果的首页呈现给用户,并将剩余优选搜索结果按需在首页后依次呈现给用户。在此,本领域技术人员应能理解,对于初始搜索结果、优选搜索结果或最优搜索结果的显示,可以是按照最优搜索结果、优选搜索结果、初始搜索结果依次进行的;也可以是从最优搜索结果、优选搜索结果、初始搜索结果任选其一进行显示的;也可以是将最优搜索结果、优选搜索结果、初始搜索结果中两者或三者结合起来,按照用户需求进行显示的。
在此,本领域技术人员应理解结果提供设备还可以包含第三筛选装置乃至更多级筛选装置,从而对初始搜索结果进行多级排序,例如采用多级排序模型对初始搜索结果进行逐级排序,以获得待提供给用户的最优搜索结果。优选地,本发明还可以根据不同的应用需求确定所需要的排序模型的级别,并根据相应级别的多级排序模型,如二级排序模型、三级或更多级排序模型,对初始搜索结果进行逐级排序,以获得待提供给用户的最优搜索结果。
优选地,第一筛选装置12还可以利用所述第一排序模型,确定所述初始搜索结果的优先级;根据预定的第一数量阈值,基于所述初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值。具体地,第一筛选装置12利用所述第一排序模型,确定所述初始搜索结果的优先级,例如该初始搜索结果所对应的特征向量或其赋值,再根据预定的第一数量阈值,基于这些初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值,例如从这些初始搜索结果中直接筛选出一定数量的优先级较高的初始搜索结果作为所述优选搜索结果,或者先按其优先级对这些初始搜索结果进行降序排列,然后将排在前列的一定数量的初始搜索结果作为所述优选搜索结果。例如,假设第一数量阈值为100,用户通过页面技术向结果获取装置11提出了“最好吃川菜”的查询序列,结果获取装置11提供了1000条初始搜索结果,第一排序模型定义为对用户查询序列的初始搜索结果进行基于权重各50%的两个分量,权威性分析和语义分析,来进行排序,第一筛选装置12获得结果获取装置11所提供的1000条所述初始搜索结果,并利用权威性和语义排序的方法确定这1000条初始搜索结果的优先级,并按照第一数量阈值100,在这1000条初始搜索结果按其优先级降序排列的序列中进行筛选,获得语义和权威性排序的前100条结果,作为所述优选搜索结果。
更优选地,结果提供设备还包括第一阈值确定装置(未示出),其中,第一阈值确定装置根据预定的第一数量确定规则,确定所述第一数量阈值;其中,所述第一数量确定规则包括以下至少任一项:基于所述初始搜索结果的数量,确定所述第一数量阈值;基于预定的用于确定所述最优搜索结果的数量阈值的确定规则,确定所述第一数量阈值。具体地,第一阈值确定装置根据所述初始搜索结果的数量或预定的用于确定所述最优搜索结果的数量阈值的确定规则,来动态地确定所述第一数量阈值。例如,第一数量确定规则中设置所述第一数量阈值与所述初始搜索结果的数量成正比,则所述初始搜索结果数量越多,所述第一数量阈值越大;或者,第一数量确定规则中设置所述第一数量阈值与所述最优搜索结果的数量阈值的确定规则正相关,如根据界面显示的限制,最优搜索结果的数量阈值限定是固定的,则第一数量阈值与所述固定的最优搜索结果的数量阈值成正比,例如根据每页展现数量确定第一数量阈值为每页展现数量的整数倍;或者,所述第一数量阈值的确定与所述初始搜索结果的数量与预定的用于确定所述最优搜索结果的数量阈值的确定规则形成正反馈关系,最终达到平衡,从而确定所述第一数量阈值。
优选地,第二筛选装置13还可以利用所述第二排序模型,确定所述优选搜索结果的优先级;根据预定的第二数量阈值,基于所述优选搜索结果的优先级,从所述优选搜索结果中筛选出所述最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值。具体地,第二筛选装置13利用所述第二排序模型,确定所述优选搜索结果的优先级,例如该优选搜索结果所对应的特征向量或其赋值,再根据预定的第二数量阈值,基于这些优选搜索结果的优先级,从所述优选搜索结果中筛选出所述最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值,例如从这些优选搜索结果中直接筛选出一定数量的优先级较高的优选搜索结果作为所述最优搜索结果,或者先按其优先级对这些优选搜索结果进行降序排列,然后将排在前列的一定数量的优选搜索结果作为所述最优搜索结果。
更优选地,结果提供设备还包括第二阈值确定装置(未示出),其中,第二阈值确定装置根据预定的第二数量确定规则,确定所述第二数量阈值;其中,所述第二数量确定规则包括以下至少任一项:基于所述用户的用户设备的终端属性,确定所述第二数量阈值;基于所述查询序列的类型信息,确定所述第二数量阈值;基于所述优选搜索结果的数量,确定所述第二数量阈值。具体地,第二阈值确定装置根据所述预定的第二数量确定规则,基于所述用户的用户设备的终端属性,或基于所述查询序列的类型信息,或基于所述优选搜索结果的数量,来确定所述第二数量阈值。例如,根据用户设备的终端属性不同,第二数量阈值也相应不同,如PC端显示屏幕相对较大,每页可以呈现10个结果,则第二数量阈值为10,移动设备的显示屏幕相对较小,则第二数量阈值为6;或根据所述查询序列的类型信息不同,第二数量阈值也相应不同,如查询序列的类型为车次信息,则呈现出最为准确的少量结果即可,第二数量阈值相对较小,如查询序列的类型为餐饮信息,则呈现出相对较多的结果才可能满足用户的需求;或与所述优选搜索结果的数量成正比,来确定所述第二数量阈值。
图2示出根据本发明一个优选实施例的一种用于提供搜索结果的结果提供设备示意图;其中,该结果提供设备包括结果获取装置11’、第一筛选装置12’、第二筛选装置13’、结果提供装置14’、模型确定装置15’。具体地,模型确定装置15’根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型,其中,所述排序模型包括以下至少任一项:所述第一排序模型,所述第二排序模型;结果获取装置11’获得与用户输入的查询序列相对应的初始搜索结果;第一筛选装置12’利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;第二筛选装置13’利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;结果提供装置14’将所述最优搜索结果提供给所述用户。其中,结果提供设备中的结果获取装置11’、第一筛选装置12’、第二筛选装置13’、结果提供装置14’分别与图1所示对应装置相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各装置之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各装置分别按照设定的或实时调整的工作模式要求进行排序模型的确定、初始搜索结果的获取、优选搜索结果的筛选、最优搜索结果的筛选以及最优搜索结果的提供等,直至结果提供设备停止获取与用户输入的查询序列相对应的初始搜索结果。
模型确定装置15’根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型,其中,所述排序模型包括以下至少任一项:所述第一排序模型,所述第二排序模型。具体地,模型确定装置15’根据已标注排序完成的第一搜索结果训练数据,从初始排序模型或任选一特征分量作为初始排序模型,并按照需求利用线性模型、非线性模型或其组合不断调整排序模型内的参量,通过机器学习的方式,确定排序模型,如所述第一排序模型或所述第二排序模型。其中,所述第一搜索结果训练数据包括但不限于查询串(query)及对应的搜索结果(url),对每条查询串标有和搜索结果的相关性等级数字,或者对其中有相关性高低区分的多个搜索结果标明所述多个搜索结果的高低关系等。其中,若所述排序模型为线性模型,则所述排序模型内包括但不限于各特征分量及与所述特征分量所对应的权值;若所述排序模型为非线性模型,则所述排序模型内可包括如与特征分量的某一个阈值点对应的决策阈值,整个排序模型由若干决策阈值构成,例如由多个特征分量的决策阈值构成一棵决策树,然后由多棵决策树构成排序模型,以用于对搜索结果进行综合打分。例如将第一搜索结果训练数据不断地代入到当前排序模型,如初始排序模型或学习得到的中间排序模型,计算得该训练数据的排序信息,例如多个带有权重信息的特征分量的加权和,或者通过由多个带有决策阈值的特征分量构成的一棵或多棵决策树打分得到的分值,并根据该排序信息与其已标注的排序信息的差别,调整该当前排序模型,如增减该当前排序模型的特征分量或调整其特征分量的权重信息或决策阈值,例如顺次调整或同时调整多个特征分量的权重信息或决策阈值。本领域技术人员应能理解,在此,通过机器学习方式确定排序模型,不仅使得排序模型在第一搜索结果训练数据上的误差尽可能小,还具有一定的泛化推广能力。
优选地,所述第一搜索结果训练数据中包括但不限于查询序列,搜索结果,以及查询序列与搜索结果之间的映射关系,如该搜索结果在对应查询序列下的优先级、排序或得分等;优选地,查询序列与搜索结果之间的映射关系还包括该搜索结果在对应查询序列下的特征分量的权重或决策阈值。例如,对于给定的模型原型,如一个包含多个特征分量的特征向量,但尚未标定各特征分量的参数,如该特征分量的权值或决策阈值,则利用包括已标注其查询序列与搜索结果之间的映射关系的训练集,通过基因算法、神经网络、决策树、支持向量机等机器学习算法,确定包括各特征分量对应的参数在内的模型参数,即获得排序模型,如所述第一排序模型或所述第二排序模型。
优选地,该结果提供设备还包括子模型确定装置16’,其中,子模型确定装置16’根据经标注排序的第二搜索结果训练数据,通过机器学习的方式,确定一个或多个用于确定所述排序模型中特征分量的排序子模型。本领域技术人员应能理解,除了排序子模型与排序模型的差异外,子模型确定装置16’的实现方式与模型确定装置15’相同或基本相似,故简明起见,不再赘述,仅以引用的方式包含于此。其中,所述第二搜索结果训练数据中包括但不限于查询序列,搜索结果,以及查询序列与搜索结果之间的映射关系,如该搜索结果在对应查询序列下的优先级、排序或得分等;优选地,查询序列与搜索结果之间的映射关系还包括该搜索结果在对应查询序列下的特征分量的权重或决策阈值。例如,对于给定的子模型原型,如一个包含多个特征分量的特征向量,但尚未标定各特征分量的参数,如该特征分量的权值或决策阈值,则利用包括已标注其查询序列与搜索结果之间的映射关系的训练集,通过基因算法、神经网络、决策树、支持向量机等机器学习算法,确定包括各特征分量对应的参数在内的模型参数,即获得子排序模型。
优选地,模型确定装置15’还可以根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定所述第二排序模型,其中,所述第二排序模型包括用户行为特征分量。具体地,用户行为特征信息包括但不限于用户进行搜索的时间信息、根据用户IP地址确认的地址信息、用户通过点击、触摸、划屏、页面停留时间等所生成的关于搜索结果的操作信息等,模型确定装置15’可以利用经标注排序的第一搜索结果训练数据,利用基因算法、神经网络等机器学习算法,对所述用户行为特征信息进行机器学习,确定在不同用户行为特征信息下各特征分量的权重或决策阈值,即获得第二排序模型。在此,用户行为特征信息可包含于所述第一搜索结果训练数据,也可存储于经由网络与结果提供设备相连接的搜索引擎或搜索日志数据库等第三方设备中,并通过该等第三方设备所提供的应用程序接口(API)从该等第三方设备中获取所述用户行为特征信息。
在另一优选实施例中,可将上述用于提供搜索结果的结果提供设备,与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以是例如Google公司的Google搜索引擎、百度公司的***搜索引擎等。
在另一优选实施例中,可将上述用于提供搜索结果的结果提供设备,与现有的搜索引擎插件相结合,构成一种新的搜索引擎插件,现有的搜索引擎插件可以是例如Google公司的Google ToolBar、百度公司的百度搜霸、微软公司的MSN ToolBar等。
在另一优选实施例中,可将上述提供搜索结果的结果提供设备,与现有的浏览器相结合,构成一种新的浏览器,现有的浏览器可以是例如Microsoft公司的IE浏览器、Netscape公司的Netscape浏览器、Mozilla公司的Firefox浏览器、Google公司的Chrome浏览器、遨游公司的Maxthon浏览器、Opera公司的opera浏览器、360公司的360浏览器、搜狐公司的搜狗浏览器、腾讯公司的腾讯TT浏览器等。
在另一优选实施例中,可将上述用于提供搜索结果的结果提供设备,与现有的浏览器插件相结合,构成一种新的浏览器插件,现有的浏览器插件可以是例如Flash插件、RealPlayer插件、MMS插件、MIDI五线谱插件、ActiveX插件等。
图3示出根据本发明另一个方面的一种由结果提供设备实现的用于提供搜索结果的方法流程图;具体地,结果提供设备在步骤s1中,获得与用户输入的查询序列相对应的初始搜索结果;在步骤s2中,利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;在步骤s3中,利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;在步骤s4中,将所述最优搜索结果提供给所述用户。其中,结果提供设备不仅可以独立工作,还可以集成于网络设备、用户设备、或网络设备与用户设备通过网络相集成所构成的设备。其中,所述网络设备其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述用户设备其包括但不限于任何一种可与用户通过键盘、遥控器、触摸板、或声控设备进行人机交互的电子产品,例如计算机、智能手机、PDA、游戏机、或IPTV等。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(AdHoc网络)等。本领域技术人员应能理解,其他的结果提供设备同样适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
其中,在步骤s1中,结果提供设备获得与用户输入的查询序列相对应的初始搜索结果。具体地,在步骤s1中,结果提供设备例如通过页面技术,如JSP、ASP、PHP等页面技术,或者,通过调用用户设备或其他能够提供所述查询序列的设备所提供的应用程序接口(API),或http、https等其他约定的通信方式,与用户进行交互,获取用户输入的查询序列,并通过诸如对用户输入的查询序列进行分词,并在查询数据库中针对分词后的查询序列进行搜索的方式,获得与用户输入的查询序列相对应的初始搜索结果,其中,用户可通过诸如键盘、触摸屏、语音输入装置与结果提供设备进行交互,输入其希望查询的查询序列,从而发起搜索;或者,结果提供设备通过基于各种通信协议(Communications Protocol),在此“通信协议”指计算机通信的传送协议,如:TCP/IP、UDP、FTP、ICMP、NetBEUI等,同时还包括存在于计算机中的其他形式通信,例如:面向对象编程里面对象之间的通信;操作***内不同程序或计算机不同模块之间的消息传送协议,与其他能够提供所述初始搜索结果的设备,如搜索引擎,进行交互以获取与用户输入的查询序列相对应的初始搜索结果。优选地,在步骤s 1中,结果提供设备还可以在所获取的与用户输入的查询序列相对应的搜索结果中截取一定数量的搜索结果,以作为所述初始搜索结果。例如,用户通过页面技术向结果提供设备提出了“最好吃川菜”的查询序列,结果提供设备对“最好吃川菜”进行分词,在数据库中分别对“最好吃”和“川菜”进行检索,获得了1000条初始搜索结果。本领域技术人员应理解上述获取初始搜索结果的方式以及几种通信传输协议仅为举例,其他现有的或今后可能出现的获取初始搜索结果的方式或通信传输协议如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤s2中,结果提供设备利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果。具体地,在步骤s2中,结果提供设备对于其在步骤s1中所提供的所述初始搜索结果中,利用所述第一排序模型,计算每个初始搜索结果的优先级或排序信息;再根据这些优先级或排序信息,对所述初始搜索结果进行筛选,以获得所述优选搜索结果,如将优先级或排序信息满足一定阈值要求的初始搜索结果作为优选搜索结果,或者将这些初始搜索结果按其优先级或排序信息降序排列,并将排在前N个初始搜索结果作为优选搜索结果。其中,所述第一排序模型中包括但不限于排序算法、排序特征向量等。
在此,利用第一排序模型计算初始搜索结果的优先级或排序信息的方式包括但不限于:利用第一排序模型,例如包含一个或多个特征分量及其权重的特征向量,确定初始搜索结果所对应的各特征分量的赋值,从而得到该初始搜索结果所对应的特征向量,即该特征向量包括该等特征分量的赋值及其权重,以作为该初始搜索结果的优先级或排序信息;优选地,还可以根据该特征向量所包括的各特征分量的赋值及其权重来加权确定该特征向量的赋值,以作为该初始搜索结果的优先级或排序信息。
在此,将初始搜索结果按其优先级或排序信息进行排列的方式包括但不限于:不是一般性,可假设初始搜索结果的优先级或排序信息包括与该初始搜索结果相对应的特征向量,该特征向量包括一个或多个特征分量的赋值及其权重,可根据每个特征向量的赋值(如由其特征分量的赋值加权确定)的大小,来确定对应的搜索结果的排序;或者,根据每个特征向量的各个特征分量的权重及其赋值大小(如字典排序),来确定对应的搜索结果的排序,例如首先按权重最高的特征分量的赋值来进行排序,然后对于其权重最高的特征分量的赋值相同的初始搜索结果,可按权重次高的特征分量的赋值来进行排序,直至完成所有初始搜索结果的排序。
例如,用户通过页面技术向结果提供设备提出了“最好吃川菜”的查询序列,结果提供设备在步骤s1中获得了1000条初始搜索结果,第一排序模型定义为对用户查询序列的初始搜索结果进行基于权重各50%的两个分量,权威性分析和语义分析,来进行排序,结果提供设备根据在步骤s1中获得的1000条所述初始搜索结果,并利用权威性和语义排序的方法对所述1000条进行筛选,获得语义和权威性排序的前100条结果,作为所述优选搜索结果。
在步骤s3中,结果提供设备利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果。具体地,在步骤s3中,结果提供设备在步骤s2所提供的所述优选搜索结果中,利用所述第二排序模型对所述用户的查询序列进行进一步筛选处理,以获得所述最优搜索结果。本领域技术人员应能理解,除了第二排序模型与第一排序模型的差异外,步骤s3的实现方式与步骤s2相同或基本相似,故简明起见,不再赘述,仅以引用的方式包含于此。例如,用户通过页面技术向结果提供设备提出了“最好吃川菜”的查询序列,结果提供设备在步骤s1中提供了1000条初始搜索结果,结果提供设备在步骤s2中提供了100条优选搜索结果,第二排序模型定义为对用户查询序列的优选结果进行基于权重各为25%的四个分量:用户需求分析、用户行为统计结果分析、权威性分析和语义分析来进行排序,在步骤s3中,结果提供设备获得结果提供设备在步骤s2中提供的100条优选搜索结果,并利用第二排序模型,对所述100条优选搜索结果进行4个分量的综合排序,获得进一步的排序结果,并将排序前10条的结果作为所述最优搜索结果。
在步骤s4中,结果提供设备将所述最优搜索结果提供给所述用户。具体地,在步骤s4中,结果提供设备获取结果提供设备在步骤s3中所筛选出的最优搜索结果,并利用与用户进行交互,或者按照用户设备所提供的应用程序接口(API)或http、https等其他约定的通信方式的格式要求,将所述最优搜索结果提供给所述用户。例如,将结果提供设备在步骤s3中所获得的10条所述最优搜索结果作为用户搜索结果的首页呈现给用户,或者将步骤s3中所获得的10条所述最优搜索结果做为用户搜索结果的首页呈现给用户,并将剩余优选搜索结果按需在首页后依次呈现给用户。在此,本领域技术人员应能理解,对于初始搜索结果、优选搜索结果或最优搜索结果的显示,可以是按照最优搜索结果、优选搜索结果、初始搜索结果依次进行的;也可以是从最优搜索结果、优选搜索结果、初始搜索结果任选其一进行显示的;也可以是将最优搜索结果、优选搜索结果、初始搜索结果中两者或三者结合起来,按照用户需求进行显示的。
在此,本领域技术人员应理解该示例方法还可以包含其他用于对中间搜索结果进行筛选的步骤乃至更多级筛选步骤,从而对初始搜索结果进行多级排序,例如采用多级排序模型对初始搜索结果进行逐级排序,以获得待提供给用户的最优搜索结果。优选地,本发明还可以根据不同的应用需求确定所需要的排序模型的级别,并根据相应级别的多级排序模型,如二级排序模型、三级或更多级排序模型,对初始搜索结果进行逐级排序,以获得待提供给用户的最优搜索结果。
优选地,在步骤s2中,结果提供设备还可以利用所述第一排序模型,确定所述初始搜索结果的优先级;根据预定的第一数量阈值,基于所述初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值。具体地,在步骤s2中,结果提供设备利用所述第一排序模型,确定所述初始搜索结果的优先级,例如该初始搜索结果所对应的特征向量或其赋值,再根据预定的第一数量阈值,基于这些初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值,例如从这些初始搜索结果中直接筛选出一定数量的优先级较高的初始搜索结果作为所述优选搜索结果,或者先按其优先级对这些初始搜索结果进行降序排列,然后将排在前列的一定数量的初始搜索结果作为所述优选搜索结果。例如,假设第一数量阈值为100,用户通过页面技术向结果提供设备提出了“最好吃川菜”的查询序列,结果提供设备在步骤s1中提供了1000条初始搜索结果,第一排序模型定义为对用户查询序列的初始搜索结果进行基于权重各50%的两个分量,权威性分析和语义分析,来进行排序,在步骤s2中,结果提供设备获得其在步骤s1中所提供的1000条所述初始搜索结果,并利用权威性和语义排序的方法确定这1000条初始搜索结果的优先级,并按照第一数量阈值100,在这1000条初始搜索结果按其优先级降序排列的序列中进行筛选,获得语义和权威性排序的前100条结果,作为所述优选搜索结果。
更优选地,该实施例还包括步骤s7(未示出),其中,在步骤s7中,结果提供设备根据预定的第一数量确定规则,确定所述第一数量阈值;其中,所述第一数量确定规则包括以下至少任一项:基于所述初始搜索结果的数量,确定所述第一数量阈值;基于预定的用于确定所述最优搜索结果的数量阈值的确定规则,确定所述第一数量阈值。具体地,在步骤s7中,结果提供设备根据所述初始搜索结果的数量或预定的用于确定所述最优搜索结果的数量阈值的确定规则,来动态地确定所述第一数量阈值。例如,第一数量确定规则中设置所述第一数量阈值与所述初始搜索结果的数量成正比,则所述初始搜索结果数量越多,所述第一数量阈值越大;或者,第一数量确定规则中设置所述第一数量阈值与所述最优搜索结果的数量阈值的确定规则正相关,如根据界面显示的限制,最优搜索结果的数量阈值限定是固定的,则第一数量阈值与所述固定的最优搜索结果的数量阈值成正比,例如根据每页展现数量确定第一数量阈值为每页展现数量的整数倍;或者,所述第一数量阈值的确定与所述初始搜索结果的数量与预定的用于确定所述最优搜索结果的数量阈值的确定规则形成正反馈关系,最终达到平衡,从而确定所述第一数量阈值。
优选地,在步骤s3中,结果提供设备还可以利用所述第二排序模型,确定所述优选搜索结果的优先级;根据预定的第二数量阈值,基于所述优选搜索结果的优先级,从所述优选搜索结果中筛选出所述最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值。具体地,在步骤s3中,结果提供设备利用所述第二排序模型,确定所述优选搜索结果的优先级,例如该优选搜索结果所对应的特征向量或其赋值,再根据预定的第二数量阈值,基于这些优选搜索结果的优先级,从所述优选搜索结果中筛选出所述最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值,例如从这些优选搜索结果中直接筛选出一定数量的优先级较高的优选搜索结果作为所述最优搜索结果,或者先按其优先级对这些优选搜索结果进行降序排列,然后将排在前列的一定数量的优选搜索结果作为所述最优搜索结果。
更优选地,该实施例还包括步骤s8(未示出),其中,在步骤s8中,结果提供设备根据预定的第二数量确定规则,确定所述第二数量阈值;其中,所述第二数量确定规则包括以下至少任一项:基于所述用户的用户设备的终端属性,确定所述第二数量阈值;基于所述查询序列的类型信息,确定所述第二数量阈值;基于所述优选搜索结果的数量,确定所述第二数量阈值。具体地,在步骤s8中,结果提供设备根据所述预定的第二数量确定规则,基于所述用户的用户设备的终端属性,或基于所述查询序列的类型信息,或基于所述优选搜索结果的数量,来确定所述第二数量阈值。例如,根据用户设备的终端属性不同,第二数量阈值也相应不同,如PC端显示屏幕相对较大,每页可以呈现10个结果,则第二数量阈值为10,移动设备的显示屏幕相对较小,则第二数量阈值为6;或根据所述查询序列的类型信息不同,第二数量阈值也相应不同,如查询序列的类型为车次信息,则呈现出最为准确的少量结果即可,第二数量阈值相对较小,如查询序列的类型为餐饮信息,则呈现出相对较多的结果才可能满足用户的需求;或与所述优选搜索结果的数量成正比,来确定所述第二数量阈值。
图4示出根据本发明一个优选实施例的一种由结果提供设备实现的用于提供搜索结果的方法流程图;具体地,在步骤s5’中,结果提供设备根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型,其中,所述排序模型包括以下至少任一项:所述第一排序模型,所述第二排序模型;在步骤s1’中,结果提供设备获得与用户输入的查询序列相对应的初始搜索结果;在步骤s2’中,结果提供设备利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;在步骤s3’中,结果提供设备利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;在步骤s4’中,结果提供设备将所述最优搜索结果提供给所述用户。其中,结果提供设备中的步骤s1’、步骤s2’、步骤s3’和步骤s4’分别与图3所示对应步骤相同或基本相同,故此处不再赘述,并通过引用的方式包含于此。
上述各步骤之间是持续不断工作的,在此,本领域技术人员应理解“持续”是指上述各步骤分别按照设定的或实时调整的工作模式要求进行排序模型的确定、初始搜索结果的获取、优选搜索结果的筛选、最优搜索结果的筛选以及最优搜索结果的提供等,直至结果提供设备停止获取与用户输入的查询序列相对应的初始搜索结果。
在步骤s5’中,结果提供设备根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型,其中,所述排序模型包括以下至少任一项:所述第一排序模型,所述第二排序模型。具体地,步骤s5’根据已标注排序完成的第一搜索结果训练数据,从初始排序模型或任选一特征分量作为初始排序模型,并按照需求利用线性模型、非线性模型或其组合不断调整排序模型内的参量,通过机器学习的方式,确定排序模型,如所述第一排序模型或所述第二排序模型。其中,所述第一搜索结果训练数据包括但不限于查询串(query)及对应的搜索结果(url),对每条查询串标有和搜索结果的相关性等级数字,或者对其中有相关性高低区分的多个搜索结果标明所述多个搜索结果的高低关系等。其中,若所述排序模型为线性模型,则所述排序模型内包括但不限于各特征分量及与所述特征分量所对应的权值;若所述排序模型为非线性模型,则所述排序模型内可包括如与特征分量的某一个阈值点对应的决策阈值,整个排序模型由若干决策阈值构成,例如由多个特征分量的决策阈值构成一棵决策树,然后由多棵决策树构成排序模型,以用于对搜索结果进行综合打分。例如将第一搜索结果训练数据不断地代入到当前排序模型,如初始排序模型或学习得到的中间排序模型,计算得该训练数据的排序信息,例如多个带有权重信息的特征分量的加权和,或者通过由多个带有决策阈值的特征分量构成的一棵或多棵决策树打分得到的分值,并根据该排序信息与其已标注的排序信息的差别,调整该当前排序模型,如增减该当前排序模型的特征分量或调整其特征分量的权重信息或决策阈值,例如顺次调整或同时调整多个特征分量的权重信息或决策阈值。本领域技术人员应能理解,在此,通过机器学习方式确定排序模型,不仅使得排序模型在第一搜索结果训练数据上的误差尽可能小,还具有一定的泛化推广能力。
优选地,所述第一搜索结果训练数据中包括但不限于查询序列,搜索结果,以及查询序列与搜索结果之间的映射关系,如该搜索结果在对应查询序列下的优先级、排序或得分等;优选地,查询序列与搜索结果之间的映射关系还包括该搜索结果在对应查询序列下的特征分量的权重或决策阈值。例如,对于给定的模型原型,如一个包含多个特征分量的特征向量,但尚未标定各特征分量的参数,如该特征分量的权值或决策阈值,则利用包括已标注其查询序列与搜索结果之间的映射关系的训练集,通过基因算法、神经网络、决策树、支持向量机等机器学习算法,确定包括各特征分量对应的参数在内的模型参数,即获得排序模型,如所述第一排序模型或所述第二排序模型。
优选地,该实施例还包括步骤s6’,其中,在步骤s6’中,结果提供设备根据经标注排序的第二搜索结果训练数据,通过机器学习的方式,确定一个或多个用于确定所述排序模型中特征分量的排序子模型。本领域技术人员应能理解,除了排序子模型与排序模型的差异外,步骤s6’的实现方式与步骤s5’相同或基本相似,故简明起见,不再赘述,仅以引用的方式包含于此。其中,所述第二搜索结果训练数据中包括但不限于查询序列,搜索结果,以及查询序列与搜索结果之间的映射关系,如该搜索结果在对应查询序列下的优先级、排序或得分等;优选地,查询序列与搜索结果之间的映射关系还包括该搜索结果在对应查询序列下的特征分量的权重或决策阈值。例如,对于给定的子模型原型,如一个包含多个特征分量的特征向量,但尚未标定各特征分量的参数,如该特征分量的权值或决策阈值,则利用包括已标注其查询序列与搜索结果之间的映射关系的训练集,通过基因算法、神经网络、决策树、支持向量机等机器学习算法,确定包括各特征分量对应的参数在内的模型参数,即获得子排序模型。
优选地,在步骤s5’中,结果提供设备还可以根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定所述第二排序模型,其中,所述第二排序模型包括用户行为特征分量。具体地,用户行为特征信息包括但不限于用户进行搜索的时间信息、根据用户IP地址确认的地址信息、用户通过点击、触摸、划屏、页面停留时间等所生成的关于搜索结果的操作信息等,结果提供设备可以利用经标注排序的第一搜索结果训练数据,利用基因算法、神经网络等机器学习算法,对所述用户行为特征信息进行机器学习,确定在不同用户行为特征信息下各特征分量的权重或决策阈值,即获得第二排序模型。在此,用户行为特征信息可包含于所述第一搜索结果训练数据,也可存储于经由网络与结果提供设备相连接的搜索引擎或搜索日志数据库等第三方设备中,并通过该等第三方设备所提供的应用程序接口(API)从该等第三方设备中获取所述用户行为特征信息。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (20)

1.一种由计算机实现的用于提供搜索结果的方法,其中,该方法包括以下步骤:
a获得与用户输入的查询序列相对应的初始搜索结果;
b利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;
c利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;
d将所述最优搜索结果提供给所述用户。
2.根据权利要求1所述的方法,其中,该方法还包括:
x根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型;
其中,所述排序模型包括以下至少任一项:
-所述第一排序模型;
-所述第二排序模型。
3.根据权利要求2所述的方法,其中,该方法还包括:
-根据经标注排序的第二搜索结果训练数据,通过机器学习的方式,确定一个或多个用于确定所述排序模型中特征分量的排序子模型。
4.根据权利要求2所述的方法,其中,所述步骤x包括:
-根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定所述第二排序模型,其中,所述第二排序模型包括用户行为特征分量。
5.根据权利要求1至4中任一项所述的方法,其中,所述步骤b包括:
-利用所述第一排序模型,确定所述初始搜索结果的优先级;
-根据预定的第一数量阈值,基于所述初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值。
6.根据权利要求5所述的方法,其中,该方法还包括:
-根据预定的第一数量确定规则,确定所述第一数量阈值;
其中,所述第一数量确定规则包括以下至少任一项:
-基于所述初始搜索结果的数量,确定所述第一数量阈值;
-基于预定的用于确定所述最优搜索结果的数量阈值的确定规则,确定所述第一数量阈值。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤c包括:
-利用所述第二排序模型,确定所述优选搜索结果的优先级;
-根据预定的第二数量阈值,基于所述优选搜索结果的优先级,从所述优选搜索结果中筛选出最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值。
8.根据权利要求7所述的方法,其中,该方法还包括:
-根据预定的第二数量确定规则,确定所述第二数量阈值;
其中,所述第二数量确定规则包括以下至少任一项:
-基于所述用户的用户设备的终端属性,确定所述第二数量阈值;
-基于所述查询序列的类型信息,确定所述第二数量阈值;
-基于所述优选搜索结果的数量,确定所述第二数量阈值。
9.一种用于提供搜索结果的结果提供设备,其中,该设备包括:
结果获取装置,用于获得与用户输入的查询序列相对应的初始搜索结果;
第一筛选装置,用于利用第一排序模型,在所述初始搜索结果中筛选出优选搜索结果;
第二筛选装置,用于利用第二排序模型,在所述优选搜索结果中筛选出最优搜索结果;
结果提供装置,用于将所述最优搜索结果提供给所述用户。
10.根据权利要求9所述的结果提供设备,其中,该设备还包括:
模型确定装置,用于根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定排序模型;
其中,所述排序模型包括以下至少任一项:
-所述第一排序模型;
-所述第二排序模型。
11.根据权利要求10所述的结果提供设备,其中,该设备还包括:
子模型确定装置,用于根据经标注排序的第二搜索结果训练数据,通过机器学习的方式,确定一个或多个用于确定所述排序模型中特征分量的排序子模型。
12.根据权利要求10所述的结果提供设备,其中,所述模型确定装置用于:
-根据经标注排序的第一搜索结果训练数据,通过机器学习的方式,确定所述第二排序模型,其中,所述第二排序模型包括用户行为特征分量。
13.根据权利要求9至12中任一项所述的结果提供设备,其中,所述第一筛选装置用于:
-利用所述第一排序模型,确定所述初始搜索结果的优先级;
-根据预定的第一数量阈值,基于所述初始搜索结果的优先级,从所述初始搜索结果中筛选出所述优选搜索结果,其中,所述优选搜索结果的数量满足所述第一数量阈值。
14.根据权利要求13所述的结果提供设备,其中,该设备还包括:
第一阈值确定装置,用于根据预定的第一数量确定规则,确定所述第一数量阈值;
其中,所述第一数量确定规则包括以下至少任一项:
-基于所述初始搜索结果的数量,确定所述第一数量阈值;
-基于预定的用于确定所述最优搜索结果的数量阈值的确定规则,确定所述第一数量阈值。
15.根据权利要求9至14中任一项所述的结果提供设备,其中,所述第二筛选装置用于:
-利用所述第二排序模型,确定所述优选搜索结果的优先级;
-根据预定的第二数量阈值,基于所述优选搜索结果的优先级,从所述优选搜索结果中筛选出最优搜索结果,其中,所述最优搜索结果的数量满足所述第二数量阈值。
16.根据权利要求15所述的结果提供设备,其中,该设备还包括:
第二阈值确定装置,用于根据预定的第二数量确定规则,确定所述第二数量阈值;
其中,所述第二数量确定规则包括以下至少任一项:
-基于所述用户的用户设备的终端属性,确定所述第二数量阈值;
-基于所述查询序列的类型信息,确定所述第二数量阈值;
-基于所述优选搜索结果的数量,确定所述第二数量阈值。
17.一种搜索引擎,包括如权利要求9至16中任一项所述的用于提供搜索结果的结果提供设备。
18.一种搜索引擎插件,包括如权利要求9至16中任一项所述的用于提供搜索结果的结果提供设备。
19.一种浏览器,包括如权利要求9至16中任一项所述的用于提供搜索结果的结果提供设备。
20.一种浏览器插件,包括如权利要求9至16中任一项所述的用于提供搜索结果的结果提供设备。
CN201210226803.XA 2012-06-29 2012-06-29 一种用于提供搜索结果的方法与设备 Active CN102810117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210226803.XA CN102810117B (zh) 2012-06-29 2012-06-29 一种用于提供搜索结果的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210226803.XA CN102810117B (zh) 2012-06-29 2012-06-29 一种用于提供搜索结果的方法与设备

Publications (2)

Publication Number Publication Date
CN102810117A true CN102810117A (zh) 2012-12-05
CN102810117B CN102810117B (zh) 2016-02-24

Family

ID=47233823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210226803.XA Active CN102810117B (zh) 2012-06-29 2012-06-29 一种用于提供搜索结果的方法与设备

Country Status (1)

Country Link
CN (1) CN102810117B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164535A (zh) * 2013-04-11 2013-06-19 苏州阔地网络科技有限公司 一种云教育平台的数据搜索实现方法及***
CN103164536A (zh) * 2013-04-11 2013-06-19 苏州阔地网络科技有限公司 一种实现云教育平台数据搜索的方法及***
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置
CN104598611A (zh) * 2015-01-29 2015-05-06 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及***
CN105701155A (zh) * 2015-12-30 2016-06-22 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN106055567A (zh) * 2015-04-09 2016-10-26 谷歌公司 提供app商店搜索结果
CN106897289A (zh) * 2015-12-18 2017-06-27 北京奇虎科技有限公司 信息搜索的优化方法及装置
CN107169574A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用嵌套机器学习模型来执行预测的方法及***
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及***
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
CN107463704A (zh) * 2017-08-16 2017-12-12 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107977405A (zh) * 2017-11-16 2018-05-01 北京三快在线科技有限公司 数据排序方法、数据排序装置、电子设备及可读存储介质
CN108829757A (zh) * 2018-05-28 2018-11-16 广州麦优网络科技有限公司 一种聊天机器人的智能服务方法、服务器及存储介质
CN109033140A (zh) * 2018-06-08 2018-12-18 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
CN109410090A (zh) * 2018-09-13 2019-03-01 张继升 一种功能高度综合的智能生活服务平台
CN109436834A (zh) * 2018-09-25 2019-03-08 北京金茂绿建科技有限公司 一种选取漏斗的方法及装置
CN109522345A (zh) * 2018-11-19 2019-03-26 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN110413357A (zh) * 2013-06-08 2019-11-05 苹果公司 用于同步两个或更多个显示器的设备、方法和图形用户界面
CN110674401A (zh) * 2019-09-19 2020-01-10 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置和电子设备
CN110688458A (zh) * 2019-09-27 2020-01-14 中国人民解放军海军大连舰艇学院 一种作战模型检索方法
CN110717263A (zh) * 2019-09-27 2020-01-21 中国人民解放军海军大连舰艇学院 一种作战模型管理***
CN111177585A (zh) * 2018-11-13 2020-05-19 北京四维图新科技股份有限公司 地图poi反馈方法及装置
CN111209378A (zh) * 2019-12-26 2020-05-29 航天信息股份有限公司企业服务分公司 一种基于业务字典权重的有序分级排序方法
CN113360796A (zh) * 2021-05-20 2021-09-07 北京三快在线科技有限公司 数据排序方法及装置、数据排序模型训练方法及装置
CN113656574A (zh) * 2021-10-19 2021-11-16 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质
CN113761084A (zh) * 2020-06-03 2021-12-07 北京四维图新科技股份有限公司 一种poi搜索排序模型训练方法、排序装置与方法及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090319507A1 (en) * 2008-06-19 2009-12-24 Yahoo! Inc. Methods and apparatuses for adapting a ranking function of a search engine for use with a specific domain
CN101770521A (zh) * 2010-03-11 2010-07-07 东华大学 一种用于垂直搜索引擎的聚焦相关度排序方法
CN101930438A (zh) * 2009-06-19 2010-12-29 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索***
CN102043846A (zh) * 2010-12-16 2011-05-04 上海电机学院 一种基于遗传算法的搜索方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090319507A1 (en) * 2008-06-19 2009-12-24 Yahoo! Inc. Methods and apparatuses for adapting a ranking function of a search engine for use with a specific domain
CN101930438A (zh) * 2009-06-19 2010-12-29 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索***
CN101770521A (zh) * 2010-03-11 2010-07-07 东华大学 一种用于垂直搜索引擎的聚焦相关度排序方法
CN102043846A (zh) * 2010-12-16 2011-05-04 上海电机学院 一种基于遗传算法的搜索方法及装置

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164536B (zh) * 2013-04-11 2016-08-03 阔地教育科技有限公司 一种实现云教育平台数据搜索的方法及***
CN103164536A (zh) * 2013-04-11 2013-06-19 苏州阔地网络科技有限公司 一种实现云教育平台数据搜索的方法及***
CN103164535A (zh) * 2013-04-11 2013-06-19 苏州阔地网络科技有限公司 一种云教育平台的数据搜索实现方法及***
CN103164535B (zh) * 2013-04-11 2016-08-03 阔地教育科技有限公司 一种云教育平台的数据搜索实现方法及***
US11692840B2 (en) 2013-06-08 2023-07-04 Apple Inc. Device, method, and graphical user interface for synchronizing two or more displays
CN110413357A (zh) * 2013-06-08 2019-11-05 苹果公司 用于同步两个或更多个显示器的设备、方法和图形用户界面
CN104462293A (zh) * 2014-11-27 2015-03-25 百度在线网络技术(北京)有限公司 搜索处理方法、生成搜索结果排序模型的方法和装置
CN104598611A (zh) * 2015-01-29 2015-05-06 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及***
CN104598611B (zh) * 2015-01-29 2018-03-23 百度在线网络技术(北京)有限公司 对搜索条目进行排序的方法及***
CN106055567A (zh) * 2015-04-09 2016-10-26 谷歌公司 提供app商店搜索结果
CN106897289A (zh) * 2015-12-18 2017-06-27 北京奇虎科技有限公司 信息搜索的优化方法及装置
CN106897289B (zh) * 2015-12-18 2020-07-10 北京奇虎科技有限公司 信息搜索的优化方法及装置
CN105701155A (zh) * 2015-12-30 2016-06-22 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105701155B (zh) * 2015-12-30 2019-05-31 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN107169573A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用复合机器学习模型来执行预测的方法及***
CN107169574A (zh) * 2017-05-05 2017-09-15 第四范式(北京)技术有限公司 利用嵌套机器学习模型来执行预测的方法及***
US10657325B2 (en) 2017-06-21 2020-05-19 Beijing Baidu Netcom Science And Technology Co., Ltd. Method for parsing query based on artificial intelligence and computer device
CN107301227A (zh) * 2017-06-21 2017-10-27 北京百度网讯科技有限公司 基于人工智能的搜索信息解析方法及装置
CN107463704A (zh) * 2017-08-16 2017-12-12 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107977405B (zh) * 2017-11-16 2021-01-22 北京三快在线科技有限公司 数据排序方法、数据排序装置、电子设备及可读存储介质
CN107977405A (zh) * 2017-11-16 2018-05-01 北京三快在线科技有限公司 数据排序方法、数据排序装置、电子设备及可读存储介质
CN108829757B (zh) * 2018-05-28 2022-01-28 广州麦优网络科技有限公司 一种聊天机器人的智能服务方法、服务器及存储介质
CN108829757A (zh) * 2018-05-28 2018-11-16 广州麦优网络科技有限公司 一种聊天机器人的智能服务方法、服务器及存储介质
CN109033140B (zh) * 2018-06-08 2020-05-29 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
US10896188B2 (en) 2018-06-08 2021-01-19 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for determining search results, device and computer storage medium
CN109033140A (zh) * 2018-06-08 2018-12-18 北京百度网讯科技有限公司 一种确定搜索结果的方法、装置、设备和计算机存储介质
CN109410090A (zh) * 2018-09-13 2019-03-01 张继升 一种功能高度综合的智能生活服务平台
CN109436834A (zh) * 2018-09-25 2019-03-08 北京金茂绿建科技有限公司 一种选取漏斗的方法及装置
CN111177585A (zh) * 2018-11-13 2020-05-19 北京四维图新科技股份有限公司 地图poi反馈方法及装置
CN109522345A (zh) * 2018-11-19 2019-03-26 百度在线网络技术(北京)有限公司 用于显示信息的方法及装置
CN110674401A (zh) * 2019-09-19 2020-01-10 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置和电子设备
CN110674401B (zh) * 2019-09-19 2022-04-15 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置和电子设备
CN110717263A (zh) * 2019-09-27 2020-01-21 中国人民解放军海军大连舰艇学院 一种作战模型管理***
CN110688458A (zh) * 2019-09-27 2020-01-14 中国人民解放军海军大连舰艇学院 一种作战模型检索方法
CN111209378A (zh) * 2019-12-26 2020-05-29 航天信息股份有限公司企业服务分公司 一种基于业务字典权重的有序分级排序方法
CN111209378B (zh) * 2019-12-26 2024-03-12 航天信息股份有限公司企业服务分公司 一种基于业务字典权重的有序分级排序方法
CN113761084A (zh) * 2020-06-03 2021-12-07 北京四维图新科技股份有限公司 一种poi搜索排序模型训练方法、排序装置与方法及介质
CN113761084B (zh) * 2020-06-03 2023-08-08 北京四维图新科技股份有限公司 一种poi搜索排序模型训练方法、排序装置与方法及介质
CN113360796A (zh) * 2021-05-20 2021-09-07 北京三快在线科技有限公司 数据排序方法及装置、数据排序模型训练方法及装置
CN113656574B (zh) * 2021-10-19 2022-02-08 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质
CN113656574A (zh) * 2021-10-19 2021-11-16 北京欧应信息技术有限公司 用于搜索结果排序的方法、计算设备和存储介质

Also Published As

Publication number Publication date
CN102810117B (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN102810117A (zh) 一种用于提供搜索结果的方法与设备
CN103593373B (zh) 一种用于搜索结果排序的方法与设备
CN107491547A (zh) 基于人工智能的搜索方法和装置
US9928282B2 (en) Method and apparatus for providing search results on a mobile terminal
WO2015085948A1 (en) Method, device, and server for friend recommendation
CN107463704A (zh) 基于人工智能的搜索方法和装置
CN102682099B (zh) 一种用于在目标区域提供目标图片的方法与设备
CN107683471A (zh) 索引具有深度链接的网页
CN102968413A (zh) 一种用于提供搜索结果的方法与设备
CN103226393A (zh) 一种输入方法和设备
CN102968454B (zh) 一种用于获取推广对象搜索结果的方法和设备
CN105224959A (zh) 排序模型的训练方法和装置
CN103076893A (zh) 一种用于实现语音输入的方法与设备
CN103189836A (zh) 用于对图数据流中的对象分类的方法
CN102346778A (zh) 一种用于提供搜索结果的方法与设备
JP2016206675A (ja) 数学公式学習者支援システム
CN110609958A (zh) 数据推送方法、装置、电子设备及存储介质
CN102945273B (zh) 一种用于提供搜索结果的方法和设备
CN102323937A (zh) 一种提供搜索结果的方法与设备
CN108763313A (zh) 模型的在线训练方法、服务器及存储介质
CN102063468A (zh) 一种用于确定查询序列的查询类别的设备及其方法
CN103399862A (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
CN111194457A (zh) 专利评估判定方法、专利评估判定装置以及专利评估判定程序
CN104615639A (zh) 一种用于提供图片的呈现信息的方法和设备
CN103076894A (zh) 一种用于根据对象标识信息构建输入词条的方法与设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant