CN112100480A - 搜索方法、装置、设备及存储介质 - Google Patents
搜索方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112100480A CN112100480A CN202010969712.XA CN202010969712A CN112100480A CN 112100480 A CN112100480 A CN 112100480A CN 202010969712 A CN202010969712 A CN 202010969712A CN 112100480 A CN112100480 A CN 112100480A
- Authority
- CN
- China
- Prior art keywords
- search
- vocabulary
- search result
- determining
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000015654 memory Effects 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 18
- 238000012163 sequencing technique Methods 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 239000012634 fragment Substances 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 7
- 230000008707 rearrangement Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种搜索方法、装置、设备及存储介质,涉及智能搜索领域。具体实现方案为:获取搜索词汇;获取所述搜索词汇对应的预测词汇,所述预测词汇中包括所述搜索词汇;获取所述搜索词汇对应的第一搜索结果集合,以及所述预测词汇对应的第二搜索结果集合;根据所述第一搜索结果集合和所述第二搜索结果集合,确定目标搜索结果,并显示所述目标搜索结果。能够在用户输入有限的搜索词汇的前提下得到有效的目标搜索结果,搜索更加精准高效。
Description
技术领域
本申请涉及数据处理中的智能搜索,尤其涉及一种搜索方法、装置、设备及存储介质。
背景技术
通常在搜索引擎中,用户输入需要查询的关键词的片段,搜索引擎就会根据关键词的片段提供相应的搜索建议,然后根据用户选中的搜索建议执行搜索过程,得到搜索结果。
而在地图搜索引擎中,通常在用户输入需要查询的关键词的片段时,地图搜索引擎就要根据关键词的片段来确定并显示搜索结果,并没有用户选中搜索建议并由地图搜索引擎根据用户选中的搜索建议来执行搜索这一过程。
而由于关键词的片段包含的文本特征较少,语义不明确,直接根据关键词的片段确定搜索结果,会导致用户需求的搜索结果与实际的搜索结果之间相差较大,从而无法实现用户在输入较少的关键词的片段的前提下得到有效的搜索结果。
发明内容
本申请提供了一种搜索方法、装置、设备及存储介质。
根据本申请的第一方面,提供了一种搜索方法,包括:
获取搜索词汇;
获取搜索词汇对应的预测词汇,预测词汇中包括搜索词汇;
获取搜索词汇对应的第一搜索结果集合,以及预测词汇对应的第二搜索结果集合;
根据第一搜索结果集合和第二搜索结果集合,确定目标搜索结果,并显示目标搜索结果。
根据本申请的第二方面,提供了一种搜索装置,包括:
第一获取模块,用于获取搜索词汇;
第二获取模块,用于获取搜索词汇对应的预测词汇,预测词汇中包括搜索词汇;
第三获取模块,用于获取搜索词汇对应的第一搜索结果集合,以及预测词汇对应的第二搜索结果集合;
处理模块,用于根据第一搜索结果集合和第二搜索结果集合,确定目标搜索结果,并显示目标搜索结果。
根据本申请的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中任一项的方法。
根据本申请的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行第一方面中任一项的方法。
本申请实施例提供的搜索方法、装置、设备及存储介质,首先获取搜索词汇,搜索词汇为用户输入的词汇,然后获取搜索词汇对应的预测词汇,预测词汇为对搜索词汇进行合理的预测得到的词汇,预测词汇中包括搜索词汇,预测词汇与搜索词汇相比具备更多的文本特征;然后,获取搜索词汇对应的第一搜索结果集合和预测词汇对应的第二搜索结果集合,根据第一搜索结果集合和第二搜索结果集合确定目标搜索结果并显示目标搜索结果。本申请实施例的方案,通过搜索词汇确定预测词汇,增加了包含的文本特征,使得词汇的语义更加明确,然后根据搜索词汇和预测词汇确定第一搜索结果集合和第二搜索结果集合,能够在用户输入有限的搜索词汇的前提下得到有效的目标搜索结果,搜索更加精准高效。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为一种搜索引擎搜索示意图;
图2为本申请实施例提供的一种应用场景示意图;
图3为本申请实施例提供的一种搜索方法的流程示意图;
图4为本申请实施例提供的搜索方法的总体示意图;
图5为本申请实施例提供的不同位置信息下的搜索结果示意图;
图6为本申请实施例提供的一种GRU模型的结构示意;
图7为本申请实施例提供的第一模型的结构示意图;
图8为本申请实施例提供的获取第一样本的示意图;
图9为本申请实施例提供的需求重排示意图;
图10为本申请实施例提供的搜索装置的结构示意图;
图11为本申请实施例提供的搜索方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
首先结合附图对本申请的应用场景进行介绍。
搜索建议(suggestion,简写为sug)是搜索引擎输入查询(query)过程中常见的一种产品形态,包括通用搜索、垂类搜索等各种搜索类型中均可提供该功能。sug的主要功能是在用户输入词汇时,给用户提供一些搜索建议,减少用户输入,此类型的搜索中,用户找到需求结果的路径是:
片段query-完整query(sug提供)-搜索结果(搜索引擎)。
其中,片段query为用户输入的,当用户输入片段query时,sug会根据用户输入的片段query提供一些建议,其中包括用户可能想要查询的一个或多个完整query。当用户点击其中一个完整query后,搜索引擎会执行搜索,得到该完整query的搜索结果。
图1为一种搜索引擎搜索示意图,如图1所示,在终端设备的界面11上,用户可以打开搜索引擎进行搜索。在图1中,用户输入的搜索词汇是“科”,此时的“科”即为片段query。
终端设备在获取到用户输入的搜索词汇后,会给出相应的搜索建议,如图1中的终端设备的界面12示意,搜索建议包括“科学”、“科目”、“科目二”、“科幻画”、“科技大学”等等。用户可以点击自己需求的搜索建议,例如可以点击“科技大学”,则此时终端设备能够获知用户想要搜索的完整query为“科技大学”,进而进行搜索操作,得到“科技大学”的相关搜索结果。
图1示例的是普通的搜索引擎的搜索过程,而针对于一些特定的搜索,例如地图搜索场景中,其搜索路径与普通的搜索路径不同,其搜索路径通常为:
片段query-搜索结果(搜索引擎)。
相对于普通搜索的搜索路径,省略了提供完整query的步骤。图2为本申请实施例提供的一种应用场景示意图,如图2所示,为一种地图场景下的搜索过程。
在终端设备的界面21下,是一个地图相关应用的界面,用户输入“科”字,然后界面21直接跳转到界面22,显示“科技大学”的搜索结果,其中,“科”即为用户输入的片段query,“科技大学”的搜索结果即为该片段query对应的搜索结果。这是地图搜索需要达到的目的。
在图2示例的地图搜索场景中,由于用户输入的片段query比较短,因此较难预测用户的真正需求。例如,用户输入“科”很难决策用户需求搜索的是“科技”、“科技大学”、“科目”等其中的哪一个。进一步的,地图搜索中,用户的需求与时间、空间因素等关联较大,例如在图2中,通过用户输入的“科”,显示“科技大学”的搜索结果,可能综合了位置信息为“北京”来共同确定的。
在目前的搜索过程中,首先根据用户输入的片段query,进行统一排序。具体的,根据片段query进行召回,得到该片段query相关的词汇集合。然后在召回的基础上,先粗排,过了词汇集合中的一部分词汇,然后对剩余的词汇进行排序,得到排序结果。在统一排序的基础上,还可以根据点击、杂质识别等特征对排序结果进行微调。
上述方案中,在片段query较短的情形下,其包含的文本特征十分有限,通过召回得到的文本词汇之间的差异较小,语义不够明确,容易导致用户需求点在粗排阶段被过滤掉或者在统一排序过程中排到靠后的位置,无法得到有效的搜索结果。
基于此,本申请实施例提供一种搜索方案,以实现在片段query较短的情形下实现用户需求点的有效定位,提高搜索效率和精准度。下面将对本申请的方案进行介绍。
图3为本申请实施例提供的一种搜索方法的流程示意图,如图3所示,该方法可以包括:
S31,获取搜索词汇。
搜索词汇可以包括一个或多个字,搜索词汇可以是一个完整的词汇,也可以是一个完整的词汇的部分。搜索词汇可以由用户在搜索引擎的输入窗口输入,然后后台获取用户输入的搜索词汇。
例如,若用户想要搜索的是“科技大学”,用户可能在搜索引擎输入“科”,此时“科”就是搜索词汇,“科”是一个完整词汇的一部分;用户也可能在搜索引擎输入“科学”,此时“科学”就是搜索词汇,“科学”可以作为一个完整的词汇存在,但是与用户想要搜索的“科技大学”不等同。
S32,获取搜索词汇对应的预测词汇,预测词汇中包括搜索词汇。
在获取了用户输入的搜索词汇之后,会根据搜索词汇获取对应的预测词汇。本申请实施例中,预测词汇是根据搜索词汇进行的合理的预测得到的词汇,预测词汇中包括搜索词汇,表示搜索词汇中的文本也存在于预测词汇中,并且搜索词汇中的文本中的字的顺序与预测词汇中相应的文本中的字的顺序不变。
例如,当搜索词汇为“科”时,对应的预测词汇可能为“科学”,“科学”中包括“科”字;当搜索词汇为“游乐”时,对应的预测词汇可能为“游乐场”,“游乐场”中包括词汇“游乐”,等等。
S33,获取搜索词汇对应的第一搜索结果集合,以及预测词汇对应的第二搜索结果集合。
在获取到搜索词汇后,会根据搜索词汇确定对应的第一搜索结果集合,即根据搜索词汇进行搜索结果的召回。根据搜索词汇确定对应的第一搜索结果集合的方式有多种,例如包括前缀召回、后缀召回等等。以后缀召回为例,在获取到搜索词汇后,可以将所有以该搜索词汇开头的搜索结果都加入到第一搜索结果集合中。例如以搜索词汇为“科”为例,则可能得到包括“科比”、“科目二”、“科目三”、“科创画”、“科技板”等相关的搜索结果,从而确定了第一搜索结果集合。
在确定了预测词汇之后,也会根据预测词汇确定对应的第二搜索结果集合,即根据预测词汇进行搜索结果的召回。本申请实施例中,根据预测词汇进行搜索结果的召回的方式与根据搜索词汇进行搜索结果的召回的方式类似,均可以采用包括前缀召回、后缀召回等各种方式。不同之处在于,由于预测词汇包括的文本特征更丰富,因此根据预测词汇确定的第二搜索结果集合中包括的搜索结果范围更小,且更具有针对性。
S34,根据第一搜索结果集合和第二搜索结果集合,确定目标搜索结果,并显示目标搜索结果。
在确定了第一搜索结果集合和第二搜索结果集合之后,可以对第一搜索结果集合和第二搜索结果集合中的搜索结果进行排序,并根据排序结果来确定和显示目标搜索结果。
本申请实施例中,确定目标搜索结果结合了根据搜索词汇确定的第一搜索结果集合和根据预测词汇确定的第二搜索结果集合。由于预测词汇具备更多的文本特征,因此根据预测词汇确定的第二搜索结果集合,能够获取到更为精准有效的目标搜索结果。但是在一些情况下,预测词汇与用户实际的需求点可能并不匹配,因此本申请实施例中,仍然保留了根据原始的搜索词汇确定的第一搜索结果集合。综合第一搜索结果集合和第二搜索结果集合,来确定目标搜索结果。
本申请实施例提供的搜索方法,首先获取搜索词汇,搜索词汇为用户输入的词汇,然后获取搜索词汇对应的预测词汇,预测词汇为对搜索词汇进行合理的预测得到的词汇,预测词汇中包括搜索词汇,预测词汇与搜索词汇相比具备更多的文本特征;然后,获取搜索词汇对应的第一搜索结果集合和预测词汇对应的第二搜索结果集合,根据第一搜索结果集合和第二搜索结果集合确定目标搜索结果并显示目标搜索结果。本申请实施例的方案,通过搜索词汇确定预测词汇,增加了包含的文本特征,使得词汇的语义更加明确,然后根据搜索词汇和预测词汇确定第一搜索结果集合和第二搜索结果集合,能够在用户输入有限的搜索词汇的前提下得到有效的目标搜索结果,搜索更加精准高效。
用户在地图搜索输入query(查询词)的过程中会不断向sug服务发起请求,每次请求对于sug服务来说都是一次独立的搜索过程。例如,用户想要找的是poi“中国人民大学”,那么用户的输入序列可能是:中->中国->中国人->…->中国人民大学。在其中的任何一次请求中,sug返回的结果中存在用户需求poi且被点击,输入就会终止,表明用户的需求得到了满足。需求得到满足时,服务端收到的请求数,定位为用户的输入步长,通常输入步长与输入字数成正比关系,输入步长即为用户找到需求poi的输入代价,这个值越小越好。
通常,用户需求poi排序越靠前,用户点击sug的概率越高。基于历史点击和query预测的排序技术是在统一排序和需求重排基础上实现的,能够最大限度地优化用户的输入步长。本申请实施例中,在以上基础上,通过用户输入的片段query获取预测query,实现在较短且大多数非完整语义query的情况下,去预测用户的需求,将用户需求poi排在前面。
下面结合附图对本申请的方案进行详细介绍。
图4为本申请实施例提供的搜索方法的总体示意图,如图4所示,总共包括需求召回、粗排截断、统一排序、需求重排等几个主要的阶段,最后得到最终的排序结果。
在需求召回阶段之前,用户首先会输入片段query,即搜索词汇。需求召回阶段就是召回与用户输入的片段query相关的各种词汇文本,如上所述,需求召回的方式可以包括前缀召回、后缀召回等方式。例如,当用户输入的片段query为“科”时,需求召回会获取各种与“科”相关的文本词汇,如“科学”、“科目”、“科目二”、“科目三”等等。在实际中,用户输入片段query是一个动态的过程,此时需求召回也是动态的。例如用户在输入“科”之后又输入了“技”,则需求召回会获取各种与“科技”相关的文本词汇,如“科技大学”、“科技中心”、“科技研究所”等等。
通过需求召回的词汇文本的数量通常是比较庞大的,因此在需求召回之后,会有一个粗排截断的过程,这个过程是对需求召回的文本词汇进行一个粗略的筛选,过滤一部分文本词汇。粗排截断之后得到的文本词汇就会进行统一排序。
统一排序的过程就是根据原始的片段query(即搜索词汇),得到预测query(即预测词汇),然后根据搜索词汇确定对应的第一搜索结果集合,根据预测词汇确定对应的第二搜索结果集合,并根据第一搜索结果集合和第二搜索结果集合进行初步排序。
其中,预测词汇是对搜索词汇的合理预测,根据用户输入的搜索词汇,预测用户可能想要搜索的词汇为预测词汇,因此预测词汇的准确性对于后续目标搜索结果的精准具有重要影响。
在不同的场景下,相同的搜索词汇可能会导致用户感兴趣的词汇不同,相应的预测词汇也就不同。其中,在地图搜索场景下,位置信息和时间信息对预测词汇的影响较大。在不同的时空场景下,用户的需求可能完全不同。结合位置信息和时间信息,来对搜索词汇进行预测,得到的预测词汇能够更加精准高效,与用户的实际需求更加匹配。
不同的位置信息下,例如,当用户输入的搜索词汇为“中国”时,如果用户位于北京,则用户接下来可能的输入是“人”、“人民”等;如果用户位于合肥,则用户接下来可能的输入是“科”、“科学”等。不同的时间信息下,相同的搜索词汇,用户感兴趣的需求点也可能不同,例如在早上,用户可能更多会搜索学校、办公楼等区域,在晚上,可能会更多搜索小区、公园等区域。下面结合图5进行说明。
图5为本申请实施例提供的不同位置信息下的搜索结果示意图,如图5所示,在终端设备51上打开某个地图类应用,其中显示地图所展示的位置为“北京”。用户在输入窗口输入“中国”,地图上显示的是位于北京的“中国人民大学”的搜索结果。在图5的右边,在终端设备52上打开某个地图类应用,其中显示地图所展示的位置为“合肥”。用户在输入窗口输入“中国”,地图上显示的是位于合肥的“中国科学技术大学”的搜索结果。
由图5的示例可见,即使用户输入的是相同的搜索词汇,由于位置信息、时间信息等的不同,用户的需求点也可能完全不同。
因此本申请实施例中,当该搜索方法应用于地图搜索引擎时,在地图搜索场景下,首先获取位置信息和/或当前时刻,并根据位置信息和/或当前时刻,来获取搜索词汇对应的预测词汇。其中,位置信息可以为地图搜索引擎当前显示的地图对应的位置信息,也可以为用户当前所在位置的位置信息,而当前时刻即为用户输入搜索词汇的时刻。
具体的,根据位置信息和搜索词汇,能够确定第一词汇集合。例如,首先获取搜索词汇对应的第三词汇集合,该第三词汇集合中的词汇为以搜索词汇为关键词搜索得到的词汇。然后,判断第三词汇集合中的词汇与位置信息的匹配度。例如在图5中,搜索词汇为“中国”时,“中国人民大学”和“中国科学技术大学”均为“中国”相关的词汇,均属于第三词汇集合。如果此时位置信息为北京,那么显然“中国人民大学”和“北京”的匹配度更高,“中国科学技术大学”和“北京”的匹配度更低。因此,可以将第三词汇集合中与位置信息匹配的至少一个词汇确定为第一词汇集合。
根据当前时刻和搜索词汇,也能够确定第二词汇集合。具体的,可以获取搜索词汇对应的第四词汇集合,其中,第四词汇集合中的词汇为以搜索词汇为关键词搜索得到的词汇。然后将第四词汇集合中与当前时刻匹配的至少一个词汇确定为第二词汇集合。例如,当搜索词汇为“馆”时,可能以“馆”这个词汇为关键词搜索得到的词汇包括“图书馆”、“博物馆”、“旅馆”等等,这些词汇均为与“馆”相关的词汇,均属于第四词汇集合。如果此时的当前时刻为夜晚九点整,由于图书馆和博物馆等地点均只在白天开放,因此“旅馆”与当前时刻的匹配度更高,“图书馆”和“博物馆”与当前时刻的匹配度更低。因此可以将第四词汇集合中的“旅馆”作为第二词汇集合中的词汇。
需要说明的是,上述实施例中位置信息为“北京”、当前时刻为“夜晚九点整”等均是一种举例,分别用于解释根据位置信息确定第一词汇集合,以及根据当前时刻确定第二词汇集合。第二词汇集合的确定方式与第一词汇集合的确定方式类似,此处不再赘述。根据第一词汇集合和/或第二词汇集合,即可确定预测词汇。
在另一种可能的实现方式中,可以通过第一模型对搜索词汇、位置信息和当前时刻进行处理,得到预测词汇;其中,第一模型为对多组第一样本学习得到的,每张第一样本包括样本搜索词汇、样本位置信息、样本时刻和样本预测词汇。
本申请实施例的方案中,需要根据用户输入的搜索词汇(片段query)进行预测,得到预测词汇(预测query),然后根据预测query与poi的相关性,通过排序模型对各个poi进行排序,确定各个poi的排序位置。
例如在query=“中国人”时,需求poi“中国人民大学”排在前三位(用户看到和点击概率最大的排序区间),说明此时排序模型能够根据query和需求poi之间的相关性特征预测需求poi;而当query=“中国”时,需求poi排在第五位以后,说明特征不足于支持排序模型去预测需求poi;当query=“中”时,情况类似。那么当query=“中”或者“中国”时,本申请实施例的方案对后续可能的query进行预测,预测query可能是“中国人”,基于预测query计算的相关性特征,加入到排序模型中去,需求poi的排序位置就有可能提前,从输入步长的角度来看,用户的输入步长就缩短了一步或两步。
query预测可以看做是一个语言模型问题,即给定一句话前面的部分,预测接下来最有可能的一些字或词。循环神经网络(Recurrent Neural Network,RNN)是一种对语言模型问题的建模工具,能够向后(或向前)预测任意多个词。本申请实施例中,采用的是RNN中的GRU(Gate Recurrent Unit)模型对query预测进行建模。
图6为本申请实施例提供的一种GRU模型的结构示意,如图6所示,其中,x序列表示输入,O序列表示输出,h序列表示模型的中间状态。对应x序列和O序列,均可以简单的看做是输入和输出的文字。
例如xt-1表示“中”,而通过GRU模型预测“中”后面的文字为“国”,则Ot-1表示“国”;xt表示“国”,而通过GRU模型预测“国”后面的文字为“人”,则Ot表示“人”;xt+1表示“人”,而通过GRU模型预测“人”后面的文字为“民”,则Ot+1表示“民”,等等。
地图搜索场景下,不同时空场景下,用户需求可能完全不同,相同片段query下,接下来输入可能完全不同,比如,query=“中国”,在北京,接下来的输入可能是“人”、“人民”等,而在合肥,接下来的输入可能是“科”、“科学”等。常规的GRU模型无法解决不同时空场景下,预测query不同的问题。基于此,本申请实施例中的第一模型,可以对GRU模型进行改进。图7为本申请实施例提供的第一模型的结构示意图,如图7所示,在GRU模型每个时间步长的预测输入中,加入了用户搜索的当前时刻以及位置信息,其他部分的结构不变,构成第一模型。
在构建了第一模型之后,还需要对第一模型进行训练,训练之前需要获取训练样本。图8为本申请实施例提供的获取第一样本的示意图,如图8所示,在终端设备81上,显示了用户的一次搜索操作。在输入“科”之后,搜索引擎给出了相应的搜索建议,包括“科学”、“科目”、“科技大学”和“科幻画”,最终用户点击了“科学”,从而可以根据此次搜索行为得到一组样本82,样本82中包括位置信息“北京”、当前时刻“14:22”、样本搜索词汇“科”和样本预测词汇“技”。
进一步的,在进行模型训练时,可以将当前时刻转换成相应的时间特征,将位置信息转换成相应的位置特征。例如,可以将一天时间分成8个桶,进行编码,将用户的位置信息进行编码,时空信息合并起来是40维的向量。采用用户实际输入的海量query(包含时空信息)训练第一模型,提升第一模型预测的准确率。利用训练好的第一模型,基于当前输入的搜索词汇预测一步或者多步,得到一个或多个预测词汇。
图8示例了一组第一样本的获取方法,需要说明的是,在获取第一样本时,并不局限于某一个用户历史的搜索操作,而是可以搜集大范围大量的不同用户历史的搜索操作,构成第一样本,从而对第一模型进行训练。在第一模型训练完成之后,就可以根据第一模型和搜索词汇,得到预测词汇。进而根据搜索词汇确定第一搜索结果集合,根据预测词汇确定第二搜索结果集合。本申请实施例中,通过对GRU模型进行改进,得到第一模型,综合了位置信息和时间信息对预测词汇的影响,使得得到的预测词汇与用户的实际需求更加匹配。
如图4中所示,在确定了第一搜索结果集合和第二搜索结果集合之后,对第一搜索结果集合和第二搜索结果集合中的词汇进行排序,得到排序结果,并根据排序结果确定目标搜索结果。
一种可能的实现方式是,将排序结果中的前N个搜索结果确定为目标搜索结果,N为大于或等于1的整数。
另一种可能的实现方式是,获取至少一个参考搜索结果,然后根据至少一个参考搜索结果和排序结果,确定目标搜索结果。
在图4中,进行粗排截断时,可能会过滤掉一部分词汇,而这些词汇可能是用户经常点击的。如果用户需求poi被过滤掉,那么后续无论如何进行排序,都无法将用户需求poi排列上来。针对此种情况,可以将需求召回的词汇中,历史点击命中率大于或等于预设阈值的词汇加入旁路中,在统一排序之后的需求重排阶段,加入基于历史点击率的个性化需求重排。
图9为本申请实施例提供的需求重排示意图,如图9所示,示意了需求召回之后得到的集合91,集合91中包括的许多词汇。然后对集合91中的词汇进行粗排截断,得到集合92和集合93,其中,集合92为被过滤掉的词汇集合,其中包括“科学技术”、“科目二”和“科技大学”。集合93为后续进行统一排序的词汇集合,其中包括“科学”、“科技”、“科目”和“科创”。
对集合93中的词汇进行排序后得到集合94,集合94为排序后的集合,其中的词汇排列顺序依次为“科技”、“科学”、“科目”和“科创”。
此时,如果集合92中的“科技大学”的历史点击命中率超过预设阈值,表明许多用户曾经点击过该poi。因此,将该词汇加入到集合94中,与集合94中的词汇进行综合排序,得到排序后的集合95,其中,集合95中的词汇排列顺序依次为“科技”、“科技大学”、“科学”、“科目”和“科创”。
在进行需求重排之后,可以在排序结果中获取前M个搜索结果,M为大于或等于1的整数,并在至少一个参考搜索结果中获取P个参考搜索结果,P为整数,然后,将M个搜索结果,和P个参考搜索结果确定为目标搜索结果。本申请实施例中,参考搜索结果是历史点击命中率大于或等于预设阈值的搜索结果,历史点击命中率可以是获取的多位用户的历史点击记录得到的。由于参考搜索结果的历史点击命中率较高,因此也表示其很有可能是用户此次搜索过程中需求的poi。但是在一些情形下,通过上述对搜索结果进行排序,可能将一些历史点击命中率较高的参考搜索结果排除在外,或者排在非常靠后的位置,导致后续确定的目标搜索结果中没有展示这些参考搜索结果。因此,可以获取P个参考搜索结果,然后将M个搜索结果和P个参考搜索结果,确定为目标搜索结果,从而保证这些历史点击命中率较高的参考搜索结果不被排除。
需要说明的是,P可以为正整数,也可以为0。当历史点击命中率大于或等于预设阈值的参考搜索结果被包括在排序结果中,例如被包括在前M个搜索结果中时,此时P可以取0。当P为正整数时,则是根据M个搜索结果为P个参考搜索结果确定目标搜索结果。当P为0时,则是根据M个搜索结果确定目标搜索结果。
其中,参考搜索结果的排序可以位于排序结果中的任意位置,也可以预先设定一定的排序规则。
例如,在用户历史点击的poi中,分别找到当前图区城市、定位城市及其他城市点击次数最多的poi,然后根据排序结果中首位poi的城市,在参考搜索结果中找到该城市的poi,***到排序结果中相应城市的poi到第二位并去重,例如首位poi是图区城市结果,则***参考搜索结果中图区城市点击次数最多的poi。
通过上述方案,能够在一定程度上避免用户需求的poi被过滤掉,或者被排列到较靠后的位置,使得后续目标搜索结果的确定能够更加精准高效。
本申请实施例提供的搜索方法,首先获取搜索词汇,搜索词汇为用户输入的词汇,然后获取搜索词汇对应的预测词汇,预测词汇为对搜索词汇进行合理的预测得到的词汇,预测词汇中包括搜索词汇,预测词汇与搜索词汇相比具备更多的文本特征;然后,获取搜索词汇对应的第一搜索结果集合和预测词汇对应的第二搜索结果集合,根据第一搜索结果集合和第二搜索结果集合确定目标搜索结果并显示目标搜索结果。本申请实施例的方案,通过搜索词汇确定预测词汇,增加了包含的文本特征,使得词汇的语义更加明确,然后根据搜索词汇和预测词汇确定第一搜索结果集合和第二搜索结果集合,能够在用户输入有限的搜索词汇的前提下得到有效的目标搜索结果,搜索更加精准高效。
图10为本申请实施例提供的搜索装置的结构示意图,如图10所示,包括:
第一获取模块101,用于获取搜索词汇;
第二获取模块102,用于获取搜索词汇对应的预测词汇,预测词汇中包括搜索词汇;
第三获取模块103,用于获取搜索词汇对应的第一搜索结果集合,以及预测词汇对应的第二搜索结果集合;
处理模块104,用于根据第一搜索结果集合和第二搜索结果集合,确定目标搜索结果,并显示目标搜索结果。
在一种可能的实施方式中,应用于地图搜索引擎;第二获取模块102具体用于:
获取位置信息和/或当前时刻,位置信息为地图搜索引擎当前显示地图所对应的位置信息或者用户当前所在位置的位置信息;
根据位置信息和/或当前时刻,获取搜索词汇对应的预测词汇。
在一种可能的实施方式中,第二获取模块102具体用于:
根据位置信息和搜索词汇,确定第一词汇集合;
根据当前时刻和搜索词汇,确定第二词汇集合;
根据第一词汇集合和/或第二词汇集合,确定预测词汇。
在一种可能的实施方式中,第二获取模块102具体用于:
获取搜索词汇对应的第三词汇集合,第三词汇集合中的词汇为以搜索词汇为关键词搜索得到的词汇;
将第三词汇集合中与位置信息匹配的至少一个词汇确定为第一词汇集合。
在一种可能的实施方式中,第二获取模块102具体用于:
获取搜索词汇对应的第四词汇集合,第四词汇集合中的词汇为以搜索词汇为关键词搜索得到的词汇;
将第四词汇集合中与当前时刻匹配的至少一个词汇确定为第二词汇集合。
在一种可能的实施方式中,第二获取模块102具体用于:
通过第一模型对搜索词汇、位置信息和当前时刻进行处理,得到预测词汇;其中,第一模型为对多组第一样本学习得到的,每组第一样本包括样本搜索词汇、样本位置信息、样本时刻和样本预测词汇。
在一种可能的实施方式中,处理模块104具体用于:
对第一搜索结果集合和第二搜索结果集合中的搜索结果进行排序,得到排序结果;
根据排序结果确定目标搜索结果。
在一种可能的实施方式中,处理模块104具体用于:
将排序结果中前N个搜索结果确定为目标搜索结果,N为大于或等于1的整数。
在一种可能的实施方式中,处理模块104具体用于:
获取至少一个参考搜索结果,参考搜索结果的历史点击命中率大于或等于预设阈值;
根据至少一个参考搜索结果和排序结果,确定目标搜索结果。
在一种可能的实施方式中,处理模块104具体用于:
在排序结果中获取前M个搜索结果,M为大于或等于1的整数;
在至少一个参考搜索结果中获取P个参考搜索结果,P为整数;
将M个搜索结果和P个参考搜索结果,确定为目标搜索结果。
本申请实施例提供的搜索装置,用于执行上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
图11为本申请实施例提供的搜索方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图11所示,该电子设备包括:一个或多个处理器1101、存储器1102,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器***)。图11中以一个处理器1101为例。
存储器1102即为本申请所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本申请所提供的搜索方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的搜索方法。
存储器1102作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的搜索方法对应的程序指令/模块(例如,附图10所示的第一获取模块101、第二获取模块102、第三获取模块103和处理模块104)。处理器1101通过运行存储在存储器1102中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的搜索方法。
存储器1102可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据搜索方法的电子设备的使用所创建的数据等。此外,存储器1102可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1102可选包括相对于处理器1101远程设置的存储器,这些远程存储器可以通过网络连接至搜索方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
搜索方法的电子设备还可以包括:输入装置1103和输出装置1104。处理器1101、存储器1102、输入装置1103和输出装置1104可以通过总线或者其他方式连接,图11中以通过总线1105连接为例。
输入装置1103可接收输入的数字或字符信息,以及产生与搜索方法的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1104可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
这些计算机程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算机程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (22)
1.一种搜索方法,包括:
获取搜索词汇;
获取所述搜索词汇对应的预测词汇,所述预测词汇中包括所述搜索词汇;
获取所述搜索词汇对应的第一搜索结果集合,以及所述预测词汇对应的第二搜索结果集合;
根据所述第一搜索结果集合和所述第二搜索结果集合,确定目标搜索结果,并显示所述目标搜索结果。
2.根据权利要求1所述的方法,其中,所述方法应用于地图搜索引擎;获取所述搜索词汇对应的预测词汇,包括:
获取位置信息和/或当前时刻,所述位置信息为所述地图搜索引擎当前显示地图所对应的位置信息或者用户当前所在位置的位置信息;
根据所述位置信息和/或所述当前时刻,获取所述搜索词汇对应的预测词汇。
3.根据权利要求2所述的方法,根据所述位置信息和/或所述当前时刻,获取所述搜索词汇对应的预测词汇,包括:
根据所述位置信息和所述搜索词汇,确定第一词汇集合;
根据所述当前时刻和所述搜索词汇,确定第二词汇集合;
根据所述第一词汇集合和/或所述第二词汇集合,确定所述预测词汇。
4.根据权利要求3所述的方法,根据所述位置信息和所述搜索词汇,确定第一词汇集合,包括:
获取所述搜索词汇对应的第三词汇集合,所述第三词汇集合中的词汇为以所述搜索词汇为关键词搜索得到的词汇;
将所述第三词汇集合中与所述位置信息匹配的至少一个词汇确定为所述第一词汇集合。
5.根据权利要求3所述的方法,根据所述当前时刻和所述搜索词汇,确定第二词汇集合,包括:
获取所述搜索词汇对应的第四词汇集合,所述第四词汇集合中的词汇为以所述搜索词汇为关键词搜索得到的词汇;
将所述第四词汇集合中与所述当前时刻匹配的至少一个词汇确定为所述第二词汇集合。
6.根据权利要求2所述的方法,根据所述位置信息和/或所述当前时刻,获取所述搜索词汇对应的预测词汇,包括:
通过第一模型对所述搜索词汇、所述位置信息和所述当前时刻进行处理,得到所述预测词汇;其中,所述第一模型为对多组第一样本学习得到的,每组第一样本包括样本搜索词汇、样本位置信息、样本时刻和样本预测词汇。
7.根据权利要求1-6任一项所述的方法,根据所述第一搜索结果集合和所述第二搜索结果集合,确定目标搜索结果,包括:
对所述第一搜索结果集合和所述第二搜索结果集合中的搜索结果进行排序,得到排序结果;
根据所述排序结果确定所述目标搜索结果。
8.根据权利要求7所述的方法,根据所述排序结果确定所述目标搜索结果,包括:
将排序结果中前N个搜索结果确定为所述目标搜索结果,所述N为大于或等于1的整数。
9.根据权利要求7所述的方法,根据所述排序结果确定所述目标搜索结果,包括:
获取至少一个参考搜索结果,所述参考搜索结果的历史点击命中率大于或等于预设阈值;
根据所述至少一个参考搜索结果和所述排序结果,确定所述目标搜索结果。
10.根据权利要求9所述的方法,根据所述至少一个参考搜索结果和所述排序结果,确定所述目标搜索结果,包括:
在所述排序结果中获取前M个搜索结果,所述M为大于或等于1的整数;
在所述至少一个参考搜索结果中获取P个参考搜索结果,所述P为整数;
将所述M个搜索结果和所述P个参考搜索结果,确定为所述目标搜索结果。
11.一种搜索装置,包括:
第一获取模块,用于获取搜索词汇;
第二获取模块,用于获取所述搜索词汇对应的预测词汇,所述预测词汇中包括所述搜索词汇;
第三获取模块,用于获取所述搜索词汇对应的第一搜索结果集合,以及所述预测词汇对应的第二搜索结果集合;
处理模块,用于根据所述第一搜索结果集合和所述第二搜索结果集合,确定目标搜索结果,并显示所述目标搜索结果。
12.根据权利要求11所述的装置,其中,应用于地图搜索引擎;所述第二获取模块具体用于:
获取位置信息和/或当前时刻,所述位置信息为所述地图搜索引擎当前显示地图所对应的位置信息或者用户当前所在位置的位置信息;
根据所述位置信息和/或所述当前时刻,获取所述搜索词汇对应的预测词汇。
13.根据权利要求12所述的装置,所述第二获取模块具体用于:
根据所述位置信息和所述搜索词汇,确定第一词汇集合;
根据所述当前时刻和所述搜索词汇,确定第二词汇集合;
根据所述第一词汇集合和/或所述第二词汇集合,确定所述预测词汇。
14.根据权利要求13所述的装置,所述第二获取模块具体用于:
获取所述搜索词汇对应的第三词汇集合,所述第三词汇集合中的词汇为以所述搜索词汇为关键词搜索得到的词汇;
将所述第三词汇集合中与所述位置信息匹配的至少一个词汇确定为所述第一词汇集合。
15.根据权利要求13所述的装置,所述第二获取模块具体用于:
获取所述搜索词汇对应的第四词汇集合,所述第四词汇集合中的词汇为以所述搜索词汇为关键词搜索得到的词汇;
将所述第四词汇集合中与所述当前时刻匹配的至少一个词汇确定为所述第二词汇集合。
16.根据权利要求12所述的装置,所述第二获取模块具体用于:
通过第一模型对所述搜索词汇、所述位置信息和所述当前时刻进行处理,得到所述预测词汇;其中,所述第一模型为对多组第一样本学习得到的,每组第一样本包括样本搜索词汇、样本位置信息、样本时刻和样本预测词汇。
17.根据权利要求11-16任一项所述的装置,所述处理模块具体用于:
对所述第一搜索结果集合和所述第二搜索结果集合中的搜索结果进行排序,得到排序结果;
根据所述排序结果确定所述目标搜索结果。
18.根据权利要求17所述的装置,所述处理模块具体用于:
将排序结果中前N个搜索结果确定为所述目标搜索结果,所述N为大于或等于1的整数。
19.根据权利要求17所述的装置,所述处理模块具体用于:
获取至少一个参考搜索结果,所述参考搜索结果的历史点击命中率大于或等于预设阈值;
根据所述至少一个参考搜索结果和所述排序结果,确定所述目标搜索结果。
20.根据权利要求19所述的装置,所述处理模块具体用于:
在所述排序结果中获取前M个搜索结果,所述M为大于或等于1的整数;
在所述至少一个参考搜索结果中获取P个参考搜索结果,所述P为整数;
将所述M个搜索结果和所述P个参考搜索结果,确定为所述目标搜索结果。
21.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969712.XA CN112100480B (zh) | 2020-09-15 | 搜索方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010969712.XA CN112100480B (zh) | 2020-09-15 | 搜索方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112100480A true CN112100480A (zh) | 2020-12-18 |
CN112100480B CN112100480B (zh) | 2024-07-30 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704507A (zh) * | 2021-10-26 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、计算机设备以及可读存储介质 |
CN113886685A (zh) * | 2021-09-23 | 2022-01-04 | 北京三快在线科技有限公司 | 一种搜索方法、装置、存储介质及电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262630A (zh) * | 2010-05-31 | 2011-11-30 | 国际商业机器公司 | 进行扩展化搜索的方法和装置 |
CN103020066A (zh) * | 2011-09-21 | 2013-04-03 | 北京百度网讯科技有限公司 | 一种识别搜索需求的方法和装置 |
CN103226601A (zh) * | 2013-04-25 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 一种图片搜索的方法和装置 |
CN103425710A (zh) * | 2012-05-25 | 2013-12-04 | 北京百度网讯科技有限公司 | 一种基于主题的搜索方法和装置 |
WO2017177630A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 个性化信息推荐方法及装置 |
CN107798066A (zh) * | 2017-09-25 | 2018-03-13 | 北京小度信息科技有限公司 | 一种搜索词推送方法、装置及终端 |
CN108319603A (zh) * | 2017-01-17 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 对象推荐方法和装置 |
US20180260848A1 (en) * | 2016-03-02 | 2018-09-13 | Tencent Technology (Shenzhen) Company Limited | Information processing method and apparatus |
CN109977293A (zh) * | 2019-03-29 | 2019-07-05 | 北京搜狗科技发展有限公司 | 一种搜索结果相关性的计算方法及装置 |
CN111177551A (zh) * | 2019-12-27 | 2020-05-19 | 百度在线网络技术(北京)有限公司 | 确定搜索结果的方法、装置、设备和计算机存储介质 |
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262630A (zh) * | 2010-05-31 | 2011-11-30 | 国际商业机器公司 | 进行扩展化搜索的方法和装置 |
CN103020066A (zh) * | 2011-09-21 | 2013-04-03 | 北京百度网讯科技有限公司 | 一种识别搜索需求的方法和装置 |
CN103425710A (zh) * | 2012-05-25 | 2013-12-04 | 北京百度网讯科技有限公司 | 一种基于主题的搜索方法和装置 |
CN103226601A (zh) * | 2013-04-25 | 2013-07-31 | 百度在线网络技术(北京)有限公司 | 一种图片搜索的方法和装置 |
US20180260848A1 (en) * | 2016-03-02 | 2018-09-13 | Tencent Technology (Shenzhen) Company Limited | Information processing method and apparatus |
WO2017177630A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 个性化信息推荐方法及装置 |
CN108319603A (zh) * | 2017-01-17 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 对象推荐方法和装置 |
CN107798066A (zh) * | 2017-09-25 | 2018-03-13 | 北京小度信息科技有限公司 | 一种搜索词推送方法、装置及终端 |
CN109977293A (zh) * | 2019-03-29 | 2019-07-05 | 北京搜狗科技发展有限公司 | 一种搜索结果相关性的计算方法及装置 |
CN111177551A (zh) * | 2019-12-27 | 2020-05-19 | 百度在线网络技术(北京)有限公司 | 确定搜索结果的方法、装置、设备和计算机存储介质 |
Non-Patent Citations (4)
Title |
---|
OVERVIEWING THE KNOWLEDGE OF A QUERY KEYWORD BY CLUSTERING VIEWPOINTS OF WEB SEARCH INFORMATION NEEDS .ET AL: "Overviewing the Knowledge of a Query Keyword by Clustering Viewpoints of Web Search Information Needs", IEEE, 30 April 2015 (2015-04-30) * |
张书波;张引;张斌;孙达明;: "平衡流行性和相似性的混合式查询扩展方法", 小型微型计算机***, no. 11, 15 November 2016 (2016-11-15) * |
陈;沈一帆;: "基于词汇树的图片搜索", 计算机工程, no. 06, 20 March 2010 (2010-03-20) * |
陈枭;刘天华;朱宏峰;刘骏;: "基于词汇相关度模型的个性化元搜索引擎", 计算机工程与设计, no. 19, 8 October 2007 (2007-10-08) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113886685A (zh) * | 2021-09-23 | 2022-01-04 | 北京三快在线科技有限公司 | 一种搜索方法、装置、存储介质及电子设备 |
CN113704507A (zh) * | 2021-10-26 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 数据处理方法、计算机设备以及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111984689B (zh) | 信息检索的方法、装置、设备以及存储介质 | |
CN110517785B (zh) | 相似病例的查找方法、装置及设备 | |
CN110955764B (zh) | 场景知识图谱的生成方法、人机对话方法以及相关设备 | |
CN111241427B (zh) | 查询自动补全的方法、装置、设备和计算机存储介质 | |
CN111026937B (zh) | 提取poi名称的方法、装置、设备和计算机存储介质 | |
CN111222058B (zh) | 查询自动补全的方法、装置、设备和计算机存储介质 | |
CN111666292B (zh) | 用于检索地理位置的相似度模型建立方法和装置 | |
CN111814077B (zh) | 信息点查询方法、装置、设备和介质 | |
CN111782977A (zh) | 兴趣点处理方法、装置、设备及计算机可读存储介质 | |
KR102601545B1 (ko) | 지리 위치점 정렬 방법, 정렬 모델 트레이닝 방법 및 대응하는 장치 | |
CN111538815A (zh) | 一种文本查询方法、装置、设备及存储介质 | |
CN112559879A (zh) | 兴趣模型训练方法、兴趣点推荐方法、装置和设备 | |
CN111506803A (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN111666461B (zh) | 检索地理位置的方法、装置、设备和计算机存储介质 | |
CN111460296B (zh) | 用于更新事件集合的方法和装置 | |
CN111767477A (zh) | 一种检索方法、装置、电子设备和存储介质 | |
CN112541123A (zh) | 地图图区推荐方法、装置、设备及存储介质 | |
CN111949820A (zh) | 视频关联兴趣点的处理方法、装置及电子设备 | |
CN112100480B (zh) | 搜索方法、装置、设备及存储介质 | |
CN112100480A (zh) | 搜索方法、装置、设备及存储介质 | |
CN111881255B (zh) | 同义文本获取方法、装置、电子设备及存储介质 | |
CN113449754B (zh) | 标签的匹配模型训练和展示方法、装置、设备及介质 | |
CN112035751A (zh) | 信息推荐的方法、装置、设备以及存储介质 | |
CN112487313A (zh) | 兴趣点识别方法、装置、电子设备和存储介质 | |
CN111523036A (zh) | 一种搜索行为挖掘方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |