CN103258023B - 搜索候选词的推荐方法及搜索引擎 - Google Patents

搜索候选词的推荐方法及搜索引擎 Download PDF

Info

Publication number
CN103258023B
CN103258023B CN201310165048.3A CN201310165048A CN103258023B CN 103258023 B CN103258023 B CN 103258023B CN 201310165048 A CN201310165048 A CN 201310165048A CN 103258023 B CN103258023 B CN 103258023B
Authority
CN
China
Prior art keywords
candidate word
search
search candidate
weight
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310165048.3A
Other languages
English (en)
Other versions
CN103258023A (zh
Inventor
连茂泉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310165048.3A priority Critical patent/CN103258023B/zh
Publication of CN103258023A publication Critical patent/CN103258023A/zh
Application granted granted Critical
Publication of CN103258023B publication Critical patent/CN103258023B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种搜索候选词的推荐方法及搜索引擎,其中所述方法包括:搜索引擎服务器接收用户输入的输入信息,并获得输入信息的前缀信息;将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;如果判断存在至少两个搜索候选词属于同一主题,则保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;以及根据多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至用户。根据本发明实施例的方法,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。

Description

搜索候选词的推荐方法及搜索引擎
技术领域
本发明涉及计算机技术领域,特别涉及一种搜索候选词的推荐方法及搜索引擎。
背景技术
搜索引擎主要采用前缀匹配的方式为用户提供搜索候选词,具体地,对于某一前缀,搜索引擎主要根据搜索候选词的热度,也就是检索频次,来决定提供哪些搜索候选词及其排序。
但是如果用户需要搜索的内容与某个热点词汇具有相同的前缀,很可能会使与热点词汇相关的内容由于具有较高的热度而都具有较高的排序权值而排在前面,而用户想要搜索的内容却无法列入候选词中,虽然可以通过基于主题类聚等方式来对搜索候选词进行重排,但是基于主题类聚的方式计算成本发哦,并存在潜在的转义风险,从而难以满足用户检索的需求。
发明内容
本发明的旨在至少解决上述技术缺陷之一。
为此,本发明第一个目的在于提出一种搜索候选词的推荐方法,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。
本发明第二个目的在于提出一种搜索引擎。
为实现上述目的,根据本发明第一方面的实施例的搜索候选词的推荐方法包括以下步骤:搜索引擎服务器接收用户输入的输入信息,并获得所述输入信息的前缀信息;将所述前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;判断所述多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;如果判断所述存在至少两个搜索候选词属于同一主题,则保留所述至少两个搜索候选词中的一个搜索候选词的权重不变,对所述至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;以及根据所述多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至所述用户。
根据本发明实施例的搜索候选词的推荐方法,通过保持同一主题中的一个搜索候选词的权重不变,对同一主题中的其他搜索候选词进行降权处理,进而提高其他主题的候选词的权重排名,使得根据权重排名提供给用户的搜索候选词能够具有不同的主题,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。
为实现上述目的,根据本发明第二方面的实施例的搜索引擎,包括:接收模块,用于接收用户输入的输入信息,并获得所述输入信息的前缀信息;搜索词确定模块,用于将所述前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;判断模块,用于判断所述多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;权重调整模块,用于在判断所述存在至少两个搜索候选词属于同一主题时,保留所述至少两个搜索候选词中的一个搜索候选词的权重不变,对所述至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;排序模块,用于根据所述多个搜索候选词的权重进行排序;以及提供模块,用于将排序之后的搜索候选词提供至所述用户。
根据本发明实施例的搜索引擎,通过权重调整模块可以在保持同一主题中的一个搜索候选词的权重不变,而对同一主题中的其他搜索候选词进行降权处理,进而提高其他主题的候选词的权重排名,使得根据权重排名提供给用户的搜索候选词能够具有不同的主题,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的搜索候选词的推荐方法的流程图;
图2为根据本发明另一个实施例的搜索候选词的推荐方法的流程图;
图3为根据本发明一个实施例的搜索引擎的结构框图;
图4为根据本发明另一个实施例的搜索引擎的结构框图;
图5为根据本发明一个实施例的搜索候选词展示框的示意图。
具体实施方式
下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
下面参考附图描述根据本发明实施例的搜索候选词的推荐方法。
一种搜索候选词的推荐方法,包括以下步骤:搜索引擎服务器接收用户输入的输入信息,并获得输入信息的前缀信息;将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;如果判断存在至少两个搜索候选词属于同一主题,则保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;以及根据多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至用户。
图1为根据本发明一个实施例的搜索候选词的推荐方法的流程图。
如图1所示,根据本发明实施例的搜索候选词的推荐方法包括下述步骤。
S101,搜索引擎服务器接收用户输入的输入信息,并获得输入信息的前缀信息。
具体地,当搜索引擎服务器在接收用户输入的输入信息时,可将用户输入的输入信息作为前缀信息,以便根据用户输入的前缀信息为用户提供丰富的并且与用户输入信息匹配的搜索候选词。
S102,将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重。
在本发明的一个实施例中,搜索引擎将前缀信息作为索引获取多个前缀与前缀信息相同的搜索候选词,并获取每个候选词的权重,其中每个候选词的权重可以由该候选词的热度(即搜索频率)、以及拼写正确与否等因素决定,例如由于《普罗米修斯》的热映可能导致以“普罗米修斯”的热度提升,进而提升了普罗米修斯”的权重,因此,对于前缀信息“普”来说,包含“普罗米修斯”的候选词就会因具有较高的权重而排在前面。
在本发明的一个实施例中,可根据获得的多个搜索候选词对应的权重将多个搜索候选词中的一部分加入至索引拉链之中,以便进一步对索引拉链中的搜索候选词进行排序以提供给用户。
S103,判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题。
具体的,可首先分析多个搜索候选词中任两个搜索候选词之间除了前缀信息内容部分连续重复的文字或字符的字面长度,如果文字或字符的字面长度大于预设阈值,则判断大于预设阈值的两个搜索候选词是否属于同一主题,如,果不大于预设阈值,则不属于同一主题,如初始预定阈值可设置为6个字符,也就是3个汉字或6个英文字母,其中预设阈值可以由搜索引擎默认设置,并在工作过程中通过评估结果、机器学习以及用户反馈等方法进行修正。
S104,如果判断存在至少两个搜索候选词属于同一主题,则保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理。
如果判断不存在至少两个搜索候选词属于同一主题,则执行步骤S105。
其中,惩罚系数为0到1之间的数值,由此,可通过将至少两个搜索候选词中的其他搜索候选词的权重乘以惩罚系数来降低需要降权的的搜索候选词的权重,使得其他主题的搜索候选词的权重排名能够提前,提高搜索候选词的多样性,并且惩罚系数可根据评估结果、机器学习或用户在线反馈进行调整。
例如,对于前缀信息“普”对应的多个搜索候选词,可将关于“普罗米修斯”主题的4个搜索候选词中的其中3个进行降权处理,被降权处理后的搜索候选词的权重排名可能会下降,可使其他主题的搜索候选词,如“普洱茶”等的权重排名提前。
S105,根据多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至用户。
根据本发明实施例的搜索候选词的推荐方法,通过保持同一主题中的一个搜索候选词的权重不变,对同一主题中的其他搜索候选词进行降权处理,进而提高其他主题的候选词的权重排名,使得根据权重排名提供给用户的搜索候选词能够具有不同的主题,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。
图2为根据本发明另一个实施例的搜索候选词的推荐方法的流程图。
如图2所示,根据本发明实施例的搜索候选词的推荐方法包括下述步骤。
S201,搜索引擎服务器接收用户输入的输入信息,并获得输入信息的前缀信息。
具体地,当搜索引擎服务器在接收用户输入的输入信息时,可将用户输入的输入信息作为前缀信息,以便根据用户输入的前缀信息为用户提供丰富的并且与用户输入信息匹配的搜索候选词。
S202,将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重。
具体地,搜索引擎将前缀信息作为索引获取多个前缀与前缀信息相同的搜索候选词,并获取每个候选词的权重,其中每个候选词的权重可以由该候选词的热度(即搜索频率)、以及拼写正确与否等因素决定,例如由于《普罗米修斯》的热映可能导致以“普罗米修斯”的热度提升,进而提升了普罗米修斯”的权重,因此,对于前缀信息“普”来说,包含“普罗米修斯”的候选词就会因具有较高的权重而排在前面。
在本发明的一个实施例中,可根据获得的多个搜索候选词对应的权重将多个搜索候选词中的一部分加入至索引拉链之中,以便进一步对索引拉链中的搜索候选词进行排序以提供给用户。
S203,判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题。
具体的,可首先分析多个搜索候选词中任两个搜索候选词之间除了前缀信息内容部分连续重复的文字或字符的字面长度,如果文字或字符的字面长度大于预设阈值,则判断大于预设阈值的两个搜索候选词是否属于同一主题,如,果不大于预设阈值,则不属于同一主题,如初始预定阈值可设置为6个字符,也就是3个汉字或6个英文字母,其中预设阈值可以由搜索引擎默认设置,并在工作过程中通过评估结果、机器学习以及用户反馈等方法进行修正。
S204,如果判断存在至少两个搜索候选词属于同一主题,则保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理。
其中,惩罚系数为0到1之间的数值,由此,可通过将至少两个搜索候选词中的其他搜索候选词的权重乘以惩罚系数来降低需要降权的的搜索候选词的权重,使得其他主题的搜索候选词的权重排名能够提前,提高搜索候选词的多样性,并且惩罚系数可根据评估结果、机器学习或用户在线反馈进行调整。
例如,对于前缀信息“普”对应的多个搜索候选词,可将关于“普罗米修斯”主题的4个搜索候选词中的其中3个进行降权处理,被降权处理后的搜索候选词的权重排名可能会下降,可使其他主题的搜索候选词,如“普洱茶”等的权重排名提前。
S205,根据多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至用户。
S206,在搜索候选词展示框中展示权重排名大于预设位置的多个搜索候选词。
具体地,预设位置的值为搜索候选词展示框中可显示的搜索候选词的个数,可将搜索拉链中权重排名大于预设位置的多个搜索候选词在搜索候选词展示框中展示,如图5所示,如果预设位置为6时,对于前缀信息“普”对应的多个搜索候选词展示结果。
S207,在搜索候选词展示框中针对展示框中的每个搜索候选词提供对应的选择按键。
举例来说,如图5所示,可以在搜索候选词展示框中的每个搜索候选词之后添加一个与之相对应的选择按键,如果用户希望对某个搜索候选词进一步检索,可以点击这个选择按键,就可将选择的搜索候选词添加到搜索编辑框中。
S208,当选择按键被触发时,以被触发的选择按键对应的搜索候选词作为前缀进一步进行候选词检索。
具体地,当用户触发了选择按键时,被触发的选择按键对应的搜索候选词将被添加到搜索编辑框中,并作为前缀信息继续执行步骤S202-S207,直到搜索到用户需要的信息。
根据本发明实施例的搜索候选词的推荐方法,通过为搜索候选词添加选择按键,可将用户需要的搜索候选词作为前缀进一步进行候选词二次检索,使得检索结果更能满足用户的需求,并且可以自动添加,无需用户输入,操作简单,进一步提升了用户体验。
为了实现上述实例,本发明还提出一种搜索引擎。
一种搜索引擎,包括:接收模块,用于接收用户输入的输入信息,并获得输入信息的前缀信息;搜索词确定模块,用于将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;判断模块,用于判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;权重调整模块,用于在判断存在至少两个搜索候选词属于同一主题时,保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;排序模块,用于根据多个搜索候选词的权重进行排序;以及提供模块,用于将排序之后的搜索候选词提供至用户。
图3为根据本发明一个实施例的搜索引擎的结构框图。
如图3所示,根据本发明实施例的搜索引擎包括:接收模块100、搜索词确定模块200、判断模块300、权重调整模块400、排序模块500以及提供模块600。
具体地,接收模块100用于接收用户输入的输入信息,并获得输入信息的前缀信息。更具体地,当接收模块100在接收用户输入的输入信息时,可将用户输入的输入信息作为前缀信息,以便于搜索词确定模块200根据用户输入的前缀信息为用户提供丰富的并且与用户输入信息匹配的搜索候选词。
搜索词确定模块200用于将前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重。更具体地,搜索词确定模块200将前缀信息作为索引获取多个前缀与前缀信息相同的搜索候选词,并获取每个候选词的权重,其中每个候选词的权重可以由该候选词的热度(即搜索频率)、以及拼写正确与否等因素决定,例如由于《普罗米修斯》的热映可能导致以“普罗米修斯”的热度提升,进而提升了普罗米修斯”的权重,因此,对于前缀信息“普”来说,包含“普罗米修斯”的候选词就会因具有较高的权重而排在前面。
判断模块300用于判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题。更具体地,判断模块300可首先分析多个搜索候选词中任两个搜索候选词之间除了前缀信息内容部分连续重复的文字或字符的字面长度,并在文字或字符的字面长度大于预设阈值时,判断大于预设阈值的两个搜索候选词是否属于同一主题,如果不大于预设阈值,则不属于同一主题,如,初始预定阈值可设置为6个字符,也就是3个汉字或6个英文字母,其中预设阈值可以由搜索引擎默认设置,并在工作过程中通过评估结果、机器学习以及用户反馈等方法进行修正。
权重调整模块400用于在判断存在至少两个搜索候选词属于同一主题时,保留至少两个搜索候选词中的一个搜索候选词的权重不变,对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理。其中,惩罚系数为0到1之间的数值,由此,权重调整模块400可通过将至少两个搜索候选词中的其他搜索候选词的权重乘以惩罚系数来降低需要降权的的搜索候选词的权重,使得其他主题的搜索候选词的权重排名能够提前,提高搜索候选词的多样性,并且惩罚系数可根据评估结果、机器学习或用户在线反馈进行调整。
例如,对于前缀信息“普”对应的多个搜索候选词,权重调整模块400可将关于“普罗米修斯”主题的4个搜索候选词中的其中3个进行降权处理,被降权处理后的搜索候选词的权重排名可能会下降,可使其他主题的搜索候选词,如“普洱茶”等的权重排名提前。
排序模块500用于根据多个搜索候选词的权重进行排序。
提供模块600用于将排序之后的搜索候选词提供至用户。在本发明的一个实施例中,提供模块600可根据获得的多个搜索候选词对应的权重将多个搜索候选词中的一部分加入至索引拉链之中,并根据排序模块500的排序结果按照权重排名将搜索候选词提供给用户。
根据本发明实施例的搜索引擎,通过权重调整模块可以在保持同一主题中的一个搜索候选词的权重不变,而对同一主题中的其他搜索候选词进行降权处理,进而提高其他主题的候选词的权重排名,使得根据权重排名提供给用户的搜索候选词能够具有不同的主题,提高了搜索候选词的多样性和准确性,能够满足用户的搜索需求,并且算法简单,易于实施,提升用户体验。
图4为根据本发明一个实施例的搜索引擎的结构框图。
如图4所示,根据本发明实施例的搜索引擎在图3所示的基础上还包括:二次检索模块700。
具体地,提供模块600还用于在搜索候选词展示框中展示权重排名大于预设位置的多个搜索候选词。更具体地,预设位置的值为搜索候选词展示框中可显示的搜索候选词的个数,可将搜索拉链中权重排名大于预设位置的多个搜索候选词在搜索候选词展示框中展示,如图5所示,如果预设位置为6时,对于前缀信息“普”对应的多个搜索候选词展示结果。
二次检索模块700用于在搜索候选词展示框中针对展示框中的每个搜索候选词提供对应的选择按键,并在选择按键被触发时,以被触发的选择按键对应的搜索候选词作为前缀进一步进行候选词检索。举例来说,如图5所示,可以在搜索候选词展示框中的每个搜索候选词之后添加一个与之相对应的选择按键,如果用户希望对某个搜索候选词进一步检索,可以点击这个选择按键,当用户触发了选择按键时,被触发的选择按键对应的搜索候选词将被添加到搜索编辑框中,并作为前缀信息进一步检索,直到搜索到用户需要的信息。
根据本发明实施例的搜索引擎,通过二次检索模块可为搜索候选词添加选择按键,可将用户需要的搜索候选词作为前缀进一步进行二次检索,使得检索结果更能满足用户的需求,并且可以自动添加,无需用户输入,操作简单,进一步提升了用户体验。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对所述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。

Claims (14)

1.一种搜索候选词的推荐方法,其特征在于,包括以下步骤:
搜索引擎服务器接收用户输入的输入信息,并获得所述输入信息的前缀信息;
将所述前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;
判断所述多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;
如果判断所述存在至少两个搜索候选词属于同一主题,则保留所述至少两个搜索候选词中的一个搜索候选词的权重不变,对所述至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;以及
根据所述多个搜索候选词的权重进行排序,将排序之后的搜索候选词提供至所述用户。
2.如权利要求1所述的搜索候选词的推荐方法,其特征在于,所述判断多个搜索候选词中是否存在至少两个搜索候选词属于同一主题进一步包括:
分析所述多个搜索候选词中任两个搜索候选词之间除了所述前缀信息之外连续重复的文字或字符的字面长度;以及
如果所述字面长度大于预设阈值,则判断大于所述预设阈值的两个搜索候选词是否属于同一主题。
3.如权利要求2所述的搜索候选词的推荐方法,其特征在于,在所述将所述前缀信息作为索引获得多个搜索候选词之后,还包括:
根据对应的权重将所述多个搜索候选词中的一部分加入至索引拉链之中。
4.如权利要求1-3任一项所述的搜索候选词的推荐方法,其特征在于,所述对至少两个搜索候选词中的其他搜索候选词的权重进行降权处理进一步包括:
将所述至少两个搜索候选词中的其他搜索候选词的权重乘以惩罚系数。
5.如权利要求4所述的搜索候选词的推荐方法,其特征在于,还包括:
根据评估结果、机器学习或用户在线反馈对所述惩罚系数进行调整。
6.如权利要求1-3任一项所述的搜索候选词的推荐方法,其特征在于,在所述将排序之后的搜索候选词提供至所述用户之后,还包括:
在搜索候选词展示框中展示权重排名大于预设位置的多个搜索候选词。
7.如权利要求6所述的搜索候选词的推荐方法,其特征在于,还包括:
在所述搜索候选词展示框中针对所述展示框中的每个搜索候选词提供对应的选择按键;
当所述选择按键被触发时,以被触发的选择按键对应的搜索候选词作为前缀进一步进行候选词检索。
8.一种搜索引擎,其特征在于,包括:
接收模块,用于接收用户输入的输入信息,并获得所述输入信息的前缀信息;
搜索词确定模块,用于将所述前缀信息作为索引获得多个搜索候选词以及每个搜索候选词的权重;
判断模块,用于判断所述多个搜索候选词中是否存在至少两个搜索候选词属于同一主题;
权重调整模块,用于在判断所述存在至少两个搜索候选词属于同一主题时,保留所述至少两个搜索候选词中的一个搜索候选词的权重不变,对所述至少两个搜索候选词中的其他搜索候选词的权重进行降权处理;
排序模块,用于根据所述多个搜索候选词的权重进行排序;以及
提供模块,用于将排序之后的搜索候选词提供至所述用户。
9.如权利要求8所述的搜索引擎,其特征在于,所述判断模块分析所述多个搜索候选词中任两个搜索候选词之间除了所述前缀信息之外连续重复的文字或字符的字面长度,当所述字面长度大于预设阈值时,判断大于所述预设阈值的两个搜索候选词是否属于同一主题。
10.如权利要求9所述的搜索引擎,其特征在于,所述提供模块根据对应的权重将所述多个搜索候选词中的一部分加入至索引拉链之中。
11.如权利要求8所述的搜索引擎,其特征在于,所述权重调整模块将所述至少两个搜索候选词中的其他搜索候选词的权重乘以惩罚系数。
12.如权利要求11所述的搜索引擎,其特征在于,所述权重调整模块,还用于根据评估结果、机器学习或用户在线反馈对所述惩罚系数进行调整。
13.如权利要求8所述的搜索引擎,其特征在于,所述提供模块在搜索候选词展示框中展示权重排名大于预设位置的多个搜索候选词。
14.如权利要求13所述的搜索引擎,其特征在于,还包括:
二次检索模块,用于在所述搜索候选词展示框中针对所述展示框中的每个搜索候选词提供对应的选择按键,并在所述选择按键被触发时,以被触发的选择按键对应的搜索候选词作为前缀进一步进行候选词检索。
CN201310165048.3A 2013-05-07 2013-05-07 搜索候选词的推荐方法及搜索引擎 Active CN103258023B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310165048.3A CN103258023B (zh) 2013-05-07 2013-05-07 搜索候选词的推荐方法及搜索引擎

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310165048.3A CN103258023B (zh) 2013-05-07 2013-05-07 搜索候选词的推荐方法及搜索引擎

Publications (2)

Publication Number Publication Date
CN103258023A CN103258023A (zh) 2013-08-21
CN103258023B true CN103258023B (zh) 2016-08-31

Family

ID=48961940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310165048.3A Active CN103258023B (zh) 2013-05-07 2013-05-07 搜索候选词的推荐方法及搜索引擎

Country Status (1)

Country Link
CN (1) CN103258023B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631929B (zh) * 2013-12-09 2016-08-31 江苏金智教育信息股份有限公司 一种用于搜索的智能提示的方法、模块和***
US11061893B2 (en) * 2014-05-30 2021-07-13 Apple Inc. Multi-domain query completion
CN104156492A (zh) * 2014-09-02 2014-11-19 北京国双科技有限公司 搜索内容的提示方法和装置
CN105488121A (zh) * 2015-11-24 2016-04-13 魏强 精确检索***
CN107665217A (zh) * 2016-07-29 2018-02-06 苏宁云商集团股份有限公司 一种用于搜索业务的词汇处理方法及***
CN107273537A (zh) * 2017-06-30 2017-10-20 深圳创维数字技术有限公司 一种搜索词推荐方法、机顶盒和存储介质
CN109582847B (zh) * 2018-11-23 2021-08-24 咪咕视讯科技有限公司 一种信息处理方法及装置、存储介质
CN110516062B (zh) * 2019-08-26 2022-11-04 腾讯科技(深圳)有限公司 一种文档的搜索处理方法及装置
CN113239284B (zh) * 2021-07-13 2021-10-15 武汉斗鱼鱼乐网络科技有限公司 推荐信息的顺序确定方法及装置
CN116954804A (zh) * 2023-08-08 2023-10-27 河北网新科技集团股份有限公司 一种界面引擎中的图形图像渲染方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102163228A (zh) * 2011-04-13 2011-08-24 北京百度网讯科技有限公司 用于确定资源候选项的排序结果的方法、装置及设备
CN102637171A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种优化搜索结果的方法和装置
CN102682001A (zh) * 2011-03-09 2012-09-19 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
CN102687138A (zh) * 2009-12-28 2012-09-19 雅虎公司 搜索建议聚类和呈现
CN102902753A (zh) * 2012-09-20 2013-01-30 北京奇虎科技有限公司 用于补全搜索词及建立个体兴趣模型的方法及装置
CN102937976A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种基于输入前缀的下拉提示方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8732171B2 (en) * 2010-01-28 2014-05-20 Microsoft Corporation Providing query suggestions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102687138A (zh) * 2009-12-28 2012-09-19 雅虎公司 搜索建议聚类和呈现
CN102637171A (zh) * 2011-02-10 2012-08-15 北京百度网讯科技有限公司 一种优化搜索结果的方法和装置
CN102682001A (zh) * 2011-03-09 2012-09-19 阿里巴巴集团控股有限公司 一种确定推荐词的方法及设备
CN102163228A (zh) * 2011-04-13 2011-08-24 北京百度网讯科技有限公司 用于确定资源候选项的排序结果的方法、装置及设备
CN102902753A (zh) * 2012-09-20 2013-01-30 北京奇虎科技有限公司 用于补全搜索词及建立个体兴趣模型的方法及装置
CN102937976A (zh) * 2012-10-17 2013-02-20 北京奇虎科技有限公司 一种基于输入前缀的下拉提示方法和装置

Also Published As

Publication number Publication date
CN103258023A (zh) 2013-08-21

Similar Documents

Publication Publication Date Title
CN103258023B (zh) 搜索候选词的推荐方法及搜索引擎
Chamberlain et al. taxize: taxonomic search and retrieval in R
JP4429236B2 (ja) 分類ルール作成支援方法
KR100992169B1 (ko) 정보 분석프로세스 추천 설계시스템 및 방법
US20100057725A1 (en) Information retrieval device, information retrieval method, and program
CN105069103B (zh) App搜索引擎利用用户评论的方法及***
Carnerud et al. Four decades of research on quality: summarising, Trendspotting and looking ahead
KR20190019077A (ko) 설계 지원 시스템
KR101925950B1 (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
KR20130140094A (ko) 실시간 검색 그리드 업데이트
CN102156747B (zh) 一种引入社会化标签的协作过滤评分预测方法及装置
US5742776A (en) Decision support system
JP5429377B2 (ja) 文字入力における候補の表示方法
KR101864401B1 (ko) 전통문화 융복합 지원을 위한 디지털 연표 표출 시스템
Yavuz Iterated beam search for the combined car sequencing and level scheduling problem
Karnik et al. Automated ESP Failure Root Cause Identification and Analyses Using Machine Learning and Natural Language Processing Technologies
JP4247266B2 (ja) スレッド順位付け装置及びスレッド順位付け方法
JP5160773B2 (ja) 情報処理装置およびその方法
CN102110095A (zh) 专利申请人技术发展趋势分析方法
CN106021521B (zh) 一种材料失效案例共享方法
CN107748789B (zh) 专利检索***
JP2010282402A (ja) 検索システム
KR101385452B1 (ko) 네트워크 분석 방법을 이용한 연구개발 우선순위 결정 장치 및 방법
CN106021317A (zh) 产品侵权分析辅助***及其辅助方法
WO2023279174A1 (en) Project schedule analysis tool

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant