CN103902697A - 组合搜索方法、客户端和服务器 - Google Patents

组合搜索方法、客户端和服务器 Download PDF

Info

Publication number
CN103902697A
CN103902697A CN201410124056.8A CN201410124056A CN103902697A CN 103902697 A CN103902697 A CN 103902697A CN 201410124056 A CN201410124056 A CN 201410124056A CN 103902697 A CN103902697 A CN 103902697A
Authority
CN
China
Prior art keywords
search
information
server
query word
object search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410124056.8A
Other languages
English (en)
Other versions
CN103902697B (zh
Inventor
唐娴
徐建春
马泽锋
鲍金霞
张瑞星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410124056.8A priority Critical patent/CN103902697B/zh
Publication of CN103902697A publication Critical patent/CN103902697A/zh
Priority to JP2014264369A priority patent/JP6047550B2/ja
Priority to EP14200400.1A priority patent/EP2930628A1/en
Priority to US14/585,350 priority patent/US10127253B2/en
Application granted granted Critical
Publication of CN103902697B publication Critical patent/CN103902697B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提出一种组合搜索方法、客户端和服务器。其中,组合搜索方法包括:获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合;以及接收服务器根据查询词组合返回的搜索结果。本发明实施例的组合搜索方法,通过获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合,以使服务器根据查询词组合进行搜索,避免了重复搜索,提高了搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升了用户体验。

Description

组合搜索方法、客户端和服务器
技术领域
本发明涉及计算机网络技术领域,特别涉及一种组合搜索方法、客户端和服务器。
背景技术
随着计算机技术的不断进步,互联网的应用越来越普及,用户可以通过搜索引擎来获取所需的资源。目前,用户可通过在搜索引擎的搜索框中输入关键词,对资源进行搜索。
为了增加搜索结果的准确性,用户可在搜索框中输入多个关键词,进行组合搜索,这样可缩小搜索结果的范围,使用户能够快速地获得所需的资源。
但是,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:通过输入关键词进行资源搜索,搜索结果并不精准,无法快速、准确地定位用户的需求,而且通过多个关键词组合搜索,只能在同一级页面中进行组合,维度单一,搜索结果无法满足用户需求,用户体验差。
发明内容
本发明实施例旨在至少在一定程度上解决上述技术问题。
为此,本发明的第一个目的在于提出一种组合搜索方法,该方法能够避免重复搜索,提高搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升用户体验。
本发明的第二个目的在于提出另一种组合搜索方法。
本发明的第三个目的在于提出一种客户端。
本发明的第四个目的在于提出一种服务器。
为达上述目的,根据本发明第一方面实施例提出了一种组合搜索方法,包括:获得用户从多级分类页面选择的查询词组合,并向服务器发送所述查询词组合;以及接收所述服务器根据所述查询词组合返回的搜索结果。
本发明实施例的组合搜索方法,通过获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合,以使服务器根据查询词组合进行搜索,避免了重复搜索,提高了搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升了用户体验。
本发明第二方面实施例提出了另一种组合搜索方法,包括:接收客户端发送的查询词组合;根据所述查询词组合查询搜索对象的倒排索引数据库,获得搜索结果;以及向所述客户端返回所述搜索结果。
本发明实施例的组合搜索方法,通过服务器根据查询词组合查询搜索对象的倒排索引数据库,使得搜索结果更加准确,并且根据搜索对象在搜索结果中出现的次数对搜索结果进行排序,使搜索结果更加符合用户的需求,提升了用户体验。
本发明第三方面实施例提出了一种客户端,包括:获得发送模块,用于获得用户从多级分类页面选择的查询词组合,并向服务器发送所述查询词组合;以及接收模块,用于接收所述服务器根据所述查询词组合返回的搜索结果。
本发明实施例的客户端,通过获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合,以使服务器根据查询词组合进行搜索,避免了重复搜索,提高了搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升了用户体验。
本发明第四方面实施例提出了一种服务器,包括:接收模块,用于接收客户端发送的查询词组合;搜索模块,用于根据所述接收模块接收的所述查询词组合查询搜索对象的倒排索引数据库,获得搜索结果;以及返回模块,用于向所述客户端返回所述搜索模块获得的所述搜索结果。
本发明实施例的服务器,通过服务器根据查询词组合查询搜索对象的倒排索引数据库,使得搜索结果更加准确,并且根据搜索对象在搜索结果中出现的次数对搜索结果进行排序,使搜索结果更加符合用户的需求,提升了用户体验。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
图1为根据本发明一个实施例的组合搜索方法的流程图;
图2为根据本发明另一个实施例的组合搜索方法的流程图;
图3为根据本发明一个具体实施例的组合搜索小说的方法的流程图;
图4为组合搜索小说主界面的效果示意图;
图5为组合搜索小说类型页面的效果示意图;
图6为组合搜索小说主角类别页面的效果示意图;
图7为组合搜索小说阅读时长页面的效果示意图;
图8为组合搜索小说正在进行搜索的效果示意图;
图9为组合搜索小说展示搜索结果的效果示意图;
图10为在不同分级页面进行组合搜索的整体流程的效果图;
图11为自动推荐组合搜索并展示搜索结果的效果示意图;
图12为浮层展示组合搜索的效果示意图;
图13为根据本发明一个实施例的客户端的结构示意图;
图14为根据本发明一个实施例的服务器的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的组合搜索方法、客户端和服务器。
图1为根据本发明一个实施例的组合搜索方法的流程图。此方法从客户端侧进行描述。如图1所示,该组合搜索方法包括:
S101,获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合。
在该实施例中,多级分类页面是指至少两级分类页面,其中,一级分类页面上可以有搜索对象的多个类别信息,每个类别信息可以对应一个二级分类页面,即用户点击一级分类页面上的某一类别信息后,可以进入对应该类别信息的二级分类页面。
具体地,客户端可获得用户从多个级别的分类页面选择的查询词,其中,用户从每个分类页面可以选择至少一个查询词即类别信息。然后客户端将从不同级别的分类页面选择的查询词进行组合,并向服务器发送查询词组合,以使服务器接收到查询词组合后进行搜索。
在本发明的实施例中,在获得用户从多级分类页面选择的查询词组合之前,先要建立多级分类页面。具体地,客户端首先获得搜索对象的类别信息,然后根据类别信息建立并显示多级分类页面。
更具体地,客户端首先获得搜索对象的类别信息可以通过以下方式实现:客户端从服务器获得搜索对象的初始类别信息,对搜索对象的初始类别信息进行处理,获得搜索对象的类别信息。
其中,初始类别信息可以为服务器通过网络爬虫或对服务器侧的数据库进行信息提取获得的。通过网络爬虫获得的初始类别信息是UGC(User Generated Content,用户生成内容)数据,即用户通过互联网进行展示或者提供给其他用户的原创的内容,获得的方式简单并且数据噪声小,可直接使用无需处理。通过对服务器侧的数据库进行信息提取获得的初始类别信息,主要包括通过对问答数据进行意图识别,然后通过中文切词、词性标注、命名实体识别等自然语言处理技术,从而获得初始类别信息。客户端还可以通过搜索日志获得初始类别信息。通过对服务器侧的数据库进行信息提取获得的初始类别信息数据噪声大,因此需要对初始类别信息进行处理。客户端可统计每个初始类别信息的词频,删除词频小于预定阈值的初始类别信息,从而对搜索对象的初始类别信息进行处理。
在获得搜索对象的类别信息之后,客户端向服务器发送类别信息,以使服务器根据类别信息建立搜索对象的倒排索引数据库。
其中,搜索对象可以是小说、音乐、APP、旅游目的地、文章、导购等。
S102,接收服务器根据查询词组合返回的搜索结果。
具体地,在服务器根据查询词组合进行搜索并获得搜索结果之后,客户端接收服务器该搜索结果,并向用户进行展示。
优选地,一级分类页面的多个类别信息和每个类别信息对应的二级分类页面的类别信息可以是互斥关系,这种分类方式可以引导用户合理的组合不同类别信息,以进行组合搜索,避免了对同一类别的重复搜索,提高了搜索的效率。
本发明实施例的组合搜索方法,通过获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合,以使服务器根据查询词组合进行搜索,避免了重复搜索,提高了搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升了用户体验。
图2为根据本发明另一个实施例的组合搜索方法的流程图。此方法从服务器侧进行描述。如图2所示,该组合搜索方法包括:
S201,接收客户端发送的查询词组合。
具体地,服务器可接收客户端发送的用户从多级分类页面选择的查询词组合,从而对查询词组合进行搜索。
S202,根据查询词组合查询搜索对象的倒排索引数据库,获得搜索结果。
具体地,在接收客户端发送的用户从多级分类页面选择的查询词组合后,服务器可根据查询词组合查询搜索对象的倒排索引数据库,并获得搜索结果。
在本发明的实施例中,在根据查询词组合查询搜索对象的倒排索引数据库之前,先要建立搜索对象的倒排索引数据库。具体地,服务器首先接收客户端发送的搜索对象的类别信息,并根据类别信息获得与类别信息对应的搜索对象信息,然后根据类别信息和与类别信息对应的搜索对象信息建立类别信息与搜索对象信息的对应关系,以完成搜索对象的倒排索引数据库的建立。
在本发明的实施例中,服务器在接收客户端发送的查询词组合之后,服务器可根据查询词组合中的查询词更新对应的倒排索引数据库。例如:查询词组合为“温暖”+“种田”,服务器只需更新查询词组合“温暖”+“种田”对应的倒排索引数据库。
S203,向客户端返回搜索结果。
具体地,服务器首先对搜索结果进行排序处理,然后向客户端返回排序后的搜索结果。更具体地,服务器可统计每个搜索结果中搜索对象出现的次数,根据次数对搜索结果进行排序。
本发明实施例的组合搜索方法,通过服务器根据查询词组合查询搜索对象的倒排索引数据库,使得搜索结果更加准确,并且根据搜索对象在搜索结果中出现的次数对搜索结果进行排序,使搜索结果更加符合用户的需求,提升了用户体验。
图3为根据本发明一个具体实施例的组合搜索小说的方法的流程图。如图3所示,该方法包括:
S301,显示一级分类页面。
其中,如图4所示,一级分类页面包括:、“看阅读心情”、“看小说主角”、“看阅读时长”、“看小说类型”、“看阅读地点”、“看小说作者”、“看阅读字数”和“看小说风格”八个类别,即八个标签(tag),每个类别均对应一个按钮。以上类别仅为示例,本实施例不做限定。一级分类页面中的分类还可以包括:文笔风格、流派特征、故事背景、主角身份、主角特征、主角关系、故事情节、小说类型、小说字数等。用户可通过点击按钮即可进入相应的二级分类页面,例如:点击“看阅读心情”按钮就进入“看阅读心情”页面等等。
此外,客户端还提供了“搜索组合推荐”。“搜索组合推荐”其实是搜索功能的缺省页,在本发明的实施例中,如图4所示,客户端没有将一级分类页面进行单独展示,而是将“搜索组合推荐”与一级分类页面中的类别在同一页面中同时展示。本发明也可将缺省页和一级分类页面拆分,在不同页面中分开展示。如果以上类别没有满足用户需求的类别,可以将页面显示的类别进行更换,直至满足用户需求为止。
S302,显示二级分类页面“看小说类型”页面,选择“现代商战”tag。
用户点击“看小说类型”按钮后,进入到“看小说类型”页面后,客户端可在这个页面中显示多种小说类别,例如:“今穿古”、“现代商战”、“种田”等,用户可根据自身喜好进行选择。如图5所示,用户选中“现代商战”tag,此时搜索输入框中显示出搜索词“现代商战”,同时返回至一级分类页面。
S303,显示二级分类页面“看小说主角”页面,选择“都可以”tag。
用户点击“看小说主角”按钮后,进入到“看小说主角”页面后,客户端可在这个页面中显示多种主角的类别,例如:“都可以”、“霸气”、“腹黑”等,用户可根据自身喜好进行选择。如图6所示,用户选中“都可以”tag,表示对主角的形象描述没有要求,因此在搜索输入框中无需添加搜索词“都可以”。同时,返回至一级分类页面。
S304,显示二级分类页面“看阅读时长”页面,选择“30分内”tag。
用户点击“看阅读时长”按钮后,进入到“看阅读时长”页面后,客户端可在这个页面中显示多种阅读时间的类别,例如:“都可以”、“30分内”、“10分内”等,用户可根据自身喜好进行选择。如图7所示,用户选中“30分内”tag,表示小说的长度能够在30分钟内阅读完。此时,搜索输入框中添加搜索词“30分内”,同时返回一级分类页面。
S305,向服务器发送搜索词组合,以使服务器根据搜索词组合进行搜索。
客户端将在不同的二级分类页面选中的tag进行组合,即“现代商战”+“30分内”,然后将tag组合发送至服务器,以使服务器根据tag组合进行搜索。如图8所示。由于对主角没有要求,因此无需对“都可以”进行组合。
S306,接收服务器返回的搜索结果并进行展示。
在服务器根据tag组合进行搜索后,服务器将搜索结果返回至客户端,客户端接收服务器返回的搜索结果,并按照预定的排序进行展示。本实施例中,客户端接收小说类型为“现代商战”,主角为“都可以”,阅读时长在“30分内”的小说列表并展示。如图9所示,根据“现代商战”+“30分内”的tag组合,搜索结果为3本小说。客户端将小说名称、类型、封面图片、简介等展示给用户,使用户选择感兴趣的小说。
其中,服务器是通过倒排索引的方式进行搜索的。倒排索引是相对于正排索引而言的。小说的正排索引是通过小说名称(标识ID)到小说tag的映射,根据映射可快速地搜索出某个小说名称(标识ID)对应的tag。但是若要根据小说tag反向搜索包含词tag的小说名称(标识ID)集合,则正排索引的方式效率低。倒排索引建立的是从小说tag到小说名称(标识ID)的对应关系,因此可以快速地根据小说tag搜索到需要的小说。
在组合搜索的情况下,根据不同分级页面中用户选择的多个tag,对小说进行搜索。满足tag个数多的小说,排序位置更靠前。因此,可根据搜索结果中小说出现的次数、小说的热度等进行排序并进行展示。
在不同分级页面进行组合搜索的整体流程,可如图10所示。
在本发明的实施例中,客户端还提供了“搜索组合推荐”。用户在点击“搜索组合推荐”按钮后,会进入“搜索组合推荐”页面,如图11a所示。页面中自动向用户提供了多种搜索组合,如图11b所示。例如:“温暖”+“种田”、“5分钟速读”+“穿越”+“腹黑男主”等。用户选中其中一个搜索组合,就会自动根据该组合进行搜索,并获得相应的搜索结果,如图11c所示。
此外,上述分类页面可以有不同的展现样式,例如:在一级分类页面中选中类别,弹出的二级分类页面可以通过浮层的方式展示。
如图12a所示,在一级分类页面中包括有“主角关系”、“女主身份”、“男主身份”、“故事背景”、“故事流派”等类别,以按钮形式展现。点击其中一个按钮,例如“男主身份”,会以浮层形式展示“男主身份”的二级分类页面,如图12b所示。二级分类页面包括:“帝王”、“王爷”、“皇子”、“特工”、“明星”类别等。用户点击选择“帝王”后,该浮层关闭,则“男主身份”变为“帝王”。如果以上类别没有满足用户需求的类别,可以通过点击浮层页面中的“换一批”按钮将显示的类别进行更换,直至满足用户需求为止。一级分类页面中其他的类别也可按照上述方法进行选择。最后将不同页面中选择的搜索类别进行组合搜索,然后将获得的搜索结果按照预定的排序进行展示。
本发明实施例的组合搜索小说的方法,有效地引导了用户需求,并将多个不同分类页面的类别进行组合搜索,使搜索出的小说更符合用户需求,提升了用户体验。
为了实现上述实施例,本发明还提出一种客户端。
图13为根据本发明一个实施例的客户端的结构示意图。如图13所示,客户端包括:获得发送模块110、接收模块120和建立显示模块130。
获得发送模块110用于获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合。
在该实施例中,多级分类页面是指至少两级分类页面,其中,一级分类页面上可以有搜索对象的多个类别信息,每个类别信息可以对应一个二级分类页面,即用户点击一级分类页面上的某一类别信息后,可以进入对应该类别信息的二级分类页面。一级分类页面的多个类别信息和每个类别信息对应的二级分类页面的类别信息均是互斥关系,因此这种分类方式可以引导用户合理的组合不同类别信息,以进行组合搜索,避免了对同一类别的组合搜索,从而避免的重复搜索,增加了搜索的效率。
具体地,获得发送模块110可获得用户从多个级别的分类页面选择的查询词,其中,用户从每个分类页面可以选择至少一个查询词即类别信息。然后获得发送模块110将从不同级别的分类页面选择的查询词进行组合,并向服务器发送查询词组合,以使服务器接收到查询词组合后进行搜索。
在获得搜索对象的类别信息之后,获得发送模块110还可向服务器发送类别信息,以使服务器根据类别信息建立搜索对象的倒排索引数据库。其中,搜索对象可以是小说、音乐、APP、旅游目的地、文章、导购等。
接收模块120用于接收服务器根据查询词组合返回的搜索结果。
具体地,在服务器根据查询词组合进行搜索并获得搜索结果之后,接收模块120接收服务器该搜索结果,并向用户进行展示。
优选地,一级分类页面的多个类别信息和每个类别信息对应的二级分类页面的类别信息可以是互斥关系,这种分类方式可以引导用户合理的组合不同类别信息,以进行组合搜索,避免了对同一类别的重复搜索,提高了搜索的效率。
建立显示模块130用于在获得用户从多级分类页面选择的查询词组合之前,获得搜索对象的类别信息,根据类别信息建立并显示多级分类页面。
具体地,建立显示模块130获得搜索对象的类别信息可以通过以下方式实现:从服务器获得搜索对象的初始类别信息,对搜索对象的初始类别信息进行处理,获得搜索对象的类别信息。其中,初始类别信息可以为服务器通过网络爬虫或对服务器侧的数据库进行信息提取获得的。通过网络爬虫获得的初始类别信息是UGC(User Generated Content,用户生成内容)数据,即用户通过互联网进行展示或者提供给其他用户的原创的内容,获得的方式简单并且数据噪声小,可直接使用无需处理。建立显示模块130通过对服务器侧的数据库进行信息提取获得的初始类别信息,主要包括通过对问答数据进行意图识别,然后通过中文切词、词性标注、命名实体识别等自然语言处理技术,从而获得初始类别信息。还可以通过搜索日志获得初始类别信息。通过对服务器侧的数据库进行信息提取获得的初始类别信息数据噪声大,因此需要对初始类别信息进行处理。建立显示模块130可统计每个初始类别信息的词频,删除词频小于预定阈值的初始类别信息,从而对搜索对象的初始类别信息进行处理。
本发明实施例的客户端,通过获得用户从多级分类页面选择的查询词组合,并向服务器发送查询词组合,以使服务器根据查询词组合进行搜索,避免了重复搜索,提高了搜索的效率,并且在用户不知道搜索对象的具体信息的情况下,可以获得符合用户需求的搜索结果,提升了用户体验。
图14为根据本发明一个实施例的服务器的结构示意图。如图14所示,服务器包括:接收模块210、搜索模块220、返回模块230、建立模块240和更新模块250。
接收模块210用于接收客户端发送的查询词组合。
具体地,接收模块210可接收客户端发送的用户从多级分类页面选择的查询词组合,从而对查询词组合进行搜索。
搜索模块220用于根据接收模块接收的查询词组合查询搜索对象的倒排索引数据库,获得搜索结果。
具体地,在接收客户端发送的用户从多级分类页面选择的查询词组合后,搜索模块220可根据查询词组合查询搜索对象的倒排索引数据库,并获得搜索结果。
返回模块230用于向客户端返回搜索模块获得的搜索结果。
具体地,返回模块230首先对搜索结果进行排序处理,然后向客户端返回排序后的搜索结果。更具体地,返回模块230可统计每个搜索结果中搜索对象出现的次数,根据次数对搜索结果进行排序。
建立模块240用于在搜索模块根据查询词组合查询搜索对象的倒排索引数据库之前,建立搜索对象的倒排索引数据库。具体地,首先接收客户端发送的搜索对象的类别信息,并根据类别信息获得与类别信息对应的搜索对象信息,然后根据类别信息和与类别信息对应的搜索对象信息建立类别信息与搜索对象信息的对应关系,最后完成搜索对象的倒排索引数据库的建立。
更新模块250用于在接收模块接收客户端发送的查询词组合之后,根据查询词组合中的查询词更新对应的倒排索引数据库。例如:查询词组合为“温暖”+“种田”,服务器只需更新查询词组合“温暖”+“种田”对应的倒排索引数据库。
本发明实施例的服务器,通过服务器根据查询词组合查询搜索对象的倒排索引数据库,使得搜索结果更加准确,并且根据搜索对象在搜索结果中出现的次数对搜索结果进行排序,使搜索结果更加符合用户的需求,提升了用户体验。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (20)

1.一种组合搜索方法,其特征在于,包括:
获得用户从多级分类页面选择的查询词组合,并向服务器发送所述查询词组合;以及接收所述服务器根据所述查询词组合返回的搜索结果。
2.根据权利要求1所述的方法,其特征在于,在所述获得用户从多级分类页面选择的查询词组合之前,还包括:
获得搜索对象的类别信息,根据所述类别信息建立并显示所述多级分类页面。
3.根据权利要求2所述的方法,其特征在于,所述获得搜索对象的类别信息包括:
从所述服务器获得所述搜索对象的初始类别信息,对所述搜索对象的初始类别信息进行处理,获得所述搜索对象的类别信息。
4.根据权利要求3所述的方法,其特征在于,所述初始类别信息为所述服务器通过网络爬虫或对服务器侧的数据库进行信息提取获得的;或者
所述对所述搜索对象的初始类别信息进行处理包括:
统计每个初始类别信息的词频,删除所述词频小于预定阈值的初始类别信息。
5.根据权利要求2所述的方法,其特征在于,在所述获得搜索对象的类别信息之后,还包括:
向所述服务器发送所述类别信息,以使所述服务器根据所述类别信息建立所述搜索对象的倒排索引数据库。
6.一种组合搜索方法,其特征在于,包括:
接收客户端发送的查询词组合;
根据所述查询词组合查询搜索对象的倒排索引数据库,获得搜索结果;以及
向所述客户端返回所述搜索结果。
7.根据权利要求6所述的方法,其特征在于,所述向所述客户端返回所述搜索结果包括:
对所述搜索结果进行排序处理,并向所述客户端返回排序后的搜索结果。
8.根据权利要求6所述的方法,其特征在于,在所述根据所述查询词组合查询搜索对象的倒排索引数据库之前,还包括:
接收所述客户端发送的所述搜索对象的类别信息,根据所述类别信息获得与所述类别信息对应的搜索对象信息;以及
根据所述类别信息和与所述类别信息对应的搜索对象信息建立所述类别信息与所述搜索对象信息的对应关系,以完成所述搜索对象的倒排索引数据库的建立。
9.根据权利要求6所述的方法,其特征在于,在所述接收客户端发送的查询词组合之后,还包括:
根据所述查询词组合中的查询词更新对应的倒排索引数据库。
10.根据权利要求7所述的方法,其特征在于,所述对所述搜索结果进行排序处理,包括:
统计每个搜索结果中搜索对象出现的次数,根据所述次数对所述搜索结果进行排序。
11.一种客户端,其特征在于,包括:
获得发送模块,用于获得用户从多级分类页面选择的查询词组合,并向服务器发送所述查询词组合;以及
接收模块,用于接收所述服务器根据所述查询词组合返回的搜索结果。
12.根据权利要求11所述的客户端,其特征在于,还包括:
建立显示模块,用于在所述获得用户从多级分类页面选择的查询词组合之前,获得搜索对象的类别信息,根据所述类别信息建立并显示所述多级分类页面。
13.根据权利要求12所述的客户端,其特征在于,所述建立显示模块,具体用于:
从所述服务器获得所述搜索对象的初始类别信息,对所述搜索对象的初始类别信息进行处理,获得所述搜索对象的类别信息。
14.根据权利要求13所述的客户端,其特征在于,所述初始类别信息为所述服务器通过网络爬虫或对服务器侧的数据库进行信息提取获得的;或者
所述建立显示模块,具体用于:
统计每个初始类别信息的词频,删除所述词频小于预定阈值的初始类别信息。
15.根据权利要求12所述的客户端,其特征在于,所述获得发送模块,还用于:
在所述建立显示模块获得搜索对象的类别信息之后,向所述服务器发送所述类别信息,以使所述服务器根据所述类别信息建立所述搜索对象的倒排索引数据库。
16.一种服务器,其特征在于,包括:
接收模块,用于接收客户端发送的查询词组合;
搜索模块,用于根据所述接收模块接收的所述查询词组合查询搜索对象的倒排索引数据库,获得搜索结果;以及
返回模块,用于向所述客户端返回所述搜索模块获得的所述搜索结果。
17.根据权利要求16所述的服务器,其特征在于,所述返回模块,具体用于:对所述搜索结果进行排序处理,并向所述客户端返回排序后的搜索结果。
18.根据权利要求16所述的服务器,其特征在于,还包括:
建立模块,用于在所述搜索模块根据所述查询词组合查询搜索对象的倒排索引数据库之前,接收所述客户端发送的所述搜索对象的类别信息,根据所述类别信息获得与所述类别信息对应的搜索对象信息;以及
根据所述类别信息和与所述类别信息对应的搜索对象信息建立所述类别信息与所述搜索对象信息的对应关系,以完成所述搜索对象的倒排索引数据库的建立。
19.根据权利要求16所述的服务器,其特征在于,还包括:
更新模块,用于在所述接收模块接收客户端发送的查询词组合之后,根据所述查询词组合中的查询词更新对应的倒排索引数据库。
20.根据权利要求17所述的服务器,其特征在于,所述返回模块,具体用于:统计每个搜索结果中搜索对象出现的次数,根据所述次数对所述搜索结果进行排序。
CN201410124056.8A 2014-03-28 2014-03-28 组合搜索方法、客户端和服务器 Active CN103902697B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201410124056.8A CN103902697B (zh) 2014-03-28 2014-03-28 组合搜索方法、客户端和服务器
JP2014264369A JP6047550B2 (ja) 2014-03-28 2014-12-26 検索方法、クライアント及びサーバ
EP14200400.1A EP2930628A1 (en) 2014-03-28 2014-12-29 Searching method, client and server
US14/585,350 US10127253B2 (en) 2014-03-28 2014-12-30 Searching method, client and server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410124056.8A CN103902697B (zh) 2014-03-28 2014-03-28 组合搜索方法、客户端和服务器

Publications (2)

Publication Number Publication Date
CN103902697A true CN103902697A (zh) 2014-07-02
CN103902697B CN103902697B (zh) 2018-07-13

Family

ID=50994019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410124056.8A Active CN103902697B (zh) 2014-03-28 2014-03-28 组合搜索方法、客户端和服务器

Country Status (4)

Country Link
US (1) US10127253B2 (zh)
EP (1) EP2930628A1 (zh)
JP (1) JP6047550B2 (zh)
CN (1) CN103902697B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239474A (zh) * 2014-09-03 2014-12-24 百度在线网络技术(北京)有限公司 搜索界面的展现方法和装置
CN104239464A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索界面的展现方法和装置
CN104951572A (zh) * 2015-07-28 2015-09-30 郑州悉知信息技术有限公司 一种网站建立方法及服务器
CN106156187A (zh) * 2015-04-21 2016-11-23 深圳市腾讯计算机***有限公司 内容检索方法及检索***
CN108255893A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 个性化对象推荐方法和装置
CN109101593A (zh) * 2018-07-26 2018-12-28 上海证大喜马拉雅网络科技有限公司 基于类目元数据的专辑搜索方法及装置
CN110727769A (zh) * 2018-06-29 2020-01-24 优视科技(中国)有限公司 语料库生成方法及装置、人机交互处理方法及装置
CN111324830A (zh) * 2020-02-07 2020-06-23 北京星选科技有限公司 对象处理方法、装置、电子设备及计算机可读存储介质
CN111368036A (zh) * 2020-03-05 2020-07-03 百度在线网络技术(北京)有限公司 用于搜索信息的方法和装置
US11921767B1 (en) * 2018-09-14 2024-03-05 Palantir Technologies Inc. Efficient access marking approach for efficient retrieval of document access data

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10313348B2 (en) * 2016-09-19 2019-06-04 Fortinet, Inc. Document classification by a hybrid classifier
CN108803958B (zh) * 2017-04-26 2022-12-16 腾讯科技(深圳)有限公司 文件载入控制、云存储应用中实现上传的交互方法和装置
JP6694910B2 (ja) * 2018-04-03 2020-05-20 株式会社L is B Faq支援装置、faq支援システム、faq支援方法およびfaq支援プログラム
CN109145110B (zh) * 2018-06-29 2022-06-28 土巴兔集团股份有限公司 标签查询方法和装置
CN109344336A (zh) * 2018-12-25 2019-02-15 北京时光荏苒科技有限公司 搜索方法、搜索集生成方法、装置、介质、终端及服务器
US20230281254A1 (en) * 2022-03-04 2023-09-07 Humane, Inc. Structuring and presenting event data for use with wearable multimedia devices

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001075728A1 (en) * 2000-03-30 2001-10-11 I411, Inc. Methods and systems for enabling efficient retrieval of data from data collections
US20020087408A1 (en) * 1999-06-25 2002-07-04 Burnett Jonathan Robert System for providing information to intending consumers
JP2003016085A (ja) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体
US20100076952A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Self contained multi-dimensional traffic data reporting and analysis in a large scale search hosting system
CN102236691A (zh) * 2010-05-04 2011-11-09 张文广 精确导向搜索工具***
CN102880624A (zh) * 2011-07-16 2013-01-16 张文广 网站导航工具***
CN102902728A (zh) * 2012-09-07 2013-01-30 腾讯科技(深圳)有限公司 级联信息处理的方法及终端
CN102968465A (zh) * 2012-11-09 2013-03-13 同济大学 网络信息服务平台及其基于该平台的搜索服务方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842203A (en) * 1995-12-01 1998-11-24 International Business Machines Corporation Method and system for performing non-boolean search queries in a graphical user interface
US6144968A (en) * 1997-03-04 2000-11-07 Zellweger; Paul Method and apparatus for menu access to information objects indexed by hierarchically-coded keywords
US5966123A (en) * 1998-09-30 1999-10-12 Harris Corporation Meta model editor controlling topic display application
AU7534100A (en) * 1999-09-24 2001-04-24 Wordmap Limited Apparatus for and method of searching
JP2002189742A (ja) * 2000-12-21 2002-07-05 Music Gate Inc ウェブサイト検索方法
CA2473446A1 (en) * 2002-01-14 2003-07-24 Jerzy Lewak Identifier vocabulary data access method and system
US7231384B2 (en) * 2002-10-25 2007-06-12 Sap Aktiengesellschaft Navigation tool for exploring a knowledge base
JP2005063366A (ja) * 2003-08-20 2005-03-10 Hitachi Software Eng Co Ltd 情報管理装置および情報管理方法
US8156135B2 (en) * 2006-12-22 2012-04-10 Yahoo! Inc. Method and system for progressive disclosure of search results

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020087408A1 (en) * 1999-06-25 2002-07-04 Burnett Jonathan Robert System for providing information to intending consumers
WO2001075728A1 (en) * 2000-03-30 2001-10-11 I411, Inc. Methods and systems for enabling efficient retrieval of data from data collections
JP2003016085A (ja) * 2001-06-29 2003-01-17 Nippon Telegraph & Telephone West Corp コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体
US20100076952A1 (en) * 2008-09-05 2010-03-25 Xuejun Wang Self contained multi-dimensional traffic data reporting and analysis in a large scale search hosting system
CN102236691A (zh) * 2010-05-04 2011-11-09 张文广 精确导向搜索工具***
CN102880624A (zh) * 2011-07-16 2013-01-16 张文广 网站导航工具***
CN102902728A (zh) * 2012-09-07 2013-01-30 腾讯科技(深圳)有限公司 级联信息处理的方法及终端
CN102968465A (zh) * 2012-11-09 2013-03-13 同济大学 网络信息服务平台及其基于该平台的搜索服务方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104239464A (zh) * 2014-09-02 2014-12-24 百度在线网络技术(北京)有限公司 搜索界面的展现方法和装置
CN104239464B (zh) * 2014-09-02 2018-11-20 百度在线网络技术(北京)有限公司 搜索界面的展现方法和装置
CN104239474A (zh) * 2014-09-03 2014-12-24 百度在线网络技术(北京)有限公司 搜索界面的展现方法和装置
CN106156187A (zh) * 2015-04-21 2016-11-23 深圳市腾讯计算机***有限公司 内容检索方法及检索***
CN104951572B (zh) * 2015-07-28 2018-07-17 郑州悉知信息科技股份有限公司 一种网站建立方法及服务器
CN104951572A (zh) * 2015-07-28 2015-09-30 郑州悉知信息技术有限公司 一种网站建立方法及服务器
CN108255893A (zh) * 2016-12-29 2018-07-06 北京国双科技有限公司 个性化对象推荐方法和装置
CN110727769A (zh) * 2018-06-29 2020-01-24 优视科技(中国)有限公司 语料库生成方法及装置、人机交互处理方法及装置
CN110727769B (zh) * 2018-06-29 2024-04-19 阿里巴巴(中国)有限公司 语料库生成方法及装置、人机交互处理方法及装置
CN109101593A (zh) * 2018-07-26 2018-12-28 上海证大喜马拉雅网络科技有限公司 基于类目元数据的专辑搜索方法及装置
US11921767B1 (en) * 2018-09-14 2024-03-05 Palantir Technologies Inc. Efficient access marking approach for efficient retrieval of document access data
CN111324830A (zh) * 2020-02-07 2020-06-23 北京星选科技有限公司 对象处理方法、装置、电子设备及计算机可读存储介质
CN111368036A (zh) * 2020-03-05 2020-07-03 百度在线网络技术(北京)有限公司 用于搜索信息的方法和装置
CN111368036B (zh) * 2020-03-05 2023-09-26 百度在线网络技术(北京)有限公司 用于搜索信息的方法和装置

Also Published As

Publication number Publication date
US20150278266A1 (en) 2015-10-01
EP2930628A1 (en) 2015-10-14
JP2015191656A (ja) 2015-11-02
US10127253B2 (en) 2018-11-13
CN103902697B (zh) 2018-07-13
JP6047550B2 (ja) 2016-12-21

Similar Documents

Publication Publication Date Title
CN103902697A (zh) 组合搜索方法、客户端和服务器
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN105786977B (zh) 基于人工智能的移动搜索方法和装置
CN101918945B (zh) 用于执行自动扩展的语言搜索的方法和***
CN109189959B (zh) 一种构建图像数据库的方法及装置
CN103092943B (zh) 一种广告调度的方法和广告调度服务器
CN103514299A (zh) 信息搜索方法和装置
CN104572846A (zh) 一种热词推荐方法、装置和***
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN101641697A (zh) 对网页的相关搜索查询及其应用
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
CN110325986A (zh) 文章处理方法、装置、服务器及存储介质
CN101305390A (zh) 媒体对象元数据关联和排名
CN103902656A (zh) 媒体对象元数据关联和排名
EP3109775A1 (en) Multimedia content providing method and device
CN103440243A (zh) 一种教学资源推荐方法及其装置
CN110633406B (zh) 事件专题的生成方法、装置、存储介质和终端设备
CN108021715B (zh) 基于语义结构特征分析的异构标签融合***
CN107885888A (zh) 信息处理方法及装置、终端设备以及计算机可读存储介质
CN104102733A (zh) 搜索内容提供方法和搜索引擎
CN110851622A (zh) 文本生成方法和装置
CN103914552A (zh) 应用检索方法和装置
CN108153754B (zh) 一种数据处理方法及其装置
CN109657043B (zh) 自动生成文章的方法、装置、设备及存储介质
CN103995881A (zh) 搜索结果的展现方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant