CN103530385A - 基于垂直搜索频道的信息搜索方法及装置 - Google Patents
基于垂直搜索频道的信息搜索方法及装置 Download PDFInfo
- Publication number
- CN103530385A CN103530385A CN201310493026.XA CN201310493026A CN103530385A CN 103530385 A CN103530385 A CN 103530385A CN 201310493026 A CN201310493026 A CN 201310493026A CN 103530385 A CN103530385 A CN 103530385A
- Authority
- CN
- China
- Prior art keywords
- channel
- vertical search
- vertical
- demand
- search channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于垂直搜索频道的信息搜索方法和装置。其中,方法包括:接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;对关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型;判断第一垂直搜索频道是否提供有满足用户需求的所有信息类型;如果没有,则获取搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中至少一个第二垂直搜索频道提供有第一垂直搜索频道未提供的满足用户需求的信息类型。根据该方法,用户获取的搜索结果不限于当前的第一垂直搜索频道,从而更好地满足用户需求,降低频道切换成本,减少用户的无效操作。
Description
技术领域
本发明涉及互联网技术领域,具体涉及一种基于垂直搜索频道的信息搜索方法及装置。
背景技术
垂直搜索引擎是相对通用搜索引擎的信息量大,查询不准确等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务,例如,各大门户搜索网站提供的图片、音乐搜索频道,以及服务于特定行业的搜索网站,如购物,旅游,汽车等行业网站。
然而,由于垂直搜索引擎只返回关键词在该频道的结果,对于某些关键词的查询效果很差。例如,对于一些涉及信息类型广泛的关键词。图1中给出了这种情况的一个示例,如图1所示,用户在某一图片搜索频道输入关键词“刘德华”,该频道只返回了图片查询结果。然而,“刘德华”这一关键词还涉及电影、音乐等大量信息,如果用户有相关需求,则无法从当前频道中得到满足。对于其他垂直搜索频道,该问题同样存在,例如,在新闻频道中搜索新闻,则得到的通常是时效性较强的新闻结果,而且信息较为零散,增加了用户的使用难度。
由此可知,对于部分关键词,垂直搜索频道的返回结果可能过于单一,无法满足用户,导致垂直搜索频道中每天都会产生大量的非该频道能解决的用户查询,使用户产生大量的无效操作,也增加了用户的使用难度。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于垂直搜索频道的信息搜索方法及装置。
根据本发明的一个方面,提供了一种基于垂直搜索频道的信息搜索方法,包括:接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型;判断第一垂直搜索频道是否提供有满足用户需求的所有信息类型;如果第一垂直搜索频道没有提供有满足用户需求的所有信息类型,则获取搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中,至少一个第二垂直搜索频道提供有第一垂直搜索频道未提供的满足用户需求的信息类型;将第一搜索结果和第二搜索结果进行整合,并发送给客户端进行展现。
根据本发明的另一方面,提供了一种基于垂直搜索频道的信息搜索装置,包括:接收模块,适于接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;分析模块,适于对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型;判断模块,适于判断第一垂直搜索频道是否提供有满足用户需求的所有信息类型;结果获取模块,适于在判断模块判断出第一垂直搜索频道没有提供有满足用户需求的所有信息类型的情况下,获取搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中所述至少一个第二垂直搜索频道提供有所述第一垂直搜索频道未提供的满足用户需求的信息类型;整合模块,适于将所述第一搜索结果和所述第二搜索结果进行整合,并发送给客户端进行展现。
根据本发明的基于垂直搜索频道的信息搜索方法及装置,根据对搜索关键词的语义分析结果得出用户需求的信息类型,从与需求类型对应的各搜索频道中获取结果,整合后显示给用户。根据本发明的方法和装置,用户获取的搜索结果不限于当前垂直搜索频道,从而更好地满足用户需求,降低频道切换成本,减少用户的无效操作。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了现有技术中图片垂直搜索频道对搜索关键词的返回结果;
图2示出了根据本发明一个实施例的基于垂直搜索频道的信息搜索方法的流程图;
图3示出了根据本发明一个实施例的基于垂直搜索频道的信息搜索方法的垂直搜索频道的返回结果;
图4示出了根据本发明一个实施例的基于垂直搜索频道的信息搜索装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图2示出了根据本发明一个实施例的基于垂直搜索频道的信息搜索方法的流程图,如图2所示,该方法始于步骤S101,其中,接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词。
垂直搜索也是根据用户提供的搜索关键词进行检索的。用户使用垂直搜索服务时,在第一垂直搜索频道,也即用户按自身需求选定的当前垂直搜索频道的搜索栏中输入待查询的搜索关键词。客户端获取该搜索关键词并将其发送至垂直搜索引擎,垂直搜索引擎在预先建立的索引库中找到匹配该搜索关键词的内容。与通用搜索不同的是,垂直搜索以一特定类别为主题,只抓取与所关注的行业主题相关信息,根据主题特点有针对性的建立相应的索引检索方式,筛选方式,以及展现方式。
与通用搜索类似地,用户可以多种方式使用垂直搜索服务,例如,通用搜索网站上的垂直搜索频道,在搜索栏中输入搜索关键词后点击按钮,获取结果。或者,通过访问特定行业、领域的垂直网站获取服务。以上情况中,通常是以搜索页面作为客户端程序,由搜索页面生成请求,通过浏览器向搜索引擎发送该请求。然而本发明提供的方法中,客户端不限于搜索页面。例如,不同行业的垂直搜索服务通常还提供有运行在智能手机、平板电脑等多种终端上的客户端软件,用户可以向这些客户端提供搜索关键词,完成搜索请求的生成和发送。
垂直搜索引擎接收搜索关键词后,方法100进入步骤S102,其中,对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型。
用户提供的搜索关键词是垂直搜索引擎判断用户所需信息类型的依据。用户输入的搜索关键词一般是自然语言,而垂直搜索引擎无法直接理解搜索关键词所包含的意图,因此,对搜索关键词进行语义识别是必要的。
具体地,由于自然语言输入方法的多样性,用户输入的搜索关键词也可能并不规范,或者只是多个关键词的堆砌。因此,语义分析的一种方法是先对搜索关键词进行切分词处理,即将用户输入的自然语言序列切分成有意义的词,然后根据切分词处理的结果,进行用户意图识别。
现有技术中有多种切分词方法,例如,基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词方法等。本领域技术人员能够根据需求进行选取,或是综合使用多种方法。
意图识别以切分词处理的结果为基础,然而,同样的切分词结果可能包含有多种意图。例如,对图1中的关键词“刘德华”来说,切分词处理虽然能识别出“刘德华”为演艺明星的名字,但该搜索关键词代表的意图可能是多样的,包括图片、电影、电视剧、音乐下载等。为保证用户需求得到满足,步骤S102中的意图识别应该考虑所有可能的意图。
与切分词类似,现有技术中也存在多种意图识别方法,如词表匹配,统计模型,规则解析等方法,本领域技术人员可以根据情况灵活选用。
在步骤S102中,还可以进一步考虑同一搜索关键词的各个意图的需求强度,例如,对搜索关键词“荷塘月色”,其意图可能包含歌曲《荷塘月色》下载、“荷塘月色”小区,以及散文《荷塘月色》。其中,歌曲下载的需求可能较高,例如50%,而其他需求较低。
在得出满足用户需求的所有信息类型后,方法100进入S103,其中,判断第一垂直搜索频道是否提供有满足用户需求的所有信息类型。
在实际中,该步骤中的判断过程可以结合步骤S102中描述的意图强度进行。对同一搜索关键词的不同意图的需求强度进行量化,例如,将意图强度的范围设为0至100%,强度值随用户的需求程度递增。如果第一垂直搜索频道所提供的信息类型的意图强度高于设定阈值,例如,95%,则认为该频道提供了用户需求的所有信息类型;否则,认为第一垂直搜索频道不能满足用户需求。
在图1所示的实例中,对“刘德华”这一搜索关键词,经过步骤S102的意图识别后,判断出了用户对图片、电影、新闻、音乐等信息类型的意图强度基本相当,而图1中的第一垂直搜索频道,即用户选择的图片搜索频道只返回了人物图片,显然地,这种情况下,第一垂直搜索频道没有提供满足用户需求的所有信息类型。
而对于一些行业性较强的关键词,例如,用户以学术搜索、文库等垂直搜索频道为第一垂直搜索频道,在其中输入了搜索关键词“锁相环”,这时,可以认为,基本上所有用户的需求都为技术文档、论文等内容,也即第一垂直搜索频道能够提供满足用户需求的所有信息类型。
进一步地,判断时还可以考虑信息的时效性,以关键词“Iphone5”为例,上市之前,用户搜索该关键词的意图绝大部分是新闻,而上市后一段时间内,用户的意图大多是购买、资讯等内容,停产后,用户不再关注购买、新闻等内容,意图基本上集中为百科、问答等,即用户对各信息类型的意图强度可以是随时间变化的。
完成上述判断后,方法100进入步骤S104,其中,如果第一垂直搜索频道没有提供有满足用户需求的所有信息类型,则获取搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中至少一个第二垂直搜索频道提供有第一垂直搜索频道未提供的满足用户需求的信息类型。
一般地,用户所选择的第一垂直搜索频道至少能满足用户的部分需求,因此,在步骤S104中,首先包括从第一垂直搜索频道的搜索引擎索引库中获取第一搜索结果。
同时,在第一垂直搜索频道没有提供有满足用户需求的所有信息类型的情况下,还需要从其他垂直搜索频道的索引库中获取与搜索关键词相关的第二搜索结果。以图片搜索为例,如果在步骤S102中已判断出用户的对图片的需求强度较弱,则可以从其他垂直搜索频道中获取文字、链接等内容。图3示出了基于垂直搜索频道的信息搜索方法的垂直搜索频道的返回结果的一个示例。在图3中,与单一的图片返回结果相比,增加了人物的简要文字介绍、详细介绍的URL链接,与人物相关且时效性较强的热点新闻,以及热门视频、电影的链接等,以供用户选择。
类似地,对于新闻搜索,则可以从其他相应频道的索引库中获取与新闻相关的图片、视频、以及事件追踪等信息;对于地图搜索,在用户搜索某个地名或者机构时,可以获取相关地名的文字介绍,建筑物图片等。
可选地,为保证信息的有效性,获取搜索关键词对应的至少一个第二垂直搜索频道的第二搜索结果一般为从第一垂直搜索频道未提供的满足用户需求的信息类型对应的至少一个第二垂直搜索频道的索引数据库中取回第二搜索结果。也就是说,第一垂直搜索频道外的信息获取应该取决于步骤S102所判断出的需求类型。具体地,可以依据步骤S103中分析的意图强度,从与具有一定意图强度的信息类型相应的其他频道中获取信息,忽略用户意图外的信息,将搜索的范围限制在用户兴趣范围内,以提高***效率。而对于需求强度较低的其他信息,可以根据情况,适当地包括或排除。
在获取了来自第一垂直搜索频道和至少一个第二垂直搜索频道的结果后,方法100进入步骤S105,其中,将第一搜索结果和所述第二搜索结果进行整合,并发送给客户端进行展现。
如图3所示,第一搜索结果为与搜索关键词“刘德华”相关的人物图片,第二搜索结果包括人物简介,关注度较高的新闻,以及人物相关的最新的影视作品等内容。这些结果浮动显示在第一搜索结果的左侧,即使用户没有这方面需求,也不影响用户使用。可以根据第二搜索结果的内容适当调整整合的形式,例如以弹出窗口、框架网页等形式呈现。
上述整合处理进一步包括根据第一搜索结果和第二搜索结果的相关度按照预设模板对搜索结果页进行重排版。将获取的第一、第二搜索结果按相关度排序后再显示。这里,排序首先包括类型之间的排序,其次是同一类型结果的排序。例如在图3中,第二搜索结果中优先展示了相关度高的人物简介,之后是新闻和最新视频;而在视频结果中,只展示了当前与人物相关度最高的两部影视作品。
重排版按照搜索服务商预先提供的模板进行,例如,通过HTML语言、jaVa脚本等写入页面的源代码中,对页面中的字体大小、颜色,图片、视频等的嵌入位置等进行设定。
在本发明上述实施例提供的方法中,搜索引擎通过对搜索关键词的切分词处理,意图识别等语义分析方法,判断出用户需求的所有信息类型,从第一垂直搜索频道中获取第一搜索结果,在第一搜索结果没有提供满足用户需求的信息类型的情况下,从与用户需求的信息类型相关的其他频道中获取第二搜索结果,经整合后呈现。根据该方法,得到的结果综合了多个垂直搜索频道的内容,包含了用户各种可能的需求,而不仅限于用户选择的当前频道,从而减少了用户的无效操作,降低了频道切换成本。
图4示出了本发明一个实施例提供的基于垂直搜索频道的信息搜索装置的结构示意图。如图4所示,该装置包括:接收模块21,分析模块22,判断模块23,结果获取模块24和整合模块25。
接收模块21适于接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词。客户端包括搜索页面,例如通用搜索网站上的垂直搜索频道,以及特定行业、领域的垂直网站等。以上情况中,由搜索页面生成请求,通过浏览器向搜索引擎发送该请求。接收模块21还能够接收其他客户端发送的关键词,例如不同行业的垂直搜索服务提供的运行在智能手机、平板电脑等多种终端上的客户端软件等。
分析模块22适于对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型。
用户提供的搜索关键词是搜索引擎判断用户所需信息类型的依据。用户输入的搜索关键词一般是自然语言,而搜索引擎无法直接理解搜索关键词所包含的意图,因此,通过分析模块22对搜索关键词进行语义识别是必要的。
具体地,由于自然语言输入方法的多样性,用户输入的搜索关键词也可能并不规范,或者只是多个搜索关键词的堆砌。因此,分析模块22通常包括切分词处理模块220和意图识别模块221,其中,切分词处理模块220适于先对搜索关键词进行切分词处理,即将用户输入的自然语言序列切分成有意义的词,意图识别模块221适于根据切分词处理的结果,进行用户意图识别。
切分词处理模块220可以利用现有技术中的多种切分词方法处理搜索关键词,例如,基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词方法等。本领域技术人员可以根据需求进行选取,或是综合使用多种方法。
意图识别模块221以切分词处理的结果作为输入信息。然而,同样的切分词结果可能包含有多种意图。仍以图1中的搜索关键词“刘德华”为例,切分词处理虽然能识别出了“刘德华”为演艺明星的名字,但该搜索关键词能表现出的意图是多样的,包括图片、电影、电视剧、音乐下载等。为保证用户需求得到满足,意图识别模块221需要分析出用户所有可能的意图。
意图识别模块221可以利用现有技术的多种意图识别方法得出用户意图,如词表匹配,统计模型,规则解析等方法,本领域技术人员可以根据情况灵活选用。
判断模块23适于判断第一垂直搜索频道是否提供有满足用户需求的所有信息类型。判断模块23可以对同一搜索关键词的不同意图的需求强度进行量化,如果第一垂直搜索频道所提供的信息类型的意图强度高于设定阈值,则认为该频道提供了用户需求的所有信息类型;否则,认为第一垂直搜索频道不能满足用户需求。例如,对“刘德华”这一搜索关键词,判断模块23分析出用户对图片、电影、新闻、音乐等信息类型的意图强度基本相当,则只返回人物图片的图片搜索垂直搜索频道显然无法提供满足用户需求的所有信息类型。
而对于一些行业性较强的关键词,例如,用户以学术搜索、文库等垂直搜索频道为第一垂直搜索频道,在其中输入了搜索关键词“锁相环”,这时,判断模块23可以认为,基本上所有用户的需求都为技术文档、论文等内容,也即第一垂直搜索频道能够提供满足用户需求的所有信息类型。
结果获取模块24适于在判断模块23判断出第一垂直搜索频道没有提供有满足用户需求的所有信息类型的情况下,获取搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中至少一个第二垂直搜索频道提供有第一垂直搜索频道未提供的满足用户需求的信息类型。
一般地,用户所选择的第一垂直搜索频道至少能满足用户的部分需求,因此,结果获取模块24首先要从第一垂直搜索频道的搜索引擎索引库中获取第一搜索结果。同时,在第一垂直搜索频道没有提供有满足用户需求的所有信息类型的情况下,结果获取还需要从其他垂直搜索频道的索引库中获取与搜索关键词相关的第二搜索结果。以图片搜索为例,如果判断模块23已判断出用户的对图片的需求强度较弱,或其他意图需求较强,则可以从相应的其他垂直搜索频道中获取文字、链接等内容。图3示出了结果获取模块24从其他垂直搜索频道获取内容并返回结果的一个示例。在图3中,与单一的图片返回结果相比,增加了人物的简要文字介绍、详细介绍的URL链接,与人物相关且时效性较强的热点新闻,以及热门视频、电影的链接等,以供用户选择。
类似地,如果第一垂直搜索频道为新闻搜索,则结果获取模块24可以从其他垂直搜索频道的索引库中获取与新闻相关的图片、视频、以及事件追踪等信息;如果是地图搜索,在用户搜索某个地名或者机构时,结果获取模块24可以获取相关地名的文字介绍,建筑物图片等。
可选地,为保证信息的有效性,结果获取模块24获取搜索关键词对应的至少一个第二垂直搜索频道的第二搜索结果一般为与第一垂直搜索频道未提供的满足用户需求的信息类型对应的至少一个第二垂直搜索频道的索引数据库中取回第二搜索结果。也就是说,第一垂直搜索频道外的信息获取应该取决于意图识别模块221所判断出的需求类型。具体地,可以依据判断模块23分析的意图强度,从与具有一定意图强度的信息类型相应的其他垂直搜索频道中获取信息,忽略用户意图外的信息,将搜索的范围限制在用户兴趣范围内,以提高***效率。而对于需求量过低的信息,可以根据情况,适当地包括或排除。
整合模块25适于将第一搜索结果和第二搜索结果进行整合,并发送给客户端进行展现。
如图3所示,第一搜索结果为与搜索关键词“刘德华”相关的人物图片,第二搜索结果包括人物简介,关注度较高的新闻,以及人物相关的最新的影视作品等内容。这些结果浮动显示在第一搜索结果的左侧,即使用户没有这方面需求,也不影响用户使用。整合模块25可以根据第二搜索结果的内容适当调整整合的形式,例如以弹出窗口、框架网页等形式呈现
整合模块25进一步适于根据第一搜索结果和第二搜索结果的相关度按照预设模板对搜索结果页进行重排版。整合模块25将获取的第一、第二搜索结果按相关度排序后再显示。这里,排序首先包括类型之间的排序,其次是同一类型结果的排序。例如在图3中,整合模块25在第二搜索结果中优先展示了相关度高的人物简介,之后是新闻和最新视频;而在视频结果中,只展示了当前与人物相关度最高的两部影视作品。
整合模块25对第一搜索结果和第二搜索结果的重排版按照搜索服务商预先提供的模板进行,例如,通过HTML语言、jaVa脚本等写入页面的源代码中,对页面中的字体大小、颜色,图片、视频等的嵌入位置等进行设定。
在本发明上述实施例提供的装置中,接收模块21接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;分析模块22对关键词进行语义分析,例如通过其中的切分词处理模块220和意图识别模块221得出满足用户需求的所有信息类型;结果获取模块24从第一搜索频道中获取第一搜索结果,并在判断模块23判断出第一搜索结果没有提供满足用户需求的信息类型的情况下,从与用户需求的信息类型相关的其他频道中获取第二搜索结果,经整合模块25整合后呈现。该装置最终得到的结果综合了多个垂直搜索频道的内容,包含了用户各种可能的需求,而不仅限于用户选择的当前频道,从而减少了用户的无效操作,降低了频道切换成本。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它,设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于垂直搜索频道的信息搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种基于垂直搜索频道的信息搜索方法,包括:
接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;
对所述搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型;
判断所述第一垂直搜索频道是否提供有满足用户需求的所有信息类型;
如果所述第一垂直搜索频道没有提供有满足用户需求的所有信息类型,则获取所述搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中所述至少一个第二垂直搜索频道提供有所述第一垂直搜索频道未提供的满足用户需求的信息类型;
将所述第一搜索结果和所述第二搜索结果进行整合,并发送给客户端进行展现。
2.根据权利要求1所述的方法,所述获取搜索关键词对应的至少一个第二垂直搜索频道的第二搜索结果进一步包括:从所述第一垂直搜索频道未提供的满足用户需求的信息类型对应的至少一个第二垂直搜索频道的索引数据库中取回第二搜索结果。
3.根据权利要求1或2所述的方法,所述对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型进一步包括:
对所述搜索关键词进行切分词处理;
根据所述切分词处理的结果进行用户意图识别,得出满足用户需求的所有信息类型。
4.根据权利要求1所述的方法,所述整合进一步包括:根据第一搜索结果和第二搜索结果的相关度按照预设模板对搜索结果页进行重排版。
5.根据权利要求1或2所述的方法,所述第一垂直搜索频道或第二垂直搜索频道垂直搜索频道为图片、视频、新闻或音乐频道。
6.一种基于垂直搜索频道的信息搜索装置,包括:
接收模块,适于接收客户端发送的用户在第一垂直搜索频道输入的搜索关键词;
分析模块,适于对所述搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型;
判断模块,适于判断所述第一垂直搜索频道是否提供有满足用户需求的所有信息类型;
结果获取模块,适于在所述判断模块判断出第一垂直搜索频道没有提供有满足用户需求的所有信息类型的情况下,获取所述搜索关键词对应的第一垂直搜索频道的第一搜索结果和至少一个第二垂直搜索频道的第二搜索结果,其中所述至少一个第二垂直搜索频道提供有所述第一垂直搜索频道未提供的满足用户需求的信息类型;
整合模块,适于将所述第一搜索结果和所述第二搜索结果进行整合,并发送给客户端进行展现。
7.根据权利要求6所述的装置,所述结果获取模块进一步适于从所述第一垂直搜索频道未提供的满足用户需求的信息类型对应的至少一个第二垂直搜索频道的索引数据库中取回第二搜索结果。
8.根据权利要求6或7所述的装置,所述分析模块进一步包括:
切分词处理模块,适于对所述搜索关键词进行切分词处理;
意图识别模块,适于根据所述切分词处理的结果进行用户意图识别,得出满足用户需求的所有信息类型。
9.根据权利要求6所述的装置,所述整合模块进一步适于根据第一搜索结果和第二搜索结果的相关度按照预设模板对搜索结果页进行重排版。
10.根据权利要求6或其所述的装置,所述第一垂直搜索频道或第二垂直搜索频道为图片、视频、新闻或音乐频道垂直搜索频道。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310493026.XA CN103530385A (zh) | 2013-10-18 | 2013-10-18 | 基于垂直搜索频道的信息搜索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310493026.XA CN103530385A (zh) | 2013-10-18 | 2013-10-18 | 基于垂直搜索频道的信息搜索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103530385A true CN103530385A (zh) | 2014-01-22 |
Family
ID=49932394
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310493026.XA Pending CN103530385A (zh) | 2013-10-18 | 2013-10-18 | 基于垂直搜索频道的信息搜索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103530385A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104750816A (zh) * | 2015-03-30 | 2015-07-01 | 百度在线网络技术(北京)有限公司 | 信息搜索方法和信息搜索装置 |
CN106021615A (zh) * | 2016-07-01 | 2016-10-12 | 广东小天才科技有限公司 | 题目搜索优化方法及装置 |
CN106156024A (zh) * | 2015-03-24 | 2016-11-23 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器 |
CN107526846A (zh) * | 2017-09-27 | 2017-12-29 | 百度在线网络技术(北京)有限公司 | 频道排序模型的生成、排序方法、装置、服务器和介质 |
WO2019007235A1 (zh) * | 2017-07-04 | 2019-01-10 | 广州神马移动信息科技有限公司 | 搜索方法、搜索设备、终端设备及终端设备可读存储介质 |
CN110297880A (zh) * | 2019-05-21 | 2019-10-01 | 深圳壹账通智能科技有限公司 | 语料产品的推荐方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1801210A (zh) * | 2004-12-04 | 2006-07-12 | 林赞松 | 对网站搜索结果清单进行竞价排名的方法 |
CN101820592A (zh) * | 2009-02-27 | 2010-09-01 | 华为技术有限公司 | 移动搜索方法及装置 |
CN102096717A (zh) * | 2011-02-15 | 2011-06-15 | 百度在线网络技术(北京)有限公司 | 搜索方法及搜索引擎 |
US20110161307A1 (en) * | 2008-09-08 | 2011-06-30 | Huawei Technologies Co., Ltd. | Method, system, and device for searching for information and method for registering vertical search engine |
CN102236663A (zh) * | 2010-04-30 | 2011-11-09 | 阿里巴巴集团控股有限公司 | 一种基于垂直搜索的查询方法、***和装置 |
CN103377201A (zh) * | 2012-04-17 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
-
2013
- 2013-10-18 CN CN201310493026.XA patent/CN103530385A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1801210A (zh) * | 2004-12-04 | 2006-07-12 | 林赞松 | 对网站搜索结果清单进行竞价排名的方法 |
US20110161307A1 (en) * | 2008-09-08 | 2011-06-30 | Huawei Technologies Co., Ltd. | Method, system, and device for searching for information and method for registering vertical search engine |
CN101820592A (zh) * | 2009-02-27 | 2010-09-01 | 华为技术有限公司 | 移动搜索方法及装置 |
CN102236663A (zh) * | 2010-04-30 | 2011-11-09 | 阿里巴巴集团控股有限公司 | 一种基于垂直搜索的查询方法、***和装置 |
CN102096717A (zh) * | 2011-02-15 | 2011-06-15 | 百度在线网络技术(北京)有限公司 | 搜索方法及搜索引擎 |
CN103377201A (zh) * | 2012-04-17 | 2013-10-30 | 腾讯科技(深圳)有限公司 | 信息搜索方法及装置 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156024A (zh) * | 2015-03-24 | 2016-11-23 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器 |
CN106156024B (zh) * | 2015-03-24 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及服务器 |
CN104750816A (zh) * | 2015-03-30 | 2015-07-01 | 百度在线网络技术(北京)有限公司 | 信息搜索方法和信息搜索装置 |
CN106021615A (zh) * | 2016-07-01 | 2016-10-12 | 广东小天才科技有限公司 | 题目搜索优化方法及装置 |
WO2019007235A1 (zh) * | 2017-07-04 | 2019-01-10 | 广州神马移动信息科技有限公司 | 搜索方法、搜索设备、终端设备及终端设备可读存储介质 |
CN107526846A (zh) * | 2017-09-27 | 2017-12-29 | 百度在线网络技术(北京)有限公司 | 频道排序模型的生成、排序方法、装置、服务器和介质 |
CN107526846B (zh) * | 2017-09-27 | 2021-09-24 | 百度在线网络技术(北京)有限公司 | 频道排序模型的生成、排序方法、装置、服务器和介质 |
CN110297880A (zh) * | 2019-05-21 | 2019-10-01 | 深圳壹账通智能科技有限公司 | 语料产品的推荐方法、装置、设备及存储介质 |
CN110297880B (zh) * | 2019-05-21 | 2023-04-18 | 深圳壹账通智能科技有限公司 | 语料产品的推荐方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103514299A (zh) | 信息搜索方法和装置 | |
US11669579B2 (en) | Method and apparatus for providing search results | |
CN102915380A (zh) | 用于对数据进行搜索的方法和*** | |
CN103530385A (zh) | 基于垂直搜索频道的信息搜索方法及装置 | |
CN103577597A (zh) | 基于当前浏览页面的关键词搜索*** | |
CN104462262A (zh) | 一种实现语音搜索的方法、装置和浏览器客户端 | |
CN103092943B (zh) | 一种广告调度的方法和广告调度服务器 | |
CN103488786A (zh) | 提供信息搜索的方法、客户端 | |
CN103577596A (zh) | 基于当前浏览页面的关键词搜索方法及装置 | |
CN103577595A (zh) | 基于当前浏览页面的关键词推送方法及装置 | |
CN103678566A (zh) | 提供移动终端故障问题解决方案的方法、服务器和*** | |
CN103699669A (zh) | 一种浏览器中进行消息推送的方法和一种浏览器终端 | |
CN103577392A (zh) | 基于当前浏览页面的关键词推送方法及装置 | |
US11423096B2 (en) | Method and apparatus for outputting information | |
US20120005195A1 (en) | Creating an ontology using an online encyclopedia and tag cloud | |
CN102541853A (zh) | 一种利用浏览器地址栏获取应用信息的方法和装置 | |
CN105447192A (zh) | 在导航页上推荐个性化搜索词方法和装置 | |
CN102930012A (zh) | 一种客户端以及一种搜索导航方法 | |
CN103530389A (zh) | 一种提高停用词搜索有效性的方法和装置 | |
US10372746B2 (en) | System and method for searching applications using multimedia content elements | |
CN103605686A (zh) | 基于搜索的终端故障解决方案提供方法、服务器和*** | |
CN104699744A (zh) | 信息搜索方法及装置 | |
CN104199865A (zh) | 提供内容提供方的定制结果的搜索方法、客户端和*** | |
CN103678706A (zh) | 一种基于截图信息的识图方法、***、设备及装置 | |
CN104699836A (zh) | 一种多关键字的搜索提示方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140122 |
|
RJ01 | Rejection of invention patent application after publication |