CN102073735A - 搜索方法及搜索*** - Google Patents

搜索方法及搜索*** Download PDF

Info

Publication number
CN102073735A
CN102073735A CN2011100227789A CN201110022778A CN102073735A CN 102073735 A CN102073735 A CN 102073735A CN 2011100227789 A CN2011100227789 A CN 2011100227789A CN 201110022778 A CN201110022778 A CN 201110022778A CN 102073735 A CN102073735 A CN 102073735A
Authority
CN
China
Prior art keywords
search
module
search results
query requests
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100227789A
Other languages
English (en)
Inventor
陈亮
陈凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN2011100227789A priority Critical patent/CN102073735A/zh
Publication of CN102073735A publication Critical patent/CN102073735A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种搜索方法,包括如下步骤:S1,接收查询请求;S2,对所述查询请求进行分析,判断所述查询请求是否包含地域词,如果是,则以所述查询请求进行搜索后至步骤S5;如果否,则获取用户地域信息后至步骤S3;S3,判断是否需要将所述用户地域信息加入所述查询请求,如果否,则以所述查询请求进行搜索后至步骤S5;如果是,则将所述用户地域信息加入到所述查询请求中,得到扩展查询请求;S4,对扩展查询请求进行搜索,并得到搜索结果;S5,将所述搜索结果输出。相较于现有技术,本发明的搜索方法及其搜索***通过扩展查询请求进行查询而得到精确的搜索结果,搜索效率高、网络流量少,且用户体验佳。

Description

搜索方法及搜索***
技术领域
本发明涉及一种搜索方法及搜索***,尤其是涉及一种对查询请求进行扩展的搜索方法及搜索***,属于搜索引擎技术领域。
背景技术
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在网络上应用的软件***,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件***提供一个网页界面,让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网页。
过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索(www.***.com)和谷歌公司的谷歌搜索(www.***.cn)。
当前的搜索引擎,首先是将因特网上的网页抓取并收录下来,之后当用户输入查询词的时候,根据一定算法计算查询词与收录网页的匹配程度,并按匹配程度从高到低显示网页的URL以及摘要。用户需要点击URL进入相应的目标网站,再按照提示输入相应的时间、空间(地域)等信息进行进一步的查询,才能得到用户最终想要得到的结果,例如用户需要查询天气预报,则首先通过搜索引擎得到与天气预报相关的网站,其次,点击进入目标网站,最后,在目标网站中选择时间、空间信息,才能得到需要的天气信息,耗时耗力,搜索效率较低,网络流量较大,且容易造成网络拥塞。
与本发明相关的现有技术请参阅2009年4月8日公开的中国发明专利第CN101404018A号,该专利揭示了一种用于实现扩展搜索的方法及***,其中该方法包括以下步骤:接收由用户生成的搜索查询;确定要应用于所述搜索查询的扩展类型;根据所述确定的扩展类型无用户干预地自动生成扩展搜索查询;对所述扩展搜索查询中的每一个执行搜索以检索搜索结果;以及以模块形式提供所述搜索结果以向所述用户呈现,其中每个模块包括所述扩展搜索查询中的一个扩展搜索查询的搜索结果。该方法通过执行同时搜索,用户接收大量结果而不必将迭代搜索处理重复多次,同时搜索减少了重复地重新定义搜索的需要。
然而,现有技术所采用的搜索方法中忽略了用户查询时的各种显式、隐式的时间空间语义信息,进而导致搜索结果用户体验较差、搜索效率较低、网络流量较大。
因此,需要对现有技术中的搜索方法及搜索***进行改进。
发明内容
本发明所要解决的技术问题在于提供一种搜索方法,其利用了时间或者空间结合机制以对用户查询请求及浏览器的信息进行综合分析,得出更靠近用户真实查询关键词的扩展查询请求。
本发明所要解决的技术问题还在于提供执行所述搜索方法的搜索***。
为解决上述技术问题,本发明搜索方法的一实施方式,其包括如下步骤:
S1,接收查询请求;
S2,对所述查询请求进行分析,判断所述查询请求是否包含地域词,如果是,则以所述查询请求进行搜索后至步骤S5;如果否,则获取用户地域信息后至步骤S3;
S3,判断是否需要将所述用户地域信息加入所述查询请求,如果否,则以所述查询请求进行搜索后至步骤S5;如果是,则将所述用户地域信息加入到所述查询请求中,得到扩展查询请求;
S4,对扩展查询请求进行搜索,并得到搜索结果;
S5,将所述搜索结果输出。
作为本发明的进一步改进,所述步骤S4具体包括:
S41,将所述扩展查询请求在资源数据库中搜索;
S42,判断是否有符合需求的搜索结果;若有,则进行S5步骤,若无,则将所述扩展查询请求在网页库中搜索,并得到搜索结果。
作为本发明的进一步改进,所述步骤S4具体包括:
将所述扩展查询请求在资源数据库和网页库中搜索,并得到搜索结果。
作为本发明的进一步改进,在所述资源数据库中搜索到的搜索结果为特型展示结果;在所述网页库中搜索到的搜索结果为URL结果。
作为本发明的进一步改进,所述步骤S5具体包括:
S51,对所述搜索结果进行排序;
S52,将排序后的所述搜索结果输出。
作为本发明的进一步改进,所述特型展现结果排在所述URL结果前。
作为本发明的进一步改进,所述用户地域信息是通过客户端浏览器的IP地址获得的。
为解决上述技术问题,本发明搜索方法的另一实施方式,其包括如下步骤:
S1,接收查询请求;
S2,对所述查询请求进行分析,判断所述查询请求是否包含时间,如果是,则以所述查询请求进行搜索后至步骤S5;如果否,则获取用户时间信息后至步骤S3;
S3,判断是否需要将所述用户时间信息加入所述查询请求,如果否,则以所述查询请求进行搜索后至步骤S5;如果是,则将所述用户时间信息加入到所述查询请求中,得到扩展查询请求;
S4,对所述扩展查询请求进行搜索,并得到搜索结果;
S5,将所述搜索结果输出。
作为本发明的进一步改进,所述步骤S4具体包括:
S41,将所述扩展查询请求在资源数据库中搜索;
S42,判断是否有符合需求的搜索结果;若有,则进行S5步骤,若无,则将所述扩展查询请求在网页库中搜索,并得到搜索结果。
作为本发明的进一步改进,所述步骤S4具体包括:
将所述扩展查询请求在资源数据库和网页库中搜索,并得到搜索结果。
作为本发明的进一步改进,在所述资源数据库中搜索到的搜索结果为特型展示结果;在所述网页库中搜索到的搜索结果为URL结果。
作为本发明的进一步改进,所述步骤S5具体包括:
S51,对所述搜索结果进行排序;
S52,将排序后的所述搜索结果输出。
作为本发明的进一步改进,所述特型展现结果排在所述URL结果前。
作为本发明的进一步改进,所述用户时间信息是通过客户端浏览器时间获得的。
为解决上述技术问题,本发明搜索***的一实施方式,其包括:
UI模块,用于接收查询条件,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
第一分析判断模块,用于对所述查询请求进行分析,判断所述查询请求是否包含地域词,和用于获取用户地域信息;
第二分析判断模块,用于判断是否需要将所述用户地域信息加入所述查询请求,以得到扩展查询请求;
搜索模块,用于在数据库中对所述扩展查询请求进行搜索,并得到搜索结果。
作为本发明的进一步改进,所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询条件,并将所述查询条件转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
作为本发明的进一步改进,所述数据库包括:
资源数据库,用于存储开放平台引入的结构化外部资源索引及数据;以及
网页库用于存储普通搜索引擎索引及数据。
作为本发明的进一步改进,所述搜索模块在所述资源数据库中搜索到的搜索结果为特型展示结果;所述搜索模块在所述网页库中搜索到的搜索结果为URL结果。
作为本发明的进一步改进,所述搜索模块还用于对所述搜索结果进行排序。
作为本发明的进一步改进,所述特型展现结果排在所述URL结果前。
作为本发明的进一步改进,所述用户地域信息是通过客户端浏览器的IP地址获得的。
为解决上述技术问题,本发明搜索***的另一实施方式,其包括:
UI模块,用于接收查询条件,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
第一分析判断模块,用于对所述查询请求进行分析,判断所述查询请求是否包含时间,和用于获取用户时间信息;
第二分析判断模块,用于判断是否需要将所述用户时间信息加入所述查询请求,以得到扩展查询请求;
搜索模块,用于在数据库中对所述扩展查询请求进行搜索,并得到搜索结果。
作为本发明的进一步改进,所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询条件,并将所述查询条件转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
作为本发明的进一步改进,所述数据库包括:
资源数据库,用于存储开放平台引入的结构化外部资源索引及数据;以及
网页库用于存储普通搜索引擎索引及数据。
作为本发明的进一步改进,所述搜索模块在所述资源数据库中搜索到的搜索结果为特型展示结果;所述搜索模块在所述网页库中搜索到的搜索结果为URL结果。
作为本发明的进一步改进,所述搜索模块还用于对所述搜索结果进行排序。
作为本发明的进一步改进,所述特型展现结果排在所述URL结果前。
作为本发明的进一步改进,所述用户时间信息是通过客户端浏览器时间获得的。
相较于现有技术,本发明的搜索方法及其***利用了时间或者空间结合机制以对用户查询请求及浏览器的信息进行综合分析,得出更靠近用户真实查询关键词的扩展查询请求,并通过对该扩展查询请求进行查询而得到精确的搜索结果,搜索效率高、网络流量少,且用户体验佳。
附图说明
图1是本发明对查询请求进行扩展的搜索***与客户端实现互动的工作原理图;
图2是本发明对用户查询请求进行扩展的***的结构图。
图3是本发明搜索***输出的结果页面示意图。
图4是本发明搜索方法于第一种实施方式的流程图。
图5是本发明搜索方法于第二种实施方式的流程图。
图6是本发明搜索方法于第三种实施方式的流程图。
具体实施方式
请参图1所示,本发明的搜索***10与客户端20实现互动的工作原理图。本实施方式中,该客户端20包括一浏览器,客户可通过该浏览器打开搜索引擎,并在搜索引擎中输入查询请求,一般的,该输入的查询请求为文本信息,当然,该查询请求还可以为图片信息、视频信息等等。所述搜索***10通过网络接收客户输入至所述浏览器中的查询请求,并对该查询请求进行搜索后,将搜索结果返回至该浏览器。其中,该搜索***10可以包括一台或多台服务器,该客户端20可以包括一个或多个用户终端设备,如个人计算机、笔记本电脑、无线电话、个人数字处理(PDA)、或其它计算机***和通信***。
这些服务器和终端设备在架构上都包含一些基本组件,如总线、处理***、存储***、一个或多个输入/输出***、和通信接口等。总线可以包括一个或多个导线,用来实现服务器或终端设备各组件之间的通信。处理***包括各类型的用来执行指令、处理进程或线程的处理器或微处理器。存储***可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入***供用户输入信息到服务器或终端设备,如键盘、鼠标、手写笔、声音识别***、或生物测定***等。输出***包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器或终端设备与其它***或***进行通信。通信接口之间可通过有线连接、无线连接、或光连接连接到网络中,使搜索***10、客户端20间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。
服务器和终端设备上均包含有用来管理***资源、控制其它程序运行的操作***软件,以及用来实现特定功能模块的应用软件。请参图2所示,本发明一种对查询请求(query)进行扩展的搜索***,其包括:web服务模块101、与所述web服务模块101交互通信的UI模块102、第一分析判断模块103、第二分析判断模块104、搜索模块105、资源数据库106、网页库107。值得一提的是,这些模块即可存储并运行于同一服务器中,也可存储并运行在多台服务器中。
所述web服务模块101用于通过网络协议接收从客户端20浏览器传来的查询请求,并将该查询请求转到UI模块102,另外,该web服务模块101还用于接收所述UI模块102返回的结果页面,并将所述结果页面返回至客户端20。
所述UI模块102用于接收所述web服务模块101传送的查询请求,并将该查询请求发送至所述第一分析判断模块103;另外,所述UI模块102还用于接收所述搜索模块105返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述第一分析判断模块103用于对该查询请求进行分析,并判断该查询请求是否包含地域词或时间,在本发明中,该分析可是语义分析,也可是模糊匹配、特征抽取等等,如果是,则直接以该用户查询请求作为搜索关键词在所述搜索模块105中进行搜索;如果否,则获取用户浏览器的信息并对该信息进行分析,以得到用户的地域信息或用户所在时区的时间。
所述第二分析判断模块104用于判断是否需要将用户的地域信息或用户所在时区的时间加入用户查询请求,如果否,则直接以该用户查询请求作为搜索关键词在所述搜索模块105中进行搜索;如果是,则将用户的地域信息或者用户所在时区的时间加入到用户查询请求中以得到新的扩展查询请求。
所述搜索模块105用于针对扩展查询请求在所述资源数据库106和/或网页库107进行搜索,并输出搜索结果至所述UI模块102,UI模块102将这些搜索结果拼装为结果页面输出。
所述资源数据库106用于存储开放平台引入的结构化外部资源索引及数据。
所述网页库107用于存储普通搜索引擎索引及数据。所述存储普通搜索引擎索引及数据已是本领域公知技术,本领域普通技术人员已能熟练掌握,在此不再赘述。
具体地,通过web服务模块101可以接受用户查询请求,例如用户查询请求为“天气”,第一分析判断模块103对该查询请求进行分析后得出该查询请求中没有地域词,则第一分析判断模块103通过用户的IP地址可以发现用户所在的地域信息,比如“北京”。由于“天气”这个词在全国不同的地点是不一样的,所以第二分析判断模块104认为“天气”这个词具有明显的地域属性,则第二分析判断模块104将用户所在的地域信息加入到用户查询请求中,从而得到新的扩展查询请求,即“天气”与“北京”。也就是说,通过本发明的搜索***10,推断用户其实是想知道天津地区的天气状况,而不时其它地区。这样的搜索结果往往能够满足用户的需求。在本发明的实施方式中,所述搜索模块105是在资源数据库106中进行搜索的。该资源数据库106是针对开放平台引入的结构化外部资源数据。如果资源数据库106中有匹配的搜索结果,则即可通过UI模块102将所述搜索结果拼装为结果页面后,由web服务模块101将所述结果页面输出至客户端浏览器,以展示给用户,优选地,在本发明最佳实施方式,所述搜索结果可作为一特型进行展示,其展示效果有别于普通的URL展示效果,用户不需要再次点击URL来进入第三方页面就能够直接看到搜索结果,如图3所示,其第一项搜索结果A即为本搜索的特型展示。当然,在本发明的另一实施方式中,搜索模块105还可以在网页库107中进行网页搜索,即返回给用户的搜索结果是普通的URL。当然在本发明的其他实施方式中,所述搜索模块105可以在资源数据库106中及网页库107中同时搜索,并由搜索模块105对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的搜索结果返回给用户。所述搜索模块105是基于时间语义及地域语义来对资源数据库106进行搜索的,通过结构化数据及基于时间空间的模板的搜索,可以得到精确的数据。
但是,当用户查询请求为“北京天气”时,第一分析判断模块103对该查询请求进行分析后得出该查询请求中具有地域词“北京”,则第一分析判断模块103直接以该查询请求作为搜索关键词。在本发明的实施方式中,所述搜索模块105是在资源数据库106中进行搜索的。该资源数据库106是针对开放平台引入的结构化外部资源数据。如果资源数据库106中有匹配的搜索结果,则即可通过UI模块102将所述搜索结果拼装为结果页面后,由web服务模块101将所述结果页面输出至客户端浏览器,以展示给用户,优选地,在本发明最佳实施方式,所述搜索结果可作为一特型进行展示,其展示效果有别于普通的URL展示效果,用户不需要再次点击URL来进入第三方页面就能够直接看到搜索结果,如图3所示,其第一项搜索结果A即为本搜索的特型展示。在本发明的另一实施方式中,搜索模块105还可以在网页库107中进行网页搜索,即返回给用户的搜索结果是普通的URL。当然在本发明的其他实施方式中,所述搜索模块105可以在资源数据库106中及网页库107中同时搜索,并由搜索模块105对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的搜索结果返回给用户。在以上情况下,虽然通过用户的IP地址可以发现用户所在的地域信息,比如“天津”。由于用户查询请求中已经带有明显的地域词,此时,第二分析判断模块104不会再将用户所在的地域信息加入到用户查询请求中,这样的搜索结果往往能够满足用户的需求。
又例如:当用户查询请求为“北京大学分数线”时,第一分析判断模块103首先对该查询请求进行分析,在本发明中,该分析可是语义分析,也可是模糊匹配、特征抽取等等,通过一定的算法,第一分析判断模块103得出查询请求的基本含义是查询“北京大学”的“分数线”。需要说明的是:虽然该查询请求里面带有地域名称“北京”,但是通过分析,第一分析判断模块103并不认为“北京”在这个查询请求里面是地域词,而是将“北京大学”连接一起视为一个关键词。第一分析判断模块103通过用户的IP地址可以发现用户所在的地域信息,比如“天津”。由于“分数线”这个词在全国不同的地点是不一样的,所以第二分析判断模块104认为“分数线”这个词具有明显的地域属性,则第二分析判断模块104将用户所在的地域信息加入到用户查询请求中,从而得到新的扩展查询请求,即“北京大学”、“天津”、“分数线”。也就是说,通过本发明的搜索***10,推断用户其实是想知道的是北京大学在天津地区的分数线,这样的搜索结果往往更贴近用户的真实查询需求。在本发明的实施方式中,所述搜索模块105是在资源数据库106中进行搜索的。该资源数据库106是针对开放平台引入的结构化外部资源数据。如果资源数据库106中有匹配的搜索结果,则即可通过UI模块102将所述搜索结果拼装为结果页面后,由web服务模块101将所述结果页面输出至客户端浏览器,以展示给用户,优选地,在本发明最佳实施方式,所述搜索结果可作为一特型进行展示,其展示效果有别于普通的URL展示效果,用户不需要再次点击URL来进入第三方页面就能够直接看到搜索结果,如图3所示,其第一项搜索结果A即为本搜索的特型展示。当然,在本发明的另一实施方式中,搜索模块105还可以在网页库107中进行网页搜索,即返回给用户的搜索结果是普通的URL。当然在本发明的其他实施方式中,所述搜索模块105可以在资源数据库106中及网页库107中同时搜索,并由搜索模块105对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的搜索结果返回给用户。所述搜索模块105是基于时间语义及地域语义来对资源数据库106进行搜索的,通过结构化数据及基于时间空间的模板的搜索,可以得到精确的数据。
上述实施方式中,所述搜索模块105在向UI模块102返回搜索结果之前,还可对搜索结果进行排序,优选地,在本发明最佳实施方式中,特型展现的搜索结果排列在前,以URL展现的搜索结果排列在后。
再例如:通过web服务模块101可以接受用户查询请求,例如用户查询请求为“前天是周几”,通过第一分析判断模块103对该查询请求进行分析后得出查询请求的基本含义是查询“前天”是“周几”,且该查询请求中没有时间,***认为“前天”这个关键词是个时间间隔词,则第一分析判断模块103通过当前***时间和用户浏览器提供的时区信息可以发现用户所在的时间信息,推断出“前天”所代表的具体日期,如“2010年12月24日”(美国用户查询“前天”与中国用户查询“前天”由于时区不同,结果可能是不一样的),同时“周几”这个词也具备一定的时间语义,说明用户想查询某种类似日历的信息。所以第二分析判断模块104认为“前天”这个词具有明显的时间属性,则第二分析判断模块104将用户所在的时间信息加入到用户查询请求中,从而得到新的扩展查询请求,即“2010年12月24日”、“周几”。在本发明的实施方式中,所述搜索模块105是在资源数据库106中进行搜索的。该资源数据库106是针对开放平台引入的结构化外部资源数据。如果资源数据库106中有匹配的搜索结果,则即可通过UI模块102将所述搜索结果拼装为结果页面后,由web服务模块101将所述结果页面输出至客户端浏览器,以展示给用户,优选地,在本发明最佳实施方式,所述搜索结果可作为一特型进行展示,其展示效果有别于普通的URL展示效果,用户不需要再次点击URL来进入第三方页面就能够直接看到搜索结果。当然,在本发明的另一实施方式中,搜索模块105还可以在网页库107中进行网页搜索,即返回给用户的搜索结果是普通的URL。当然在本发明的其他实施方式中,所述搜索模块105可以在资源数据库106中及网页库107中同时搜索,并由搜索模块105对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的搜索结果返回给用户。所述搜索模块105是基于时间语义及地域语义来对资源数据库106进行搜索的,通过结构化数据及基于时间空间的模板的搜索,可以得到精确的数据。
上述实施方式中,所述搜索模块105在向UI模块102返回搜索结果之前,还可对搜索结果进行排序,优选地,在本发明最佳实施方式中,特型展现的搜索结果排列在前,以URL展现的搜索结果排列在后。
请参图4所示,在本发明第一种实施方式中,本发明一种对查询请求进行扩展的搜索方法包括如下步骤:
S1,接收查询请求;优选地,该查询条件是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S2,对该查询请求进行分析,以判断该查询请求是否包含地域词,在本发明中,该分析可是语义分析,也可是模糊匹配、特征抽取等等,如果是,则直接以该用户查询请求在搜索模块105中作为搜索关键词进行搜索,跳至步骤S5;如果否,则获取用户浏览器的信息并对该信息进行分析,以得到用户的地域信息,至步骤S3;优选地,该步骤是在所述第一分析判断模块103中完成的;
S3,判断是否需要将用户的地域信息加入用户查询请求,如果否,则直接以该用户查询请求在搜索模块105中进行搜索,跳至步骤S5;如果是,则将用户的地域信息加入到用户查询请求中以得到新的扩展查询请求;优选地,该步骤是在所述第二分析判断模块104中完成的;
S4,针对步骤S3中的扩展查询请求进行搜索;优选地,该步骤是在所述搜索模块105中完成的;具体地,所述搜索模块105用于针对扩展查询请求在所述资源数据库106和/或网页库107进行搜索,并输出搜索结果至所述UI模块102;
S5,将所述搜索结果输出。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
值得一提的是:步骤S4具体包括:
将所述扩展查询请求在资源数据库106进行搜索,在对资源数据库106进行搜索的步骤中,如果有符合需求的结果,则进行S5步骤,如果没有符合需求的结果,则将所述扩展查询请求在网页库107进行网页搜索,并将通过网页搜索而得到的URL及摘要作为搜索结果,再进行S5步骤。当然,在其它实施方式中,也可同时对所述资源数据库106和所述网页库107进行搜索。
步骤S2中,用户浏览器的信息包括用户浏览器的IP地址。
步骤S4包括对网页库107进行网页搜索的步骤,返回给用户搜索结果中包括通过网页搜索而得到的URL及摘要。
在步骤S5中,返回给用户的搜索结果是由对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的。步骤S5包括对搜索结果进行排序的步骤,优选地,在本发明最佳实施方式中,特型展现的搜索结果排列在前,以URL展现的搜索结果排列在后。
请参图5所示,在本发明第二种实施方式中,本发明一种对查询请求进行扩展的搜索方法包括如下步骤:
S10,接收查询请求;优选地,该查询条件是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S20,对该查询请求进行分析,以判断该查询请求是否包含时间,在本发明中,该分析可是语义分析,也可是模糊匹配、特征抽取等等,如果是,则直接以该用户查询请求在所述搜索模块105中进行搜索,跳至步骤S50;如果否,则获取用户浏览器的信息并对该信息进行分析,以得到用户所在时区的时间信息,至步骤S30;优选地,该步骤是在所述第二分析判断模块104中完成的;
S30,判断是否需要将用户所在时区的时间信息加入用户查询请求,如果否,则直接以该用户查询请求在所述搜索模块105中进行搜索,跳至步骤S5;如果是,则将用户所在时区的时间信息加入到用户查询请求中以得到新的扩展查询请求;优选地,该步骤是在所述第二分析判断模块104中完成的;
S40,针对步骤S30中的扩展查询请求进行搜索;优选地,该步骤是在所述搜索模块105中完成的;具体地,所述搜索模块105用于针对扩展查询请求在所述资源数据库106和/或网页库107进行搜索,并输出搜索结果至所述UI模块102;
S50,将所述搜索结果输出。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
值得一提的是:步骤S40具体包括:
将所述扩展查询请求在资源数据库106进行搜索,在对资源数据库106进行搜索的步骤中,如果有符合需求的结果,则进行S5步骤,如果没有符合需求的结果,则将所述扩展查询请求在网页库107进行网页搜索,并将通过网页搜索而得到的URL及摘要作为搜索结果,再进行S5步骤。当然,在其它实施方式中,也可同时对所述资源数据库106和所述网页库107进行搜索。
步骤S20中,用户浏览器的信息包括用户浏览器的浏览器时间。
步骤S40包括对网页库107进行网页搜索的步骤,返回给用户搜索结果中包括通过网页搜索而得到的URL及摘要。
在步骤S50中,返回给用户的搜索结果是由对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的。步骤S50包括对搜索结果进行排序的步骤,优选地,在本发明最佳实施方式中,特型展现的搜索结果排列在前,以URL展现的搜索结果排列在后。
请参图6所示,在本发明第三种实施方式中,本发明一种对查询请求进行扩展的搜索方法包括如下步骤:
S100,接收查询请求;优选地,该查询条件是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块102;
S200,对该查询请求进行分析,以判断该查询请求是否存在代表时间空间查询需求的地域词或者时间,在本发明中,该分析可是语义分析,也可是模糊匹配、特征抽取等等,如果是,则直接以该用户查询请求在所述搜索模块1 05中进行搜索;跳至步骤S500;如果否,则获取用户浏览器的信息并对该信息进行分析,以得到用户的地域信息或时间信息,至步骤S300;优选地,该步骤是在所述第二分析判断模块104中完成的;
S300,判断是否需要将用户的地域信息或时间信息加入用户查询请求,如果否,则直接以该用户查询请求在所述搜索模块105中进行搜索,跳至步骤S5;如果是,则将用户的地域信息或时间信息加入到用户查询请求中以得到新的扩展查询请求;优选地,该步骤是在所述第二分析判断模块104中完成的;
S400,针对步骤S300中的扩展查询请求进行搜索;优选地,该步骤是在所述搜索模块105中完成的;具体地,所述搜索模块105用于针对扩展查询请求在所述资源数据库106和/或网页库107进行搜索,并输出搜索结果至所述UI模块102;
S500,将所述搜索结果输出。优选地,该步骤是在所述UI模块102和所述web服务模块101中完成的,搜索结果从所述搜索模块104返回至所述UI模块102,并通过所述UI模块102将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
值得一提的是:步骤S400具体包括:
将所述扩展查询请求在资源数据库106进行搜索,在对资源数据库106进行搜索的步骤中,如果有符合需求的结果,则进行S5步骤,如果没有符合需求的结果,则将所述扩展查询请求在网页库107进行网页搜索,并将通过网页搜索而得到的URL及摘要作为搜索结果,再进行S5步骤。当然,在其它实施方式中,也可同时对所述资源数据库106和所述网页库107进行搜索。
步骤S200中,用户浏览器的信息包括用户浏览器的IP地址或浏览器时间。
步骤S400包括对网页库107进行网页搜索的步骤,返回给用户搜索结果中包括通过网页搜索而得到的URL及摘要。
在步骤S500中,返回给用户的搜索结果是由对资源数据库106进行搜索的结果及对网页库107进行网页搜索的结果合并而成的。步骤S500包括对搜索结果进行排序的步骤,优选地,在本发明最佳实施方式中,特型展现的搜索结果排列在前,以URL展现的搜索结果排列在后。
相较于现有技术,本发明的搜索方法及其***利用了时间或者空间结合机制以对用户查询请求及浏览器的信息进行综合分析,得出更靠近用户真实查询关键词的扩展查询请求,并通过对该扩展查询请求进行查询而得到精确的搜索结果,搜索效率高、网络流量少,且用户体验佳。另外,本发明是针对开放平台引入的结构化外部资源数据,通过基于时间空间语义模版的查询,可以将搜索结果直接展现给用户,无需再次点击进入URL所展示网站。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (28)

1.一种搜索方法,其特征在于,所述搜索方法包括如下步骤:
S1,接收查询请求;
S2,对所述查询请求进行分析,判断所述查询请求是否包含地域词,如果是,则以所述查询请求进行搜索后至步骤S5;如果否,则获取用户地域信息后至步骤S3;
S3,判断是否需要将所述用户地域信息加入所述查询请求,如果否,则以所述查询请求进行搜索后至步骤S5;如果是,则将所述用户地域信息加入到所述查询请求中,得到扩展查询请求;
S4,对扩展查询请求进行搜索,并得到搜索结果;
S5,将所述搜索结果输出。
2.如权利要求1所述的搜索方法,其特征在于:所述步骤S4具体包括:
S41,将所述扩展查询请求在资源数据库中搜索;
S42,判断是否有符合需求的搜索结果;若有,则进行S5步骤,若无,则将所述扩展查询请求在网页库中搜索,并得到搜索结果。
3.如权利要求1所述的搜索方法,其特征在于:所述步骤S4具体包括:
将所述扩展查询请求在资源数据库和网页库中搜索,并得到搜索结果。
4.如权利要求3所述的搜索方法,其特征在于:在所述资源数据库中搜索到的搜索结果为特型展示结果;在所述网页库中搜索到的搜索结果为URL结果。
5.如权利要求4所述的搜索方法,其特征在于:所述步骤S5具体包括:
S51,对所述搜索结果进行排序;
S52,将排序后的所述搜索结果输出。
6.如权利要求5所述的搜索方法,其特征在于:所述特型展现结果排在所述URL结果前。
7.如权利要求1至6中任意一项所述的搜索方法,其特征在于:所述用户地域信息是通过客户端浏览器的IP地址获得的。
8.一种搜索方法,其特征在于,所述搜索方法包括如下步骤:
S1,接收查询请求;
S2,对所述查询请求进行分析,判断所述查询请求是否包含时间,如果是,则以所述查询请求进行搜索后至步骤S5;如果否,则获取用户时间信息后至步骤S3;
S3,判断是否需要将所述用户时间信息加入所述查询请求,如果否,则以所述查询请求进行搜索后至步骤S5;如果是,则将所述用户时间信息加入到所述查询请求中,得到扩展查询请求;
S4,对所述扩展查询请求进行搜索,并得到搜索结果;
S5,将所述搜索结果输出。
9.如权利要求8所述的搜索方法,其特征在于:所述步骤S4具体包括:
S41,将所述扩展查询请求在资源数据库中搜索;
S42,判断是否有符合需求的搜索结果;若有,则进行S5步骤,若无,则将所述扩展查询请求在网页库中搜索,并得到搜索结果。
10.如权利要求8所述的搜索方法,其特征在于:所述步骤S4具体包括:
将所述扩展查询请求在资源数据库和网页库中搜索,并得到搜索结果。
11.如权利要求10所述的搜索方法,其特征在于:在所述资源数据库中搜索到的搜索结果为特型展示结果;在所述网页库中搜索到的搜索结果为URL结果。
12.如权利要求11所述的搜索方法,其特征在于:所述步骤S5具体包括:
S51,对所述搜索结果进行排序;
S52,将排序后的所述搜索结果输出。
13.如权利要求12所述的搜索方法,其特征在于:所述特型展现结果排在所述URL结果前。
14.如权利要求8至13中任意一项所述的搜索方法,其特征在于:所述用户时间信息是通过客户端浏览器时间获得的。
15.一种搜索***,其特征在于,所述***包括:
UI模块,用于接收查询条件,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
第一分析判断模块,用于对所述查询请求进行分析,判断所述查询请求是否包含地域词,和用于获取用户地域信息;
第二分析判断模块,用于判断是否需要将所述用户地域信息加入所述查询请求,以得到扩展查询请求;
搜索模块,用于在数据库中对所述扩展查询请求进行搜索,并得到搜索结果。
16.如权利要求15所述的搜索***,其特征在于:所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询条件,并将所述查询条件转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
17.如权利要求16所述的搜索***,其特征在于:所述数据库包括:
资源数据库,用于存储开放平台引入的结构化外部资源索引及数据;以及
网页库用于存储普通搜索引擎索引及数据。
18.如权利要求17所述的搜索***,其特征在于:所述搜索模块在所述资源数据库中搜索到的搜索结果为特型展示结果;所述搜索模块在所述网页库中搜索到的搜索结果为URL结果。
19.如权利要求18所述的搜索***,其特征在于:所述搜索模块还用于对所述搜索结果进行排序。
20.如权利要求19所述的搜索方法,其特征在于:所述特型展现结果排在所述URL结果前。
21.如权利要求15至20中任意一项所述的搜索方法,其特征在于:所述用户地域信息是通过客户端浏览器的IP地址获得的。
22.一种搜索***,其特征在于,所述***包括:
UI模块,用于接收查询条件,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
第一分析判断模块,用于对所述查询请求进行分析,判断所述查询请求是否包含时间,和用于获取用户时间信息;
第二分析判断模块,用于判断是否需要将所述用户时间信息加入所述查询请求,以得到扩展查询请求;
搜索模块,用于在数据库中对所述扩展查询请求进行搜索,并得到搜索结果。
23.如权利要求22所述的搜索***,其特征在于:所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询条件,并将所述查询条件转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
24.如权利要求23所述的搜索***,其特征在于:所述数据库包括:
资源数据库,用于存储开放平台引入的结构化外部资源索引及数据;以及
网页库用于存储普通搜索引擎索引及数据。
25.如权利要求24所述的搜索***,其特征在于:所述搜索模块在所述资源数据库中搜索到的搜索结果为特型展示结果;所述搜索模块在所述网页库中搜索到的搜索结果为URL结果。
26.如权利要求25所述的搜索***,其特征在于:所述搜索模块还用于对所述搜索结果进行排序。
27.如权利要求26所述的搜索***,其特征在于:所述特型展现结果排在所述URL结果前。
28.如权利要求22至27中任意一项所述的搜索***,其特征在于:所述用户时间信息是通过客户端浏览器时间获得的。
CN2011100227789A 2011-01-20 2011-01-20 搜索方法及搜索*** Pending CN102073735A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100227789A CN102073735A (zh) 2011-01-20 2011-01-20 搜索方法及搜索***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100227789A CN102073735A (zh) 2011-01-20 2011-01-20 搜索方法及搜索***

Publications (1)

Publication Number Publication Date
CN102073735A true CN102073735A (zh) 2011-05-25

Family

ID=44032274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100227789A Pending CN102073735A (zh) 2011-01-20 2011-01-20 搜索方法及搜索***

Country Status (1)

Country Link
CN (1) CN102073735A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495851A (zh) * 2011-11-17 2012-06-13 百度在线网络技术(北京)有限公司 时序数据的存储和查询方法、***及装置
CN102663120A (zh) * 2012-04-20 2012-09-12 江苏奇异点网络有限公司 网站视频搜索***
CN103164527A (zh) * 2013-03-27 2013-06-19 百度在线网络技术(北京)有限公司 检索方法及设备
CN103365903A (zh) * 2012-04-05 2013-10-23 北京百度网讯科技有限公司 一种为搜索引擎获取结构化数据的方法、装置与***
CN103412899A (zh) * 2013-07-26 2013-11-27 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN104641372A (zh) * 2012-07-24 2015-05-20 微软公司 提供访问网站动作的接口
CN105955991A (zh) * 2016-04-19 2016-09-21 乐视控股(北京)有限公司 一种搜索结果聚合及定位的方法和装置
CN106354852A (zh) * 2016-09-02 2017-01-25 北京百度网讯科技有限公司 基于人工智能的搜索方法及装置
CN113239293A (zh) * 2021-05-10 2021-08-10 北京百度网讯科技有限公司 确定搜索结果的方法、设备、介质及程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845555A (zh) * 2005-04-07 2006-10-11 深圳市沃通通信服务有限公司 因特网网站访问者定位技术的实现方法以及应用
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN101777082A (zh) * 2010-03-01 2010-07-14 苏州数字地图网络科技有限公司 一种文字信息与地理信息的关联方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1845555A (zh) * 2005-04-07 2006-10-11 深圳市沃通通信服务有限公司 因特网网站访问者定位技术的实现方法以及应用
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN101777082A (zh) * 2010-03-01 2010-07-14 苏州数字地图网络科技有限公司 一种文字信息与地理信息的关联方法及***

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495851B (zh) * 2011-11-17 2014-11-05 百度在线网络技术(北京)有限公司 时序数据的存储和查询方法、***及装置
CN102495851A (zh) * 2011-11-17 2012-06-13 百度在线网络技术(北京)有限公司 时序数据的存储和查询方法、***及装置
CN103365903B (zh) * 2012-04-05 2019-03-26 北京百度网讯科技有限公司 一种为搜索引擎获取结构化数据的方法、装置与***
CN103365903A (zh) * 2012-04-05 2013-10-23 北京百度网讯科技有限公司 一种为搜索引擎获取结构化数据的方法、装置与***
CN102663120A (zh) * 2012-04-20 2012-09-12 江苏奇异点网络有限公司 网站视频搜索***
CN104641372A (zh) * 2012-07-24 2015-05-20 微软公司 提供访问网站动作的接口
CN104641372B (zh) * 2012-07-24 2018-07-20 微软技术许可有限责任公司 提供访问网站动作的接口
CN103164527A (zh) * 2013-03-27 2013-06-19 百度在线网络技术(北京)有限公司 检索方法及设备
CN103412899A (zh) * 2013-07-26 2013-11-27 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN103412899B (zh) * 2013-07-26 2016-02-10 百度在线网络技术(北京)有限公司 搜索方法和搜索引擎
CN105955991A (zh) * 2016-04-19 2016-09-21 乐视控股(北京)有限公司 一种搜索结果聚合及定位的方法和装置
CN106354852A (zh) * 2016-09-02 2017-01-25 北京百度网讯科技有限公司 基于人工智能的搜索方法及装置
CN113239293A (zh) * 2021-05-10 2021-08-10 北京百度网讯科技有限公司 确定搜索结果的方法、设备、介质及程序产品

Similar Documents

Publication Publication Date Title
US11334610B2 (en) Providing relevance-ordered categories of information
CN102096717B (zh) 搜索方法及搜索引擎
CN102073735A (zh) 搜索方法及搜索***
CN101124576B (zh) 集成有来自信任网络的用户注释的搜索***和方法
US10360272B2 (en) System and method for compending blogs
CN103339623B (zh) 涉及因特网搜索的方法和设备
CN101986306B (zh) 一种用于基于查询序列获取黄页信息的方法与设备
US20150088846A1 (en) Suggesting keywords for search engine optimization
CN102110170B (zh) 一种具有信息发布和搜索功能的***及信息发布方法
CN101231636A (zh) 一种便捷的信息搜索方法、***及一种输入法***
US9684717B2 (en) Semantic search for business entities
CN102117331B (zh) 视频搜索方法及***
WO2017196407A1 (en) Forking digital content items between digital topical environments
WO2021003024A1 (en) Post-ranker for search results
CN102156749B (zh) 一种地图网站的自动搜索判别方法、***及其分布式服务器***
CN105095383A (zh) 信息发布方法、搜索方法及相应装置
CN112417248A (zh) 寻址关键词的推荐方法、装置、模型、设备和存储介质
US9176939B2 (en) Alert driven interactive interface to a website mining system
JP2007148476A (ja) 情報検索支援システム、情報検索支援方法、検索支援モジュールプログラムおよび情報検索支援プログラム
KR20010104871A (ko) 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템
US11314793B2 (en) Query processing
JP2018529149A (ja) 情報をプッシュ配信する方法及び装置
CN107622125B (zh) 一种信息爬取方法和装置、电子设备
CN1804834A (zh) 一种实现网站级搜索网页级展示的中英文搜索引擎
CN101867668A (zh) 一种呼叫中心业务处理***及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110525