CN102135985A - 调用第三方搜索引擎搜索结果的搜索方法和搜索*** - Google Patents

调用第三方搜索引擎搜索结果的搜索方法和搜索*** Download PDF

Info

Publication number
CN102135985A
CN102135985A CN2011100316157A CN201110031615A CN102135985A CN 102135985 A CN102135985 A CN 102135985A CN 2011100316157 A CN2011100316157 A CN 2011100316157A CN 201110031615 A CN201110031615 A CN 201110031615A CN 102135985 A CN102135985 A CN 102135985A
Authority
CN
China
Prior art keywords
search
party
search results
query statement
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100316157A
Other languages
English (en)
Other versions
CN102135985B (zh
Inventor
甘泉
王婧雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN 201110031615 priority Critical patent/CN102135985B/zh
Publication of CN102135985A publication Critical patent/CN102135985A/zh
Application granted granted Critical
Publication of CN102135985B publication Critical patent/CN102135985B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明揭示了一种调用第三方搜索引擎搜索结果的搜索方法,包括:接收查询指令;对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,得到第一搜索结果;若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;输出所述第一搜索结果或第二搜索结果;其中,获取所述缓存数据库中预存数据步骤为:从用户历史搜索记录挖掘出用户需求列表;根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;所述第三方搜索引擎搜索结果存储于所述缓存数据库中。相较于现有技术,本发明提高了用户的检索效率,节约了网络流量。

Description

调用第三方搜索引擎搜索结果的搜索方法和搜索***
技术领域
本发明涉及一种调用第三方搜索引擎搜索结果的搜索方法和搜索***,属于搜索引擎技术领域。
背景技术
现有的搜索引擎调用第三方结果,主要是在双方达成合作关系后的全局性调用。例如,soso曾在2010年以前调用***的检索结果,即soso的检索结果页所显示内容除了soso自己的直达区模块,全部调用***的检索结果。但是,现有的搜索技术都是统一整体调用第三方检索结果,当第三方搜索引擎的响应时间不稳定的情况下,就无法保证搜索结果的及时响应。另外,现有的搜索技术对于需求识别和质量控制做得较差,没有实现精确针对某一类需求,调用第三方检索结果的技术,进而造成用户体验较差,搜索效率较低的问题。
与本发明相关的现有技术可参阅2009年9月23日公开的中国发明专利第CN101539918A号。该专利揭示了一种互联网搜索方法,在服务器端设置效果搜索服务器和源搜索服务器分别与互联网相连,并包括以下步骤:用户输入关键词通过互联网发送到效果服务器;效果搜索服务器以该关键词为索引查询搜索效果数据库,如果搜索效果数据库中有符合条件的搜索效果,则返回给用户,否则启动源搜索服务器;源搜索服务器以该关键词为索引查询源数据库,根据搜索结果生成该关键词对应的搜索效果返回给用户,并将该搜索效果保存在搜索效果数据库中。所述索效果数据库包括缓存,以保证用户搜索结果的实时响应。
但是,与通常的搜索技术一样,因为没有设置需求识别机制,所以在接 到用户的查询指令后,难以对该查询指令进行准确判断,进而导致返回给用户的搜索结果质量较差,进而造成用户体验较差,搜索效率较低的问题。
因此,需要对现有技术中的搜索方法进行改进。
发明内容
本发明目的在于提供一种改进的调用第三方搜索引擎搜索结果的搜索方法,所述方法能够输出准确度较高且搜索质量较好的检索结果。
本发明的另一目的在于提供一种改进的调用第三方搜索引擎搜索结果的搜索***,所述***能够输出准确度较高且搜索质量较好的检索结果。
相应地,本发明的一种实施方式的调用第三方搜索引擎搜索结果的搜索方法包括如下步骤:
S21、接收查询指令;
S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;
S23、若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,得到第一搜索结果;
S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25、输出所述第一搜索结果或第二搜索结果;
其中,获取所述缓存数据库中预存数据步骤为:
S11、从用户历史搜索记录挖掘出用户需求列表;
S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
作为本发明的进一步改进,在所述S12和S13步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
作为本发明的进一步改进,更新所述缓存数据库中预存数据步骤为:
S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;
S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;
S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
作为本发明的进一步改进,在所述S12’和S13’步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
作为本发明的进一步改进,所述S22步骤,具体为:
判断所述查询指令是否为英文搜索需求。
作为本发明的进一步改进,所述S22步骤,具体为:
分析所述查询指令,对所述查询指令进行过滤;
判断所述查询指令是否为英文搜索需求。
作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
相应地,本发明的另一种实施方式的调用第三方搜索引擎搜索结果的搜索方法包括如下步骤:
S21、接收查询指令;
S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;
S23、若是,则根据所述查询指令对缓存数据库中预存数据和网页存储库进行搜索,并得到第一搜索结果;
S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25、输出所述第一搜索结果或第二搜索结果;
其中,获取所述缓存数据库中预存数据步骤为:
S11、从用户历史搜索记录挖掘出用户需求列表;
S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
作为本发明的进一步改进,在所述S12和S13步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
作为本发明的进一步改进,更新所述缓存数据库中预存数据步骤为:
S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;
S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;
S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
作为本发明的进一步改进,在所述S12’和S13’步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
作为本发明的进一步改进,所述S22步骤,具体为:
判断所述查询指令是否为英文搜索需求。
作为本发明的进一步改进,所述S22步骤,具体为:
分析所述查询指令,对所述查询指令进行过滤;
判断所述查询指令是否为英文搜索需求。
作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
相应地,本发明的一种实施方式的调用第三方搜索引擎搜索结果的搜索***包括:
UI模块,用于接收查询指令,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
搜索模块,用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;以及用于将所述查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果;
需求挖掘模块,用于从查询日志中挖掘出用户需求列表;
数据抓取模块,用于根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
缓存数据库,用于存储查询指令对应的第三方搜索引擎搜索结果;
网页存储库,用于存储网页数据和该网页数据的索引信息;
查询日志,用于存储用户历史搜索记录。
作为本发明的进一步改进,所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询指令,并将所述查询指令转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
作为本发明的进一步改进,所述***还包括:
缓存模块,用于提供所述缓存数据库的访问服务接口。
作为本发明的进一步改进,所述缓存模块还用于将所述第三方搜索引擎搜索结果进行筛选。
作为本发明的进一步改进,所述需求挖掘模块还用于从用户历史搜索记录和已有预存数据挖掘出用户需求列表。
作为本发明的进一步改进,所述搜索模块包括:
需求识别单元,用于接收所述UI模块输入的查询指令,并对所述查询指令进行需求识别;以及
搜索单元,用于将经过所述需求识别单元的查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果。
作为本发明的进一步改进,所述需求识别单元用于识别所述查询指令是否为英文搜索需求。
作为本发明的进一步改进,所述需求识别单元还用于分析所述查询指令,对所述查询指令进行过滤。
作为本发明的进一步改进,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
相较于现有技术,本发明通过需求识别模块对用户查询指令(query)进行解析,进而能够准确识别哪些用户查询指令需调用第三方搜索引擎搜索结果,提高了检索结果的准确度;另外,通过对存入缓存数据库中的搜索结果进行 筛选,提高了调用第三方搜索引擎搜索结果所返回的搜索结果的质量,总的来说,通过上述方式,本发明提高了用户的检索效率,节约了网络流量。
附图说明
图1是本发明的调用第三方搜索引擎搜索结果的搜索***的一具体实施方式的工作原理框图;
图2是本发明的调用第三方搜索引擎搜索结果的搜索***的另一具体实施方式的工作原理框图;
图3是本发明调用第三方搜索引擎搜索结果的搜索方法的流程图。
图4是本发明的调用第三方搜索引擎搜索结果的搜索方法的一实施方式的流程图;
图5是本发明检索流程的一实施方式的具体流程图;
图6是本发明检索流程的另一实施方式的具体流程图;
图7是本发明的调用第三方搜索引擎搜索结果的搜索方法的另一实施方式的流程图。
具体实施方式
以下将结合附图所示的各实施方式对本发明进行详细描述。但这些实施方式并不限制本发明,本领域的普通技术人员根据这些实施方式所轻易做出的结构、方法、或功能上的变换均包含在本发明的保护范围内。
图1所示的本发明的调用第三方搜索引擎搜索结果的搜索***10与客户端20和第三方搜索引擎30实现互动的工作原理图。本实施方式中,该客户端20包括一浏览器201,客户可通过该浏览器201打开搜索引擎,并在搜索引擎中输入查询指令,一般的,该输入的查询指令为文本信息,当然,该查询指令还可以为图片信息、视频信息等等。所述调用第三方搜索引擎搜索结果的搜索***10通过网络接收客户输入至所述浏览器201中的查询指令,并对该查询指令进行搜索后,将搜索结果返回至该浏览器201。其中,该调用第三方搜索引擎搜索结果的搜索***10以及第三方搜索引擎30可以包括一台或多台服务器,该客户端20可以包括一个或多个用户终端设备,如个人计算机、笔记本电脑、无线电话、个人数字处理(PDA)、或其它计算机***和通信***。
这些服务器和终端设备在架构上都包含一些基本组件,如总线、处理***、存储***、一个或多个输入/输出***、和通信接口等。总线可以包括一个或多个导线,用来实现服务器或终端设备各组件之间的通信。处理***包括各类型 的用来执行指令、处理进程或线程的处理器或微处理器。存储***可以包括存储动态信息的随机访问存储器(RAM)等动态存储器,和存储静态信息的只读存储器(ROM)等静态存储器,以及包括磁或光学记录介质与相应驱动的大容量存储器。输入***供用户输入信息到服务器或终端设备,如键盘、鼠标、手写笔、声音识别***、或生物测定***等。输出***包括用来输出信息的显示器、打印机、扬声器等。通信接口用来使服务器或终端设备与其它***或***进行通信。通信接口之间可通过有线连接、无线连接、或光连接连接到网络中,使调用第三方搜索引擎搜索结果的搜索***10、客户端20、第三方搜索引擎30间能够通过网络实现相互间的通信。网络可以包括局域网(LAN)、广域网(WAN)、电话网络如公共交换电话网(PSTN)、企业内部的互联网、因特网、或上述这些网络的结合等。
服务器和终端设备上均包含有用来管理***资源、控制其它程序运行的操作***软件,以及用来实现特定功能模块的应用软件。如图1所示,在本发明一种实施方式中,所述调用第三方搜索引擎搜索结果的搜索***主要包括两部分,一部分为搜索部分,另一部分为数据预存部分。其中所述搜索部分包括web服务模块101、与web服务模块101交互通信的UI模块103、与所述UI模块103交互通信的搜索模块105、与所述搜索模块105通信的缓存数据库107,以及与所述搜索模块通信的网页存储库108;所述数据预存部分包括需求挖掘模块111、与所述查询指令挖掘模块111通信的查询日志115,以及与所述需求挖掘模块111通信的数据抓取模块113。其中,所述数据挖掘模块113与所述第三方搜索引擎30交互通信,一般地,所述数据挖掘模块113通过API接口与所述第三方搜索引擎30交互通信。
所述web服务模块101用于通过网络协议接收从所述客户端20传来的查询指令,并将该查询指令转到所述UI模块103,另外,该web服务模块101还用于接收所述UI模块103返回的结果页面,并将所述结果页面返回至所述客户端20。
所述UI模块103用于接收所述web服务模块101传送的查询指令,并将该 查询指令发送至所述搜索模块105进行搜索;另外,所述UI模块103还用于接收所述搜索模块105返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述搜索模块105用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;所述搜索模块105还用于接收所述查询指令,并将所述查询指令在所述缓存数据库107和/或网页存储库108中进行搜索,得到搜索结果。
所述缓存数据库107用于存储查询指令对应的第三方搜索引擎搜索结果。通过这样的设置,可使得搜索模块105直接搜索所述缓存数据库107,即可得到搜索结果,而无需从第三方再取一遍。避免了实时检索时,由于第三方搜索引擎响应时间不稳定而造成的延误。因此,本发明的***在接受用户的查询指令时能够快速反应,用户体验较好,搜索效率较高。所述缓存数据库107中的数据是更新策略的依据,优选地,本发明会记录所述缓存数据库107中每条数据的更新时间、热度(PV值),这样,在做删除或者更新的时候,会根据这些值进行计算,得到合理的更新列表(用户需求列表)和删除列表。
所述网页存储库108用于存储网页数据和该网页数据的索引信息。该数据库即是普通搜索引擎常用的数据库,在此不再赘述。
所述需求挖掘模块111用于从所述缓存数据库107或从所述查询日志115和所述缓存数据库107中挖掘出用户需求列表。优选地,该用户需求列表为从所述查询日志115和所述缓存数据库107中挖掘出需要入库,或者更新的用于需求列表。因对不同的数据有不同的数据更新周期,故所述需求挖掘模块111用于在提高缓存数据库107中第三方搜索引擎搜索结果的时效性与降低所述数据抓取模块113抓取频率之间保持一定的平衡;所述需求挖掘模块111还用于过滤所述查询日志115中的查询指令,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索***是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求挖掘 模块111会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等非英文查询指令,即是上述的查询指令都不会请求第三方搜索引擎30。
所述数据抓取模块113用于接收所述用户需求列表并根据所述用户需求列表调用所述第三方搜索引擎30,并抓取所述第三方搜索引擎30的第三方搜索引擎搜索结果;所述数据抓取模块113还用于将抓取到的搜索结果存入所述缓存数据库107中。所述数据抓取模块113设有自己的并发请求策略,保证按照要求的QPS(query per second)上限进行抓取,不会超过所述上限。所述缓存数据库107中的数据有时效性要求,超过一定时间就可能过期,更新就是为了保证所述缓存数据库107中数据的时效性。
所述查询日志115用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。所述查询日志115定期或者不定期的更新,因而存入缓存数据库107中的第三方搜索引擎搜索结果也在不断地更新。
如图2所示,在本发明另一种实施方式中,所述调用第三方搜索引擎搜索结果的搜索***主要包括两部分,一部分为搜索部分,另一部分为数据预存部分。其中所述搜索部分包括web服务模块101、与web服务模块101交互通信的UI模块103、与所述UI模块103交互通信的搜索模块105、与所述搜索模块105通信的网页存储库108、与所述搜索模块105交互通信的缓存模块106、与所述缓存模块106通信的缓存数据库107;所述数据预存部分包括需求挖掘模块111、与所述查询指令挖掘模块111通信的查询日志115,以及与所述需求挖掘模块111通信的数据抓取模块113。其中,所述数据挖掘模块113与所述第三方搜索引擎30交互通信,一般地,所述数据挖掘模块113通过API接口与所述第三方搜索引擎30交互通信。
所述web服务模块101用于通过网络协议接收从所述客户端20传来的查询指令,并将该查询指令转到所述UI模块103,另外,该web服务模块101还用于接收所述UI模块103返回的结果页面,并将所述结果页面返回至所述客户端 20。
所述UI模块103用于接收所述web服务模块101传送的查询指令,并将该查询指令发送至所述搜索模块105进行搜索;另外,所述UI模块103还用于接收所述搜索模块105返回的搜索结果,并将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101。
所述搜索模块105用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;所述搜索模块105还用于接收所述查询指令,以及在所述网页存储库108中进行搜索,所述搜索模块105还用于通过所述缓存模块106将所述查询指令在所述缓存数据库107中进行搜索,以及得到搜索结果。
所述缓存模块106用于提供所述缓存数据库107的访问服务接口。优选地,在本发明中,所述缓存模块106用于接收所述搜索模块105的搜索要求,在所述缓存数据库107中进行搜索;以及用于接收所述数据抓取模块113中抓取到的所述第三方搜索引擎30的搜索结果,并将其存入所述缓存数据库107中;所述缓存模块106还用于依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。
所述缓存数据库107用于存储查询指令对应的第三方搜索引擎搜索结果。通过这样的设置,可使得搜索模块105直接搜索所述缓存数据库107,即可得到搜索结果,而无需从第三方再取一遍。避免了实时检索时,由于第三方搜索引擎响应时间不稳定而造成的延误。因此,本发明的***在接受用户的查询指令时能够快速反应,用户体验较好,搜索效率较高。所述缓存数据库107中的数据是更新策略的依据,优选地,本发明会记录所述缓存数据库107中每条数据的更新时间、热度(PV值),这样,在做删除或者更新的时候,会根据这些值进行计算,得到合理的更新列表(用户需求列表)和 删除列表。
所述网页存储库108用于存储网页数据和该网页数据的索引信息。
所述需求挖掘模块111用于从所述查询日志115和所述缓存数据库107中挖掘出用户需求列表。优选地,该用户需求列表为从所述查询日志115和所述缓存数据库107中挖掘出需要入库,或者更新的用于需求列表。因对不同的数据有不同的数据更新周期,故所述需求挖掘模块111用于在提高缓存数据库107中第三方搜索引擎搜索结果的时效性与降低所述数据抓取模块113抓取频率之间保持一定的平衡;所述需求挖掘模块111还用于过滤所述查询日志115中的查询指令,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索***是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求挖掘模块111会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等非英文查询指令,即是上述的查询指令都不会请求第三方搜索引擎30。
所述数据抓取模块113用于接收所述用户需求列表并根据所述用户需求列表调用所述第三方搜索引擎30,并抓取所述第三方搜索引擎30的第三方搜索引擎搜索结果;所述数据抓取模块113还用于将抓取到的搜索结果存入所述缓存数据库107中。所述数据抓取模块113设有自己的并发请求策略,保证按照要求的QPS(query per second)上限进行抓取,不会超过所述上限。所述缓存数据库107中的数据有时效性要求,超过一定时间就可能过期,更新就是为了保证所述缓存数据库107中数据的时效性。
所述查询日志115用于存储用户历史搜索记录。优选地,其可包括查询指令、查询次数,以及加权点击数等信息。所述查询日志115定期或者不定期的更新,因而存入缓存数据库107中的第三方搜索引擎搜索结果也在不断地更新。
如图3所示,优选地,在上述各个实施方式中,所述搜索模块105包括了搜索单元1051,和需求识别单元1052。
所述搜索单元1051用于将经过所述需求识别单元1052的查询指令在所述缓存数据库107和/或网页存储库中进行搜索,得到搜索结果。
所述需求识别单元1052用于接收所述UI模块103输入的查询指令,并对所述查询指令进行需求识别,以提高检索结果的准确度。举例说明:若所述调用第三方搜索引擎搜索结果的搜索***是用于在接收到英文搜索需求时,调用第三方搜索引擎搜索结果的,则所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉语拼音、软件名、产品型号等非英文查询指令。
在本发明调用第三方搜索引擎搜索结果的搜索方法的一实施方式中,其包括数据预充流程及检索流程,其中,如图4所示,数据预充流程包括如下步骤:
S11,从查询日志115中的用户历史搜索记录挖掘出用户需求列表;优选地,该步骤是通过需求挖掘模块111和所述查询日志115完成;
S12,根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;优选地,该步骤是通过所述数据抓取模块113调用所述第三方搜索引擎30进行搜索,并得到所述第三方搜索引擎30输出的搜索结果;
S14,将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
预选地,在本发明最佳实施方式中,在所述S12和所述S14步骤之间,还包括S13,将所述第三方搜索引擎搜索结果进行筛选;优选地,该步骤是通过所述缓存模块106完成的,所述缓存模块106依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。
如图5所示,所述检索流程S2包括如下步骤:
S21,接收查询指令;优选地,该查询指令是用户通过客户端上的浏览 器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块103;
S22,对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;优选地,该步骤是通过搜索模块105中的需求识别单元1052完成的;优选地,在本发明最佳实施方式中,所述需求识别为识别所述查询指令是否为一英文搜索需求;所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型号等;
S23,若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,并得到第一搜索结果;优选地,该步骤是通过所述搜索模块105中的搜索单元1051完成的;
S24,若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25,输出所述第一搜索结果或第二搜索结果。优选地,该步骤是在所述UI模块103和所述web服务模块101中完成的,搜索结果从所述搜索模块105返回至所述UI模块103,并通过所述UI模块103将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
在本发明的另一实施方式中,如图6所示,所述检索流程包括如下步骤:
S21’,接收查询指令;优选地,该查询指令是用户通过客户端上的浏览器输入的至web服务模块101,该web服务模块101在得到所述查询命令后,会将该查询命令转到UI模块103;
S22’,对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;优选地,该步骤是通过搜索模块105中的需求识别单元1052完成的;优选地,在本发明最佳实施方式中,所述需求识别为识别所述查询指令是否为一英文搜索需求;所述需求识别单元1052会分析所述查询指令,并剔除不是英文的查询指令,如:汉字、网址、汉语拼音、软件名、产品型 号等;
S23’,若是,则根据所述查询指令对缓存数据库中预存数据和网页存储库进行搜索,并得到第一搜索结果;优选地,该步骤是通过所述搜索模块105中的搜索单元1051完成的;
S24’,若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25’,输出所述第一搜索结果或第二搜索结果。优选地,该步骤是在所述UI模块103和所述web服务模块101中完成的,搜索结果从所述搜索模块105返回至所述UI模块103,并通过所述UI模块103将所述搜索结果拼装为结果页面后,返回所述结果页面至所述web服务模块101,从而通过所述web服务模块101返回至客户端浏览器。
如图7所示,在本发明调用第三方搜索引擎搜索结果的搜索方法的一实施方式中,可更新所述缓存数据库107,其包括如下步骤:
S11’,从查询日志115和缓存数据库107中的用户历史搜索记录和已有预存数据挖掘出用户需求列表;优选地,该步骤是通过需求挖掘模块111和所述查询日志115完成;
S12’,根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到搜索结果;优选地,该步骤是通过所述数据抓取模块113调用所述第三方搜索引擎30进行搜索,并得到所述第三方搜索引擎30输出的搜索结果;
S14’,将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
预选地,在本发明最佳实施方式中,在所述S12’和所述S14’步骤之间,还包括S13’,将所述第三方搜索引擎搜索结果进行筛选;优选地,该步骤是通过所述缓存模块106完成的,所述缓存模块106依据一定的过滤条件对所述第三方搜索引擎30的搜索结果进行筛选,其中只有符合要求的第三方搜索引擎30的搜索结果才会被最终存入所述缓存数据库107中。例如,乱码的搜索结果预先被剔除。如此设置,可以提高调用第三方搜索引擎搜索结果所返回的搜索结果的质量。
通过上述描述可知,本发明通过需求识别模块对用户查询指令(query)进行解析,进而能够准确识别哪些用户查询指令需调用第三方搜索引擎搜索结果,提高了检索结果的准确度;另外,通过对存入缓存数据库中的搜索结果进行筛选,提高了调用第三方搜索引擎搜索结果所返回的搜索结果的质量,总的来说,通过上述方式,本发明提高了用户的检索效率,节约了网络流量。
应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式或变更均应包含在本发明的保护范围之内。

Claims (23)

1.一种调用第三方搜索引擎搜索结果的搜索方法,其特征在于,所述方法包括如下步骤:
S21、接收查询指令;
S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;
S23、若是,则根据所述查询指令对缓存数据库中预存数据进行搜索,得到第一搜索结果;
S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25、输出所述第一搜索结果或第二搜索结果;
其中,获取所述缓存数据库中预存数据步骤为:
S11、从用户历史搜索记录挖掘出用户需求列表;
S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
2.如权利要求1所述的方法,其特征在于,在所述S12和S13步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
3.如权利要求1所述的方法,其特征在于,更新所述缓存数据库中预存数据步骤为:
S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;
S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;
S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
4.如权利要求3所述的方法,其特征在于,在所述S12’和S13’步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
5.如权利要求1所述的方法,其特征在于,所述S22步骤,具体为:
判断所述查询指令是否为英文搜索需求。
6.如权利要求1所述的方法,其特征在于,所述S22步骤,具体为:
分析所述查询指令,对所述查询指令进行过滤;
判断所述查询指令是否为英文搜索需求。
7.如权利要求6所述的方法,其特征在于,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
8.一种调用第三方搜索引擎搜索结果的搜索方法,其特征在于,所述方法包括如下步骤:
S21、接收查询指令;
S22、对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;
S23、若是,则根据所述查询指令对缓存数据库中预存数据和网页存储库进行搜索,并得到第一搜索结果;
S24、若否,则根据所述查询指令在网页存储库中进行搜索,得到第二搜索结果;
S25、输出所述第一搜索结果或第二搜索结果;
其中,获取所述缓存数据库中预存数据步骤为:
S11、从用户历史搜索记录挖掘出用户需求列表;
S12、根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
S13、所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
9.如权利要求8所述的方法,其特征在于,在所述S12和S13步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
10.如权利要求8所述的方法,其特征在于,更新所述缓存数据库中预存数据步骤为:
S11’、从用户历史搜索记录和已有预存数据挖掘出用户需求列表;
S12’、根据所述用户需求列表,调用第三方搜索引擎进行搜索,得到搜索结果;
S13’、将所述第三方搜索引擎搜索结果存储于所述缓存数据库中。
11.如权利要求10所述的方法,其特征在于,在所述S12’和S13’步骤间,还包括步骤:
将所述第三方搜索引擎搜索结果进行筛选。
12.如权利要求8所述的方法,其特征在于,所述S22步骤,具体为:
判断所述查询指令是否为英文搜索需求。
13.如权利要求8所述的方法,其特征在于,所述S22步骤,具体为:
分析所述查询指令,对所述查询指令进行过滤;
判断所述查询指令是否为英文搜索需求。
14.如权利要求13所述的方法,其特征在于,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
15.一种调用第三方搜索引擎搜索结果的搜索***,其特征在于,该***包括:
UI模块,用于接收查询指令,且所述UI模块还用于接收搜索模块返回的搜索结果,并将所述搜索结果拼装为结果页面后输出;
搜索模块,用于对所述查询指令进行需求识别,判断其是否需要调用第三方搜索引擎搜索结果;以及用于将所述查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果;
需求挖掘模块,用于从查询日志中挖掘出用户需求列表;
数据抓取模块,用于根据所述用户需求列表,调用第三方搜索引擎进行搜索,并得到第三方搜索引擎搜索结果;
缓存数据库,用于存储查询指令对应的第三方搜索引擎搜索结果;
网页存储库,用于存储网页数据和该网页数据的索引信息;
查询日志,用于存储用户历史搜索记录。
16.如权利要求15所述的***,其特征在于,所述***还包括:
web服务模块,用于通过网络协议接收客户端发出的查询指令,并将所述查询指令转到所述UI模块,且所述web服务模块还用于接收所述UI模块返回的结果页面,并将所述结果页面返回至所述客户端。
17.如权利要求15或16所述的***,其特征在于,所述***还包括:
缓存模块,用于提供所述缓存数据库的访问服务接口。
18.如权利要求17所述的***,其特征在于,所述缓存模块还用于将所述第三方搜索引擎搜索结果进行筛选。
19.如权利要求15所述的***,其特征在于,所述需求挖掘模块还用于从用户历史搜索记录和已有预存数据挖掘出用户需求列表。
20.如权利要求15所述的***,其特征在于,所述搜索模块包括:
需求识别单元,用于接收所述UI模块输入的查询指令,并对所述查询指令进行需求识别;以及
搜索单元,用于将经过所述需求识别单元的查询指令在所述缓存数据库和/或网页存储库中进行搜索,得到搜索结果。
21.如权利要求20所述的***,其特征在于,所述需求识别单元用于识别所述查询指令是否为英文搜索需求。
22.如权利要求21所述的***,其特征在于,所述需求识别单元还用于分析所述查询指令,对所述查询指令进行过滤。
23.如权利要求22所述的***,其特征在于,所述过滤包括汉字过滤、网址过滤、软件名过滤、商品过滤及拼音过滤。
CN 201110031615 2011-01-28 2011-01-28 调用第三方搜索引擎搜索结果的搜索方法和搜索*** Active CN102135985B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110031615 CN102135985B (zh) 2011-01-28 2011-01-28 调用第三方搜索引擎搜索结果的搜索方法和搜索***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110031615 CN102135985B (zh) 2011-01-28 2011-01-28 调用第三方搜索引擎搜索结果的搜索方法和搜索***

Publications (2)

Publication Number Publication Date
CN102135985A true CN102135985A (zh) 2011-07-27
CN102135985B CN102135985B (zh) 2013-03-06

Family

ID=44295771

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110031615 Active CN102135985B (zh) 2011-01-28 2011-01-28 调用第三方搜索引擎搜索结果的搜索方法和搜索***

Country Status (1)

Country Link
CN (1) CN102135985B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393858A (zh) * 2011-11-17 2012-03-28 陈洪 一种基于客户端实时聚合的元搜索引擎***
CN102915380A (zh) * 2012-11-19 2013-02-06 北京奇虎科技有限公司 用于对数据进行搜索的方法和***
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及***
CN103034662A (zh) * 2011-09-28 2013-04-10 富士通株式会社 数据库构建装置和方法、搜索应用整合***和方法
CN103838735A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种提高检索效率和质量的数据检索方法
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN104978971A (zh) * 2014-04-08 2015-10-14 安徽科大讯飞信息科技股份有限公司 一种口语评测方法及***
CN105786928A (zh) * 2014-12-26 2016-07-20 北大医疗信息技术有限公司 医疗***数据查询方法和医疗***数据查询***
CN107748764A (zh) * 2017-09-27 2018-03-02 合肥博力生产力促进中心有限公司 一种用于企业服务的远程辅助指导控制***
CN107872329A (zh) * 2016-09-22 2018-04-03 阿里巴巴集团控股有限公司 一种预估qps的方法和设备
CN108228624A (zh) * 2016-12-15 2018-06-29 深圳市优朋普乐传媒发展有限公司 数据获取及更新方法、片单服务***及片单***
CN109783518A (zh) * 2018-12-11 2019-05-21 深圳市优必选科技有限公司 一种信息查询方法、查询装置、存储介质及终端设备
CN109886733A (zh) * 2019-01-25 2019-06-14 平安科技(深圳)有限公司 信息推荐方法、存储介质及计算机设备
CN111431860A (zh) * 2020-02-28 2020-07-17 山东公链信息科技有限公司 一种完全匿名的保护社交的公链
CN113806611A (zh) * 2020-06-17 2021-12-17 海信集团有限公司 一种存储搜索引擎结果的方法及设备
CN116010472A (zh) * 2023-03-28 2023-04-25 山东浪潮科学研究院有限公司 一种数据查询方法、装置、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101539918A (zh) * 2008-03-19 2009-09-23 天下互联(北京)科技有限公司 一种互联网搜索方法及***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101539918A (zh) * 2008-03-19 2009-09-23 天下互联(北京)科技有限公司 一种互联网搜索方法及***

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103034662A (zh) * 2011-09-28 2013-04-10 富士通株式会社 数据库构建装置和方法、搜索应用整合***和方法
CN102393858A (zh) * 2011-11-17 2012-03-28 陈洪 一种基于客户端实时聚合的元搜索引擎***
CN102915380A (zh) * 2012-11-19 2013-02-06 北京奇虎科技有限公司 用于对数据进行搜索的方法和***
CN102930054A (zh) * 2012-11-19 2013-02-13 北京奇虎科技有限公司 数据搜索方法及***
CN103838735A (zh) * 2012-11-21 2014-06-04 大连灵动科技发展有限公司 一种提高检索效率和质量的数据检索方法
CN104978971A (zh) * 2014-04-08 2015-10-14 安徽科大讯飞信息科技股份有限公司 一种口语评测方法及***
CN104978971B (zh) * 2014-04-08 2019-04-05 科大讯飞股份有限公司 一种口语评测方法及***
CN105786928A (zh) * 2014-12-26 2016-07-20 北大医疗信息技术有限公司 医疗***数据查询方法和医疗***数据查询***
CN104881451A (zh) * 2015-05-18 2015-09-02 百度在线网络技术(北京)有限公司 图片搜索方法及装置
CN107872329B (zh) * 2016-09-22 2020-10-16 阿里巴巴集团控股有限公司 一种预估qps的方法和设备
CN107872329A (zh) * 2016-09-22 2018-04-03 阿里巴巴集团控股有限公司 一种预估qps的方法和设备
CN108228624A (zh) * 2016-12-15 2018-06-29 深圳市优朋普乐传媒发展有限公司 数据获取及更新方法、片单服务***及片单***
CN107748764A (zh) * 2017-09-27 2018-03-02 合肥博力生产力促进中心有限公司 一种用于企业服务的远程辅助指导控制***
CN109783518A (zh) * 2018-12-11 2019-05-21 深圳市优必选科技有限公司 一种信息查询方法、查询装置、存储介质及终端设备
CN109886733A (zh) * 2019-01-25 2019-06-14 平安科技(深圳)有限公司 信息推荐方法、存储介质及计算机设备
CN111431860A (zh) * 2020-02-28 2020-07-17 山东公链信息科技有限公司 一种完全匿名的保护社交的公链
CN113806611A (zh) * 2020-06-17 2021-12-17 海信集团有限公司 一种存储搜索引擎结果的方法及设备
CN116010472A (zh) * 2023-03-28 2023-04-25 山东浪潮科学研究院有限公司 一种数据查询方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN102135985B (zh) 2013-03-06

Similar Documents

Publication Publication Date Title
CN102135985B (zh) 调用第三方搜索引擎搜索结果的搜索方法和搜索***
CN101231636B (zh) 一种便捷的信息搜索方法、***及一种输入法***
CN102096717B (zh) 搜索方法及搜索引擎
CN103210386B (zh) 混合联合搜索的方法、***和设备
CN102117331B (zh) 视频搜索方法及***
CN111241125A (zh) 一种记录操作日志的方法、装置、电子设备和存储介质
CN102541853A (zh) 一种利用浏览器地址栏获取应用信息的方法和装置
RU2316131C2 (ru) Способ хранения страниц в памяти мобильного устройства (варианты) и мобильное устройство для его осуществления
KR102550540B1 (ko) 랜딩 페이지 처리 방법, 장치, 기기 및 매체
CN106911782A (zh) 一种数据读取方法及装置
CN102298617A (zh) 一种用于获取目标页面的方法与设备
CN102073735A (zh) 搜索方法及搜索***
CN105718307B (zh) 进程管理方法及进程管理装置
CN101299854B (zh) 一种移动终端及其数据维护方法
CN102737022A (zh) 获取和搜索相关知识信息的方法及装置
CN101945178A (zh) 一种新闻信息的查看方法、***及移动终端
CN111814024A (zh) 分布式数据采集方法、***及存储介质
CN102946346A (zh) 即时通信交互界面中预设浏览器的方法、客户端及***
CN104765844B (zh) 一种网站页面的生成方法和装置
CN101008946A (zh) 中文移动通信信息搜索方法及装置
CN202102435U (zh) 一种移动设备搜索信息的装置
CN102156697A (zh) 一种通过微件实现网页应用的方法及终端设备
CN103729440B (zh) 一种访问网站的方法及装置
CN112417248A (zh) 寻址关键词的推荐方法、装置、模型、设备和存储介质
CN102024063A (zh) 自动搜索方法和移动通信终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant