CN105808740A - 信息搜索方法及信息搜索装置 - Google Patents

信息搜索方法及信息搜索装置 Download PDF

Info

Publication number
CN105808740A
CN105808740A CN201610139383.XA CN201610139383A CN105808740A CN 105808740 A CN105808740 A CN 105808740A CN 201610139383 A CN201610139383 A CN 201610139383A CN 105808740 A CN105808740 A CN 105808740A
Authority
CN
China
Prior art keywords
search
search engine
key word
self
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610139383.XA
Other languages
English (en)
Inventor
程书京
金伟伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610139383.XA priority Critical patent/CN105808740A/zh
Publication of CN105808740A publication Critical patent/CN105808740A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种信息搜索方法,应用于搜索服务器,所述方法包括:接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类;接收来自于所述用户终端的信息搜索请求,提取所述信息搜索请求中的关键词,确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果;及将所述搜索结果返回给所述用户终端。本发明实施例可实现搜索过程具有更强的针对性及搜索结果更加符合用户期望的特点。

Description

信息搜索方法及信息搜索装置
技术领域
本发明涉及信息检索及信息搜索领域,具体而言,涉及一种信息搜索方法及信息搜索装置。
背景技术
搜索引擎作为互联网的重要入口,提供用户依据查询关键字返回搜索结果的功能。传统的元搜索引擎的搜索结果主要通过获取各个第三方独立搜索引擎的搜索结果并对结果进行排名及去重后整合而得到。虽然这种方式获得的搜索结果的准确度会有一定的提高,但无法对第三方独立搜索引擎的数据库进行分类聚合,也不能充分发挥各独立搜索引擎的优点。当用户用“百度”搜索英文关键词时,其搜索结果的质量就远不如“谷歌”。同样,当用户搜索中文关键词时,谷歌搜索结果的质量也略逊于“百度”。而对于一个文本类型确定的搜索关键词,不管是谷歌、还是百度的搜索结果质量都远远比不上谷歌自定义搜索的搜索结果质量。因为谷歌自定义搜索可以针对用户的搜索意图,对符合用户搜索意图的相应的数据进行整合并提供搜索结果,就相当于为用户的搜索关键词量身定制了一个搜索引擎。比如当用户搜索“美人鱼电影”的时候,用户的意图可能是看电影或了解这个电影。谷歌自定义搜索便可根据用户的搜索意图,提供相应的自定义数据,因此结果更加准确,显得更加智能。
然而,由于自定义搜索自定义数据库的数据无法和独立第三方搜索引擎的数据量相比,当用户输入搜索词后,返回的搜索结果有时很少甚至有获取不到搜索结果的情况出现,这样可能会严重影响用户体验。
发明内容
有鉴于此,本发明实施例的目的在于提供一种信息搜索方法,应用于搜索服务器,所述方法包括:
搜索引擎创建步骤,接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类;
关键词确定步骤,接收来自于所述用户终端的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型;
搜索步骤,确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果;及
结果返回步骤,将所述搜索结果返回给所述用户终端。
本发明另一较佳实施例还提供一种信息搜索装置,应用于搜索服务器,所述装置包括:
搜索引擎创建模块,用于接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类;
关键词确定模块,用于接收来自于所述用户终端的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型;
搜索模块,确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果;及
结果返回模块,用于将所述搜索结果返回给所述用户终端。
与现有技术相比,本发明较佳实施例提供的信息搜索方法及信息搜索装置,在搜索服务器中对新添加的自定义搜索引擎进行分类,在收到信息搜索请求后,根据信息搜索请求中关键词的文本类型调取与之文本类型相对的自定义搜索引擎进行搜索。使得上述过程搜索过程具有更强的针对性、搜索的数据范围相对更大,搜索结果更加符合用户的期望。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明较佳实施例提供的搜索服务器与至少一用户终端进行通信的交互示意图。
图2是图1所示的搜索服务器的方框示意图。
图3是本发明较佳实施例提供的图1所示的搜索服务器的信息搜索方法的流程图。
图4是本发明较佳实施例提供的图1所示的信息搜索装置的功能模块框图。
主要元件符号说明
搜索服务器 100
用户终端 200
网络 300
信息搜索装置 110
存储器 111
处理器 112
通信单元 113
搜索引擎添加模块 1101
关键词确定模块 1102
搜索模块 1103
结果返回模块 1104
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本发明较佳实施例提供的搜索服务器100与至少一用户终端200进行通信的交互示意图。所述用户终端200可通过网络300访问搜索服务器100,以使用搜索服务器100提供的搜索服务。本实施例中,所述搜索服务器100,所述搜索服务器100可以是,但不限于,web(网站)服务器,所述搜索服务器100可以是单独存在的服务器,也可以由多个分布在云端的服务器组成,所述搜索服务器100中可以包括至少一搜索引擎。所述用户终端200可以是,但不限于,智能手机、个人电脑(personalcomputer,PC)、平板电脑、个人数字助理(personaldigitalassistant,PDA)、移动上网设备(mobileInternetdevice,MID)等。所述网络300可以是,但不限于,有线网络或无线网络。
如图2所示,是图1所示的搜索服务器100的方框示意图。所述搜索服务器100包括信息搜索装置110、存储器111、处理器112及通信单元113。
所述存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,所述存储器111可以是,但不限于,随机存取存储器(RandomAccessMemory,RAM),只读存储器(ReadOnlyMemory,ROM),可编程只读存储器(ProgrammableRead-OnlyMemory,PROM),可擦除只读存储器(ErasableProgrammableRead-OnlyMemory,EPROM),电可擦除只读存储器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。其中,存储器111用于存储程序,所述处理器112在接收到执行指令后,执行所述程序。所述通信单元113用于通过所述网络300建立所述搜索服务器100与用户终端200之间的通信连接,并用于通过所述网络300收发数据。
所述信息搜索装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器111中或固化在所述搜索服务器100的操作***(operatingsystem,OS)中的软件功能模块。所述处理器112用于执行所述存储器111中存储的可执行模块,例如所述信息搜索装置110所包括的软件功能模块及计算机程序等。本实施例中,所述信息搜索装置110,为用户终端200提供网络信息搜索服务,具体的方法在后续进行详细说明。本实施例中,所述信息搜索装置110可以是搜索服务器100提供的搜索引擎或者属于该搜索引擎的一部分(如该搜索引擎的其中一个功能模块)。所述搜索引擎是指根据一定的策略、运用计算机程序从网络(如互联网)上搜集信息,在对信息进行组织和处理后,为用户提供搜索服务,将用户需要搜索的相关的信息(例如文档、视频、音乐等)展示给用户的***。
请参照图3,是本发明较佳实施例提供的应用于图1所示的搜索服务器100的信息搜索方法的流程图。下面将对图3所示的具体流程和步骤进行详细阐述。
搜索引擎创建步骤S301,接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类。
在本具体实施例中,用户可以根据自己的需求提交网址信息到搜索服务器100中用以建立自定义搜索引擎。具体地,所述网址信息包括但不限于:单个网页(如:www.example.com/page.html),整个网站(如:www.mysite.com/*),网站的某些部分(如:www.example.com/docs/*或www.example.com/docs/),整个域(如:*.example.com)及正则表达式(如:\w{4}\:\/\/\w+\.\w*\.\w{3,}\/)等。
具体地,以谷歌搜索引擎为例,当然应当理解的是,下面描述的内容同样适用其它搜索引擎(比如:百度、必应及雅虎等)。谷歌搜索引擎在创建自定义搜索引擎时,会将用户通过用户终端200提供的网站创建成单独的索引作为自定义搜索引擎的数据库,用以响应用户的搜索请求。自定义搜索引擎可以保证数据的相似性,从而尽可能保证搜索结果符合用户的搜索意图,让搜索结果聚焦到用户的搜索意图上,可以提高搜索结果的准确性和用户体验。
关键词确定步骤S302,接收来自于所述用户终端200的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型。
在本具体实施例中,所述搜索服务器100提取出所述信息搜索请求中的关键词,并对所述关键词的文本类别进行确定。所述文本类别可以是:电影、电视剧、网盘、音乐、文档、软件及美食等。具体地,对所述文本类别进行确认的算法可以是朴素贝叶斯分类算法、决策树分类算法、人工神经网络分类算法,也可以是各种算法的综合。但对关键词的文本类别确认的算法和对自定义搜索引擎的分类算法应当一致,即如果采用朴素贝叶斯分类算法对多个自定义搜索引擎分类,假如多个个自定义搜索引擎可以分类为:电影、视频、网盘、音乐、文档、软件、APP....等。对用户搜索关键词进行文本类型确认时也必须采用朴素贝叶斯分类算法,若用户搜索关键词为“功夫熊猫”,采用此算法文本类型为“电影”,则关键词“功夫熊猫”与电影自定义搜索引擎相匹配。
检索步骤S303,确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果。
在本具体实施例中,所述搜索服务器100确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索。
具体地,若在搜索服务器100中识别到一个与所述关键词文本类型匹配的自定义搜索引擎,则将所述关键词带入到所述自定义搜索引擎中进行搜索。若在搜索服务器100中识别到多个所述关键词文本类型相关的自定义搜索引擎,则将所述关键词带入到与所述关键词文本类型相关性最高的自定义搜索引擎中进行搜索。
在本具体实施例中,检索步骤S303还可以包括当不存在与所述关键词的文本类型相符的自定义搜索引擎时,判断所述关键词中是否存在特定语言,若不存在特定语言,对所述关键词进行全网搜索。
在本实施例中,所述搜索服务器不仅可以通过人为创建用户指定网站的自定义搜索引擎,还可以对整个网络(全网络)进行搜索。在本具体实施方式中,若不存在与所述关键词的文本类型相符的自定义搜索引擎,且该关键词中不含有特定语言时,对所述关键词进行全网搜索。其中,所述特定语言是相对于搜索引擎而言,具体地,对于谷歌而言非英文(如:中文)可以被认定为谷歌搜索引擎的特定语言,对于百度而言非中文(如:英文)可以被认定为百度搜索引擎的特定语言。
在本具体实施例中,步骤S303还可以包括当所述关键词中存在特定语言时,将搜索关键词发送到预设的与该特定语言相关的至少一个搜索引擎中进行搜索并在每一个搜索引擎中得到相应的搜索结果。
在本实施方式中,在不存在与所述关键词的文本类型相符的自定义搜索引擎且关键词中存在特定语言时,将搜索关键词发送到与该特定语言相关的至少一个预设搜索引擎中进行搜索。比如,在谷歌的搜索引擎中没有找到与一含有中文的关键词文本类型相符的自定义搜索引擎,搜索服务器100可以将含有中文的关键词发送给与中文相关的预设搜索引擎中(如:百度搜索引擎、360搜索引擎及搜狗搜索引擎等),在对应的各个与中文相关的搜索引擎内搜索出与所述含有中文的关键词的相关搜索结果。
结果返回步骤S304,将所述搜索结果返回给所述用户终端200。
在本具体实施例中,所述搜索服务器100对搜索结果进行排名、去重后发送给所述用户终端200,并在所述用户终端200上进行显示。
在本具体实施例的一实施方式中,当含有特定语言的关键词在与所述特定语言相关的搜索引擎中搜索时,对与该特定语言相关的至少一个搜索引擎中的每一个搜索引擎赋予权重系数,综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重系数对与所述关键词相关的所有搜索结果进行排序,将排序后的搜索结果返回给所述用户终端200。
在本实施方式中可以采用如下方式对搜索结果进行排序,根据搜索引擎的权重系数进行搜索结果排序。例如,对含有中文的关键词进行搜索时,其中,百度搜索引擎的权重系数为0.7,360搜索引擎的权重系数为0.2,搜狗搜索引擎的权重系数为0.1。在进行搜索结果排名时,依次按百度搜索引擎、360搜索引擎及搜狗搜索引擎的搜索结果进行排名。
在本实施方式中还可以采用另一种方式对搜索结果进行排序,即综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重对与所述关键词相关的所有搜索结果进行排序。具体地,例如,在对含有中文的关键词进行搜索时,搜索服务器100会将中文关键词发送给百度搜索引擎、360搜索引擎及搜狗搜索引擎。其中,百度搜索引擎的权重系数为0.7,360搜索引擎的权重系数为0.2,搜狗搜索引擎的权重系数为0.1。假如,百度搜索引擎返回的搜索结果中排列顺序为1a、2a、3a、......;360搜索引擎返回的搜索结果中排列顺序为1b、2b、3b、......;搜狗搜索引擎返回的搜索结果中排列顺序为1c、2c、3c、......。百度搜索引擎返回的每条搜索结果的排名权重为70、70/2、70/3、70/4、......;360搜索引擎返回的每条搜索结果的排名权重为20、20/2、20/3、20/4、......;搜狗搜索引擎返回的每条搜索结果的排名权重为10、10/2、10/3、10/4、.......。因此对于该含有中文的关键词所有搜索结果的排序为:a1、a2、a3、b1、a4、a5、c1......。再对上述结果进行去重后即可以得到最终的排序结果,将上述最终的排序结果发送给所述用户终端即可。在一个搜索引擎中若搜索结果的排序权重相同,相同排序权重的搜索结果前后顺序可以任意。同理,在上述搜索结果中若不同搜索引擎中存在排序权重相同的项时,排序权重相同的项的排序前后顺序也可以任意。
请参照图4,是本发明较佳实施例提供的应用于图1所示的搜索服务器100的信息搜索装置110的流程图。下面将对图4所示的信息搜索装置110进行详细阐述。
搜索引擎创建模块1101,用于接收在用户终端200上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类。
在本具体实施例中,用户可以根据自己的需求提交网址信息到搜索引擎添加模块1101中用以建立自定义搜索引擎。具体地,所述网址信息包括但不限于:单个网页(如:www.example.com/page.html),整个网站(如:www.mysite.com/*),网站的某些部分(如:www.example.com/docs/*或www.example.com/docs/),整个域(如:*.example.com)及正则表达式(如:\w{4}\:\/\/\w+\.\w*\.\w{3,}\/)等。
具体地,以谷歌搜索引擎为例,当然应当理解的是,下面描述的内容同样适用其它搜索引擎(比如:百度、必应及雅虎等)。谷歌搜索引擎在创建自定义搜索引擎时,会将用户通过用户终端200提供的网站创建成单独的索引作为自定义搜索引擎的数据库,用以响应用户的搜索请求。自定义搜索引擎可以保证数据的相似性,从而尽可能保证搜索结果符合用户的搜索意图,让搜索结果聚焦到用户的搜索意图上,可以提高搜索结果的准确性和用户体验。
关键词确定模块1102,用于接收来自于所述用户终端200的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型。
在本具体实施例中,所述关键词确定模块1102提取出所述信息搜索请求中的关键词,并对所述关键词的文本类别进行确定。所述文本类别可以是:电影、电视剧、网盘、音乐、文档、软件及美食等。具体地,对所述文本类别进行确认的算法可以是朴素贝叶斯分类算法、决策树分类算法、人工神经网络分类算法,也可以是各种算法的综合。但对关键词的文本类别确认的算法和对自定义搜索引擎的分类算法应当一致,即如果采用朴素贝叶斯分类算法对多个自定义搜索引擎分类,假如多个自定义搜索引擎可以分类为:电影、视频、网盘、音乐、文档、软件、APP....等。对用户搜索关键词进行文本类型确认时也必须采用朴素贝叶斯分类算法,若用户搜索关键词为“功夫熊猫”,采用此算法文本类型为“电影”,则关键词“功夫熊猫”与电影自定义搜索引擎相匹配。
搜索模块1103,用于确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果。
在本具体实施例中,所述搜索模块1103用于确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索。
具体地,若在搜索模块1103识别到一个与所述关键词文本类型匹配的自定义搜索引擎,则将所述关键词带入到所述自定义搜索引擎中进行搜索。若搜索模块1103识别到多个所述关键词文本类型相关的自定义搜索引擎,则将所述关键词带入到与所述关键词文本类型相关性最高的自定义搜索引擎中进行搜索。
在本具体实施例中,搜索模块1103还可以用于当不存在与所述关键词的文本类型相符的自定义搜索引擎时,判断所述关键词中是否存在特定语言,若不存在特定语言,对所述关键词进行全网搜索。
在本实施例中,所述搜索模块1103不仅可以通过人为创建用户指定网站的自定义搜索引擎,还可以对整个网络(全网络)进行搜索。在本具体实施方式中,若不存在与所述关键词的文本类型相符的自定义搜索引擎,且该关键词中不含有特定语言时,对所述关键词进行全网搜索。其中,所述特定语言是相对于搜索引擎而言,具体地,对于谷歌而言非英文(如:中文)可以被认定为谷歌搜索引擎的特定语言,对于百度而言非中文(如:英文)可以被认定为百度搜索引擎的特定语言。
在本具体实施例中,所述搜索模块1103还可以用于当所述关键词中存在特定语言时,将搜索关键词发送到预设的与该特定语言相关的至少一个搜索引擎中进行搜索并在每一个搜索引擎中得到相应的搜索结果。
在本实施例中,在不存在与所述关键词的文本类型相符的自定义搜索引擎且关键词中存在特定语言时,将搜索关键词发送到与该特定语言相关的至少一个预设搜索引擎中进行搜索。比如,在谷歌的搜索引擎中没有找到与一含有中文的关键词文本类型相符的自定义搜索引擎,搜索服务器100可以将含有中文的关键词发送发送给与中文相关的搜索引擎中(如:百度搜索引擎、360搜索引擎及搜狗搜索引擎等),在对应的各个与中文相关的搜索引擎内搜索出与所述含有中文的关键词的相关搜索结果。
结果返回模块1104,用于将所述搜索结果返回给所述用户终端200。
在本具体实施例中,所述结果返回模块1104对搜索结果进行排名、去重后发送给所述用户终端,并在所述用户终端200上进行显示。
在本具体实施例的一实施方式中,当含有特定语言的关键词在与所述特定语言相关的搜索引擎中搜索时,对与该特定语言相关的至少一个搜索引擎中的每一个搜索引擎赋予权重系数,综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重系数对与所述关键词相关的所有搜索结果进行排序,将排序后的搜索结果返回给所述用户终端200。
在本实施方式中可以采用如下方式对搜索结果进行排序,根据搜索引擎的权重系数进行搜索结果排序。例如,对含有中文的关键词进行搜索时,其中,百度搜索引擎的权重系数为0.7,360搜索引擎的权重系数为0.2,搜狗搜索引擎的权重系数为0.1。在进行搜索结果排名时,依次按百度搜索引擎、360搜索引擎及搜狗搜索引擎的搜索结果进行排名。
在本实施方式中还可以采用另一种方式对搜索结果进行排序,即综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重对与所述关键词相关的所有搜索结果进行排序。具体地,例如,在对含有中文的关键词进行搜索时,搜索服务器100会将中文关键词发送给百度搜索引擎、360搜索引擎及搜狗搜索引擎。其中,百度搜索引擎的权重系数为0.7,360搜索引擎的权重系数为0.2,搜狗搜索引擎的权重系数为0.1。假如,百度搜索引擎返回的搜索结果中排列顺序为1a、2a、3a、......;360搜索引擎返回的搜索结果中排列顺序为1b、2b、3b、......;搜狗搜索引擎返回的搜索结果中排列顺序为1c、2c、3c、......。百度搜索引擎返回的每条搜索结果的排名权重为70、70/2、70/3、70/4、......;360搜索引擎返回的每条搜索结果的排名权重为20、20/2、20/3、20/4、......;搜狗搜索引擎返回的每条搜索结果的排名权重为10、10/2、10/3、10/4、.......。因此对于该含有中文的关键词所有搜索结果的排序为:a1、a2、a3、b1、a4、a5、c1......。再对上述结果进行去重后即可以得到最终的排序结果,将上述最终的排序结果发送给所述用户终端200即可。在一个搜索引擎中若搜索结果的排序权重相同,相同排序权重的搜索结果前后顺序可以任意。同理,在上述搜索结果中若不同搜索引擎中存在排序权重相同的项时,排序权重相同的项的排序前后顺序也可以任意。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,也可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种信息搜索方法,应用于搜索服务器,其特征在于,所述方法包括:
搜索引擎创建步骤,接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类;
关键词确定步骤,接收来自于所述用户终端的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型;
搜索步骤,确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果;及
结果返回步骤,将所述搜索结果返回给所述用户终端。
2.如权利要求1所述信息搜索方法,其特征在于:
所述搜索引擎创建步骤中对创建的自定义搜索引擎进行分类的算法与所述搜索步骤中确定所述关键词文本类型的算法相同。
3.如权利要求1所述信息搜索方法,其特征在于,所述搜索步骤还包括:
当不存在与所述关键词的文本类型相符的自定义搜索引擎时,判断所述关键词中是否存在特定语言,若不存在特定语言,对所述关键词进行全网搜索。
4.如权利要求3所述信息搜索方法,其特征在于,所述搜索步骤还包括:
当所述关键词中存在特定语言时,将搜索关键词发送到预设的与该特定语言相关的至少一个搜索引擎中进行搜索并在每一个搜索引擎中得到相应的搜索结果。
5.如权利要求4所述信息搜索方法,其特征在于,所述结果返回步骤还包括:
对与该特定语言相关的至少一个搜索引擎中的每一个搜索引擎赋予权重系数,综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重系数对与所述关键词相关的所有搜索结果进行排序,将排序后的搜索结果返回给所述用户终端。
6.一种信息搜索装置,应用于搜索服务器,其特征在于:所述装置包括:
搜索引擎创建模块,用于接收在用户终端上添加的网址信息,对应所述网址信息创建相应的自定义搜索引擎,并对创建的自定义搜索引擎进行分类;
关键词确定模块,用于接收来自于所述用户终端的信息搜索请求,提取所述信息搜索请求中的关键词,确定所述关键词的文本类型;
搜索模块,用于确认是否存在与所述关键词的文本类型相符的自定义搜索引擎,当存在与所述关键词的文本类型相符的自定义搜索引擎时,将所述关键词发送到与所述关键词的文本类型相符的自定义搜索引擎中进行搜索,得到搜索结果;及
结果返回模块,用于将所述搜索结果返回给所述用户终端。
7.如权利要求6所述的信息搜索装置,其特征在于:
搜索引擎创建模块对创建的自定义搜索引擎进行分类的算法与所述关键词确定模块确定所述关键词文本类型的算法相同。
8.如权利要求6所述的信息搜索装置,其特征在于:
所述搜索模块,还用于当不存在与所述关键词的文本类型相符的自定义搜索引擎时,判断所述关键词中是否存在特定语言,若不存在特定语言,对所述关键词进行全网搜索。
9.如权利要求6所述的信息搜索装置,其特征在于:
所述搜索模块还用于当所述关键词中存在特定语言时,将搜索关键词发送到预设的与该特定语言相关的至少一个搜索引擎中进行搜索并在每一个搜索引擎中得到相应的搜索结果。
10.如权利要求9所述的信息搜索装置,其特征在于:
所述结果返回模块还用于对与该特定语言相关的至少一个搜索引擎中的每一个搜索引擎赋予权重系数,综合每一搜索结果在搜索引擎中的排序及对应搜索引擎的权重系数对与所述关键词相关的所有搜索结果进行排序,将排序后的搜索结果返回给所述用户终端。
CN201610139383.XA 2016-03-11 2016-03-11 信息搜索方法及信息搜索装置 Pending CN105808740A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610139383.XA CN105808740A (zh) 2016-03-11 2016-03-11 信息搜索方法及信息搜索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610139383.XA CN105808740A (zh) 2016-03-11 2016-03-11 信息搜索方法及信息搜索装置

Publications (1)

Publication Number Publication Date
CN105808740A true CN105808740A (zh) 2016-07-27

Family

ID=56468113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610139383.XA Pending CN105808740A (zh) 2016-03-11 2016-03-11 信息搜索方法及信息搜索装置

Country Status (1)

Country Link
CN (1) CN105808740A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664509A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 一种即席查询的方法、装置及服务器
CN110020082A (zh) * 2017-12-11 2019-07-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN111143646A (zh) * 2018-11-06 2020-05-12 沈阳美行科技有限公司 一种多引擎搜索***及其实现方法
CN111241390A (zh) * 2019-12-31 2020-06-05 熵加网络科技(北京)有限公司 一种元搜索引擎的检索方法
CN111368166A (zh) * 2020-03-05 2020-07-03 深圳中兴网信科技有限公司 资源搜索方法、资源搜索装置和计算机可读存储介质
CN112579871A (zh) * 2020-12-21 2021-03-30 维沃移动通信有限公司 信息搜索方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101676901A (zh) * 2008-09-19 2010-03-24 华为技术有限公司 搜索调度方法及搜索服务器
CN101751434A (zh) * 2008-12-16 2010-06-23 北大方正集团有限公司 一种元搜索引擎的排名方法及元搜索引擎
CN102043831A (zh) * 2010-11-19 2011-05-04 四川圣望科技有限公司 代理搜索引擎方法
US20140172817A1 (en) * 2008-05-12 2014-06-19 Enpulz, L.L.C. Web browser accessible search engine that identifies search result maxima through user search flow and result content comparison

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140172817A1 (en) * 2008-05-12 2014-06-19 Enpulz, L.L.C. Web browser accessible search engine that identifies search result maxima through user search flow and result content comparison
CN101676901A (zh) * 2008-09-19 2010-03-24 华为技术有限公司 搜索调度方法及搜索服务器
CN101751434A (zh) * 2008-12-16 2010-06-23 北大方正集团有限公司 一种元搜索引擎的排名方法及元搜索引擎
CN102043831A (zh) * 2010-11-19 2011-05-04 四川圣望科技有限公司 代理搜索引擎方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664509A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 一种即席查询的方法、装置及服务器
CN108664509B (zh) * 2017-03-31 2021-09-07 华为技术有限公司 一种即席查询的方法、装置及服务器
CN110020082A (zh) * 2017-12-11 2019-07-16 北京搜狗科技发展有限公司 一种搜索方法及装置
CN111143646A (zh) * 2018-11-06 2020-05-12 沈阳美行科技有限公司 一种多引擎搜索***及其实现方法
CN111143646B (zh) * 2018-11-06 2023-09-29 沈阳美行科技股份有限公司 一种多引擎搜索***及其实现方法
CN111241390A (zh) * 2019-12-31 2020-06-05 熵加网络科技(北京)有限公司 一种元搜索引擎的检索方法
CN111368166A (zh) * 2020-03-05 2020-07-03 深圳中兴网信科技有限公司 资源搜索方法、资源搜索装置和计算机可读存储介质
CN112579871A (zh) * 2020-12-21 2021-03-30 维沃移动通信有限公司 信息搜索方法、装置和电子设备

Similar Documents

Publication Publication Date Title
CN105808740A (zh) 信息搜索方法及信息搜索装置
CN107590174B (zh) 页面访问方法及装置
Zamani et al. Situational context for ranking in personal search
US9317613B2 (en) Large scale entity-specific resource classification
CN102368262B (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
CN109634698B (zh) 菜单显示方法、装置、计算机设备及存储介质
CN102346778B (zh) 一种用于提供搜索结果的方法与设备
US8631097B1 (en) Methods and systems for finding a mobile and non-mobile page pair
CN104699737A (zh) 用于管理搜索的方法和***
EP2798537A1 (en) Knowledge-based entity detection and disambiguation
CN102567475A (zh) 用于交互式查询重构的用户接口
CN108614832B (zh) 一种用户个性化商品搜索实现方法及装置
CN104572717B (zh) 信息搜索方法和装置
CN104142999A (zh) 搜索结果展示方法及装置
CN111475725B (zh) 用于搜索内容的方法、装置、设备和计算机可读存储介质
EP2460095A1 (en) Keyword assignment to a web page
CN109241403A (zh) 项目推荐方法、装置、机器设备和计算机可读存储介质
US10936819B2 (en) Query-directed discovery and alignment of collections of document passages for improving named entity disambiguation precision
CN105677787B (zh) 信息搜索装置及信息搜索方法
WO2008022150A2 (en) Method and apparatus for identifying and classifying query intent
CN104142990A (zh) 搜索方法及装置
CN103678460A (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和***
CN105243064A (zh) 一种子图匹配的方法及装置
CN112818111A (zh) 文档推荐方法、装置、电子设备和介质
CN105786803A (zh) 翻译方法及翻译装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160727

RJ01 Rejection of invention patent application after publication