CN101639831B - 一种搜索方法、装置及*** - Google Patents
一种搜索方法、装置及*** Download PDFInfo
- Publication number
- CN101639831B CN101639831B CN200810117355.3A CN200810117355A CN101639831B CN 101639831 B CN101639831 B CN 101639831B CN 200810117355 A CN200810117355 A CN 200810117355A CN 101639831 B CN101639831 B CN 101639831B
- Authority
- CN
- China
- Prior art keywords
- search
- path
- searching request
- request information
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 230000000295 complement effect Effects 0.000 claims description 32
- 238000004321 preservation Methods 0.000 claims description 11
- 238000012163 sequencing technique Methods 0.000 claims description 8
- 244000188472 Ilex paraguariensis Species 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 description 11
- 238000010168 coupling process Methods 0.000 description 11
- 238000005859 coupling reaction Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 6
- 230000007423 decrease Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 241000220324 Pyrus Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种搜索方法、装置及***。根据获取的用户搜索请求信息,以及与所述用户用分类目录树路径所表示的搜索历史路径所对应的词库,确定与所述搜索请求信息相匹配的当前搜索路径,并将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索,从而结合搜索历史信息,合理调度各成员搜索引擎,加快搜索速度,实现了个性化调度和精确搜索的目的。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种搜索方法、装置及***。
背景技术
目前,作为搜索引擎和移动通信这两个当前信息产业的两大热门领域的结合-移动搜索,已经成为移动增值业务新的亮点与增长点。
基于元搜索的移动搜索平台会连接成百上千的成员垂直搜索引擎,如何完成成员搜索引擎的调度以将搜索请求发往最相关的成员引擎去搜索,从而提高搜索的效率,得到精确搜索的目的是我们需要解决的问题。
现有元搜索的调度方法一般是利用成员搜索引擎的能力进行调度,如利用成员搜索引擎的相关文档数、相关文档的命中率等一些信息来完成对成员搜索引擎的调度。现有的搜索解决方案,在成员搜索引擎调度能力,以及搜索结果的精确程度都有待进一步的提高和优化。
发明内容
本发明实施例要解决的主要技术问题是提供一种搜索方法、装置及***,结合用户搜索历史信息,合理调度各成员搜索引擎,提高搜索结果的精确度。
本发明实施例提供了一种搜索方法,包括:
根据获取的用户搜索请求信息,以及所述用户的搜索历史路径对应的词库,确定与所述搜索请求信息相匹配的当前搜索路径;
将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索。
本发明实施例还提供了一种搜索***,包括可与搜索客户端及成员搜索引擎通讯的搜索服务器,其中:
搜索客户端,用于获取用户的搜索请求信息,向搜索服务器发送所述搜索请求信息;
搜索服务器,用于记录并保存所述用户的搜索历史路径,并根据所述搜索客户端发送的搜索请求信息和所述用户的搜索历史路径对应的词库,确定与所述搜索请求信息相匹配的当前搜索路径,将所述搜索请求信息发送至所述当前搜索路径所对应的成员搜索引擎;
成员搜索引擎,用于根据所述搜索服务器发送的搜索请求信息进行搜索。
本发明实施例还提供了一种搜索服务器,包括:
搜索历史路径保存模块,用于记录并保存用户搜索历史路径,以及成员搜索引擎对应的分类目录树;
搜索请求接收模块,用于接收搜索请求信息;
当前搜索路径匹配确定模块,用于将所述搜索请求接收模块接收的所述搜索请求信息,与搜索历史路径保存模块保存的所述用户搜索历史路径对应的词库相匹配,确定当前搜索路径;
搜索请求分发模块,用于将所述搜索请求接收模块接收的搜索请求信息以及所述当前搜索路径匹配确定模块确定的当前搜索路径信息,发送至所述当前搜索路径所对应的搜索引擎进行搜索;
本发明实施例还提供了一种搜索方法,包括:
根据获取的用户搜索请求信息,查询若干与成员搜索引擎对应的分类目录树,确定与所述搜索请求相匹配的当前搜索路径;
将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索。
由上述本发明实施例提供的技术方案可以看出,本发明实施例通过根据获取的用户搜索请求信息,以及与所述用户的搜索历史路径,确定与所述搜索请求信息相匹配的当前搜索路径,并将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索,从而结合搜索历史信息,合理调度各成员搜索引擎,加快了搜索速度,实现了个性化调度和精确搜索的目的。
附图说明
图1为本发明实施例提供的搜索***结构示意图;
图2为本发明实施例提供的搜索客户端结构示意图;
图3为本发明实施例提供的搜索服务器结构示意图;
图4为本发明实施例提供的搜索服务器内分类目录树示意图;
图5为本发明实施例提供的成员搜索引擎结构示意图;
图6为本发明实施例提供的成员搜索引擎内分类目录树示意图;
图7为本发明实施例提供的搜索方法流程图1;
图8为本发明实施例提供的搜索方法流程图2;
图9为本发明实施例提供的搜索方法流程图3;
图10为本发明实施例提供的搜索方法一个具体实施例所涉及的分类目录树示意图。
具体实施方式
本发明实施例针对现有搜索技术解决方案中,没有利用用户的搜索点击历史信息来合理调度成员搜索引擎,可能无法达到个性化调度和精确搜索的问题,提供了一种全新的搜索方案,利用基于分类目录树路径的搜索历史路径信息,对各成员搜索引擎进行个性化调度。该搜索方案具体包括:将用户的搜索点击历史信息记录成分类目录树路径的集合,从而形成用户搜索历史路径;,搜索调度时,首先将搜索关键词与该搜索历史路径对应的词库进行匹配,从而选出最相关的成员搜索引擎,并将携带路径信息的搜索请求发往最相关的成员搜索引擎进行搜索。从而得到成员搜索引擎的个性化调度和精确搜索的目的。该方案包括搜索***、搜索装置及搜索方法。
本发明实施例提供的搜索方案,可应用于任意搜索平台,优选的,本发明实施例公开的搜索方案可应用于移动搜索平台。
本发明实施例提供的搜索***,如附图1所示,具体可由搜索客户端11、搜索服务器12和成员搜索引擎13组成。在实际网络中,搜索服务器12可以与若干成员搜索引擎13相连,附图1中仅以与一个成员搜索引擎13相连为图示进行说明。
该***在具体应用过程中,可由搜索服务器12记录并保存用户的搜索点击历史,该用户的搜索点击历史被记录成分类目录树路径的集合。该搜索历史路径集合具体可为成员搜索引擎13生成、由搜索服务器12保存的若干分类目录树根节点至叶子节点的路经的集合。
当搜索客户端11获取到用户的搜索请求信息时,搜索客户端11将获取的搜索请求信息发送至搜索服务器12,由搜索服务器12根据搜索请求信息,与搜索服务器12自身保存的、该用户搜索历史路径集合所对应的词库进行匹配,根据匹配结果确定当前搜索时所要使用的当前搜索路径。
上述匹配的过程具体是指搜索服务器12根据搜索请求信息中包含一个或多个关键词的搜索请求表达式,与该用户的搜索历史路径所对应的词库进行匹配,如果表达式的匹配结果为“真”,则选中该路径,从而生成与搜索请求信息中一个或多个关键词表达式匹配的历史路径集合;或者,搜索服务器12根据搜索请求信息中包含一个或多个关键词的搜索请求表达式,与搜索服务器自身保存的所有成员搜索引擎13对应的分类目录树中的所有搜索路径所对应的词库相匹配,确定与搜索请求信息相匹配的全部搜索路径,再将该全部搜索路径与该用户的搜索历史路径相交集,从而生成与搜索请求信息中一个或多个关键词表达式匹配的历史路径集合。如果与搜索请求信息中一个或多个关键词表达式匹配的历史路径集合非空,则选中该匹配的用户历史搜索路径作为当前搜索路径。如果与搜索请求信息中一个或多个关键词表达式匹配的历史路径集合为空,则用其他非个性化的调度方法进行调度(如搜索服务器12根据搜索请求信息中包含一个或多个关键词的搜索请求表达式,与搜索服务器自身保存的所有成员搜索引擎13对应的分类目录树中的所有搜索路径所对应的词库相匹配,确定与搜索请求信息相匹配的全部搜索路径,将匹配的全部搜索路径作为当前搜索路径)。
在经过匹配确定当前搜索路径集合后,将搜索请求信息,以及当前搜索路径信息发送至当前搜索路径根节点所标识的、即与当前搜索路径相对应的成员搜索引擎13,由该成员搜索引擎13根据搜索请求信息,按指定的当前搜索路径进行搜索,并将搜索结果经搜索服务器12,返回至搜索客户端11。
本发明实施例提供的搜索***中所涉及的搜索客户端11,用于获取搜索请求信息,向搜索服务器12发送搜索请求信息,并从搜索服务器12获取搜索结果。
如附图2所示,搜索客户端11具体可由搜索请求信息发送模块111和搜索结果接收模块112组成,其中:
搜索请求发送模块111,用于获取用户的搜索请求信息,并向搜索服务器12发送搜索请求信息。
搜索结果接收模块112,用于接收搜索服务器12返回的搜索结果。
本发明实施例提供的搜索***中所涉及的搜索服务器12,即元搜索服务器,用于根据搜索客户端11发送的搜索请求信息,以及自身保存的、用分类目录树路径所表示的该用户搜索历史路径集合中每条路径对应的词库,确定与搜索请求信息相匹配的当前搜索路径,并将搜索请求信息及该当前搜索路径发送至当前搜索路径根节点所对应的成员搜索引擎13。
搜索服务器12,如附图3所示,具体可以包括:
搜索历史路径保存模块121,用于记录并保存用户搜索历史路径。
具体的,搜索历史路径保存模块121将用户对搜索结果链接文档进行点击的动作记录为用文档对应的成员搜索引擎13所属分类目录树上从根节点到叶子节点的一条路径,这样用户的搜索历史路径就用各个成员搜索引擎13所属分类目录树的路径的集合来表示,搜索历史路径保存模块121记录并保存该用户的搜索历史路径集合。
搜索历史路径保存模块121具体还可以保存***内各成员搜索引擎13的分类目录树。
搜索历史路径保存模块121保存的成员搜索引擎13的分类目录树具体可如附图4所示。其中,根节点S、S’等表示不同成员搜索引擎13的标识,树枝节点C11、C11’,以及叶子节点C1m、C1m’等表示分类目录树中的分类目录信息,词库1、1’等用于存储叶子节点分类目录信息相关主题所包括的关键词信息。
搜索历史路径保存模块121还可以用于当用户点击搜索结果文档时,将搜索该文档时所使用的分类目录树路径的时间戳刷新为当前用户点击使用时间,或者,将所使用的分类目录树路径的权重加上一个常数,而且,还可以每过一段时间(如一个月),路径的权重递减一定的百分比,以表示该路径近期内没有使用,其使用频率降低。
搜索请求接收模块122,用于接收搜索请求信息。
具体的,搜索请求接收模块122可以用于接收搜索客户端11发送的搜索请求信息。
当前搜索路径匹配确定模块123,用于根据搜索请求接收模块122接收的搜索请求信息,与搜索历史路径保存模块121保存的用户搜索历史路径和该用户搜索历史路径在若干成员搜索引擎13的分类目录树中对应的词库进行匹配,确定当前搜索路径。
具体的,当前搜索路径匹配确定模块123可以根据搜索请求信息中包含一个或多个关键词的搜索请求表达式,与用户搜索历史路径在若干分类目录树路径中所对应的词库进行匹配,确定与搜索请求信息匹配的当前搜索路径;
或者,
当前搜索路径匹配确定模块123可以根据搜索请求信息中包含一个或多个关键字的搜索请求表达式,与搜索服务器12保存的***内各成员搜索引擎13的分类目录树中,所有路径所对应的词库相匹配,确定与搜索请求信息相匹配的全部搜索路径,再将全部搜索路径与用户搜索历史路径相交集,确定与搜索请求信息匹配的当前搜索路径。
搜索请求分发模块124,用于将搜索请求接收模块122接收的搜索请求信息以及当前搜索路径匹配确定模块123确定的当前搜索路径信息,发送至当前搜索路径相对应的成员搜索引擎13。
搜索结果返回模块125,用于将获取成员搜索引擎13返回的搜索结果,并将搜索结果返回至搜索客户端11。
搜索服务器12进一步还可以包括:
当前搜索路径排序模块126,用于将当前搜索路径匹配确定模块123确定的当前搜索路径按相关性进行排序。
当前搜索路径排序模块126将当前搜索路径匹配确定模块123确定的当前搜索路径进行排序的方法具体可以包括:
按路径点击时间戳的先后顺序排序,这种情况下,需要当用户每点击一次文档链接,文档所对应的分类目录树路径的时间戳被刷新为当前使用时间;
或者,
按路径的权重大小排序,这种情况下,需要当用户每点击一次文档链接,文档所对应的分类目录树路径的权重加上一个常数,而且,还可以每过一段时间(如一个月),路径的权重递减一定的百分比,以表示该路径近期内没有使用,其重要性已经降低。
在具体应用过程中,当前搜索路径排序模块126可以按照时间戳或者路径权重的大小,将当前搜索路径匹配确定模块123已经确定的当前搜索路径进行排序,这样,搜索请求分发模块124可以按照一定的规则,将搜索请求信息以及当前搜索路径信息发送至对应的成员搜索引擎13进行搜索。
比如,如果设定只取排序靠前的若干当前搜索路径,则搜索请求分发模块124可以只将搜索请求信息等发送至排序靠前的当前搜索路径所对应的成员搜索引擎13进行搜索,放弃其他排序靠后的当前搜索路径所对应的成员搜索引擎13;再比如,搜索请求分发模块124可以将搜索请求信息等,分别按照排序后当前搜索路径的顺序逐一发送,直到被调度的所有成员搜索引擎13返回的文档总数已经达到预设的数量为止,等等,这样就可以达到个性化搜索以及精确搜索的目的。
搜索结果排序模块127,用于将搜索结果返回模块125获取的搜索结果,按其对应的搜索路径在经过当前搜索路径排序模块126排序后的先后顺序进行排序。
搜索结果排序模块127具体可以借鉴当前搜索路径排序模块126的排序结果,对搜索结果进行排序。比如,搜索结果排序模块127可以按照当前搜索路径的排序顺序,将采用对应当前搜索路径所获取的搜索结果进行排序,那么相应的,搜索结果返回模块125可以将排序后的搜索结果,按先后顺序返回至搜索客户端11,或者搜索结果返回模块125只将排序靠前的搜索结果返回至搜索客户端11,过滤掉排序靠后的搜索结果。可以理解的是,上述对搜索结果按照排序顺序进行舍取可以根据实际情况进行应用,本发明实施例对此并不限制。
如附图5所示,成员搜索引擎13具体可以包括:
分类目录树生成模块131,用于生成及保存分类目录树。
需要说明的是,每个成员搜索引擎13都保存一分类目录树,且该分类目录树的每个叶子节点都下挂一个与该叶子节点所代表的分类目录主题相关的词库。成员搜索引擎13将所有文档按分类目录树的结构进行分类,分类的方法可以用常用的算法,如KNN(K-Nearest Neighbour K近邻算法)和SVM(Support Vector Machine支持向量机算法)等,成员搜索引擎13将分类后属于分类目录树树枝节点以及叶子节点所代表的主题相关的文档进行切词,保存后形成词库,并将所有文档统一存放于文档库中。同时,建立词库中每个词到文档库对应文档的索引。
成员搜索引擎保存的分类目录树具体可如附图6所示,其中:
根节点S,用于标识成员搜索引擎;
树枝节点C11,Ci1以及叶子节点C1m,C2m…Cnm,用于表示分类目录树中的分类目录信息;
词库,用于存储叶子节点分类目录信息相关主题所包括的关键词信息。
需要说明的是,本发明实施例中的成员搜索引擎13还可以将分类目录树发送至搜索服务器12,并当成员搜索引擎13的分类目录树或某个叶子节点或其对应的词库发生变化时,主动上报给搜索服务器12,以便同步更新搜索服务器保存的该成员搜索引擎13的分类目录树和词库;或者,搜索服务器12定期向各个成员搜索引擎13收集最新的分类目录树和词库信息,并同步更新搜索服务器12保存的中各个成员搜索引擎13对应的分类目录树和词库。
搜索模块132,用于根据接收的携带有当前搜索路径信息的搜索请求信息,按指定当前搜索路径进行搜索。
由于搜索模块132接收的信息中包括了已经确定的当前搜索路径信息,因此,搜索模块可以不用遍寻成员搜索引擎13内分类目录树的全部路径,直接使用已经确定的当前搜索路径进行搜索,从而加快了搜索的速度,并可以更准确的搜索到用户想要获取的搜索结果。
搜索结果返回模块133,用于返回搜索模块132搜索获取的搜索结果。
具体的,搜索结果返回模块133可以将搜索模块132搜索获取的搜索结果返回至搜索服务器12。
上述描述可以看出,本发明实施例提供的搜索***,结合以往的搜索点击历史,用分类目录树的路径表示搜索历史路径,当用户发生搜索操作时,将搜索请求信息与用户的搜索历史路径相匹配,从而生成当前搜索路径,确定与搜索请求信息最相关的成员搜索引擎13,并将携带当前搜索路径信息的搜索请求信息发往最相关的搜索引擎进行搜索。从而达到成员搜索引擎的个性化调度和精确搜索的目的。
进一步说明的是,本发明实施例提供的搜索***所属各功能模块均可以独立存在,并各自实现其功能。任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,单独提供上述某一个功能模块,都应涵盖在本发明的保护范围之内。
本发明实施例还提供了一种搜索方法,通过根据获取的用户搜索请求信息,以及该用户搜索历史路径,确定与搜索请求信息相匹配的当前搜索路径,并将搜索请求信息发送至当前搜索路径相对应的成员搜索引擎进行搜索,从而提出了一种全新的搜索方案,结合搜索历史信息,合理调度各成员搜索引擎,实现了个性化调度和精确搜索的目的。
本发明实施例提供的搜索方法,结合以往的搜索点击历史信息,用分类目录树路径来表示用户的搜索历史路径,该分类目录树具体可以包括根节点、树枝节点、叶子节点以及叶子节点对应的词库,其中:
根节点,用于标识成员搜索引擎;
树枝节点以及叶子节点,用于表示分类目录树中的分类目录信息;
词库,用于存储叶子节点分类目录信息相关主题所包括的关键词信息。
本发明实施例所提出的分类目录树具体可如附图3、6所示。
下面,以本发明实施例提供的搜索方法应用本发明实施例提供的搜索***中为例,对本发明实施例提供的搜索方法的具体实现过程进行详细的表述。如附图7所示,该过程具体可以包括:
步骤701,搜索客户端11将包含具有一个或多个搜索关键字的搜索逻辑表达式的搜索请求发给搜索服务器12。
步骤702,搜索服务器12将搜索请求表达式与该用户搜索历史路径所对应的词库逐一匹配,从而确定当前搜索路径集合。
步骤703,搜索服务器12将匹配确定的当前搜索路径集合按相关性进行排序。
具体的,可以将匹配确定的当前搜索路径按路径点击时间戳的先后顺序排序,这种情况下,需要当用户每点击一次文档链接,文档所对应的分类目录树路径的时间戳被刷新为当前用户点击使用时间;
或者,
可以将匹配确定的当前搜索路径按路径的权重大小排序,这种情况下,需要当用户每点击一次文档链接,文档所对应的分类目录树路径的权重加上一个常数,而且,还可以每过一段时间(如一个月),路径的权重递减一定的百分比,以表示该路径近期内没有使用,其重要性降低。
需要说明的是,步骤703在本发明实施例中为可选步骤,在实际应用过程中,也可以不进行排序操作,直接执行步骤704。
步骤704,搜索服务器12将搜索请求信息发往匹配确定的当前搜索路径所对应的成员搜索引擎13。
此步骤中,搜索服务器12可以将搜索请求信息,以及匹配确定的当前搜索路径信息发送至,与当前搜索路径相对应的成员搜索引擎13进行搜索。
进一步说明的是,搜索服务器12可以按排序后的当前搜索路径的前后顺序,逐一将搜索请求信息以及当前搜索路径信息发送至与当前搜索路径相匹配的成员搜索引擎13,直到成员引擎13返回的搜索结果达到预设的数量为止。另外,搜索服务器12还可以将搜索请求信息以及当前搜索路径信息发送至,排序后顺序靠前的当前搜索路径所对应的成员搜索引擎13,从而达到个性化搜索的目的。
步骤705,成员搜索引擎13按指定路径检索出搜索结果。
成员搜索引擎13根据获取的搜索请求信息,按经过匹配确定的当前搜索路径进行搜索。
由于成员搜索引擎13按照指定的路径进行搜索,无需遍历所有的路径,因此可以加快搜索速度。
步骤706,成员搜索引擎13将搜索结果返回给搜索服务器12。
步骤707,搜索服务器12将搜索结果按其对应的当前搜索路径排序后的先后顺序进行排序。
具体的,搜索服务器12可以将所有搜索结果,按其对应的当前搜索路径,即获取该搜索结果时所使用的当前搜索路径,在执行步骤703后的顺序进行排序。
需要说明的是,步骤707在本发明实施例中为可选步骤,在实际应用过程中,可以不执行步骤707,直接执行步骤708。
步骤708,搜索服务器12将搜索结果返回给搜索客户端11。
具体的,搜索服务器12可以将全部搜索结果返回至搜索客户端11,或者,搜索服务器12可以按照步骤707排序后的前后顺序,将搜索结果返回至搜索客户端11,或者,搜索服务器12只将排序靠前的当前搜索路径所对应的搜索结果返回至搜索客户端11。
另外,本发明实施例提供的搜索方法还可以另一个实施例实现,如附图8所示,包括:
步骤801,搜索客户端11将包含具有一个或多个搜索关键字的搜索逻辑表达式的搜索请求发给搜索服务器12。
步骤802,搜索服务器12将搜索请求表达式与搜索服务器12自身保存的若干成员搜索引擎13对应的若干分类目录树全部路径所对应的词库相匹配,确定与搜索请求信息相匹配的全部搜索路径,再将全部搜索路径与搜索请求信息相对应的该用户的搜索历史路径相交集,确定与搜索请求信息匹配的当前搜索路径。
步骤803,搜索服务器12将匹配确定的当前搜索路径集合按相关性进行排序。
步骤804,搜索服务器12将搜索请求信息发往匹配确定的当前搜索路径所对应的成员搜索引擎13。
步骤805,成员搜索引擎13按指定路径检索出搜索结果。
步骤806,成员搜索引擎13将搜索结果返回给搜索服务器12。
步骤807,搜索服务器12将搜索结果按其对应的当前搜索路径排序后的先后顺序进行排序。
步骤808,搜索服务器12将搜索结果返回给搜索客户端11。
需要说明的是,本发明实施例提供的搜索方法,进一步还可以包括在用户点击搜索结果文档时,将该文档对应的分类目录树的路径时间戳刷新为当前使用时间;或者,将该文档对应的分类目录树的路径的权重增加常数。
进一步说明的是,本发明实施例提供的搜索方法在具体实现过程中,也可以不考虑用户的搜索历史信息,直接根据用户的搜索请求,在搜索服务器12保存的所有成员搜索引擎13所对应的分类目录树中的词库进行匹配,确定与搜索请求相匹配的当前搜索路径集合,并将包含当前搜索路径信息的搜索请求,发送至当前搜索路径所对应的成员搜索引擎13,成员搜索引擎13根据指定的搜索路径进行搜索,从而同样可以实现精确搜索及个性化搜索的目的。
上述实施例的具体实现过程可如附图9所示,包括:
步骤901,搜索客户端11将包含具有一个或多个搜索关键字的搜索逻辑表达式的搜索请求发给搜索服务器12。
步骤902,搜索服务器12将搜索请求表达式与搜索服务器12自身保存的若干成员搜索引擎13对应的若干分类目录树全部路径所对应的词库相匹配,确定与搜索请求信息匹配的当前搜索路径。
步骤903,搜索服务器12将匹配确定的当前搜索路径集合按相关性进行排序。
步骤904,搜索服务器12将搜索请求信息发往匹配确定的当前搜索路径所对应的成员搜索引擎13。
步骤905,成员搜索引擎13按指定路径检索出搜索结果。
步骤906,成员搜索引擎13将搜索结果返回给搜索服务器12。
步骤907,搜索服务器12将搜索结果按其对应的当前搜索路径排序后的先后顺序进行排序。
可以理解的是,步骤903以及步骤907同样为可选步骤。
步骤908,搜索服务器12将搜索结果返回给搜索客户端11。
为了便于对本发明实施例提供的搜索方法的理解,下面对本发明实施提供的搜索方法的一个具体应用实例进行详细的表述。
假设搜索服务器12与两个成员搜索引擎13(S1、S2)相连,且搜索服务器12内部保存有成员搜索引擎S1及S2的分类目录树。成员搜索引擎S1及S2所对应的分类目录树可如附图10所示。
假设用户曾经搜索过“梨”,则搜索服务器12返回的搜索结果文档属于“S1,农产品,水果”这条分类目录树的路径,当用户点击该搜索结果文档时,则搜索服务器12记录并保存分类目录树的路径“S1,农产品,水果”,用于表示用户的搜索历史路径。
当用户再次发出对“苹果”的搜索请求时,由于“苹果”可以被理解为属于“水果”分类目录,也可以被理解为属于“电脑”分类目录,那么,如果不考虑搜索点击历史信息,则属于“S1,农产品,水果”和/或“S2,电气,电脑”这两条分类目录树路径下面的关于“苹果”的文档都有可能会被返回给用户,其中属于“电脑”的苹果可能是用户不想要的,这样就达不到精确搜索的目的。而本发明实施例提供的搜索方法,将用户的搜索点击历史信息考虑进去,由于搜索历史路径中包含“S1,农产品,水果”这条路径,这条路径的词库与当前搜索请求信息中的关键词“苹果”相匹配,于是搜索服务器12就将搜索请求信息携带当前搜索路径信息直接发给成员搜索引擎S1,S1返回关于水果“苹果”的文档给用户,从而达到精确搜索的目的。
上述描述可以看出,本发明实施例提供的搜索方法,结合以往的搜索点击历史,用于分类目录树的路径表示搜索历史路径,当用户发生搜索操作时,将搜索请求信息与该用户相对应的用分类目录树路径表示的搜索历史路径所对应的词库进行匹配,从而选出与搜索请求信息最相关的成员搜索引擎13,并将携带当前搜索路径信息的搜索请求信息发往最相关的成员搜索引擎13进行搜索。从而达到成员搜索引擎13的个性化调度和精确搜索的目的。
可以理解的是,通过以上对本发明实施里提供的搜索方法、装置及***实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的硬件平台的方式来实现,当然也可以全部通过硬件来实施,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (24)
1.一种搜索方法,其特征在于,包括:
根据获取的用户搜索请求信息,以及所述用户的搜索历史路径对应的词库,确定与所述搜索请求信息相匹配的当前搜索路径;
将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索;
所述确定与所述搜索请求信息相匹配的当前搜索路径包括:
根据所述搜索请求信息中包含一个或多个关键词的搜索请求表达式,与所述用户的搜索历史路径所对应的词库进行匹配,确定与所述搜索请求信息匹配的当前搜索路径。
2.根据权利要求1所述的方法,其特征在于,所述方法在获取搜索请求信息之前还包括:根据用户的搜索点击历史信息,记录并保存用户的搜索历史路径。
3.根据权利要求2所述的方法,其特征在于,所述搜索历史路径用分类目录树路径表示;
且所述分类目录树包括根节点、树枝节点、叶子节点以及叶子节点对应的词库;
所述根节点用于标识成员搜索引擎;
所述树枝节点以及叶子节点用于表示分类目录树中的分类目录信息;
所述词库用于存储所述叶子节点分类目录相关主题所包括的关键词信息。
4.根据权利要求3所述的方法,其特征在于,若所述分类目录树或所述词库发生变化,则采用主动上报或定期查询的方式,同步更新保存于不同功能实体内的同一棵分类目录树。
5.根据权利要求1所述的方法,其特征在于,所述确定与所述搜索请求信息相匹配的当前搜索路径还包括:
将确定的与所述搜索请求信息相匹配的当前搜索路径按照相关性进行排序;
且所述按相关性进行排序包括:
按所述当前搜索路径的时间戳进行排序;或
按所述当前搜索路径的权重大小进行排序。
6.根据权利要求1所述的方法,其特征在于,所述将所述搜索请求信息发送至所述当前搜索路径所对应的成员搜索引擎进行搜索包括:
将所述搜索请求信息,以及所述当前搜索路径信息发送至所述当前搜索路径根节点所标识的成员搜索引擎,根据所述当前搜索路径进行搜索;
获取成员搜索引擎返回的搜索结果,并将所述搜索结果返回至客户端。
7.根据权利要求6所述的方法,其特征在于,所述将所述搜索结果返回至客户端包括:
将所述搜索结果按所述搜索结果所对应的当前搜索路径排序后的先后顺序进行排序,并将排序后的搜索结果返回至客户端。
8.根据权利要求6或7所述的方法,其特征在于,所述方法在将所述搜索结果返回至客户端之后还包括:当用户点击所述搜索结果文档时,将所述文档对应的分类目录树路径的时间戳刷新为当前使用时间;或将所述文档对应的分类目录树路径的权重增加常数。
9.一种搜索***,其特征在于,包括可与搜索客户端及成员搜索引擎通讯的搜索服务器,其中:
搜索客户端,用于获取用户的搜索请求信息,向搜索服务器发送所述搜索请求信息;
搜索服务器,用于记录并保存所述用户的搜索历史路径,并根据所述搜索客户端发送的搜索请求信息和所述用户的搜索历史路径对应的词库,确定与所述搜索请求信息相匹配的当前搜索路径,将所述搜索请求信息发送至所述当前搜索路径所对应的成员搜索引擎;
成员搜索引擎,用于根据所述搜索服务器发送的搜索请求信息进行搜索。
10.根据权利要求9所述的***,其特征在于,所述搜索客户端包括:
搜索请求发送模块,用于获取用户的搜索请求信息,并向所述搜索服务器发送所述搜索请求信息;
搜索结果接收模块,用于接收所述搜索服务器返回的搜索结果。
11.根据权利要求9所述的***,其特征在于,所述搜索服务器包括:
搜索历史路径保存模块,用于记录并保存用户的搜索历史路径,以及成员搜索引擎对应的分类目录树;
搜索请求接收模块,用于接收所述搜索客户端发送的搜索请求信息;
当前搜索路径匹配确定模块,用于将所述搜索请求接收模块接收的所述搜索请求信息,与搜索历史路径保存模块保存的所述用户搜索历史路径对应的词库进行匹配,确定当前搜索路径;
搜索请求分发模块,用于将所述搜索请求接收模块接收的搜索请求信息以及所述当前搜索路径匹配确定模块确定的当前搜索路径信息,发送至所述当前搜索路径所对应的成员搜索引擎进行搜索;
搜索结果返回模块,用于获取搜索结果,并将搜索结果返回至所述搜索客户端。
12.根据权利要求11所述的***,其特征在于,所述分类目录树包括:由根节点、树枝节点、叶子节点以及叶子节点组成的搜索路径及每一搜索路径对应的词库;
所述根节点用于标识成员搜索引擎;
所述树枝节点以及叶子节点用于表示分类目录树中的分类目录信息;
所述词库用于存储所述叶子节点分类目录相关主题所包括的关键词信息。
13.根据权利要求11所述的***,其特征在于,所述搜索服务器包括:
当前搜索路径排序模块,用于将所述当前搜索路径匹配确定模块确定的当前搜索路径按相关性进行排序;
搜索结果排序模块,用于将所述搜索结果返回模块获取的搜索结果,按所述搜索结果对应的当前搜索路径经,在经过所述当前搜索路径排序模块排序后的顺序进行排序。
14.根据权利要求11所述的***,其特征在于,所述成员搜索引擎包括:
分类目录树生成模块,用于生成及保存分类目录树并更新所述搜索服务器中搜索历史路径保存模块中的分类目录树;
搜索模块,用于根据接收的携带有当前搜索路径信息的搜索请求信息,按指定搜索路径进行搜索;
搜索结果返回模块,用于将所述搜索模块搜索获取的搜索结果,返回至搜索服务器。
15.一种搜索服务器,其特征在于,包括:
搜索历史路径保存模块,用于记录并保存用户搜索历史路径,以及成员搜索引擎对应的分类目录树;
搜索请求接收模块,用于接收搜索请求信息;
当前搜索路径匹配确定模块,用于将所述搜索请求接收模块接收的所述搜索请求信息,与搜索历史路径保存模块保存的所述用户搜索历史路径对应的词库相匹配,确定当前搜索路径;
搜索请求分发模块,用于将所述搜索请求接收模块接收的搜索请求信息以及所述当前搜索路径匹配确定模块确定的当前搜索路径信息,发送至所述当前搜索路径所对应的搜索引擎进行搜索。
16.根据权利要求15所述的搜索服务器,其特征在于,所述搜索服务器包括:
搜索结果返回模块,用于获取搜索结果,并将搜索结果返回;
当前搜索路径排序模块,用于将当前搜索路径匹配确定模块确定的当前搜索路径按相关性进行排序;
搜索结果排序模块,用于所述搜索结果返回模块获取的搜索结果,按所述搜索结果对应的当前搜索路径经,在经过所述当前搜索路径排序模块排序后的顺序进行排序。
17.一种搜索方法,其特征在于,包括:
根据获取的用户搜索请求信息,查询若干与成员搜索引擎对应的分类目录树,确定与所述搜索请求相匹配的当前搜索路径;
将所述搜索请求信息发送至所述当前搜索路径对应的成员搜索引擎进行搜索;
所述确定与所述搜索请求相匹配的当前搜索路径包括:
根据所述搜索请求信息中包含一个或多个关键词的搜索请求表达式,与所有成员搜索引擎对应的分类目录树中的所有搜索路径所对应的词库相匹配,确定与所述搜索请求信息相匹配的全部搜索路径,再将所述全部搜索路径与所述用户的搜索历史路径相交集,确定与所述搜索请求信息匹配的当前搜索路径。
18.根据权利要求17所述的方法,其特征在于,所述方法在获取搜索请求信息之前还包括:根据用户的搜索点击历史信息,记录并保存用户的搜索历史路径。
19.根据权利要求18所述的方法,其特征在于,所述搜索历史路径用分类目录树路径表示;
且所述分类目录树包括根节点、树枝节点、叶子节点以及叶子节点对应的词库;
所述根节点用于标识成员搜索引擎;
所述树枝节点以及叶子节点用于表示分类目录树中的分类目录信息;
所述词库用于存储所述叶子节点分类目录相关主题所包括的关键词信息。
20.根据权利要求19所述的方法,其特征在于,若所述分类目录树或所述词库发生变化,则采用主动上报或定期查询的方式,同步更新保存于不同功能实体内的同一棵分类目录树。
21.根据权利要求17所述的方法,其特征在于,所述确定与所述搜索请求信息相匹配的当前搜索路径还包括:
将确定的与所述搜索请求信息相匹配的当前搜索路径按照相关性进行排序;
且所述按相关性进行排序包括:
按所述当前搜索路径的时间戳进行排序;或
按所述当前搜索路径的权重大小进行排序。
22.根据权利要求17所述的方法,其特征在于,所述将所述搜索请求信息发送至所述当前搜索路径所对应的成员搜索引擎进行搜索包括:
将所述搜索请求信息,以及所述当前搜索路径信息发送至所述当前搜索路径根节点所标识的成员搜索引擎,根据所述当前搜索路径进行搜索;
获取成员搜索引擎返回的搜索结果,并将所述搜索结果返回至客户端。
23.根据权利要求22所述的方法,其特征在于,所述将所述搜索结果返回至客户端包括:
将所述搜索结果按所述搜索结果所对应的当前搜索路径排序后的先后顺序进行排序,并将排序后的搜索结果返回至客户端。
24.根据权利要求22或23所述的方法,其特征在于,所述方法在将所述搜索结果返回至客户端之后还包括:当用户点击所述搜索结果文档时,将所述文档对应的分类目录树路径的时间戳刷新为当前使用时间;或将所述文档对应的分类目录树路径的权重增加常数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810117355.3A CN101639831B (zh) | 2008-07-29 | 2008-07-29 | 一种搜索方法、装置及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810117355.3A CN101639831B (zh) | 2008-07-29 | 2008-07-29 | 一种搜索方法、装置及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101639831A CN101639831A (zh) | 2010-02-03 |
CN101639831B true CN101639831B (zh) | 2012-09-05 |
Family
ID=41614816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810117355.3A Expired - Fee Related CN101639831B (zh) | 2008-07-29 | 2008-07-29 | 一种搜索方法、装置及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101639831B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102654895B (zh) * | 2011-03-03 | 2015-06-17 | 腾讯科技(深圳)有限公司 | 一种生成扫描目录树的方法及装置 |
CN103902597B (zh) * | 2012-12-27 | 2019-03-08 | 百度在线网络技术(北京)有限公司 | 确定目标关键词所对应的搜索相关性类别的方法和设备 |
WO2014146265A1 (en) * | 2013-03-20 | 2014-09-25 | Nokia Corporation | Method and apparatus for personalized resource recommendations |
CN104424296B (zh) * | 2013-09-02 | 2018-07-31 | 阿里巴巴集团控股有限公司 | 查询词分类方法和装置 |
CN103514299B (zh) * | 2013-10-18 | 2018-04-17 | 北京奇虎科技有限公司 | 信息搜索方法和装置 |
CN103646089B (zh) * | 2013-12-13 | 2017-07-25 | 百度在线网络技术(北京)有限公司 | 自动搜索方法及装置 |
CN104408639A (zh) * | 2014-10-22 | 2015-03-11 | 百度在线网络技术(北京)有限公司 | 多轮会话交互方法和*** |
CN104572977B (zh) * | 2014-12-31 | 2017-09-29 | 北京农业信息技术研究中心 | 一种农产品质量安全事件在线检测方法 |
CN104679899A (zh) * | 2015-03-17 | 2015-06-03 | 努比亚技术有限公司 | 搜索方法、搜索装置及终端 |
CN105468729A (zh) * | 2015-11-23 | 2016-04-06 | 深圳大粤网络视界有限公司 | 一种互联网移动垂直搜索引擎 |
CN106708282B (zh) * | 2015-12-02 | 2019-03-19 | 北京搜狗科技发展有限公司 | 一种推荐方法和装置、一种用于推荐的装置 |
CN106919625B (zh) * | 2015-12-28 | 2021-04-09 | ***通信集团公司 | 一种互联网用户属性识别方法和装置 |
CN107766869A (zh) * | 2016-08-22 | 2018-03-06 | 富士通株式会社 | 对象分类方法和对象分类设备 |
CN106844511A (zh) * | 2016-12-28 | 2017-06-13 | 广州联客信息科技有限公司 | 聚合搜索方法及*** |
CN110020096B (zh) * | 2017-07-24 | 2021-09-07 | 北京国双科技有限公司 | 基于查询的分类器训练方法和装置 |
CN107436948B (zh) * | 2017-08-04 | 2020-01-14 | Oppo广东移动通信有限公司 | 文件搜索方法、装置及终端 |
CN109948044A (zh) * | 2017-12-14 | 2019-06-28 | 微软技术许可有限责任公司 | 基于向量最近邻搜索的文档查询 |
CN109034938B (zh) * | 2018-06-11 | 2022-07-05 | 广东因特利信息科技股份有限公司 | 信息快速筛选匹配方法、装置、电子设备及存储介质 |
US10951638B2 (en) * | 2018-06-27 | 2021-03-16 | International Business Machines Corporation | Security of server hosting remote application |
CN109033326B (zh) * | 2018-07-17 | 2020-05-05 | 深圳市嘀哒知经科技有限责任公司 | 一种知识技能的拆分重组方法及装置 |
CN111984689B (zh) * | 2020-08-21 | 2023-07-25 | 北京百度网讯科技有限公司 | 信息检索的方法、装置、设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070050335A1 (en) * | 2005-08-26 | 2007-03-01 | Fujitsu Limited | Information searching apparatus and method with mechanism of refining search results |
US20070192293A1 (en) * | 2006-02-13 | 2007-08-16 | Bing Swen | Method for presenting search results |
CN101101605A (zh) * | 2007-07-24 | 2008-01-09 | 华为技术有限公司 | 搜索网页的方法、装置及***和建立索引数据库的装置 |
CN101179472A (zh) * | 2007-05-31 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络资源搜索方法及搜索*** |
-
2008
- 2008-07-29 CN CN200810117355.3A patent/CN101639831B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070050335A1 (en) * | 2005-08-26 | 2007-03-01 | Fujitsu Limited | Information searching apparatus and method with mechanism of refining search results |
US20070192293A1 (en) * | 2006-02-13 | 2007-08-16 | Bing Swen | Method for presenting search results |
CN101179472A (zh) * | 2007-05-31 | 2008-05-14 | 腾讯科技(深圳)有限公司 | 一种网络资源搜索方法及搜索*** |
CN101101605A (zh) * | 2007-07-24 | 2008-01-09 | 华为技术有限公司 | 搜索网页的方法、装置及***和建立索引数据库的装置 |
Also Published As
Publication number | Publication date |
---|---|
CN101639831A (zh) | 2010-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101639831B (zh) | 一种搜索方法、装置及*** | |
CN105701216B (zh) | 一种信息推送方法及装置 | |
CN100514337C (zh) | 关键词的联想信息生成***和生成方法 | |
CN102890714B (zh) | 数据索引方法及装置 | |
CN111552885B (zh) | 实现自动化实时消息推送运营的***及其方法 | |
CN110135890A (zh) | 基于知识关系挖掘的产品数据推送方法及相关设备 | |
CN102054000B (zh) | 数据查询方法、装置及*** | |
CN102902800B (zh) | 基于Agent的智能元搜索引擎*** | |
CN108509437A (zh) | 一种ElasticSearch查询加速方法 | |
CN104584524A (zh) | 聚合中介***中的数据 | |
CN101202966A (zh) | 一种用户信息的收集方法、***及设备 | |
CN107103011A (zh) | 终端数据搜索的实现方法和装置 | |
CN109871380B (zh) | 一种基于Redis的人群包应用方法及*** | |
CN108984626B (zh) | 一种数据处理方法、装置及服务器 | |
CN104750860B (zh) | 一种不确定数据的数据存储方法 | |
CN110471925A (zh) | 实现搜索***中索引数据同步的方法及*** | |
CN102724290B (zh) | 一种获取目标客户群的方法、设备及*** | |
Liu et al. | Distributed incomplete pattern matching via a novel weighted bloom filter | |
CN112559899A (zh) | 一种用户画像生成方法 | |
US20050091128A1 (en) | System and method for querying inventory | |
CN103020300A (zh) | 一种信息检索方法和设备 | |
Nie et al. | Effectively mining and using coverage and overlap statistics for data integration | |
CN101996246B (zh) | 即时索引方法及*** | |
CN113034231B (zh) | 一种基于SaaS云服务的多供应链商品智能推荐***及方法 | |
CN108256086A (zh) | 数据特征统计分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120905 |