CN102193999A - 一种对搜索结果进行排序的方法及设备 - Google Patents

一种对搜索结果进行排序的方法及设备 Download PDF

Info

Publication number
CN102193999A
CN102193999A CN2011101180826A CN201110118082A CN102193999A CN 102193999 A CN102193999 A CN 102193999A CN 2011101180826 A CN2011101180826 A CN 2011101180826A CN 201110118082 A CN201110118082 A CN 201110118082A CN 102193999 A CN102193999 A CN 102193999A
Authority
CN
China
Prior art keywords
search results
corrected parameter
page
correction conditions
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011101180826A
Other languages
English (en)
Inventor
李彦宏
张子云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN2011101180826A priority Critical patent/CN102193999A/zh
Publication of CN102193999A publication Critical patent/CN102193999A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对搜索结果进行排序的方法及设备,主要内容包括:本发明实施例不仅将搜索结果与检索词的相关度作为排序的依据,还预先为每个搜索结果设定修正条件,结合搜索结果与检索词的相关度以及搜索结果的修正参数对搜索结果进行排序,使得最终的排序能够最大程度地满足用户的搜索需求,提高用户从搜索结果中查询需要的结果的效率,减少搜索过程占用的***资源。

Description

一种对搜索结果进行排序的方法及设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种对搜索结果进行排序的方法及设备。
背景技术
在进行信息搜索时,搜索引擎根据搜索检索词(称之为query)从数据库中查询出页面形式的搜索结果后,并不立即将搜索结果向用户展示,而是以搜索结果与检索词之间的相关性为依据,按照相关性由高至低的顺序对搜索结果进行排序,并将排序后的搜索结果向用户展示,这种将与检索词之间的相关性作为排序依据的操作称之为依据基础权值进行排序的操作。
依据基础权值进行排序后的搜索结果能够向用户展示搜索结果与检索词之间的相关性,在一定程度上有利于用户从搜索结果中快速查找出需要的搜索结果,但是,由于依据基础权值进行排序只基于搜索结果页面的内容与检索词的相关性,并不考虑其他因素,而实际的搜索结果内容繁多,仅依据基础权值进行的排序过于简单,排在前列的搜索结果并不一定是用户需要的搜索结果,排在靠后的搜索结果反而可能是用户需要的搜索结果,导致用户从搜索结果中查询需要的结果的效率较低。
例如:若使用的检索词为“A品牌手机”,查询出了两个搜索结果,第一个搜索结果的页面内容是简单介绍该“A品牌手机”的短文,第二个搜索结果的页面是关于“A品牌手机”和“B品牌手机”的数千字专题报道,如果仅按照基础权值进行排序,第一个搜索结果的与“A品牌手机”的相关性要高于第二个搜索结果,第一个搜索结果的排列顺序先于第二个搜索结果。由于第二个搜索结果的内容更加丰富,更能满足用户的搜索需求,但却排列在较后面的位置,因此,这种单方面依据基础权值进行排序的操作并不能反映用户的搜索需求,仍然存在搜索效率低,导致搜索过程占用的***资源过多的问题。
发明内容
本发明实施例提供一种对搜索结果进行排序的方法及设备,用以解决现有技术中存在搜索结果排序不能很好地满足用户需求,导致搜索效率较低且搜索过程占用的***资源过多的问题。
一种对搜索结果进行排序的方法,所述方法包括:
分别确定搜索结果集合中每个搜索结果与检索词的相关度;
针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数;
按照每个搜索结果与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
一种对搜索结果进行排序的设备,所述设备包括:
相关度确定模块,用于分别确定搜索结果集合中每个搜索结果与检索词的相关度;
修正参数确定模块,用于针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数;
排序模块,用于按照每个搜索结果与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
本发明实施例不仅将搜索结果与检索词的相关度作为排序的依据,还预先为每个搜索结果设定修正条件,结合搜索结果与检索词的相关度以及搜索结果的修正参数对搜索结果进行排序,使得最终的排序能够最大程度地满足用户的搜索需求,提高用户从搜索结果中查询需要的结果的效率,进而降低搜索过程占用的***资源。
附图说明
图1为本发明实施例一对搜索结果进行排序的方法示意图;
图2为本发明实施例二对搜索结果进行排序的设备结构示意图。
具体实施方式
为了实现本发明目的,本发明实施例提出一种新的对搜索结果进行排序的方案,不仅将搜索结果与检索词的相关度作为排序的依据,还预先为每个搜索结果设定修正条件,结合搜索结果与检索词的相关度以及搜索结果的修正参数对搜索结果进行排序,使得最终的排序能够最大程度地满足用户的搜索需求,提高用户从搜索结果中查询需要的结果的效率,进而降低搜索过程占用的***资源。
本发明各实施例中涉及的搜索结果可以是根据特定的检索词从搜索数据库中查询出的搜索结果,搜索结果可以是页面形式,对搜索结果进行排序后,向用户展示搜索结果所表示页面的页面链接地址。
下面结合说明书附图对本发明实施例进行详细描述。
实施例一
本发明实施例一中对搜索结果进行排序的方法中,在为某一检索词的搜索结果进行排序之前,可以通过线下挖掘的方式,预先为每种修正条件配置多个可选的修正参数,然后为搜索数据库中的每个页面的每种修正条件选择一个修正参数,以便于针对某一检索词得到多个搜索结果时,可以直接利用为每个搜索结果已选择的搜索结果对应的修正条件进行排序操作。
本实施例一中的修正条件可以是与搜索结果所表示的页面有关的各种指标,例如搜索结果所引用资源的有效性、搜索结果所在站点的权威性、搜索结果的页面级别、搜索结果的页面类型、搜索结果的页面质量、搜索结果的页面编码类型、搜索结果的页面丰富程度或针对之前使用相同的检索词得到的搜索结果是否被点击过等。
针对上述任一修正条件,可以预先为每种修正条件配置多个可选的修正参数,其配置原则是:针对每一种修正条件可能出现的情况,分别配置可选的修正参数,也就是说,将能够表示修正条件可能出现的情况的各项参数,作为该修正条件的修正参数。
下面分别针对上述任一修正条件进行详细说明:
1、搜索结果所引用资源的有效性是指搜索结果所表示的页面的内容可用程度,为其配置的可选修正参数可以按照所引用资源是否有效、是否无效和是否部分有效为条件进行配置。
搜索结果所引用资源的有效性包括但不限于页面中包含的图片、视频、音频、下载链接的有效性,如是否可以观看、播放或下载,该修正条件的可选修正参数为有效、部分有效和无效,这三个可选修正参数可通过-N、0、+N(N为正整数)来表示,例如:若某一页面包含的图片下载链接全部可用,则为该页面选择的修正参数为+10;若某一页面包含的图片下载链接部分可用,则为该页面选择的修正参数为0;若某一页面包含的图片下载链接全部不可用,则为该页面选择的修正参数为-10。
进一步地,搜索结果所引用资源的有效性还可以包括下载资源的成本,如免费下载、积分下载或收费下载,所述免费下载可以看作是所引用的资源有效,积分下载可以看作是所引用的资源部分有效,收费下载可以看作是所引用的资源无效,这三个可选修正参数可通过+M、0、-M(M为正整数)来表示,针对两个页面,在页面的可用程度相同时,为免费下载的页面选择的修正参数为+M,为积分下载的页面选择的修正参数为0,为收费下载的页面选择的修正参数为-M。
2、搜索结果所在站点的权威性是指搜索结果所表示页面所在站点的权威程度,按照站点可能出现的权威性高低为条件,分别配置可选修正参数。例如,通过正实数来表示站点可能出现的权威性,则可以将1、2、3、4和5作为站点权威性的可选修正参数,权威性越高的搜索结果所在的站点,该搜索结果在本修正条件中选择的修正参数越大。
3、搜索结果的页面级别(PageRank)是一种网页重要性评估方式,PageRank的值决定了在以与检索词相关度为条件的排序中,搜索结果中的排名。搜索结果的页面级别的修正参数按照页面可能出现的级别为条件来配置。例如,通过正实数来表示页面级别,则可以将1、2、3、4和5作为页面级别的可选修正参数,页面级别越高的搜索结果,在本修正条件中选择的修正参数越大。
4、搜索结果的页面类型是指搜索结果所表示页面在页面划分中的类型,如首页、专题页或其他底层页面等,其可选的修正参数可以按照页面可能出现的类型为条件来配置。例如,通过正实数来表示页面类型,越重要的页面类型对应的正实数越大。如首页、专题页等页面类型的搜索结果的修正参数大于其他底层页面类型的搜索结果的修正参数。
5、搜索结果的页面质量是指搜索结果所表示的页面的排版合理程度、广告的数量等,可按照页面可能出现的质量为条件,分别配置可选的修正参数,例如,将排版合理且广告数量少的搜索结果的修正参数设置得大于排版不合理且广告数量多的搜索结果的修正参数。
6、搜索结果的页面编码类型是指搜索结果所表示页面的内容编码方式,可按照页面可能出现的编码类型为条件,分别配置可选的修正参数,例如,设定表示中文简体编码方式的修正参数大于中文繁体编码方式的修正参数。
7、搜索结果的页面丰富程度是指搜索结果所表示页面的内容数量,可以按照页面包含的内容多少为条件,分别配置可选的修正参数。例如,将表示内容数量多的修正参数设置得大于内容数量少的修正参数。
8、针对之前使用相同的检索词得到的搜索结果是否被点击过是指本次搜索操作之前是否用户针对相同的检索词得到该搜索结果后,点击阅读过该搜索请求,可以按照相同的检索词得到的搜索结果被点击过或没有被点击过为条件,分别配置可选的修正参数,若本次搜索操作之前用户针对相同的检索词得到该搜索结果后点击阅读过该搜索请求,则搜索结果的修正参数为1,否则,搜索结果的修正参数为0。
上述修正条件是实现本发明目的的可选修正条件,本发明实施例并不限于其他能够反映搜索结果所表示页面的各项指标的其他修正条件,为每种修正条件配置的多个修正参数,以及根据搜索结果所表示的页面为搜索数据库中的每个搜索结果选择修正条件的修正参数的方式也不限于上述记载的方式。
为搜索数据库中的每个搜索结果的各修正条件选择修正参数后,可以以搜索结果的统一资源定位符(URL)为关键字进行存储,后续可以从数据库中根据搜索结果的URL,查询出该搜索结果对于各修正条件选择的修正参数。
在预先为搜索数据库中的每个搜索结果设置对应的修正条件,以及为每个修正条件选择修正参数后,可以为用户输入的搜索词从搜索数据库中进行查询,得到与该搜索词相关的搜索结果,并执行本发明实施例的以下步骤,如图1所示:
步骤101:分别确定搜索结果集合中每个搜索结果与检索词的相关度。
在本步骤中,搜索引擎根据用户输入的检索词从搜索数据库中查询出搜索结果,构成搜索结果集合。由于搜索结果是根据检索词查询出的,因此,搜索结合集合中的每个搜索结果与检索词都有一定的相关性,因此,在本步骤中计算出每个搜索结果与检索词之间的相关度。
本发明实施例并不限定确定搜索结果与检索词之间相关度的运算方法,一种可选的运算方式为基于TF和IDF的相关性运算方法,TF为检索词在检索结果中出现的次数,IDF为检索词在互联网上所有网页中的出现频率的倒数,则检索词与某一搜索结果之间的相关度为:检索词在该搜索结果中的TF和IDF之积;若检索词中包含多个分词,则检索词与某一搜索结果之间的相关度为:各分词的TF*IDF的平均值。
较优地,在确定每个搜索结果与检索词的相关度后,从中选择出N个相关度最高的搜索结果执行后续步骤,这样做的好处是:一方面,由于选择出的N个搜索结果是与检索词相关度最高的搜索结果,因此,这N个搜索结果满足用户搜索需求的概率也较大,用选择出的N个搜索结果进行后续操作已经能够较好地满足用户的搜索需求;另一方面,去除与检索词相关度较小的搜索结果,可以有效提高运算效率,节约运算资源。
步骤102:针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数。
在本实施例的方案中,为搜索结果的每种修正条件选择的修正参数携带在搜索结果的URL中(如搜索结果的PageRank的修正参数),或携带在搜索结果的检索词-网页(Query-URL)对中(如针对之前使用相同的检索词得到的搜索结果是否被点击过的修正参数),因此,根据预设的修正条件,可以从搜索结果的URL或Query-URL对中查询出已选择的修正参数。
例如:预先设定的修正条件为搜索结果所引用资源的有效性和搜索结果所在站点的权威性,搜索结果1所表示的页面内容全部可用,其修正参数为10,搜索结果1所在站点是可靠的门户网站,选择的修正参数为5;搜索结果2所表示的内容全部不可用,其修正参数为-10,搜索结果2所在站点来源不可靠,选择的修正参数为2。
步骤103:按照每个搜索与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
在步骤102中已经确定出各搜索结果的修正参数,在本步骤中,可以采用加权求和的方式来计算每个搜索结果在排序时使用的统一权值,具体做法为:
首先,针对每个搜索结果,为该搜索结果的相关度和各修正参数分配权重。
在本实施例中,可以根据用户对搜索结果的实际需求来为相关度和各修正参数分配权重。例如,可以为搜索结果的相关度分配固定权重,如为相关度分配权重0.5;若用户对资源有效性的要求较高,则可以为搜索结果所引用资源的有效性的修正参数分配较大的权重,为其他修正参数分配较小的权重,如在步骤102中假定搜索结果对应的修正条件为搜索结果所引用资源的有效性和搜索结果所在站点的权威性,为搜索结果所引用资源的有效性分配的权重为α1=0.4,为搜索结果所在站点的权威性分配的权重为α2=0.1,为相关性分配的权重为α3=0.5。
本实施例也不限于根据经验值,预先为搜索结果的相关度和每个修正参数分配固定的权重值。
然后,对每个搜索结果的相关度和各修正参数加权求和,得到搜索结果的统一权值。
例如,在步骤102中假定搜索结果1与检索词的相关度为q1,修正参数为10、5,搜索结果1与检索词的相关度为相关度为q2,修正参数为-10、2,得到搜索结果1的统一权值为:Q1=10*α1+5*α2+q13,搜索结果2的统一权值为Q2=-10*α1+2*α2+q23,搜索结果2中的搜索结果所引用资源的有效性的修正参数是负数,表示由于搜索结果2的页面内容无效,搜索结果2被降权。
最后,按照搜索结果的统一权值由高到低的顺序对搜索结果进行排序,并将排序结果向用户展示。
通过本发明实施例的方案,将搜索结果与检索词的相关度和搜索结果所表示的页面有关的各种指标结合作为对搜索结果进行排序的依据,使得最终的排序能够最大程度地满足用户的搜索需求,提高用户从搜索结果中查询需要的结果的效率。同时,按照本实施例提供的为修正条件配置修正参数的方式,配置的修正参数可以从多个方面反映修正条件可能出现的情况,使得选择出的作为排序依据的修正条件能够正确地反映实际的搜索过程;并且,在确定用于排序的相关性以及各修正参数后,根据用户的实际搜索需求为各修正参数配置权重,使得修正条件能够很好地表示用户的搜索需求,使得排序在前的搜索结果满足用户搜索需求的可能性大,提高搜索效率,减少搜索过程对***资源的占用。例如,若搜索结果1和搜索结果2与检索词的相关度接近,但搜索结果1表示重要的门户网站中的新闻页面,搜索结果2表示转载新闻的网站中页面,则可以将搜索结果1排在搜索结果2之前,使用户可以首先观察到更加容易满足用户需求的搜索结果1,提高用户从搜索结果中查询需要的结果的效率。
实施例二
本发明实施例二还提供一种与实施例一属于同一发明构思下的对搜索结果进行排序的设备,如图2所示,所述设备包括相关度确定模块11、修正参数确定模块12和排序模块13,其中:相关度确定模块11用于分别确定搜索结果集合中每个搜索结果与检索词的相关度;修正参数确定模块12用于针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数;排序模块13用于按照每个搜索结果与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
所述设备还包括配置模块14和选择模块15,其中:配置模块14用于为每一种修正条件配置多个可选的修正参数;选择模块15用于针对每个搜索结果,为该搜索结果的每种修正条件选择一个修正参数.
所述修正参数确定模块12具体用于根据为搜索结果的每种修正条件选择的修正参数,确定该搜索结果对应的修正参数。
所述配置模块14具体用于针对每一种修正条件可能出现的情况,分别配置可选的修正参数。
针对不同的修正条件,配置模块14分别配置可选的修正参数包括:
所述配置模块14具体用于在修正条件是搜索结果所引用资源的有效性时,按照所引用资源是否有效、是否无效和是否部分有效为条件,分别配置可选修正参数;
在修正条件是搜索结果所在站点的权威性时,按照站点可能出现的权威性高低为条件,分别配置可选修正参数;
在修正条件是搜索结果的页面级别时,按照页面可能出现的级别为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面类型时,按照页面可能出现的类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面质量时,按照页面可能出现的质量为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面编码类型时,按照页面可能出现的编码类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面丰富程度时,按照页面包含的内容多少为条件,分别配置可选的修正参数;
在修正条件是针对之前使用相同的检索词得到的搜索结果是否被点击过时,按照相同的检索词得到的搜索结果被点击过或没有被点击过为条件,分别配置可选的修正参数。
所述排序模块13具体用于针对每个搜索结果,为该搜索结果的相关度和每个修正参数分配权重,对每个搜索结果的相关度和各修正参数加权求和,得到搜索结果的统一权值,以及按照搜索结果的统一权值由高到低的顺序对搜索结果进行排序。
排序模块13为每个搜索结果的相关度和各修正参数分配权重的方式与实施例一的步骤103的分配方式相同。
本实施例二中的对搜索结果进行排序的设备可以是搜索引擎中的逻辑部件,也可以是独立于搜索引擎的设备,本实施例中的对搜索结果进行排序的设备还具有能够实现实施例一各步骤的功能模块,此处不再赘述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种对搜索结果进行排序的方法,其特征在于,所述方法包括:
分别确定搜索结果集合中每个搜索结果与检索词的相关度;
针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数;
按照每个搜索结果与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
2.如权利要求1所述的方法,其特征在于,
所述修正条件为:搜索结果所引用资源的有效性、搜索结果所在站点的权威性、搜索结果的页面级别、搜索结果的页面类型、搜索结果的页面质量、搜索结果的页面编码类型、搜索结果的页面丰富程度或针对之前使用相同的检索词得到的搜索结果是否被点击过。
3.如权利要求1或2所述的方法,其特征在于,确定搜索结果集合中每个搜索结果与检索词的相关度之前,所述方法还包括:
为每一种修正条件配置多个可选的修正参数;
针对每个搜索结果,为该搜索结果的每种修正条件选择一个修正参数。
4.如权利要求3所述的方法,其特征在于,为每一种修正条件配置多个可选的修正参数,具体包括:
针对每一种修正条件可能出现的情况,分别配置可选的修正参数。
5.如权利要求4所述的方法,其特征在于,针对每一种修正条件可能出现的情况,分别配置可选的修正参数,具体包括:
在修正条件是搜索结果所引用资源的有效性时,按照所引用资源是否有效、是否无效和是否部分有效为条件,分别配置可选修正参数;
在修正条件是搜索结果所在站点的权威性时,按照站点可能出现的权威性高低为条件,分别配置可选修正参数;
在修正条件是搜索结果的页面级别时,按照页面可能出现的级别为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面类型时,按照页面可能出现的类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面质量时,按照页面可能出现的质量为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面编码类型时,按照页面可能出现的编码类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面丰富程度时,按照页面包含的内容多少为条件,分别配置可选的修正参数;
在修正条件是针对之前使用相同的检索词得到的搜索结果是否被点击过时,按照相同的检索词得到的搜索结果被点击过或没有被点击过为条件,分别配置可选的修正参数。
6.如权利要求3所述的方法,其特征在于,为搜索结果的每种修正条件选择的修正参数携带在搜索结果的统一资源定位符URL中,或携带在搜索结果的检索词-网页Query-URL对中。
7.如权利要求1所述的方法,其特征在于,按照相关度以及修正参数对搜索结果集合中每个搜索结果进行排序,具体包括:
针对每个搜索结果,为该搜索结果的相关度和每个修正参数分配权重;
对每个搜索结果的相关度和各修正参数加权求和,得到搜索结果的统一权值;
按照搜索结果的统一权值由高到低的顺序对搜索结果进行排序。
8.一种对搜索结果进行排序的设备,其特征在于,所述设备包括:
相关度确定模块,用于分别确定搜索结果集合中每个搜索结果与检索词的相关度;
修正参数确定模块,用于针对每个搜索结果,确定该搜索结果对应至少一个预设的修正条件的修正参数;
排序模块,用于按照每个搜索结果与检索词的相关度以及该搜索结果的修正参数,对搜索结果集合中每个搜索结果进行排序。
9.如权利要求8所述的设备,其特征在于,所述设备还包括:
配置模块,用于为每一种修正条件配置多个可选的修正参数;
选择模块,用于针对每个搜索结果,为该搜索结果的每种修正条件选择一个修正参数。
10.如权利要求9所述的设备,其特征在于,
所述配置模块,具体用于针对每一种修正条件可能出现的情况,分别配置可选的修正参数。
11.如权利要求10所述的设备,其特征在于,
所述配置模块,具体用于在修正条件是搜索结果所引用资源的有效性时,按照所引用资源是否有效、是否无效和是否部分有效为条件,分别配置可选修正参数;
在修正条件是搜索结果所在站点的权威性时,按照站点可能出现的权威性高低为条件,分别配置可选修正参数;
在修正条件是搜索结果的页面级别时,按照页面可能出现的级别为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面类型时,按照页面可能出现的类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面质量时,按照页面可能出现的质量为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面编码类型时,按照页面可能出现的编码类型为条件,分别配置可选的修正参数;
在修正条件是搜索结果的页面丰富程度时,按照页面包含的内容多少为条件,分别配置可选的修正参数;
在修正条件是针对之前使用相同的检索词得到的搜索结果是否被点击过时,按照相同的检索词得到的搜索结果被点击过或没有被点击过为条件,分别配置可选的修正参数。
12.如权利要求8所述的设备,其特征在于
所述排序模块,具体用于针对每个搜索结果,为该搜索结果的相关度和每个修正参数分配权重,对每个搜索结果的相关度和各修正参数加权求和,得到搜索结果的统一权值,以及按照搜索结果的统一权值由高到低的顺序对搜索结果进行排序。
CN2011101180826A 2011-05-09 2011-05-09 一种对搜索结果进行排序的方法及设备 Pending CN102193999A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011101180826A CN102193999A (zh) 2011-05-09 2011-05-09 一种对搜索结果进行排序的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011101180826A CN102193999A (zh) 2011-05-09 2011-05-09 一种对搜索结果进行排序的方法及设备

Publications (1)

Publication Number Publication Date
CN102193999A true CN102193999A (zh) 2011-09-21

Family

ID=44602068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011101180826A Pending CN102193999A (zh) 2011-05-09 2011-05-09 一种对搜索结果进行排序的方法及设备

Country Status (1)

Country Link
CN (1) CN102193999A (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102591977A (zh) * 2012-01-04 2012-07-18 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法以及***
CN103186574A (zh) * 2011-12-29 2013-07-03 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN103294681A (zh) * 2012-02-23 2013-09-11 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN103473290A (zh) * 2013-08-30 2013-12-25 百度在线网络技术(北京)有限公司 Poi的属性数据的处理方法及装置
CN103646034A (zh) * 2013-11-14 2014-03-19 东华理工大学 一种基于内容可信的Web搜索引擎***及搜索方法
CN103995851A (zh) * 2014-05-07 2014-08-20 百度在线网络技术(北京)有限公司 对搜索结果进行处理的方法和装置
CN104427403A (zh) * 2013-09-05 2015-03-18 中国科学院声学研究所 一种终端媒体聚合链接质量保障方法与***
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN104881504A (zh) * 2015-06-23 2015-09-02 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN104933149A (zh) * 2015-06-23 2015-09-23 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN104991915A (zh) * 2015-06-23 2015-10-21 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN106294786A (zh) * 2016-08-12 2017-01-04 北京创新乐知信息技术有限公司 一种代码搜索方法和***
CN107688950A (zh) * 2017-08-31 2018-02-13 广东美的制冷设备有限公司 家电售后咨询方法、电子设备和计算机可读存储介质
CN108334575A (zh) * 2018-01-23 2018-07-27 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
WO2018176467A1 (zh) * 2017-04-01 2018-10-04 深圳市智晟达科技有限公司 根据用户观看影片推荐免费资源的方法以及推荐***
CN109241319A (zh) * 2018-09-28 2019-01-18 百度在线网络技术(北京)有限公司 一种图片检索方法、装置、服务器和存储介质
CN109636536A (zh) * 2018-12-19 2019-04-16 拉扎斯网络科技(上海)有限公司 服务产品提供方法、装置、电子设备及存储介质
CN110020206A (zh) * 2019-04-12 2019-07-16 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN110377831A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110516062A (zh) * 2019-08-26 2019-11-29 腾讯科技(深圳)有限公司 一种文档的搜索处理方法及装置
CN110827106A (zh) * 2018-08-08 2020-02-21 北京京东尚科信息技术有限公司 构建搜索模型的方法及装置以及商品搜索方法及装置
CN113192584A (zh) * 2021-03-30 2021-07-30 深圳市圣格灵科技有限公司 一种远程病案查阅***
CN115686432A (zh) * 2022-12-30 2023-02-03 药融云数字科技(成都)有限公司 一种用于检索排序的文献评价方法、存储介质及终端

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101046804A (zh) * 2006-03-30 2007-10-03 国际商业机器公司 文件***中搜索排序的方法及相关搜索引擎
CN102023991A (zh) * 2009-09-21 2011-04-20 中兴通讯股份有限公司 在终端上更新索引并基于其对搜索结果排序的方法及装置
CN102043846A (zh) * 2010-12-16 2011-05-04 上海电机学院 一种基于遗传算法的搜索方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101046804A (zh) * 2006-03-30 2007-10-03 国际商业机器公司 文件***中搜索排序的方法及相关搜索引擎
CN102023991A (zh) * 2009-09-21 2011-04-20 中兴通讯股份有限公司 在终端上更新索引并基于其对搜索结果排序的方法及装置
CN102043846A (zh) * 2010-12-16 2011-05-04 上海电机学院 一种基于遗传算法的搜索方法及装置

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186574A (zh) * 2011-12-29 2013-07-03 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN103186574B (zh) * 2011-12-29 2016-08-10 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN102591977A (zh) * 2012-01-04 2012-07-18 北京百度网讯科技有限公司 一种对搜索结果进行排序的方法以及***
CN103294681A (zh) * 2012-02-23 2013-09-11 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN103294681B (zh) * 2012-02-23 2017-02-08 北京百度网讯科技有限公司 一种搜索结果的生成方法和装置
CN103473290A (zh) * 2013-08-30 2013-12-25 百度在线网络技术(北京)有限公司 Poi的属性数据的处理方法及装置
CN103473290B (zh) * 2013-08-30 2017-10-31 百度在线网络技术(北京)有限公司 兴趣点的属性数据的处理方法及装置
CN104427403A (zh) * 2013-09-05 2015-03-18 中国科学院声学研究所 一种终端媒体聚合链接质量保障方法与***
CN104427403B (zh) * 2013-09-05 2017-11-21 中国科学院声学研究所 一种终端媒体聚合链接质量保障方法与***
CN103646034B (zh) * 2013-11-14 2017-03-08 东华理工大学 一种基于内容可信的Web搜索引擎***及搜索方法
CN103646034A (zh) * 2013-11-14 2014-03-19 东华理工大学 一种基于内容可信的Web搜索引擎***及搜索方法
CN104750713A (zh) * 2013-12-27 2015-07-01 阿里巴巴集团控股有限公司 一种对搜索结果进行排序的方法及装置
CN103995851A (zh) * 2014-05-07 2014-08-20 百度在线网络技术(北京)有限公司 对搜索结果进行处理的方法和装置
CN103995851B (zh) * 2014-05-07 2017-10-31 百度在线网络技术(北京)有限公司 对搜索结果进行处理的方法和装置
CN104881504A (zh) * 2015-06-23 2015-09-02 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN104933149B (zh) * 2015-06-23 2018-08-14 郑州悉知信息科技股份有限公司 一种信息搜索方法及装置
CN104991915A (zh) * 2015-06-23 2015-10-21 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN104933149A (zh) * 2015-06-23 2015-09-23 郑州悉知信息技术有限公司 一种信息搜索方法及装置
CN104881504B (zh) * 2015-06-23 2018-08-14 郑州悉知信息科技股份有限公司 一种信息搜索方法及装置
CN106294786A (zh) * 2016-08-12 2017-01-04 北京创新乐知信息技术有限公司 一种代码搜索方法和***
WO2018176467A1 (zh) * 2017-04-01 2018-10-04 深圳市智晟达科技有限公司 根据用户观看影片推荐免费资源的方法以及推荐***
CN107688950A (zh) * 2017-08-31 2018-02-13 广东美的制冷设备有限公司 家电售后咨询方法、电子设备和计算机可读存储介质
CN108334575A (zh) * 2018-01-23 2018-07-27 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
CN108334575B (zh) * 2018-01-23 2022-04-26 北京三快在线科技有限公司 一种推荐结果排序修正方法及装置,电子设备
CN110827106A (zh) * 2018-08-08 2020-02-21 北京京东尚科信息技术有限公司 构建搜索模型的方法及装置以及商品搜索方法及装置
CN109241319A (zh) * 2018-09-28 2019-01-18 百度在线网络技术(北京)有限公司 一种图片检索方法、装置、服务器和存储介质
CN109241319B (zh) * 2018-09-28 2021-11-02 百度在线网络技术(北京)有限公司 一种图片检索方法、装置、服务器和存储介质
CN109636536A (zh) * 2018-12-19 2019-04-16 拉扎斯网络科技(上海)有限公司 服务产品提供方法、装置、电子设备及存储介质
CN109636536B (zh) * 2018-12-19 2021-04-27 拉扎斯网络科技(上海)有限公司 服务产品提供方法、装置、电子设备及存储介质
CN110020206A (zh) * 2019-04-12 2019-07-16 北京搜狗科技发展有限公司 一种搜索结果排序方法及装置
CN110377831A (zh) * 2019-07-25 2019-10-25 拉扎斯网络科技(上海)有限公司 检索方法、装置、可读存储介质和电子设备
CN110516062A (zh) * 2019-08-26 2019-11-29 腾讯科技(深圳)有限公司 一种文档的搜索处理方法及装置
CN110516062B (zh) * 2019-08-26 2022-11-04 腾讯科技(深圳)有限公司 一种文档的搜索处理方法及装置
CN113192584A (zh) * 2021-03-30 2021-07-30 深圳市圣格灵科技有限公司 一种远程病案查阅***
CN115686432A (zh) * 2022-12-30 2023-02-03 药融云数字科技(成都)有限公司 一种用于检索排序的文献评价方法、存储介质及终端

Similar Documents

Publication Publication Date Title
CN102193999A (zh) 一种对搜索结果进行排序的方法及设备
CN102073699B (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
US7860878B2 (en) Prioritizing media assets for publication
CN103221951A (zh) 预测查询建议高速缓存
US20150278359A1 (en) Method and apparatus for generating a recommendation page
US7756867B2 (en) Ranking documents
CN106708817B (zh) 信息搜索方法及装置
CN105701216A (zh) 一种信息推送方法及装置
CN105051732A (zh) 本地应用内容的排名
CN105653705A (zh) 一种热门事件搜索方法和装置
CN107729578B (zh) 一种音乐推荐方法及装置
CN102184185A (zh) 一种用于多媒体资源搜索的方法与设备
CN103699700A (zh) 一种搜索引导的生成方法、***及相关服务器
CN1764916A (zh) 用于频率计数的方法和装置
CN104808892A (zh) 一种应用图标排序方法、装置、***及相关设备
CN103092943A (zh) 一种广告调度的方法和广告调度服务器
CN103500235A (zh) 一种多媒体文件推荐方法及装置
CN105808773A (zh) 一种新闻推送方法及装置
CN103246654A (zh) 搜索结果的展示处理方法和装置
EP3345102A1 (en) Context based instant search suggestions
US20240086479A1 (en) Identification and Issuance of Repeatable Queries
CN105447192A (zh) 在导航页上推荐个性化搜索词方法和装置
CN105117383A (zh) 一种提供搜索结果的方法与装置
CN111552884A (zh) 用于内容推荐的方法和设备
CN104484413A (zh) 一种获得搜索结果的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110921