CN104572776B - 一种搜索结果聚合块的生成方法及装置 - Google Patents

一种搜索结果聚合块的生成方法及装置 Download PDF

Info

Publication number
CN104572776B
CN104572776B CN201310516802.3A CN201310516802A CN104572776B CN 104572776 B CN104572776 B CN 104572776B CN 201310516802 A CN201310516802 A CN 201310516802A CN 104572776 B CN104572776 B CN 104572776B
Authority
CN
China
Prior art keywords
search result
polymeric block
search
module generator
polymerization module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310516802.3A
Other languages
English (en)
Other versions
CN104572776A (zh
Inventor
罗长升
吴健民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310516802.3A priority Critical patent/CN104572776B/zh
Publication of CN104572776A publication Critical patent/CN104572776A/zh
Application granted granted Critical
Publication of CN104572776B publication Critical patent/CN104572776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24554Unary operations; Data partitioning operations
    • G06F16/24556Aggregation; Duplicate elimination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明适用于搜索技术领域,提供了一种搜索结果聚合块的生成方法及装置,包括:创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑;根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址;依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果;将提取出的搜索结果输出至所述聚合块生成器;通过所述聚合块生成器生成搜索结果聚合块。本发明大大提高了用于展示搜索结果的代码的可扩展性,降低了代码成本。

Description

一种搜索结果聚合块的生成方法及装置
技术领域
本发明属于搜索技术领域,尤其涉及一种搜索结果聚合块的生成方法及装置。
背景技术
搜索引擎在根据搜索关键词得到搜索结果之后,会将相同类型或者具备相关性的多个搜索结果聚合在一起进行展示,以方便用户在大量的搜索结果中快速地查找、定位到需要的信息。通常,称上述对搜索结果的展示方式为搜索结果聚合块。
目前,每个搜索结果聚合块均对应一个C++类,搜索结果聚合块的相关逻辑代码都通过与其对应的类来实现,存在用于展示搜索结果的代码可扩展性差的问题,一旦需要新增搜索结果聚合块,则必须相应地增加与其对应的类。
发明内容
本发明实施例的目的在于提供一种搜索结果聚合块的生成方法,旨在解决现有技术中用于展示搜索结果的代码可扩展性差的问题。
本发明实施例是这样实现的,一种搜索结果聚合块的生成方法,包括:
创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑;
根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址;
依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果;
将提取出的搜索结果输出至所述聚合块生成器;
通过所述聚合块生成器生成搜索结果聚合块。
本发明实施例的另一目的在于提供一种搜索结果聚合块的生成装置,包括:
类创建单元,用于创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑;
实例化单元,用于根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址;
提取单元,用于依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果;
输出单元,用于将提取出的搜索结果输出至所述聚合块生成器;
生成单元,用于通过所述聚合块生成器生成搜索结果聚合块。
在本发明实施例中,利用一个聚合块生成类来实现生成搜索结果聚合块的通用逻辑,通过不同的配置文件来对该类进行实例化,从而输出不同类型的搜索结果聚合块。在本发明实施例中,一旦需要对搜索结果聚合块进行修改或者新增,只需要对配置文件做出改动,而无需增加新的类,由此大大提高了用于展示搜索结果的代码的可扩展性,降低了代码成本。
附图说明
图1是本发明实施例提供的搜索结果聚合块的示意图;
图2是本发明实施例提供的搜索结果聚合块的生成方法的实现流程图;
图3是本发明实施例提供的搜索结果聚合块的生成方法S202的具体实现流程图;
图4是本发明实施例提供的搜索结果聚合块的生成方法S203的具体实现流程图;
图5是本发明另一实施例提供的搜索结果聚合块的生成方法S203的具体实现流程图;
图6是本发明另一实施例提供的搜索结果聚合块的生成方法的实现流程图;
图7是本发明实施例提供的搜索结果聚合块的生成装置的结构框图;
图8是本发明另一实施例提供的搜索结果聚合块的生成装置的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在本发明实施例中,利用一个聚合块生成类来实现生成搜索结果聚合块的通用逻辑,通过不同的配置文件来对该类进行实例化,从而输出不同类型的搜索结果聚合块。在本发明实施例中,一旦需要对搜索结果聚合块进行修改或者新增,只需要对配置文件做出改动,而无需增加新的类,由此大大提高了用于展示搜索结果的代码的可扩展性,降低了代码成本。
在本发明实施例中,聚合块即为聚合在一起的、相同类型或者相互之间具备相关性的多个文档,而当所述文档为由搜索引擎根据搜索关键词进行搜索而得到的搜索结果时,称聚合块为搜索结果聚合块。例如,图1为搜索引擎根据搜索关键词“欢乐谷+项目”进行搜索而得到的搜索结果,其中,11和12即为两个不同类型的搜索结果聚合块,每个搜索结果聚合块中所聚合的搜索结果均归属于同一网站之下,因此,聚合在一起的搜索结果之间互相具备一定的相关性。
图2示出了本发明实施例提供的搜索结果聚合块的生成方法的实现流程,详述如下:
在S201中,创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑。
首先结合生成各种类型的搜索结果聚合块所需要使用到的生成逻辑,创建出聚合块生成类,该聚合块生成类中包含了用于生成搜索结果聚合块的通用逻辑。
在S202中,根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址。
在本实施例中,针对可能在最终展示给用户的搜索结果页面中显示的每一个搜索结果聚合块,在后台均配置有与该搜索结果聚合块对应的配置文件,根据配置文件来对聚合块生成类进行实例化,得到了用于生成该搜索结果聚合块的聚合块生成器,该聚合块生成器即为聚合块生成类的一个对象。
对于在最终展示给用户的搜索结果页面中显示的搜索结果聚合块,可以由开发人员根据实际的用户需求来确定。例如,搜索结果聚合块A,其聚合的均为域名为abc.com的搜索结果;又例如,搜索结果聚合块B,其聚合的均为视频类网站的搜索结果。针对每个搜索结果聚合块,其对应的配置文件中的配置项包括但不限于:
该搜索结果聚合块的预设网址:其用于指定能够包含在该搜索结果聚合块中的搜索结果。例如,对于上述搜索结果聚合块A,则其预设网址即为abc.com,所以域名为abc.com的搜索结果都被允许聚合在搜索结果聚合块A中;又例如,对于上述搜索结果聚合块B,则其预设网址可以为多个常用的视频网站的域名,归属于这些视频网站的搜索结果都被允许聚合在搜索结果聚合块B中。
进一步地,配置文件中的配置项还可以包括:
该搜索结果聚合块的名称;以及
该搜索结果聚合块的类型标识。
其中,名称用于区分不同的搜索结果聚合块,而类型标识用于区分不同类型的搜索结果聚合块。不同类型的搜索结果聚合块主要在最终的展示方式上有区分,分别对应不同的展示格式,例如,对于上述搜索结果聚合块A,聚合在其中的搜索结果均以文本的格式进行展示,而对于上述搜索结果聚合块B,聚合在其中的搜索结果则可以以文件及视频缩略图的格式进行展示,以方便用户更直观地定位到需要的信息。
作为本发明的一个实施例,当最终展示给用户的搜索结果聚合块在类型上有区分时,如图3所示,S202具体为:
在S301中,根据所述类型标识,在所述聚合块生成类包含的逻辑中确定出该类型的搜索结果聚合块的生成逻辑,确定出的所述生成逻辑生成的搜索结果聚合块展示与该类型相匹配的格式。
在S302中,根据确定出的所述生成逻辑,实例化出所述聚合块生成器。
由于在聚合块生成类中包含的逻辑仅为生成搜索结果聚合块的通用逻辑,根据搜索结果聚合块的类型的不同,需要在通用逻辑中确定出适于生成某一特定类型的搜索结果聚合块的生成逻辑。例如,对于搜索结果均以纯文本方式展示的搜索结果聚合块,则其无需执行通用逻辑中关于生成视频或者图片缩略图的相关逻辑。通过读取配置文件中的类型标识,能够根据预置在后台的类型标识与生成逻辑的对应关系,确定出适用于该配置文件对应的搜索结果聚合块类型的生成逻辑。因此,在本实施例中,仅仅通过一个类,根据不同的配置文件,实例化出的聚合块生成器不仅能够生成不同的搜索结果聚合块,生成的搜索结果聚合块在最终的展示格式上也可以实现区分,大大降低了开发的代码成本,一旦出于需求考虑,需要增加搜索结果聚合块的类型,则只需要增加相应的配置文件,并在后台预置该配置文件中的类型标识与生成逻辑的对应关系即可,大大提高了用于展示搜索结果的代码的可扩展性。
需要说明的是,在本发明实施例中,聚合块生成类是预先创建好的,而S202中对聚合块生成类的实例化步骤,可以在聚合块生成类创建之后就执行,也可以在每次搜索动作进行的过程中进行实时的实例化,在此不用于限定本发明。
在S203中,依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果。
在S204中,将提取出的搜索结果输出至所述聚合块生成器。
在本实施例中,搜索结果排序列表中包括了搜索引擎根据搜索关键词进行搜索得到的搜索结果,且这些搜索结果按照与搜索关键词的相关性大小由高至低进行排序,通过依次遍历搜索结果排序列表,一旦遍历到与配置文件中配置的预设网址相匹配的搜索结果时,则将其提取出来。而由于搜索结果排序列表中的搜索结果数量可能多达成百上千万个,因此,在具体的实施过程中,会只对搜索结果排序列表中的前M个搜索结果进行依次遍历(例如,对搜索结果排序列表中的前100个搜索结果进行依次遍历),而排列在M个搜索结果之后的搜索结果,由于其相关性不高,用户可能在翻阅到这些搜索结果之前已经找到了需要的信息,因此,对于这些搜索结果,在实际操作过程中,没有生成搜索结果聚合块的太大必要。
每提取出一个搜索结果,则将该搜索结果输出至S202中生成的聚合块生成器中,输出至聚合块生成器的搜索结果即为最终需要显示在搜索结果聚合块中的搜索结果。
由于搜索结果排序列表中的搜索结果数量可能多达成百上千万个,随着遍历过程的进行,遍历的搜索结果与搜索关键词的相关性可能越来越小,为了保证聚合在搜索结果聚合块中的搜索结果与搜索关键词具备一定程度的相关性,以提高展示给用户的搜索结果的准确性,作为本发明的一个实施例,S203具体如图4所示:
在S401中,判断所述提取出的搜索结果与搜索关键词的相关性是否大于第一预设阈值。
由于搜索结果排序列表本身已是按照与搜索关键词的相关性来进行排序的,因此,在具体的实施过程中,当遍历到搜索结果排序列表的前N个搜索结果时(例如,前10个搜索结果),由于这前N个搜索结果与搜索关键词的相关性较高,因此,可以先不执行S401的判断步骤。从搜索结果排序列表的前N个搜索结果之后开始,会对提取出的搜索结果与搜索关键词的相关性作一个判断,判断该相关性是否大于第一预设阈值。
在S402中,当所述提取出的搜索结果与所述搜索关键词的相关性大于所述第一预设阈值时,将所述提取出的搜索结果输出至所述聚合块生成器。
若当前提取出的搜索结果与搜索关键词的相关性大于第一预设阈值,此时才考虑将该搜索结果输出至聚合块生成器,否则,则不对该搜索结果进行输出,由此提高最终聚合在搜索结果聚合块中的文档的相关性,以便于用户快速地定位到需要的信息。
作为本发明的另一实施例,由于在最终展示给用户的一个搜索结果页面中,能够展示出的搜索结果数量是有限的,因此,为了避免聚合在一个搜索结果聚合块中的搜索结果过多,从而影响了其他搜索结果聚合块或者其他搜索结果在一个搜索结果页面中的显示,如图5所示,S203具体为:
在S501中,判断当前已输出至所述聚合块生成器的搜索结果数量是否小于第二预设阈值。
在本实施例中,每个聚合块生成器都会有一个搜索结果列表,若当前未有输出至该聚合块生成器的搜索结果,则该聚合块生成器的搜索结果列表中的搜索结果数量为0,且该搜索结果列表中的搜索结果数量随着输出至该聚合块生成器的搜索结果的增加而增加。在具体的实施过程中,在将提取出的搜索结果输出至聚合块生成器之前,首先读取该聚合块生成器的搜索结果列表,判断已输出至该聚合块生成器中的搜索结果的数量是否小于第二预设阈值(例如,第二预设阈值可以设置为4)。
在S502中,若当前已输出至所述聚合块生成器的搜索结果数量小于所述第二预设阈值,将所述提取出的搜索结果输出至所述聚合块生成器。
若判断出当前已输出至该聚合块生成器中的搜索结果的数量仍小于第二预设阈值,则继续向该聚合块生成器输出该搜索结果,否则,停止向该聚合块生成器输出搜索结果,且后续的遍历过程也不再对搜索结果进行与该聚合块生成器对应的预设网址的匹配过程。由于搜索结果排序列表本身已是按照与搜索关键词的相关性来进行排序的,因此,依次遍历搜索结果列表的过程能够保证最终聚合在搜索结果聚合块中的搜索结果的相关性,避免将相关性较高的搜索结果排除在搜索结果聚合块之外。
在S205中,通过所述聚合块生成器生成搜索结果聚合块。
在本实施例中,根据聚合块生成器生成搜索结果聚合块之前,会读取聚合块生成器中的搜索结果列表,判断输出至聚合块生成器的搜索结果数量是否为零,若为零,则不通过聚合块生成器生成搜索结果聚合块。而当输出至聚合块生成器的搜索结果数量不为零时,则通过该聚合块生成器生成搜索结果聚合块并输出。
需要说明的是,当输出至聚合块生成器的搜索结果数量仅为1时,实质上,该搜索结果聚合块所需要展示的搜索结果和单独展示的搜索结果是没有区别的,因此,一种情况是,当输出至聚合块生成器的搜索结果数量为1时,也不通过聚合块生成器生成搜索结果聚合块,而是直接输出单条的搜索结果;而另一种情况是,当输出至聚合块生成器的搜索结果数量为1时,生成的搜索结果聚合块的展示格式可以等同于单条搜索结果的展示格式,该情况可以通过前述确定搜索结果聚合块的生成逻辑的步骤来实现。
作为本发明的另一实施例,在S205之后,还需要将生成的搜索结果聚合块输出至最终展示的搜索结果页面中的相应位置。如图6所示,在S204之后,S205之前,本方法还包括了:
在S206中,判断当前输出的搜索结果是否为第一个输出至所述聚合块生成器的搜索结果。
在S207中,若所述当前输出的搜索结果为第一个输出至所述聚合块生成器的搜索结果时,获取所述当前输出的搜索结果在所述搜索结果排序列表中的位置。
即,若在输出搜索结果之前,检测到聚合块生成器中的搜索结果为零时,则当前输出的搜索结果为第一个输出至该聚合块生成器的搜索结果,此时,获取到当前输出的搜索结果在搜索结果排序列表中的排序位置。
与此同时,在S205之后,所述方法还包括:
S208,将获取到的位置确定为生成的搜索结果聚合块在最终展示的搜索结果页面中的位置。
在本实施例中,第一个输出至聚合块生成器中的搜索结果一定是最终展示在搜索结果聚合块的搜索结果中相关性最高的一个,因此,将该搜索结果在搜索结果排序列表的位置确定为该搜索结果聚合块在最终展示给用户的搜索结果页面中的位置,能够保证最终展示的搜索结果页面的有序性。以图1为例,实质上,11中展示的第一个搜索结果在搜索结果排序列表中排列在第2位,而12中展示的第一个搜索结果在搜索结果排序列表中排列在第3位。
在本发明实施例中,当同时存在多个聚合块生成器时,生成所有聚合块生成器对应的搜索结果聚合块的过程实际上是不断对搜索结果排序列表进行遍历和刷新的过程。例如,对于第一个聚合块生成器,首先遍历搜索结果排序列表,提取出相关的搜索结果并输出给第一个聚合块生成器,之后再针对第二个聚合块生成器进行遍历、提取和输出的操作,以此类推。在此过程中,作为本发明的一个实施例,当第一个聚合块生成器生成了搜索结果聚合块之后,会在搜索结果排序列表中删除已输入至该聚合块生成器的搜索结果,以避免后续的重复、无效遍历操作,提高搜索结果页面的生成效率。
作为本发明的一个实施例,在后台若需要根据实际的搜索需求对生成的搜索结果聚合块进行改动时,例如,新增不同类型的搜索结果聚合块,修改某个搜索结果聚合块中的预设网址等,则只需要修改所述配置文件中的配置项,生成新的配置文件,以根据该配置文件实例化聚合块生成类,以得到用于生成新的搜索结果聚合块的聚合块生成器。在上述过程中,无需新增相应的类,只需要对配置文件进行改动,由此大大提高了用于展示搜索结果的代码的可扩展性。
在本发明实施例中,利用一个聚合块生成类来实现生成搜索结果聚合块的通用逻辑,通过不同的配置文件来对该类进行实例化,从而输出不同类型的搜索结果聚合块。在本发明实施例中,一旦需要对搜索结果聚合块进行修改或者新增,只需要对配置文件做出改动,而无需增加新的类,由此大大提高了用于展示搜索结果的代码的可扩展性,降低了代码成本。
图7示出了本发明实施例提供的搜索结果聚合块的生成装置的结构框图,该装置用于运行本发明图2至图6实施例所述的搜索结果聚合块的生成方法。为了便于说明,仅示出了与本实施例相关的部分。
参照图7,该装置包括:
类创建单元71,创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑。
实例化单元72,根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址。
提取单元73,依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果。
输出单元74,将提取出的搜索结果输出至所述聚合块生成器。
生成单元75,通过所述聚合块生成器生成搜索结果聚合块。
可选地,所述配置文件中的配置项还包括了该配置文件对应的搜索结果聚合块的类型标识,所述实例化单元72包括:
逻辑确定子单元,根据所述类型标识,在所述聚合块生成类包含的逻辑中确定出该类型的搜索结果聚合块的生成逻辑,确定出的所述生成逻辑生成的搜索结果聚合块展示与该类型相匹配的格式。
实例化子单元,根据确定出的所述生成逻辑,实例化出所述聚合块生成器。
可选地,所述输出单元74包括:
第一判断子单元,判断所述提取出的搜索结果与搜索关键词的相关性是否大于第一预设阈值。
第一输出子单元,当所述提取出的搜索结果与所述搜索关键词的相关性大于所述第一预设阈值时,将所述提取出的搜索结果输出至所述聚合块生成器。
可选地,所述输出单元74包括:
第二判断子单元,判断当前已输出至所述聚合块生成器的搜索结果数量是否小于第二预设阈值。
第二输出子单元,若当前已输出至所述聚合块生成器的搜索结果数量小于所述第二预设阈值,将所述提取出的搜索结果输出至所述聚合块生成器。
可选地,如图8所示,所述装置还包括:
判断单元76,判断当前输出的搜索结果是否为第一个输出至所述聚合块生成器的搜索结果。
位置获取单元77,若所述当前输出的搜索结果为第一个输出至所述聚合块生成器的搜索结果时,获取所述当前输出的搜索结果在所述搜索结果排序列表中的位置。
确定单元78,将获取到的位置确定为生成的搜索结果聚合块在最终展示的搜索结果页面中的位置。
可选地,所述装置还包括:
删除单元,在所述搜索结果排序列表中删除已输入至所述聚合块生成器的搜索结果。
可选地,所述装置还包括:
修改单元,修改所述配置文件中的配置项,以得到用于生成新的搜索结果聚合块的聚合块生成器。
在本发明实施例中,利用一个聚合块生成类来实现生成搜索结果聚合块的通用逻辑,通过不同的配置文件来对该类进行实例化,从而输出不同类型的搜索结果聚合块。在本发明实施例中,一旦需要对搜索结果聚合块进行修改或者新增,只需要对配置文件做出改动,而无需增加新的类,由此大大提高了用于展示搜索结果的代码的可扩展性,降低了代码成本。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种搜索结果聚合块的生成方法,其特征在于,包括:
创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑,其中,所述搜索结果聚合块为对关键词进行搜索后得到的相同类型或相互之间具备相关性的多个文档;
根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址;
依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果;
将提取出的搜索结果输出至所述聚合块生成器;
通过所述聚合块生成器生成搜索结果聚合块。
2.如权利要求1所述的方法,其特征在于,所述配置文件中的配置项还包括了该配置文件对应的搜索结果聚合块的类型标识,所述根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器包括:
根据所述类型标识,在所述聚合块生成类包含的逻辑中确定出该类型的搜索结果聚合块的生成逻辑,确定出的所述生成逻辑生成的搜索结果聚合块展示与该类型相匹配的格式;
根据确定出的所述生成逻辑,实例化出所述聚合块生成器。
3.如权利要求1所述的方法,其特征在于,所述将提取出的搜索结果输出至所述聚合块生成器包括:
判断所述提取出的搜索结果与搜索关键词的相关性是否大于第一预设阈值;
当所述提取出的搜索结果与所述搜索关键词的相关性大于所述第一预设阈值时,将所述提取出的搜索结果输出至所述聚合块生成器。
4.如权利要求1所述的方法,其特征在于,所述将提取出的搜索结果输出至所述聚合块生成器包括:
判断当前已输出至所述聚合块生成器的搜索结果数量是否小于第二预设阈值;
若当前已输出至所述聚合块生成器的搜索结果数量小于所述第二预设阈值,将所述提取出的搜索结果输出至所述聚合块生成器。
5.如权利要求1所述的方法,其特征在于,在所述将提取出的搜索结果输出至所述聚合块生成器之后,在所述通过所述聚合块生成器生成搜索结果聚合块之前,所述方法还包括:
判断当前输出的搜索结果是否为第一个输出至所述聚合块生成器的搜索结果;
若所述当前输出的搜索结果为第一个输出至所述聚合块生成器的搜索结果时,获取所述当前输出的搜索结果在所述搜索结果排序列表中的位置;
在所述通过所述聚合块生成器生成搜索结果聚合块之后,所述方法还包括:
将获取到的位置确定为生成的搜索结果聚合块在最终展示的搜索结果页面中的位置。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
在所述搜索结果排序列表中删除已输入至所述聚合块生成器的搜索结果。
7.如权利要求1所述的方法,其特征在于,所述方法还包括:
修改所述配置文件中的配置项,以得到用于生成新的搜索结果聚合块的聚合块生成器。
8.一种搜索结果聚合块的生成装置,其特征在于,包括:
类创建单元,用于创建聚合块生成类,所述聚合块生成类包含用于生成搜索结果聚合块的逻辑,其中,所述搜索结果聚合块为对关键词进行搜索后得到的相同类型或相互之间具备相关性的多个文档;
实例化单元,用于根据配置文件对所述聚合块生成类进行实例化,得到聚合块生成器,所述配置文件对应一个搜索结果聚合块,且所述配置文件中的配置项包括了该搜索结果聚合块的预设网址;
提取单元,用于依次遍历搜索结果排序列表,提取出其中与所述配置文件中的所述预设网址相匹配的搜索结果;
输出单元,用于将提取出的搜索结果输出至所述聚合块生成器;
生成单元,用于通过所述聚合块生成器生成搜索结果聚合块。
9.如权利要求8所述的装置,其特征在于,所述配置文件中的配置项还包括了该配置文件对应的搜索结果聚合块的类型标识,所述实例化单元包括:
逻辑确定子单元,用于根据所述类型标识,在所述聚合块生成类包含的逻辑中确定出该类型的搜索结果聚合块的生成逻辑,确定出的所述生成逻辑生成的搜索结果聚合块展示与该类型相匹配的格式;
实例化子单元,用于根据确定出的所述生成逻辑,实例化出所述聚合块生成器。
10.如权利要求8所述的装置,其特征在于,所述输出单元包括:
第一判断子单元,用于判断所述提取出的搜索结果与搜索关键词的相关性是否大于第一预设阈值;
第一输出子单元,用于当所述提取出的搜索结果与所述搜索关键词的相关性大于所述第一预设阈值时,将所述提取出的搜索结果输出至所述聚合块生成器。
11.如权利要求8所述的装置,其特征在于,所述输出单元包括:
第二判断子单元,用于判断当前已输出至所述聚合块生成器的搜索结果数量是否小于第二预设阈值;
第二输出子单元,用于若当前已输出至所述聚合块生成器的搜索结果数量小于所述第二预设阈值,将所述提取出的搜索结果输出至所述聚合块生成器。
12.如权利要求8所述的装置,其特征在于,所述装置还包括:
判断单元,用于判断当前输出的搜索结果是否为第一个输出至所述聚合块生成器的搜索结果;
位置获取单元,用于若所述当前输出的搜索结果为第一个输出至所述聚合块生成器的搜索结果时,获取所述当前输出的搜索结果在所述搜索结果排序列表中的位置;
确定单元,用于将获取到的位置确定为生成的搜索结果聚合块在最终展示的搜索结果页面中的位置。
13.如权利要求12所述的装置,其特征在于,所述装置还包括:
删除单元,用于在所述搜索结果排序列表中删除已输入至所述聚合块生成器的搜索结果。
14.如权利要求8所述的装置,其特征在于,所述装置还包括:
修改单元,用于修改所述配置文件中的配置项,以得到用于生成新的搜索结果聚合块的聚合块生成器。
CN201310516802.3A 2013-10-28 2013-10-28 一种搜索结果聚合块的生成方法及装置 Active CN104572776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310516802.3A CN104572776B (zh) 2013-10-28 2013-10-28 一种搜索结果聚合块的生成方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310516802.3A CN104572776B (zh) 2013-10-28 2013-10-28 一种搜索结果聚合块的生成方法及装置

Publications (2)

Publication Number Publication Date
CN104572776A CN104572776A (zh) 2015-04-29
CN104572776B true CN104572776B (zh) 2019-04-12

Family

ID=53088853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310516802.3A Active CN104572776B (zh) 2013-10-28 2013-10-28 一种搜索结果聚合块的生成方法及装置

Country Status (1)

Country Link
CN (1) CN104572776B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108182401B (zh) * 2017-12-27 2021-09-03 武汉理工大学 一种基于聚合块信息的安全虹膜识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488151A (zh) * 2009-01-20 2009-07-22 中国科学院计算技术研究所 一种聚合Web站点内容的***和方法
CN101534324A (zh) * 2009-04-14 2009-09-16 河北全通通信有限公司 基于DotNet平台的可插拔的Web服务动态调用方法
CN102982066A (zh) * 2011-10-12 2013-03-20 微软公司 呈现聚合地签注的搜索结果
CN103258004A (zh) * 2013-04-12 2013-08-21 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行处理的方法和装置
CN103377204A (zh) * 2012-04-18 2013-10-30 腾讯科技(深圳)有限公司 一种地图搜索结果的展现方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101488151A (zh) * 2009-01-20 2009-07-22 中国科学院计算技术研究所 一种聚合Web站点内容的***和方法
CN101534324A (zh) * 2009-04-14 2009-09-16 河北全通通信有限公司 基于DotNet平台的可插拔的Web服务动态调用方法
CN102982066A (zh) * 2011-10-12 2013-03-20 微软公司 呈现聚合地签注的搜索结果
CN103377204A (zh) * 2012-04-18 2013-10-30 腾讯科技(深圳)有限公司 一种地图搜索结果的展现方法和装置
CN103258004A (zh) * 2013-04-12 2013-08-21 百度在线网络技术(北京)有限公司 一种用于对搜索结果进行处理的方法和装置

Also Published As

Publication number Publication date
CN104572776A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
Bíró et al. Latent dirichlet allocation in web spam filtering
CN104504109B (zh) 图片搜索方法和装置
KR101377389B1 (ko) 다차원 검색 시스템, 다차원 검색을 수행하는 컴퓨터 구현 방법 및 컴퓨터 실행가능 시스템
CA2743273C (en) Method and device for intercepting junk mail
Lian et al. Collaborative filtering meets next check-in location prediction
CN107992764B (zh) 一种敏感网页识别与检测方法及装置
US7992092B2 (en) Information processing apparatus, control method for same, program, and storage medium
CN102750346B (zh) 软件推荐方法和***、终端设备
WO2008073784A1 (en) Web site structure analysis
Poisel et al. A comprehensive literature review of file carving
CN105159938B (zh) 检索方法和装置
GB2509773A (en) Automatic genre determination of web content
JP2008033687A (ja) 検索クエリー作成装置
CN104217008A (zh) 互联网人物视频交互式标注方法及***
CN105912652A (zh) 基于关联规则和用户属性的异常行为检测方法和***
CN102402589A (zh) 一种提供与搜索请求相关的参考搜索信息的方法与设备
CN104035999A (zh) 基于家长个性化推荐管控的安全网络浏览***
KR20140008732A (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
JP2004164608A (ja) 情報検索装置
CN106156098A (zh) 一种纠错对挖掘方法及***
CN101576872B (zh) 一种中文文本处理方法及装置
CN104572776B (zh) 一种搜索结果聚合块的生成方法及装置
CN110532772A (zh) 文件检测方法、模型、设备及计算机可读存储介质
CN104537082A (zh) 文件排序显示方法和装置
Gu A lightweight Phishing website detection algorithm by machine learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant