CN105354283A - 一种资源的搜索方法和装置 - Google Patents

一种资源的搜索方法和装置 Download PDF

Info

Publication number
CN105354283A
CN105354283A CN201510728103.4A CN201510728103A CN105354283A CN 105354283 A CN105354283 A CN 105354283A CN 201510728103 A CN201510728103 A CN 201510728103A CN 105354283 A CN105354283 A CN 105354283A
Authority
CN
China
Prior art keywords
serial
resource
resource group
related resource
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510728103.4A
Other languages
English (en)
Inventor
周燕红
杨琛
汤兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201510728103.4A priority Critical patent/CN105354283A/zh
Publication of CN105354283A publication Critical patent/CN105354283A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种资源的搜索方法和装置,其中的方法包括:依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;将所述系列相关资源组中的资源返回给用户。本发明实施例能够提高搜索结果的准确性和相关性。

Description

一种资源的搜索方法和装置
技术领域
本发明涉及网络技术领域,特别是涉及一种资源的搜索方法和装置。
背景技术
目前视频网站主要分为两种,一种是以用户生成内容为主的网站,即UGC(UserGeneratedContent,用户生成内容)网站;另一种是专业视频内容为主的网站。相比较而言,UGC网站具有以短视频为主、视频数量较多、内容比较丰富的优点。
在视频网站中,视频搜索能够帮助用户快速找到想要观看的视频内容。具体地,可以根据用户输入的查询词,在视频网站中查找并返回用户搜索的视频内容以及和该视频内容相关的其它视频,一并展示给用户。
然而,对于以UGC业务为主的视频网站,每天都有大量的视频被上传,用户上传的视频内容往往具有随意性和重复性,这使得用户上传的视频内容被零散地分布在视频网站中的各个位置。在这种情况下,当用户搜索视频时,在大量的、杂乱无章的视频中进行查找,不但会影响搜索的效率,而且使得搜索结果的准确性和相关性也无法得到保证。
发明内容
本发明实施例所要解决的技术问题是提供一种资源的搜索方法和装置,能够提高搜索结果的准确性和相关性。
为了解决上述问题,本发明公开了一种资源的搜索方法,包括:
依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;
将所述系列相关资源组中的资源返回给用户。
优选地,通过如下步骤建立所述系列相关索引表:
提取资源库中资源对应的文本特征信息和数字特征信息;
依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成所述系列相关资源组的系列关键词;
依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述方法还包括:
依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
优选地,所述方法还包括:
将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
优选地,所述方法还包括:
依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
依据本发明的另一个方面,提供了一种资源的搜索装置,包括:
第一检索模块,用于依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;及
结果返回模块,用于将所述系列相关资源组中的资源返回给用户。
优选地,所述装置还包括:用于建立系列相关索引表的索引表建立模块;
所述索引表建立模块包括:
提取子模块,用于提取资源库中资源对应的文本特征信息和数字特征信息;
聚合子模块,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成子模块,用于生成所述系列相关资源组的系列关键词;
建立子模块,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述装置还包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
优选地,所述装置还包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
优选地,所述装置还包括:
第二检索模块,用于依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
判断模块,用于判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
更新模块,用于将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
与现有技术相比,本发明实施例包括以下优点:
本发明实施例依据用户输入的查询词,在已建立的系列相关索引表中,检索出与该查询词匹配的系列相关资源组,并将所述系列相关资源组中的资源返回给用户。本发明实施例在用户搜索的过程中,可以为用户提供与用户搜索资源具有系列关系的一组资源,由于具有系列关系的资源通常具有强关联性,因此,该系列相关资源组中的资源内容都是具有强关联性的视频,从而可以提高搜索结果的准确性和相关性。
附图说明
图1示出了本发明的一种资源的搜索***的结构示意图;
图2示出了本发明的一种资源的搜索方法实施例的步骤流程图;
图3示出了本发明的一种建立系列相关索引表的步骤流程图;及
图4示出了本发明的一种资源的搜索装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
在实际应用中,本发明的一种资源的搜索***具体可以包括:系列相关资源组生成模块、在线搜索模块、以及搜索结果展示模块。参照图1,示出了本发明的一种资源的搜索***的结构示意图,其中,系列相关资源组生成模块用于在库存的所有资源中挖掘出系列相关资源组,以及建立对应的系列相关索引表供在线搜索模块检索使用;在线搜索模块用于依据用户输入的查询词在系列相关索引表中检索出匹配的系列相关资源组;搜索结果展示模块用于将在线搜索模块检索出的系列相关资源组中的资源作为一个整体结果放在搜索结果列表中,展示给用户。
本发明实施例中的资源可以包括视频、书籍、图片等各种可以在网络上供用户查询浏览的资源,本发明对于资源的具体内容不加以限制,本发明实施例主要以视频资源为例进行说明,对于其它资源的情况相互参照即可
实施例一
参照图2,示出了本发明的一种资源的搜索方法实施例的步骤流程图,具体可以包括:
步骤201、依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组可以包括内容相互关联的多个资源;
其中,系列相关资源组中的各个资源之间具有系列关系,即该系列相关资源组中的所有资源在一起能够表示一个完整的内容。例如,“游泳教学视频-蛙泳教学完整版-01”,“游泳教学视频-蛙泳教学完整版-02”,“游泳教学视频-蛙泳教学完整版-03”等。这些视频在一起组成蛙泳教学完整版的完整内容,属于一个系列,对于用户来说一个系列中的单个视频只能提供部分信息,并不完整,只有该系列中的全部视频才能给用户提供完整的观看体验。
依据系列相关索引表可以检索到与用户查询词匹配的系列相关资源组。具体地,可以用户查询词作为系列关键词在系列相关索引表中进行检索,查找匹配的表项。参见表1,示出了本发明的一种系列相关索引表的结构示意图。当然,本领域技术人员在实际应用中可以根据需要灵活设置系列相关索引表,本发明对于系列相关索引表的具体结构及检索方法不加以限制。
表1
系列关键词 系列相关资源组 系列编号
蛙泳教学 游泳教学视频-蛙泳教学完整版-01 01
蛙泳教学 游泳教学视频-蛙泳教学完整版-02 02
蛙泳教学 游泳教学视频-蛙泳教学完整版-03 03
南禅七日 南禅七日-1(全套) 01
南禅七日 南禅七日-2(全套) 02
南禅七日 南禅七日-3(全套)-高清 03
南禅七日 南禅七日-4(全套)-高清 04
南禅七日 南禅七日-5(全套) 05
依据用户输入的查询词在系列相关索引表中进行检索,例如,用户输入“蛙泳教学”时,在系列相关索引表中检索到与“蛙泳教学”匹配的系列关键词,其对应的系列相关资源组中包括视频:游泳教学视频-蛙泳教学完整版-01,游泳教学视频-蛙泳教学完整版-02,游泳教学视频-蛙泳教学完整版-03。该系列相关资源组中包括内容相关的多个资源,可以将该系列相关资源组返回给用户,使得用户可以方便快捷地从中找到所需要的目标资源,以及与目标资源内容相关联的其它资源,从而能够提高搜索结果的准确性和相关性。
步骤202、将所述系列相关资源组中的资源返回给用户。
在现有的视频搜索方法中,通常会检索出许多弱关联的视频并返回给用户,例如用户搜索“游泳教学视频-蛙泳教学完整版-01”时,会向用户返回弱关联的视频,如“游泳教学视频蛙式换气动作教学”等,一般来说,弱关联仅能保证有一定关联关系,比如都是与“游泳”相关,但是关联关系不够紧密。通常,用户在搜索“游泳教学视频-蛙泳教学完整版-01”时,接下来搜索“游泳教学视频-蛙泳教学完整版-02”的可能性更大,本发明实施例提供的资源的搜索方法为用户检索出的系列相关资源组,其中包括的各资源具有系列关系,也即具有强关联的关系,能够提高了搜索结果的准确性和相关性。
在本发明的一种应用示例中,在用户搜索“游泳教学视频-蛙泳教学完整版-01”时,优先向用户返回系列相关资源组,如“游泳教学视频-蛙泳教学完整版-01”,“游泳教学视频-蛙泳教学完整版-02”,“游泳教学视频-蛙泳教学完整版-03”等。在不存在匹配的系列相关资源组或者检索出的资源数据不够时,可以再使用传统的基于关键词的弱关联搜索方法进行检索。
本发明实施例依据用户输入的查询词,在已建立的系列相关索引表中,检索出与该查询词匹配的系列相关资源组,并将所述系列相关资源组中的资源返回给用户。本发明实施例在用户搜索的过程中,可以为用户提供与用户搜索资源具有系列关系的一组资源,由于具有系列关系的资源通常具有强关联性,因此,该系列相关资源组中的资源内容都是具有强关联性的视频,从而可以提高搜索结果的准确性和相关性。
实施例二
本实施例的资源的搜索方法在上述实施例一的基础上,进一步还可以包括如下可选技术方案。
参照图3,示出了本发明的一种建立系列相关索引表的步骤流程图,具体可以包括:
步骤301、提取资源库中资源对应的文本特征信息和数字特征信息;
具体地,可以对资源库中资源的元信息(如资源的标题、描述等)进行分词操作,提取出重要的文本特征信息和数字特征信息,例如,对于标题“游泳教学视频-蛙泳教学完整版-01”进行分词,可以得到文本特征信息:“游泳教学视频”、“蛙泳教学”、“完整版”,以及数字特征信息:“01”。
步骤302、依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
具体地,在聚合过程中,首先挑选出具有数字特征信息的资源,然后将文本特征信息相同或相似的资源聚合在一起,以生成系列相关资源组,该系列相关资源组中的资源属于同一个系列。
由于具有数字特征信息的标题通常具有系列关系,因此,本发明对于具有数字特征信息的资源进行聚合,例如,资源“游泳教学视频-蛙泳教学完整版-01”具有数字特征信息,而资源“夏天游泳教学视频-蛙泳教学完整版-分解动作教学”没有数字特征信息,因此,在聚合时,丢弃资源“夏天游泳教学视频-蛙泳教学完整版-分解动作教学”。
在排除了不具有数字特征信息的资源之后,针对具有数字特征信息的资源可以按照文本特征信息相接近的原则进行聚合。优选地,可以通过设置聚合参数确定资源是否属于同一个系列,例如,设置聚合参数为3,则对于两个待聚合的资源,在具有三个以上相同的文本特征信息时,可以确定这这两个资源属于同一个系列,可以聚合到同一个系列相关资源组。当然,上述通过设置聚合参数对于文本特征信息相同或相似的资源进行聚合只是作为一种应用示例,在具体应用中,本领域技术人员可以根据实际情况使用不同的方法聚合系列相关资源组,本发明对此不加以限制。
步骤303、生成所述系列相关资源组的系列关键词;
在本发明的一种应用示例中,可以依据系列相关资源组中资源的文本特征信息来生成系列关键词,例如,可以使用出现次数最多的一个或多个文本特征信息来作为系列关键词。
此外,还可以生成与系列关键词对应的系列编号,系列编号可以通过数字特征信息进行提取。例如,对于下面这些视频可以聚合为一个系列相关资源组:南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套)-高清,南禅七日-5(全套),以及可以确定该系列相关资源组的系列关键词为“南禅七日”,而每个资源对应的系列编号分别是:1、2、3、4、5。
在本发明的一种优选实施例中,所述方法还可以包括:
将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
具体地,可以将上述应用示例中“南禅七日”系列相关资源组中的资源依据系列编号从小大到进行排序,以及将该系列相关视频组作为一个整体放在搜索结果列表中展示给用户,其中的视频资源按照系列编号排序,使得用户可以直接按顺序播放资源组中的各视频资源,从而可以提高用户的点击率。
步骤304、依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
优选地,所述系列相关索引表具体可以为倒排索引表。倒排索引源于实际应用中需要根据属性的值来查找记录。倒排索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引。带有倒排索引的文件称为倒排索引文件,简称倒排文件。
在本发明的一种应用示例中,可以建立如下倒排索引表:“游泳教学视频”→系列1,“蛙泳教学”→系列1,“南禅七日”→系列2。其中,系列1、系列2为系列名称,“游泳教学视频”,“蛙泳教学”,“南禅七日”为系列关键词。当用户输入查询词“南禅七日5(全套)”时,可以先对该查询词进行分词,得到文本特征信息“南禅七日”,在上述倒排索引表中检索到系列2对应的系列关键词与该查询词匹配,则可以把系列2对应的系列相关资源组返回给用户。
在具体应用中,本领域技术人员还可以根据实际情况选用其它方法来建立系列相关索引表,上述使用倒排索引的方法仅作为一种应用示例,本发明对于建立系列相关索引表的方法不加以限制。
在本发明的另一种优选实施例中,所述方法还可以包括:
依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
在建立系列相关索引表的过程中,通过资源的文本特征信息对具有系列关系的资源进行聚合,但是聚合后的资源中可能会存在一些脏数据,因此,本发明实施例可以通过查询用户的历史点击记录清除这些脏数据以修正聚合的结果。例如,视频A和视频B被聚合到同一个系列相关资源组中,但是,通过查询用户对于视频A和视频B的历史点击记录发现,在用户搜索的过程中,只会点击视频A,而从未点击过视频B,说明视频A和视频B不属于同一个系列,因此,可以将视频B从该系列相关资源组中删除,从而可以对已建立的系列相关资源组进行优化,进一步提高搜索结果的准确性和相关性。
在本发明的又一种优选实施例中,所述方法还可以包括:
步骤A1、依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
步骤A2、判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
步骤A3、将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
在本发明的一种应用示例中,用户输入查询词“南禅七日5(全套)”,首先,在资源库中检索到对应的目标资源:南禅七日-5(全套);然后,对所述查询词经过分词及检索得到与该查询词匹配的系列相关资源组,其中包括南禅七日-1(全套),南禅七日-2(全套),南禅七日-3(全套)-高清,南禅七日-4(全套);该系列相关资源组中不存在用户检索的目标资源,因此,可以将所述目标资源和检索得到的系列相关资源组一并返回给用户;最后,更新所述系列相关资源组和系列相关索引表,将该目标资源添加到所述相关资源组中,以及依据更新后的相关资源组的信息更新系列相关索引表。从而可以在用户搜索的过程中,不断更新并优化系列相关资源组及系列相关索引表,使得搜索结果的准确性和相关性进一步得到提高。
装置实施例
参照图4,示出了本发明的一种资源的搜索装置的结构框图,具体可以包括:
第一检索模块410,用于依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组可以包括内容相互关联的多个资源;及
结果返回模块420,用于将所述系列相关资源组中的资源返回给用户。
在本发明的一种优选实施例中,所述装置还可以包括:用于建立系列相关索引表的索引表建立模块;
所述索引表建立模块还可以包括:
提取子模块,用于提取资源库中资源对应的文本特征信息和数字特征信息;
聚合子模块,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成子模块,用于生成所述系列相关资源组的系列关键词;
建立子模块,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
在本发明的另一种优选实施例中,所述装置还可以包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
在本发明的又一种优选实施例中,所述装置还可以包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
在本发明的再一种优选实施例中,所述装置还可以包括:
第二检索模块,用于依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
判断模块,用于判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
更新模块,用于将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种资源的搜索方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种资源的搜索方法,其特征在于,所述方法包括:
依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;
将所述系列相关资源组中的资源返回给用户。
2.如权利要求1所述的方法,其特征在于,通过如下步骤建立所述系列相关索引表:
提取资源库中资源对应的文本特征信息和数字特征信息;
依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成所述系列相关资源组的系列关键词;
依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
6.一种资源的搜索装置,其特征在于,所述装置包括:
第一检索模块,用于依据用户输入的查询词在系列相关索引表中进行检索,得到与所述查询词匹配的系列相关资源组;其中,所述系列相关索引表中记录有系列相关资源组与系列关键词之间的映射关系,所述系列相关资源组包括内容相互关联的多个资源;及
结果返回模块,用于将所述系列相关资源组中的资源返回给用户。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:用于建立系列相关索引表的索引表建立模块;
所述索引表建立模块包括:
提取子模块,用于提取资源库中资源对应的文本特征信息和数字特征信息;
聚合子模块,用于依据文本特征信息对具有数字特征信息的资源进行聚合,以得到系列相关资源组;
生成子模块,用于生成所述系列相关资源组的系列关键词;
建立子模块,用于依据所述系列关键词以及对应的系列相关资源组建立系列相关索引表。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
优化模块,用于依据用户对所述系列相关资源组中各资源的历史点击记录,从所述系列相关资源组中删除不满足预置点击条件的资源。
9.如权利要求7所述的装置,其特征在于,所述装置还包括:
排序模块,用于将聚合后的系列相关资源组中的资源依据所述数字特征信息进行排序。
10.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二检索模块,用于依据用户输入的查询词,检索得到与所述查询词对应的目标资源和系列相关资源组;
判断模块,用于判断所述目标资源在所述系列相关资源组中是否存在,若不存在,则将所述系列相关资源组和所述目标资源返回给用户;
更新模块,用于将所述目标资源添加到所述系列相关资源组中并更新所述系列相关索引表。
CN201510728103.4A 2015-10-30 2015-10-30 一种资源的搜索方法和装置 Pending CN105354283A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510728103.4A CN105354283A (zh) 2015-10-30 2015-10-30 一种资源的搜索方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510728103.4A CN105354283A (zh) 2015-10-30 2015-10-30 一种资源的搜索方法和装置

Publications (1)

Publication Number Publication Date
CN105354283A true CN105354283A (zh) 2016-02-24

Family

ID=55330255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510728103.4A Pending CN105354283A (zh) 2015-10-30 2015-10-30 一种资源的搜索方法和装置

Country Status (1)

Country Link
CN (1) CN105354283A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545069A (zh) * 2017-09-20 2018-01-05 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN107844497A (zh) * 2016-09-20 2018-03-27 天脉聚源(北京)科技有限公司 一种数据库检索的方法和***
CN108073675A (zh) * 2016-11-18 2018-05-25 谷歌有限责任公司 自主地提供事后包括在会话助理上下文中的搜索结果
CN113609315A (zh) * 2021-05-19 2021-11-05 湖南快乐阳光互动娱乐传媒有限公司 一种媒资相似度的判定方法、装置、电子设备和存储介质
CN114860865A (zh) * 2022-05-05 2022-08-05 北京达佳互联信息技术有限公司 索引构建及资源召回方法、装置、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103559286A (zh) * 2013-11-08 2014-02-05 北京奇虎科技有限公司 视频搜索结果的处理方法及装置
CN103678560A (zh) * 2013-12-06 2014-03-26 乐视网信息技术(北京)股份有限公司 多媒体资源纠错检索方法、多媒体资源服务器及***
WO2014146265A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Method and apparatus for personalized resource recommendations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014146265A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Method and apparatus for personalized resource recommendations
CN103559286A (zh) * 2013-11-08 2014-02-05 北京奇虎科技有限公司 视频搜索结果的处理方法及装置
CN103678560A (zh) * 2013-12-06 2014-03-26 乐视网信息技术(北京)股份有限公司 多媒体资源纠错检索方法、多媒体资源服务器及***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844497A (zh) * 2016-09-20 2018-03-27 天脉聚源(北京)科技有限公司 一种数据库检索的方法和***
CN108073675A (zh) * 2016-11-18 2018-05-25 谷歌有限责任公司 自主地提供事后包括在会话助理上下文中的搜索结果
CN108073675B (zh) * 2016-11-18 2022-02-01 谷歌有限责任公司 自主地提供事后包括在会话助理上下文中的搜索结果
US11238116B2 (en) 2016-11-18 2022-02-01 Google Llc Autonomously providing search results post-facto, including in assistant context
US11971935B2 (en) 2016-11-18 2024-04-30 Google Llc Autonomously providing search results post-facto, including in assistant context
CN107545069A (zh) * 2017-09-20 2018-01-05 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN107545069B (zh) * 2017-09-20 2021-07-20 广州炫锐信息科技有限公司 一种查询多种资源的方法及装置
CN113609315A (zh) * 2021-05-19 2021-11-05 湖南快乐阳光互动娱乐传媒有限公司 一种媒资相似度的判定方法、装置、电子设备和存储介质
CN114860865A (zh) * 2022-05-05 2022-08-05 北京达佳互联信息技术有限公司 索引构建及资源召回方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US9645787B1 (en) Tag-based electronic media playlist processing
US9805022B2 (en) Generation of topic-based language models for an app search engine
CN105354283A (zh) 一种资源的搜索方法和装置
US20100082653A1 (en) Event media search
CN107729399B (zh) 数据处理的方法和装置
CN106294573A (zh) 一种海量数据实时查询方法及***
WO2017096892A1 (zh) 索引构建方法、查询方法及对应装置、设备、计算机存储介质
CN102368262A (zh) 一种提供与查询序列相对应的搜索建议的方法与设备
CN111966677B (zh) 数据报表的处理方法、装置、电子设备及存储介质
JP2015204105A (ja) 推薦情報を提供するための方法および装置
CN104077415A (zh) 搜索方法及装置
US20150081690A1 (en) Network sourced enrichment and categorization of media content
CN105574054A (zh) 一种分布式缓存范围查询方法、装置及***
CN104965903A (zh) 一种资源的推荐方法和装置
CN104636349A (zh) 一种索引数据压缩以及索引数据搜索的方法和设备
CN111666468A (zh) 一种基于团簇属性在社交网络中搜索个性化影响力社区的方法
CN103870557A (zh) 基于数据库的电子档案存储***
CN108255963A (zh) 一种基于互联网的新闻信息检索的控制方法及装置
CN111178965B (zh) 一种资源投放方法及服务器
CN104331434A (zh) 一种生成搜索提示词服务的方法及其装置
CN105184550A (zh) 管理排期数据的方法、服务器及***
CN110399337B (zh) 基于数据驱动的文件自动化服务方法和***
CN106547843B (zh) 多级分类查询方法和装置
CN116414854A (zh) 数据资产查询方法、装置、计算机设备和存储介质
CN111897837A (zh) 数据查询方法、装置、设备和介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160224