CN104636368B - 数据检索方法、装置及服务器 - Google Patents

数据检索方法、装置及服务器 Download PDF

Info

Publication number
CN104636368B
CN104636368B CN201310557261.9A CN201310557261A CN104636368B CN 104636368 B CN104636368 B CN 104636368B CN 201310557261 A CN201310557261 A CN 201310557261A CN 104636368 B CN104636368 B CN 104636368B
Authority
CN
China
Prior art keywords
mark
user
retrieval
data object
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310557261.9A
Other languages
English (en)
Other versions
CN104636368A (zh
Inventor
朱健琛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310557261.9A priority Critical patent/CN104636368B/zh
Publication of CN104636368A publication Critical patent/CN104636368A/zh
Application granted granted Critical
Publication of CN104636368B publication Critical patent/CN104636368B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据检索方法、装置及服务器,属于数据检索领域。所述方法包括:根据检索用户的标识确定关系用户的标识;通过该关系用户的标识查询该关系用户对应的数据对象的标识;根据查询到的该关系用户对应的数据对象的标识检索目标对象;将该目标对象输出为检索结果。本发明通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的。

Description

数据检索方法、装置及服务器
技术领域
本发明涉及数据检索领域,特别涉及一种数据检索方法、装置及服务器。
背景技术
随着互联网应用的不断发展,网络社区,比如博客或者论坛,逐渐成为很多人日常生活中的重要组成部分。在使用网络社区的过程中,用户常常需要检索包含有特定内容的数据对象,比如检索包含有关键词的日志。
现有的数据检索方法中,服务器预先获取网络社区中各个数据对象,对各个数据对象建立倒排索引,该倒排索引中包含有各个关键词与包含有各个关键词的数据对象之间的对应关系;服务器接收到用户发送的检索请求时,根据检索请求中携带的关键词从倒排索引中直接检索包含有该关键词的所有数据对象并输出检索结果。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有的数据检索方法中,服务器直接检索包含有该关键词的所有数据对象,当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源,影响***性能。
发明内容
为了解决现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,本发明实施例提供了一种数据检索方法、装置及服务器。所述技术方案如下:
一方面,提供了一种数据检索方法,所述方法包括:
接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
通过所述关系用户的标识以及第一对应关系查询所述关系用户对应的数据对象的标识,所述第一对应关系中包含有各个用户的标识与所述各个用户对应的数据对象的标识之间的对应关系,其中,所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为固定长度的数值;
检索包含有所述关键词的数据对象的标识;
将所述关系用户对应的数据对象的标识和包含有所述关键词的数据对象的标识的交集获取为目标对象的标识,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
将所述目标对象输出为检索结果。
另一方面,提供了一种数据检索装置,所述装置包括:
请求接收模块,用于接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
标识确定模块,用于根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
查询模块,用于通过所述关系用户的标识以及第一对应关系查询所述关系用户对应的数据对象的标识,所述第一对应关系中包含有各个用户的标识与所述各个用户对应的数据对象的标识之间的对应关系,其中,所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为固定长度的数值;
检索模块,用于检索包含有所述关键词的数据对象的标识,将所述关系用户对应的数据对象的标识和包含有所述关键词的数据对象的标识的交集获取为目标对象的标识,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
输出模块,用于将所述检索模块检索出的目标对象输出为检索结果。
再一方面,提供了一种服务器,所述服务器包括:
如上述方面所述的数据检索装置。
还一方面,提供了一种计算机可读存储介质,其上存储有程序,所述程序由处理器执行以实现上述数据检索方法。
本发明实施例提供的技术方案带来的有益效果是:
通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例提供的数据检索方法的方法流程图;
图2是本发明另一实施例提供的数据检索方法的方法流程图;
图3是本发明另一实施例提供的第一对应关系的存储示意图;
图4是本发明一个实施例提供的数据检索装置的装置结构图;
图5是本发明另一实施例提供的数据检索装置的装置结构图;
图6是本发明一个实施例提供的服务器的设备构成图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参见图1,其示出了本发明一个实施例提供的数据检索方法的方法流程图,该数据检索方法可以用于在社区网络中检索包含有指定关键词,且与检索用户具有特定类型关系的用户对应的数据对象。该数据检索方法可以包括:
步骤101,接收检索用户发送的检索请求,该检索请求中包含有关键词和该检索用户的标识;
步骤102,根据该检索用户的标识确定关系用户的标识,该关系用户为与该检索用户具有特定类型关系的用户;
步骤103,通过该关系用户的标识查询该关系用户对应的数据对象的标识;
步骤104,根据查询到的该关系用户对应的数据对象的标识检索目标对象,该目标对象为该关系用户对应的数据对象中与该关键词相匹配的数据对象;
步骤105,将该目标对象输出为检索结果。
综上所述,本发明实施例提供的数据检索方法,通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的。
请参见图2,其示出了本发明另一实施例提供的数据检索方法的方法流程图,该数据检索方法可以用于在社区网络中检索包含有指定关键词,且与检索用户具有特定类型关系的用户对应的数据对象。该数据检索方法可以包括:
步骤201,接收检索用户发送的检索请求,该检索请求中包含有关键词和检索用户的标识;
当检索用户个人电脑、智能手机或者平板电脑等个人终端中浏览社区网络且发起检索时,终端向服务器发送检索请求,该检索请求中包含有检索用户在搜索框内输入的关键词,此外,该检索请求中还包含有该检索用户的标识。
步骤202,根据检索用户的标识确定关系用户的标识;
其中,该关系用户为与该检索用户具有特定类型关系的用户,服务器可以预先存储用于表征各个用户之间的关系类型的关系链。该特定类型关系可以是好友关系、同学关系、同事关系、校友关系等。
该关系链中可以包含有该检索用户的标识与该关系用户的标识之间的对应关系;服务器可以根据该检索用户的标识和该检索用户的标识与该关系用户的标识之间的对应关系确定该关系用户的标识。
该关系链可以由与各个用户的标识对应的用户标识列表组成。以该特定类型关系包括好友关系为例,服务器预先遍历网络社区中各个用户之间的关系,并分别为各个用户建立对应的好友列表,好友列表中包含有具有好友关系的用户的标识;服务器将各个用户的标识与各个用户对应的好友列表对应存储为关系链。比如,用户A的好友包括用户B、用户C、用户D和用户E,则关系链中存储有用户A的标识与包含有用户B、用户C、用户D和用户E的标识列表之间的对应关系。当用户A发起检索时,服务器可以根据检索请求中包含的用户A的标识从关系链中查询出用户B、用户C、用户D和用户E的标识。
步骤203,通过关系用户的标识查询关系用户对应的数据对象的标识;
其中,在查询关系用户对应的数据对象之前,服务器可以获取各个数据对象的标识以及各个数据对象各自对应的用户的标识,根据各个数据对象各自对应的用户的标识对各个数据对象的标识进行聚类,以建立第一对应关系并存储;该第一对应关系中包含有各个用户的标识与各个用户对应的数据对象的标识之间的对应关系。服务器可以通过关系用户的标识以及该第一对应关系查询关系用户对应的数据对象的标识。
为了提高存储效率和查询效率,服务器可以结合哈希表和/或冲突列表的形式存储第一对应关系,具体的,服务器存储第一对应关系之前,可以通过哈希函数将第一对应关系中各个用户对应的数据对象的标识压缩为固定长度的数值,存储第一对应关系时,将该第一对应关系中包含的各个用户的标识分为至少两个用户标识组,各个用户标识组对应有各自的存储地址,在该用户标识组对应的存储地址中对应存储该用户标识组包含的用户的标识以及与该用户标识组包含的用户的标识对应的数据对象的标识。服务器时通过关系用户的标识以及该第一对应关系查询关系用户对应的数据对象的标识,可以确定关系用户的标识对应的用户标识组,并在确定的用户标识组对应的存储地址中查询关系用户对应的数据对象的标识。
比如,第一对应关系的存储方法可以如图3所示,其中,假设网络社区中的注册用户总数为10000,各个用户的标识为由1~10000依次递增的用户ID(IDentity,身份标识号码),数据对象为各个用户在网络社区中发表的文档,数据对象的标识为文档的ID,图3第一列中的各个元素分别存储有对应ID区间内的各个用户ID对应的存储地址,该存储地址中存储有用户的ID和该用户在网络社区中发表的文档的ID,且各个文档的ID以哈希方式进行压缩存储,将不同长度的文档ID转换为相同长度的值,从而提高存储效率。假设服务器根据检索请求中包含的用户A的ID从关系链中查询出用户B、用户C、用户D和用户E的ID后,首选确定用户B、用户C、用户D和用户E的ID所处的ID区间,再从对应ID区间中分别查询用户B、用户C、用户D和用户E在网络社区中发表的文档的ID,无需对各个用户进行全局检索,大大提高检索效率。
步骤204,根据查询到的关系用户对应的数据对象的标识检索目标对象;
其中,该目标对象为关系用户对应的数据对象中与该关键词相匹配的数据对象;服务器可以检索包含有该关键词的数据对象的标识,并将该关系用户对应的数据对象的标识和包含有该关键词的数据对象的标识的交集获取为该目标对象的标识。
具体的,服务器可以预先对网络社区中各个数据对象建立倒排列表,该倒排列表中包括各个关键词与包含有各个关键词的数据对象的标识之间的对应关系,服务器根据该关键词和该倒排列表检索包含有该关键词的数据对象的标识。
进一步的,服务器对步骤203中查询出的关系用户对应的数据对象的标识和包含该关键词的数据对象的标识进行求交运算,求取关系用户对应的数据对象的标识和包含该关键词的数据对象的标识的交集,求交运算的结果即为目标对象的标识。
比如,服务器可以将步骤203中查询到的用户B、用户C、用户D和用户E在网络社区中发表的文档的ID获取为第一标识集,并将根据倒排索引查询出的包含有关键词的文档的ID获取为第二标识集,对第一标识集和第二标识集求交集,并将求得的交集中的文档ID获取为目标文档的ID。
步骤205,获取该目标对象的权限信息,根据该目标对象的权限信息检测该检索用户是否具有查看该目标对象的权限;
以数据对象为各个用户在网络社区中发表的文档为例,用户可以对发表文档设定查看权限,服务器可以获取目标文档的权限信息,并根据获取到的权限检测检索用户是否具有查看对应的目标文档的权限。
步骤206,若检测结果为该检索用户具有查看该目标对象的权限,则将该目标对象输出为检索结果。
比如,以数据对象为各个用户在网络社区中发表的文档为例,用户可以将发表的文档设置为允许好友查看、允许所有人查看或者只允许自己查看。服务器可以确定检索用户对权限设置为允许好友查看以及允许所有人查看的文档具有查看权限,并将对应的文档输出为检索结果。
在本发明实施例所示的方法中,服务器预先建立用于查找关系用户的关系链和用于查找关系用户对应的数据对象的标识的第一对应关系,以用户标识为用户的ID为例,服务器只需要根据检索用户的ID从关系链中查找关系用户的ID,并根据关系用户的ID从第一对应关系中查找关系用户对应的数据对象的标识,再根据关系用户对应的数据对象的标识以及关键词检索目标对象的标识。在网络社区中,用户标识可以有多种,比如用户ID、用户名或者用户昵称等,当***需要扩展基于其它类型的用户标识进行检索的功能,比如需要扩展基于用户名进行检索的功能时,只需要另外建立一套对应的关系链和第一对应关系,***可扩展性强。
此外,本发明实施例所示的方法中,服务器先通过关系链查找关系用户的标识,再根据关系用户的标识和第一对应关系查找关系用户的文档的ID,最后再根据关系用户的文档的ID以及倒排索引检索关系用户发表的、包含有关键词的文档,其中关系链、第一对应关系以及倒排索引三者之间相互独立,提高了检索***的灵活性,能够有效避免检索过程中的热点问题。
综上所述,本发明实施例提供的数据检索方法,通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的;其次,本发明实施例提供的数据检索方法,通过结合哈希表和冲突列表的形式存储第一对应关系,能够提高存储效率和查询效率;另外,本发明实施例提供的数据检索方法,当***需要扩展基于其它类型的用户标识进行检索的功能时,只需要另外建立一套对应的关系链和第一对应关系,***可扩展性强;最后,本发明实施例提供的数据检索方法,关系链、第一对应关系以及倒排索引三者之间相互独立,提高了检索***的灵活性,能够有效避免检索过程中的热点问题。
请参见图4,其示出了本发明一个实施例提供的数据检索装置的装置结构图,该数据检索装置可以实现为网络社区服务器的一部分,用于在社区网络中检索包含有指定关键词,且与检索用户具有特定类型关系的用户对应的数据对象。该数据检索装置可以包括:
请求接收模块301,用于接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
标识确定模块302,用于根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
查询模块303,用于通过所述标识确定模块302确定的关系用户的标识查询所述关系用户对应的数据对象的标识;
检索模块304,用于根据所述查询模块303查询到的所述关系用户对应的数据对象的标识检索目标对象,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
输出模块305,用于将所述检索模块304检索出的目标对象输出为检索结果。
综上所述,本发明实施例提供的数据检索装置,通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的。
请参见图5,其示出了本发明另一实施例提供的数据检索装置的装置结构图,该数据检索装置可以实现为网络社区服务器的一部分,用于在社区网络中检索包含有指定关键词,且与检索用户具有特定类型关系的用户对应的数据对象。该数据检索装置可以包括:
请求接收模块401,用于接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
标识确定模块402,用于根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
查询模块403,用于通过所述标识确定模块402确定的关系用户的标识查询所述关系用户对应的数据对象的标识;
检索模块404,用于根据所述查询模块403查询到的所述关系用户对应的数据对象的标识检索目标对象,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
输出模块405,用于将所述检索模块404检索出的目标对象输出为检索结果。
所述装置还包括:
第一获取模块406,用于在所述查询模块403通过所述标识确定模块402确定的关系用户的标识查询所述关系用户对应的数据对象的标识之前,获取各个数据对象的标识以及所述各个数据对象各自对应的用户的标识;
聚类模块407,用于按照所述第一获取模块406获取到的各个数据对象各自对应的用户的标识对所述各个数据对象的标识进行聚类,以建立第一对应关系,所述第一对应关系中包含有各个用户的标识与所述各个用户对应的数据对象的标识之间的对应关系;
存储模块408,用于存储所述第一对应关系;
所述查询模块403,用于通过所述关系用户的标识以及所述第一对应关系查询所述关系用户对应的数据对象的标识。
所述装置还包括:
压缩模块409,用于在所述存储模块408存储所述第一对应关系之前,通过哈希函数将所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为固定长度的数值。
所述存储模块408,包括:
分组单元408a,用于将所述第一对应关系中包含的各个用户的标识分为至少两个用户标识组,所述用户标识组对应有各自的存储地址;
存储单元408b,用于在所述用户标识组对应的存储地址中对应存储所述用户标识组包含的用户的标识以及与所述用户标识组包含的用户的标识对应的数据对象的标识;
所述查询模块403,包括:
确定单元403a,用于确定所述关系用户的标识对应的用户标识组;
查询单元403b,用于在所述确定单元403a确定的用户标识组对应的存储地址中查询所述关系用户对应的数据对象的标识。
所述检索模块404,包括:
检索单元404a,用于检索包含有所述关键词的数据对象的标识;
获取单元404b,用于将所述关系用户对应的数据对象的标识和包含有所述关键词的数据对象的标识的交集获取为所述目标对象的标识。
所述装置还包括:
第二获取模块410,用于在所述检索单元404a检索包含有所述关键词的数据对象的标识之前,获取各个数据对象的标识和所述各个数据对象包含的各个关键词;
列表建立模块411,用于建立倒排列表,所述倒排列表中包含有所述各个关键词与包含有所述各个关键词的数据对象的标识之间的对应关系;
所述检索单元404a,用于根据所述关键词和所述倒排列表检索包含有所述关键词的数据对象的标识。
所述装置还包括:
第三获取模块412,用于在所述输出模块405将所述检索模块检索出的目标对象输出为检索结果之前,获取所述目标对象的权限信息;
检测模块413,用于根据所述目标对象的权限信息检测所述检索用户是否具有查看所述目标对象的权限;
所述输出模块405,用于若所述检测模块413的检测结果为所述检索用户具有查看所述目标对象的权限,则执行所述将所述目标对象输出为检索结果的步骤。
综上所述,本发明实施例提供的数据检索装置,通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的;其次,本发明实施例提供的数据检索装置,通过结合哈希表和冲突列表的形式存储第一对应关系,能够提高存储效率和查询效率;另外,本发明实施例提供的数据检索装置,当***需要扩展基于其它类型的用户标识进行检索的功能时,只需要另外建立一套对应的关系链和第一对应关系,***可扩展性强。
请参见图6,其示出了本发明一个实施例提供的服务器的设备构成图,该服务器可以用于在社区网络中检索包含有指定关键词,且与检索用户具有特定类型关系的用户对应的数据对象。该服务器可以包括:
如上述图4或图5所示的数据检索装置500。
综上所述,本发明实施例提供的服务器,通过确定与检索用户具有特定类型关系的关系用户的标识,查询该关系用户对应的数据对象的标识,根据查询到的该关系用户对应的数据对象的标识检索目标对象,解决了现有技术中当网络社区中包含该关键词的数据对象数量较多时,服务器输出检索结果时需要消耗大量的处理资源和带宽资源的问题,达到提高***性能的目的;其次,本发明实施例提供的服务器,通过结合哈希表和冲突列表的形式存储第一对应关系,能够提高存储效率和查询效率;另外,本发明实施例提供的服务器,当***需要扩展基于其它类型的用户标识进行检索的功能时,只需要另外建立一套对应的关系链和第一对应关系,***可扩展性强。
需要说明的是:上述实施例提供的数据检索装置在检索数据对象时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的数据检索装置与数据检索方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种数据检索方法,其特征在于,所述方法包括:
接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
通过所述关系用户的标识以及第一对应关系查询所述关系用户对应的数据对象的标识,所述第一对应关系中包含有各个用户的标识与所述各个用户对应的数据对象的标识之间的对应关系,其中,所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为固定长度的数值;
检索包含有所述关键词的数据对象的标识;
将所述关系用户对应的数据对象的标识和包含有所述关键词的数据对象的标识的交集获取为目标对象的标识,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
将所述目标对象输出为检索结果。
2.根据权利要求1所述的方法,其特征在于,所述通过所述关系用户的标识以及第一对应关系查询所述关系用户对应的数据对象的标识之前,所述方法还包括:
获取各个数据对象的标识以及所述各个数据对象各自对应的用户的标识;
按照所述各个数据对象各自对应的用户的标识对所述各个数据对象的标识进行聚类,以建立所述第一对应关系;
存储所述第一对应关系。
3.根据权利要求2所述的方法,其特征在于,所述存储所述第一对应关系之前,所述方法还包括:
通过哈希函数将所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为所述固定长度的数值。
4.根据权利要求2所述的方法,其特征在于,所述存储所述第一对应关系,包括:
将所述第一对应关系中包含的各个用户的标识分为至少两个用户标识组,所述用户标识组对应有各自的存储地址;
在所述用户标识组对应的存储地址中对应存储所述用户标识组包含的用户的标识以及与所述用户标识组包含的用户的标识对应的数据对象的标识;
所述通过所述关系用户的标识以及所述第一对应关系查询所述关系用户对应的数据对象的标识,包括:
确定所述关系用户的标识对应的用户标识组;
在确定的用户标识组对应的存储地址中查询所述关系用户对应的数据对象的标识。
5.根据权利要求1所述的方法,其特征在于,所述检索包含有所述关键词的数据对象的标识之前,所述方法还包括:
获取各个数据对象的标识和所述各个数据对象包含的各个关键词;
建立倒排列表,所述倒排列表中包括所述各个关键词与包含有所述各个关键词的数据对象的标识之间的对应关系;
所述检索包含有所述关键词的数据对象的标识,包括:
根据所述关键词和所述倒排列表检索包含有所述关键词的数据对象的标识。
6.根据权利要求1至5任一所述的方法,其特征在于,所述将所述目标对象输出为检索结果之前,所述方法还包括:
获取所述目标对象的权限信息;
根据所述目标对象的权限信息检测所述检索用户是否具有查看所述目标对象的权限;
若检测结果为所述检索用户具有查看所述目标对象的权限,则执行所述将所述目标对象输出为检索结果的步骤。
7.一种数据检索装置,其特征在于,所述装置包括:
请求接收模块,用于接收检索用户发送的检索请求,所述检索请求中包含有关键词和所述检索用户的标识;
标识确定模块,用于根据所述检索用户的标识确定关系用户的标识,所述关系用户为与所述检索用户具有特定类型关系的用户;
查询模块,用于通过所述关系用户的标识以及第一对应关系查询所述关系用户对应的数据对象的标识,所述第一对应关系中包含有各个用户的标识与所述各个用户对应的数据对象的标识之间的对应关系,其中,所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为固定长度的数值;
检索模块,用于检索包含有所述关键词的数据对象的标识,将所述关系用户对应的数据对象的标识和包含有所述关键词的数据对象的标识的交集获取为目标对象的标识,所述目标对象为所述关系用户对应的数据对象中与所述关键词相匹配的数据对象;
输出模块,用于将所述检索模块检索出的目标对象输出为检索结果。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一获取模块,用于在所述查询模块通过所述标识确定模块确定的关系用户的标识查询所述关系用户对应的数据对象的标识之前,获取各个数据对象的标识以及所述各个数据对象各自对应的用户的标识;
聚类模块,用于按照所述第一获取模块获取到的各个数据对象各自对应的用户的标识对所述各个数据对象的标识进行聚类,以建立所述第一对应关系;
存储模块,用于存储所述第一对应关系。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
压缩模块,用于在所述存储模块存储所述第一对应关系之前,通过哈希函数将所述第一对应关系中,所述各个用户对应的数据对象的标识压缩为所述固定长度的数值。
10.根据权利要求8所述的装置,其特征在于,所述存储模块,包括:
分组单元,用于将所述第一对应关系中包含的各个用户的标识分为至少两个用户标识组,所述用户标识组对应有各自的存储地址;
存储单元,用于在所述用户标识组对应的存储地址中对应存储所述用户标识组包含的用户的标识以及与所述用户标识组包含的用户的标识对应的数据对象的标识;
所述查询模块,包括:
确定单元,用于确定所述关系用户的标识对应的用户标识组;
查询单元,用于在所述确定单元确定的用户标识组对应的存储地址中查询所述关系用户对应的数据对象的标识。
11.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于在所述检索模块检索包含有所述关键词的数据对象的标识之前,获取各个数据对象的标识和所述各个数据对象包含的各个关键词;
列表建立模块,用于建立倒排列表,所述倒排列表中包含有所述各个关键词与包含有所述各个关键词的数据对象的标识之间的对应关系;
所述检索模块,用于根据所述关键词和所述倒排列表检索包含有所述关键词的数据对象的标识。
12.根据权利要求7至11任一所述的装置,其特征在于,所述装置还包括:
第三获取模块,用于在所述输出模块将所述检索模块检索出的目标对象输出为检索结果之前,获取所述目标对象的权限信息;
检测模块,用于根据所述目标对象的权限信息检测所述检索用户是否具有查看所述目标对象的权限;
所述输出模块,用于若所述检测模块的检测结果为所述检索用户具有查看所述目标对象的权限,则执行所述将所述目标对象输出为检索结果的步骤。
13.一种服务器,其特征在于,所述服务器包括:
如上述权利要求7至12任一所述的数据检索装置。
14.一种计算机可读存储介质,其上存储有程序,其特征在于,所述程序由处理器执行以实现如权利要求1-6任一项所述的数据检索方法。
CN201310557261.9A 2013-11-11 2013-11-11 数据检索方法、装置及服务器 Active CN104636368B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310557261.9A CN104636368B (zh) 2013-11-11 2013-11-11 数据检索方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310557261.9A CN104636368B (zh) 2013-11-11 2013-11-11 数据检索方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN104636368A CN104636368A (zh) 2015-05-20
CN104636368B true CN104636368B (zh) 2019-06-04

Family

ID=53215138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310557261.9A Active CN104636368B (zh) 2013-11-11 2013-11-11 数据检索方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN104636368B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105871686A (zh) * 2016-03-22 2016-08-17 青岛海信移动通信技术股份有限公司 一种融合通信中的消息接收方法和智能终端
CN107172178B (zh) * 2017-06-05 2019-03-26 腾讯科技(深圳)有限公司 一种内容发送方法及装置
CN109344342B (zh) * 2018-12-17 2021-04-09 北京百度网讯科技有限公司 地图数据检索方法、装置、检索服务器及***
CN110413570A (zh) * 2019-06-25 2019-11-05 大唐软件技术股份有限公司 一种文档索引和检索方法及其装置
CN110399374A (zh) * 2019-07-05 2019-11-01 东软集团股份有限公司 数据检索方法、装置、存储介质及电子设备
CN116827682B (zh) * 2023-08-23 2023-11-24 腾讯科技(深圳)有限公司 数据处理方法、装置及计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102402589A (zh) * 2011-10-26 2012-04-04 北京百度网讯科技有限公司 一种提供与搜索请求相关的参考搜索信息的方法与设备
CN102915306A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种搜索方法和***
CN102955778A (zh) * 2011-08-18 2013-03-06 腾讯科技(深圳)有限公司 一种网络社区数据的快速查找方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915306A (zh) * 2011-08-02 2013-02-06 腾讯科技(深圳)有限公司 一种搜索方法和***
CN102955778A (zh) * 2011-08-18 2013-03-06 腾讯科技(深圳)有限公司 一种网络社区数据的快速查找方法及***
CN102402589A (zh) * 2011-10-26 2012-04-04 北京百度网讯科技有限公司 一种提供与搜索请求相关的参考搜索信息的方法与设备

Also Published As

Publication number Publication date
CN104636368A (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN104636368B (zh) 数据检索方法、装置及服务器
CN104598631B (zh) 分布式数据处理平台
CN102761627B (zh) 基于终端访问统计的云网址推荐方法及***及相关设备
CN108574742B (zh) 域名信息收集方法及域名信息收集装置
CN102833262B (zh) 基于whois信息的钓鱼网站收集、鉴定方法和***
US7844593B2 (en) Method and system for network search
GB2555801A (en) Identifying fraudulent and malicious websites, domain and subdomain names
CN105224636A (zh) 一种数据访问方法和装置
US11232166B2 (en) Networked page access and addressing based on partial categorization indexing
CN108154024B (zh) 一种数据检索方法、装置及电子设备
CN111026709B (zh) 基于集群访问的数据处理方法及装置
CN102622402B (zh) 使用页面集而提供信息搜索服务的服务器、方法和***
CN108243207B (zh) 一种网络云盘的数据存储方法
CN109947759A (zh) 一种数据索引建立方法、索引检索方法及装置
CN104424316B (zh) 一种数据存储方法、数据查询方法、相关装置和***
CN110198227B (zh) 日志文件的处理方法、装置、存储介质及电子装置
CN105653717B (zh) 一种信息分享的方法及装置
CN110708309A (zh) 反爬虫***及方法
CN102378407A (zh) 一种物联网中的对象名字解析***及其解析方法
CN108804502A (zh) 大数据查询***、方法、计算机设备及存储介质
US20160321345A1 (en) Chain understanding in search
CN107220262B (zh) 信息处理方法和装置
CN109302406B (zh) 一种分布式网页取证的方法及***
CN104636384B (zh) 一种处理文档的方法及装置
US20150278372A1 (en) Search Engine and Network for Enhancing Search of Information Over a Data Network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant