WO2017181986A1

WO2017181986A1 - 数据检索方法及***

Info

Publication number: WO2017181986A1
Application number: PCT/CN2017/081357
Authority: WO
Inventors: 黄斌; 罗勋; 朱健琛; 罗敏; 汤善敏; 刘永升
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2016-04-22
Filing date: 2017-04-21
Publication date: 2017-10-26
Also published as: US10984059B2; US20180232452A1; CN107305570B; CN107305570A

Abstract

本申请公开了数据检索方法及***，应用于信息处理技术领域。在本实施例的方法中，接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；如果链接标识与用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识；根据所述消息标识显示对应文章的用户分享信息，其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。本实施例中的方法可以不用执行求交操作，而是可以直接查找得到最终结果，相对于现有技术中的求交操作，数据检索的计算量较少。

Description

数据检索方法及***

本申请要求于2016年4月22日提交中国专利局、申请号为201610257637.8、发明名称为“一种数据检索方法及***”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息处理技术领域，特别涉及一种数据检索方法及***。

背景技术

现有的社交网络***(比如微信***、即时通信***等)都具有关系链的检索功能，具体地，社交网络***可以根据用户输入的关键字检索某一个链接的文章被该用户好友的分享情况，并将分享情况展示给用户。

现有的社交网络***一般采用优质网页数据对象(Good Object，简称GOB)检索***实现上述检索功能，具体地，社交网络***以项(Term)到消息标识的倒排数据结构储存用户与分享的文章之间的关系，这样社交网络***在检索用户分享文章的信息时，会将用户标识和链接标识作为项，分别查找得到用户标识和链接标识对应的消息标识的第一列表和第二列表，然后对第一列表和第二列表进行求交操作得到链接标识、用户标识和消息标识的对应关系。由于要对第一列表和第二列表进行求交操作，如果两个列表的项比较多，则数据检索的计算量就比较大。

发明内容

本申请提供一种数据检索方法及***，实现了在数据检索***储存的对应关系列表中直接查找到消息标识。

根据本申请的一方面，提供了一种数据检索方法，其特征在于，包括：接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；如果链接标识与用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识；根据所述消息标识显示对应文章的用户分享信息，其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。

根据本申请的另一方面，提供了一种数据检索***，其特征在于，包括：请求接收单元，接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；查找单元，在链接标识与用户标识相对应时，在预置的对应关系列表中，查找相应的消息标识；结果显示单元，根据所述消息标识显示对应文章的用户分享信息，其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。

根据本申请的技术方案，数据检索***中以对应关系列表储存链接标识或用户标识与消息标识的对应关系，这样数据检索***确定数据检索请求中的链接标识与用户标识相关联，则直接在对应关系列表中查找到与链接标识或用户标识对应的消息标识，从而得到用户分享文章的情况。本申请所提供的方案可以不用执行求交操作，而是可以直接查找得到最终结果，相对于现有技术中的求交操作，数据检索的计算量较少。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种数据检索方法的流程图；

图2是示例一中数据检索***储存数据的示意图；

图3是示例二中数据检索***储存数据的示意图；

图4是应用本申请实施例的数据检索方法的社交网络***的结构示意图；

图5是应用本申请实施例提供的数据检索方法的示意图；

图6是本申请实施例提供的一种数据检索***的结构示意图；

图7是本申请实施例提供的另一种数据检索***的结构示意图；

图8是本申请实施例提供的一种数据检索***的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排它的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例，提供了一种数据检索方法，主要是应用于社交网络***中比如微信***、微博***或即时通信***(比如QQ***等)等，在社交网络***中可以包括客户端和服务器，在服务器中装载数据检索***，本实施例的方法是服务器的数据检索***所执行的方法，流程图如图1所示，包括：

步骤101，接收数据检索请求，数据检索请求中包括用户标识和链接标识，这里用户标识是唯一标识某一个用户的信息，比如微信号、微博号或即时通信号等；链接标识是唯一标识某一个文章链接的信息。

可以理解，用户可以通过社交网络***中包括的客户端发起数据检索流程。具体地，用户可以在客户端显示的搜索界面选择至少一个文章链接，且可以选择该用户的用户标识，和/或，与该用户相关的至少一个用户标识，以发起数据检索请求，并在数据检索请求中添加用户选择的信息；这样服务器的数据检索***会接收到客户端发送的数据检索请求，并执行如下步骤102到104。其中，在数据检索请求中的用户标识和链接标识可以分别为一个，或分别为多个。

步骤102，判断链接标识是否与用户标识相对应，如果是，则执行步骤103，说明该用户标识对应用户通过客户端分享了该链接标识所标识链接的文章；如果不是，则结束流程。其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。

步骤103，在预置的对应关系列表中，查找相应的消息标识。

步骤104，根据消息标识显示对应文章的用户分享信息，用户分享信息具体可以包括用户的评论信息，分享该文章的用户数等信息。

需要说明的是，当某一用户通过客户端分享某一链接的文章时，本实施例的数据检索***会接收到该用户对某一链接的文章的分享请求，在分享请求中包括该某一链接的链接标识和该用户的用户标识，且还可以包括用户的评论信息；则数据检索***会将该链接的文章的信息储存成用户标识对应的一条消息，且还可以将用户的评论信息储存到该条消息中，并生成该条消息的消息标识来唯一标识该条消息。然后将该链接标识和消息标识储存到对应关系列表中，并将该链接标识与用户标识关联；或者将用户标识与消息标识存储到对应关系列表中，并将该用户标识与链接标识关联。因此，在执行本步骤102时，数据检索***可以查找数据检索***中储存的与数据检索请求中的用户标识关联的链接标识中是否包括数据检索请求中的链接标识或者查找数据检索***中存储的与请求中的链接标识关联的用户标识中是否包括请求中的用户标识，如果有，则执行步骤103。

下面分别就对应关系列表(第一对应关系列表)包括链接标识和消息标识(示例一)以及对应关系列表(第二对应关系列表)包括用户标识和消息标识(示例二)两种情况来对本申请的方法进行进一步的介绍。

示例一

本示例中，数据检索***中不仅需要储存第一对应关系列表，还需要储存与用户标识关联的链接标识的信息。在具体实现过程中：

(1)第一对应关系列表可以包括多个数据块，每个数据块包括头部和值两部分。

其中头部的结构可以如下表1所示，包括数据长度(data length)和下一数据块(next)在文件中的偏移(offset)数据，且还可以包括预留(reserve)数据，这里数据长度用于指示该数据块的长度，下一数据块在文件中的偏移数据用于指示该数据块的下一数据块的位置信息。

表1

8bytes next offset

8bytes data length

16bytes reserve

每个数据块的值的结构可以如下表2所示，包括链接标识及对应的消息标识，其中链接标识可以用文档标识(document identity，简称docid)来表示，消息标识用推特标识(Tweet identity，简称tid)来表示，该tid主要是指用户通过社交网络***的客户端发表的一条消息的标识，比如微博消息的标识，微信消息的标识。

表2

8bytes tid A

8bytes docid A

8bytes tid B

8bytes docid B

(2)本示例中，数据检索***可以通过用户标识索引查找到与用户标识关联的链接标识的信息。其中，用户标识索引的结构可以如下述表3所示，包括用户标识和关联信息在文件中的偏移数据，这里用户标识可以用用户识别号码(user identification number，简称uni)来表示，关联信息在文件中的偏移数据用于表示与该用户标识关联的链接标识的信息的位置信息。

表3

8bytes uin

8bytes offset

在该示例中，针对步骤103，在预置的第一对应关系列表中，查找检索请求中的链接标识对应的消息标识。其中，第一对应关系列表包括链接标识与消息标识的对应关系。

在一个具体的示例中，为了进一步地减少数据检索的工作量，如果上述数据检索请求中包括的用户标识有多个，则在执行步骤102之前，数据检索***可以先使用过滤器对数据检索请求中包括的多个用户标识进行过滤以滤除其中的至少一个用户标识得到剩余的用户标识，滤除掉的用户标识为未对应任何链接标识的用户标识；在这种情况下，在执行步骤102时，数据检索***会判断数据检索请求中的链接标识是否包括在剩余的用户标识对应的链接标识中。

具体地，数据检索***中储存的过滤器的数据可以包括：过滤器索引和过滤器值。

针对示例一，所述过滤器索引的结构可以如下表4所示，包括链接标识和过滤器在文件中的偏移数据，其中过滤器在文件中的偏移数据用于指示过滤器的位置信息，且一个链接标识对应一个过滤器。

表4

8bytes docid

8bytes offset

过滤器值的结构可以如下表5所示，包括多个数据块，每个数据块中包括数据长度和过滤策略数据，其中数据长度用于指示过滤策略数据的长度，过滤策略数据是指过滤用户标识的策略数据，可以由用户预置。这里过滤器可以是布隆过滤器(Bloom Filter，简称BF)。

表5

4bytes length

X bytes BF data A

4bytes length

X bytes BF data B

另外，需要说明的是，本示例中数据检索***在储存第一对应关系列表和与用户标识关联的链接标识的信息时，都是储存于该数据检索***的永久性存储器(比如磁盘)中，而过滤器的数据可以储存在暂时性存储器(比如内存)中。

可见，在应用本示例的方法中，数据检索***中以第一对应关系列表储存链接标识与消息标识的对应关系，这样数据检索***确定数据检索请求中的链接标识与用户标识相关联，则直接在第一对应关系列表中查找到与该链接标识对应的消息标识，从而得到用户分享某一链接的文章的情况。本实施例中的方法可以不用执行求交操作，而是可以直接查找得到最终结果，相对于现有技术中的求交操作，数据检索的计算量较少。

示例二

在本示例中，数据检索***中不仅需要储存第二对应关系列表，还需要储存与链接标识关联的用户标识的信息。在具体实现过程中：

(1)第二对应关系列表可以包括多个数据块，每个数据块包括头部和值两部分。

其中头部的结构可以如上述表1所示，包括数据长度和下一数据块在文件中的偏移数据，且还可以包括预留数据；每个数据块的值的结构可以如下表6所示，包括用户标识及对应的消息标识，这里用户标识可以用uin来表示，消息标识可以用tid来表示。

表6

8bytes tid A

8bytes uin A

8bytes tid B

8bytes uin B

(2)本示例中，数据检索***可以通过链接标识索引查找到与链接标识关联的用户标识的信息。其中，链接标识索引的结构可以如下述表7所示，包括链接标识和关联信息在文件中的偏移数据，这里链接标识可以用docid来表示，关联信息在文件中的偏移数据用于表示与该链接标识关联的用户标识的信息的位置信息。

表7

8bytes docid

8bytes offset

在该示例中，针对步骤103，在预置的第二对应关系列表中，查找与数据检索请求中的用户标识对应的消息标识。其中，第二对应关系列表包括用户标识与消息标识的对应关系。

根据本申请的一方面，为了进一步地减少数据检索的工作量，如果上述数据检索请求中包括的用户标识有多个，则在执行步骤102之前，数据检索***可以先使用过滤器过滤多个用户标识中的至少一个用户标识得到剩余的用户标识，滤除的用户标识为未对应任何链接标识的用户标识。例如在执行步骤102时，数据检索***可以判断剩余的用户标识是否包括在数据检索请求中的链接标识对应的用户标识中。

具体地，本示例的过滤器的结构可以如上述示例一中的表5中所述，在此不进行赘述。

另外，数据检索***中储存的标识索引的结构可以如下表8所示，包括链接标识、关联信息在文件中的偏移数据和过滤器在文件中的偏移数据，这里过滤器在文件中的偏移数据用于表示与该链接标识对应的过滤器的数据的位置信息，链接标识可以用docid来表示，而关联信息在文件中的偏移数据表示用于表示与该链接标识关联的用户标识的信息的位置信息。

表8

8bytes docid

8bytes offset

8bytes BF offset

在这种情况下，直接可以通过链接标识就可以定位到对应过滤器的位置。

另外，需要说明的是，本示例中数据检索***在储存第二对应关系列表和与链接标识关联的用户标识的信息时，都是储存于该数据检索***的永久性存储器(比如磁盘)中，而过滤器的数据可以储存在暂时性存储器(比如内存)中。

可见，在本示例二对应的方法中，数据检索***中以第二对应关系列表储存用户标识与消息标识的对应关系，这样数据检索***确定数据检索请求中的用户标识与链接标识相关联，则直接在第二对应关系列表中查找到该用户标识对应的消息标识，从而得到用户分享文章的情况。本实施例中的方法可以不用执行求交操作，而是可以直接查找得到最终结果，相对于现有技术中的求交操作，数据检索的计算量较少。

需要说明的是，示例二与上述示例一相比，数据检索***所采用的检索方法类似，都是从对应关系列表中可以直接查找到最终结果，不同的是，上述示例一中，数据检索***储存的数据结构是用户标识到链接标识与消息标识的对应关系的倒排数据结构，具体可以如图2所示，这样通过用户标识可以找到对应的消息标识。而在示例二中，数据检索***储存的数据结构是链接标识到用户标识与消息标识的对应关系的倒排数据结构，具体可以如图3所示，这样通过链接标识可以找到对应的消息标识。其中由于一个用户所分享的文章数量，相比一篇文章被分享的用户数量较小，则用户标识对应的链接标识与消息标识的数据，会比链接标识对应的用户标识与消息标识的数据少很多，一般情况下，几乎所有用户标识对应的链接标识与消息标识的数据只要一个4kb的数据块就可以存放，因此，采用示例一中的方法，数据检索***中储存的数据量要小。

作为示例，下面将参考图4以一个具体的实施例说明根据示例一的数据检索***。如图4所示，本实施例的社交网络***包括社交网络客户端和社交网络服务器，在社交网络服务器中装载数据检索***。

(1)用户通过社交网络客户端发起本实施例的数据检索流程。

具体地，用户可以在社交网络客户端显示的文章搜索界面中输入关键字并点击提交，则社交网络客户端会向文章服务器发送文章搜索请求，这样文章服务器会根据关键字搜索相关的文章信息，并将文章的链接信息发送给社交网络客户端进行显示。

这样用户可以选择一个或多个链接，且可以选择该用户的用户标识，或与该用户相关的其它用户标识，并提交，这样社交网络客户端会向社交网络服务器发送所述的数据检索请求，并由社交网络服务器中的数据检索***执行根据示例一的方法。

其中文章服务器是社交网络***所支撑的一个服务器。

(2)数据检索***接收到数据检索请求，例如在数据检索请求中包括的用户标识为uin1，链接标识为docid1。

参考图5所示，数据检索***会查找到该uin1所属的哈希(hash)桶即哈希索引，并根据哈希索引中的哈希列表偏移确定哈希列表所在的位置；然后查找到哈希列表，并根据哈希列表中uin1的关联信息的偏移确定与uin1关联的链接标识的信息的位置；再查找到与该uin1关联的信息，具体可以包括最大docid，最小docid，链接标识所在磁盘标识符(disk id)，所在文件的标识(file id)及对应关系偏移等。

如果上述docid1在最大docid与最小docid的范围内，且在与uin1关联的链接标识的信息中匹配到该docid1，则数据检索***确定docid1在uin1对应的链接标识的范围内。也即，如果链接标识docid1包括在与所述用户标识uni1对应的链接标识中，则确定所述链接标识和所述用户标识相对应。然后根据其中的对应关系偏移确定链接标识和消息标识的第一对应关系的值的位置，然后根据该位置查找到第一对应关系的值即tid+doc的值；从tid+doc的值中取出docid1对应的tid值。当然，本领域技术人员应该理解，如果用户标识uni1包括在与所述链接标识docid1对应的用户标识中，也可确定所述链接标识和所述用户标识相对应。

(3)数据检索***可以将最终得到的tid值发送给文章服务器，由文章服务器根据该tid值得到对应文章的用户分享信息，并将用户分享信息发送给社交网络客户端进行显示。

本申请还提供一种数据检索***，该***用于执行上述实施例中的方法，其结构示意图如图6所示，具体可以包括：

请求接收单元10，用于接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；在数据检索请求中的用户标识和链接标识可以分别为一个，或分别为多个。

查找单元11，用于如果确定链接标识与用户标识相对应，在预置的对应关系列表中，查找相应的消息标识。

根据本发明的另一方面，所述查找单元11可以基于如上述方法实施例中的示例一所述的表示链接标识与消息标识的对应关系的对应关系列表或者如上述方法实施例中的示例二所述的表示用户标识与消息标识的对应关系的对应关系列表来进行查找操作。例如，查找单元11如果确定请求接收单元10接收的数据检索请求中包括的链接标识在数据检索请求中包括的用户标识对应的链接标识中，则在预置的表示链接标识与消息标识的对应关系的第一对应关系列表中，查找请求中包括的链接标识对应的消息标识。再如，查找单元11如果确定请求接收单元10接收的数据检索请求中包括的用户标识在数据检索请求中的链接标识对应的用户标识的范围内，则在预置的表示用户标识与消息标识的对应关系的第二对应关系列表中，查找请求中的用户标识对应的消息标识。

结果显示单元12，用于根据所述查找单元11查找的消息标识显示对应文章的用户分享信息。

可见，在本实施例的数据检索***中以对应关系列表储存链接标识或用户标识与消息标识的对应关系，这样当查找单元11确定数据检索请求中的链接标识与用户标识相对应，则直接在对应关系列表中查找到与链接标识或用户标识对应的消息标识，从而得到用户分享文章的情况。本申请中的***可以不用执行求交操作，而是可以直接查找得到最终结果，相对于现有技术中的求交操作，数据检索的计算量较少。

参考图7所示，在一个具体的实施例中，数据检索***除了可以包括如图6所示的结构外，还可以包括过滤单元13和对应关系储存单元14，其中：

当所述请求接收单元10接收的数据检索请求中包括的用户标识有多个时，过滤单元13，用于使用过滤器在所述多个用户标识中过滤掉至少一个用户标识得到剩余的用户标识，其中滤除的用户标识为未对应任何链接标识的用户标识。这样，所述查找单元11如果确定数据检索请求中包括的链接标识在所述过滤单元13过滤得到的剩余用户标识对应的链接标识的范围内，则在预置的第一对应关系列表中，查找所述链接标识对应的消息标识，减少了数据检索的工作量。或者，查找单元11如果确定所述过滤单元13过滤得到的剩余用户标识在所述链接标识对应的用户标识的范围内，在预置的第二对应关系列表中，查找所述用户标识对应的消息标识，减少了数据检索的工作量。

对应关系储存单元14，用于接收到用户对某一链接的文章的分享请求，所述分享请求中包括所述某一链接的链接标识和所述用户的用户标识；将所述某一链接的文章的信息储存成所述用户标识对应的一条消息，并生成所述消息的消息标识，将所述链接标识与所述用户标识关联，然后将所述链接标识和消息标识储存到所述第一对应关系列表中，或者将用户标识与消息标识存储到第二对应关系列表中。其中，所述第一对应关系列表中包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括链接标识及对应的消息标识。而所述第二对应关系列表中也包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括用户标识及对应的消息标识。这样查找单元11会在对应关系储存单元14储存的第一对应关系列表或者第二关系列表中查找到对应的消息标识。

本申请还提供一种数据检索***，其结构示意图如图8所示，该数据检索***可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(例如一个或一个以***处理器(central processing units，CPU))30和存储器31，一个或一个以上存储应用程序321或数据322的存储介质32(例如一个或一个以上海量存储设备)。其中，存储器31和存储介质32可以是短暂存储或持久存储。存储在存储介质32的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括实施本申请所述的方法的一系列指令操作。更进一步地，处理器30可以设置为与存储介质32通信，在数据检索***上执行存储介质32中的一系列指令操作。

数据检索***还可以包括一个或一个以上电源33，一个或一个以上有线或无线网络接口34，一个或一个以上输入输出接口35，和/或，一个或一个以上操作***323，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述方法实施例中所述的由数据检索***所执行的步骤可以基于该图8所示的数据检索***的结构。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM)、随机存取存储器RAM)、磁盘或光盘等。

以上对本申请实施例所提供的数据检索方法及***进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种数据检索方法，其特征在于，包括：

接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；

如果链接标识与用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识；

根据所述消息标识显示对应文章的用户分享信息，

其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。
如权利要求1所述的方法，其特征在于，所述数据检索请求中包括的用户标识有多个，在如果链接标识与用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识之前，所述方法还包括：

使用过滤器在所述多个用户标识中滤除至少一个用户标识得到剩余的用户标识，滤除的用户标识为未对应任何链接标识的用户标识；

其中，所述如果链接标识与用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识的步骤包括：如果链接标识与剩余的用户标识相对应，则在预置的对应关系列表中，查找相应的消息标识。
如权利要求2所述的方法，其特征在于，

所述过滤器的数据包括：过滤器索引和过滤器值，其中，所述过滤器索引中包括链接标识和所述过滤器在文件中的偏移数据，所述过滤器值中包括多个数据块，每个数据块中包括数据长度和过滤策略数据。
如权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

接收用户对某一链接的文章的分享请求，所述分享请求中包括所述链接的链接标识和所述用户的用户标识；

将所述链接的文章的信息储存成所述用户标识对应的一条消息，并生成所述消息的消息标识，将所述链接标识和与所述用户标识关联，并将所述链接标识和消息标识储存到对应关系列表中以便于在对应关系列表中查找相应的消息标识；

其中，所述对应关系列表中包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括链接标识及对应的消息标识。
如权利要求1至3任一项所述的方法，其特征在于，所述方法还包括：

接收用户对某一链接的文章的分享请求，所述分享请求中包括所述链接的链接标识和所述用户的用户标识；

将所述链接的文章的信息储存成所述用户标识对应的一条消息，生成所述消息的消息标识，将所述链接标识和与所述用户标识关联，并将所述链接标识和消息标识储存到所述对应关系列表中，以便于在所述对应关系列表中查找相应的消息标识；

其中，所述对应关系列表包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括用户标识及对应的消息标识。
一种数据检索***，其特征在于，包括：

请求接收单元，接收数据检索请求，所述数据检索请求中包括用户标识和链接标识；

查找单元，在链接标识与用户标识相对应时，在预置的对应关系列表中，查找相应的消息标识；

结果显示单元，根据所述消息标识显示对应文章的用户分享信息，

其中，如果所述链接标识包括在与所述用户标识对应的链接标识中，或者所述用户标识包括在与所述链接标识对应的用户标识中，则确定所述链接标识和所述用户标识相对应。
如权利要求6所述的***，其特征在于，所述请求接收单元接收到的数据检索请求中包括的用户标识有多个，

所述***还包括：

过滤单元，使用过滤器在所述多个用户标识中滤除至少一个用户标识得到剩余的用户标识，滤除的用户标识为未对应任何链接标识的用户标识；

其中，所述查找单元在所述链接标识与剩余的用户标识相对应时，在预置的对应关系列表中，查找相应的消息标识。
如权利要求7所述的***，其特征在于，

所述过滤器的数据包括：过滤器索引和过滤器值，其中，所述过滤器索引中包括链接标识和所述过滤器在文件中的偏移数据，所述过滤器值中包括多个数据块，每个数据块中包括数据长度和过滤策略数据。
如权利要求6至8任一项所述的***，其特征在于，所述***还包括：

对应关系存储单元，用于：

接收用户对某一链接的文章的分享请求，所述分享请求中包括所述链接的链接标识和所述用户的用户标识；

将所述链接的文章的信息储存成所述用户标识对应的一条消息，生成所述消息的消息标识，并将所述链接标识和与所述用户标识关联；

将所述链接标识和消息标识储存到对应关系列表中，以便于在对应关系列表中查找相应的消息标识；

其中，所述对应关系列表中包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括链接标识及对应的消息标识。
如权利要求6至8任一项所述的方法，其特征在于，所述***还包括：

对应关系存储单元，用于：

接收用户对某一链接的文章的分享请求，所述分享请求中包括所述链接的链接标识和所述用户的用户标识；

将所述链接的文章的信息储存成所述用户标识对应的一条消息，生成所述消息的消息标识，并将所述链接标识和与所述用户标识关联；将所述链接标识和消息标识储存到所述对应关系列表中，以便于在所述对应关系列表中查找相应的消息标识；

其中，所述对应关系列表包括多个数据块，每个数据块包括头部和值，所述头部包括数据长度和下一数据块在文件中的偏移数据，每个数据块的值包括用户标识及对应的消息标识。