WO2014015782A1

WO2014015782A1 - 分布式文件***、文件访问方法以及客户端

Info

Publication number: WO2014015782A1
Application number: PCT/CN2013/079855
Authority: WO
Inventors: 伍海君; 朱会灿; 邓大付; 李锐; 邹永强; 董乘宇; 阙太富; 王磊; 杨绍鹏; 张书鑫; 赵大勇; 刘畅; 陈晓东; 张银锋
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2012-07-26
Filing date: 2013-07-23
Publication date: 2014-01-30
Also published as: JP2015528957A; US20150169623A1; CN103581229B; CN103581229A

Abstract

本申请实施例提供了分布式文件***、文件访问方法以及客户端。其中，该方法包括：访问主服务器Master Server存储的文件目录，并从Master Server获取与需要访问的文件相关联的元信息服务器Meta Server的路由信息；利用获取的路由信息访问Meta Server，并从该Meta Server中获取需要访问的文件的元信息，利用获取的元信息从多个节点服务器Node Server上访问需要访问的文件。

Description

分布式文件***、文件访问方法以及客户端

技术领域

本申请涉及数据存储技术，特别涉及分布式文件***、文件访问方法以及客户端。发明背景

目前，在工业界具有典型代表性的分布式文件***是 Google公司的分布式文件***，筒称 GFS ( Global File System )。该 GFS主要由一个主服务器（ Master Server )和众多块服务器（ Chunk Server )组成。其中， Master Server 主要负责存储文件目录、以及文件目录中各文件的元 ( meta )信息。这里， meta信息主要包括：文件的大小、文件被分成的数据块的数量、文件被分成的数据块所处的 Chunk Server 等。 Chunk Server主要负责存储文件被分成的数据块。通常，一个文件会按照一定大小划分为多个数据块，每一个数据块称为一个 Chunk, 这些数据块分散存储在不同的 Chunk Server。

但是，由于 GFS只有一个 Master Server提供文件目录和文件 meta 信息的查询，这会限制文件的并发访问量，并且，因单一 Master Server 的内存限制，也会限制 GFS存储的文件数目。发明内容

本申请实施例提供了分布式文件***、文件访问方法以及客户端，以提高单一集群（cluster ) 的文件数目以及文件的并发访问量。

本申请实施例提供的技术方案包括：

一种分布式文件***，包括：主服务器 Master Server, 用于存储文件目录、以及与文件目录中各文件相关联的 Meta Server的路由信息；在存储的文件目录中存在客户端需要访问的文件时，从存储的路由信息中找到与该文件相关联的 Meta Server的路由信息并提供给客户端，以使客户端利用所述 Master Server 提供的路由信息访问 Meta Server;

Meta Server , 用于存储相关联的文件的元信息， Meta Server的数量大于等于 1 ; 在接收到客户端的访问时，提供该客户端需要访问的文件的元信息给客户端，以使客户端利用所述 Meta Server提供的元信息从 Node Server访问需要访问的文件。

节点服务器 Node Server, 用于存储文件被划分成的数据块和 /或数据块的备份， Node Server的数量大于等于 1。

一种文件访问方法，包括：

访问主月良务器 Master Server存者的文件目录，并从 Master Server获取与需要访问的文件相关联的元信息服务器 Meta Server的路由信息；利用获取的路由信息访问 Meta Server, 并从该 Meta Server中获取需要访问的文件的元信息；

利用获取的元信息从多个节点服务器 Node Server上访问需要访问的文件。

一种应用于文件访问的客户端，包括：

第一访问单元，用于访问主服务器 Master Server存储的文件目录，并从 Master Server获取与本客户端需要访问的文件相关联的元信息服务器 Meta Server的路由信息；

第二访问单元，用于利用所述第一访问单元获取的路由信息访问 Meta Server,并从该 Meta Server中获取本客户端需要访问的文件的元信息；第三访问单元，用于利用获取的元信息从多个节点服务器 Node Server上访问需要访问的文件。

由以上技术方案可以看出，在本发明实施例中，文件目录和文件元信息分开存储，即，客户端只在 Master Server访问文件目录和与文件目录中各文件相关联的 Meta Server的路由信息，而去 Meta Server访问具体文件的元信息，这相比单个 Master Server既要提供文件目录访问，又要提供文件元信息的访问而言，能提供更高的每秒访问次数（QPS ), 也能提供更高的并发访问量，同时由于本发明实施例中 Master Server只存储文件目录，这能保证本发明实施例中的分布式文件***存储更多的文件。附图简要说明

图 1为本发明实施例提供的分布式文件***结构示意图；

图 2为本发明实施例提供的文件访问方法流程示意图；

图 3为本发明实施例提供的客户端结构示意图；

图 4为本发明另一实施例提供的客户端结构示意图。实施本发明的方式

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

本发明实施例提供的分布式文件***具有图 1所示的结构，其包括：一个主服务器（ Master Server )、至少一个元信息服务器（ Meta Server )、以及至少一个节点服务器（ Node Server )。其中， Meta Server以及 Node Server的数量可根据集群规模设置，本发明实施例并不具体限定。

从图 1所示的分布式***可以看出，本发明实施例提供的分布式系统采用了三层架构，其中，最上层为 Master Server, 中间层为至少一个 Meta Server, 最下层为至少一个 Node Server, 基于此，本发明实施例提供的分布式***可称为三层架构的分布式文件***。

另外，由于本发明实施例提供的分布式文件***中， Meta Server以及 Node Server的数量可根据集群规模设置，当根据需求需要扩展集群规模时，该 Meta Server以及 Node Server的数量也需要扩展，基于此，还可将本发明实施例提供的分布式***称为扩展的分布式文件***，筒称 XFS ( extensible File System )。

正常情况下，文件元信息的存储量会比文件目录的存储量大很多，为了扩展分布式文件***，本发明实施例将文件目录和文件元信息分开存储，具体为：将文件目录单独用 Master Server存储，而将文件元信息用 Meta Server存储，其中，为了将文件目录中的文件与 Meta Server存储的该文件的元信息关联起来，还需要在 Master Server中存储与文件目录中各文件相关联的 Meta Server的路由信息。

下面对图 1所示分布式文件***中各个功能单元进行描述：

Master Server , 用于存储文件目录、以及与文件目录中各文件相关联的 Meta Server的路由信息；

而每一 Meta Server, 用于存储与其相关联的文件的元信息，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server; 优选地，本发明实施例中，所述文件的元信息还可进一步包括：文件创建时间、文件创建者、文件被划分成的各个数据块的摘要信息等，本发明实施例并不具体限定。

而每一 Node Server, 用于存储数据块和 /或其它数据块的备份。其中，每一 Node Server可以仅存储同一文件被划分成的一个或多个数据块，但禁止同时存储同一文件被划分成的某一数据块和该数据块的备份。也就是说，一个数据块不能和其备份同时存储在同一 Node Server 上。

以图 1所示分布式文件***为例，则，针对 Master Server存储的文件目录中的文件（记为文件 1 ) , 如果该文件 1被划分成 5个数据块，则为了提高***的容错能力，还需要针对这 5个数据块进行备份，基于上面描述的 Node Server存储数据块及数据块的备份的特点，在本发明实施例中，可将该 5个数据块和其备份分散放在不同的 Node Server上即可。其中，文件 1如何被划分成数据块可依据现有划分方式，本发明不再赘述。

在本发明实施例中，一个数据块可存在多个备份，针对一个数据块的多个备份，为了提高***容错能力，优选地，本发明实施例并不将该多个备份同时存放在同一个 Node Server, 而是分散存放在不同的 Node Server上，即同一数据块的所有备份不存放在同一 Node Server。并且，针对同一文件被划分成的不同数据块的备份，基于容错能力的考虑，也不存放在同一个 Node Server。

基于上述 Master Server, Meta Server以及 Node Server存者的信息，则，当客户端需要访问一文件时， Master Server在存储的文件目录中存在客户端需要访问的文件时，从存储的路由信息中找到与该文件相关联的 Meta Server的路由信息并提供给客户端，以使客户端利用所述 Master Server提供的路由信息访问 Meta Server;而当 Meta Server接收到客户端的访问时，提供该客户端需要访问的文件的元信息给客户端，以使客户端利用所述 Meta Server提供的元信息访问需要访问的文件。

如此，即可完成客户端的文件访问。可以看出，客户端只在 Master Server访问文件目录和与文件目录中各文件相关联的 Meta Server的路由信息，而去 Meta Server访问具体文件的元信息，这相比单个 Master Server 既要提供文件目录访问，又要提供文件元信息的访问而言，能提供更高的每秒访问次数（QPS ), 也能提供更高的并发访问量，同时由于 Master Server仅存储文件目录，这能够扩展该 Master Server存储的文件目录，保证本发明实施例提供的分布式文件***存储更多的文件。

需要说明的是，在本发明实施例中，由于 Master Server仅存储文件目录和与文件目录中各文件相关联的 Meta Server的路由信息，并不存储文件的元信息，这相比单个 Master Server既要提供文件目录，又要提供文件元信息而言，不再因单一 Master Server的内存有限而限制集群的文件数目，而是可以灵活扩展文件数目，也可相应灵活扩展 Meta Server 和 Node Server的数量。

以根据需求需要扩展 Meta Server的数量为例，该扩展的每一 Meta Server与分布式文件***原有的 Meta Server功能类似，比如，假如当前扩展的 Meta Server记为 Server 1和 Server2, 以 Serverl为例， Server2 原理类似，贝' J ,

该 Serverl 可以存储与其相关联的文件的元信息，其中，与 Serverl 相关联的文件可为 Master Server 的文件目录中已存在的文件，以与 Serverl相关联的文件为 Master Server的文件目录中已存在的一文件（记为文件 1 ) 为例，则 Serverl存储文件 1的元信息，其中， Serverl存储文件 1的元信息，能够为已存储了文件 1的元信息的 Meta Server提供备份，以提高***容错能力。

当然，作为本发明实施例的扩展，与该 Serverl 相关联的文件也可以为 Master Server的文件目录中不存在的一文件，而是根据需求需要扩展的文件。基于此， Serverl就存储该需要扩展的文件的元信息。相应地， Master Server 还用于在文件目录中添力口与扩展的 Meta Server 比如 Serverl 相关联的文件，以及接收并存储该扩展的 Meta Server 比如 Serverl之间的路由信息。

至于本发明实施例中根据需求扩展的每一 Node Server,其与分布式文件***已有的 Node Server功能类似，用于存储文件被划分的数据块和 /或数据块的备份。其中，扩展的每一 Node Server存储的数据块可为 Master Server的文件目录中已存在的一文件被划分的数据块或数据块备份，也可为新扩展的一文件被划分的数据块或数据块备份，具体如何存放数据块，可依据当前实际情况设定，这里不再赘述。

还有，在本发明实施例中，由于 Master Server只存储文件目录和与文件目录中各个文件相关联的 Meta Server的路由信息，而该文件目录和与文件目录中各个文件相关联的 Meta Server的路由信息占用的存储空间不大，尤其是当文件目录中文件的名称筒短比如为筒短的数字或字符编码时，这能够保证 Master Server存储更多的文件目录和与文件目录中各个文件相关联的 Meta Server的路由信息，扩展集群规模。另外，作为本发明实施例的一个扩展，在本发明实施例中，还可将 Master Server上的文件目录、以及与文件目录中各文件相关联的 Meta Server的路由信息存储至其他可快速访问的分布***上，该分布***的存储空间远大于 Master Server, 这能保证存储更多的文件目录、以及更多与文件目录中各个文件相关联的 Meta Server的路由信息，整个集群的并发访问能力将进一步提升。

另夕卜，在本发明实施例中，因 Meta Server的数量并非唯一，这样，若其中一个或多个 Meta Server出现故障，不影响其他正常 Meta Server, 部分文件仍能读写，容错能力更强。

至此，完成图 1所示分布式文件***的描述。

下面对本发明实施例提供的方法进行描述：基于图 1所示的分布式文件***，本发明实施例提供了一种文件访问方法。参见图 2, 图 2为本发明实施例提供的文件访问方法流程图。该图 2所示的流程可由客户端执行，具体如图 2所示，包括以下步骤：步骤 201 , 访问 Master Server存储的文件目录，并从 Master Server 获取与需要访问的文件相关联的 Meta Server的路由信息；

步骤 202,利用获取的路由信息访问 Meta Server,并从该 Meta Server 中获取需要访问的文件的元信息。

优选地，本发明实施例中，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server。

步骤 203 ,利用获取的元信息从多个 Node Server上访问需要访问的文件。

至此，完成图 2所示方法的描述。从图 2所示流程可以看出，客户端只在 Master Server访问文件目录和与文件目录中各文件相关联的 Meta Server的路由信息，而去 Meta Server访问具体文件的元信息，这相比单个 Master Server既要提供文件目录访问，又要提供文件元信息的访问而言，能提供更高的每秒访问次数（QPS ), 也能提供更高的并发访问量。

优选地，本发明实施例还提供了一种应用于文件访问的客户端。参见图 3 , 图 3为本发明实施例提供的客户端结构图。如图 3所示，所述客户端包括：

第一访问单元，用于访问 Master Server存储的文件目录，并从 Master Server获取与本客户端需要访问的文件相关联的 Meta Server的路由信息；

第二访问单元，用于利用所述第一访问单元获取的路由信息访问 Meta Server,并从该 Meta Server中获取本客户端需要访问的文件的元信息。其中，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server;

第三访问单元，用于利用第二访问单元获取的元信息从多个 Node Server上访问需要访问的文件。

至此，完成图 3所示的客户端描述。

图 4为本发明另一实施例提供的客户端结构示意图。如图 4所示，该客户端至少包括：存储器以及与存储器通信的处理器，其中该存储器中包括可由处理器执行的第一访问指令、第二访问指令和第三访问指令。

该第一访问指令，用于访问主服务器 Master Server存储的文件目录，并从 Master Server获取与本客户端需要访问的文件相关联的元信息服务器 Meta Server的路由信息；

第二访问指令，用于利用所述第一访问指令获取的路由信息访问 Meta Server,并从该 Meta Server中获取本客户端需要访问的文件的元信息；

第三访问指令，用于利用所述第二访问指令获取的元信息从多个节点服务器 Node Server上访问需要访问的文件。

优选地，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server。

由以上技术方案可以看出，在本发明实施例中，文件目录和文件元信息分开存储，即，客户端只在 Master Server访问文件目录和与文件目录中各文件相关联的 Meta Server的路由信息，而去 Meta Server访问具体文件的元信息，这相比单个 Master Server既要提供文件目录访问 , 又要提供文件元信息的访问而言，能提供更高的 QPS , 也能提供更高的并发访问量。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

权利要求书

1、一种分布式文件***，其特征在于，所述分布式文件***包括：主服务器 Master Server, 用于存储文件目录、以及与文件目录中各文件相关联的元信息服务器 Meta Server的路由信息；在存储的文件目录中存在客户端需要访问的文件时，从存储的路由信息中找到与该文件相关联的 Meta Server的路由信息并提供给客户端，以使客户端利用所述 Master Server提供的路由信息访问 Meta Server;

Meta Server , 用于存储与其相关联的文件的元信息， Meta Server的数量大于等于 1 ; 在接收到客户端的访问时，提供该客户端需要访问的文件的元信息给客户端，以使客户端利用所述 Meta Server提供的元信息从 Node Server访问需要访问的文件；

节点服务器 Node Server, 用于存储文件被划分成的数据块和 /或该文件其它数据块的备份， Node Server的数量大于等于 1。

2、根据权利要求 1所述的***，其特征在于，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server。

3、根据权利要求 1所述的***，其特征在于，每一 Node Server禁止同时存储数据块和该数据块的备份；和 /或，

每一 Node Server禁止同时存储同一数据块的所有备份。

4、根据权利要求 1至 3任一所述的***，其特征在于，所述分布式文件***进一步包括扩展的 Meta Server和 /或 Node Server;

Master Server还用于在文件目录中添加与扩展的 Meta Server相关联的文件，以及接收并存储该扩展的 Meta Server的路由信息；

扩展的每一 Meta Server用于存储与其相关联的文件的元信息；扩展的每一 Node Server用于存放数据块和 /或其它数据块的备份。

5、一种文件访问方法，其特征在于，该方法包括：

访问主月良务器 Master Server存者的文件目录，并从 Master Server获取与需要访问的文件相关联的元信息服务器 Meta Server的路由信息；利用获取的路由信息访问 Meta Server , 并从该 Meta Server中获取需要访问的文件的元信息；

6、根据权利要求 5所述的方法，其特征在于，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server。

7、根据权利要求 5所述的方法，其特征在于，每一 Node Server禁止同时存储数据块和该数据块的备份；和 /或，

每一 Node Server禁止同时存储同一数据块的所有备份。

8、一种应用于文件访问的客户端，其特征在于，所述客户端包括：第一访问单元，用于访问主服务器 Master Server存储的文件目录，并从 Master Server获取与本客户端需要访问的文件相关联的元信息服务器 Meta Server的路由信息；

第二访问单元，用于利用所述第一访问单元获取的路由信息访问 Meta Server ,并从该 Meta Server中获取本客户端需要访问的文件的元信息；

第三访问单元，用于利用所述第二访问单元获取的元信息从多个节点服务器 Node Server上访问需要访问的文件。

9、根据权利要求 8所述的客户端，其特征在于，所述文件的元信息至少包括：文件的长度、文件被划分成的数据块的数量、文件被划分成的各数据块以及各数据块的备份所处的 Node Server。