CN104123359A - 一种分布式对象存储***的资源管理方法 - Google Patents

一种分布式对象存储***的资源管理方法 Download PDF

Info

Publication number
CN104123359A
CN104123359A CN201410343218.7A CN201410343218A CN104123359A CN 104123359 A CN104123359 A CN 104123359A CN 201410343218 A CN201410343218 A CN 201410343218A CN 104123359 A CN104123359 A CN 104123359A
Authority
CN
China
Prior art keywords
store path
metadata
spid
access
data server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410343218.7A
Other languages
English (en)
Other versions
CN104123359B (zh
Inventor
张文健
房磊
朱晨鸣
张云帆
乔爱锋
乔长兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhong Tong clothing consulting and Design Research Institute Co., Ltd.
Original Assignee
Jiangsu Posts and Telecommunications Planning and Designing Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Posts and Telecommunications Planning and Designing Institute Co Ltd filed Critical Jiangsu Posts and Telecommunications Planning and Designing Institute Co Ltd
Priority to CN201410343218.7A priority Critical patent/CN104123359B/zh
Publication of CN104123359A publication Critical patent/CN104123359A/zh
Application granted granted Critical
Publication of CN104123359B publication Critical patent/CN104123359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种分布式对象存储***的资源管理方法,包括以下步骤:所述分布式对象存储***将文件的存储路径属性与文件的元数据分离,存储路径属性包括文件所在的存储路径名称及相应的路径访问控制属性,文件的元数据包括文件名、创建时间、修改时间以及文件长度在内的访问属性;所述分布式对象存储***包括存储路径索引服务器、元数据服务器和对象存储设备,其中,存储路径索引服务器为***中所有存储路径建立索引项,每个索引项包括SPID和存储路径属性,其中,SPID是存储路径索引服务器为存储路径分配的一个全局唯一的存储路径ID;元数据服务器定位存储路径ID为SPID的存储路径对象所对应的对象存储设备。

Description

一种分布式对象存储***的资源管理方法
技术领域
本发明涉及云计算计算机数据分布式对象存储的领域,尤其涉及一种云计算环境下分布式对象存储***的资源管理方法。
背景技术
在云计算环境下,数据的存储是一个极其重要的问题。传统网络存储主要分为三种:直接附加存储(Direct Attached Storage,DAS)、存储区域网(Storage Area Network,SAN)和网络附加存储(Network Attached Storage,NAS)。但是,DAS不适合大规模数据存储;而对于SAN和NAS,随着数据规模的增大,元数据服务器很容易成为整个***的瓶颈。
相对于传统存储***,新型的分布式对象存储***(Object-Based Storage,OBS)能够很好地解决上述问题。OBS提供了一个带有NAS***的传统的文件共享和管理特征的单***映象(single-system-image)文件***,并改进了SAN的资源整合和可扩展的性能。与传统面向块的逻辑单元不同,对象存储不提供对不相关的数据块的访问,它允许通过存储对象来访问相关的数据块。存储对象是一个虚拟实体,它是一个客户认为相关的一组数据,类似于平面文件***中的大小不限的比特流文件,但对象又不同于文件,它只是有属性的比特序列。尽管对象既不同与数据块,也不同于文件,但可通过对象语义的定义来实现文件或数据块的输入/输出,因此,通过对象实现了文件输入/输出和数据块输入/输出的统一。
对象存储的管理分两部分:服务器和对象存储目标端(Object-based Storage Target,OST)。服务器将所有存储目标端的存储空间虚拟为统一的存储空间,同时负责用户的命名空间的管理,在认证用户请求后,分配给其唯一的对象ID,并按一定的算法实现用户命名空间到存储空间的映射。OST负责与其相连的存储设备的管理,它没有对象命名空间,只有平面对象ID空间,OST根据对象ID在存储设备中分配存储空间或访问存储对象。
对象存储通过信用保证所有操作的安全,信用包括允许客户的操作集和完整性编码。对每个操作简单提供信用,即使信用不加密,也能提供保护(由于完整性编码),因为不可能偶然为一个操作提供一个可靠信用。为了提供安全,对信用的某些形式的加密保护是必要的。对象存储提供安全和保护是在对象级而不是整个卷级,因此允许不可信的客户位于存储网络中,并允许共享访问存储数据而不需访问整个卷的数据。由于客户不能直接访问定位元数据,可提供额外的保护,因为不可能有错误配置和蠕虫主机破坏定位元数据。
此外,对象存储体系结构在每一个级别上都提供了安全性:存储***对存储设备的认证;存储***对计算节点的认证;存储***对计算节点命令的认证;所有命令都经CRC(Cyclic Redundancy Check,循环冗余校验码)的完整性检查;数据和命令经由IP的私有性。这样的安全水平能给用户以信心,让他们可以更经济高效地管理并轻松地访问网络。因此,分布式对象存储是一种高性能的、安全的大规模数据存储技术。
对象存储***在大规模数据存储、性能、数据共享和可扩展性方面已经取得了很大的成就,并得到了业界的广泛认可。如Panasas公司是全球第一家OSD(Object-basedStorage Device,对象存储设备)产品的提供商,同时提供面向对象的存储和并行文件***。HP已经和开放源代码厂家Lustre文件***合作,使用OSD作为HP StorageWork可扩展文件***的重要部分。
在分布式对象存储***中,数据对象的所有操作都需要访问元数据,在一些极端情况下,***对元数据的访问次数占据了大部分的数据访问时间,从而可能成为制约***性能的瓶颈。所以,高效的元数据管理方法对整个存储***提供高性能和高可伸缩性至关重要。同时,大规模分布式存储***的存储容量往往是动态变化的,需要不断增加新的存储节点,淘汰旧的存储节点,高可伸缩性、高可管理性要求数据对象能够实现自适应的、均衡的分配,以保证数据对象在整个存储***的分布总是负载均衡的。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种分布式对象存储***的资源管理方法,以分别实现高效的元数据组织、定位和访问控制,以及数据对象分配的动态负载均衡。
为了解决上述技术问题,本发明公开了一种分布式对象存储***的资源管理方法,所述分布式对象存储***将文件的存储路径属性与文件的元数据分离,存储路径属性包括文件所在的存储路径名称及相应的路径访问控制属性,文件的元数据包括文件名、创建时间、修改时间以及文件长度在内的访问属性;
所述分布式对象存储***包括存储路径索引服务器、元数据服务器和对象存储设备,其中,存储路径索引服务器为***中所有存储路径建立索引项,每个索引项包括SPID和存储路径属性,其中,SPID是存储路径索引服务器为存储路径分配的一个全局唯一的存储路径ID;元数据服务器定位存储路径ID为SPID的存储路径对象所对应的对象存储设备;
所述分布式对象存储***在存储路径索引服务器上建立SPID与元数据服务器的映射表,并将元数据服务器映射表分为主元数据服务器映射表和从元数据服务器映射表,其中主元数据服务器映射表是将SPID的散列值与元数据服务器映射,从映射表则是直接将SPID值与元数据服务器映射;
所述分布式对象存储***将SPID做为存储路径索引服务器中索引项的主关键字,根据SPID与元数据服务器的映射表定位文件元数据对应的不同的元数据服务器;元数据服务器根据文件名的散列值和存储路径对象的元数据信息计算文件元数据对应的桶对象,并在对象存储设备中确定该桶对象。
本发明中,新建文件元数据包括以下步骤:
步骤1:存储路径索引服务器获取文件的存储路径及相应的访问控制属性,并记录在索引项;
步骤1a、存储路径索引服务器获取文件的存储路径及相应的路径访问控制属性;
步骤1b、存储路径索引服务器检查存储路径访问控制属性,确认用户是否有新建文件元数据的权限;
步骤1c、如果用户有新建文件元数据权限,则存储路径索引服务器将存储路径及相应的访问控制属性记录在索引项,否则结束;
步骤2:存储路径索引服务器为存储路径分配SPID,并记录在索引项;
步骤3:定位文件元数据对应的元数据服务器,将文件元数据存储到对应的对象存储设备上;
步骤3a、在存储路径索引服务器上建立SPID与元数据服务器的映射表,其中主映射表是将SPID的散列值与元数据服务器映射,从映射表则是直接将SPID值与元数据服务器映射;
步骤3b、根据SPID和元数据服务器映射表定位主元数据服务器和从元数据服务器;
步骤3c、元数据服务器定位存储路径ID为SPID的存储路径对象所在的对象存储设备;
步骤3d、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据对应的桶对象ID,根据桶对象ID在对象存储设备中确定该桶对象;
步骤3e、将文件元数据存储到所述桶对象中。
本发明中,访问文件元数据包括如下步骤:
步骤4:将文件分解为存储路径和文件名两部分;
步骤5:存储路径索引服务器获取存储路径的访问控制属性及其SPID
步骤5a、客户端在本地缓存中查找是否有缓存项;
步骤5b、如果没有,则客户端访问存储路径索引服务器,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
步骤5c、存储路径索引服务器根据存储路径的散列值检索是否存在索引项,如果存在,则检查用户是否有访问权限,如果不存在,则结束;如果有权限,则返回索引项中的访问控制属性和SPID,否则结束;
步骤5d、客户端获得返回的索引项,将它保存在本地的缓存中;
步骤6:客户端获取文件的元数据;
步骤6a、客户端在本地缓存中查找是否有缓存项;
步骤6b、如果没有,则根据SPID的散列值确定主元数据服务器,访问主元数据服务器,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
步骤6c、主元数据服务器查找缓存中是否有存储路径ID为SPID的存储路径对象,如果没有,根据SPID从对象存储设备中读取该存储路径对象,否则,主元数据服务器直接确定存储元数据的桶对象;
步骤6d、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据所在的桶对象ID,如果该桶对象不在本地缓存中,根据桶对象ID从对象存储设备中读取该桶对象;
步骤6e、客户端从桶对象中获得文件的元数据;
步骤6f、如果主元数据服务器过载,从存储路径索引服务器获得负载较轻的从元数据服务器,查询从元数据服务器获得所需要的文件元数据;
步骤6g、客户端将获得的元数据项保存在本地的缓存中。
本发明中,在当前存储路径新建目录时,构建新存储路径的访问控制属性包括以下步骤:
步骤7、用户查询当前存储路径的访问控制属性,确认用户是否有新建目录的权限,如果有权限,则执行步骤2,否则结束;
步骤8、用户设定新建目录的访问权限属性;
步骤9、根据当前存储路径的访问控制属性以及新建目录的访问权限属性,构造新存储路径的访问控制属性。
本发明实现了分布式对象存储***的资源管理方法,具有以下优点:
1、实现了高效的元数据组织、定位和访问控制;
2、实现了对***中对象等数据资源的高效管理。
3、解决了大规模数据存储***资源管理不易等问题,保证了云存储环境下数据的安全。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1为存储路径对象内部结构。
图2a和图2b分别为MDS主、从映射表。
图3为创建新文件元数据的流程图。
图4为访问文件元数据的流程图。
图5为对象资源管理工作内容。
具体实施方式
本发明针对云计算环境下分布式对象存储的特点,提出了一种分布式对象存储的资源管理方法。
(1)元数据管理
对象存储***将文件和数据分开管理,文件***的元数据信息与实际数据读写分离,减轻了***的元数据工作负载,提高了***的整体性能。本发明将存储路径属性与文件的元数据进一步分离,存储路径属性包括文件所在的存储路径名称及相应的路径访问控制属性,文件的元数据包括文件名、创建时间、修改时间、文件长度等访问属性。目录属性由存储路径索引服务器(Storage Path Index Server,SPIS)专门管理,为***中的所有存储路径分配一个全局唯一的存储路径ID。存储路径索引服务器中的目录属性包括:
●SPID:表示全局唯一的存储路径ID;
●ACp:表示该存储路径的访问控制属性;
●StoragePath:表示该存储路径名字。
每次创建目录时,SPIS将获得的路径访问控制属性记录在当前索引项中,在该目录下创建新的目录时,不再需要遍历前面目录,只需递归使用当前的路径访问控制属性与新建目录文件的访问控制属性即可构建新的存储路径访问控制属性。SPID为存储路径索引服务器中索引的主关键字,存储路径下的文件元数据通过SPID的散列值分布到不同的元数据服务器(Metadata Server,MDS)。这种方法可以在SPID不改变的条件下任意修改文件路径中目录名和访问权限,避免了由于目录名和访问权限的修改导致该存储路径下文件的元数据更新,从而也避免了大量的元数据迁移。
元数据服务器主要负责存储和管理数据文件的元数据,这些元数据都包含在一种称为存储路径对象(Storage Path Object,SPO)的逻辑结构中。SPO包含一个或多个固定大小的桶(Bucket)对象,每一个Bucket对象包含固定数量的文件或目录文件元数据的登记项入口(Entry),每一个Entry则包含着某一文件的全部元数据。在存储路径对象的起始位置包含描述该存储路径对象属性的元数据,存储路径对象的内部结构如图1所示。
通常采用静态散列法根据文件的标志值散列到不同的MDS中。本发明结合字典与散列法,在SPIS上建立SPID与MDS的映射表,并将MDS映射表分为主MDS映射表和从MDS映射表,其中主映射表是将SPID的散列值与MDS映射,从映射表则是直接将SPID值与MDS映射。从映射表的目的是为了防止过载访问的极端情况。主、从映射表如图2a和图2b所示。
新建文件元数据的流程如下,其流程图如图3所示:
步骤一:SPIS获取文件的存储路径及相应的访问控制属性,并记录在索引项;
ⅰ、SPIS获取文件的存储路径相应的访问控制属性;
ⅱ、SIPS查询存储路径访问控制属性,确认用户是否有新建文件的权限;
ⅲ、如果用户有新建文件权限,则SPIS将存储路径及相应的访问控制属性记录在索引项,否则结束。
步骤二:SPIS为存储路径分配SPID,并记录在索引项;
步骤三:定位文件元数据对应的MDS,将文件元数据存储到对应的OSD上;
ⅰ、在SPIS上建立SPID与MDS的映射表,其中主映射表是将SPID的散列值与MDS映射,从映射表则是直接将SPID值与MDS映射;
ⅱ、根据SPID和MDS映射表确定主MDS和从MDS;
ⅲ、MDS定位存储路径ID为SPID的存储路径对象所在的OSD;
ⅳ、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据对应的桶对象ID,根据桶对象ID在OSD中确定该桶对象;
ⅴ、将文件的元数据存储到桶对象中。
访问文件元数据的流程如下,其流程图如图4所示:
步骤一:将文件分解为存储路径和文件名两部分;
步骤二:SPIS获取存储路径的访问控制属性及其SPID:
ⅰ、客户端在本地Cache中查找是否有缓存项;
ⅱ、如果没有,则客户端访问SPIS,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
ⅲ、SPIS根据存储路径的散列值快速检索是否存在索引项,如果存在,则检查用户是否有访问权限,如果不存在,则结束;如果有,则返回索引项中的访问控制属性和SPID,否则结束;
ⅳ、如果客户端获得返回的索引项,将它保存在本地的Cache中;
步骤三:客户端获取文件的元数据;
ⅰ、客户端在本地Cache中查找是否有缓存项;
ⅱ、如果没有,则根据SPID的散列值确定主MDS,访问主MDS,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
ⅲ、主MDS查找Cache中是否有存储路径ID为SPID的存储路径对象,如果没有,根据SPID从OSD中读取该存储路径对象,否则,主元数据服务器直接确定存储元数据的桶对象;
ⅳ、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据所在的桶对象ID,如果该桶对象不在Cache中,根据桶对象ID从OSD中读取该桶对象;
ⅴ、客户端从桶对象中获得文件的元数据;
ⅵ、如果主MDS过载,从SPIS获得负载较轻的从MDS,查询从MDS获得所需要的文件元数据;
ⅶ、客户端将获得的元数据项保存在本地的缓存Cache中。
(2)对象资源管理
在对象存储***中,对象数据作为一种资源,需要进行合理的管理和操作,从而提高对象存储***性能和资源利用率。
对象的管理主要包括对象资源管理,对象基本操作管理,对象性能管理等,各项具体工作内容如图5所示。在对象资源管理中,对象存储***根据***中存储节点的规模和权值将单位区间分割成长度不同的区间,并在这些区间与存储节点之间建立映射关系。通过将数据对象映射到均匀分布在单位区间[0,1)中的随机数集合中,根据映射确定数据对象的存储位置,从而实现对象数据在***中的均衡存储。
实施例
(1)元数据管理
元数据管理主要涉及元数据定位和文件访问控制属性管理两方面。
元数据定位操作的基本步骤是当客户端需要访问数据文件时,首先需要访问SPIS,查询所要访问文件的存储路径的访问控制属性以及SPID。如果有访问权限,则需要根据SPID进行散列计算,确定存储文件元数据的主MDS。在正常访问情况下,通过查询主MDS即可获得所需要的文件元数据,如果主MDS过载,则从SPIS获得负载较轻的从MDS,查询从MDS获得所需要的文件元数据。以访问文件/home/src/test/HelloWorld.Java的元数据为例,说明具体的访问过程。
步骤一:将以下文件/home/src/test/HelloWorld.java分解为存储路径/home/src/test/和文件名HelloWorld.java两部分;
步骤二:获取存储路径/home/src/test/的访问控制属性及其SPID;
ⅰ、在本地Cache中查找是否有缓存项;
ⅱ、如果没有,则访问SPIS;
ⅲ、SPIS根据/home/src/test/的散列值快速检索是否存在索引项,如果存在,则检查用户是否有访问权限;如果有,则返回索引项中的访问控制属性和SPID;
ⅳ、如果获得返回的索引项,将它保存在本地的Cache中;
步骤三:获取文件HelloWorld.java的元数据;
ⅰ、在本地Cache中查找是否有缓存项;
ⅱ、如果没有,则根据SPID的散列值确定主MDS,访问主MDS;
ⅲ、主MDS查找Cache中是否有存储路径ID为SPID的存储路径对象,如果没有,根据SPID从OSD中读取该存储路径对象;
ⅳ、将HelloWorld.java转换成整数,根据它的散列值以及存储路径对象的元数据信息计算HelloWorld.java所在的Bucket对象ID,如果该Bucket对象不在Caehe中,从OSD中读取该Bucket对象;
ⅴ、从Bucket对象中获得HelloWorld.java的元数据;
ⅵ、如果主MDS过载,从SPIS获得负载较轻的从MDS,查询从MDS获得所需要的文件元数据;
ⅶ、将获得的元数据项保存在本地的Cache中。
文件访问控制属性管理的基本操作过程是将文件本身的访问控制属性与所在的存储路径访问控制属性分开管理。构造存储路径的访问控制属性时,每次创建新的目录都需要将获得的路径访问控制属性记录在当前索引项中。在该目录下创建新的子目录时,只需要结合当前的路径访问控制属性与新建目录的访问控制属性即可构建新的存储路径访问控制属性,而无需遍历前面的各层目录。这种方法的好处是,只需要通过SPIS即可查询文件的存储路径访问控制属性,无需遍历文件所在路径的所有目录,大大提高了元数据访问效率。以下是在目录/home/src下新建目录test时,构造存储路径/home/src/test的访问控制属性过程如下:
步骤一:用户查询存储路径/home/src的访问控制属性,获得/home/src的访问控制属性为:rwxr-xr-x,即用户有新建目录的权限;
步骤二:用户设定新建目录test的访问权限属性为:rwxr-r-;
步骤三:根据存储路径/home/src的访问控制属性以及新建目录test的访问权限属性,构造存储路径/home/src/test的访问控制属性为:rwxr-r-。
(2)对象资源管理
对象资源管理主要涉及到数据对象的资源分配、数据对象操作、***性能监控、资源回收等内容,其具体步骤如下:
步骤一:对象存储***接收来自用户的对象资源申请,申请信息包括所需资源大小。对象存储***将资源申请中的所需资源大小与自身存储能力进行对比,如果存储资源充足,则为申请分配对象资源,否则产生资源不足告警。
步骤二:对象存储分配对象资源时,通过线性散列函数H(x)为数据对象x产生全局唯一的ID,并映射到随机产生的均匀分布在单位区间[0,1)上的随机数集合上。
步骤三:对象存储***将单位区间[0,l)分割成如果干个不交叉的独立区间。通过比较存储***中所有存储节点的权重,在区间与存储节点之间建立映射关系,映射到同一个存储节点的区间构成了一个区间域,区间域中的区间按照区间的左边界递增的顺序进行排列,每个区间域中所有区间长度之和代表存储节点的权重。
步骤四:对象存储***查找数据对象x所对应的随机数所属的映射区间和区间域,由区间域唯一确定对应的存储节点,并将数据对象x存储到对应的存储节点。
步骤六:在对象存储***运行过程中,***对自身存储性能进行监控,并生成性能记录数据。如果***性能低于预定门限,则对象存储***发出告警。
步骤五:如果用户提交操作对象资源的请求,对象存储***根据用户请求对对象资源进行相关操作。例如,如果用户提交对数据对象x的删除操作,则对象存储根据对象x所在区间域确定存储节点,从该存储节点中删除数据对象x,并释放相应的存储资源。
本发明提供了一种分布式对象存储***的资源管理方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出如果干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。

Claims (4)

1.一种分布式对象存储***的资源管理方法,其特征在于,
所述分布式对象存储***将文件的存储路径属性与文件的元数据分离,存储路径属性包括文件所在的存储路径名称及相应的路径访问控制属性,文件的元数据包括文件名、创建时间、修改时间以及文件长度在内的访问属性;
所述分布式对象存储***包括存储路径索引服务器、元数据服务器和对象存储设备,其中,存储路径索引服务器为***中所有存储路径建立索引项,每个索引项包括SPID和存储路径属性,其中,SPID是存储路径索引服务器为存储路径分配的一个全局唯一的存储路径ID;元数据服务器定位存储路径ID为SPID的存储路径对象所对应的对象存储设备;
所述分布式对象存储***在存储路径索引服务器上建立SPID与元数据服务器的映射表,并将元数据服务器映射表分为主元数据服务器映射表和从元数据服务器映射表,其中主元数据服务器映射表是将SPID的散列值与元数据服务器映射,从映射表则是直接将SPID值与元数据服务器映射;
所述分布式对象存储***将SPID做为存储路径索引服务器中索引项的主关键字,根据SPID与元数据服务器的映射表定位文件元数据对应的不同的元数据服务器;元数据服务器根据文件名的散列值和存储路径对象的元数据信息计算文件元数据对应的桶对象,并在对象存储设备中确定该桶对象。
2.根据权利要求1所述的一种分布式对象存储***的资源管理方法,其特征在于,新建文件元数据包括以下步骤:
步骤1:存储路径索引服务器获取文件的存储路径及相应的访问控制属性,并记录在索引项;
步骤1a、存储路径索引服务器获取文件的存储路径及相应的路径访问控制属性;
步骤1b、存储路径索引服务器检查存储路径访问控制属性,确认用户是否有新建文件元数据的权限;
步骤1c、如果用户有新建文件元数据权限,则存储路径索引服务器将存储路径及相应的访问控制属性记录在索引项,否则结束;
步骤2:存储路径索引服务器为存储路径分配SPID,并记录在索引项;
步骤3:定位文件元数据对应的元数据服务器,将文件元数据存储到对应的对象存储设备上;
步骤3a、在存储路径索引服务器上建立SPID与元数据服务器的映射表,其中主映射表是将SPID的散列值与元数据服务器映射,从映射表则是直接将SPID值与元数据服务器映射;
步骤3b、根据SPID和元数据服务器映射表定位主元数据服务器和从元数据服务器;
步骤3c、元数据服务器定位存储路径ID为SPID的存储路径对象所在的对象存储设备;
步骤3d、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据对应的桶对象ID,根据桶对象ID在对象存储设备中确定该桶对象;
步骤3e、将文件元数据存储到所述桶对象中。
3.根据权利要求1所述的一种分布式对象存储***的资源管理方法,其特征在于,访问文件元数据包括如下步骤:
步骤4:将文件分解为存储路径和文件名两部分;
步骤5:存储路径索引服务器获取存储路径的访问控制属性及其SPID
步骤5a、客户端在本地缓存中查找是否有缓存项;
步骤5b、如果没有,则客户端访问存储路径索引服务器,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
步骤5c、存储路径索引服务器根据存储路径的散列值检索是否存在索引项,如果存在,则检查用户是否有访问权限,如果不存在,则结束;如果有权限,则返回索引项中的访问控制属性和SPID,否则结束;
步骤5d、客户端获得返回的索引项,将它保存在本地的缓存中;
步骤6:客户端获取文件的元数据;
步骤6a、客户端在本地缓存中查找是否有缓存项;
步骤6b、如果没有,则根据SPID的散列值确定主元数据服务器,访问主元数据服务器,如果有,则客户端根据缓存项确定存储元数据的桶对象,直接访问元数据;
步骤6c、主元数据服务器查找缓存中是否有存储路径ID为SPID的存储路径对象,如果没有,根据SPID从对象存储设备中读取该存储路径对象,否则,主元数据服务器直接确定存储元数据的桶对象;
步骤6d、将文件名转换成整数,根据它的散列值以及存储路径对象的元数据信息计算文件元数据所在的桶对象ID,如果该桶对象不在本地缓存中,根据桶对象ID从对象存储设备中读取该桶对象;
步骤6e、客户端从桶对象中获得文件的元数据;
步骤6f、如果主元数据服务器过载,从存储路径索引服务器获得负载较轻的从元数据服务器,查询从元数据服务器获得所需要的文件元数据;
步骤6g、客户端将获得的元数据项保存在本地的缓存中。
4.根据权利要求1所述的一种分布式对象存储***的资源管理方法,其特征在于,在当前存储路径新建目录时,构建新存储路径的访问控制属性包括以下步骤:
步骤7、用户查询当前存储路径的访问控制属性,确认用户是否有新建目录的权限,如果有权限,则执行步骤2,否则结束;
步骤8、用户设定新建目录的访问权限属性;
步骤9、根据当前存储路径的访问控制属性以及新建目录的访问权限属性,构造新存储路径的访问控制属性。
CN201410343218.7A 2014-07-17 2014-07-17 一种分布式对象存储***的资源管理方法 Active CN104123359B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410343218.7A CN104123359B (zh) 2014-07-17 2014-07-17 一种分布式对象存储***的资源管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410343218.7A CN104123359B (zh) 2014-07-17 2014-07-17 一种分布式对象存储***的资源管理方法

Publications (2)

Publication Number Publication Date
CN104123359A true CN104123359A (zh) 2014-10-29
CN104123359B CN104123359B (zh) 2017-03-22

Family

ID=51768770

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410343218.7A Active CN104123359B (zh) 2014-07-17 2014-07-17 一种分布式对象存储***的资源管理方法

Country Status (1)

Country Link
CN (1) CN104123359B (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631269A (zh) * 2015-12-30 2016-06-01 成都广达新网科技股份有限公司 一种缓存服务器数据库资源可用性检测方法及装置
WO2016082078A1 (zh) * 2014-11-24 2016-06-02 华为技术有限公司 路径管理的***、装置和方法
CN106202367A (zh) * 2016-07-07 2016-12-07 腾讯科技(深圳)有限公司 一种对象信息的处理方法及装置
CN106339415A (zh) * 2016-08-12 2017-01-18 北京奇虎科技有限公司 数据的查询方法、装置及***
CN106446715A (zh) * 2016-10-11 2017-02-22 武汉斗鱼网络科技有限公司 一种文件加密方法和装置
WO2017045545A1 (zh) * 2015-09-14 2017-03-23 中兴通讯股份有限公司 多存储盘负载管理方法、装置、文件***及存储网络***
CN106980540A (zh) * 2017-03-07 2017-07-25 清华大学 一种分布式多维离散数据的计算方法
CN107241299A (zh) * 2016-03-29 2017-10-10 百度在线网络技术(北京)有限公司 网盘的权限控制管理方法和装置
CN107291870A (zh) * 2017-06-15 2017-10-24 郑州云海信息技术有限公司 一种分布式存储中文件批量读取方法
CN107590249A (zh) * 2017-09-18 2018-01-16 郑州云海信息技术有限公司 一种分布式文件***的负载平衡方法、装置及设备
CN108108376A (zh) * 2016-11-25 2018-06-01 中标软件有限公司 一种线性自适应文件名长度调度***及方法
CN108351901A (zh) * 2015-11-17 2018-07-31 微软技术许可有限责任公司 统一活动服务
CN108427677A (zh) * 2017-02-13 2018-08-21 阿里巴巴集团控股有限公司 一种对象访问方法、装置及电子设备
CN109445694A (zh) * 2018-10-19 2019-03-08 郑州云海信息技术有限公司 一种分布式存储***元数据分离方法和装置
CN109918355A (zh) * 2019-03-05 2019-06-21 杭州前云数据技术有限公司 实现基于对象存储服务的nas的虚拟元数据映射***和方法
WO2019127234A1 (zh) * 2017-12-28 2019-07-04 华为技术有限公司 一种对象迁移的方法、设备和***
CN110012087A (zh) * 2019-03-28 2019-07-12 中国工商银行股份有限公司 数据处理***及数据处理方法
CN110046133A (zh) * 2019-04-12 2019-07-23 苏州浪潮智能科技有限公司 一种存储文件***的元数据管理方法、装置及***
WO2019148841A1 (zh) * 2018-01-31 2019-08-08 华为技术有限公司 一种分布式存储***、数据处理方法和存储节点
US10540323B2 (en) 2017-05-30 2020-01-21 Western Digital Technologies, Inc. Managing I/O operations in a storage network
CN111324799A (zh) * 2020-02-05 2020-06-23 星辰天合(北京)数据科技有限公司 搜索请求的处理方法及装置
CN111427862A (zh) * 2020-03-19 2020-07-17 国电南瑞科技股份有限公司 电网调度控制***中分布式文件***的元数据管理方法
CN111427910A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 数据处理方法及装置
CN111447275A (zh) * 2020-03-26 2020-07-24 深圳市中盛瑞达科技有限公司 存储***和存储装置
CN111857890A (zh) * 2020-07-24 2020-10-30 苏州浪潮智能科技有限公司 一种业务处理方法、***、设备以及介质
CN112417036A (zh) * 2018-09-10 2021-02-26 华为技术有限公司 分布式存储***中处理对象的元数据的方法及装置
CN114237490A (zh) * 2021-11-02 2022-03-25 清华大学 基于Nauru-graph的大规模数据存储和读取方法及装置
CN116150093A (zh) * 2023-03-04 2023-05-23 北京大道云行科技有限公司 一种对象存储列举对象的实现方法及电子设备
CN117435559A (zh) * 2023-12-20 2024-01-23 苏州元脑智能科技有限公司 元数据分层管理方法、装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036602A1 (en) * 2004-08-13 2006-02-16 Unangst Marc J Distributed object-based storage system that stores virtualization maps in object attributes
CN103020315A (zh) * 2013-01-10 2013-04-03 中国人民解放军国防科学技术大学 一种基于主从分布式文件***的海量小文件存储方法
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件***元数据管理方法
CN103229173A (zh) * 2012-12-26 2013-07-31 华为技术有限公司 元数据管理方法及***
CN103812939A (zh) * 2014-02-17 2014-05-21 李漾 一种大数据存储***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060036602A1 (en) * 2004-08-13 2006-02-16 Unangst Marc J Distributed object-based storage system that stores virtualization maps in object attributes
CN103229173A (zh) * 2012-12-26 2013-07-31 华为技术有限公司 元数据管理方法及***
CN103020315A (zh) * 2013-01-10 2013-04-03 中国人民解放军国防科学技术大学 一种基于主从分布式文件***的海量小文件存储方法
CN103150394A (zh) * 2013-03-25 2013-06-12 中国人民解放军国防科学技术大学 面向高性能计算的分布式文件***元数据管理方法
CN103812939A (zh) * 2014-02-17 2014-05-21 李漾 一种大数据存储***

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016082078A1 (zh) * 2014-11-24 2016-06-02 华为技术有限公司 路径管理的***、装置和方法
WO2017045545A1 (zh) * 2015-09-14 2017-03-23 中兴通讯股份有限公司 多存储盘负载管理方法、装置、文件***及存储网络***
US11416520B2 (en) 2015-11-17 2022-08-16 Microsoft Technology Licensing, Llc Unified activity service
CN108351901A (zh) * 2015-11-17 2018-07-31 微软技术许可有限责任公司 统一活动服务
CN105631269B (zh) * 2015-12-30 2018-11-27 成都广达新网科技股份有限公司 一种缓存服务器数据库资源可用性检测方法及装置
CN105631269A (zh) * 2015-12-30 2016-06-01 成都广达新网科技股份有限公司 一种缓存服务器数据库资源可用性检测方法及装置
CN107241299B (zh) * 2016-03-29 2021-03-02 百度在线网络技术(北京)有限公司 网盘的权限控制管理方法和装置
CN107241299A (zh) * 2016-03-29 2017-10-10 百度在线网络技术(北京)有限公司 网盘的权限控制管理方法和装置
US11281632B2 (en) 2016-07-07 2022-03-22 Tencent Technology (Shenzhen) Company Limited Object information processing method and apparatus, and storage medium
CN106202367A (zh) * 2016-07-07 2016-12-07 腾讯科技(深圳)有限公司 一种对象信息的处理方法及装置
CN106202367B (zh) * 2016-07-07 2019-03-05 腾讯科技(深圳)有限公司 一种对象信息的处理方法及装置
CN106339415B (zh) * 2016-08-12 2019-08-23 北京奇虎科技有限公司 数据的查询方法、装置及***
CN106339415A (zh) * 2016-08-12 2017-01-18 北京奇虎科技有限公司 数据的查询方法、装置及***
CN106446715A (zh) * 2016-10-11 2017-02-22 武汉斗鱼网络科技有限公司 一种文件加密方法和装置
CN108108376B (zh) * 2016-11-25 2021-07-09 中标软件有限公司 一种线性自适应文件名长度调度***及方法
CN108108376A (zh) * 2016-11-25 2018-06-01 中标软件有限公司 一种线性自适应文件名长度调度***及方法
CN108427677A (zh) * 2017-02-13 2018-08-21 阿里巴巴集团控股有限公司 一种对象访问方法、装置及电子设备
CN106980540A (zh) * 2017-03-07 2017-07-25 清华大学 一种分布式多维离散数据的计算方法
US10540323B2 (en) 2017-05-30 2020-01-21 Western Digital Technologies, Inc. Managing I/O operations in a storage network
CN107291870A (zh) * 2017-06-15 2017-10-24 郑州云海信息技术有限公司 一种分布式存储中文件批量读取方法
CN107291870B (zh) * 2017-06-15 2021-03-09 苏州浪潮智能科技有限公司 一种分布式存储中文件批量读取方法
CN107590249A (zh) * 2017-09-18 2018-01-16 郑州云海信息技术有限公司 一种分布式文件***的负载平衡方法、装置及设备
WO2019127234A1 (zh) * 2017-12-28 2019-07-04 华为技术有限公司 一种对象迁移的方法、设备和***
US11573725B2 (en) 2017-12-28 2023-02-07 Huawei Cloud Computing Technologies Co., Ltd. Object migration method, device, and system
US11262916B2 (en) 2018-01-31 2022-03-01 Huawei Technologies Co., Ltd. Distributed storage system, data processing method, and storage node
WO2019148841A1 (zh) * 2018-01-31 2019-08-08 华为技术有限公司 一种分布式存储***、数据处理方法和存储节点
CN112417036A (zh) * 2018-09-10 2021-02-26 华为技术有限公司 分布式存储***中处理对象的元数据的方法及装置
CN109445694B (zh) * 2018-10-19 2022-02-18 郑州云海信息技术有限公司 一种分布式存储***元数据分离方法和装置
CN109445694A (zh) * 2018-10-19 2019-03-08 郑州云海信息技术有限公司 一种分布式存储***元数据分离方法和装置
CN109918355B (zh) * 2019-03-05 2020-12-15 杭州前云数据技术有限公司 实现基于对象存储服务的nas的虚拟元数据映射***和方法
CN109918355A (zh) * 2019-03-05 2019-06-21 杭州前云数据技术有限公司 实现基于对象存储服务的nas的虚拟元数据映射***和方法
CN110012087A (zh) * 2019-03-28 2019-07-12 中国工商银行股份有限公司 数据处理***及数据处理方法
CN110046133A (zh) * 2019-04-12 2019-07-23 苏州浪潮智能科技有限公司 一种存储文件***的元数据管理方法、装置及***
CN111324799B (zh) * 2020-02-05 2021-05-04 星辰天合(北京)数据科技有限公司 搜索请求的处理方法及装置
CN111324799A (zh) * 2020-02-05 2020-06-23 星辰天合(北京)数据科技有限公司 搜索请求的处理方法及装置
CN111427862B (zh) * 2020-03-19 2022-11-04 国电南瑞科技股份有限公司 电网调度控制***中分布式文件***的元数据管理方法
CN111427862A (zh) * 2020-03-19 2020-07-17 国电南瑞科技股份有限公司 电网调度控制***中分布式文件***的元数据管理方法
CN111427910A (zh) * 2020-03-20 2020-07-17 北京百度网讯科技有限公司 数据处理方法及装置
CN111447275A (zh) * 2020-03-26 2020-07-24 深圳市中盛瑞达科技有限公司 存储***和存储装置
CN111447275B (zh) * 2020-03-26 2021-01-01 深圳市中盛瑞达科技有限公司 存储***和存储装置
CN111857890A (zh) * 2020-07-24 2020-10-30 苏州浪潮智能科技有限公司 一种业务处理方法、***、设备以及介质
CN111857890B (zh) * 2020-07-24 2021-08-31 苏州浪潮智能科技有限公司 一种业务处理方法、***、设备以及介质
CN114237490A (zh) * 2021-11-02 2022-03-25 清华大学 基于Nauru-graph的大规模数据存储和读取方法及装置
CN116150093A (zh) * 2023-03-04 2023-05-23 北京大道云行科技有限公司 一种对象存储列举对象的实现方法及电子设备
CN116150093B (zh) * 2023-03-04 2023-11-03 北京大道云行科技有限公司 一种对象存储列举对象的实现方法及电子设备
CN117435559A (zh) * 2023-12-20 2024-01-23 苏州元脑智能科技有限公司 元数据分层管理方法、装置、存储介质及电子设备
CN117435559B (zh) * 2023-12-20 2024-03-01 苏州元脑智能科技有限公司 元数据分层管理方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN104123359B (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
CN104123359B (zh) 一种分布式对象存储***的资源管理方法
US10467188B2 (en) In-line policy management with multi-level object handle
US10469501B2 (en) Multi-protocol access control lists
CN108804510B (zh) 键值文件***
US9565254B2 (en) Object location service for network-based content repository
US8180813B1 (en) Content repository implemented in a network storage server system
US9317511B2 (en) System and method for managing filesystem objects
US10019459B1 (en) Distributed deduplication in a distributed system of hybrid storage and compute nodes
US8489654B2 (en) Method and system for forming a virtual file system at a computing device
CN104077423B (zh) 一种基于一致性散列的结构化数据存储、查询和迁移方法
CN106066896B (zh) 一种应用感知的大数据重复删除存储***及方法
CN101674334B (zh) 一种网络存储设备的访问控制方法
US20110137966A1 (en) Methods and systems for providing a unified namespace for multiple network protocols
EP2631805A1 (en) Storage-service-provision device, system, service-provision method, and service-provision program
CN103793534A (zh) 分布式文件***及均衡元数据存储和访问负载的实现方法
CN104408111A (zh) 一种删除重复数据的方法及装置
US11221777B2 (en) Storage system indexed using persistent metadata structures
JP5236129B2 (ja) ストレージサービス提供装置、システム、サービス提供方法、及びサービス提供プログラム
CN103744882A (zh) 一种基于键值对的目录片段表示方法及装置
US8495112B2 (en) Distributed file hierarchy management in a clustered redirect-on-write file system
CN104537023A (zh) 一种反向索引记录的存储方法及装置
JP5174255B2 (ja) ストレージサービス提供装置、システム、サービス提供方法、及びサービス提供プログラム
Tao et al. Small file access optimization based on GlusterFS
Vashist et al. A Review on Distributed File System and Its Applications.
JP2015207305A (ja) ストレージサービス提供装置、システム、サービス提供方法、及びサービス提供プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 210006 Tianyuan East Road, Jiangning District, Nanjing, Jiangsu Province, No. 1

Patentee after: Zhong Tong clothing consulting and Design Research Institute Co., Ltd.

Address before: 210006 Tianyuan East Road, Jiangning District, Nanjing, Jiangsu Province, No. 1

Patentee before: Jiangsu Posts & Telecommunications Planning and Designing Institute Co., Ltd.

CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: The Jianye District of Nanjing City, Jiangsu province 210000 Jiangdong Street No. 58

Patentee after: CHINA INFORMATION CONSULTING & DESIGNING INSTITUTE Co.,Ltd.

Address before: 210006 No. 1 East Tianyuan Road, Jiangning District, Jiangsu, Nanjing

Patentee before: CHINA INFORMATION CONSULTING & DESIGNING INSTITUTE Co.,Ltd.