CN104331453B - 一种分布式文件***及分布式文件***的构建方法 - Google Patents
一种分布式文件***及分布式文件***的构建方法 Download PDFInfo
- Publication number
- CN104331453B CN104331453B CN201410601171.XA CN201410601171A CN104331453B CN 104331453 B CN104331453 B CN 104331453B CN 201410601171 A CN201410601171 A CN 201410601171A CN 104331453 B CN104331453 B CN 104331453B
- Authority
- CN
- China
- Prior art keywords
- file
- key
- data block
- allocation table
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种分布式文件***及分布式文件***的构建方法,包括以下步骤:封装访问函数,定义结构体文件;将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中;根据每个数据块的键头部和文件的文件名建立文件分配表;当外部应用发起文件访问请求时,查询文件分配表,得到查询结果,对分布式开源数据库进行数据块读写同时对分布式开源数据库中的文件分配表进行修改。本发明利用HBASE对小数据块的快速访问,通过自动数据拆分和汇集,实现对任意大小文件均能按照类似传统非分布式文件***一样快速随机存储和访问。
Description
技术领域
本发明涉及一种分布式文件***及分布式文件***的构建方法。
背景技术
Hadoop是一个分布式***基础架构,由Apache基金会开发。Hadoop实现了一个分布式文件***(HDFS)和一种分布式计算框架(MapReduce)。
HDFS是Hadoop Distributed File System的简称,它是一个分布式文件***。HDFS有着高容错性的特点,它提供高吞吐量方法来访问应用程序的数据,适合那些有着超大数据集的应用程序,但对数据随机访问和小数据集的读写有着较大的效率瓶颈。
HBase是一个分布式的、面向列的开源数据库,它不是关系型的数据库,数据采用Key-Value方式存储,是一个适合于非结构化数据存储的数据库。目前通用分布式文件***对小文件(小于64MB)和普通文件随机快速访问具有处理效率低的问题。
发明内容
本发明所要解决的技术问题是提供一种对小文件和普通文件随机快速访问处理效率高的分布式文件***及分布式文件***的构建方法。
本发明解决上述技术问题的技术方案如下:一种分布式文件***的构建方法,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
步骤2:将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
本发明的有益效果是:本发明利用HBASE对小数据块(HBASE的数据记录)的快速查询访问,通过自动数据拆分和汇集(Map-Reduce),实现对任意大小文件均能按照类似本地文件***一样快速随机存储和访问,解决了目前通用分布式文件***对小文件(小于64MB)和普通文件随机快速访问处理效率低的问题。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
进一步,所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
进一步,当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
进一步,当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
进一步,当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
进一步,一种分布式文件***,包括封装定义模块,拆分模块,存储模块,建立模块和查询修改模块;
所述封装定义模块,用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块,用于将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个数据块;
所述存储模块,用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块,用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块,用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
进一步,所述存储模块存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
进一步,所述查询修改模块中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
附图说明
图1为本发明方法步骤流程图;
图2为本发明***结构图。
附图中,各标号所代表的部件列表如下:
1、封装定义模块,2、拆分模块,3、存储模块,4、建立模块,5、查询修改模块。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为本发明方法步骤流程图;图2为本发明***结构图。
实施例1
一种分布式文件***的构建方法,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
***封装标准C的文件访问常用函数,如打开文件(fopen)、关闭文件(fclose)、写文件(fwrite)、读文件(fread)、文件偏移(fseek)、文件位置重置(rewind)、文件改名(rename)等,对函数的标准声明不变,重新定义结构体FILE,在此结构体中存储HBASE默认表的访问句柄;
步骤2:将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写同时对分布式开源数据库中的文件分配表进行修改。
字段名 | 字段类型 | 描述 |
FileName | Char(128) | 文件名 |
KeyPre | Char(128) | Key头部 |
AddAttr | Char(256) | 扩展属性 |
表1.文件分配表(FAT)
分布式文件***上的文件在被访问时,分布式文件***会先根据请求的文件名从文件分配表中得到键头部,然后判断扩展属性允许访问后,从分布式开源数据库中根据键头部获取对应的数据片,并将数据片内容提供给外部应用。
所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
流水号为从全局***中获取的长度为8的数字,此数字在同一时刻不会重复,并且主机重启也不会造成此数字的复位。键头部在文件创建的同时生成,并唯一标识此文件,直到文件被删除,此key都不会发生变更;
所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
一种分布式文件***,包括封装定义模块1,拆分模块2,存储模块3,建立模块4和查询修改模块;
所述封装定义模块1,用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块2,用于将磁盘上的所有文件按照预先定义的预定数据块大小拆分为多个预定数据块大小的数据块;
所述存储模块3,用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块4,用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块5,用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写和/或对分布式开源数据库中的文件分配表进行修改。
所述存储模块3存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
所述查询修改模块5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求。
本发明针对现有的Hadoop架构下,HDFS和HBASE平台特点,通过本发明所描述的分布式虚拟文件***(iDVFS),实现一种适合任何尺寸文件快速随机访问的文件***。
首先,搭建HDFS,并在其上搭建HBASE如图一(为描述方便,图中只画出对应平台的存储节点);
然后,基于HBASE接口,搭建本发明软件——分布式虚拟文件***(iDVFS)。此文件***的主要作用在于将一个逻辑文件分解成若干等长的小块,然后以记录的方式存放在HBASE中。当外部应用发起对虚拟文件的读写访问时,iDVFS会将对文件的读写请求分解成HBASE的查询,并将查询结果返回给应用程序;
本发明的主要思路在于:有效利用了HBASE对小数据块(HBASE的数据记录)的快速查询访问,并通过iDVFS的自动数据拆分和汇集(Map-Reduce),实现对任意大小文件均能按照类似本地文件***一样快速随机访问。
在Hadoop架构下,利用Hadoop提供的Map-Reduce方法将文件读取、写入、删除、随机定位等文件访问过程,分解成对HBASE平台的数据记录的查询、***、删除、更新访问。
分布式文件***上的文件,被自动分为固定大小的数据块,以记录的方式存储在HBASE上。
HBASE上记录和分布式文件***中文件的对应关系,由本专利要求的分布式文件***管理。
本发明的分布式文件***构建于HBASE之上,文件虚拟化存在于此文件***内,文件数据实体存放于HBASE,虚拟文件与文件数据间的对应关系在文件分配表(FAT)中管理。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种分布式文件***的构建方法,其特征在于,包括以下步骤:
步骤1:封装用于进行文件访问的访问函数,定义结构体文件,所述结构体文件用于存储文件分配表的访问指针;
步骤2:将磁盘上所有文件按照预先定义的预定数据块大小拆分为多个数据块;
步骤3:将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
步骤4:根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
步骤5:当外部应用发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名,利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写,同时对分布式开源数据库中的文件分配表进行修改;
所述步骤5中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求;
当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名,利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
2.根据权利要求1所述的构建方法,其特征在于:所述键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
3.根据权利要求1所述的构建方法,其特征在于:当文件访问请求为文件复写请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,在分布式开源数据库中删除与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,为键值对的键值部分存入新的数据块,数据块一开始写入时直接写入内存中,当内存写入数据达到预定阀值或外部的应用程序主动调用强制刷新命令要求刷新数据到磁盘时,将内存中缓存数据的当前数据偏移量拼接到键头部,将当前数据偏移量作为键值对中的键及作为键值的内存中的数据块一通写入分布式开源数据库,写入成功后,返回复写函数调用成功提示。
4.根据权利要求1所述的构建方法,其特征在于:当文件访问请求为文件删除请求时,外部的应用程序调用删除函数,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果;
如果在文件分配表中未找到同名文件,则返回删除函数调用失败提示;
如果在文件分配表中找到同名文件,从文件分配表中获取与文件删除请求携带的文件名对应的键头部和扩展属性,根据扩展属性判断此文件的权限是否允许当前用户执行删除操作,如果允许,利用获取的键头部从分布式开源数据库中删除相对应的键值,然后从文件分配表中删除与键头部对应的文件名和扩展属性,全部删除完毕后,返回删除函数调用成功。
5.一种分布式文件***,其特征在于:包括封装定义模块(1),拆分模块(2),存储模块(3),建立模块(4)和查询修改模块(5);
所述封装定义模块(1),用于封装进行文件访问的访问函数,定义存储文件分配表的访问指针的结构体文件;
所述拆分模块(2),用于将磁盘上所有文件按照预先定义的预定数据块大小拆分为多个数据块;
所述存储模块(3),用于将拆分后的每个数据块分别以键值对的形式存储在分布式开源数据库中,所述键值对包括键和键值,所述键包括键头部和当前数据块在被拆分的文件中的序号,所述键值用于存储数据块;
所述建立模块(4),用于根据每个数据块的键头部和所有被拆分文件的文件名建立文件分配表,所述文件分配表中还包括被拆分文件的扩展属性;
所述查询修改模块(5),用于当外部应用向分布式开源数据库发起文件访问请求时,分布式开源数据库根据文件访问请求中携带的文件名利用定义的结构体文件查询文件分配表,得到查询结果,根据封装的访问函数及查询结果对分布式开源数据库进行数据块读写,同时对分布式开源数据库中的文件分配表进行修改;
所述查询修改模块(5)中文件访问请求具体为文件创建请求、文件复写请求或者文件删除请求;
所述查询修改模块(5),用于当文件访问请求为文件创建请求时,分布式开源数据库根据文件访问请求中携带的文件名,利用定义的结构体文件查询文件分配表,得到查询结果;
如果文件分配表中存在与文件访问请求中的文件名相同的同名文件,则根据扩展属性判断此文件权限是否允许当前用户修改,如果不允许修改,则返回无权限修改的错误提示;如果允许修改,根据文件分配表中的同名文件的键头部,删除在分布式开源数据库中与该同名文件对应的键值,然后复用此同名文件的键头部,为该键头部重新写入数据块;
如果在文件分配表中未找到同名文件,则新建一个键值对,并将键值对的键值部分存入新的数据块,将文件访问请求中的文件名和键值对的键头部分别对应存入文件分配表,并返回创建文件成功提示。
6.根据权利要求5所述的分布式文件***,其特征在于:所述存储模块(3)存储的键值对的键头部包括时间戳、主机名和流水号,所述时间戳为将磁盘上的文件拆分为数据块时所在主机的时间,所述主机名为将磁盘上的文件拆分为数据块时所在主机的主机名,所述流水号用于记录每一个数据块的序号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410601171.XA CN104331453B (zh) | 2014-10-30 | 2014-10-30 | 一种分布式文件***及分布式文件***的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410601171.XA CN104331453B (zh) | 2014-10-30 | 2014-10-30 | 一种分布式文件***及分布式文件***的构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104331453A CN104331453A (zh) | 2015-02-04 |
CN104331453B true CN104331453B (zh) | 2017-10-17 |
Family
ID=52406180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410601171.XA Active CN104331453B (zh) | 2014-10-30 | 2014-10-30 | 一种分布式文件***及分布式文件***的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104331453B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106156197A (zh) * | 2015-04-22 | 2016-11-23 | 中兴通讯股份有限公司 | 一种数据库的查询方法和装置 |
CN105354311B (zh) * | 2015-11-10 | 2018-06-19 | 科大智能电气技术有限公司 | 一种基于嵌入式设备文件***的数据键值对存储方法 |
CN108616556B (zh) * | 2016-12-13 | 2021-01-19 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置和*** |
CN106843759B (zh) * | 2017-01-17 | 2019-11-12 | 苏州同元软控信息技术有限公司 | 一种基于动态***结果数据的快速读写方法 |
CN107423431A (zh) * | 2017-08-03 | 2017-12-01 | 东北林业大学 | 一种基于分布式文件***的遥感数据存储方法及*** |
CN109144733A (zh) * | 2018-09-06 | 2019-01-04 | 北京京东尚科信息技术有限公司 | 基于Alluxio的数据处理方法及*** |
CN109451069B (zh) * | 2018-12-29 | 2021-01-29 | 江苏鼎峰信息技术有限公司 | 基于分布式存储的网络数据文件库存储及查询方法 |
CN109871338B (zh) * | 2019-03-15 | 2021-01-29 | 北京思特奇信息技术股份有限公司 | 一种数据存储方法、装置及计算机设备 |
CN110717192B (zh) * | 2019-09-11 | 2021-05-18 | 南京工业职业技术大学 | 基于Key-Value加速器的面向大数据安全的访问控制方法 |
CN110704875B (zh) * | 2019-10-22 | 2022-02-01 | 泰康保险集团股份有限公司 | 客户敏感信息的处理方法、装置、***、介质及电子设备 |
CN113590560A (zh) * | 2021-06-29 | 2021-11-02 | 济南浪潮数据技术有限公司 | 一种分布式***的缓存优化方法、***、设备和存储介质 |
CN116501713B (zh) * | 2023-06-26 | 2023-09-22 | 成都谐盈科技有限公司 | 一种分布式文件***的实现方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375853A (zh) * | 2010-08-24 | 2012-03-14 | ***通信集团公司 | 分布式数据库***、在其中建立索引的方法和查询方法 |
CN102646121A (zh) * | 2012-02-23 | 2012-08-22 | 武汉大学 | 结合RDBMS和Hadoop云存储的两级存储方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489445B2 (en) * | 2013-03-13 | 2016-11-08 | Nice Systems Ltd. | System and method for distributed categorization |
-
2014
- 2014-10-30 CN CN201410601171.XA patent/CN104331453B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102375853A (zh) * | 2010-08-24 | 2012-03-14 | ***通信集团公司 | 分布式数据库***、在其中建立索引的方法和查询方法 |
CN102646121A (zh) * | 2012-02-23 | 2012-08-22 | 武汉大学 | 结合RDBMS和Hadoop云存储的两级存储方法 |
Non-Patent Citations (1)
Title |
---|
云计算环境下大规模数据处理的研究与初步实现;张兴旺等;《现代图书情报技术》;20110425;第17-23页 * |
Also Published As
Publication number | Publication date |
---|---|
CN104331453A (zh) | 2015-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104331453B (zh) | 一种分布式文件***及分布式文件***的构建方法 | |
CN106708427B (zh) | 一种适用于键值对数据的存储方法 | |
US10289315B2 (en) | Managing I/O operations of large data objects in a cache memory device by dividing into chunks | |
US10635643B2 (en) | Tiering data blocks to cloud storage systems | |
CN103179185B (zh) | 一种分布式文件***客户端缓存中文件创建方法及其*** | |
CN103544045A (zh) | 一种基于hdfs的虚拟机镜像存储***及其构建方法 | |
CN103761190B (zh) | 数据处理方法及装置 | |
WO2016086819A1 (zh) | 将数据写入叠瓦状磁记录smr硬盘的方法及装置 | |
US8112607B2 (en) | Method and system for managing large write-once tables in shadow page databases | |
CN103106286B (zh) | 元数据的管理方法和装置 | |
US20130339314A1 (en) | Elimination of duplicate objects in storage clusters | |
CN104850572A (zh) | HBase非主键索引构建与查询方法及其*** | |
CN104978151A (zh) | 基于应用感知的重复数据删除存储***中的数据重构方法 | |
CN106021031B (zh) | 一种btrfs文件***的删除数据恢复方法和装置 | |
CN105549905A (zh) | 一种多虚拟机访问分布式对象存储***的方法 | |
CN106095807B (zh) | 一种分布式文件***纠删码缓存装置及其缓存方法 | |
CN107291889A (zh) | 一种数据存储方法及*** | |
CN102915278A (zh) | 重复数据删除方法 | |
CN103593477A (zh) | 一种哈希数据库的配置方法和装置 | |
US8572338B1 (en) | Systems and methods for creating space-saving snapshots | |
CN109522283A (zh) | 一种重复数据删除方法及*** | |
CN109542861B (zh) | 一种文件管理方法、装置和*** | |
CN107783988A (zh) | 一种目录树的加锁方法及设备 | |
CN106469123A (zh) | 一种基于nvdimm的写缓存分配、释放方法及其装置 | |
CN104965835B (zh) | 一种分布式文件***的文件读写方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |