CN105138571B - 分布式文件***及其存储海量小文件的方法 - Google Patents

分布式文件***及其存储海量小文件的方法 Download PDF

Info

Publication number
CN105138571B
CN105138571B CN201510443330.2A CN201510443330A CN105138571B CN 105138571 B CN105138571 B CN 105138571B CN 201510443330 A CN201510443330 A CN 201510443330A CN 105138571 B CN105138571 B CN 105138571B
Authority
CN
China
Prior art keywords
storage
file
data storage
small
main server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510443330.2A
Other languages
English (en)
Other versions
CN105138571A (zh
Inventor
杨雪莲
***
姜韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Changhong Electric Co Ltd
Original Assignee
Sichuan Changhong Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Changhong Electric Co Ltd filed Critical Sichuan Changhong Electric Co Ltd
Priority to CN201510443330.2A priority Critical patent/CN105138571B/zh
Publication of CN105138571A publication Critical patent/CN105138571A/zh
Application granted granted Critical
Publication of CN105138571B publication Critical patent/CN105138571B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1824Distributed file systems implemented using Network-attached Storage [NAS] architecture

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及数据存储领域,提供一种分布式文件***及其存储海量小文件的方法,以解决目前的海量小文件存储的效率较低的问题,该***包括客户端、资源定位模块和数据存储模块。本发明提出的技术方案将小文件合并成大文件来存储,通过定位到大文件的指定位置来访问小文件,减少了对文件的读写次数,简化了IO访问流程,提高了文件***的处理性能。

Description

分布式文件***及其存储海量小文件的方法
技术领域
本发明涉及数据存储领域,特别涉及一种分布式文件***及其存储海量小文件的方法。
背景技术
如今,人类已经步入信息化时代,各行各业产生的数据信息总量正呈现***式地增长,例如,纽约证券交易所一天产生的数据可以达到一个T的级别,著名的社交网站Facebook在全球拥有上亿的用户,因此需要存储的用户数据非常庞大,在这些庞大的用户数据中,海量小文件所占的比重正逐渐增大。在这种大背景下,如何将这些由社会化网络、移动通信、网络视频音频、科学实验等各种应用产生的文件数据进行有效地、安全地存储并且能方便用户随时查找,已成为信息化时代亟待解决的难题。通常认为大小在1MB以内的文件为小文件,百万级数量及以上称为海量,数据越庞大,需要存储空间就越多,此时如果继续采用传统的存储方式不仅成本非常高,而且也较复杂。因此如何用普通的硬件来实现海量数据的存储,逐渐成为热点课题,分布式文件***在这种大背景下应运而生。
分布式文件***,是一种允许文件通过网络在多台主机上分享的文件***,分布式文件***可以让多台机器上的多用户分享文件和存储空间。分布式文件***最大的一个特性叫做通透性,在分布式文件***中,访问文件上的数据实际上是通过网络来实现的,但是在用户看来,访问分布式文件***与访问本地磁盘文件是一样的。在处理海量小文件的问题上,由于海量小文件需要的存储容量巨大,文件***的处理性能会受到显著的影响,在文件***中,由于文件的索引节点和数据保存在存储器的不同位置上,因此访问一个文件时就需要经历多次独立的随机访问,但是在大并发量的情况下,这种随机访问对于磁盘***来说是非常低效的。
发明内容
【要解决的技术问题】
本发明的目的是提供一种分布式文件***及其存储小文件的方法,以解决目前的海量小文件存储的效率较低的问题。
【技术方案】
本发明是通过以下技术方案实现的。
本发明首先涉及一种分布式文件***,包括客户端、资源定位模块和数据存储模块,
所述客户端被配置成:向资源定位模块发送小文件上传请求、将小文件上传至数据存储模块;
所述资源定位模块包括至少一个资源***,所述资源***被配置成:处理客户端发送的小文件上传请求、为客户端分配源节点、指定数据存储服务器中的一个数据存储节点作为合并存储的主服务器,所述主服务器被配置成:为小文件分配空闲存储单元并完成小文件的合并存储、将小文件的存储信息同步到与主服务器同组的其他数据存储节点,所述源节点为资源***查询得到的可用的数据存储节点,所述源节点被配置成:将上传的小文件主动推送至与其同组的其他数据存储节点;
所述数据存储模块包括至少一组数据存储服务器,所述数据存储服务器包括至少一个数据存储节点,所述数据存储模块被配置成用于实现小文件的存储、同步。
作为一种优选的实施方式,所述数据存储节点的存储空间包括大小相等的多个存储单元,所述存储单元包括最小存储空间和最大存储空间,所述主服务器被配置成:当上传的小文件小于最小存储空间时,则上传的小文件占用一个存储空间;当上传的小文件大于最大存储空间时,则上传的小文件作为一个单独的文件存储。
作为另一种优选的实施方式,所述主服务器还包括为各个数据存储节点分配的以空闲存储单元大小作为关键字的平衡二叉树,所述平衡二叉树用于保存空闲存储单元。
作为另一种优选的实施方式,所述主服务器为数据存储服务器中最先启动的数据存储节点或最近一次与资源***发起主动连接的数据存储节点。
本发明还涉及一种分布式文件***存储海量小文件的方法,包括步骤:
A、组建权利要求1至4中任一所述的分布式文件***;
B、当用户需要上传小文件时,通过客户端向资源***发起上传请求,资源***为客户端分配源节点并指定数据存储服务器中的一个数据存储节点作为主服务器,所述主服务器为小文件分配空闲存储单元并完成小文件的合并存储,文件合并存储结束后,将空闲存储单元的使用情况发送至主服务器;
C、源节点将小文件及其存储信息同步到与源节点同组的其他数据存储节点;
D、主服务器将合并存储日志同步到与主服务器同组的其他数据存储节点。
作为一种优选的实施方式,所述步骤B具体包括步骤:
B1、当用户需要上传文件时,由客户端向资源***发起上传请求;
B2、资源***查询可用的数据存储节点作为源节点并指定主服务器;
B3、资源***将源节点的IP和端口信息返回给客户端;
B4、客户端上传小文件到源节点;
B5、源节点判断其本身是否是主服务器,如果不是,执行步骤B6,反之则跳转至步骤B7;
B6、源节点发送请求到主服务器,请求主服务器分配一个可用的空闲存储单元进行合并存储,转入步骤B10;
B7、源节点查找主服务器的平衡二叉树是否有合适的空闲存储单元,如果没有,则执行步骤B8,反之则跳转至步骤B9;
B8、使用一个新的存储单元进行小文件的存储,存储完毕后将存储单元的剩余存储空间作为空闲存储单元添加至平衡二叉树,转入步骤B10;
B9、将查找到的空闲存储单元分成两部分,将空闲存储单元的一部分存储文件,将空闲存储单元的另一部分作为新的空闲存储单元加入到平衡二叉树,转入步骤B10;
B10、文件合并存储结束后,将空闲存储单元的使用情况发送至主服务器,将生成的合并文件ID返回给客户端。
作为另一种优选的实施方式,所述合并存储日志包括文件的操作信息、大文件名、小文件在大文件中的偏移量、小文件占用的存储空间大小。
作为另一种优选的实施方式,所述步骤C还包括:
启动线程对日志文件进行轮询,检查是否有需要同步的文件,并将已同步的文件记录到标识文件;
数据存储节点定时将自身的状态信息上报给资源***;
源节点向资源***报告其向每个数据存储节点同步小文件及其存储信息的时间。
作为另一种优选的实施方式,所述文件的存储信息包括文件上传信息、文件删除信息。
作为另一种优选的实施方式,所述步骤D具体包括步骤:
D1、主服务器收到空闲单元的使用情况后,更新合并存储日志;
D2、主服务器分别对与其同组的数据存储节点各创建一个同步线程;
D3、主服务器通过同步线程将合并存储日志同步到与其同组的其他数据存储节点;
D4、与主服务器同组的数据存储节点接收并保持合并存储日志。
【有益效果】
本发明提出的技术方案具有以下有益效果:
本发明构建分布式文件***,将小文件合并成大文件来存储,通过定位到大文件的指定位置来访问小文件,减少了对文件的读写次数,简化了IO访问流程,提高了文件***的处理性能。
附图说明
图1为本发明的实施例一提供的分布式文件***的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图,对本发明的具体实施方式进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例,也不是对本发明的限制。基于本发明的实施例,本领域普通技术人员在不付出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
实施例一
实施例一提供一种分布式文件***,图1为本发明实施例一提供的分布式文件***。如图1所示,该***包括客户端、资源定位模块和数据存储模块,
客户端是用户的操作入口,其分别与资源定位模块和数据存储模块连接,客户端被配置成:向资源定位模块发送小文件上传请求、将小文件上传至数据存储模块。
资源定位模块包括至少一个资源***,资源***被配置成:处理客户端发送的小文件上传请求、为客户端分配源节点、指定数据存储服务器中的一个数据存储节点作为合并存储的主服务器,主服务器被配置成:为小文件分配空闲存储单元并完成小文件的合并存储、将小文件的存储信息同步到与主服务器同组的其他数据存储节点,源节点为资源***查询得到的可用的数据存储节点,源节点被配置成:将上传的小文件主动推送至与其同组的其他数据存储节点。需要说明,由于资源定位模块由一个或者多个资源***组成,为了避免不同的资源***指定不同主服务器,需要选择一个主要的资源***,可以将最先启动的资源***设置为主资源***,将数据存储服务器端最先启动的那个数据存储节点作为合并存储的主服务器,另外,当作为合并存储的主服务器宕机时,主资源***选择最近一次发起主动连接的数据存储节点作为合并存储的主服务器。另外需要说明,小文件的存储信息包括文件上传信息、文件删除信息。
本实施例中,主服务器还包括为各个数据存储节点分配的以空闲存储单元大小作为关键字的平衡二叉树,平衡二叉树用于保存空闲存储单元。
数据存储模块包括至少一组数据存储服务器,数据存储服务器包括至少一个数据存储节点,数据存储模块被配置成用于实现小文件的存储、同步。需要说明,同一组的数据存储节点存储的文件是一致的,不同组的数据存储节点是相互独立的。
数据存储节点的存储空间包括大小相等的多个存储单元,存储单元包括最小存储空间和最大存储空间,主服务器被配置成:当上传的小文件小于最小存储空间时,则上传的小文件占用一个存储空间;当上传的小文件大于最大存储空间时,则上传的小文件作为一个单独的文件存储。
实施例二
实施例二提供基于实施例一中的分布式文件***进行海量小文件存储的方法,该方法包括以下步骤:组建分布式文件***、小文件上传、源节点同步和主服务器同步,下面分别对各个步骤进行详细说明。
(一)组建分布式文件***
具体地,组件实施例一种的分布式文件***。
(二)小文件上传
小文件上传包括步骤2.1至2.10,下面分别对步骤2.1至步骤2.10进行详细说明。
步骤2.1、当用户需要上传小文件时,由客户端向资源***发起上传请求。
步骤2.2、资源***查询可用的数据存储节点作为源节点并指定主服务器。
步骤2.3、资源***将源节点的IP和端口信息返回给客户端。
步骤2.4、客户端上传小文件到源节点。
步骤2.5、源节点判断其本身是否是主服务器,如果不是,执行步骤2.6,反之则跳转至步骤2.7。
步骤2.6、源节点发送请求到主服务器,请求主服务器分配一个可用的空闲存储单元进行合并存储,转入步骤2.10。
步骤2.7、源节点查找主服务器的平衡二叉树是否有合适的空闲存储单元,如果没有,则执行步骤2.8,反之则跳转至步骤2.9。
步骤2.8、使用一个新的存储单元进行小文件的存储,存储完毕后将存储单元的剩余存储空间作为空闲存储单元添加至平衡二叉树,转入步骤2.10。
步骤2.9、将查找到的空闲存储单元分成两部分,将空闲存储单元的一部分存储文件,将空闲存储单元的另一部分作为新的空闲存储单元加入到平衡二叉树,转入步骤2.10.
步骤2.10、文件合并存储结束后,将空闲存储单元的使用情况发送至主服务器,将生成的合并文件ID返回给客户端。
(三)源节点同步
源节点采用主动推送的方式,将文件同步到与其同组的其他数据存储节点,包括以下具体步骤:
数据存储节点的日志文件记录文件上传、删除等更新操作,日志只记录文件名,不记录文件内容;
源节点对同组内除了自己以外的每一个数据存储节点都启动一个线程来进行文件同步,需要说明,只有源节点的数据才需要同步,备份数据不需要再次同步;
启动线程对日志文件进行轮询,检查是否有需要同步的文件,并将已同步的文件记录到标识文件;
数据存储节点定时将自身的状态信息上报给资源***,另外,源节点还需要向资源***报告其向每个数据存储节点同步小文件及小文件的存储信息的时间点。资源***根据数据存储源节点的同步信息,就能得到组内的其他数据存储节点的同步情况以及最新文件被同步的时间点。
(四)主服务器同步
主服务器同步包括步骤4.1至4.4,下面分别对步骤4.1至步骤4.4进行详细说明。
步骤4.1、主服务器收到空闲单元的使用情况后,更新合并存储日志,合并存储日志主要记录文件的操作信息、大文件名、小文件在大文件中的偏移量、小文件占用的存储空间大小等;
步骤4.2、主服务器分别对与其同组的数据存储节点各创建一个同步线程;
步骤4.3、主服务器通过同步线程采用主动推送的方式将合并存储日志同步到与其同组的其他数据存储节点;
步骤4.4、与主服务器同组的数据存储节点接收并保持合并存储日志。
从以上实施例可以看出,本发明实施例通过分布式文件***,将小文件合并成大文件来存储,通过定位到大文件的指定位置来访问小文件,减少了对文件的读写次数,简化了IO访问流程,提高了文件***的处理性能。

Claims (8)

1.一种分布式文件***,其特征在于包括客户端、资源定位模块和数据存储模块,
所述客户端被配置成:向资源定位模块发送小文件上传请求、将小文件上传至数据存储模块;
所述资源定位模块包括至少一个资源***,所述资源***被配置成:处理客户端发送的小文件上传请求、为客户端分配源节点、指定数据存储服务器中的一个数据存储节点作为合并存储的主服务器,所述主服务器被配置成:为小文件分配空闲存储单元并完成小文件的合并存储、将小文件的存储信息同步到与主服务器同组的其他数据存储节点,所述源节点为资源***查询得到的可用的数据存储节点,所述源节点被配置成:将上传的小文件主动推送至与其同组的其他数据存储节点,所述主服务器还包括为各个数据存储节点分配的以空闲存储单元大小作为关键字的平衡二叉树,所述平衡二叉树用于保存空闲存储单元;
所述数据存储模块包括至少一组数据存储服务器,所述数据存储服务器包括至少一个数据存储节点,所述数据存储模块被配置成用于实现小文件的存储、同步,所述数据存储节点的存储空间包括大小相等的多个存储单元,所述存储单元包括最小存储空间和最大存储空间,所述主服务器被配置成:当上传的小文件小于最小存储空间时,则上传的小文件占用一个存储空间;当上传的小文件大于最大存储空间时,则上传的小文件作为一个单独的文件存储。
2.根据权利要求1所述的分布式文件***,其特征在于所述主服务器为数据存储服务器中最先启动的数据存储节点或最近一次与资源***发起主动连接的数据存储节点。
3.一种分布式文件***存储海量小文件的方法,其特征在于包括步骤:
A、组建权利要求1或2所述的分布式文件***;
B、当用户需要上传小文件时,通过客户端向资源***发起上传请求,资源***为客户端分配源节点并指定数据存储服务器中的一个数据存储节点作为主服务器,所述主服务器为小文件分配空闲存储单元并完成小文件的合并存储,文件合并存储结束后,将空闲存储单元的使用情况发送至主服务器;
C、源节点将小文件及其存储信息同步到与源节点同组的其他数据存储节点;
D、主服务器将合并存储日志同步到与主服务器同组的其他数据存储节点。
4.根据权利要求3所述的分布式文件***存储海量小文件的方法,其特征在于所述步骤B具体包括步骤:
B1、当用户需要上传文件时,由客户端向资源***发起上传请求;
B2、资源***查询可用的数据存储节点作为源节点并指定主服务器;
B3、资源***将源节点的IP和端口信息返回给客户端;
B4、客户端上传小文件到源节点;
B5、源节点判断其本身是否是主服务器,如果不是,执行步骤B6,反之则跳转至步骤B7;
B6、源节点发送请求到主服务器,请求主服务器分配一个可用的空闲存储单元进行合并存储,转入步骤B10;
B7、源节点查找主服务器的平衡二叉树是否有合适的空闲存储单元,如果没有,则执行步骤B8,反之则跳转至步骤B9;
B8、使用一个新的存储单元进行小文件的存储,存储完毕后将存储单元的剩余存储空间作为空闲存储单元添加至平衡二叉树,转入步骤B10;
B9、将查找到的空闲存储单元分成两部分,将空闲存储单元的一部分存储文件,将空闲存储单元的另一部分作为新的空闲存储单元加入到平衡二叉树,转入步骤B10;
B10、文件合并存储结束后,将空闲存储单元的使用情况发送至主服务器,将生成的合并文件ID返回给客户端。
5.根据权利要求3所述的分布式文件***存储海量小文件的方法,其特征在于所述合并存储日志包括文件的操作信息、大文件名、小文件在大文件中的偏移量、小文件占用的存储空间大小。
6.根据权利要求3所述的分布式文件***存储海量小文件的方法,其特征在于所述步骤C还包括:
启动线程对日志文件进行轮询,检查是否有需要同步的文件,并将已同步的文件记录到标识文件;
数据存储节点定时将自身的状态信息上报给资源***;
源节点向资源***报告其向每个数据存储节点同步小文件及其存储信息的时间点。
7.根据权利要求3所述的分布式文件***存储海量小文件的方法,其特征在于所述文件的存储信息包括文件上传信息、文件删除信息。
8.根据权利要求3所述的分布式文件***存储海量小文件的方法,其特征在于所述步骤D具体包括步骤:
D1、主服务器接收空闲存储单元的使用情况,更新合并存储日志;
D2、主服务器分别对与其同组的数据存储节点各创建一个同步线程;
D3、主服务器通过同步线程将合并存储日志同步到与其同组的其他数据存储节点;
D4、与主服务器同组的数据存储节点接收并保持合并存储日志。
CN201510443330.2A 2015-07-24 2015-07-24 分布式文件***及其存储海量小文件的方法 Active CN105138571B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510443330.2A CN105138571B (zh) 2015-07-24 2015-07-24 分布式文件***及其存储海量小文件的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510443330.2A CN105138571B (zh) 2015-07-24 2015-07-24 分布式文件***及其存储海量小文件的方法

Publications (2)

Publication Number Publication Date
CN105138571A CN105138571A (zh) 2015-12-09
CN105138571B true CN105138571B (zh) 2019-12-24

Family

ID=54723920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510443330.2A Active CN105138571B (zh) 2015-07-24 2015-07-24 分布式文件***及其存储海量小文件的方法

Country Status (1)

Country Link
CN (1) CN105138571B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107402924A (zh) * 2016-05-19 2017-11-28 普天信息技术有限公司 Mr文件应用在hdfs的实现方法和装置
CN105956183B (zh) * 2016-05-30 2019-04-30 广东电网有限责任公司电力调度控制中心 一种分布式数据库中海量小文件的多级优化存储方法及***
CN106294603B (zh) * 2016-07-29 2019-07-23 北京奇虎科技有限公司 文件存储方法及装置
CN108614837B (zh) * 2016-12-13 2020-10-09 杭州海康威视数字技术股份有限公司 文件存储和检索的方法及装置
CN107423321B (zh) * 2017-03-31 2020-12-01 北京亿智云科技有限公司 适用大批量小文件云存储的方法及其装置
CN108959313B (zh) * 2017-05-23 2021-03-05 ***通信集团重庆有限公司 面向海量小文件的并发处理方法、装置和存储介质
CN107861686B (zh) * 2017-09-26 2021-01-05 深圳前海微众银行股份有限公司 文件存储方法、服务端和计算机可读存储介质
CN108520016A (zh) * 2018-03-21 2018-09-11 四川斐讯信息技术有限公司 基于时钟定时器和多台上传服务器的数据入库方法及***
CN110147203B (zh) * 2019-05-16 2022-11-04 北京金山云网络技术有限公司 一种文件管理方法、装置、电子设备及存储介质
CN110580599A (zh) * 2019-07-24 2019-12-17 唐颐(湖州)生物科技有限公司 一种生物样本存储空间规划的智能定位算法及装置
CN114048185B (zh) * 2021-11-18 2022-09-02 北京聚存科技有限公司 一种分布式文件***中海量小文件透明打包存储与访问的方法
CN114116634B (zh) * 2022-01-26 2022-04-22 苏州浪潮智能科技有限公司 一种缓存方法、装置及可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795211A (zh) * 2010-01-13 2010-08-04 北京中创信测科技股份有限公司 一种数据存储方法及***
CN104133882A (zh) * 2014-07-28 2014-11-05 四川大学 一种基于hdfs的小文件处理方法
CN104778214A (zh) * 2015-03-20 2015-07-15 四川长虹电器股份有限公司 基于资源***跳转的分布式文件***及其数据同步方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1662901A (zh) * 2002-06-25 2005-08-31 国际商业机器公司 用于在分布式环境中监视应用性能的方法和***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795211A (zh) * 2010-01-13 2010-08-04 北京中创信测科技股份有限公司 一种数据存储方法及***
CN104133882A (zh) * 2014-07-28 2014-11-05 四川大学 一种基于hdfs的小文件处理方法
CN104778214A (zh) * 2015-03-20 2015-07-15 四川长虹电器股份有限公司 基于资源***跳转的分布式文件***及其数据同步方法

Also Published As

Publication number Publication date
CN105138571A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN105138571B (zh) 分布式文件***及其存储海量小文件的方法
US10831612B2 (en) Primary node-standby node data transmission method, control node, and database system
CN102708165B (zh) 分布式文件***中的文件处理方法及装置
US9547706B2 (en) Using colocation hints to facilitate accessing a distributed data storage system
CN107562757B (zh) 基于分布式文件***的查询、访问方法、装置及***
CN109407977B (zh) 一种大数据分布式存储管理方法及***
CN109542861B (zh) 一种文件管理方法、装置和***
CN111400312B (zh) 一种基于改进lsm树的边缘存储数据库
US11151081B1 (en) Data tiering service with cold tier indexing
CN107291768B (zh) 一种索引建立的方法及装置
CN102739622A (zh) 一种可扩展的数据存储***
US11263270B1 (en) Heat balancing in a distributed time-series database
US11775480B2 (en) Method and system for deleting obsolete files from a file system
CN103631924A (zh) 一种分布式数据库平台的应用方法和***
CN107493309B (zh) 一种分布式***中的文件写入方法及装置
CN113254460B (zh) 数据处理方法、***、电子设备及存储介质
CN114610680A (zh) 分布式文件***元数据管理方法、装置、设备及存储介质
CN111435286A (zh) 一种数据存储方法、装置和***
CN101789963A (zh) 数据同步***
US11366598B1 (en) Dynamic lease assignments in a time-series database
CN103905512A (zh) 一种数据处理方法和设备
CN110362590A (zh) 数据管理方法、装置、***、电子设备及计算机可读介质
CN111428114A (zh) Elasticsearch搜索引擎的索引创建方法及装置
CN109408467A (zh) 一种实现数据存储的方法及装置
CN111143366B (zh) 一种针对海量大对象数据的高效能存储方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant