CN118018563A - 一种具有分布式存储结构的*** - Google Patents
一种具有分布式存储结构的*** Download PDFInfo
- Publication number
- CN118018563A CN118018563A CN202410424529.XA CN202410424529A CN118018563A CN 118018563 A CN118018563 A CN 118018563A CN 202410424529 A CN202410424529 A CN 202410424529A CN 118018563 A CN118018563 A CN 118018563A
- Authority
- CN
- China
- Prior art keywords
- file data
- storage
- server
- file
- transmission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 claims abstract description 37
- 238000013523 data management Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 3
- 238000013500 data storage Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种具有分布式存储结构的***,属于数据存储技术领域,本发明通过云端***构建广域网分布式存储结构将文件数据分散在多个存储服务器进行存储,再通过云端***对不同地域和存储相应文件数据的存储服务器统一管理,克服集中式数据管理架构单点性能瓶颈的问题;通过文件传输策略来对批量小文件数据和大文件数据进行分类处理,匹配存储服务器对应的性能极限,从而提高资源合理利用,提升文件数据的传输速率。
Description
技术领域
本发明公开一种数据存储技术,尤其是涉及一种具有分布式存储结构的***。
背景技术
云计算平台,是指基于硬件资源和软件资源的服务,提供计算、网络和存储能力,SaaS软件运营服务是让用户能够通过互联网连接来使用基于云的应用程序。所有基础结构、中间件、应用软件和应用数据都位于服务提供商的数据中心内。服务提供商负责管理硬件和软件,并根据适当的服务协议确保应用和数据的可用性和安全性。
现有提供SaaS软件运营服务的云平台服务器向客户端用户传输大文件数据或批量传输小文件数据时存在传输效率不高的问题,在于储存端***采用集中式数据管理架构,集中式数据管理架构由于单点性能瓶颈,在点对点进行大文件数据或批量小文件数据传输时,储存端***的任务队列会挂起进行逐个一一传输,导致传输速率大大拖慢,时延严重,也有通过异步写入的方式整合数据包进行并行化处理,虽能够节省传输时间,但写入时对磁盘资源等损耗较大,为此需要一种更高效的文件传输方法。
发明内容
本发明的目的是为了解决上述的问题而提供一种具有分布式存储结构的***。
为实现上述目的,本发明提供了如下技术方案:一种具有分布式存储结构的***,包括云端***和用户端,所述云端***的结构单元包括如下:
接口层,其包括上传下载模块和传输控制模块,为***的其它结构单元提供接口服务;
传输分配策略层,其可采取文件传输策略将文件数据进行自动分类打包;
任务队列,其包含若干个用于传输文件数据的数据通道;
存储服务器,其用于存储代理程序;
所述云端***采用广域网分布式存储结构统一管理文件数据,所述用户端可通过服务器节点互联到云端***的SaaS软件运营服务对存储服务器中的文件数据进行访问。
通过采用上述技术方案,存储服务器分散在各个物理地域,借助云端***采用广域网分布式存储结构统一管理文件数据,利用多台存储服务器分担存储负担,利用哈希值检索来确定相应的文件数据位置,并根据存储服务器的位置定位来分配而忽视的服务器节点进行互联,满足低时延高速传输的要求。
作为优选,所述传输分配策略层采取的文件传输策略如下:
S1,预设文件数据的大小值M作为条件阈值,将需要传输的文件数据按照条件阈值M分类成大文件数据和小文件数据,将大文件数据分割成N个分级文件数据;
S2,设置n个集合将分级文件数据和批量小文件数据分类打包成文件数据块,设置每个文件数据块集合内总的文件数据大小阈值为m;
S3,将n个文件数据块分配到对应数量为n的服务器节点传输到用户端;
S4,用户端接收下载服务器节点传输的文件数据块,并将文件数据块中的分级文件数据重组获取大文件数据。
通过采用上述技术方案,通过文件传输策略将大文件数据和批量小文件数据进行分类打包文件数据块来下放到任务队列的相应数据通道进行合理分配。
作为优选,所述大文件数据采用分片并行传输策略,所述分级文件数据的大小值小于或等于M,所述小文件数据采用通道复用传输策略。
通过采用上述技术方案,通过分片并行传输策略和通道复用传输策略使任务队列的数据通道处于最大化的合理利用。
作为优选,所述存储服务器的缓冲区的大小大于或等于每个文件数据块集合内总的文件数据大小阈值m。
通过采用上述技术方案,存储服务器的缓冲区的最大值代表存储服务器传输的性能极限,将每个文件数据块集合内总的文件数据大小阈值m能够最大限度地调动存储服务器性能进行传输文件数据块。
作为优选,所述存储服务器具有存储文件数据生命周期管理机制,其机制如下:
M1,定期记录各个文件数据的访问频率f,预设一个访问频率条件阈值F,将存储服务器的储存媒介按照性能分级,分为高性能存储端和低性能存储端;
M2,如果某一文件数据周期内的访问频率f小于F时,将该文件数据迁移到低性能存储端;否则,将该文件数据迁移到高性能存储端。
通过采用上述技术方案,通过性能分级来控制存储服务器对应的储存媒介搭建成本,合理分配存储资源,并且能够借此获取到多访问频率的文件数据信息的流动方向以此大数据分析用户端的需求。
作为优选,所述存储服务器具有负载均衡调整策略,所述存储服务器包括常用服务端和备用服务端,且根据高性能存储端和低性能存储端配置常用服务端和备用服务端的数量,其策略如下:
K1,当存储服务器处于低负载时,用户端访问时接入常用服务端,并且备用服务端保持实时同步常用服务端存储的文件数据;
K2,当存储服务器处于高负载时,用户端访问时动态根据负载情况接入备用服务端。
通过采用上述技术方案,通过负载均衡调整策略来动态分配常用服务端和备用服务端的使用,保证云端***提供SaaS软件运营服务时减少网络堵塞和存储服务器卡顿的情况,提升用户的使用体验。
与现有技术相比,本发明的有益效果是:
通过云端***构建广域网分布式存储结构将文件数据分散在多个存储服务器进行存储,再通过云端***对不同地域和存储相应文件数据的存储服务器统一管理,克服集中式数据管理架构单点性能瓶颈的问题;通过文件传输策略来对批量小文件数据和大文件数据进行分类处理,匹配存储服务器对应的性能极限,从而提高资源合理利用,提升文件数据的传输速率。
附图说明
图1为云端***和用户端的数据结构简图;
图2为文件传输策略流程简图;
图3为用户端通过服务器节点访问存储服务器的流程简图;
图4为存储服务器关于存储文件数据生命周期管理机制简图;
图5为负载均衡调整策略流程简图;
图6为云端***关于存储服务器的状态监控示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,在本发明的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
一种具有分布式存储结构的***,如图1和图3所示,包括云端***和用户端,云端***的结构单元包括如下:
接口层,其包括上传下载模块和传输控制模块,为***的其它结构单元提供接口服务;
传输分配策略层,其可采取文件传输策略将文件数据进行自动分类打包;
任务队列,其包含若干个用于传输文件数据的数据通道;
存储服务器,其用于存储代理程序;
云端***采用广域网分布式存储结构统一管理文件数据,用户端可通过服务器节点互联到云端***的SaaS软件运营服务对存储服务器中的文件数据进行访问。
如图2所示,传输分配策略层采取的文件传输策略如下:
S1,预设文件数据的大小值M作为条件阈值,将需要传输的文件数据按照条件阈值M分类成大文件数据和小文件数据,将大文件数据分割成N个分级文件数据;
S2,设置n个集合将分级文件数据和批量小文件数据分类打包成文件数据块,设置每个文件数据块集合内总的文件数据大小阈值为m;
大文件数据采用分片并行传输策略,即待传输的大文件数据采用分片策略分割成N个分级文件数据,并使分级文件数据的大小值小于或等于M,传输时将分级文件数据分散到多个数据通道进行并行传输;
小文件数据采用通道复用传输策略,即批量待传输的小文件数据整合成一个文件数据块并利用一个数据通道来传输;
存储服务器的缓冲区的大小大于或等于每个文件数据块集合内总的文件数据大小阈值m,存储服务器的缓冲区的最大缓存应大于或等于阈值m,一个文件数据块占用的数据通道资源能够得到最大化利用,使任务队列分配数据通道时能够动态适配存储服务器的缓冲区;
S3,将n个文件数据块分配到对应数量为n的服务器节点传输到用户端;
多节点的服务器节点结构能够同时进行响应到用户端进行互联,提高上传下载速率;
S4,用户端接收下载服务器节点传输的文件数据块,并将文件数据块中的分级文件数据重组获取大文件数据。
实施例二
如图4所示,存储服务器具有存储文件数据生命周期管理机制,其机制如下:
M1,定期记录各个文件数据的访问频率f,预设一个访问频率条件阈值F,将存储服务器的储存媒介按照性能分级,分为高性能存储端和低性能存储端;
M2,如果某一文件数据周期内的访问频率f小于F时,将该文件数据迁移到低性能存储端;否则,将该文件数据迁移到高性能存储端。
高频率访问的文件数据意味该文件数据具有更高的使用率和信息价值,将其分配高性能存储端进行储存,具有架构成本更高和传输速率更高的储存媒介,能够更合理的利用资源来提高商业价值。
实施例三
如图3和图5所示,存储服务器具有负载均衡调整策略,存储服务器包括常用服务端和备用服务端,且根据高性能存储端和低性能存储端配置常用服务端和备用服务端的数量,其策略如下:
K1,当存储服务器处于低负载时,用户端访问时接入常用服务端,并且备用服务端保持实时同步常用服务端存储的文件数据;
K2,当存储服务器处于高负载时,用户端访问时动态根据负载情况接入备用服务端。
如图6所示,文件数据传输时,云端***会进行存储服务器的状态监控,当用户端通过节点服务器访问某一文件数据时,该文件数据对应的常用服务端处于高负载时,会动态分配到文件数据对应的备用服务端,并且文件数据检索采用哈希值校验,能够确保文件数据一致,并且访问更改该文件数据信息时,其它备用服务端或常用服务端会进行实时同步替换更新到该文件数据的新版本来保证数据的一致性;并且当存储服务器对应的节点服务器传输时失联或者故障时,会及时分配存储有相同文件数据的存储服务器接替任务队列。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (5)
1.一种具有分布式存储结构的***,其特征在于,包括云端***和用户端,所述云端***的结构单元包括如下:
接口层,其包括上传下载模块和传输控制模块,为***的其它结构单元提供接口服务;
传输分配策略层,其可采取文件传输策略将文件数据进行自动分类打包;
任务队列,其包含若干个用于传输文件数据的数据通道;
存储服务器,其用于存储代理程序;
所述云端***采用广域网分布式存储结构统一管理文件数据,所述用户端可通过服务器节点互联到云端***的SaaS软件运营服务对存储服务器中的文件数据进行访问;
所述传输分配策略层采取的文件传输策略如下:
S1,预设文件数据的大小值M作为条件阈值,将需要传输的文件数据按照条件阈值M分类成大文件数据和小文件数据,将大文件数据分割成N个分级文件数据;
S2,设置n个集合将分级文件数据和批量小文件数据分类打包成文件数据块,设置每个文件数据块集合内总的文件数据大小阈值为m;
S3,将n个文件数据块分配到对应数量为n的服务器节点传输到用户端;
S4,用户端接收下载服务器节点传输的文件数据块,并将文件数据块中的分级文件数据重组获取大文件数据。
2.根据权利要求1所述的一种具有分布式存储结构的***,其特征在于,所述大文件数据采用分片并行传输策略,所述分级文件数据的大小值小于或等于M,所述小文件数据采用通道复用传输策略。
3.根据权利要求2所述的一种具有分布式存储结构的***,其特征在于,所述存储服务器的缓冲区的大小大于或等于每个文件数据块集合内总的文件数据大小阈值m。
4.根据权利要求3所述的一种具有分布式存储结构的***,其特征在于,所述存储服务器具有存储文件数据生命周期管理机制,其机制如下:
M1,定期记录各个文件数据的访问频率f,预设一个访问频率条件阈值F,将存储服务器的储存媒介按照性能分级,分为高性能存储端和低性能存储端;
M2,如果某一文件数据周期内的访问频率f小于F时,将该文件数据迁移到低性能存储端;否则,将该文件数据迁移到高性能存储端。
5.根据权利要求4所述的一种具有分布式存储结构的***,其特征在于,所述存储服务器具有负载均衡调整策略,所述存储服务器包括常用服务端和备用服务端,且根据高性能存储端和低性能存储端配置常用服务端和备用服务端的数量,其策略如下:
K1,当存储服务器处于低负载时,用户端访问时接入常用服务端,并且备用服务端保持实时同步常用服务端存储的文件数据;
K2,当存储服务器处于高负载时,用户端访问时动态根据负载情况接入备用服务端。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410424529.XA CN118018563A (zh) | 2024-04-10 | 2024-04-10 | 一种具有分布式存储结构的*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410424529.XA CN118018563A (zh) | 2024-04-10 | 2024-04-10 | 一种具有分布式存储结构的*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118018563A true CN118018563A (zh) | 2024-05-10 |
Family
ID=90946685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410424529.XA Pending CN118018563A (zh) | 2024-04-10 | 2024-04-10 | 一种具有分布式存储结构的*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118018563A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102841931A (zh) * | 2012-08-03 | 2012-12-26 | 中兴通讯股份有限公司 | 分布式文件***的存储方法及装置 |
CN103118136A (zh) * | 2013-02-28 | 2013-05-22 | 杭州电子科技大学 | 一种基于块级别云存储负载均衡优化的方法 |
CN108810140A (zh) * | 2018-06-12 | 2018-11-13 | 湘潭大学 | 云存储***中基于动态阈值调整的分级存储方法 |
CN116401225A (zh) * | 2023-03-28 | 2023-07-07 | 北京航空航天大学 | 一种面向卫星云的分布式文件*** |
-
2024
- 2024-04-10 CN CN202410424529.XA patent/CN118018563A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102841931A (zh) * | 2012-08-03 | 2012-12-26 | 中兴通讯股份有限公司 | 分布式文件***的存储方法及装置 |
WO2013178155A1 (zh) * | 2012-08-03 | 2013-12-05 | 中兴通讯股份有限公司 | 分布式文件***的存储方法及装置 |
CN103118136A (zh) * | 2013-02-28 | 2013-05-22 | 杭州电子科技大学 | 一种基于块级别云存储负载均衡优化的方法 |
CN108810140A (zh) * | 2018-06-12 | 2018-11-13 | 湘潭大学 | 云存储***中基于动态阈值调整的分级存储方法 |
CN116401225A (zh) * | 2023-03-28 | 2023-07-07 | 北京航空航天大学 | 一种面向卫星云的分布式文件*** |
Non-Patent Citations (7)
Title |
---|
BRAND: "常用负载均衡详解(图文总结)", Retrieved from the Internet <URL:https://www.cnblogs.com/wzh2010/p/18031153> * |
屠要峰等人: "基于分布式块存储***的服务质量研究与优化", 《电信科学》, vol. 34, no. 4, 20 April 2018 (2018-04-20), pages 118 - 128 * |
庞丽萍;朱楚波;吴松;熊慕舟;: "广域存储虚拟化的一种基于最小代价副本管理模型", 华中科技大学学报(自然科学版), no. 1 * |
曹风华;: "一种基于授权机制的分布式文件***小文件访问优化策略", 计算机***应用, no. 07, 15 July 2013 (2013-07-15) * |
梁浩等人: "基于云计算的分布式存储***文件传输优化", 《自动化技术与应用》, vol. 42, no. 5, 17 May 2023 (2023-05-17) * |
金斌等人: "数据中心分层存储技术探究及实践", 《中国金融电脑》, no. 5, 7 May 2016 (2016-05-07), pages 71 - 75 * |
金海, 官象山, 吴松, 谢超: "分布式存储***中文件传输优化的设计与实现", 华中科技大学学报(自然科学版), no. 01, 30 January 2005 (2005-01-30), pages 4 - 8 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11237871B1 (en) | Methods, systems, and devices for adaptive data resource assignment and placement in distributed data storage systems | |
US10992739B2 (en) | Integrated application-aware load balancer incorporated within a distributed-service-application-controlled distributed computer system | |
US9977618B2 (en) | Pooling of memory resources across multiple nodes | |
US20030236837A1 (en) | Content delivery system providing accelerate content delivery | |
US20020107989A1 (en) | Network endpoint system with accelerated data path | |
US20030236919A1 (en) | Network connected computing system | |
US20030236861A1 (en) | Network content delivery system with peer to peer processing components | |
US20020105972A1 (en) | Interprocess communications within a network node using switch fabric | |
US20020107971A1 (en) | Network transport accelerator | |
US20020116452A1 (en) | Network connected computing system including storage system | |
US20050138162A1 (en) | System and method for managing usage quotas | |
US20020107962A1 (en) | Single chassis network endpoint system with network processor for load balancing | |
US20060294045A1 (en) | Control of service workload management | |
JP2023532947A (ja) | データ転送方法、プロキシサーバ、記憶媒体及び電子デバイス | |
US9860317B1 (en) | Throughput throttling for distributed file storage services with varying connection characteristics | |
US11743333B2 (en) | Tiered queuing system | |
WO2002046945A2 (en) | Network connected computing systems including network switch | |
US20200050479A1 (en) | Blockchain network and task scheduling method therefor | |
WO2003096190A1 (en) | Real-time storage area network | |
US20140032766A1 (en) | Real-time storage area network | |
US11354164B1 (en) | Robotic process automation system with quality of service based automation | |
CN118018563A (zh) | 一种具有分布式存储结构的*** | |
US11277356B2 (en) | Network buffer credit allocation | |
Liu et al. | Virtualization Solution for Fast Storage Based on RoCE+ P2P Technology in Heterogeneous Environment | |
KR20240053091A (ko) | 클라우드 기반 마이크로 서비스 제공 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |