CN103503414B - 一种计算存储融合的集群*** - Google Patents

一种计算存储融合的集群*** Download PDF

Info

Publication number
CN103503414B
CN103503414B CN201280005761.5A CN201280005761A CN103503414B CN 103503414 B CN103503414 B CN 103503414B CN 201280005761 A CN201280005761 A CN 201280005761A CN 103503414 B CN103503414 B CN 103503414B
Authority
CN
China
Prior art keywords
data
resource server
resource
submodule
storage resources
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280005761.5A
Other languages
English (en)
Other versions
CN103503414A (zh
Inventor
顾炯炯
王道辉
闵小勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Cloud Computing Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN103503414A publication Critical patent/CN103503414A/zh
Application granted granted Critical
Publication of CN103503414B publication Critical patent/CN103503414B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • G06F3/0607Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0632Configuration or reconfiguration of storage systems by initialisation or re-initialisation of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0665Virtualisation aspects at area level, e.g. provisioning of virtual or logical volumes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种计算存储融合的集群***,包括:资源服务器群,该资源服务器群包括至少两个资源服务器,该资源服务器群中的每个资源服务器至少具有计算资源和存储资源中的一种,并且该资源服务器群中的至少一个资源服务器具有计算资源和存储资源,该存储资源包括持久化磁盘以及和所述持久化磁盘对应的缓存;存储资源控制模块,用于将所述资源服务器群中的存储资源构建成共享的存储资源池,以提供存储服务,其中每个所述存储资源池包括的存储资源来自于所述资源服务器群中的至少两个资源服务器。

Description

一种计算存储融合的集群***
技术领域
本发明涉及通信技术领域,尤其涉及一种计算存储融合的集群***。
背景技术
企业要进行信息化,购买的信息技术(InformationTechnology,简称IT)基础设施一般包括服务器设备、网络设备和存储设备三大部分,然后企业自己需要将这三部分搭建成一个网络,进行各种配置,整个过程复杂,而且后续的扩容等操作也复杂。虚拟化技术的成熟和云概念的出现,促进了一体机诞生。为减少组建网络和后续维护IT设备的复杂性,主要IT设备厂家(例如IBM/DELL/HP/CISCO等)纷纷推出了“一体机”产品,即,在一个机架内预集成服务器、存储和网络。客户购买了这种一体机后,无需进行复杂的硬件安装;更进一步,无需进行复杂的软件安装和配置,插上电以后,简单的进行配置(例如配置外网IP),就可以使用了(典型的一体机架构示意图如图1所示)。
从已经存在的各种一体机来看,都有如下两个共同的目标:(1)降低成本,保证优于个人计算机(PersonalComputer,简称PC)的性价比;(2)优化架构,保证不差于PC的性能。为实现这两个目标,高效使用存储是个关键。
一体机中的存储设备,一般使用的是存储区域网络(StorageAreaNetwork,简称SAN)或网络附加存储(NetworkAttachedStorage,简称NAS)等专用存储设备。虽然,SAN或NAS等专用存储设备作为独立的设备已经有很长时间了,但随着云计算、一体机的出现,在一体机中使用SAN或NAS专用存储设备也暴露了其固有的缺点:专用SAN或NAS需要进行复杂配置,后续维护困难;专用SAN或NAS需要控制机头,性价比不高,无法满足用户低成本要求;专用SAN或NAS受制于控制机头,横向扩展受限,无法线性扩展而满足大量数据突发的查询性能要求。这些缺点使得SAN或NAS设备成了一体机中的薄弱环节。
发明内容
本发明实施例提供一种计算存储融合的集群***,用以解决现有技术中因为使用专用SAN而导致的操作复杂、成本较高以及由于无法线性扩展而不能满足大量数据突发的查询性能要求的问题。
第一方面,本发明实施例提供一种计算存储融合的集群***,包括:
资源服务器群,所述资源服务器群包括至少两个资源服务器,所述资源服务器群中的每个资源服务器至少具有计算资源和存储资源中的一种,并且所述资源服务器群中的至少一个资源服务器具有计算资源和存储资源,所述存储资源包括持久化磁盘以及和所述持久化磁盘对应的缓存;
存储资源控制模块,用于将所述资源服务器群中的存储资源构建成共享的存储资源池,以提供存储服务,其中每个所述存储资源池包括的存储资源来自于所述资源服务器群中的至少两个资源服务器。
结合第一方面,在第一方面的第一种可能的实现方式中,所述存储资源控制模块,包括:
集群视图管理子模块,用于根据用户预设的配置信息对所述资源服务器群中的持久化磁盘进行逻辑划分以得到逻辑分区,所述每个逻辑分区都对应所述持久化磁盘上固定数量的物理存储资源块。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述存储资源控制模块,还包括数据子模块,所述资源服务器群中的每个具有存储资源的资源服务器都对应一个所述数据子模块;
所述集群视图管理子模块,还用于为所述数据子模块分配所述逻辑分区资源,建立所述数据子模块的逻辑分区拓扑结构,并根据所述数据子模块的请求,将分配的逻辑分区信息分别发给对应的所述数据子模块。
结合第一方面的第一种可能的实现方式以及第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述存储资源控制模块,还包括接口子模块,所述资源服务器群中的每个资源服务器都对应一个所述接口子模块;
所述接口子模块,用于接收用户发送的用户卷创建请求,并根据所述用户卷创建请求,在所述共享的存储资源池中为需要创建的用户卷分配与所述用户卷创建请求相应的物理存储资源块,所述物理存储资源块来自于不同的持久化磁盘。
结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述接口子模块,还用于接收用户发送的读/写数据操作请求,根据所述读/写数据操作请求中包含的用户卷标识,计算出读/写数据操作对应的物理存储资源块以及所述物理存储资源块所属的逻辑分区;根据计算出的所述物理存储资源块所属的逻辑分区确定需要执行读/写数据操作的数据子模块;将所述读/写数据操作请求发送给所述需要执行读/写数据操作的数据子模块。
结合第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述数据子模块,用于根据所述接口子模块发送的写数据操作请求,通过所述数据子模块对应的资源服务器的缓存写入数据;或者,用于根据所述接口子模块发送的读数据操作请求,通过所述数据子模块对应的资源服务器的缓存读取数据。
结合第一方面的第五种可能的实现方式,在第六种可能的实现方式中,所述通过所述数据子模块对应的资源服务器的缓存写入数据,具体包括:所述数据子模块先将数据写入所述数据子模块对应的资源服务器的缓存中,再由所述缓存将数据写入与所述用户卷标识对应的物理存储资源块中。
结合第一方面的第五种可能的实现方式,在第七种可能的实现方式中,所述通过所述数据子模块对应的资源服务器的缓存读取数据,具体包括:所述数据子模块先从所述数据子模块对应的资源服务器的缓存中读取请求的数据,如果所述缓存中没有所述请求的数据,再从所述用户卷标识对应的物理存储资源块中读取所述请求的数据,并将读取到的所述请求的数据写入缓存中。
结合第一方面的第二种可能的实现方式,在第八种可能的实现方式中,如果所述集群***增加或者删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于根据预设的逻辑分区分配算法重新生成所述数据子模块的逻辑分区拓扑结构,将新的逻辑分区拓扑结构广播给所述集群***中所有的接口子模块和数据子模块,并通知原有的数据子模块基于所述新的逻辑分区拓扑结构发起数据迁移。
结合第一方面的第八种可能的实现方式,在第九种可能的实现方式中,如果所述集群***删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于在所述数据子模块完成数据迁移后,将所述被删除的资源服务器设置为不可用状态。
结合第一方面的第三种可能的实现方式以及第一方面的第四种可能的实现方式,在第十种可能的实现方式中,所述接口子模块的接口符合小型计算机***接口协议。
结合第一方面,在第十一种可能的实现方式中,所述存储资源控制模块,还用于将所述具有存储资源的资源服务器的单个持久化磁盘作为独立节点,构建所述共享的存储资源池。
结合第一方面,以及第一方面的任意一种可能的实现方式,在第十二种可能的实现方式中,所述存储资源控制模块,还用于通过分布式算法构建并管理所述共享的存储资源池。
结合第一方面,以及第一方面的任意一种可能的实现方式,在第十三种可能的实现方式中,所述集群***中的资源服务器之间通过高速数据交换网络进行通信。
结合第一方面的第十三种可能的实现方式,在第十四种可能的实现方式中,所述高速交换网络包括高速外设组件互连标准PCI-E网络或光纤网络。
由上述技术方案可知,通过本发明实施例提供计算存储融合的集群***,由于不存在专用的SAN,省略了对SAN存储***的复杂管理,在硬件上解决了现有技术中因为使用专用SAN而导致的操作复杂、成本较高的问题;存储设备可以有多个,每个存储设备上都可以部署缓存,在硬件上极大的提升了存储端缓存的扩展能力;存储资源不依赖于计算资源,存储资源可以独立的增加和减少,增强了***的可扩展性;将***中的持久化磁盘、缓存资源虚拟化为共享资源池并被所有计算共享,数据读写时所有计算和存储都可以参与,通过并发性的提高而提升了***的存储性能。另外,由于本发明实施例提供计算存储融合的集群***采用高速数据交换网络进行通信,进一步加快了数据的交换速度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例。
图1为现有技术中典型的一体机架构示意图;
图2为本发明一实施例提供的计算存储融合的集群***的示意性框图;
图3为本发明一实施例提供的计算存储融合的集群***的结构示意图;
图4为本发明一实施例提供的磁盘分区和用户卷构成示意图;
图5为本发明一实施例提供的计算存储融合的集群***中的存储资源控制模块的结构示意图;
图6为本发明一实施例提供的MDC模块为OSD节点分配分区资源的拓扑示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明实施例提供的技术方案将计算资源与存储资源垂直整合,将一个集群***中资源服务器的存储资源整合起来,通过存储资源控制模块,使用分布式算法,将各个资源服务器中的存储资源(持久化存储资源、缓存资源)虚拟化为资源池,供所有资源服务器的计算共享使用。资源服务器之间通过高速数据交换网络进行数据通信。
图2示出了根据本发明实施例的计算存储融合的集群***100的示意性框图。如图1所示,该计算存储融合的集群***100包括:
资源服务器群110,该资源服务器群包括至少两个资源服务器,该资源服务器群中的每个资源服务器至少具有计算资源和存储资源中的一种,并且该资源服务器群中的至少一个资源服务器具有计算资源和存储资源,所述存储资源包括持久化磁盘以及和所述持久化磁盘对应的缓存;
存储资源控制模块120,用于将所述资源服务器群中的存储资源构建成共享的存储资源池,以提供存储服务,其中每个所述存储资源池包括的存储资源来自于所述资源服务器群中的至少两个资源服务器。
在本发明实施例中,计算存储融合的集群***中提供计算资源和存储资源的设备来自于资源服务器群,该资源服务器群由两个或两个以上的资源服务器组成,每个资源服务器能够提供计算资源和/或存储资源,并且至少有一个资源服务器能够同时提供计算资源和存储资源;计算存储融合的集群***中的存储资源控制模块通过对共享的一个或多个存储资源池进行管理,从而提供虚拟存储服务,该共享的存储资源池由该资源服务器群中的存储资源构建成,并且每个存储资源池包括的存储资源来自于该资源服务器群中的两个或两个以上的资源服务器。
在本发明实施例中,由于资源服务器群中的每个资源服务器具有计算资源和存储资源中的至少一种资源,并且该资源服务器群中的至少一个资源服务器具有计算资源和存储资源,即***的存储资源和计算资源联合部署,因此能够节省设备投入成本、设备占用空间成本以及设备能源消耗成本;并且由于存储资源池由资源服务器群中的至少两个资源服务器的存储资源构成,因此能够均衡各资源服务器的存储资源,提高存储资源的利用效率和可靠性。
因此,本发明实施例提供的计算存储融合的集群***,由于不存在专用的SAN,省略了对SAN存储***的复杂管理,在硬件上解决了现有技术中因为使用专用SAN而导致的操作复杂、成本较高的问题;又由于存储设备可以有多个,每个存储设备上都包括持久化磁盘和缓存,在硬件上极大的提升了存储端缓存的扩展能力;存储资源不依赖于计算资源,存储资源可以独立的增加和减少,增强了***的可扩展性;将***中的持久化磁盘、缓存资源虚拟化为共享资源池并被所有计算共享,数据读写时所有计算和存储都可以参与,通过并发性的提高而显著提升了***的存储性能。
在本发明实施例中,存储资源控制模块可以部署在资源服务器上,也可以单独部署。
在本发明实施例中,可选地,该存储资源控制模块120还用于通过分布式算法创建并管理该存储资源池。例如,存储资源控制模块通过分布式哈希表(DistributedHashTable,简称为“DHT”)方法、伪随机算法等分布式算法,创建并管理存储资源池,使得***能够提供统一共享的存储服务。
可选的,所述存储资源控制模块120还可以将所述具有存储资源的资源服务器的单个持久化磁盘作为独立节点,构建所述共享的存储资源池。
在本发明实施例中,计算资源和存储资源采用统一的硬件服务器架构,合一部署,从而能够充分地利用物理服务器的计算能力和存储能力。即***包括的每个资源服务器可同时提供计算资源和/或存储资源。在部署形态上,提供存储资源和/或计算资源的资源服务器,在物理部署形态上为同一物理设备,即存储资源和计算资源合一部署在一台服务器上,而计算资源和存储资源在逻辑上相互独立,可以分别构建自己的资源池。
进一步,为了使计算和存储深度融合,本发明实施例提供的计算存储融合的集群***可以采用纯高速外设组件互连标准(PeripheralComponentInterconnectionExpress,简称PCI-E)交换架构。基于该PCI-E交换架构,包括计算、存储所有的资源服务器都可以通过PCI-E接口直接互连进行无阻塞交换,使集群***中的计算和存储之间的通道更快速。
具体地,由于本发明实施例提供的计算存储融合的集群***的各部分都可以采用纯PCI-E交换,不管是计算设备、存储设备,还是直接的磁盘组,所有的单元都可以直接挂接到PCI-E交换网络下,无需进行不同协议之间的适配,因而进一步加快了数据的交换速度。
应理解,上述PCI-E网络只是本发明实施例采用的高速数据交换网络的一种可能实现方式,本发明实施例并不对此进行限定。例如,实际应用中,也可以使用光纤网络作为该集群***的高速数据交换网络。
图3为本发明一实施例提供的计算存储融合的集群***的结构示意图。如图3所示,本实施例的计算存储融合的集群***由高速数据交换网络、资源服务器群以及存储资源控制模块组成,该资源服务器群包括三个资源服务器,即资源服务器1、资源服务器2和资源服务器3。其中,资源服务器1只具有计算资源,资源服务器2只具有存储资源,资源服务器3既具有计算资源又具有存储资源。资源服务器2和资源服务器3的存储资源被构建成统一的共享存储资源池,该共享存储资源池包括共享的缓存资源和共享的持久化磁盘。
需要说明的是:图3仅仅为该计算存储融合的集群***部署的一种示例,实际应用中,既可以部署更多的资源服务器,也可以在每个资源服务器上同时部署计算资源和存储资源。持久化磁盘可以为硬盘驱动器(HardDiskDriver,简称HDD)或者固态硬盘(SolidStateDisk,简称SSD)。
通过这种计算存储融合的集群***,可以带来以下好处:存储设备可以有多个,每个存储设备上都可以部署缓存,在硬件上极大的提升了存储端缓存的扩展能力;存储资源不依赖于计算资源,存储资源可以独立的增加和减少,增强了***的可扩展性。
进一步,基于图3所示的计算存储融合的集群***架构,由于去掉了专用SAN,将存储资源分散到了各个资源服务器上,需要通过存储资源控制模块对这些分散的存储资源进行统一的管理。具体包括:
(1)集群***初始化时,将***中的磁盘按照固定大小块Block(例如1M)进行划分(如图4中对每个DISK的划分);
(2)通过存储资源控制模块将一定数量的Block组成一个分区(Partition,简称为PT,参见图4中标有P的方块),如图4所示,每个分区由4个Block组成,该分区为逻辑分区,对用户而言是不可见的;
(3)当用户创建卷(Volume)时,资源存储控制模块负责指定所属该卷的Block,如图4示例:Block2、Block4、Block5、Block7属于Volume1,Block6、Block8、Block9、Block12属于Volume2,Block11、Block13、Block14、Block16属于Volume3,卷对用户而言是可见的;
(4)用户对卷进行数据读写时,资源存储控制模块根据自身的算法,计算出所要读写操作的Block,并根据某种算法(如Hash算法)计算出每个Block所对应的Partition,通过Partition完成对数据的读写操作。
这样,对于一个用户卷来说,其实际的存储物理资源是分布在很多磁盘上的。这样就达到了将不同的磁盘资源共享给一个用户卷,供用户使用,即达到存储资源共享使用的目的。当用户对卷进行数据读写时,读写请求经过存储资源控制模块的处理后,将转换为对卷中不同Partition进行分布式读写。
需要说明的是:在集群***启动前,用户会根据自身的需要制作集群***的配置文件,该配置文件规划了集群***中存储资源控制模块的部署、集群***的分区规格(如Partition个数)以及不同资源服务器间的互相通信地址等信息。
如图5所示,为了实现上述功能,所述存储资源控制模块包括:
集群视图管理子模块,用于根据用户预设的配置信息对所述资源服务器群中的持久化磁盘进行逻辑划分以得到逻辑分区,所述每个逻辑分区都对应所述持久化磁盘上固定数量的物理存储资源块。
进一步的,所述存储资源控制模块,还包括数据子模块,所述资源服务器群中的每个具有存储资源的资源服务器都对应一个所述数据子模块;
应理解,在实际应用中,可以在每一个具有存储资源的资源服务器上部署所述数据子模块。
相应的,所述集群视图管理子模块,还用于为所述数据子模块分配所述逻辑分区资源,建立所述数据子模块的逻辑分区拓扑结构,并根据所述数据子模块的请求,将分配的逻辑分区信息分别发给对应的所述数据子模块。
进一步的,所述存储资源控制模块,还包括接口子模块,所述资源服务器群中的每个资源服务器都对应一个所述接口子模块;
应理解,在实际应用中,可以在每一个资源服务器上部署所述接口子模块。其中,所述接口子模块可以采用符合小型计算机***接口协议的接口。
所述接口子模块,用于接收用户发送的用户卷创建请求,并根据所述用户卷创建请求,在所述共享的存储资源池中为需要创建的用户卷分配与所述用户卷创建请求相应的物理存储资源块,所述物理存储资源块来自于不同的持久化磁盘。
进一步的,所述接口子模块,还用于接收用户发送的读/写数据操作请求,根据所述读/写数据操作请求中包含的用户卷标识,计算出读/写数据操作对应的物理存储资源块以及所述物理存储资源块所属的逻辑分区;根据计算出的所述物理存储资源块所属的逻辑分区确定需要执行读/写数据操作的数据子模块;将所述读/写数据操作请求发送给所述需要执行读/写数据操作的数据子模块。
相应的,所述数据子模块,用于根据所述接口子模块发送的写数据操作请求,通过所述数据子模块对应的资源服务器的缓存写入数据;或者,用于根据所述接口子模块发送的读数据操作请求,通过所述数据子模块对应的资源服务器的缓存读取数据。
具体地,所述通过所述数据子模块对应的资源服务器的缓存写入数据,包括:
所述数据子模块先将数据写入所述数据子模块对应的资源服务器的缓存中,再由所述缓存将数据写入与所述用户卷标识对应的物理存储资源块中。
具体地,所述通过所述数据子模块对应的资源服务器的缓存读取数据,包括:
所述数据子模块先从所述数据子模块对应的资源服务器的缓存中读取请求的数据,如果所述缓存中没有所述请求的数据,再从所述用户卷标识对应的物理存储资源块中读取所述请求的数据,并将读取到的所述请求的数据写入缓存中。
可选的,如果所述集群***增加或者删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于根据预设的逻辑分区分配算法重新生成所述数据子模块的逻辑分区拓扑结构,将新的逻辑分区拓扑结构广播给所述集群***中所有的接口子模块和数据子模块,并通知原有的数据子模块基于所述新的逻辑分区拓扑结构发起数据迁移。
如果所述集群***删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于在所述数据子模块完成数据迁移后,将所述被删除的资源服务器设置为不可用状态。
基于本发明实施例提供计算存储融合的集群***,由于不存在专用的SAN,省略了对SAN存储***的复杂管理,在硬件上解决了现有技术中因为使用专用SAN而导致的操作复杂、成本较高的问题;存储节点可以有多个,每个存储节点上都可以部署Cache,在硬件上极大的提升了存储端Cache的扩展能力;存储节点不依赖于计算节点,存储节点可以独立的增加和减少,增强了***的可扩展性。另外,由于本发明实施例提供的一体机***的各部分都是采用纯PCI-E交换,不管是计算节点、存储节点,还是直接的磁盘组,所有的单元都是直接挂接到PCI-E交换下,因而无需进行不同协议之间的适配,进一步加快了数据的交换速度。
作为本发明实施例提供的计算存储融合的集群***的一种具体应用,所述***中的存储资源控制模块的功能可以通过一种分布式存储控制软件实现。
为了更清楚地理解本发明实施例的技术方案,下面将以该分布式存储控制软件为例对本发明实施例的技术方案做进一步的说明。
具体地,该分布式存储控制软件主要包括三个功能模块:MetaDataController(简称MDC)模块,VirtualizationBlockService(简称VBS)模块和ObjectStorageDevice(简称OSD)模块。其中:
MDC模块,主要用于实现分布式集群***的状态视图控制,以及当资源服务器加入、退出集群***时进行的输入/输出(Input/Output,简称I/O)视图、分区分配视图、节点视图的更新;同时,还对数据分布式规则和数据重建规则进行控制;
VBS模块,主要用于实现基于小型计算机***接口(SmallComputerSystemInterface,简称SCSI)的块设备的访问接口,同时完成块存储元数据的保存和访问逻辑;另外,VBS模块还接受MDC模块下发的I/O视图,然后根据视图规则,将数据转发到相应的OSD节点(即,部署了OSD模块的资源服务器)上,其中,I/O视图可以由MDC模块主动下发给VBS模块,也可以由VBS模块主动从MDC模块上获取;
OSD模块,主要用于实现读写缓存功能,以及数据的一致性备份,组织磁盘数据访问等;另外,OSD模块主要接受MDC模块下发的OSD视图,然后接受VBS模块的读写命令,完成数据的存放与获取。
在实际应用中,上述MDC模块可以只部署在集群***的两个(一主一备)或三个(一主两备)资源服务器上,VBS模块部署在集群***中的每个资源服务器上,作为驱动;OSD模块部署在集群***中的每个具有存储资源的资源服务器上,用于控制本地存储资源。具体的部署方式可以依据用户提供的配置文件执行,该配置文件中包括上述功能模块的部署、集群***的分区规格(即,把每个硬盘分为多少份)以及不同资源服务器间的互相通信地址信息(包括MDC模块、VBS模块和OSD模块的地址信息)等。
当***启动后,用户通过***的管理端将配置信息导入***,MDC模块根据导入的配置信息建立***的分区信息,然后根据***下发的添加OSD节点请求建立逻辑OSD节点(是真实OSD节点在MDC模块侧的映射),并且为每个OSD节点分配分区等资源(即,每个资源服务器上的OSD模块对应的分区信息)。如图6所示,为MDC模块为OSD节点分配分区资源的拓扑示意图。当资源服务器上的OSD模块被激活后,所述OSD模块向MDC模块请求分区信息,根据该请求,MDC模块将已经分配好的分区资源信息发送给对应的OSD模块。
当***中的VBS模块也被激活时,***中的MDC模块、VBS模块和OSD模块就都处于激活状态了,并彼此之间建立了连接。同时,MDC模块也建立了全局的分区信息,以及完成了对每个OSD节点的分区资源分配和同步。
当***完成初始化进程后,VBS模块会根据用户发起的创建用户卷命令创建一个用户卷,该用户卷包含卷ID信息、卷大小以及确定了哪些Block构成该用户卷,其中,不同的Block可能属于同一个分区,也可能属于不同的分区。
因此,对于一个用户卷来说,其实际的存储物理资源是分布在很多磁盘上的。这样就达到了将不同的磁盘资源共享给一个用户卷,供用户使用,即达到存储资源共享使用的目的。
可选的,当本发明实施例提供的集群***需要增加资源服务器时,用户通过***的管理端进行操作,将添加资源服务器的消息发给***中的MDC模块(为***中的主MDC模块);所述MDC模块根据接收到的消息对新增的资源服务器进行参数校验,包括拓扑结果、IP地址等;校验正确后,MDC模块再进行(1)拓扑结构计算,将新增的资源服务器加入到OSD视图的拓扑结构图中,以及(2)分区结构计算,根据分区分配算法重新生成新的分区视图;完成上述计算后,MDC模块将新的分区视图信息广播给***中所有的VBS模块和OSD模块;随后,MDC模块通知***中的原有OSD模块发起数据迁移过程(根据新的分区拓扑结构,将原OSD节点下的数据迁移到新加入的节点)。
可选的,当本发明实施例提供的集群***需要删除资源服务器时,类似与上述增加资源服务器的流程,也是由用户通过***的管理端进行操作,MDC模块收到消息后重新进行分区计算,计算后再通知***中各个OSD模块和VBS模块,然后再通知OSD模块发起数据迁移。
与增加资源服务器不同的是:在删除资源服务器的流程中,当数据迁移完成后,MDC模块将被删除的资源服务器设置为不可用状态。之后,用户才可以将该被删除的资源服务器撤离集群***。
在本发明实施例提供的计算存储融合的集群***中,在资源服务器增删的过程中,MDC模块根据节点的变化情况进行分区的分配计算并将变化情况通知到各个OSD模块和VBS模块。
下面,我们以客户端用户发起对资源服务器2中的卷进行写数据操作请求为例,来说明在本发明实施例提供的计算存储融合的集群***中,用户是如何在写数据过程中,实现对存储资源的共享使用的。
首先,该写数据操作请求经过资源服务器2中对应的应用程序处理后,以标准的数据访问接口(可以是文件接口,也可以是块接口)要求写数据,并将该写数据操作请求发送给资源服务器2中的VBS模块;
其次,VBS模块根据自身的算法(如DHT等分布式算法)分析计算出需要写数据的逻辑OSD节点(包括计算出需要写入数据的Block,以及所述Block所属的分区),VBS模块通过自身算法,将需要写入的数据进行拆分(通过算法尽量均衡拆分),分别向逻辑OSD节点对应的资源服务器中的OSD模块发送写数据操作请求;
例如,VBS模块通过计算分析出需要写入数据的Block分别属于分区P6和P7,而P6和P7分别归属资源服务器2中的OSD节点和资源服务器3中的OSD节点,VBS模块通过自身算法,将需要写入的数据进行拆分(通过算法尽量均衡拆分),分别向资源服务器2中的OSD模块和资源服务器3中的OSD模块发送写数据操作请求。
再次,资源服务器2中的OSD模块和资源服务器3中的OSD模块接收到写数据操作请求后,分别将数据写入本资源服务器的缓存中,后续再分别由资源服务器2的缓存和资源服务器3的缓存写入各自持久化磁盘的指定物理空间中;
最后,为了保证写数据的可靠性,资源服务器2的缓存和资源服务器3的缓存再分别将数据写入到本资源服务器的持久化磁盘的其他空闲物理空间中,从而完成数据写入流程。
需要说明的是:最后一步可以由缓存异步并行执行。
这样,一个数据写入请求,经过上述步骤处理后,达到了分布式并行写入不同资源服务器的缓存中,再由各资源服务器的缓存写入本地的持久化磁盘中,提高了写数据的效率,实现了磁盘的共享使用。当数据写入完成后,OSD模块中的逻辑分区与实际的磁盘物理分区建立起了对应关系。
进一步,我们以客户端用户发起对资源服务器2中的卷进行读数据操作请求为例,来说明在本发明实施例提供的计算存储融合的集群***中,用户是如何在读数据过程中,实现对存储资源的共享使用的。
首先,该读数据操作请求经过资源服务器2中对应的应用程序处理后,以标准的数据访问接口(可以是文件接口,也可以是块接口)要求读数据,并将该读数据操作请求发送给资源服务器2中的VBS模块;
其次,VBS模块根据自身的算法(如DHT等分布式算法)分析计算出需要读取数据的逻辑OSD节点(包括计算出需要读数据的Block,以及所述Block所属的分区),分别向逻辑OSD节点对应的资源服务器中的OSD模块发送读数据操作请求;
例如,VBS模块通过计算分析出需要读取数据的Block分别属于分区P6和P7,而P6和P7分别归属资源服务器2中的OSD节点和资源服务器3中的OSD节点,则VBS模块分别向资源服务器2中的OSD模块和资源服务器3中的OSD模块发送读数据操作请求。
最后,资源服务器2中的OSD模块和资源服务器3中的OSD模块接收到读数据操作请求后,先到本资源服务器中的缓存读取数据,如果缓存中没有所需数据,再到本地持久化磁盘读取数据,从本地持久化磁盘读出数据后,先存入缓存,以便下次从缓存中读取。
因此,一个数据读取请求,经过上述步骤处理后,可以分布式并行从不同资源服务器的缓存中读取数据(当缓存中没有所需数据时,再从持久化磁盘读取),从而提高了读数据的效率,实现了磁盘的共享使用。
在本发明实施例提供的计算存储融合的集群***中,随着集群***中持久化存储资源的增加,整个集群***的缓存随之线性增加,缓存的增加,意味着***读写数据时,同一个任务的分布式并发处理会越多,效率会更高,***整体性能随着***的扩容不断提高。
通过本发明实施例提供的计算存储融合的集群***,由于不存在专用的SAN,省略了对SAN存储***的复杂管理,在硬件上解决了现有技术中因为使用专用SAN而导致的操作复杂、成本较高的问题;存储设备可以有多个,每个存储设备上都可以部署缓存,在硬件上极大的提升了存储端缓存的扩展能力;存储资源不依赖于计算资源,存储设备可以独立的增加和减少,增强了***的可扩展性。另外,由于本发明实施例提供计算存储融合的集群***采用高速数据交换网络进行通信,进一步加快了数据的交换速度。
应理解,在本发明实施例中,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的实施例中,应该理解到,所揭露的***,可以通过其它的方式实现。例如,以上所描述的***实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (15)

1.一种计算存储融合的集群***,其特征在于,包括:
资源服务器群,所述资源服务器群包括至少两个资源服务器,所述资源服务器群中的每个资源服务器至少具有计算资源和存储资源中的一种,并且所述资源服务器群中的至少一个资源服务器具有计算资源和存储资源,所述存储资源包括持久化磁盘以及和所述持久化磁盘对应的缓存;
存储资源控制模块,用于将所述资源服务器群中的存储资源构建成共享的存储资源池,以提供存储服务,其中每个所述存储资源池包括的存储资源来自于所述资源服务器群中的至少两个资源服务器。
2.根据权利要求1所述的计算存储融合的集群***,其特征在于,所述存储资源控制模块,包括:
集群视图管理子模块,用于根据用户预设的配置信息对所述资源服务器群中的持久化磁盘进行逻辑划分以得到逻辑分区,所述每个逻辑分区都对应所述持久化磁盘上固定数量的物理存储资源块。
3.根据权利要求2所述的计算存储融合的集群***,其特征在于,所述存储资源控制模块,还包括数据子模块,所述资源服务器群中的每个具有存储资源的资源服务器都对应一个所述数据子模块;
所述集群视图管理子模块,还用于为所述数据子模块分配所述逻辑分区资源,建立所述数据子模块的逻辑分区拓扑结构,并根据所述数据子模块的请求,将分配的逻辑分区信息分别发给对应的所述数据子模块。
4.根据权利要求2或3所述的计算存储融合的集群***,其特征在于,所述存储资源控制模块,还包括接口子模块,所述资源服务器群中的每个资源服务器都对应一个所述接口子模块;
所述接口子模块,用于接收用户发送的用户卷创建请求,并根据所述用户卷创建请求,在所述共享的存储资源池中为需要创建的用户卷分配与所述用户卷创建请求相应的物理存储资源块,所述物理存储资源块来自于不同的持久化磁盘。
5.根据权利要求4所述的计算存储融合的集群***,其特征在于,所述接口子模块,还用于接收用户发送的读/写数据操作请求,根据所述读/写数据操作请求中包含的用户卷标识,计算出读/写数据操作对应的物理存储资源块以及所述物理存储资源块所属的逻辑分区;根据计算出的所述物理存储资源块所属的逻辑分区确定需要执行读/写数据操作的数据子模块;将所述读/写数据操作请求发送给所述需要执行读/写数据操作的数据子模块。
6.根据权利要求5所述的计算存储融合的集群***,其特征在于,所述数据子模块,用于根据所述接口子模块发送的写数据操作请求,通过所述数据子模块对应的资源服务器的缓存写入数据;或者,用于根据所述接口子模块发送的读数据操作请求,通过所述数据子模块对应的资源服务器的缓存读取数据。
7.根据权利要求6所述的计算存储融合的集群***,其特征在于,所述通过所述数据子模块对应的资源服务器的缓存写入数据,具体包括:
所述数据子模块先将数据写入所述数据子模块对应的资源服务器的缓存中,再由所述缓存将数据写入与所述用户卷标识对应的物理存储资源块中。
8.根据权利要求6所述的计算存储融合的集群***,其特征在于,所述通过所述数据子模块对应的资源服务器的缓存读取数据,具体包括:
所述数据子模块先从所述数据子模块对应的资源服务器的缓存中读取请求的数据,如果所述缓存中没有所述请求的数据,再从所述用户卷标识对应的物理存储资源块中读取所述请求的数据,并将读取到的所述请求的数据写入缓存中。
9.根据权利要求3所述的计算存储融合的集群***,其特征在于,如果所述集群***增加或者删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于根据预设的逻辑分区分配算法重新生成所述数据子模块的逻辑分区拓扑结构,将新的逻辑分区拓扑结构广播给所述集群***中所有的接口子模块和数据子模块,并通知原有的数据子模块基于所述新的逻辑分区拓扑结构发起数据迁移。
10.根据权利要求9所述的计算存储融合的集群***,其特征在于,如果所述集群***删除具有存储资源的资源服务器,所述集群视图管理子模块,还用于在所述数据子模块完成数据迁移后,将所述被删除的资源服务器设置为不可用状态。
11.根据权利要求5所述的计算存储融合的集群***,其特征在于,
所述接口子模块的接口符合小型计算机***接口协议。
12.根据权利要求1所述的计算存储融合的集群***,其特征在于,所述存储资源控制模块,还用于将所述具有存储资源的资源服务器的单个持久化磁盘作为独立节点,构建所述共享的存储资源池。
13.根据权利要求1至3或5至11中任一项所述的计算存储融合的集群***,其特征在于,所述存储资源控制模块,还用于通过分布式算法构建并管理所述共享的存储资源池。
14.根据权利要求1至3或5至12中任一项所述的计算存储融合的集群***,其特征在于,所述集群***中的资源服务器之间通过高速数据交换网络进行通信。
15.根据权利要求14所述的计算存储融合的集群***,其特征在于,所述高速数据交换网络包括高速外设组件互连标准PCI-E网络或光纤网络。
CN201280005761.5A 2012-12-31 2012-12-31 一种计算存储融合的集群*** Active CN103503414B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/088109 WO2014101218A1 (zh) 2012-12-31 2012-12-31 一种计算存储融合的集群***

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201610150118.1A Division CN105657057A (zh) 2012-12-31 2012-12-31 一种计算存储融合的集群***

Publications (2)

Publication Number Publication Date
CN103503414A CN103503414A (zh) 2014-01-08
CN103503414B true CN103503414B (zh) 2016-03-09

Family

ID=49866757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280005761.5A Active CN103503414B (zh) 2012-12-31 2012-12-31 一种计算存储融合的集群***

Country Status (6)

Country Link
US (4) US10481804B2 (zh)
EP (2) EP2930910B1 (zh)
JP (1) JP6019513B2 (zh)
CN (1) CN103503414B (zh)
ES (1) ES2624412T3 (zh)
WO (2) WO2014101218A1 (zh)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105872031B (zh) * 2016-03-26 2019-06-14 天津书生云科技有限公司 存储***
CN105657066B (zh) * 2016-03-23 2019-06-14 天津书生云科技有限公司 用于存储***的负载再均衡方法及装置
US20190028542A1 (en) * 2016-02-03 2019-01-24 Surcloud Corp. Method and device for transmitting data
WO2014101218A1 (zh) 2012-12-31 2014-07-03 华为技术有限公司 一种计算存储融合的集群***
US9882984B2 (en) 2013-08-02 2018-01-30 International Business Machines Corporation Cache migration management in a virtualized distributed computing system
EP2983339B1 (en) 2014-05-22 2017-08-23 Huawei Technologies Co. Ltd. Node interconnection apparatus and server system
CN104135514B (zh) * 2014-07-25 2017-10-17 英业达科技有限公司 融合式虚拟化存储***
AU2014410705B2 (en) * 2014-11-05 2017-05-11 Xfusion Digital Technologies Co., Ltd. Data processing method and apparatus
CN104486444A (zh) * 2014-12-30 2015-04-01 北京天云融创软件技术有限公司 云管理平台的异构api转化***
US10425352B2 (en) * 2015-03-09 2019-09-24 International Business Machines Corporation Policy driven storage hardware allocation
CN107430527B (zh) * 2015-05-14 2021-01-29 株式会社日立制作所 具有服务器存储***的计算机***
US10346237B1 (en) * 2015-08-28 2019-07-09 EMC IP Holding Company LLC System and method to predict reliability of backup software
CN107851062A (zh) * 2015-12-31 2018-03-27 华为技术有限公司 一种主机集群中缓存管理方法及主机
CN107211003B (zh) * 2015-12-31 2020-07-14 华为技术有限公司 分布式存储***及管理元数据的方法
US10073725B2 (en) * 2016-02-11 2018-09-11 Micron Technology, Inc. Distributed input/output virtualization
CN106657356A (zh) * 2016-12-29 2017-05-10 郑州云海信息技术有限公司 一种云存储***的数据写入方法、装置及云存储***
US10768986B2 (en) 2017-01-06 2020-09-08 International Business Machines Corporation Management and utilization of storage capacities in a converged system
US10824355B2 (en) 2017-01-10 2020-11-03 International Business Machines Corporation Hierarchical management of storage capacity and data volumes in a converged system
US10938901B2 (en) 2017-01-11 2021-03-02 International Business Machines Corporation Management and utilization of data volumes in a converged system
US10394454B2 (en) * 2017-01-13 2019-08-27 Arm Limited Partitioning of memory system resources or performance monitoring
CN106844052A (zh) * 2017-01-22 2017-06-13 郑州云海信息技术有限公司 一种基于Windows Server构建融合集群的方法及装置
CN106919456A (zh) * 2017-03-01 2017-07-04 郑州云海信息技术有限公司 一种实现服务器串联的模块
US10454844B2 (en) * 2017-03-08 2019-10-22 A10 Networks, Inc. Dynamic capacity planning for application delivery platform across multiple cloud deployment
WO2019071595A1 (zh) * 2017-10-13 2019-04-18 华为技术有限公司 分布式块存储***中数据存储方法、装置及计算机可读存储介质
CN107729536B (zh) * 2017-10-31 2020-09-08 新华三技术有限公司 一种数据存储方法和装置
CN107807794B (zh) * 2017-10-31 2021-02-26 新华三技术有限公司 一种数据存储方法和装置
EP3620905B1 (en) * 2017-12-18 2022-10-19 Huawei Cloud Computing Technologies Co., Ltd. Method and device for identifying osd sub-health, and data storage system
US11194746B2 (en) * 2017-12-22 2021-12-07 Seagate Technology Llc Exchanging drive information
CN109039743B (zh) * 2018-08-03 2022-05-10 陕西中光电信高科技有限公司 分布式存储ceph群集网络的集中管理方法
CN109120556B (zh) * 2018-08-21 2019-07-09 广州市品高软件股份有限公司 一种云主机访问对象存储服务器的方法及***
US11106378B2 (en) 2018-11-21 2021-08-31 At&T Intellectual Property I, L.P. Record information management based on self describing attributes
US11042411B2 (en) * 2019-03-15 2021-06-22 Toshiba Memory Corporation Data storage resource management
CN111786930A (zh) * 2019-04-03 2020-10-16 上海宽带技术及应用工程研究中心 虚拟现实的数据共享***、方法、装置、终端、及介质
CN112099728B (zh) * 2019-06-18 2022-09-16 华为技术有限公司 一种执行写操作、读操作的方法及装置
CN111158595B (zh) * 2019-12-27 2023-05-23 中国建设银行股份有限公司 企业级异构存储资源调度方法及***
CN111209253B (zh) * 2019-12-30 2023-10-24 河南创新科信息技术有限公司 分布式存储设备性能提升方法、装置及分布式存储设备
CN111459679B (zh) * 2020-04-03 2023-10-27 宁波大学 一种用于5g通信测试仪表测试数据的并行处理方法
CN111625401B (zh) * 2020-05-29 2023-03-21 浪潮电子信息产业股份有限公司 基于集群文件***的数据备份方法、装置及可读存储介质
CN113946276B (zh) * 2020-07-16 2024-06-04 北京达佳互联信息技术有限公司 集群中的磁盘管理方法、装置及服务器
CN111949217A (zh) * 2020-08-21 2020-11-17 广东韶钢松山股份有限公司 超融合一体机及其软件定义存储sds处理方法和***
CN112948300B (zh) * 2021-01-19 2023-02-10 浙江大华技术股份有限公司 服务器、存算一体设备以及服务器***
US11016688B1 (en) * 2021-01-06 2021-05-25 Open Drives LLC Real-time localized data access in a distributed data storage system
CN113031858B (zh) * 2021-02-10 2022-09-20 山东英信计算机技术有限公司 一种基于多双活存储的数据处理方法、***及介质
CN113342509B (zh) * 2021-08-03 2021-12-07 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN113821165B (zh) * 2021-08-20 2023-12-22 济南浪潮数据技术有限公司 一种分布式集群融合存储方法、***及设备
CN114143190A (zh) * 2021-11-29 2022-03-04 中国建设银行股份有限公司 一种数据中心资源池构建方法及相关设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008049738A1 (en) * 2006-10-23 2008-05-02 International Business Machines Corporation On-demand personal computer provisioning system and method
CN101281454A (zh) * 2008-05-27 2008-10-08 中国科学院计算技术研究所 一种绑定计算资源和存储资源的装置

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6389503B1 (en) 1997-08-04 2002-05-14 Exabyte Corporation Tape drive emulation by removable disk drive and media formatted therefor
US6829610B1 (en) * 1999-03-11 2004-12-07 Microsoft Corporation Scalable storage system supporting multi-level query resolution
US6732166B1 (en) 1999-05-28 2004-05-04 Intel Corporation Method of distributed resource management of I/O devices in a network cluster
JP2001337850A (ja) 2000-05-25 2001-12-07 Hitachi Ltd 記憶装置および記憶装置の制御方法
US7734781B2 (en) * 2001-07-09 2010-06-08 Savvis Communications Corporation Methods and systems for shared storage virtualization
CN1602480A (zh) * 2001-12-10 2005-03-30 单球体有限公司 管理附装在数据网络上的存储器资源
US7379990B2 (en) 2002-08-12 2008-05-27 Tsao Sheng Ted Tai Distributed virtual SAN
AU2003272358A1 (en) * 2002-09-16 2004-04-30 Tigi Corporation Storage system architectures and multiple caching arrangements
US7624170B2 (en) * 2002-09-26 2009-11-24 International Business Machines Corporation Integrated storage appliance
US7565566B2 (en) 2003-04-23 2009-07-21 Dot Hill Systems Corporation Network storage appliance with an integrated switch
US7380163B2 (en) 2003-04-23 2008-05-27 Dot Hill Systems Corporation Apparatus and method for deterministically performing active-active failover of redundant servers in response to a heartbeat link failure
US7380039B2 (en) * 2003-12-30 2008-05-27 3Tera, Inc. Apparatus, method and system for aggregrating computing resources
CN100337218C (zh) 2005-02-23 2007-09-12 北京邦诺存储科技有限公司 网络存储***中的数据管理方法及其构建的网络存储***
JP4718285B2 (ja) 2005-09-22 2011-07-06 株式会社日立製作所 ファイル管理機能を備えたコンピュータシステム、ストレージ装置およびファイル管理方法
US8719501B2 (en) 2009-09-08 2014-05-06 Fusion-Io Apparatus, system, and method for caching data on a solid-state storage device
US8091087B2 (en) * 2007-04-20 2012-01-03 Microsoft Corporation Scheduling of new job within a start time range based on calculated current load and predicted load value of the new job on media resources
US8706914B2 (en) * 2007-04-23 2014-04-22 David D. Duchesneau Computing infrastructure
US8396937B1 (en) * 2007-04-30 2013-03-12 Oracle America, Inc. Efficient hardware scheme to support cross-cluster transactional memory
US9824006B2 (en) * 2007-08-13 2017-11-21 Digital Kiva, Inc. Apparatus and system for object-based storage solid-state device
US20090049236A1 (en) * 2007-08-15 2009-02-19 Hitachi, Ltd. System and method for data protection management for network storage
CN101374192A (zh) 2007-09-26 2009-02-25 北京数字太和科技有限责任公司 一种利用数字电视网络下载并存储多媒体数据的方法
JP2009223442A (ja) * 2008-03-13 2009-10-01 Hitachi Ltd ストレージシステム
RU2507703C2 (ru) * 2008-05-21 2014-02-20 Телефонактиеболагет Л М Эрикссон (Пабл) Объединение ресурсов в сервере центра коммутации с кластером с электронными платами
CN101730313A (zh) 2008-10-10 2010-06-09 ***通信集团公司 多载波移动通信***中的通信方法、基站以及通信***
US8525925B2 (en) * 2008-12-29 2013-09-03 Red.Com, Inc. Modular digital camera
JP5286192B2 (ja) * 2009-08-12 2013-09-11 株式会社日立製作所 ストレージシステムの容量を管理する管理計算機及びストレージシステムの容量管理方法
US20110087833A1 (en) 2009-10-08 2011-04-14 Advanced Micro Devices, Inc. Local nonvolatile write-through cache for a data server having network-based data storage, and related operating methods
US20110153570A1 (en) * 2009-12-18 2011-06-23 Electronics And Telecommunications Research Institute Data replication and recovery method in asymmetric clustered distributed file system
US8290919B1 (en) * 2010-08-27 2012-10-16 Disney Enterprises, Inc. System and method for distributing and accessing files in a distributed storage system
CN102480791B (zh) 2010-11-30 2014-05-21 普天信息技术研究院有限公司 一种协作多点传输的调度方法
CN102076096B (zh) 2011-01-12 2013-08-28 上海华为技术有限公司 一种 CoMP的实现方法、装置及基站
CN102164177A (zh) 2011-03-11 2011-08-24 浪潮(北京)电子信息产业有限公司 一种集群共享存储池的方法、装置及***
CN102223409B (zh) 2011-06-13 2013-08-21 浪潮(北京)电子信息产业有限公司 一种网络存储资源应用***及方法
CN102521063B (zh) 2011-11-30 2013-12-25 广东电子工业研究院有限公司 一种适用于虚拟机迁移和容错的共享存储方法
CN102520883B (zh) 2011-12-12 2015-05-20 杭州华三通信技术有限公司 一种数据存取方法及其装置
WO2013112634A1 (en) * 2012-01-23 2013-08-01 The Regents Of The University Of California System and method for implementing transactions using storage device support for atomic updates and flexible interface for managing data logging
CN102664923A (zh) 2012-03-30 2012-09-12 浪潮电子信息产业股份有限公司 一种利用Linux全局文件***实现共享存储池的方法
CN102739771A (zh) * 2012-04-18 2012-10-17 上海和辰信息技术有限公司 一种支持服务融合的云应用集成管理平台和方法
WO2014000271A1 (zh) 2012-06-29 2014-01-03 华为技术有限公司 一种pcie交换***、装置及交换方法
WO2014101218A1 (zh) 2012-12-31 2014-07-03 华为技术有限公司 一种计算存储融合的集群***
US10313251B2 (en) * 2016-02-01 2019-06-04 Netapp, Inc. Methods and systems for managing quality of service in a networked storage environment
US10048896B2 (en) * 2016-03-16 2018-08-14 Netapp, Inc. Methods and systems for determining performance capacity of a resource of a networked storage environment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008049738A1 (en) * 2006-10-23 2008-05-02 International Business Machines Corporation On-demand personal computer provisioning system and method
CN101281454A (zh) * 2008-05-27 2008-10-08 中国科学院计算技术研究所 一种绑定计算资源和存储资源的装置

Also Published As

Publication number Publication date
EP3188449B1 (en) 2018-09-19
WO2014101218A1 (zh) 2014-07-03
ES2624412T3 (es) 2017-07-14
US10082972B2 (en) 2018-09-25
EP3188449A1 (en) 2017-07-05
US9733848B2 (en) 2017-08-15
EP2930910A4 (en) 2015-11-25
EP2930910A1 (en) 2015-10-14
EP2930910B1 (en) 2017-02-22
JP2016507814A (ja) 2016-03-10
JP6019513B2 (ja) 2016-11-02
US20140189128A1 (en) 2014-07-03
WO2014101896A1 (zh) 2014-07-03
US11042311B2 (en) 2021-06-22
US20200065010A1 (en) 2020-02-27
US20170336998A1 (en) 2017-11-23
CN103503414A (zh) 2014-01-08
US20150301759A1 (en) 2015-10-22
US10481804B2 (en) 2019-11-19

Similar Documents

Publication Publication Date Title
CN103503414B (zh) 一种计算存储融合的集群***
US10708356B2 (en) Cloud computing system and method for managing storage resources therein
CN102255962B (zh) 一种分布式存储方法、装置和***
CN105095317B (zh) 分布式数据库服务管理***
US10545994B2 (en) Data replication method and storage system
CN105657057A (zh) 一种计算存储融合的集群***
CN103595799B (zh) 一种实现分布式共享数据库的方法
CN104735110B (zh) 元数据管理方法和***
KR101670343B1 (ko) 피어투피어 데이터 복제를 위한 방법, 장치, 및 시스템 및 마스터 노드 전환을 위한 방법, 장치, 및 시스템
CN104156216A (zh) 一种面向云计算的异构存储管理***及方法
CN104283959B (zh) 一种适用于云平台的基于性能分级的存储机制
CN105138281B (zh) 一种物理磁盘的共享方法及装置
CN103124299A (zh) 一种异构环境下的分布式块级别存储***
CN104270409B (zh) 一种云平台中高效利用集中存储的方法
CN104050248A (zh) 一种文件存储***及存储方法
US9641612B2 (en) Virtualized fusion storage system
CN109547537A (zh) 基于SAN存储共享卷实现openstack高可用的方法
CN109302494A (zh) 一种网络存储***的配置方法、装置、设备及介质
KR20160121380A (ko) 토러스 네트워크를 이용하는 분산 파일 시스템 및 토러스 네트워크를 이용하는 분산 파일 시스템의 구성 및 운영 방법
CN102833334A (zh) 一种逻辑卷管理方法
CN108388524A (zh) 用于缓存数据的方法和设备
CN103414764A (zh) 一种云平台弹性存储***及其弹性存储实现方法
WO2015165351A1 (zh) 一种数据存储方法和设备
CN114466030B (zh) 数据分布存储策略的管理方法、装置及分布式存储***
CN107832093A (zh) 一种在私有云中免驱动对接标准iscsi/fc存储的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220301

Address after: 550025 Huawei cloud data center, jiaoxinggong Road, Qianzhong Avenue, Gui'an New District, Guiyang City, Guizhou Province

Patentee after: Huawei Cloud Computing Technologies Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.

TR01 Transfer of patent right