CN105187517A - 一种实现元数据集群的方法及元数据集群 - Google Patents
一种实现元数据集群的方法及元数据集群 Download PDFInfo
- Publication number
- CN105187517A CN105187517A CN201510516048.2A CN201510516048A CN105187517A CN 105187517 A CN105187517 A CN 105187517A CN 201510516048 A CN201510516048 A CN 201510516048A CN 105187517 A CN105187517 A CN 105187517A
- Authority
- CN
- China
- Prior art keywords
- node
- metadata
- multicast packets
- cluster
- host node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1097—Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/14—Details of searching files based on file metadata
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Library & Information Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本发明公开了一种实现元数据集群的方法及元数据集群,所述方法包括:主节点接收客户端发送的操作元数据命令;在根据操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,组播包中携带元数据修改信息,指示从节点修改元数据;接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认组播包发送成功,向客户端返回成功结果,并记录返回成功消息的从节点的目录。本发明为分布式***以及分布式文件***的元数据信息查询、定位和修改等提供了优越的性能和高可用性。本发明在权衡性能和一致性的前提下,实现了工业上的应用需求。
Description
技术领域
本发明涉及数据管理技术,尤指一种实现元数据集群的方法及元数据集群。
背景技术
现如今大数据时代的兴起,不仅引起了海量数据的数据挖掘,同样也带动了海量数据的存储。在移动互联网爆发的同时,大量的数据的存储变成了业内普遍存在的问题。如何保证千万级,亿级的数据量,PB级的存储的可靠性,高效性,成了业内普遍研究的问题。从小规模公司到大规模公司,都会存在这样的问题,尤其是互联网公司每日产生的用户日志、数据和信息等等的存储。
一般在分布式***中,尤其是分布式文件***中,对于元数据的存储是独立存储。在分布式文件***中,元数据只是描述文件存储位置、属性以及文件副本等信息的数据。这些数据一般是独立存储在单独的服务器中。例如,HDFS、lustre分布式文件***,但是以上文件***为防止单点故障,均采用的是HA,双机互备的方案,但是往往两个节点无法满足继续扩展的集群规模,所以一些分布式文件***例如,ceph等,采用的集群式的管理元数据。但是,在集群中的元数据服务器实现性能和一致性的双重保证往往是个难题。
发明内容
为了解决上述技术问题,本发明提供了一种实现元数据集群的方法及元数据集群,能够实现元数据集群性能的线性扩展,以及极高的可用性和可靠性。
为了达到本发明目的,本发明提供了一种实现元数据集群的方法,所述元数据集群包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,所述方法包括:
所述主节点接收客户端发送的操作元数据命令;
所述主节点在根据所述操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,所述组播包中携带元数据修改信息,指示所述从节点修改元数据;
所述主节点接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认所述组播包发送成功,向所述客户端返回成功结果,并记录返回成功消息的从节点的目录。
进一步地,所述方法还包括:
如果所述主节点宕机,则多个节点编号靠前的从节点协商获取主节点权限,所述多个节点编号靠前的从节点为所述目录中的从节点。
进一步地,所述方法还包括:
所述主节点接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
进一步地,一种实现元数据集群的方法,所述元数据集群包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,所述方法包括:
所述从节点接收主节点发送的组播包,所述组播包中携带元数据修改信息,根据所述组播包修改元数据;
所述从节点向所述主节点返回成功消息。
进一步地,所述方法还包括:
所述从节点接收主节点采用哈希的方式转发的查询命令,根据所述查询命令完成客户端请求的查询。
进一步地,一种元数据集群,包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,其中:
所述主节点,用于接收客户端发送的操作元数据命令,在根据所述操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,所述组播包中携带元数据修改信息,指示所述从节点修改元数据;并接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认所述组播包发送成功,向所述客户端返回成功结果,并记录返回成功消息的从节点的目录。
进一步地,所述从节点,用于在所述主节点宕机时,多个节点编号靠前的从节点协商获取主节点权限,所述多个节点编号靠前的从节点为所述目录中的从节点。
进一步地,所述主节点,还用于接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
进一步地,所述从节点,用于接收主节点发送的组播包,所述组播包中携带元数据修改信息,根据所述组播包修改元数据;并向所述主节点返回成功消息。
进一步地,所述从节点,还用于接收主节点采用哈希的方式转发的查询命令,根据所述查询命令完成客户端请求的查询。
与现有技术相比,本发明包括主节点接收客户端发送的操作元数据命令;在根据操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,组播包中携带元数据修改信息,指示从节点修改元数据;接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认组播包发送成功,向客户端返回成功结果,并记录返回成功消息的从节点的目录。本发明通过构建一个可以实现线性扩展的元数据服务集群,采用的是集群一主多备,分工合作,内部协商的方式,实现了sale-out扩展方式,为分布式***以及分布式文件***的元数据信息查询、定位和修改等提供了优越的性能和高可用性。本发明在权衡性能和一致性的前提下,实现了工业上的应用需求。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1为本发明的实现元数据集群的方法的流程图;
图2为本发明的元数据集群的架构图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1所示为本发明的实现元数据集群的方法,元数据集群包含N(N>1)个节点,N个节点共享同一个虚拟IP地址,N个节点中包含一个主节点和至少一个从节点,本发明的方法包括:
步骤101:主节点接收客户端发送的操作元数据命令;
本发明中在N个节点的元数据集群中,N个节点共享一个虚拟IP地址,此IP也是提供给客户端和存储节点的IP地址。
客户端发起创建和删除文件的操作的时候,去元数据集群操作元数据,主(master)节点接收客户端发送的操作元数据命令。
步骤102:主节点在根据操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,组播包中携带元数据修改信息,指示从节点修改元数据;
master节点修改元数据的同时,发组播包给元数据集群其他从(slave)节点。
步骤103:主节点接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认组播包发送成功,向客户端返回成功结果,并记录返回成功消息的从节点的目录。
master节点接收到的返回成功的数目为配置的M的数量即算成功,则master节点返回给客户端成功结果,并且此时master节点记录成功的slave节点目录。
进一步的,如果主节点宕机,则多个节点编号靠前的从节点协商获取主节点权限,多个节点编号靠前的从节点为上述目录中的从节点。
在正常情况下master节点一直在发组播包给元数据集群中的其他slave节点,并携带了元数据修改信息,如果master宕机,则由事先约定好的编号大的节点协商获取master权限,当然这个slave节点是上述的正常返回给master节点的正常节点。
进一步的,主节点接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
如果客户端执行查询操作,则master获取查询命令后,采用哈希的方式直接转发给正常slave节点,如果客户端频繁的查询,单个master对于简单的查询操作的转发能力是很强大的,可以实现千万级的转发,将高负载分散到其他节点。
本发明实现了密集查询的负载均衡,同时实现了密集查询的性能的线性扩展。也实现了对于元数据修改、增加和删除操作的强一致性,保证了元数据集群的高性能的同时,也高可用性的需求。
本发明还提供了另一种实现元数据集群的方法,元数据集群包含N(N>1)个节点,N个节点共享同一个虚拟IP地址,N个节点中包含一个主节点和至少一个从节点,所述方法包括:
从节点接收主节点发送的组播包,组播包中携带元数据修改信息,根据组播包修改元数据;
从节点向主节点返回成功消息。
进一步的,从节点接收主节点采用哈希的方式转发的查询命令,根据查询命令完成客户端请求的查询。
本发明还提供了一种元数据集群,本发明中集群中至少存在两个节点,并且可以根据实际性能需求进行扩展,master节点为管理节点,根据配置文件的nodenumber进行指定,数字大的为master,保证集群中的节点号不重复,master宕机保证下一个节点号大的数字的节点接管,以此类推。
Slave节点为热备节点,在正常情况下进行的是提供客户端的查询服务和实现master节点异步同步数据服务,master节点实现的是转发客户端的查询服务和实现客户端的修改元数据并且同步发送给集群其他节点的修改请求等待修改成功返回。
如图2所示,本发明的元数据集群包含N(N>1)个节点,N个节点共享同一个虚拟IP地址,N个节点中包含一个主节点和至少一个从节点,其中:
主节点,用于接收客户端发送的操作元数据命令,在根据操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,组播包中携带元数据修改信息,指示从节点修改元数据;并接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认组播包发送成功,向客户端返回成功结果,并记录返回成功消息的从节点的目录。
进一步的,从节点,用于在主节点宕机时,多个节点编号靠前的从节点协商获取主节点权限,多个节点编号靠前的从节点为目录中的从节点。
进一步的,主节点,还用于接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
进一步的,从节点,用于接收主节点发送的组播包,组播包中携带元数据修改信息,根据组播包修改元数据;并向主节点返回成功消息。
进一步的,从节点,还用于接收主节点采用哈希的方式转发的查询命令,根据查询命令完成客户端请求的查询。
虽然本发明所揭露的实施方式如上,但所述的内容仅为便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式及细节上进行任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (10)
1.一种实现元数据集群的方法,其特征在于,所述元数据集群包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,所述方法包括:
所述主节点接收客户端发送的操作元数据命令;
所述主节点在根据所述操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,所述组播包中携带元数据修改信息,指示所述从节点修改元数据;
所述主节点接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认所述组播包发送成功,向所述客户端返回成功结果,并记录返回成功消息的从节点的目录。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述主节点宕机,则多个节点编号靠前的从节点协商获取主节点权限,所述多个节点编号靠前的从节点为所述目录中的从节点。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述主节点接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
4.一种实现元数据集群的方法,其特征在于,所述元数据集群包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,所述方法包括:
所述从节点接收主节点发送的组播包,所述组播包中携带元数据修改信息,根据所述组播包修改元数据;
所述从节点向所述主节点返回成功消息。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述从节点接收主节点采用哈希的方式转发的查询命令,根据所述查询命令完成客户端请求的查询。
6.一种元数据集群,其特征在于,包含N(N>1)个节点,所述N个节点共享同一个虚拟IP地址,所述N个节点中包含一个主节点和至少一个从节点,其中:
所述主节点,用于接收客户端发送的操作元数据命令,在根据所述操作元数据命令修改元数据的同时,向元数据集群中的从节点发送组播包,所述组播包中携带元数据修改信息,指示所述从节点修改元数据;并接收从节点返回的成功消息,在返回成功消息的从节点的数目达到配置的数量M(M>0)时,即确认所述组播包发送成功,向所述客户端返回成功结果,并记录返回成功消息的从节点的目录。
7.根据权利要求6所述的元数据集群,其特征在于:
所述从节点,用于在所述主节点宕机时,多个节点编号靠前的从节点协商获取主节点权限,所述多个节点编号靠前的从节点为所述目录中的从节点。
8.根据权利要求6所述的元数据集群,其特征在于:
所述主节点,还用于接收客户端发送的查询命令,采用哈希的方式将查询命令转发给从节点,完成客户端请求的查询。
9.根据权利要求6所述的元数据集群,其特征在于:
所述从节点,用于接收主节点发送的组播包,所述组播包中携带元数据修改信息,根据所述组播包修改元数据;并向所述主节点返回成功消息。
10.根据权利要求8所述的元数据集群,其特征在于:
所述从节点,还用于接收主节点采用哈希的方式转发的查询命令,根据所述查询命令完成客户端请求的查询。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510516048.2A CN105187517A (zh) | 2015-08-20 | 2015-08-20 | 一种实现元数据集群的方法及元数据集群 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510516048.2A CN105187517A (zh) | 2015-08-20 | 2015-08-20 | 一种实现元数据集群的方法及元数据集群 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105187517A true CN105187517A (zh) | 2015-12-23 |
Family
ID=54909357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510516048.2A Pending CN105187517A (zh) | 2015-08-20 | 2015-08-20 | 一种实现元数据集群的方法及元数据集群 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105187517A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107124469A (zh) * | 2017-06-07 | 2017-09-01 | 郑州云海信息技术有限公司 | 一种集群节点通信方法及*** |
CN107247564A (zh) * | 2017-07-17 | 2017-10-13 | 郑州云海信息技术有限公司 | 一种数据处理的方法及*** |
CN107786650A (zh) * | 2017-10-20 | 2018-03-09 | 郑州云海信息技术有限公司 | 一种存储介质和管理策略的同步方法、装置及*** |
CN109582686A (zh) * | 2018-12-13 | 2019-04-05 | 中山大学 | 分布式元数据管理一致性保证方法、装置、***及应用 |
CN110231915A (zh) * | 2019-05-29 | 2019-09-13 | 南昌大学 | 数据管理方法、***、装置、计算机设备及存储介质 |
CN111556137A (zh) * | 2020-04-26 | 2020-08-18 | 北京元心科技有限公司 | 一种自组织异构网络中分布式***的数据同步方法及*** |
CN115665159A (zh) * | 2022-12-14 | 2023-01-31 | 中国华能集团清洁能源技术研究院有限公司 | 一种大数据环境下的元数据管理方法及*** |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102904948A (zh) * | 2012-09-29 | 2013-01-30 | 南京云创存储科技有限公司 | 一种超大规模低成本存储*** |
US20140236888A1 (en) * | 2008-12-22 | 2014-08-21 | Google Inc. | Asynchronous Distributed De-Duplication for Replicated Content Addressable Storage Clusters |
CN104104739A (zh) * | 2014-08-08 | 2014-10-15 | 成都致云科技有限公司 | 一种云存储***元数据服务集群的数据同步方法 |
-
2015
- 2015-08-20 CN CN201510516048.2A patent/CN105187517A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140236888A1 (en) * | 2008-12-22 | 2014-08-21 | Google Inc. | Asynchronous Distributed De-Duplication for Replicated Content Addressable Storage Clusters |
CN102904948A (zh) * | 2012-09-29 | 2013-01-30 | 南京云创存储科技有限公司 | 一种超大规模低成本存储*** |
CN104104739A (zh) * | 2014-08-08 | 2014-10-15 | 成都致云科技有限公司 | 一种云存储***元数据服务集群的数据同步方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107124469A (zh) * | 2017-06-07 | 2017-09-01 | 郑州云海信息技术有限公司 | 一种集群节点通信方法及*** |
CN107124469B (zh) * | 2017-06-07 | 2020-07-24 | 苏州浪潮智能科技有限公司 | 一种集群节点通信方法及*** |
CN107247564A (zh) * | 2017-07-17 | 2017-10-13 | 郑州云海信息技术有限公司 | 一种数据处理的方法及*** |
CN107247564B (zh) * | 2017-07-17 | 2021-02-02 | 苏州浪潮智能科技有限公司 | 一种数据处理的方法及*** |
CN107786650A (zh) * | 2017-10-20 | 2018-03-09 | 郑州云海信息技术有限公司 | 一种存储介质和管理策略的同步方法、装置及*** |
CN107786650B (zh) * | 2017-10-20 | 2021-06-18 | 郑州云海信息技术有限公司 | 一种存储介质和管理策略的同步方法、装置及*** |
CN109582686A (zh) * | 2018-12-13 | 2019-04-05 | 中山大学 | 分布式元数据管理一致性保证方法、装置、***及应用 |
CN110231915A (zh) * | 2019-05-29 | 2019-09-13 | 南昌大学 | 数据管理方法、***、装置、计算机设备及存储介质 |
CN110231915B (zh) * | 2019-05-29 | 2022-04-01 | 南昌大学 | 数据管理方法、***、装置、计算机设备及存储介质 |
CN111556137A (zh) * | 2020-04-26 | 2020-08-18 | 北京元心科技有限公司 | 一种自组织异构网络中分布式***的数据同步方法及*** |
CN115665159A (zh) * | 2022-12-14 | 2023-01-31 | 中国华能集团清洁能源技术研究院有限公司 | 一种大数据环境下的元数据管理方法及*** |
CN115665159B (zh) * | 2022-12-14 | 2023-04-28 | 中国华能集团清洁能源技术研究院有限公司 | 一种大数据环境下的元数据管理方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105187517A (zh) | 一种实现元数据集群的方法及元数据集群 | |
US10185497B2 (en) | Cluster federation and trust in a cloud environment | |
US9560093B2 (en) | Higher efficiency storage replication using compression | |
US20150215405A1 (en) | Methods of managing and storing distributed files based on information-centric network | |
AU2009244352B2 (en) | Deletion in data file forwarding framework | |
US20120323864A1 (en) | Distributed de-duplication system and processing method thereof | |
US20150019491A1 (en) | Replication of Data Between Mirrored Data Sites | |
CN102882985A (zh) | 基于云存储的文件共享方法 | |
CN105095317A (zh) | 分布式数据库服务管理*** | |
CN101969468A (zh) | 查询服务器集群***及查询方法 | |
CN104184812A (zh) | 一种基于私有云的多点数据传输方法 | |
CN105005611A (zh) | 一种文件管理***及文件管理方法 | |
CN103177082A (zh) | 主服务器、从服务器、索引同步***和索引同步方法 | |
CN103546572A (zh) | 一种云存储装置以及多云存储联网***和方法 | |
CN102929958A (zh) | 元数据的处理方法,代理、转发设备,服务器及计算*** | |
CN115150410A (zh) | 多集群访问方法和*** | |
CN107493309B (zh) | 一种分布式***中的文件写入方法及装置 | |
CN111225003B (zh) | 一种nfs节点配置方法和装置 | |
CN109951567A (zh) | 一种双数据中心应用部署方法 | |
CN106528667A (zh) | 读写分离的低功耗海量数据全文检索***框架 | |
CN102833295A (zh) | 分布式缓存***中的数据操作方法和装置 | |
JP5756379B2 (ja) | データ転送システム、転送元システム及び転送先システム並びにプログラム | |
CN114996053A (zh) | 一种远程卷复制传输方法、***、装置及存储介质 | |
CN115129779A (zh) | 数据库的同步方法、装置及可读介质 | |
US10887429B1 (en) | Processing multi-protocol redirection links |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151223 |