CN110362582A - 一种实现零停机升级的方法和装置 - Google Patents

一种实现零停机升级的方法和装置 Download PDF

Info

Publication number
CN110362582A
CN110362582A CN201810303780.5A CN201810303780A CN110362582A CN 110362582 A CN110362582 A CN 110362582A CN 201810303780 A CN201810303780 A CN 201810303780A CN 110362582 A CN110362582 A CN 110362582A
Authority
CN
China
Prior art keywords
hbase cluster
version
data
hbase
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810303780.5A
Other languages
English (en)
Other versions
CN110362582B (zh
Inventor
杨�远
温帮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201810303780.5A priority Critical patent/CN110362582B/zh
Publication of CN110362582A publication Critical patent/CN110362582A/zh
Application granted granted Critical
Publication of CN110362582B publication Critical patent/CN110362582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了实现零停机升级的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:在低版本HBase集群预设命名空间;将新写入低版本HBase集群的数据指定相应的命名空间值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。该实施方式能够解决无法实现从低版本HBase集群到高版本HBase集群的不停机迁移的问题。

Description

一种实现零停机升级的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种实现零停机升级的方法和装置。
背景技术
在数据高速发展的时代,分布式体系成为了很重要的角色。在大数据的发展的背景下,分布式集群,分布式数据库,分布式文件***都成为了受人们关注的焦点。在这个动力的趋势下,Hadoop集群成为了较成熟的分布式***。分布式数据库HBase在Hadoop生态***中正在不断的完善,HBase不同于传统的数据库,它是一个适用于非结构化数据存储的开源数据库,具有高扩展性、高性能,列存储、可伸缩、能实时读写大数据的特点。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
在分布式数据库HBase的使用过程中,随着新技术,新功能的不断加入,要想使用这些新功能,必然得升级数据库,一般在版本跨度不大的情况下,升级数据库,原地升级就可以,但是在实际生产环境中,升级的版本跨度可能会很大,高版本不再兼容低版本。HBase1.1.X上的表是namespace下的,如果没有指定namespace,表会存在default的namespace下。HBase0.94没有namespace,同时HBase0.94和HBase1.1.X使用的协议是不一样的,而且HBase1.1.X更改一些API,导致不在兼容HBase0.98以下的版本,如果迁移数据,则需搭建一个集群,然后通过搭建的集群迁移数据,因此在迁移数据时需要停机一段时间,停机的时长根据业务的数据量大小增减。通常情况下1T的数据得停机1小时以上。停机对于一些重要的业务来说,是不允许的。哪怕停机一分钟,造成的损失也不容小觑。
发明内容
有鉴于此,本发明实施例提供一种实现零停机升级的方法和装置,能够解决无法实现从低版本HBase集群到高版本HBase集群的不停机迁移的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种实现零停机升级的方法,包括在低版本HBase集群预设命名空间;将新写入低版本HBase集群的数据指定相应的命名空间值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
可选地,将新写入低版本HBase集群的数据指定相应的命名空间值,包括:
将低版本HBase集群中预设的命名空间存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的命名空间值,以对新写入低版本HBase集群的数据指定相应的命名空间值。
可选地,将新写入低版本HBase集群的数据同步至高版本HBase集群中,包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述积压的数据至高版本HBase集群中;
将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,则在低版本HBase集群中开启数据同步。
可选地,在HDFS层面拷贝所述数据至高版本HBase集群中,包括:
在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
可选地,将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,还包括:
修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
可选地,在低版本HBase集群shell中使用add_peer命令预设命名空间。
可选地,还包括:
基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应;
在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设命名空间值,以将低版本HBase集群的数据同步至高版本HBase集群中;
重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
另外,根据本发明实施例的一个方面,提供了一种实现零停机升级的装置,包括设置模块,用于在低版本HBase集群预设命名空间;同步模块,用于将新写入低版本HBase集群的数据指定相应的命名空间值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
可选地,所述同步模块将新写入低版本HBase集群的数据指定相应的命名空间值,包括:
将低版本HBase集群中预设的命名空间存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的命名空间值,以对新写入低版本HBase集群的数据指定相应的命名空间值。
可选地,所述同步模块将新写入低版本HBase集群的数据同步至高版本HBase集群中,包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述积压的数据至高版本HBase集群中;
将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,则在低版本HBase集群中开启数据同步。
可选地,所述同步模块在HDFS层面拷贝所述数据至高版本HBase集群中,包括:
在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
可选地,所述同步模块,还用于:
修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
可选地,所述设置模块在低版本HBase集群shell中使用add_peer命令预设命名空间。
可选地,所述设置模块,还用于:
基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应;
在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设命名空间值,以将低版本HBase集群的数据同步至高版本HBase集群中;
重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实现零停机升级的实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实现零停机升级的实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:本发明旨在实现低版本HBase集群到高版本HBase集群零停机升级功能,满足了重要业务不停机升级HBase数据库的需求,使得这些业务不再蒙受停机带来的巨大损失。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的实现零停机升级的方法的主要流程的示意图;
图2是根据本发明可参考实施例的实现零停机升级的方法的主要流程的示意图;
图3是根据本发明实施例的实现零停机升级的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性***架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的实现零停机升级的方法,如图1所示,所述实现零停机升级的方法包括:
步骤S101,在低版本HBase集群预设namespace。
较佳地,在低版本HBase集群shell中使用add_peer命令预设namespace。其中,namespace即"命名空间",也称"名称空间"、"名字空间"。VS.NET中的各种语言使用的一种代码组织的形式通过名称空间来分类,区别不同的代码功能同时也是VS.NET中所有类的完全名称的一部分。
步骤S102,将新写入低版本HBase集群的数据指定相应的namespace值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
较佳地,在低版本HBase集群中预设的namespace存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的namespace值,以对新写入低版本HBase集群的数据指定相应的namespace值。优选地,可以采用zookeeper服务器。其中,zookeeper是指一个分布式的、开放源码的分布式应用***协调服务,是Hadoop和HBase的重要组件,为分布式应用提供一致***。
在一个实施例中,将新写入低版本HBase集群的数据同步至高版本HBase集群中,具体的实施过程包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述数据至高版本HBase集群中。然后,将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,则在低版本HBase集群中开启数据同步。
进一步地,在HDFS层面拷贝所述数据至高版本HBase集群中时,可以在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
作为本发明的另一个实施例,将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,还需要修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
还值得说明的是,本发明通过步骤S101和S102可以完成新写入低版本HBase集群的数据同步至高版本HBase集群,而对于新写入数据之前低版本HBase集群中存在的大量数据则可以通过如下过程实现同步至高版本HBase集群中:
首先,基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应。然后,在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设namespace值,以将低版本HBase集群的数据同步至高版本HBase集群中。最后,重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
根据上面的各种实施例,可以看出所述的实现零停机升级的方法,本发明解决了现有不能实现低版本HBase集群到高版本HBase集群的不停机迁移的问题,实现了零停机升级,HBase集群不用停机,用户不再蒙受停机带来的巨大经济损失,同时可以向高版本HBase集群指定的namespace的表同步数据。另外,实现低版本HBase集群到高版本HBase集群不停机迁移的功能非常实用,也是迫切需要的。
图2是根据本发明可参考实施例的实现零停机升级的方法的主要流程的示意图,所述实现零停机升级的方法可以包括:
步骤S201,基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应。
其中,所述的低版本是HBase0.98以下的版本,而所述的高版本是HBase1.1.X版本以及以上版本。
在实施例中,由于低版本和高版本的框架已不相同,尤其是高、低两版本的API接口的设置不相同,因此低版本HBase集群的补丁patch无法直接应用于高版本HBase集群上,针对这个问题本发明实施例将低版本的API接口信息与高版本API接口信息进行对应。其中,所述低版本HBase集群的补丁patch就是将低版本HBase集群升级为高版本HBase集群的补丁patch。
步骤S202,在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设namespace值,以将低版本HBase集群的数据同步至高版本HBase集群中。
需要说明的是,该步骤可以实现将当前低版本HBase集群中的数据全部同步至高版本HBase集群中。
步骤S203,重新启动高版本HBase集群和低版本HBase集群的regionserver,以使高版本HBase集群和低版本HBase集群正常工作。
在实施例中,可以重新启动regionserver(regionserver是HBase集群运行在每个工作节点上的服务),以使代码可以正常工作。
较佳地,Replication同步功能是工作在regionserver上的,HBase主要是由java语言写的,补丁patch(在本实施例中所述的补丁patch是将低版本HBase集群升级为高版本HBase集群所相关的程序)是打在java代码中的,然后编译成jar文件,更新到regionserver对应的服务器中,重启regionserver是为了重新加载jar文件,让更改的代码正常工作。
步骤S204,在低版本HBase集群shell中使用add_peer命令预设namespace。
其中,shell为计算机壳层,俗称壳,是指提供使用者使用界面的软件(命令解析器)。而namespace是指名称空间,数据库表的逻辑分组,同一组中的表有类似的用途。
在实施例中,我们在低版本HBase集群的shell中使用add_peer命令预设一个namespace。
较佳地,低版本的shell中使用add_peer命令时,可以指定HBaseReplication功能所使用的协议类型。其中,Replication功能用于集群间复制,它是master/slaves(一主多从)结构式的复制。由master推送,多个slave接收。这个复制操作是异步的,复制的状态和进度等信息保存到zookeeper服务器中。通过zookeeper服务器来协助完成复制工作。
优选地,HBase Replication功能使用Thrift协议。而Thrift是一个软件框架,用于进行可拓展且跨语言的服务的开发。例如:
add_peer‘1’,”hbase-1.1:2181:/hbase”,”THRIFT”,”namespace_test”
该命令为HBase0.94添加一个从集群为peer,指定Replication功能使用Thrift协议,往namespace_test下同步。
步骤S205,当低版本HBase集群具有新写入的数据时,对新写入低版本HBase集群的数据指定相应的namespace值。
较佳地,在低版本HBase集群中预设的namespace可以存储在zookeeper服务器中,当低版本HBase集群具有新写入的数据时,获取zookeeper服务器中的namespace值,以对新写入低版本HBase集群的数据指定相应的namespace值。
进一步地,可以将namespace的值存储在namespace_test表中,并且将所述的namespace_test表存储在了zookeeper服务器中。Replication同步增量数据时,则从zookeeper中读出namespace_test,为新写入的每一条数据添加上相对应的namespace值。从而在高版本HBase集群将新写入的数据通过Replication功能,使用Thrift协议进行数据复制时,便可以往高版本HBase集群中指定的namespace下的表写入数据。
也就是说,在低版本HBase集群中预设的namespace值是能够与高版本HBase集群中的namespace值进行对应的,进而才能将低版本HBase集群中的数据同步至高版本HBase集群中。
步骤S206,通过disable peer命令暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝数据至高版本HBase集群中。
其中,HDFS是Hadoop分布式文件***,是被设计成适合运行在通用硬件上的分布式文件***,具有高度容错性,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,适合在大规模数据集上应用。
还值得说明的是,在将数据同步的过程中本实施例采用了先执行disable peer命令暂停数据同步功能以使数据积压,待同步的数据完成拷贝并可以正常使用之后再执行enable peer命令,开启数据同步功能。也就是说,可以对同步的数据起到一种缓存的效果。
优选地,在HDFS层面拷贝数据至高版本HBase集群中的时候,可以在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口。然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
进一步地,在hbase-site.xml的配置文件中添加如下配置:
<property>
<name>hbase.replication</name>
<value>true</value>
<description>打开replication功能</description>
</property>
<property>
<name>hbase.replication.sink.enable.thrift</name>
<value>true</value>
</property>
<property><name>hbase.replication.thrift.server.port</name>
<value>9090</value>
</property>
然后开启thrift服务使用如下命令:
$HBASE_HOME/bin/hbase-daemon.sh start thrift
步骤S207,修复拷贝至高版本HBase集群中的数据,以确认所述数据可用,然后在低版本HBase集群的shell中通过enable peer命令开启数据同步。
较佳地,在修复拷贝至高版本HBase集群中的数据是可以使用如下命令:fixTableOrphans、fixMeta以及fix。
例如:表tb_test的数据拷贝到HBase1.1.X存储的HDFS上,修复数据时,过程如下:
hdfs dfs-rm–r hdfs://Hadoop_master_ip_address:9000/hbase/data/namespace_test/tb_test/.tableinfo.0000000001
hbase hbck-fixTableOrphans"tb_test"
hbase hbck-fixMeta"tb_test"
hbase hbck-fix"tb_test"
在一个实施例中,当完成所有数据的同步之后(新写入的数据便可以通过步骤S205至S207进行同步),便可以切换至高版本HBase集群。进一步地,可以设置一个在低版本HBase集群的迁移表,当迁移表中的数据量与高版本HBase集群中的数据量一致时,便可以切换至高版本HBase集群。
图3是根据本发明实施例的实现零停机升级的装置,如图3所示,所述实现零停机升级的装置300包括设置模块301和同步模块302。其中,设置模块301在低版本HBase集群预设namespace。之后,同步模块302新写入低版本HBase集群的数据指定相应的namespace值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
较佳地,设置模块301在低版本HBase集群shell中使用add_peer命令预设namespace。
作为实施例,同步模块302在低版本HBase集群中预设的namespace存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的namespace值,以对新写入低版本HBase集群的数据指定相应的namespace值。优选地,可以采用zookeeper服务器。其中,zookeeper是指一个分布式的、开放源码的分布式应用***协调服务,是Hadoop和Hbase的重要组件,为分布式应用提供一致***。
另外,同步模块302将新写入低版本HBase集群的数据同步至高版本HBase集群中,具体的实施过程包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述数据至高版本HBase集群中。然后,将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,则在低版本HBase集群中开启数据同步。
进一步地,在HDFS层面拷贝所述数据至高版本HBase集群中时,可以在低版本HBase集群中开启Replication功能,指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
作为本发明的另一个实施例,同步模块302将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,还需要修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
还值得说明的是,本发明可以完成新写入低版本HBase集群的数据同步至高版本HBase集群,而对于新写入数据之前低版本HBase集群中存在的大量数据则可以通过设置模块301采用如下过程实现同步至高版本HBase集群中:
首先,基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应。然后,在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设namespace值,以将低版本HBase集群的数据同步至高版本HBase集群中。最后,重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
需要说明的是,在本发明所述实现零停机升级的装置的具体实施内容,在上面所述实现零停机升级的方法中已经详细说明了,故在此重复内容不再说明。
图4示出了可以应用本发明实施例的实现零停机升级的方法或实现零停机升级的装置的示例性***架构400。或者图4示出了可以应用本发明实施例的实现零停机升级的方法或实现零停机升级的装置的示例性***架构400。
如图4所示,***架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的实现零停机升级的方法一般由服务器405执行,相应地,实现零停机升级的装置一般设置于服务器405中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机***500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机***500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有***500操作所需的各种程序和数据。CPU501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括设置模块和同步模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:在低版本HBase集群预设namespace;将新写入低版本HBase集群的数据指定相应的namespace值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
根据本发明实施例的技术方案,能够解决无法实现从低版本HBase集群到高版本HBase集群的不停机迁移的问题。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (16)

1.一种实现零停机升级的方法,其特征在于,包括:
在低版本HBase集群预设命名空间;
将新写入低版本HBase集群的数据指定相应的命名空间值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
2.根据权利要求1所述的方法,其特征在于,将新写入低版本HBase集群的数据指定相应的命名空间值,包括:
将低版本HBase集群中预设的命名空间存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的命名空间值,以对新写入低版本HBase集群的数据指定相应的命名空间值。
3.根据权利要求1所述的方法,其特征在于,将新写入低版本HBase集群的数据同步至高版本HBase集群中,包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述积压的数据至高版本HBase集群中;
将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,在低版本HBase集群中开启数据同步。
4.根据权利要求3所述的方法,其特征在于,在HDFS层面拷贝所述数据至高版本HBase集群中,包括:
在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
5.根据权利要求1所述的方法,其特征在于,将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,还包括:
修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
6.根据权利要求1所述的方法,其特征在于,在低版本HBase集群shell中使用add_peer命令预设命名空间。
7.根据权利要求1-6任一所述的方法,其特征在于,还包括:
基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应;
在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设命名空间值,以将低版本HBase集群的数据同步至高版本HBase集群中;
重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
8.一种实现零停机升级的装置,其特征在于,包括:
设置模块,用于在低版本HBase集群预设命名空间;
同步模块,用于将新写入低版本HBase集群的数据指定相应的命名空间值,以将新写入低版本HBase集群的数据同步至高版本HBase集群中。
9.根据权利要求8所述的装置,其特征在于,所述同步模块将新写入低版本HBase集群的数据指定相应的命名空间值,包括:
将低版本HBase集群中预设的命名空间存储在服务器中,当低版本HBase集群具有新写入的数据时,获取服务器中的命名空间值,以对新写入低版本HBase集群的数据指定相应的命名空间值。
10.根据权利要求8所述的装置,其特征在于,所述同步模块将新写入低版本HBase集群的数据同步至高版本HBase集群中,包括:
在低版本HBase集群中暂停数据同步,以使新写入低版本HBase集群的数据积压,然后在HDFS层面拷贝所述积压的数据至高版本HBase集群中;
将新写入低版本HBase集群的数据同步至高版本HBase集群中之后,则在低版本HBase集群中开启数据同步。
11.根据权利要求10所述的装置,其特征在于,所述同步模块在HDFS层面拷贝所述数据至高版本HBase集群中,包括:
在低版本HBase集群中和高版本HBase集群中分别开启Replication功能,并指定Thrift服务的端口;然后通过Replication功能,使用Thrift协议,复制所述数据至高版本HBase集群中。
12.根据权利要求8所述的装置,其特征在于,所述同步模块,还用于:
修复拷贝至高版本HBase集群中的数据,以确认所述数据可用。
13.根据权利要求8所述的装置,其特征在于,所述设置模块在低版本HBase集群shell中使用add_peer命令预设命名空间。
14.根据权利要求8-13任一所述的装置,其特征在于,所述设置模块,还用于:
基于Thrift的Replication功能补丁,将低版本HBase集群的API接口与高版本HBase集群的API接口对应;
在低版本HBase集群的基于Thrift的Replication功能补丁中加入预设命名空间值,以将低版本HBase集群的数据同步至高版本HBase集群中;
重新启动高版本HBase集群和低版本HBase集群,以使高版本HBase集群和低版本HBase集群正常工作。
15.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
16.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201810303780.5A 2018-04-03 2018-04-03 一种实现零停机升级的方法和装置 Active CN110362582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810303780.5A CN110362582B (zh) 2018-04-03 2018-04-03 一种实现零停机升级的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810303780.5A CN110362582B (zh) 2018-04-03 2018-04-03 一种实现零停机升级的方法和装置

Publications (2)

Publication Number Publication Date
CN110362582A true CN110362582A (zh) 2019-10-22
CN110362582B CN110362582B (zh) 2024-06-18

Family

ID=68213437

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810303780.5A Active CN110362582B (zh) 2018-04-03 2018-04-03 一种实现零停机升级的方法和装置

Country Status (1)

Country Link
CN (1) CN110362582B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632032A (zh) * 2020-12-18 2021-04-09 华人运通(上海)云计算科技有限公司 一种数据迁移方法、装置、存储介质及终端设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100070967A (ko) * 2008-12-18 2010-06-28 한국전자통신연구원 클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법
CN103631907A (zh) * 2013-11-26 2014-03-12 中国科学院信息工程研究所 一种将关系型数据迁移至HBase的方法及***
CN105243067A (zh) * 2014-07-07 2016-01-13 北京明略软件***有限公司 一种实现实时增量同步数据的方法及装置
CN106855871A (zh) * 2015-12-09 2017-06-16 阿里巴巴集团控股有限公司 一种数据迁移的方法和装置
CN107122361A (zh) * 2016-02-24 2017-09-01 阿里巴巴集团控股有限公司 数据迁移***和方法
US20170346690A1 (en) * 2016-05-27 2017-11-30 Intel Corporation Methods, systems and apparatus to improve cluster efficiency

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100070967A (ko) * 2008-12-18 2010-06-28 한국전자통신연구원 클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법
CN103631907A (zh) * 2013-11-26 2014-03-12 中国科学院信息工程研究所 一种将关系型数据迁移至HBase的方法及***
CN105243067A (zh) * 2014-07-07 2016-01-13 北京明略软件***有限公司 一种实现实时增量同步数据的方法及装置
CN106855871A (zh) * 2015-12-09 2017-06-16 阿里巴巴集团控股有限公司 一种数据迁移的方法和装置
CN107122361A (zh) * 2016-02-24 2017-09-01 阿里巴巴集团控股有限公司 数据迁移***和方法
US20170346690A1 (en) * 2016-05-27 2017-11-30 Intel Corporation Methods, systems and apparatus to improve cluster efficiency

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112632032A (zh) * 2020-12-18 2021-04-09 华人运通(上海)云计算科技有限公司 一种数据迁移方法、装置、存储介质及终端设备

Also Published As

Publication number Publication date
CN110362582B (zh) 2024-06-18

Similar Documents

Publication Publication Date Title
CN109086409B (zh) 微服务数据处理方法、装置、电子设备及计算机可读介质
RU2500023C2 (ru) Синхронизация документа по протоколу, не использующему информацию о состоянии
CN108804306B (zh) 用于自动测试***的方法和***
CN109542445A (zh) 一种Android插件化开发的方法和装置
US20140195514A1 (en) Unified interface for querying data in legacy databases and current databases
CN110472207A (zh) 表单生成方法和装置
CN110019062A (zh) 数据同步方法和***
US20160140141A1 (en) File lookup in a distributed file system
CN108958744A (zh) 大数据分布式集群的部署方法、装置、介质及电子设备
CN107506218A (zh) 一种配置文件的管理方法及管理***
CN110019539A (zh) 一种数据仓库的数据同步的方法和装置
CN109241033A (zh) 创建实时数据仓库的方法和装置
CN110781197A (zh) 一种hive离线同步校验方法、装置及电子设备
US20230259358A1 (en) Documentation enforcement during compilation
CN112988583A (zh) 数据库语法兼容性测试的方法和装置
CN114416868B (zh) 一种数据同步方法、装置、设备及存储介质
CN109960212A (zh) 任务发送方法和装置
CN113128197A (zh) 应用投产版本管理的方法和装置
CN109828964A (zh) 一种数据导入方法、装置及电子设备
CN110362582A (zh) 一种实现零停机升级的方法和装置
CN109933484A (zh) 大数据集群准实时container资源分配监控分析方法
CN110580216B (zh) 一种应用提测的方法和装置
CN111984686A (zh) 一种数据处理的方法和装置
CN110019525A (zh) 一种数据库扩容的方法和装置
CN110858199A (zh) 一种单据数据分布式计算的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant