CN102855299A - 不中断服务条件下,分布式数据库迭代迁移的方法 - Google Patents

不中断服务条件下,分布式数据库迭代迁移的方法 Download PDF

Info

Publication number
CN102855299A
CN102855299A CN2012102921793A CN201210292179A CN102855299A CN 102855299 A CN102855299 A CN 102855299A CN 2012102921793 A CN2012102921793 A CN 2012102921793A CN 201210292179 A CN201210292179 A CN 201210292179A CN 102855299 A CN102855299 A CN 102855299A
Authority
CN
China
Prior art keywords
data
migration
application
iteration
guarantee
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102921793A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI INTPLE TECHNOLOGY CO LTD
Original Assignee
SHANGHAI INTPLE TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI INTPLE TECHNOLOGY CO LTD filed Critical SHANGHAI INTPLE TECHNOLOGY CO LTD
Priority to CN2012102921793A priority Critical patent/CN102855299A/zh
Publication of CN102855299A publication Critical patent/CN102855299A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种在生产环境下不中断应用服务对分布式数据库进行扩容和数据迁移的方法,通过将需迁移数据进行划分,将大量数据划分成若干少量数据集进行迭代迁移,从而降低迁移过程对应用服务的正常运行所带来的影响。同时通过理解关联数据之间的关系,将相关数据划分到同一迭代过程中来保证数据一致性和完整性。

Description

不中断服务条件下,分布式数据库迭代迁移的方法
技术领域
本发明涉及集群分布式计算领域。 
背景技术
在信息技术高速发展的今天,无论是互联网还是企业内部的数据量,都呈指数速度的发展和增加中。数据扩容的问题已显得前所未有的重要。数据扩容涉及到对现有数据的重新分配,从而需要对现有数据进行大量的迁移,在生产环境下如何对数据进行大量迁移而不影响到应用服务的正常使用,是面临的一个重大课题。 
为了在生产环境下对分布式数据库进行迁移,发明了迭代迁移数据的方法,该方法通过将需要进行迁移的数据划分成若干少量数据集进行迭代迁移,除当前正在迁移的这一少量数据外,其余数据可以进行正常操作。同时通过关联性分析,将相关的数据分布到同一个迭代过程中进行迁移,从而保证数据的一致性和完整性。 
发明内容
本发明的目的是提供一种在生产环境下不中断应用服务对分布式数据库进行扩容和数据迁移的方法,通过将需迁移数据进行划分,将大量数据划分成若干少量数据进行迭代迁移,从而降低迁移过程对应用服务的正常运行所带来的影响。同时通过理解关联数据之间的关系,将相关数据划分到同一迭代过程中来保证数据一致性和完整性。 
为达到上述目的,本发明设定了一种迭代迁移策略。 
1.计算迁移量,并进行数据划分,将需迁移的数据平均地分配到每一个迭代过程中。 
2.对数据进行关联关系分析,保证相关数据被划分到同一个迭代过程中。 
3.对每一迭代过程进行事务控制,保证数据一致性和完整性。 
4.在每一迭代过程开始时通知应用,此部分数据正在迁移,不能再对其进行增、删、改操作,在结束时通知应用迁移已结束,可以对其进行增、删、改操作。 
附图说明
附图为本发明的工作流程示意图,在本示例中,将原有的2个存储节点扩容为4个存储节点。通过迭代方法将原有的2个节点中的一部分数据在不中断服务的情况下迁移至新增的2个存储节点中。 
具体实施方式
下面结合附图对本发明所述的技术方案做进一步详细描述。 
附图展示了如何在生产环境下将2个存储节点扩容为4个节点的过程,以及如何与应用程序交互的过程。 
迭代迁移的步骤如下: 
1)计算需要迁移的数据量,以及将要迁移至的目标存储节点。 
2)将数据划分到若干小的迭代迁移任务,此过程包含数据相关性判断,相关数据将被划分到同一任务中。 
3)利用多线程同时启动多个迭代任务。 
4)每一任务开始时将通知应用程序此部分迁移开始,同时锁定数据。 
5)进行数据迁移,每一迭代任务在同一个事务中处理。 
6)每一任务迁移完成时通知应用程序此部分迁移结束,同时解锁数据。 
7)主线程询问是否还有迭代迁移任务,如还有,继续迁移,否则退出,全部迁移完成。 

Claims (6)

1.不中断服务条件下,分布式数据库迭代迁移的方法,其特征在于:
1)在生产环境下不中断应用服务进行分布式数据库扩容和数据迁移;
2)大量数据将被划分为若干少量数据进行迭代迁移;
3)相关数据将被划分到同一迭代任务,保证数据一致性和完整性;
4)迁移过程与应用交互保证应用的畅通;
5)多个分布式数据分块,并行迁移,同时保证业务应用不受影响。
2.如权利1所述的分布式数据库环境下不中断应用服务迭代迁移数据的方法,其特征在于:在生产环境不中断应用服务的情况下,将部分数据迁移至新的节点,以达到数据扩容的通用方法。
3.如权利1所述的大量数据将被划分为若干少量数据进行迭代迁移,其特征在于:仅仅正在迁移的少量数据会受影响,应用程序不能对其进行增、删、改操作,其余数据将不受影响。
4.如权利1所述的相关数据将被划分到同一迭代任务,保证数据一致性和完整性,其特征在于:相关数据将在同一批任务中进行迁移,数据一致性和完整性将得到保障。
5.如权利1所述的迁移过程与应用交互保证应用的畅通,其特征在于:在每一迭代任务开始迁移时和迁移结束后,应用程序会得到及时的通知,以避免试图操作正在迁移的数据而造成无谓的锁等待,从而保证应用程序的畅通。
6.如权利1所述的迁移过程,迁移过程保持高并发,分布式迁移,同时不影响应用本身的使用。其特征在于:多数据分布可以并行迁移同时互相不影响,与此同时,应用本身的全部特征都不受影响,保持可用性。
CN2012102921793A 2012-08-16 2012-08-16 不中断服务条件下,分布式数据库迭代迁移的方法 Pending CN102855299A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102921793A CN102855299A (zh) 2012-08-16 2012-08-16 不中断服务条件下,分布式数据库迭代迁移的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102921793A CN102855299A (zh) 2012-08-16 2012-08-16 不中断服务条件下,分布式数据库迭代迁移的方法

Publications (1)

Publication Number Publication Date
CN102855299A true CN102855299A (zh) 2013-01-02

Family

ID=47401887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102921793A Pending CN102855299A (zh) 2012-08-16 2012-08-16 不中断服务条件下,分布式数据库迭代迁移的方法

Country Status (1)

Country Link
CN (1) CN102855299A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909597A (zh) * 2016-06-30 2017-06-30 阿里巴巴集团控股有限公司 一种数据库迁移方法和装置
CN107015972A (zh) * 2016-01-27 2017-08-04 五八同城信息技术有限公司 一种机房业务迁移方法、装置和***
WO2017143957A1 (zh) * 2016-02-26 2017-08-31 华为技术有限公司 一种数据重分布的方法及装置
CN107870960A (zh) * 2017-06-25 2018-04-03 平安科技(深圳)有限公司 数据搬迁***及方法
CN108282378A (zh) * 2017-01-05 2018-07-13 阿里巴巴集团控股有限公司 一种监控网络流量的方法和装置
WO2018177107A1 (zh) * 2017-03-29 2018-10-04 腾讯科技(深圳)有限公司 数据迁移方法、迁移服务器及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033236A1 (en) * 2005-08-04 2007-02-08 Fujitsu Limited Database restructuring apparatus, and computer-readable recording medium recording database restructuring program
CN101364186A (zh) * 2008-09-27 2009-02-11 腾讯科技(深圳)有限公司 数据迁移方法、***、数据迁移服务器及数据接口服务器
CN101997911A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 一种数据迁移的方法及***
CN102073462A (zh) * 2010-11-29 2011-05-25 华为技术有限公司 虚拟存储迁移方法、***和虚拟机监控器
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070033236A1 (en) * 2005-08-04 2007-02-08 Fujitsu Limited Database restructuring apparatus, and computer-readable recording medium recording database restructuring program
CN101364186A (zh) * 2008-09-27 2009-02-11 腾讯科技(深圳)有限公司 数据迁移方法、***、数据迁移服务器及数据接口服务器
CN101997911A (zh) * 2010-10-21 2011-03-30 中兴通讯股份有限公司 一种数据迁移的方法及***
CN102073462A (zh) * 2010-11-29 2011-05-25 华为技术有限公司 虚拟存储迁移方法、***和虚拟机监控器
CN102244685A (zh) * 2011-08-11 2011-11-16 中国科学院软件研究所 一种支持负载均衡的分布式缓存动态伸缩方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SUDIPTO DAS ET AL.: "Live Database Migration for Elasticity in a Multitenant Database for Cloud Plateforms", 《UCSB COMPUTER SCIENCE TECHNICAL REPORT》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107015972A (zh) * 2016-01-27 2017-08-04 五八同城信息技术有限公司 一种机房业务迁移方法、装置和***
CN107015972B (zh) * 2016-01-27 2020-02-18 五八同城信息技术有限公司 一种机房业务迁移方法、装置和***
WO2017143957A1 (zh) * 2016-02-26 2017-08-31 华为技术有限公司 一种数据重分布的方法及装置
CN106909597A (zh) * 2016-06-30 2017-06-30 阿里巴巴集团控股有限公司 一种数据库迁移方法和装置
CN106909597B (zh) * 2016-06-30 2020-07-03 阿里巴巴集团控股有限公司 一种数据库迁移方法和装置
CN108282378A (zh) * 2017-01-05 2018-07-13 阿里巴巴集团控股有限公司 一种监控网络流量的方法和装置
CN108282378B (zh) * 2017-01-05 2021-11-09 阿里巴巴集团控股有限公司 一种监控网络流量的方法和装置
WO2018177107A1 (zh) * 2017-03-29 2018-10-04 腾讯科技(深圳)有限公司 数据迁移方法、迁移服务器及存储介质
CN108664496A (zh) * 2017-03-29 2018-10-16 腾讯科技(深圳)有限公司 数据迁移方法及装置
CN107870960A (zh) * 2017-06-25 2018-04-03 平安科技(深圳)有限公司 数据搬迁***及方法
WO2019001272A1 (zh) * 2017-06-25 2019-01-03 平安科技(深圳)有限公司 数据搬迁***及方法

Similar Documents

Publication Publication Date Title
CN102855299A (zh) 不中断服务条件下,分布式数据库迭代迁移的方法
US10402316B2 (en) Tracing garbage collector for search trees under multi-version concurrency control
US10133770B2 (en) Copying garbage collector for B+ trees under multi-version concurrency control
EP2738665B1 (en) Similarity analysis method, apparatus, and system
JP2013541083A (ja) 重複排除に基づくストレージシステムにおけるスケーラブル参照管理のためのシステム及び方法
CN104461744A (zh) 一种资源分配方法及装置
US9984139B1 (en) Publish session framework for datastore operation records
CN106126601A (zh) 一种社保大数据分布式预处理方法及***
JP6361223B2 (ja) トランザクションシステム
CN112965951A (zh) 用于数据库中数据重分布的***和方法
CN106406762A (zh) 一种重复数据删除方法及装置
CN106156245B (zh) 一种电子地图中的线要素合并方法及装置
US10061697B2 (en) Garbage collection scope detection for distributed storage
CN106202307A (zh) 一种批量日志保存方法及装置
US20120311021A1 (en) Processing method of transaction-based system
US10599472B2 (en) Information processing apparatus, stage-out processing method and recording medium recording job management program
CN106528297A (zh) 一种管理任务的***
Mestre et al. Efficient entity matching over multiple data sources with mapreduce
CN102779134B (zh) 基于Lucene的分布式搜索方法
CN106815318B (zh) 一种时序数据库的集群化方法及***
CN104102557A (zh) 一种基于聚类的云计算平台数据备份方法
CN103024047A (zh) 一种数据容错方法
CN107590286B (zh) 在集群文件***中事务信息的管理方法和装置
CN105635276A (zh) 云平台分布式物理卷对象迁移到非分布式存储的方法
KR101792189B1 (ko) 빅 데이터 처리 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130102