CN103885986A - 主备数据库同步的方法和装置 - Google Patents

主备数据库同步的方法和装置 Download PDF

Info

Publication number
CN103885986A
CN103885986A CN201210564590.1A CN201210564590A CN103885986A CN 103885986 A CN103885986 A CN 103885986A CN 201210564590 A CN201210564590 A CN 201210564590A CN 103885986 A CN103885986 A CN 103885986A
Authority
CN
China
Prior art keywords
affairs
write
major key
queue
virtual record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210564590.1A
Other languages
English (en)
Other versions
CN103885986B (zh
Inventor
叶晖俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210564590.1A priority Critical patent/CN103885986B/zh
Publication of CN103885986A publication Critical patent/CN103885986A/zh
Application granted granted Critical
Publication of CN103885986B publication Critical patent/CN103885986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种主备数据库同步的方法和装置,用于主数据库和备数据库间的数据同步,该方法包括:事务派发步骤,将从主数据库读取的各个事务或各个事务的标识派发至写队列;事务写入步骤,采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库。本发明采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率。

Description

主备数据库同步的方法和装置
技术领域
本申请涉及数据处理领域,尤其是一种数据库主备数据库同步的方法和装置。
背景技术
MySQL是互联网行业广泛使用的开源数据库软件。很多大型网站都在使用MySQL数据库,随着业务规模不断的增长,一台MySQL数据库会无法支撑庞大的访问量。
有一个有效的解决方案就是建立MySQL主备集群,备数据库是主数据库的完全镜像。写请求只落在主数据库上,读请求会均衡的分布到所有数据库上,这样整个集群可以提供更大容量的读写服务。MySQL主数据库在接收新增变更数据后,再通过同步工具,把变更数据实时同步到备数据库。
Mysql binlog日志是一种二进制日志,包括三种格式,分别为ROW(行)格式、Statement(SQL语句)格式、MIX(混合)格式。其中ROW格式记录了每次数据变更的整行完整的旧值和新值。信息丰富完整,并且拥有重复复制到从库,得到的最终数据还是一致的特性。
MySQL官方提供社区版,主备同步采用的是单线程同步。当主数据库有较高的写入负载时,主从同步的延时增加,导致从库不能及时的读取到最新的数据,降低了整个集群的可用性。
发明内容
本申请要解决的技术问题是提供一种主备数据库同步的方法和装置,以解决现有主备数据库同步效率低下的问题。
为解决上述技术问题,本申请提供了一种主备数据库同步的方法,用于主数据库和备数据库间的数据同步,该方法包括:
事务派发步骤,将从主数据库读取的各个事务或各个事务的标识派发至写队列;
事务写入步骤,采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库。
进一步地,所述派发步骤前,该方法还包括:
预处理步骤,依次提取各个事务的主键,为各个事务创建主键列表,根据各个事务的主键列表,依次将各个事务的标识放入各个事务的主键对应的主键事务队列中,处于主键事务队列的队首的事务获得该主键对应的虚拟记录锁;
派发事务或写入事务的前提为该事务的虚拟记录锁总数等于该事务的主键列表中主键的总数。
进一步地,所述预处理步骤中,去除重复的主键后创建所述主键列表。
进一步地,所述派发步骤还包括:对于已经写入备数据库的事务,删除位于主键事务队列队首的该事务的事务标识,将虚拟记录锁传递给该主键事务队列的下一个节点。
进一步地,所述事务派发步骤由派发线程执行,预处理步骤中,为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,所述派发线程或写线程根据所述虚拟记录锁计数器判断当前事务的虚拟记录锁总数等于该事务的主键列表中主键的总数。
进一步地,事务派发步骤中,根据写队列最短原则或事务哈希值为当前事务选择写队列。
进一步地,述事务的哈希值是将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
进一步地,事务写入步骤之后,该方法还包括删除步骤,删除已写入备数据库的事务对象。
为解决上述技术问题,本发明还提供了一种主备数据库同步的装置,该装置包括:
派发单元,用于依次将从主数据库读取的各个事务或各个事务的标识派发至写队列;
写入单元,用于采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库;
若干个写队列,用于存放派发单元派发的事务或事务的标识,一个写队列对应一个写线程。
相较于现有技术,本申请技术方案同步的最小单位是事务;在同步过程中确保了事务的原子性;且采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率,增加了集群的可用性。
附图说明
图1为本申请主备数据库同步的方法实施例1的示意图;
图2为本申请主备数据库同步的方法实施例2的示意图;
图3为本申请主备数据库同步的方法实施例3的示意图;
图4为本申请主备数据库同步的方法实施例4的示意图;
图5是本申请给出的一个应用实例的示意图;
图6为本发明主备数据库同步的装置的模块结构示意图;
图7为本发明主备数据库同步的装置的另一模块结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而非全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
实施例1
本申请实施例主备数据库同步的方法,如图1所示,用于主数据库和备数据库间的数据同步,该方法包括:
步骤101:事务派发步骤,依次将从主数据库读取的各个事务或各个事务的标识派发至写队列;
本申请实施例从主数据库读出的事务的读出的顺序为其在主数据库中提交并写入日志的顺序。
该事务派发步骤由一个派发线程实现。
事务派发步骤中,根据写队列最短原则或事务哈希值为当前事务选择写队列。
较佳地,采用写队列最短原则,即将当前待派发的事务派发至最短的写队列(即任务量最少的写队列),如此,可以较好地达到负载均衡。
本申请对获得事务的哈希值的方法不做限定,可选地,事务的哈希值可将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
步骤102:事务写入步骤,采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库。
本申请中,同步的最小单位是事务;写入备数据库时,可以确保事务不被打散,即主数据库是一个事务写入的记录,从库中也会在一个事务中写入,在同步过程中确保了事务的原子性。
可理解地,即使利用单线程将事务的标识串行派发至写队列,其速度仍然较快,而在事务写入备数据库时,采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率,增加了集群的可用性。
实施例2
本申请主备数据库同步的方法,如图2所示,用于主数据库和备数据库间的数据同步,该方法包括:
步骤201:预处理步骤,依次提取从主数据库读取的各个事务的主键,为各个事务创建主键列表,根据各个事务的主键列表,依次将各个事务的标识放入各个事务的主键对应的主键事务队列中,处于主键事务队列的队首的事务该主键对应的虚拟记录锁;
本文中,一个主键对应一个主键事务队列,不同的主键对应不同的主键事务队列。一个事务在写入备数据库之前,需要获得该事务每条记录对应的主键所对应的虚拟记录锁。
例如,事务A的N个行记录的主键均为a,则该主键a的主键事务队列中包括该事务A的N个标识,当该主键事务队列的队首存放事务A的标识时,该事务A依次获得该主键的N个虚拟记录锁。
每个主键对应一个主键事务队列(PK Tran Queue)。各个主键的虚拟记录锁按如下方式维护:事务标识处于主键事务队列的队首的事务,获得该主键对应的虚拟记录锁;当队首的事务标识对应的事务已经写入备数据库后,删除队首,将虚拟记录锁传递给该队列的下一个节点。
步骤202:事务派发步骤,当事务的虚拟记录锁总数等于该事务的主键列表中主键的总数时将该事务派发至写队列;
该事务派发步骤由一个派发线程实现。
事务派发步骤中,根据写队列最短原则或事务哈希值为当前事务选择写队列。
较佳地,采用写队列最短原则,即选择最短的写队列派发事务,可以较好地达到负载均衡。
本申请对获得事务的哈希值方法不做限定,可选地,事务的哈希值可将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
步骤203:事务写入步骤,采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库。
可理解地,即使利用单线程将事务标识串行派发至写队列,其速度仍然较快,而在写入备数据库时,采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率,增加了集群的可用性。
可优化地,以上实施例2中,步骤201预处理步骤中,为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,步骤202事务派发步骤中,派发线程根据所述虚拟记录锁计数器判断当前事件的虚拟记录锁总数是否等于该事务的主键列表中主键的总数,进而决定是否将该事务派发至写队列。
可选地,以上实施例2的步骤201预处理步骤中,创建的主键列表前,可删除其中重复的主键,例如,事务A的N个行记录的主键均为a,则删除重复的主键后,此时主键a仍然对应事务A的N个行记录。该主键a的主键事务队列中包括该事务A的一个标识(比如指针),相应的,当事务A的标识排在主键a对应的主键事务队列的队首时,该事务A获得该主键的1个虚拟记录锁。步骤202事务派发步骤中,派发线程仍然通过判断该事件获得的虚拟记录锁总数是否等于该事务的主键列表中主键的总数来触发事务派发。
实施例3
本申请主备数据库同步的方法,如图3所示,用于主数据库和备数据库间的数据同步,该方法包括:
步骤301:预处理步骤,依次提取各个从主数据库读取的事务的主键,并去除重复的主键,为各个事务创建主键列表;根据各个事务的主键列表,依次将各个事务的标识(比如指针)放入该事务各个主键对应的主键事务队列中,事务标识处于主键事务队列的队首的事务获得该主键对应的虚拟记录锁;
步骤301中,依次从事务的各个行记录中提取主键,去除重复的主键后,一个主键对应一个或若干个行记录。
各个主键的虚拟记录锁按如下方式维护:处于主键事务队列队首的事务标识对应事务,获得该主键对应的虚拟记录锁;当队首的的事务标识对应事务已经写入备数据库后,删除队首,将虚拟记录锁传递给该队列的下一个节点。
步骤302:事务派发步骤,依次将各个事务或各个事务的标识派发至写队列;
该事务派发步骤由一个派发线程实现。
事务派发步骤中,根据写队列最短原则或事务哈希值为当前事务选择写队列。
较佳地,采用写队列最短原则,即选择最短的写队列派发事务,可以较好地达到负载均衡。
本申请对获得事务的哈希值方法不做限定,可选地,事务的哈希值可将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
步骤303:事务写入步骤,采用多个写线程并行实现,写线程判断位于写队列队首的事务的虚拟记录锁总数等于该事务的主键列表中主键的总数时,将该事务写入备数据库。
可理解地,即使利用单线程将事务标识串行派发至写队列,其速度仍然较快,而在写入备数据库时,采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率,增加了集群的可用性。
可优化地,以上实施例3中,步骤301预处理步骤中,为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,步骤303事务写入步骤中,写线程根据所述虚拟记录锁计数器判断当前事务的虚拟记录锁总数等于该事务的主键列表中主键的总数。
实施例4
如图4,本实施例中大量使用了队列(Queue)和哈希(Hash)计算,所以本文也称本申请为哈希队列算法。
本实施例中包括输入队列(Input Queue),源队列(Source Queue)、主键事务队列(PK Tran Queue)、写队列(Wrtier Queue)、待释放队列(Free Queue)、预处理线程(Preprocess Thread),派发线程(Dispatcherd Thread),写线程(WrtierThread);其中只有写线程(Writer Thread)和写队列(Writer Queue)根据配置创建多个,其他均为单个实例;一个写线程对应一个写队列。
如图各个关键模块中维护和管理了一些队列,接下来按照数据流转的过程,介绍本方案的实施过程和关键模块:
步骤401,对输入队列(Input Queue)中的事务进行预处理;
输入队列(Input Queue)中存放着本申请的输入数据,即一个个事务的指针,按照主数据库中读出事务的顺序,先读出,先存入其事务指针,先消费。
预处理线程(Preprocess Thread),把输入队列中的事务指针对应的事务做如下处理:
创建事务队列节点(BinlogItem),包括如下属性:输入的事务,该事务的主键列表(PK List),事务的Hash值,虚拟记录锁计数器。
提取事务的主键,去除重复主键,对每个事务创建一个主键列表,包括事务中的每行记录对应的主键;
计算事务哈希(Hash)值,提取事务队列中的第一个主键,把他转换成字符串,例如“库名.表名.列名.值”,再通过Hash计算,把主键字符串映射为64位的长整形Hash值,作为事务派发到写队列中使用的Hash值。
初始化虚拟记录锁计算器的值为零。
源队列(Source Queue),事务预处理完成后,就放入到源队列(SourceQueue)。源队列只是用来暂存做完预处理的事务队列节点(BinlogItem);
主键事务队列(PK Tran Queue),即一个主键对应一个队列,这个队列中按先进先出的模式存放着预处理完的事务队列节点(BinlogItem)的指针;事务队列节点的指针位于主键事务队列的队首,即标志着对应的事务取得了该主键对应的虚拟记录锁;
一个事务有多少个不同主键,就进入多少个不同的主键事务队列;进入的对象直接是事务队列节点(BinlogItem)的指针,这个对象指向整个事务,事务由是由所有记录组成。
根据各个事务的主键列表,依次将各个事务的事务队列节点的指针放入该事务各个主键对应的主键事务队列中,处于主键事务队列队首的事务队列节点的指针对应的事务即获得该主键对应的虚拟记录锁。
回收事务的记录占有的虚拟记录锁,当事务已经写入备数据库后,释放主键事务队列(PK Tran Queue)中的事务队列节点指针对应的事务。从该事务的事务主键列表中,逐个获得每个主键,再获得该主键对应的主键事务队列(PK Tran Queue),并删除队首,然后把虚拟记录锁传递给该主键事务队列(PKTran Queue)中的下一个节点(BinlogItem),即下一个节点对应的事务的虚拟记录锁计数器加1;如果该队列已经是空的,即可删除释放该队列,完成本步骤后再释放队列节点对象。
待释放队列(Free Queue),先进先出队列,用来存放已经写入到备数据库的事务队列节点的指针;
派发线程根据待释放队列中的事务队列节点的指针,释放内存中对应的事务对象,此时写线程已将对应事务写入了备数据库,完成了同步。
虚拟记录锁,每条记录对应一个虚拟记录锁,虚拟记录锁有两种状态,锁定、未锁定;锁定状态是表示这条记录在本***中已经锁定,把该记录写入备数据库,不会产生数据冲突;未锁定状态,表示该记录还不具备写入备数据库的先决条件。本申请中,一个事务在写入备数据库之前,需要获得该事务每条记录对应的主键所对应的虚拟记录锁;一个事务中所有不同记录的虚拟记录锁,采用事务队列节点(BinlogItem)的虚拟记录锁计数器属性来描述。获得一条记录的虚拟记录锁,即表示锁定该记录,或者说该记录的虚拟记录锁状态被设置为锁定。
虚拟记录锁计数器,是一个整形计数器,初始值为0,最大值等于步骤1预处理后事务的主键列表的大小(即主键列表中主键的总数);对应的事务每次获得一个虚拟记录锁,对应的数值就加1,当一个事务获得的所有虚拟记录锁的总数等于主键列表的大小时,表示该事务可以写入备数据库,而不会产生任何数据冲突了。
虚拟记录锁计算器是对单个事务而言,是否已经具写到从库的条件的标志。因为一个事务可能排在部分主键事务队列的队首,同时排在部分主键事务队列的队中,此种情况下,根据本申请,该事务就不具备执行派发或写入的前置条件,除非该事务获得所有虚拟记录锁。
步骤402:派发事务到写队列;
派发事务有两种方式:
a.先获得所有虚拟记录锁,再派发:先把事务队列节点的指针放到该事务队列节点所有主键对应的主键事务队列(PK Tran Queue)的队尾中,如果事务队列节点的指针已经排在队首,那么对应的事务队列节点即获得该主键对应的虚拟记录锁,该事务队列节点的虚拟记录锁计数器属性加1;否则主键事务队列中事务队列节点就等待获取虚拟记录锁,当一个事务队列节点获得了所有的虚拟记录锁之后,即可被派发到写队列,派发的算法可以是,遍历写队列,把事务队列节点的指针或事务指针放入最短的写队列;也可以根据步骤1生成的事务哈希值,通过哈希算法派发,例如Tran Hash Value%WriteQueue Size即用事务哈希值取模队列数,得到的数值作为写队列数组的下标;
b.直接派发:先把事务队列节点的指针放到其所有主键对应的主键事务队列(PK Tran Queue)中,如果事务队列节点的指针已经排在队首,那么对应的事务队列节点即获得该主键对应的虚拟记录锁;无论事务队列节点是否获得所有虚拟记录锁,都派发事务队列节点的指针到写队列。派发的算法可以据步骤1生成的事务哈希值,通过哈希算法派发。采用这种派发方式,写线程在把每个事务写入备数据库前需要检查该事务是否获得所有虚拟记录锁,如果没有则等待事务获得所有虚拟记录锁后再写入。
步骤403,并行写入事务,
写队列(Wrtier Queue)也是一个先进先出(FIFO)队列,存放由步骤402派发来的事务队列节点的指针;每个写线程对应一个写队列;
如果步骤403中采用a方式,则每个写线程根据自己的写队列中的事务队列节点的指针去内存取事务,按照数据库事务的标准写入事务(即开始事务,逐条写入记录,提交事务),写入完成后,把事务队列节点的指针的从写队列中移除,并放回到待释放队列(Free Queue)。
如果步骤403中采用b方式,则写入之前,写线程先检查该事务队列节点是否获得所有虚拟记录锁,如果是那么写入;如果否那么等待该事务队列节点获得所有虚拟记录锁再执行写入操作
本申请采用C/C++会有较好的性能,但是也可以采用其他高级语言编写。在本申请的实施实验中,确定本申请可以使得备数据库写入达到极限;
本申请中预处理和派发事务到写队列是串行执行的,而写入步骤是并行执行,如此,对修改了相同记录的事务依次串行写入备数据库,对于不相关的事务即修改的是完全不同记录的事务,并行处理。
如图5所示,输入数据为三个有序的事务,事务1(Tran 1)和事务2(Tran 2)都更新了同一条记录B,那么事务1和事务2应该串行,并且顺序必须是先写入事务1,再写入事务2。事务3和事务1、事务2都没关系,所以也可以并行写入。采用本申请机制,可以同时执行事务1和事务3的写入操作。而事务2,因为没有获得足够的虚拟记录锁,只好等待,直到它获得足够的虚拟记录锁,即可写入备数据库。从而对事务的并行和串行进行了有效控制,达到可以并行的并行,应该串行的串行。
在事务1和事务2的事务队列节点不写入同一个写队列时,在事务1写入前,如果是403a,则执行事务2的写线程会被挂起,直到事务1写完,并释放完虚拟记录锁;如果是403b,那么事务2在事务1写入之前都不会被派发至写队列。
以上实施例中,输入队列主要是为了保证其中的节点对应的事务是按照主数据库中事务读出的顺序,具体的输入队列的节点是事务、事务的指针对本发明实质不会产生影响。
源队列中的节点是根据输入队列中的顺序生成的事务队列节点,各事务队列节点包括事务的各个属性参数及本发明特有的事务的虚拟记录锁计数器。
每个主键事务队列对应一个特定的主键,其中存放的节点是该主键对应的、根据输入队列或源队列(即能保证事务时序)中的事务时序存放的事务指针或事务队列节点的指针,其主要用于对事务的虚拟记录锁进行计数以及事务获得虚拟记录锁的时序进行控制。
写队列和待释放队列中的节点是事务的指针或事务队列节点的指针,主要用于指示写线程对哪个事务进行写入操作或完成了写入操作。
综上可以看出,事务的指针或事务队列节点的指针均具有标识事务的作用,可统称事务标识。从主数据库输出的事务仅需要缓存一次,待写队列中事务标识对应的事务写入备数据库后,删除待释放队列中事务标识对应的事务即可。
采用事务的标识可减少缓存资源的占用,提高处理效率。
为实现上述方法,本发明还提供了一种主备数据库同步的装置,如图6所示,该装置包括:
派发单元,用于依次将从主数据库读取的各个事务或各个事务的标识派发至写队列;
派发单元根据写队列最短原则或事务哈希值为当前事务选择写队列。
所述事务哈希值是将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
写入单元,用于采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库;
若干个写队列,用于存放派发单元派发的事务或事务的标识,一个写队列对应一个写线程。
如图7所示,与图6不同的是,所述装置还包括:
预处理单元,用于依次提取各个事务的主键,为各个事务创建主键列表;还用于根据各个事务的主键列表,依次将各个事务的指针放入该事务各个主键对应的主键事务队列中,事务的指针处于队首的事务即获得该主键对应的虚拟记录锁;
若干个主键事务队列,用于存储各个事务的标识;
所述派发单元或写入单元,当事务获得的虚拟记录锁总数等于该事务的主键列表中主键的总数时,派发事务或写入事务。
优选地,所述预处理单元去除重复的主键后创建事务的主键列表。
优选地,所述派发单元,还用于删除各个主键事务队列队首的已经写入备数据库的事务的事务标识,将虚拟记录锁传递给该队列的下一个节点。
优选地,所述派发单元由派发线程实现,预处理单元还用于为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,所述派发单元或写入单元根据所述虚拟记录锁计数器判断当前事件的虚拟记录锁总数等于该事务的主键列表中主键的总数。
本申请技术方案具有以下优点:
同步的最小单位是事务;写入备数据库时,可以确保事务不被打散,即主数据库是一个事务写入的记录,从库中也会在一个事务中写入,在同步过程中确保了事务的原子性;
采用多个写线程同时并行执行写入操作,减少了时延,可及时实现主备数据库同步,提高了同步效率,增加了集群的可用性;
通过虚拟记录锁,使得不同事务间可以并行写入备数据库而又可以确保时序和不产生死锁;
在同一个派发线程(Dispatcher Thread)中处理虚拟记录锁的回收、分配,避免了多线程争用记录锁,提升了性能,降低了程序复杂度;
可以先派发事务到写队列,让写线程去校验是否获得所有记录锁;也可以获得所有记录锁后再派发事务入写队列,而后直接写入备数据库;事务写到备数据库后,都要放回到待释放队列;
采用本申请,可以对数据库同步,进行并行同步,提高数据写入速度超过500%的同时、控制最大延时在1秒以内,即提高了吞吐量,减少了时延,并且还能确保同步的过程中事务不被打散,具有事务强一致性的优点。

Claims (14)

1.一种主备数据库同步的方法,用于主数据库和备数据库间的数据同步,其特征在于,该方法包括:
事务派发步骤,将从主数据库读取的各个事务或各个事务的标识派发至写队列;
事务写入步骤,采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库。
2.如权利要求1所述的方法,其特征在于:所述派发步骤前,该方法还包括:
预处理步骤,依次提取各个事务的主键,为各个事务创建主键列表,根据各个事务的主键列表,依次将各个事务的标识放入各个事务的主键对应的主键事务队列中,处于主键事务队列的队首的事务获得该主键对应的虚拟记录锁;
派发事务或写入事务的前提为该事务的虚拟记录锁总数等于该事务的主键列表中主键的总数。
3.如权利要求2所述的方法,其特征在于:所述预处理步骤中,去除重复的主键后创建所述主键列表。
4.如权利要求2所述的方法,其特征在于,所述派发步骤还包括:对于已经写入备数据库的事务,删除位于主键事务队列队首的该事务的事务标识,将虚拟记录锁传递给该主键事务队列的下一个节点。
5.如权利要求4所述的方法,其特征在于:所述事务派发步骤由派发线程执行,预处理步骤中,为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,所述派发线程或写线程根据所述虚拟记录锁计数器判断当前事务的虚拟记录锁总数等于该事务的主键列表中主键的总数。
6.如权利要求1所述的方法,其特征在于:事务派发步骤中,根据写队列最短原则或事务哈希值为当前事务选择写队列。
7.如权利要求6所述的方法,其特征在于:所述事务的哈希值是将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
8.如权利要求1所述的方法,其特征在于:事务写入步骤之后,该方法还包括删除步骤,删除已写入备数据库的事务对象。
9.一种主备数据库同步的装置,其特征在于,该装置包括:
派发单元,用于依次将从主数据库读取的各个事务或各个事务的标识派发至写队列;
写入单元,用于采用多个写线程并行将各写线程对应的写队列中的事务或标识对应的事务写入备数据库;
若干个写队列,用于存放派发单元派发的事务或事务的标识,一个写队列对应一个写线程。
10.如权利要求9所述的装置,其特征在于:所述装置还包括:
预处理单元,用于依次提取各个事务的主键,为各个事务创建主键列表;还用于根据各个事务的主键列表,依次将各个事务的指针放入该事务各个主键对应的主键事务队列中,事务的指针处于队首的事务即获得该主键对应的虚拟记录锁;
若干个主键事务队列,用于存储各个事务的标识;
所述派发单元或写入单元,当事务获得的虚拟记录锁总数等于该事务的主键列表中主键的总数时,派发事务或写入事务。
11.如权利要求10所述的装置,其特征在于,所述派发单元,还用于删除已经写入备数据库的事务对应的主键事务队列队首的事务标识,将虚拟记录锁传递给该队列的下一个节点。
12.如权利要求10所述的装置,其特征在于:所述派发单元由派发线程实现,预处理单元还用于为各个事务创建虚拟记录锁计数器,该事务每获得一个虚拟记录锁,该虚拟记录锁计数器加1,所述派发单元或写入单元根据所述虚拟记录锁计数器判断当前事件的虚拟记录锁总数等于该事务的主键列表中主键的总数。
13.如权利要求9所述的装置,其特征在于:派发单元根据写队列最短原则或事务哈希值为当前事务选择写队列。
14.如权利要求10所述的装置,其特征在于:所述事务哈希值是将各个事务的第一个主键转换成字符串,再通过哈希计算得到的。
CN201210564590.1A 2012-12-21 2012-12-21 主备数据库同步的方法和装置 Active CN103885986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210564590.1A CN103885986B (zh) 2012-12-21 2012-12-21 主备数据库同步的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210564590.1A CN103885986B (zh) 2012-12-21 2012-12-21 主备数据库同步的方法和装置

Publications (2)

Publication Number Publication Date
CN103885986A true CN103885986A (zh) 2014-06-25
CN103885986B CN103885986B (zh) 2017-12-19

Family

ID=50954881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210564590.1A Active CN103885986B (zh) 2012-12-21 2012-12-21 主备数据库同步的方法和装置

Country Status (1)

Country Link
CN (1) CN103885986B (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503986A (zh) * 2014-12-02 2015-04-08 国家电网公司 一种用户信息录入的方法及设备
CN104699541A (zh) * 2015-03-30 2015-06-10 北京奇虎科技有限公司 同步数据的方法、装置、数据传输组件及***
CN105574026A (zh) * 2014-10-15 2016-05-11 腾讯科技(深圳)有限公司 非关系型数据库支持事务的方法及装置
WO2016127903A1 (zh) * 2015-02-13 2016-08-18 阿里巴巴集团控股有限公司 一种数据同步方法、装置和***
CN105893386A (zh) * 2015-01-04 2016-08-24 伊姆西公司 用于在同步复制***中处理事务的方法和装置
CN106776790A (zh) * 2016-11-11 2017-05-31 北京奇虎科技有限公司 基于令牌的并发主从同步方法及装置
CN106802897A (zh) * 2015-11-26 2017-06-06 北京国双科技有限公司 查询表数据同步方法和装置
CN106815094A (zh) * 2015-12-02 2017-06-09 阿里巴巴集团控股有限公司 一种用于实现主备同步模式下事务提交的方法与设备
CN106855860A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 用于创建主备数据库的方法和设备
CN106874341A (zh) * 2016-12-23 2017-06-20 航天星图科技(北京)有限公司 一种数据库同步方法
CN106909554A (zh) * 2015-12-22 2017-06-30 亿阳信通股份有限公司 一种数据库文本表数据的加载方法及装置
CN106959989A (zh) * 2016-01-11 2017-07-18 北京京东尚科信息技术有限公司 主备数据库的同步方法及装置
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN107918620A (zh) * 2016-10-10 2018-04-17 阿里巴巴集团控股有限公司 一种数据库的写入方法及装置、电子设备
CN107958023A (zh) * 2017-11-06 2018-04-24 北京华宇信息技术有限公司 数据同步方法、数据同步装置和计算机可读存储介质
CN108073658A (zh) * 2016-11-16 2018-05-25 ***通信集团广西有限公司 一种数据同步***及方法
CN108304406A (zh) * 2017-01-12 2018-07-20 阿里巴巴集团控股有限公司 一种数据库读写方法、装置及电子设备
CN108694199A (zh) * 2017-04-10 2018-10-23 北京京东尚科信息技术有限公司 数据同步装置、方法、存储介质及电子设备
CN109299136A (zh) * 2018-11-27 2019-02-01 佛山科学技术学院 一种智能制造的数据库资源池的实时同步方法及装置
CN109446268A (zh) * 2018-10-09 2019-03-08 联动优势科技有限公司 一种数据同步方法及装置
CN109656936A (zh) * 2018-11-30 2019-04-19 金蝶软件(中国)有限公司 数据同步方法、装置、计算机设备和存储介质
CN110134500A (zh) * 2019-04-15 2019-08-16 平安普惠企业管理有限公司 基于多线程的数据同步方法、装置、设备和存储介质
CN111198872A (zh) * 2020-01-06 2020-05-26 中科驭数(北京)科技有限公司 数据库处理事务的方法及装置
CN111858626A (zh) * 2020-06-04 2020-10-30 武汉达梦数据库有限公司 一种基于并行执行的数据同步的方法和装置
CN115952178A (zh) * 2022-12-01 2023-04-11 北京华宇九品科技有限公司 一种多层级关联数据异构数据同步方法
US11947427B2 (en) * 2020-02-26 2024-04-02 EMC IP Holding Company LLC Method, electronic device, and computer program product for storage management using blockchain

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394641A (zh) * 2007-09-18 2009-03-25 中兴通讯股份有限公司 一种面向用户数据的主备机倒换方法
CN101706795A (zh) * 2009-11-30 2010-05-12 上海世范软件技术有限公司 主备服务器上数据库数据同步方法
CN102081611A (zh) * 2009-11-26 2011-06-01 中兴通讯股份有限公司 一种主、备网管***数据库同步的实现方法及装置
US20110307524A1 (en) * 2010-06-11 2011-12-15 Microsoft Corporation Unified concurrent changes to data, schema, and application
CN102831156A (zh) * 2012-06-29 2012-12-19 浙江大学 一种云计算平台上的分布式事务处理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101394641A (zh) * 2007-09-18 2009-03-25 中兴通讯股份有限公司 一种面向用户数据的主备机倒换方法
CN102081611A (zh) * 2009-11-26 2011-06-01 中兴通讯股份有限公司 一种主、备网管***数据库同步的实现方法及装置
CN101706795A (zh) * 2009-11-30 2010-05-12 上海世范软件技术有限公司 主备服务器上数据库数据同步方法
US20110307524A1 (en) * 2010-06-11 2011-12-15 Microsoft Corporation Unified concurrent changes to data, schema, and application
CN102831156A (zh) * 2012-06-29 2012-12-19 浙江大学 一种云计算平台上的分布式事务处理方法

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574026A (zh) * 2014-10-15 2016-05-11 腾讯科技(深圳)有限公司 非关系型数据库支持事务的方法及装置
CN104503986A (zh) * 2014-12-02 2015-04-08 国家电网公司 一种用户信息录入的方法及设备
CN105893386A (zh) * 2015-01-04 2016-08-24 伊姆西公司 用于在同步复制***中处理事务的方法和装置
US11507599B2 (en) 2015-01-04 2022-11-22 EMC IP Holding Company LLC Processing transactions in a synchronized replication system
WO2016127903A1 (zh) * 2015-02-13 2016-08-18 阿里巴巴集团控股有限公司 一种数据同步方法、装置和***
US10509585B2 (en) 2015-02-13 2019-12-17 Alibaba Group Holding Limited Data synchronization method, apparatus, and system
CN104699541B (zh) * 2015-03-30 2018-07-10 北京奇虎科技有限公司 同步数据的方法、装置、数据传输组件及***
CN104699541A (zh) * 2015-03-30 2015-06-10 北京奇虎科技有限公司 同步数据的方法、装置、数据传输组件及***
CN106802897A (zh) * 2015-11-26 2017-06-06 北京国双科技有限公司 查询表数据同步方法和装置
CN106815094A (zh) * 2015-12-02 2017-06-09 阿里巴巴集团控股有限公司 一种用于实现主备同步模式下事务提交的方法与设备
CN106815094B (zh) * 2015-12-02 2020-12-11 阿里巴巴集团控股有限公司 一种用于实现主备同步模式下事务提交的方法与设备
CN106855860A (zh) * 2015-12-08 2017-06-16 阿里巴巴集团控股有限公司 用于创建主备数据库的方法和设备
CN106909554A (zh) * 2015-12-22 2017-06-30 亿阳信通股份有限公司 一种数据库文本表数据的加载方法及装置
CN106909554B (zh) * 2015-12-22 2020-08-04 亿阳信通股份有限公司 一种数据库文本表数据的加载方法及装置
CN106959989A (zh) * 2016-01-11 2017-07-18 北京京东尚科信息技术有限公司 主备数据库的同步方法及装置
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN107783975B (zh) * 2016-08-24 2021-02-26 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN107918620A (zh) * 2016-10-10 2018-04-17 阿里巴巴集团控股有限公司 一种数据库的写入方法及装置、电子设备
US11640384B2 (en) 2016-10-10 2023-05-02 Alibaba Group Holding Limited Database processing method, apparatus, and electronic device
CN106776790A (zh) * 2016-11-11 2017-05-31 北京奇虎科技有限公司 基于令牌的并发主从同步方法及装置
CN108073658B (zh) * 2016-11-16 2020-06-12 ***通信集团广西有限公司 一种数据同步***及方法
CN108073658A (zh) * 2016-11-16 2018-05-25 ***通信集团广西有限公司 一种数据同步***及方法
CN106874341B (zh) * 2016-12-23 2022-04-05 中科星图股份有限公司 一种数据库同步方法
CN106874341A (zh) * 2016-12-23 2017-06-20 航天星图科技(北京)有限公司 一种数据库同步方法
CN108304406A (zh) * 2017-01-12 2018-07-20 阿里巴巴集团控股有限公司 一种数据库读写方法、装置及电子设备
CN108694199A (zh) * 2017-04-10 2018-10-23 北京京东尚科信息技术有限公司 数据同步装置、方法、存储介质及电子设备
CN107958023A (zh) * 2017-11-06 2018-04-24 北京华宇信息技术有限公司 数据同步方法、数据同步装置和计算机可读存储介质
CN109446268A (zh) * 2018-10-09 2019-03-08 联动优势科技有限公司 一种数据同步方法及装置
CN109299136A (zh) * 2018-11-27 2019-02-01 佛山科学技术学院 一种智能制造的数据库资源池的实时同步方法及装置
CN109656936A (zh) * 2018-11-30 2019-04-19 金蝶软件(中国)有限公司 数据同步方法、装置、计算机设备和存储介质
CN110134500A (zh) * 2019-04-15 2019-08-16 平安普惠企业管理有限公司 基于多线程的数据同步方法、装置、设备和存储介质
CN111198872A (zh) * 2020-01-06 2020-05-26 中科驭数(北京)科技有限公司 数据库处理事务的方法及装置
US11947427B2 (en) * 2020-02-26 2024-04-02 EMC IP Holding Company LLC Method, electronic device, and computer program product for storage management using blockchain
CN111858626A (zh) * 2020-06-04 2020-10-30 武汉达梦数据库有限公司 一种基于并行执行的数据同步的方法和装置
CN111858626B (zh) * 2020-06-04 2024-06-21 武汉达梦数据库股份有限公司 一种基于并行执行的数据同步的方法和装置
CN115952178A (zh) * 2022-12-01 2023-04-11 北京华宇九品科技有限公司 一种多层级关联数据异构数据同步方法

Also Published As

Publication number Publication date
CN103885986B (zh) 2017-12-19

Similar Documents

Publication Publication Date Title
CN103885986A (zh) 主备数据库同步的方法和装置
CN108804112B (zh) 一种区块链落账处理方法及***
Wang et al. Multi-query optimization in mapreduce framework
US9619430B2 (en) Active non-volatile memory post-processing
CA2822900C (en) Filtering queried data on data stores
CN102640151B (zh) 用于传输日志记录的方法和***
CN103930875A (zh) 用于加速业务数据处理的软件虚拟机
CN104516989B (zh) 增量数据推送***和方法
Yang et al. Huge: An efficient and scalable subgraph enumeration system
Gupta et al. Lock-free pending event set management in time warp
CN103886109B (zh) 一种实现数据库行锁的方法及装置
CN107113341A (zh) 用于数据划分的分布式关系数据库管理***中事务的高吞吐量处理的***
CN106663062A (zh) 在事务性中间件机器环境中提供分布式事务锁的***和方法
CN104750720A (zh) 多线程并发访问环境下高性能数据处理的实现
CN104111936A (zh) 数据查询方法和***
Su et al. Bringing modular concurrency control to the next level
Abebe et al. MorphoSys: automatic physical design metamorphosis for distributed database systems
Tang et al. Toward coordination-free and reconfigurable mixed concurrency control
Wu et al. GPU accelerated on-the-fly reachability checking
CN111858626B (zh) 一种基于并行执行的数据同步的方法和装置
He et al. Real-time scheduling in mapreduce clusters
CN103345383A (zh) 一种多线程数据比对方法和装置
Burgos et al. Exploiting concurrency in sharded parallel state machine replication
Perwej et al. An extensive investigate the mapreduce technology
CN106708948A (zh) 一种用主键唯一性实现事务操作的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant