CN109815028A - 数据同步的***、方法、装置和计算机存储介质 - Google Patents

数据同步的***、方法、装置和计算机存储介质 Download PDF

Info

Publication number
CN109815028A
CN109815028A CN201811615533.5A CN201811615533A CN109815028A CN 109815028 A CN109815028 A CN 109815028A CN 201811615533 A CN201811615533 A CN 201811615533A CN 109815028 A CN109815028 A CN 109815028A
Authority
CN
China
Prior art keywords
data
data source
message queue
module
synchronization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811615533.5A
Other languages
English (en)
Other versions
CN109815028B (zh
Inventor
朱超
安瑞恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanhai Information Technology Shanghai Co Ltd
Original Assignee
Beijing Mobai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mobai Technology Co Ltd filed Critical Beijing Mobai Technology Co Ltd
Priority to CN201811615533.5A priority Critical patent/CN109815028B/zh
Publication of CN109815028A publication Critical patent/CN109815028A/zh
Application granted granted Critical
Publication of CN109815028B publication Critical patent/CN109815028B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供给了一种数据同步***、方法、装置和计算机存储介质。所述***包括数据监听模块、消息分发模块、数据同步模块、以及配置管理模块;数据监听模块,用于对数据源进行监听以获取数据源的数据变更记录;消息分发模块,用于创建与数据源对应的消息队列,将数据变更记录加入到消息队列中;配置管理模块,用于管理数据源的同步配置参数;数据同步模块,用于获取同步配置参数,按照同步配置参数创建消费协程;由消费协程监听消息队列,按照同步配置参数将数据变更记录更新到目标存储中。

Description

数据同步的***、方法、装置和计算机存储介质
技术领域
本发明涉及数据信息处理技术领域,更具体地,涉及数据同步***、数据同步方法、数据同步装置和计算机存储介质。
背景技术
当某些数据设备中存储的数据发生变化,其他数据设备中存储的此类数据需要做相应的改变,使得所有数据中存储的设备保持一致,这就是数据同步。在大数据时代,数据同步显得越来越重要。不管是数据的加工生产过程中,还是在数据的提取和传输过程中,都需要进行数据同步。
在现有技术中,数据同步采用的工具通常有datax、sqoop等。这些工具通过定时定量的方式将数据同步到指定的存储中,不能在数据源发生数据变更后立即进行同步,无法达到实时同步的效果。
发明内容
根据本发明的第一方面,提供一种数据同步***,包括数据监听模块、消息分发模块、数据同步模块、以及配置管理模块;
所述数据监听模块,用于对数据源进行监听,以获取所述数据源的数据变更记录;
所述消息分发模块,用于创建与所述数据源对应的消息队列,从所述数据监听模块获取所述数据源的数据变更记录并将所述数据源的数据变更记录加入到与所述数据源对应的消息队列中;
所述配置管理模块,用于管理所述数据源的同步配置参数,所述数据源的同步配置参数包括所述数据源的标识、目标存储的位置、以及与所述数据源对应的消息队列的标识;
所述数据同步模块,用于监听所述配置管理模块以获取所述数据源的同步配置参数,按照所述数据源的同步配置参数创建与所述消息队列对应的消费协程;以及,由所述消费协程监听对应的所述消息队列,以消费对应的所述消息队列中写入的数据变更记录,按照所述数据源的同步配置参数将所述消息队列中写入的数据变更记录更新到对应的目标存储中。
可选地或优选地,所述消息分发模块采用Kafka分布式发布订阅消息***。
可选地或优选地,所述配置管理模块采用Zookeeper分布式应用程序协调服务***。
可选地或优选地,所述数据源的同步配置参数还包括与所述数据源对应的消息队列的并发速度;所述数据同步模块,还用于按照所述并发速度确定需要创建的与所述消息队列对应的消费协程的数量。
可选地或优选地,所述数据监听模块,还用于将所述数据源的数据变更记录转化为预设的格式,所述预设的格式为所述消费协程可解析的格式。
可选地或优选地,所述数据同步模块,还用于将自身注册到所述配置管理模块中,由所述配置管理模块监听所述数据同步模块的工作状态。
可选地或优选地,所述消息队列为持久化的消息队列。
根据本发明的第二方面,提供一种数据同步方法,包括:
对数据源进行监听,以获取所述数据源的数据变更记录;
创建与所述数据源对应的消息队列,将所述数据源的数据变更记录加入到与所述数据源对应的消息队列中;
对所述数据源的同步配置参数进行监听,按照所述数据源的同步配置参数创建与所述消息队列对应的消费协程;其中,所述数据源的同步配置参数包括所述数据源的标识、目标存储的位置、以及与所述数据源对应的消息队列的标识;以及,
由所述消费协程监听对应的所述消息队列,以消费对应的所述消息队列中写入的数据变更记录,按照所述数据源的同步配置参数将所述消息队列中写入的数据变更记录更新到对应的目标存储中。
根据本发明的第三方面,提供一种计算机存储介质,存储有可执行计算机指令,所述可执行计算机指令被处理器执行时,实现如本发明第二方面提供的方法。
根据本发明的第四方面,提供一种数据同步装置,包括处理器和存储器;所述存储器存储有可执行计算机指令,所述可执行计算机指令被所述处理器执行时,实现如本发明第二方面提供的方法。
本发明实施例提供的数据同步方法、***、计算机存储介质和数据同步装置,采用消息队列订阅机制,将数据变更记录加入到消息队列中,通过消费协程对消息队列的消费将数据源的变更实时写入到目标存储中,实现了数据的实时同步更新。此外,本发明实施例提供的数据同步方法、***、计算机存储介质和数据同步装置,根据同步配置参数设置消费协程,并且消费协程按照同步配置参数进行数据更新,当同步配置参数被用户更新时,数据同步***可以及时增加、删除、或者修改消费协程,因此,本发明实施例的数据同步***还具有很好的灵活性和扩展性。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1示出了本发明实施例提供的数据同步***的硬件配置示意图;
图2示出了本发明实施例提供的数据同步***的示意图;
图3示出了本发明实施例提供的数据同步模块的示意图。
图4示出了本发明实施例提供的数据同步方法的流程图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人物已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<数据同步***>
如图1所示,本发明实施例的数据同步***可以由服务器400实现。
服务器400提供处理、数据库、通讯设施的业务点。服务器400可以是整体式服务器或是跨多计算机或计算机数据中心的分散式服务器。服务器400可以是各种类型的,例如但不限于,网络服务器,新闻服务器,邮件服务器,消息服务器,广告服务器,文件服务器,应用服务器,交互服务器,数据库服务器,或代理服务器。在一些实施例中,服务器400可以包括硬件,软件,或用于执行服务器400所支持或实现的合适功能的内嵌逻辑组件或两个或多个此类组件的组合。例如,服务器400可以是由多台服务器组成的服务器群组,可以包括上述类型的服务器中的一种或多种等等。
在一个例子中,服务器400可以如图1所示,包括处理器4010、存储器4020、接口装置4030、通信装置4040、显示装置4050、输入装置4060等。尽管服务器也可以包括扬声器、麦克风等等,但是,这些部件与本发明无关,故在此省略。
其中,处理器4010例如可以是中央处理器CPU、微处理器MCU等。存储器4020例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置4030例如包括USB接口、串行接口、红外接口等。通信装置4040例如能够进行有线或无线通信。显示装置4050例如是液晶显示屏、LED显示屏触摸显示屏等。输入装置4060例如可以包括触摸屏、键盘等。
尽管在图1中对服务器400示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,服务器400只涉及存储器4020和处理器4010。
在上述描述中,技术人员可以根据本公开所提供的方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
图1所示的数据同步***仅是解释性的,并且决不是为了要限制本公开、其应用或用途。
参见图2所示,说明本发明实施例提供的数据同步***。
数据同步***包括数据监听模块20、消息分发模块30、数据同步模块40、以及配置管理模块50。
数据监听模块20,用于对数据源10进行监听,以获取数据源10的数据变更记录。数据源10可以是一个或者多个。也就是说,本发明实施例的数据同步***可以同时对多个数据源10进行数据同步。
消息分发模块30,用于创建与数据源对应的消息队列,即,数据源和消息队列为一一对应的关系。消息分发模块30从数据监听模块20获取数据源的数据变更记录并将数据源的数据变更记录加入到与数据源对应的消息队列中。
配置管理模块50,用于管理数据源的同步配置参数,数据源的同步配置参数包括数据源的标识、目标存储60的位置、以及与数据源对应的消息队列的标识。
数据同步模块40,用于监听配置管理模块20以获取数据源的同步配置参数,按照数据源的同步配置参数创建与消息队列对应的消费协程;以及,由消费协程监听对应的消息队列,以消费对应的消息队列中写入的数据变更记录,按照数据源的同步配置参数将消息队列中写入的数据变更记录更新到对应的目标存储60中。协程是一种程序组件,为进程中的一个相对独立的、可调度的执行单元实体。协程一般较为轻量和灵活,可以在指定位置挂起和恢复执行。消费协程是一种充当消费者角色的协程,用于消费消息队列中的消息。图2中示出了3个目标存储60,在实际应用中,可以将多个数据源10的数据合并同步到一个目标存储中,也可以将一个数据源10的数据分别同步到多个目标存储中。
本发明实施例提供的数据同步***,采用消息队列订阅机制,将数据变更记录加入到消息队列中,通过消费协程对消息队列的消费将数据源的变更实时写入到目标存储中,实现了数据的实时同步更新。
本发明实施例提供的数据同步***,根据同步配置参数设置消费协程,并且消费协程按照同步配置参数进行数据更新,当同步配置参数被用户更新时,数据同步***可以及时增加、删除、或者修改消费协程,因此,本发明实施例的数据同步***还具有很好的灵活性和扩展性。
在一个具体的例子中,数据源的同步配置参数还可以包括消息队列的并发速度。在一个例子中,与同一个消息队列对应的多个消费协程可以以并发的形式从该消息队列中消费数据。通过设置消费协程的数量,能够控制消息队列中的消息被消费的速度,也就是控制消息队列的并发速度。数据同步模块,还用于按照并发速度确定需要创建的与消息队列对应的消费协程的数量,也就是说,消息队列的并发速度越高,消费这个消息队列的消费协程的数量越多。本发明实施例提供的数据同步***,可以很方便地通过扩展消费协程的数量来增加同步速度。
在一个具体的例子中,参见图3所示,数据同步模块40的主协程41监听配置管理模块50,当数据源的同步配置参数被更新时,主协程41能够及时获得更新后的同步配置参数,根据更新后的同步配置参数对消费协程进行增加、删除、或者修改。
在图3所示的例子中,第二个数据源对应的消息队列为消息队列2,第二个数据源的同步配置参数中限定了并发速度为1,主协程41创建1个消费协程(消费协程424)监听消息队列1。第一个数据源对应的消息队列为消息队列1,第一个数据源的同步配置参数中限定了并发速度为3,主协程41会创建3个消费协程(分别为消费协程421、422、423)同时监听消息队列1,消息队列订阅机制自身能够保证1条消息只能由1个消费者消费,也就是说,每一条数据变更记录只会被一个消费协程消费,而不会被重复处理。
在一个具体的例子中,数据监听模块20,还用于将数据源的数据变更记录转化为预设的格式,使得消息队列中的数据变更记录的格式是统一的,并且这种预设的格式应当是消费协程可解析的格式,以方便消费协程消费。例如,第一个数据源的格式为Binlog格式,第一数据源的变更记录也是Binlog格式;第二个数据源的格式为Oplog格式,第二数据源的变更记录也是Oplog格式;预设的格式为JSON格式,数据同步***会将第一个数据源的数据变更记录由Binlog格式转化为JSON格式,将第二个数据源的变更记录由Oplog转化为JSON格式,再将JSON格式的数据变更记录传递给消息队列。
在一个具体的例子中,数据同步模块40,还用于将自身注册到配置管理模块50中,由配置管理模块50监听数据同步模块40的工作状态,使得用户可以及时观察到消费协程的消费进度。
在一个具体的例子中,消息分发模块30创建的消息队列为持久化的消息队列,使得数据变更记录不会轻易丢失。当消费协程需要暂停、暂停后启动、或者倒退回到某一个时间点进行重新消费时,都可以从消息队列中读取到所需的数据变更记录。
在一个具体的例子中,消息分发模块30创建的消息队列采用先进先出机制,使得消费协程可以按照顺序消费消息队列中的数据变更记录。
在一个具体的例子中,消息分发模块30采用Kafka分布式发布订阅消息***。Kafka分布式发布订阅消息***,是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java语言编写。Kafka是一种高吞吐量的分布式发布订阅消息***,它可以处理消费者规模的网站中的所有动作流数据。通过采用Kafka作为消息分发模块30,能够使本实施例中的数据同步***具有较高的吞吐量,并且容易实现持久化的消息队列。此外,基于Kafka消息分发模块自身的机制,能够保证1条消息只能由1个消费者消费,也就是说,每一条数据变更记录只会被一个消费协程消费,而不会被重复处理,从而保证了数据同步的准确高效。
在一个具体的例子中,配置管理模块50采用Zookeeper分布式应用程序协调服务***。Zookeeper分布式应用程序协调服务***是Google的一个开源的实现,为分布式应用提供一致***,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。Zookeeper分布式应用程序协调服务***具有通知机制。通过采用Zookeeper作为配置管理模块,使得配置管理模块50的性能高效并且可靠。此外,基于Zookeeper配置管理模块自身具有的通知机制,能够实现用户实时修改同步任务的效果。
在一个具体的例子中,数据同步模块40可以采用守护进程实现。守护进程是一种运行在后台的一种特殊的进程,能够独立于控制终端并且周期性的执行某种任务或等待处理某些发生的事件。
下面以消息分发模块30采用Kafka分布式发布订阅消息***,配置管理模块50采用Zookeeper分布式应用程序协调服务***,数据同步模块40采用守护进程为例,说明本发明实施例提供的数据同步***:
数据同步***包括数据监听模块、Kafka消息分发模块、数据同步模块、以及Zookeeper配置管理模块。
数据监听模块对数据源进行监听,以获取数据源的数据变更记录。数据源的变更记录例如包括以下内容:数据源的标识,数据源所属数据库的标识,本次变更的时间戳,本次变更涉及的字段,变更前后的内容等。
Kafka消息分发模块,用于创建与数据源对应的Kafka消息队列,即,数据源和消息队列为一一对应的关系。Kafka消息分发模块从数据监听模块获取数据源的数据变更记录,将数据源的数据变更记录加入到与数据源对应的Kafka消息队列中。
Zookeeper配置管理模块,用于统一管理各个数据源的同步配置参数。数据源的同步配置参数包括数据源的标识、目标存储的位置、以及与数据源对应的Kafka消息队列的标识。数据源的同步配置参数例如还可以包括:需要同步更新的字段,与该数据源对应的Kafka消息队列的并发速度等。
一方面,用户通过Zookeeper配置管理模块统一管理各个数据源的同步配置参数。基于Zookeeper配置管理模块自身具有的通知机制,当用户通过Zookeeper配置管理模块修改同步配置参数时,会及时被数据同步模块的主协程获知,主协程根据同步配置参数及时调整消费进程,从而实现了用户实时修改同步任务的效果。
另一方面,数据同步模块将自身注册到Zookeeper配置管理模块中,由Zookeeper配置管理模块监听数据同步模块的工作状态。当消费协程异常关闭时,能够被Zookeeper配置管理模块及时捕捉到,使得用户可以及时观察到同步任务的状态。
具体地:
数据同步模块的主协程按照数据源的同步配置参数创建与Kafka消息队列对应的消费协程。由消费协程监听对应的Kafka消息队列,以消费对应的Kafka消息队列中写入的数据变更记录,按照数据源的同步配置参数将Kafka消息队列中写入的数据变更记录更新到对应的目标存储中。
数据同步模块的主协程监听Zookeeper配置管理模块,当数据源的同步配置参数被更新时,主协程能够及时获得更新后的同步配置参数,根据更新后的同步配置参数对消费协程进行增加、删除、或者修改。
基于Kafka消息分发模块自身的机制,能够保证1条消息只能由1个消费者消费,也就是说,每一条数据变更记录只会被一个消费协程消费,而不会被重复处理。
Kafka消息队列为持久化的消息队列,使得数据变更记录不会轻易丢失。当消费协程需要暂停、暂停后启动、或者倒退回到某一个时间点进行重新消费时,都可以从Kafka消息队列中读取到所需的数据变更记录。并且,Kafka消息队列遵循先进先出机制,保证消费过程的有序性。
对于Kafka消息分发模块来说,数据监听模块为其内容生产者,数据同步模块的消费协程为其内容消费者。Kafka消息分发模块自身具有解耦特性,可以将内容生产者和内容消费者解耦,屏蔽内容生产者和内容消费者之间的感知,当数据监听模块和数据同步模块中的任何一个模块出现问题时,都不会影响另一个模块的正常工作。
本发明实施例提供的数据同步***,采用Kafka消息订阅分发机制,将数据变更记录加入到Kafka消息队列中,通过消费协程对Kafka消息队列的消费将数据源的变更实时写入到目标存储中,实现了数据的实时同步更新。
<数据同步方法>
如图4所示,本发明实施例还提供了一种数据同步方法,包括以下步骤:
步骤S110、对数据源进行监听,以获取数据源的数据变更记录。
步骤S120、创建与数据源对应的消息队列,将数据源的数据变更记录加入到与数据源对应的消息队列中。
步骤S130、对数据源的同步配置参数进行监听,按照数据源的同步配置参数创建与消息队列对应的消费协程;其中,数据源的同步配置参数包括数据源的标识、目标存储的位置、以及与数据源对应的消息队列的标识。
步骤S140、由消费协程监听对应的消息队列,以消费对应的消息队列中写入的数据变更记录,按照数据源的同步配置参数将消息队列中写入的数据变更记录更新到对应的目标存储中。
本发明实施例提供的数据同步方法,采用消息队列订阅机制,将数据变更记录加入到消息队列中,通过消费协程对消息队列的消费将数据源的变更实时写入到目标存储中,实现了数据的实时同步更新。
在一个具体的例子中,数据源的同步配置参数还包括与数据源对应的消息队列的并发速度。按照数据源的同步配置参数创建与消息队列对应的消费协程,还包括按照并发速度确定与消息队列对应的消费协程的数量。
在一个具体的例子中,对数据源进行监听,以获取数据源的数据变更记录,还包括将数据源的数据变更记录转化为预设的格式,预设的格式为消费协程可解析的格式。
在一个例子中,采用Kafka分布式发布订阅消息***实现消息分发模块。
在一个例子中,采用Zookeeper分布式应用程序协调服务实现配置管理模块。
在一个例子中,数据源的同步配置参数还包括与数据源对应的消息队列的并发速度;数据同步模块,还用于按照并发速度确定需要创建的与消息队列对应的消费协程的数量。
在一个例子中,数据同步模块,还用于将自身注册到配置管理模块中,由配置管理模块监听数据同步模块的工作状态。
在一个具体的例子中,消息队列为持久化的消息队列。
在一个具体的例子中,消息队列采用先进先出机制。
本实施例提供的数据同步方法与前述实施例提供的数据同步***是对应的,前述数据同步***的实施例可用于解释本实施例中的数据同步方法,本实施例中不再赘述。
同样地,本发明实施例提供的数据同步方法,采用消息队列订阅机制,将数据变更记录加入到消息队列中,通过消费协程对消息队列的消费将数据源的变更实时写入到目标存储中,实现了数据的实时同步更新。此外,本发明实施例提供的数据同步方法,根据同步配置参数设置消费协程,并且消费协程按照同步配置参数进行数据更新,当同步配置参数被用户更新时,可以及时增加、删除、或者修改消费协程,因此,本发明实施例的数据同步方法还具有很好的灵活性和扩展性。
<数据同步装置>
本发明实施例还提供了一种数据同步装置,包括处理器和存储器;所述存储器存储有可执行计算机指令,所述可执行计算机指令被所述处理器执行时,能够实现前述数据同步方法实施例提供的数据同步方法。
具体的,前述数据同步方法的实施例可用于解释本实施例的数据同步装置,本数据同步装置的实施例中不再赘述。
<计算机存储介质>
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有可执行计算机指令,所述可执行计算机指令被处理器执行时,能够实现前述数据同步方法实施例提供的数据同步方法。
具体的,前述数据同步方法的实施例可用于解释本实施例的计算机存储介质,本计算机存储介质的实施例中不再赘述。
本发明可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人物来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人物来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人物能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。

Claims (10)

1.一种数据同步***,其特征在于,所述***包括数据监听模块、消息分发模块、数据同步模块、以及配置管理模块;
所述数据监听模块,用于对数据源进行监听,以获取所述数据源的数据变更记录;
所述消息分发模块,用于创建与所述数据源对应的消息队列,从所述数据监听模块获取所述数据源的数据变更记录并将所述数据源的数据变更记录加入到与所述数据源对应的消息队列中;
所述配置管理模块,用于管理所述数据源的同步配置参数,所述数据源的同步配置参数包括所述数据源的标识、目标存储的位置、以及与所述数据源对应的消息队列的标识;
所述数据同步模块,用于监听所述配置管理模块以获取所述数据源的同步配置参数,按照所述数据源的同步配置参数创建与所述消息队列对应的消费协程;以及,由所述消费协程监听对应的所述消息队列,以消费对应的所述消息队列中写入的数据变更记录,按照所述数据源的同步配置参数将所述消息队列中写入的数据变更记录更新到对应的目标存储中。
2.根据权利要求1所述的***,其中,所述消息分发模块采用Kafka分布式发布订阅消息***。
3.根据权利要求1所述的***,其中,所述配置管理模块采用Zookeeper分布式应用程序协调服务***。
4.根据权利要求1所述的***,其中,所述数据源的同步配置参数还包括与所述数据源对应的消息队列的并发速度;所述数据同步模块,还用于按照所述并发速度确定需要创建的与所述消息队列对应的消费协程的数量。
5.根据权利要求1所述的***,其中,所述数据监听模块,还用于将所述数据源的数据变更记录转化为预设的格式,所述预设的格式为所述消费协程可解析的格式。
6.根据权利要求1所述的***,其中,所述数据同步模块,还用于将自身注册到所述配置管理模块中,由所述配置管理模块监听所述数据同步模块的工作状态。
7.根据权利要求1所述的***,其中,所述消息队列为持久化的消息队列。
8.一种数据同步方法,包括:
对数据源进行监听,以获取所述数据源的数据变更记录;
创建与所述数据源对应的消息队列,将所述数据源的数据变更记录加入到与所述数据源对应的消息队列中;
对所述数据源的同步配置参数进行监听,按照所述数据源的同步配置参数创建与所述消息队列对应的消费协程;其中,所述数据源的同步配置参数包括所述数据源的标识、目标存储的位置、以及与所述数据源对应的消息队列的标识;以及,
由所述消费协程监听对应的所述消息队列,以消费对应的所述消息队列中写入的数据变更记录,按照所述数据源的同步配置参数将所述消息队列中写入的数据变更记录更新到对应的目标存储中。
9.一种计算机存储介质,存储有可执行计算机指令,所述可执行计算机指令被处理器执行时,实现权利要求8所述的方法。
10.一种数据同步装置,包括处理器和存储器;所述存储器存储有可执行计算机指令,所述可执行计算机指令被所述处理器执行时,实现权利要求8所述的方法。
CN201811615533.5A 2018-12-27 2018-12-27 数据同步的***、方法、装置和计算机存储介质 Active CN109815028B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811615533.5A CN109815028B (zh) 2018-12-27 2018-12-27 数据同步的***、方法、装置和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811615533.5A CN109815028B (zh) 2018-12-27 2018-12-27 数据同步的***、方法、装置和计算机存储介质

Publications (2)

Publication Number Publication Date
CN109815028A true CN109815028A (zh) 2019-05-28
CN109815028B CN109815028B (zh) 2022-02-08

Family

ID=66602587

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811615533.5A Active CN109815028B (zh) 2018-12-27 2018-12-27 数据同步的***、方法、装置和计算机存储介质

Country Status (1)

Country Link
CN (1) CN109815028B (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427426A (zh) * 2019-08-02 2019-11-08 中国工商银行股份有限公司 一种数据同步处理方法及装置
CN110489249A (zh) * 2019-08-23 2019-11-22 行吟信息科技(上海)有限公司 一种消息的处理方法及***
CN110727736A (zh) * 2019-10-24 2020-01-24 中国建设银行股份有限公司 一种数据同步方法、装置、电子设备和存储介质
CN110990476A (zh) * 2019-12-17 2020-04-10 腾讯科技(深圳)有限公司 数据导入方法、装置、服务器及存储介质
CN111031336A (zh) * 2019-12-10 2020-04-17 北京达佳互联信息技术有限公司 直播榜单数据更新方法、装置、电子设备和存储介质
CN111026774A (zh) * 2019-12-03 2020-04-17 深圳前海环融联易信息科技服务有限公司 数据顺序同步方法、装置、计算机设备及存储介质
CN111177173A (zh) * 2020-01-02 2020-05-19 普元信息技术股份有限公司 大数据环境下实现数据同步优化处理的***及其方法
CN111193656A (zh) * 2019-12-03 2020-05-22 中国建设银行股份有限公司 一种消息推送方法和装置
CN111339186A (zh) * 2020-02-19 2020-06-26 平安科技(深圳)有限公司 工作流引擎数据同步方法、装置、介质及电子设备
CN111367692A (zh) * 2020-03-09 2020-07-03 政采云有限公司 一种搜索引擎数据处理方法、装置、电子设备及介质
CN111506337A (zh) * 2020-04-15 2020-08-07 中国银行股份有限公司 一种应用软件更新方法及装置
CN111552575A (zh) * 2019-12-31 2020-08-18 远景智能国际私人投资有限公司 基于消息队列的消息消费方法、装置及设备
CN111767343A (zh) * 2020-06-23 2020-10-13 中国工商银行股份有限公司 基于消息队列的测试数据同步方法和装置、设备以及介质
CN111813868A (zh) * 2020-08-13 2020-10-23 中国工商银行股份有限公司 数据同步方法及装置
CN112000350A (zh) * 2020-07-29 2020-11-27 新华三大数据技术有限公司 一种动态规则更新方法、装置及存储介质
CN112069265A (zh) * 2020-09-11 2020-12-11 中国工商银行股份有限公司 配置数据的同步方法、业务数据***、计算机***和介质
CN112380229A (zh) * 2020-11-16 2021-02-19 中消云(北京)物联网科技研究院有限公司 业务数据同步方法及装置、非易失性存储介质、处理器
CN113032491A (zh) * 2021-04-07 2021-06-25 工银科技有限公司 实现静态数据同步的方法、装置、电子设备及介质
CN113377863A (zh) * 2020-03-10 2021-09-10 阿里巴巴集团控股有限公司 数据同步方法、装置、电子设备及计算机可读存储介质
WO2021174537A1 (zh) * 2020-03-06 2021-09-10 深圳市欢太科技有限公司 数据传输方法及装置
CN113448725A (zh) * 2021-05-27 2021-09-28 深圳震有科技股份有限公司 一种数据推送的方法、装置、终端及存储介质
CN113656221A (zh) * 2021-08-18 2021-11-16 中国邮政储蓄银行股份有限公司 数据的处理方法、装置、计算机可读存储介质及处理器
CN113742617A (zh) * 2020-08-28 2021-12-03 北京沃东天骏信息技术有限公司 一种缓存更新的方法和装置
US11200255B2 (en) 2019-08-22 2021-12-14 Adp, Llc Robust data synchronization solution between databases
CN113805910A (zh) * 2020-11-26 2021-12-17 北京沃东天骏信息技术有限公司 一种应用中的数据共享的方法及***
CN115080366A (zh) * 2022-08-22 2022-09-20 深圳依时货拉拉科技有限公司 告警方法、装置、计算机设备和存储介质
CN115237630A (zh) * 2022-07-25 2022-10-25 小米汽车科技有限公司 数据处理方法、装置、车辆、存储介质及芯片
CN116821245A (zh) * 2023-07-05 2023-09-29 贝壳找房(北京)科技有限公司 分布式场景下数据聚合同步方法及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100688A1 (en) * 2008-10-16 2010-04-22 Microsoft Corporation Low-level conditional synchronization support
US20160197849A1 (en) * 2015-01-07 2016-07-07 Mckesson Corporation Method and Apparatus for Implementing a Messaging Interface
CN106390453A (zh) * 2016-08-31 2017-02-15 腾讯科技(深圳)有限公司 一种游戏***及游戏处理方法
CN106713487A (zh) * 2017-01-16 2017-05-24 腾讯科技(深圳)有限公司 数据的同步方法和装置
CN106815338A (zh) * 2016-12-25 2017-06-09 北京中海投资管理有限公司 一种大数据的实时存储、处理和查询***
CN107038162A (zh) * 2016-02-03 2017-08-11 滴滴(中国)科技有限公司 基于数据库日志的实时数据查询方法和***
CN107395729A (zh) * 2017-07-27 2017-11-24 深圳乐信软件技术有限公司 一种消息队列的消费***、方法及装置
CN107729366A (zh) * 2017-09-08 2018-02-23 广东省建设信息中心 一种普适多源异构大规模数据同步***
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN108156181A (zh) * 2018-02-01 2018-06-12 杭州安恒信息技术股份有限公司 一种基于协程异步io的漏洞探测方法及其漏洞扫描***
CN108173917A (zh) * 2017-12-22 2018-06-15 杭州顺网珑腾信息技术有限公司 一种分布式无上限的网络聊天室消息转发***
CN108769172A (zh) * 2018-05-21 2018-11-06 杭州有赞科技有限公司 一种数据同步方法及***
CN108763387A (zh) * 2018-05-20 2018-11-06 湖北九州云仓科技发展有限公司 异构平台的大数据融合方法、电子设备、存储介质及***

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100100688A1 (en) * 2008-10-16 2010-04-22 Microsoft Corporation Low-level conditional synchronization support
US20160197849A1 (en) * 2015-01-07 2016-07-07 Mckesson Corporation Method and Apparatus for Implementing a Messaging Interface
CN107038162A (zh) * 2016-02-03 2017-08-11 滴滴(中国)科技有限公司 基于数据库日志的实时数据查询方法和***
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN106390453A (zh) * 2016-08-31 2017-02-15 腾讯科技(深圳)有限公司 一种游戏***及游戏处理方法
CN106815338A (zh) * 2016-12-25 2017-06-09 北京中海投资管理有限公司 一种大数据的实时存储、处理和查询***
CN106713487A (zh) * 2017-01-16 2017-05-24 腾讯科技(深圳)有限公司 数据的同步方法和装置
CN107395729A (zh) * 2017-07-27 2017-11-24 深圳乐信软件技术有限公司 一种消息队列的消费***、方法及装置
CN107729366A (zh) * 2017-09-08 2018-02-23 广东省建设信息中心 一种普适多源异构大规模数据同步***
CN108173917A (zh) * 2017-12-22 2018-06-15 杭州顺网珑腾信息技术有限公司 一种分布式无上限的网络聊天室消息转发***
CN108156181A (zh) * 2018-02-01 2018-06-12 杭州安恒信息技术股份有限公司 一种基于协程异步io的漏洞探测方法及其漏洞扫描***
CN108763387A (zh) * 2018-05-20 2018-11-06 湖北九州云仓科技发展有限公司 异构平台的大数据融合方法、电子设备、存储介质及***
CN108769172A (zh) * 2018-05-21 2018-11-06 杭州有赞科技有限公司 一种数据同步方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李若鹏: "基于大数据的网络异常行为检测平台的设计与实现", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110427426A (zh) * 2019-08-02 2019-11-08 中国工商银行股份有限公司 一种数据同步处理方法及装置
US11200255B2 (en) 2019-08-22 2021-12-14 Adp, Llc Robust data synchronization solution between databases
CN110489249A (zh) * 2019-08-23 2019-11-22 行吟信息科技(上海)有限公司 一种消息的处理方法及***
CN110489249B (zh) * 2019-08-23 2022-03-22 行吟信息科技(上海)有限公司 一种消息的处理方法及***
CN110727736A (zh) * 2019-10-24 2020-01-24 中国建设银行股份有限公司 一种数据同步方法、装置、电子设备和存储介质
CN111026774A (zh) * 2019-12-03 2020-04-17 深圳前海环融联易信息科技服务有限公司 数据顺序同步方法、装置、计算机设备及存储介质
CN111193656A (zh) * 2019-12-03 2020-05-22 中国建设银行股份有限公司 一种消息推送方法和装置
CN111031336A (zh) * 2019-12-10 2020-04-17 北京达佳互联信息技术有限公司 直播榜单数据更新方法、装置、电子设备和存储介质
CN110990476A (zh) * 2019-12-17 2020-04-10 腾讯科技(深圳)有限公司 数据导入方法、装置、服务器及存储介质
CN110990476B (zh) * 2019-12-17 2023-04-07 腾讯科技(深圳)有限公司 数据导入方法、装置、服务器及存储介质
CN111552575B (zh) * 2019-12-31 2023-09-12 远景智能国际私人投资有限公司 基于消息队列的消息消费方法、装置及设备
CN111552575A (zh) * 2019-12-31 2020-08-18 远景智能国际私人投资有限公司 基于消息队列的消息消费方法、装置及设备
CN111177173A (zh) * 2020-01-02 2020-05-19 普元信息技术股份有限公司 大数据环境下实现数据同步优化处理的***及其方法
CN111339186B (zh) * 2020-02-19 2022-09-30 平安科技(深圳)有限公司 工作流引擎数据同步方法、装置、介质及电子设备
CN111339186A (zh) * 2020-02-19 2020-06-26 平安科技(深圳)有限公司 工作流引擎数据同步方法、装置、介质及电子设备
WO2021174537A1 (zh) * 2020-03-06 2021-09-10 深圳市欢太科技有限公司 数据传输方法及装置
CN111367692B (zh) * 2020-03-09 2023-08-22 政采云有限公司 一种搜索引擎数据处理方法、装置、电子设备及介质
CN111367692A (zh) * 2020-03-09 2020-07-03 政采云有限公司 一种搜索引擎数据处理方法、装置、电子设备及介质
CN113377863A (zh) * 2020-03-10 2021-09-10 阿里巴巴集团控股有限公司 数据同步方法、装置、电子设备及计算机可读存储介质
CN113377863B (zh) * 2020-03-10 2022-04-29 阿里巴巴集团控股有限公司 数据同步方法、装置、电子设备及计算机可读存储介质
CN111506337A (zh) * 2020-04-15 2020-08-07 中国银行股份有限公司 一种应用软件更新方法及装置
CN111767343A (zh) * 2020-06-23 2020-10-13 中国工商银行股份有限公司 基于消息队列的测试数据同步方法和装置、设备以及介质
CN112000350A (zh) * 2020-07-29 2020-11-27 新华三大数据技术有限公司 一种动态规则更新方法、装置及存储介质
CN111813868B (zh) * 2020-08-13 2023-11-10 中国工商银行股份有限公司 数据同步方法及装置
CN111813868A (zh) * 2020-08-13 2020-10-23 中国工商银行股份有限公司 数据同步方法及装置
CN113742617A (zh) * 2020-08-28 2021-12-03 北京沃东天骏信息技术有限公司 一种缓存更新的方法和装置
CN112069265B (zh) * 2020-09-11 2024-01-30 中国工商银行股份有限公司 配置数据的同步方法、业务数据***、计算机***和介质
CN112069265A (zh) * 2020-09-11 2020-12-11 中国工商银行股份有限公司 配置数据的同步方法、业务数据***、计算机***和介质
CN112380229A (zh) * 2020-11-16 2021-02-19 中消云(北京)物联网科技研究院有限公司 业务数据同步方法及装置、非易失性存储介质、处理器
CN113805910A (zh) * 2020-11-26 2021-12-17 北京沃东天骏信息技术有限公司 一种应用中的数据共享的方法及***
CN113805910B (zh) * 2020-11-26 2024-05-17 北京沃东天骏信息技术有限公司 一种应用中的数据共享的方法及***
CN113032491B (zh) * 2021-04-07 2023-01-06 工银科技有限公司 实现静态数据同步的方法、装置、电子设备及介质
CN113032491A (zh) * 2021-04-07 2021-06-25 工银科技有限公司 实现静态数据同步的方法、装置、电子设备及介质
CN113448725A (zh) * 2021-05-27 2021-09-28 深圳震有科技股份有限公司 一种数据推送的方法、装置、终端及存储介质
CN113656221A (zh) * 2021-08-18 2021-11-16 中国邮政储蓄银行股份有限公司 数据的处理方法、装置、计算机可读存储介质及处理器
CN113656221B (zh) * 2021-08-18 2024-06-07 中国邮政储蓄银行股份有限公司 数据的处理方法、装置、计算机可读存储介质及处理器
CN115237630A (zh) * 2022-07-25 2022-10-25 小米汽车科技有限公司 数据处理方法、装置、车辆、存储介质及芯片
CN115237630B (zh) * 2022-07-25 2023-11-21 小米汽车科技有限公司 数据处理方法、装置、车辆、存储介质及芯片
CN115080366A (zh) * 2022-08-22 2022-09-20 深圳依时货拉拉科技有限公司 告警方法、装置、计算机设备和存储介质
CN116821245A (zh) * 2023-07-05 2023-09-29 贝壳找房(北京)科技有限公司 分布式场景下数据聚合同步方法及存储介质

Also Published As

Publication number Publication date
CN109815028B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN109815028A (zh) 数据同步的***、方法、装置和计算机存储介质
CN107850882B (zh) 自动化和控制分布式数据管理***
CN105653425B (zh) 基于复杂事件处理引擎的监控***
CN109214704A (zh) 一种分布式智能化运维平台、方法、装置及可读存储介质
D'silva et al. Real-time processing of IoT events with historic data using Apache Kafka and Apache Spark with dashing framework
CN108733532B (zh) 大数据平台的健康度管控方法、装置、介质及电子设备
CN105205231A (zh) 一种基于dcom的配电网数字仿真***
CN110232054A (zh) 日志传输***及流式日志传输方法
WO2023246347A1 (zh) 数字孪生处理方法及数字孪生***
CN111327692A (zh) 模型训练方法、装置及集群***
CN109905286A (zh) 一种监控设备运行状态的方法和***
US10110679B2 (en) Timed functions for distributed decentralized real time systems
JP7114772B2 (ja) 証明書送信方法、証明書受信方法、クラウド及び端末機器
CN110673938A (zh) 任务处理方法、***、服务器及存储介质
Nguyen et al. A low-cost two-tier fog computing testbed for streaming IoT-based applications
CN105553732B (zh) 一种分布式网络模拟方法及***
CN108108986A (zh) 一种客户关系管理***的设计方法、装置及电子设备
Corradi et al. SIRDAM4. 0: A support infrastructure for reliable data acquisition and management in industry 4.0
CN109960212A (zh) 任务发送方法和装置
CN110188308A (zh) 客户端自动打点上报方法、存储介质、设备及***
CN110221910A (zh) 用于执行mpi作业的方法和装置
Dragoicea et al. Integrating HLA and service-oriented architecture in a simulation framework
CN106021270B (zh) 在数据仓库和大数据存储之间协同数据智能的方法和***
CN115774573B (zh) 应用集成方法、装置、电子设备和存储介质
Pham A big data analytics framework for iot applications in the cloud

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20201218

Address after: Room 168, building 6, 741 Hangzhou Road, Yangpu District, Shanghai 200090

Applicant after: HANHAI INFORMATION TECHNOLOGY SHANGHAI Co.,Ltd.

Address before: Room Bnan 1231, 2 bungalows, No. 5 Road, College, Haidian District, Beijing, 100191

Applicant before: BEIJING MOBIKE TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 200090 Room 102, block D2 (Building 8), No. 221, Huangxing Road, Yangpu District, Shanghai

Patentee after: HANHAI INFORMATION TECHNOLOGY SHANGHAI Co.,Ltd.

Address before: Room 168, building 6, 741 Hangzhou Road, Yangpu District, Shanghai 200090

Patentee before: HANHAI INFORMATION TECHNOLOGY SHANGHAI Co.,Ltd.