CN103810076A - 数据复制的监控方法及装置 - Google Patents

数据复制的监控方法及装置 Download PDF

Info

Publication number
CN103810076A
CN103810076A CN201210460617.2A CN201210460617A CN103810076A CN 103810076 A CN103810076 A CN 103810076A CN 201210460617 A CN201210460617 A CN 201210460617A CN 103810076 A CN103810076 A CN 103810076A
Authority
CN
China
Prior art keywords
data replica
replica server
database
server
replication status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210460617.2A
Other languages
English (en)
Other versions
CN103810076B (zh
Inventor
焦阳
王嘉欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing Electric Power Corp
Original Assignee
State Grid Corp of China SGCC
Beijing Electric Power Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing Electric Power Corp filed Critical State Grid Corp of China SGCC
Priority to CN201210460617.2A priority Critical patent/CN103810076B/zh
Publication of CN103810076A publication Critical patent/CN103810076A/zh
Application granted granted Critical
Publication of CN103810076B publication Critical patent/CN103810076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本发明提供了一种数据复制的监控方法及装置,其中,该方法包括:控制数据复制服务器对数据复制服务器上的数据库的复制状态进行检测;根据检测结果判断是否发送异常通知。本发明解决了相关技术中不能将监控到的数据库复制的状态上报的问题,从而提高了对数据库复制的监控的有效性,有助于提高运行工作的效率。

Description

数据复制的监控方法及装置
技术领域
本发明涉及通信领域,具体而言,涉及一种数据复制的监控方法及装置。
背景技术
随着公司数据级灾备***的建成,对数据复制的恢复点目标(Recover Point Ojbect,简称为RPO)和恢复时间目标(Recover Time Ojbect,简称为RTO)的要求越来越高,由于复制进程异常导致数据复制的RPO和RTO时间与目标不匹配。现有监控平台可以监控操作***、数据库、中间件的状态,但对于灾备***无法实现监控报警。在现有技术中,通过安全外壳协议(Secure Shell Protocol,简称为SSH)、简单网络管理协议(Simple Network ManagementProtocol,简称为SNMP)、代理技术来实现对操作***的监控,通过连接至数据库执行结构查询语言(Structured Query Language,简称为SQL)语句的方式实现对数据库的监控,但对于专用软件或新软件无法实现监控,数据库复制采用软件为新型软件。
目前,灾备***中采用的数据库复制的监控方案是通过软件自身命令与所提供的监控工具进行监控,但该监控方案均无法实现将异常状态短信通知到运行人员,运行人员需要时刻通过命令或监控工具来主动得到灾备***的运行状态。由于灾备***的跨地域特性使得有效监控数据库复制的状态成为运行工作的难点。
针对相关技术中上述至少之一的问题,目前尚未提出有效的解决方案。
发明内容
本发明提供了一种数据复制的监控方法及装置,以至少解决相关技术中不能将监控到的数据库复制的状态上报的问题。
根据本发明的一个方面,提供了一种数据复制的监控方法,其包括:控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测;根据检测结果判断是否发送异常通知。
优选地,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测包括:通过调用上述数据复制服务器上的操作***对应的命令对上述数据库的复制状态进行检测。
优选地,上述数据复制服务器上的操作***对应的命令包括:SHELL命令
优选地,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测包括:采用通过协议与上述数据复制服务器连接的控制模块来控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测。
优选地,上述控制模块通过JAVA程序来控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测。
优选地,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测之前,上述数据复制的监控方法还包括:根据多个数据复制服务器的配置信息与上述多个数据复制服务器建立连接,其中,上述配置信息包括:数据复制服务器的地址信息和安全信息。
优选地,与上述多个数据复制服务器建立连接包括:分别与每个数据复制服务器建立独立线程,其中,建立的线程为连接至每个数据复制服务器的长连接。
优选地,根据检测结果判断是否发送异常通知包括:上述检测结果为异常状态的情况下,判断出发送异常通知,并存储异常信息至数据库中,其中,上述异常通知为短信形式;或者上述检测结果为正常状态或人工停止状态的情况下,判断出不发送异常通知。
优选地,上述检测结果为异常状态的情况下,确定出发送异常通知之后,上述数据复制的监控方法还包括:接收到确认恢复消息后,发送恢复通知,并将恢复时间存储到上述数据库中。
根据本发明的另一方面,提供了一种数据复制的监控装置,其包括:控制模块,用于控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测;处理模块,用于根据检测结果判断是否发送异常通知。
在本发明中,通过控制数据复制服务器对该数据复制服务器上的数据库的复制状态进行检测,并根据检测结果判断是否发送异常通知,实现了可以将检测到的数据库的复制状态及时上报,例如,在数据库的复制出现异常时,可以实时地、自动地将异常通知上报给运行人员,避免了运行人员需要主动获取数据库的复制状的问题,从而提高了对数据库复制的监控的有效性,有助于提高运行工作的效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的数据复制的监控方法的流程图;
图2是根据本发明实施例的数据复制的监控装置的结构框图;
图3是根据本发明实施例的另一种数据复制的监控装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本实施例提供了一种数据复制的监控方法,如图1所示,该数据复制的监控方法包括步骤S102至步骤S104。
步骤S102:控制数据复制服务器对数据复制服务器上的数据库的复制状态进行检测。
步骤S104:根据检测结果判断是否发送异常通知。
通过上述步骤,通过控制数据复制服务器对该数据复制服务器上的数据库的复制状态进行检测,并根据检测结果判断是否发送异常通知,实现了可以将检测到的数据库的复制状态及时上报,例如,在数据库的复制出现异常时,可以实时地、自动地将异常通知上报给运行人员,避免了运行人员需要主动获取数据库的复制状的问题,从而提高了对数据库复制的监控的有效性,有助于提高运行工作的效率。
优选地,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测包括:通过调用上述数据复制服务器上的操作***对应的命令对上述数据库的复制状态进行检测。优选地,上述数据复制服务器上的操作***对应的命令可以包括:SHELL命令,例如,可以利用SHELL命令执行数据库复制状态健康检查接口命令,来检测数据库的复制状态,还可以在SHELL中对命令的执行结果进行过滤,即是否是出现了异常状态。
为了实现对上述数据复制服务器的控制,在本优选实施例中,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测包括:采用通过协议与上述数据复制服务器连接的控制模块来控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测。优选地,上述控制模块通过JAVA程序来控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测,例如,通过采用JAVA程序使用SSH协议连接上述数据复制服务器,以便控制该数据复制服务器执行SHELL命令。
为了实现与上述数据复制服务器建立连接,在本优选实施例中,控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测之前,上述数据复制的监控方法还包括:根据多个数据复制服务器的配置信息与上述多个数据复制服务器建立连接,其中,上述配置信息包括:数据复制服务器的地址信息和安全信息。例如,在第一次与上述数据复制服务器建立连接前,可以先对上述数据复制服务器的IP信息及密码信息进行配置,密码可以为密文存储,在保存配置信息后再与上述数据复制服务器建立连接。
优选地,与上述多个数据复制服务器建立连接可以包括:分别与每个数据复制服务器建立独立线程,其中,建立的线程为连接至每个数据复制服务器的长连接。即在运行过程中对于每个数据复制服务器采用独立线程操作,每个线程为连接至数据复制服务器的SSH长连接。但无打开终端,属于notty连接,在执行检查时建立会话。
为了实时地上报检测结果,在本优选实施例中,根据检测结果判断是否发送异常通知包括:上述检测结果为异常状态的情况下,判断出发送异常通知,并存储异常信息至数据库中,其中,上述异常通知为短信形式;或者上述检测结果为正常状态或人工停止状态的情况下,判断出不发送异常通知。即当数据库复制进程为人为停止或正常状态时,不发送异常通知给运行人员,在检测结果为异常状态的情况下,则发送异常通知给运行人员。
为了实现高效率的地行,在本优选实施例中,上述检测结果为异常状态的情况下,确定出发送异常通知之后,上述数据复制的监控方法还包括:接收到确认恢复消息后,发送恢复通知,并将恢复时间存储到上述数据库中。即当数据库的复制进程异常时,将异常信息保存至配置数据库,并短信通知运行人员,考虑复制进程会在30秒内自动重新启动,但启动后的状态仍然需要运行人员进行确认及调试,因此,在运行人员未确认前不发出恢复通知。在运行人员确认后,再发出恢复通知,***将检测恢复时间,并进行记录,以便有利于运行人员分析中断的时间。
在本优选实施例中,提供了一种数据复制的监控装置,如图2所示,该数据复制的监控装置包括:控制模块202,用于控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测;处理模块204,连接至控制模块202,用于根据检测结果判断是否发送异常通知。
在上述实施例中,通过控制数据复制服务器对该数据复制服务器上的数据库的复制状态进行检测,并根据检测结果判断是否发送异常通知,实现了可以将检测到的数据库的复制状态及时上报,例如,在数据库的复制出现异常时,可以实时地、自动地将异常通知上报给运行人员,避免了运行人员需要主动获取数据库的复制状的问题,从而提高了对数据库复制的监控的有效性,有助于提高运行工作的效率。
优选地,上述控制模块202控制上述数据复制服务器通过调用上述数据复制服务器上的操作***对应的命令对上述数据库的复制状态进行检测。
为了实现对上述数据复制服务器的控制,在本优选实施例中,上述控制模块202通过协议与上述数据复制服务器连接来控制数据复制服务器对上述数据复制服务器上的数据库的复制状态进行检测。
为了实现与上述数据复制服务器建立连接,在本优选实施例中,如图3所示,上述数据复制的监控装置还包括:连接模块206,用于根据多个数据复制服务器的配置信息与上述多个数据复制服务器建立连接,其中,上述配置信息包括:数据复制服务器的地址信息和安全信息。
优选地,上述连接模块206,用于分别与每个数据复制服务器建立独立线程,其中,建立的线程为连接至每个数据复制服务器的长连接。
为了实时地上报检测结果,在本优选实施例中,上述处理模块204,用于上述检测结果为异常状态的情况下,判断出发送异常通知,并存储异常信息至数据库中,其中,上述异常通知为短信形式;或者上述检测结果为正常状态或人工停止状态的情况下,判断出不发送异常通知。
为了实现高效率的地行,在本优选实施例中,上述处理模块204,还用于接收到确认恢复消息后,发送恢复通知,并将恢复时间存储到上述数据库中。
优选地,上述数据复制的监控装置的功能可以通过JAVA程序来实现。
从以上的描述中,可以看出,上述优选实施例实现了如下技术效果:通过控制数据复制服务器对该数据复制服务器上的数据库的复制状态进行检测,并根据检测结果判断是否发送异常通知,实现了可以将检测到的数据库的复制状态及时上报,例如,在数据库的复制出现异常时,可以实时地、自动地将异常通知上报给运行人员,避免了运行人员需要主动获取数据库的复制状的问题,从而提高了对数据库复制的监控的有效性,有助于提高运行工作的效率。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种数据复制的监控方法,其特征在于,包括: 
控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测; 
根据检测结果判断是否发送异常通知。 
2.根据权利要求1所述的方法,其特征在于,控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测包括: 
通过调用所述数据复制服务器上的操作***对应的命令对所述数据库的复制状态进行检测。 
3.根据权利要求2所述的方法,其特征在于,所述数据复制服务器上的操作***对应的命令包括: 
SHELL命令。
4.根据权利要求1所述的方法,其特征在于,控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测包括: 
采用通过协议与所述数据复制服务器连接的控制模块来控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测。 
5.根据权利要求4所述的方法,其特征在于,所述控制模块通过JAVA程序来控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测。 
6.根据权利要求1至5中任一项所述的方法,其特征在于,控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测之前,还包括: 
根据多个数据复制服务器的配置信息与所述多个数据复制服务器建立连接,其中,所述配置信息包括:数据复制服务器的地址信息和安全信息。 
7.根据权利要求6所述的方法,其特征在于,与所述多个数据复制服务器建立连接包括: 
分别与每个数据复制服务器建立独立线程,其中,建立的线程为连接至每个数据复制服务器的长连接。 
8.根据权利要求1至5中任一项所述的方法,其特征在于,根据检测结果判断是否发送异常通知包括: 
所述检测结果为异常状态的情况下,判断出发送异常通知,并存储异常信息至数据库中,其中,所述异常通知为短信形式;或者 
所述检测结果为正常状态或人工停止状态的情况下,判断出不发送异常通知。 
9.根据权利要求8所述的方法,其特征在于,所述检测结果为异常状态的情况下,确定出发送异常通知之后,还包括: 
接收到确认恢复消息后,发送恢复通知,并将恢复时间存储到所述数据库中。 
10.一种数据复制的监控装置,其特征在于,包括: 
控制模块,用于控制数据复制服务器对所述数据复制服务器上的数据库的复制状态进行检测; 
处理模块,用于根据检测结果判断是否发送异常通知。 
CN201210460617.2A 2012-11-15 2012-11-15 数据复制的监控方法及装置 Active CN103810076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210460617.2A CN103810076B (zh) 2012-11-15 2012-11-15 数据复制的监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210460617.2A CN103810076B (zh) 2012-11-15 2012-11-15 数据复制的监控方法及装置

Publications (2)

Publication Number Publication Date
CN103810076A true CN103810076A (zh) 2014-05-21
CN103810076B CN103810076B (zh) 2017-09-29

Family

ID=50706875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210460617.2A Active CN103810076B (zh) 2012-11-15 2012-11-15 数据复制的监控方法及装置

Country Status (1)

Country Link
CN (1) CN103810076B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055429A (zh) * 2016-05-24 2016-10-26 努比亚技术有限公司 一种信息处理方法及装置
CN106649577A (zh) * 2016-11-17 2017-05-10 杭州沃趣科技股份有限公司 一种检测Oracle数据库同步软件运行状态的方法
CN107168855A (zh) * 2017-03-24 2017-09-15 广东小天才科技有限公司 一种文件拷贝的监控方法及装置
CN107688522A (zh) * 2017-09-01 2018-02-13 郑州云海信息技术有限公司 一种存储***性能判定方法及***
CN107957933A (zh) * 2017-12-05 2018-04-24 泰康保险集团股份有限公司 数据复制的监控方法及装置
CN110019500A (zh) * 2017-08-21 2019-07-16 东软集团股份有限公司 一种复制组状态监控方法、装置、设备及存储介质
CN110795508A (zh) * 2019-11-04 2020-02-14 中国建设银行股份有限公司 数据的复制方法、装置、设备和存储介质
CN113010599A (zh) * 2019-12-19 2021-06-22 ***通信集团四川有限公司 Mysql数据库组复制状态监控方法、装置和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111655A1 (en) * 2002-12-06 2004-06-10 Mitsuhiro Watanabe Microcomputer and test method therefore
CN101452406A (zh) * 2008-12-23 2009-06-10 北京航空航天大学 一种对操作***透明的机群负载平衡方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111655A1 (en) * 2002-12-06 2004-06-10 Mitsuhiro Watanabe Microcomputer and test method therefore
CN101452406A (zh) * 2008-12-23 2009-06-10 北京航空航天大学 一种对操作***透明的机群负载平衡方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘信 等: "国家电网公司数据灾备中心数据复制方式研究", 《硅谷》 *
潘群华 等: "分布式数据库***中数据一致性维护方法", 《计算机工程》, vol. 28, no. 9, 30 September 2002 (2002-09-30), pages 255 - 257 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055429A (zh) * 2016-05-24 2016-10-26 努比亚技术有限公司 一种信息处理方法及装置
CN106055429B (zh) * 2016-05-24 2019-05-24 努比亚技术有限公司 一种信息处理方法及装置
CN106649577A (zh) * 2016-11-17 2017-05-10 杭州沃趣科技股份有限公司 一种检测Oracle数据库同步软件运行状态的方法
CN106649577B (zh) * 2016-11-17 2020-02-07 杭州沃趣科技股份有限公司 一种检测Oracle数据库同步软件运行状态的方法
CN107168855A (zh) * 2017-03-24 2017-09-15 广东小天才科技有限公司 一种文件拷贝的监控方法及装置
CN110019500A (zh) * 2017-08-21 2019-07-16 东软集团股份有限公司 一种复制组状态监控方法、装置、设备及存储介质
CN107688522A (zh) * 2017-09-01 2018-02-13 郑州云海信息技术有限公司 一种存储***性能判定方法及***
CN107957933A (zh) * 2017-12-05 2018-04-24 泰康保险集团股份有限公司 数据复制的监控方法及装置
CN107957933B (zh) * 2017-12-05 2021-11-16 泰康保险集团股份有限公司 数据复制的监控方法及装置
CN110795508A (zh) * 2019-11-04 2020-02-14 中国建设银行股份有限公司 数据的复制方法、装置、设备和存储介质
CN113010599A (zh) * 2019-12-19 2021-06-22 ***通信集团四川有限公司 Mysql数据库组复制状态监控方法、装置和***

Also Published As

Publication number Publication date
CN103810076B (zh) 2017-09-29

Similar Documents

Publication Publication Date Title
CN103810076A (zh) 数据复制的监控方法及装置
CN107995049B (zh) 电力安全区跨区同步故障监测方法、装置和***
US9684574B2 (en) Method and system for implementing remote disaster recovery switching of service delivery platform
US8526299B2 (en) Method and device for processing cell out-of-service failures
CN102932466B (zh) 基于内容分发网络的分布式源监控方法和***
CN105323113B (zh) 一种基于可视化技术的***故障应急处置方法
CN108429629A (zh) 设备故障恢复方法和装置
CN103019866A (zh) 基于消息队列的分布式方法和***
JP2004021549A (ja) ネットワーク監視システムおよびプログラム
CN107947998A (zh) 一种基于应用***的实时监测***
CN102333206A (zh) 一种监控存储***和一种提高监控存储可靠性的方法
CN101989933A (zh) 一种故障检测的方法和***
JP2013130901A (ja) 監視サーバおよびそれを用いたネットワーク機器復旧システム
US10721135B1 (en) Edge computing system for monitoring and maintaining data center operations
CN113794597A (zh) 告警信息处理方法、***、电子设备及存储介质
US20070157052A1 (en) Protection of devices in a redundant configuration
CN109286525B (zh) 一种基于mqtt通讯和主备之间心跳的双机备份方法
KR101433045B1 (ko) 사전 장애 탐지 시스템 및 방법
KR20090045534A (ko) 로그 필터링을 통한 장애 감지 장치 및 그 방법과 그장치를 이용한 장애 감지 시스템
CN106407081B (zh) 一种机箱管理***及服务器
CN104754562A (zh) 数据复制异常的修复方法及装置
CN113381884B (zh) 用于监控告警***的全链路监控方法及装置
CN106301826A (zh) 一种故障检测方法及装置
WO2014040470A1 (zh) 告警消息的处理方法及装置
KR101214651B1 (ko) Snmp trap을 이용한 usp의 장애발생을 sms를 이용하여 통지하는 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant