CN107395387A - 双机业务恢复的方法、装置和*** - Google Patents

双机业务恢复的方法、装置和*** Download PDF

Info

Publication number
CN107395387A
CN107395387A CN201610332931.0A CN201610332931A CN107395387A CN 107395387 A CN107395387 A CN 107395387A CN 201610332931 A CN201610332931 A CN 201610332931A CN 107395387 A CN107395387 A CN 107395387A
Authority
CN
China
Prior art keywords
connection status
monitoring
storage device
main frame
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610332931.0A
Other languages
English (en)
Inventor
史骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen ZTE Technical Service Co.,Ltd.
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610332931.0A priority Critical patent/CN107395387A/zh
Publication of CN107395387A publication Critical patent/CN107395387A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/22Arrangements for detecting or preventing errors in the information received using redundant apparatus to increase reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种双机业务恢复的方法、装置和***,包括:实时监听存储设备的连接状态;如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务,当存储设备的连接状态异常,在主备机业务停止后,能根据存储设备的连接恢复状态,根据监听结果自动启动主备机对应的集群服务,保证了业务的连续性。同时,在启动业务的过程中通过对主机的资源启动状态的监听验证了资源的有效性,保证了业务启动的正确性。

Description

双机业务恢复的方法、装置和***
技术领域
本发明涉及通信技术领域,特别是涉及一种双机业务恢复的方法、装置和***。
背景技术
在高可用双机领域中,服务资源的连续性以及数据的安全性是最为关注的功能点,且在通信行业中尤为重要。
但是目前高可用双机只存在简单的监控与管理,比如存储资源的管理上,只是针对存储的只读进行了判断,或者对存储的连接只做了超时的处理,并没有智能化,即当存储网络断开后,双机管理软件一般都会认为存储出现了问题,而导致双机业务全部瘫痪,即使网络恢复,双机管理软件也不会自动的将业务恢复,只会发出告警或者抛出异常等待人为去操作解决,业务的连续性能差。
发明内容
基于此,有必要针对上述技术问题,提供一种双机业务恢复的方法、装置和***,在存储网络发生异常并恢复后,能自动恢复集群服务,保证业务的连续性。
一种双机业务恢复的方法,所述方法包括:
实时监听存储设备的连接状态;
如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
一种双机业务恢复的装置,所述装置包括:
监听模块,用于实时监听存储设备的连接状态;
停止模块,用于如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
主机启动模块,用于如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
备机启动模块,用于监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
上述双机业务恢复的方法和装置,通过实时监听存储设备的连接状态,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态,如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务,监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务,当存储设备的连接状态异常,在主备机业务停止后,能根据存储设备的连接恢复状态,根据监听结果自动启动主备机对应的集群服务,保证了业务的连续性。同时,在启动业务的过程中通过对主机的资源启动状态的监听验证了资源的有效性,保证了业务启动的正确性。
一种双机业务恢复的***,所述***包括监听装置和存储设备;
所述监听装置用于实时监听所述存储设备的连接状态,如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
所述监听装置还用于如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
所述监听装置还用于监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
上述双机业务恢复的***,通过监听装置和存储设备的配合,监听装置实时监听存储设备的连接状态,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态,如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务,监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务,当存储设备的连接状态异常,在主备机业务停止后,能根据存储设备的连接恢复状态,根据监听结果自动启动主备机对应的集群服务,保证了业务的连续性。同时,在启动业务的过程中通过对主机的资源启动状态的监听验证了资源的有效性,保证了业务启动的正确性。
附图说明
图1为一个实施例中双机业务恢复的方法的应用环境图;
图2为一个实施例中双机业务恢复的方法的流程图;
图3为一个实施例中根据资源数据校验结果启动主机对应的集群服务的流程图;
图4为一个实施例中监控装置与第三方设备之间通用接口时序图;
图5为一个实施例中双机业务恢复的方法的时序图;
图6为一个实施例中双机业务恢复的装置的结构框图;
图7为另一个实施例中双机业务恢复的装置的结构框图;
图8为再一个实施例中双机业务恢复的装置的结构框图;
图9为又一个实施例中双机业务恢复的装置的结构框图;
图10为一个实施例中双机业务恢复的***的结构框图;
图11为再一个实施例中双机业务恢复的***的结构框图;
图12为又一个实施例中双机业务恢复的***的结构框图。
具体实施方式
图1为一个实施例中双机业务恢复的方法运行的应用环境图,如图1所示,该应用环境包括监听装置110、存储设备120、集群管理服务器130、集群主机140、集群备机150,监听装置110可以设置在任意一个服务器中,监听装置110可以直接进行配置启动,也可以通过通用接口接收传递的监听参数进行配置启动,可以独立的实现监听,也可以提供给第三方控制实现监听,实时监听存储设备的连接状态并根据监听结果向集群管理服务器130发送控制指令,控制指令用于控制主备机的服务状态。存储设备120可以是具备连接存储功能的设备,如具有存储功能的服务器、磁阵等。集群管理服务器130上运行集群软件,用于统一对集群主机和集群备机进行管理,如控制主备机的文件***、控制主备机停止业务或启动业务等。集群主机140和集群备机150用于联合提供高可用的双机业务。
在一个实施例中,如图所示,提供了一种双机业务恢复的方法,应用于上述应用环境中的监听装置,包括如下步骤:
步骤S210,实时监听存储设备的连接状态。
具体的,连接状态是指网络通信的联通,如果断线则为连接异常,如果联网则为连接正常。可以按照一定周期对存储设备进行监听,可通过配置参数自定义存储状态监听周期,便于方便的对监听进行控制。可通过去存储设备的***文件进行读写校验或发送测试数据包的方式对存储设备的连接状态进行监听。还可设置存储状态最大异常次数,如果监听结果的异常连接次数超过存储状态最大异常次数则判断为连接异常,如果没有超过存储状态最大异常次数,可判断为连接状态正常,通过设置存储状态最大异常次数可避免误判断,因为当存储设备的连接发生异常时,会尝试多次重试监听,如果重试成功则说明连接发生闪断,但是业务不会有影响。
在一个实施例中,步骤S210包括:对存储设备的文件***进行读写校验,根据读写校验的结果确定存储设备的连接状态,或通过发送网络测试数据包至存储设备,根据返回的响应数据包确定存储设备的连接状态。
具体的,通过***命令对存储设备的文件***进行存储介质读写速率的校验或创建临时文件的方式判断存储介质的读写状态,如存储设备为磁阵,则对服务器上存在的磁阵分配的卷,磁阵分配的卷转化成操作***的文件***,进行磁盘读写速率的校验,还可以在磁阵的卷上创建临时文件的方式判断磁盘读写状态,如果磁盘速度无法得到、磁盘无法读写文件则校验结果为连接状态异常,否则校验结果为连接状态正常。还可通过IP的PING向存储设备发送网络测试数据包,如果收到返回的响应数据包,则IP PING通,存储设备的连接状态正常。如果存在存储状态最大异常次数,则可根据校验结果的连续异常次数和PING命令的连续响应结果异常次数判断连接状态。
步骤S220,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态。
具体的,如果监听到连接状态为连接异常,则通知集群管理服务器停止业务,集群管理服务器控制主备机的业务停止,可上报告警信息提示存储设备连接发生异常。继续监听存储设备的连接状态,在主备机业务停止时对存储设备的连接状态的监听参数可与之前的监听参数不同,如具有不同的监听周期,如设置存储异常状态扫描周期与存储状态监听周期不同。
步骤S230,如果监听到连接状态为连接恢复,则启动主机对应的集群服务。
具体的,可设置恢复状态最小正常次数,只有监听到连接状态超过恢复状态最小正常次数才判断为连接恢复,可自定义恢复状态最小正常次数,如设置为2次,进一步保证连接恢复的可靠性。如果连接恢复,则通知集群管理服务器将主机对应的集群服务启动。
步骤S240,监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务。
具体的,可设置应用服务资源监听周期,监听主机的资源启动状态。通过进程查看命令,查看进程启动状态来监听主机的资源启动状态,当存在多个进程时,只要存在一个进程启动状态为异常,则资源启动状态为异常。进程的启动状态反映了主机集群对于业务服务的处理结果是正常还是异常,如果进程的启动状态异常,则说明资源存在问题,需要停止主机的服务,如果进程的启动状态正常,则说明资源完整可用,可启动备机对应的集群服务。在判断资源启动状态正常时,可设置应用服务资源监听最大错误次数,只有主机的资源启动状态连续异常次数超过应用服务资源监听最大错误次数才判断为资源启动状态异常,通过应用服务资源监听最大错误次数减少了误判概率。
本实施例中,通过实时监听存储设备的连接状态,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态,如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务,监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务,当存储设备的连接状态异常,在主备机业务停止后,能根据存储设备的连接恢复状态,根据监听结果自动启动主备机对应的集群服务,保证了业务的连续性。同时,在启动业务的过程中通过对主机的资源启动状态的监听验证了资源的有效性,保证了业务启动的正确性。
在一个实施例中,步骤S210之前,还包括:配置监听参数,监听参数包括:存储状态监听周期、存储状态最大异常次数、存储异常状态扫描周期、应用服务资源监听周期、应用服务资源监听最大错误次数中的至少一种。
具体的,监听参数自由配置可实现监听过程的可定制灵活管理,存储状态监听周期用于控制每次监听存储设备的时间周期,存储状态最大异常次数是指监听到存储设备的连接状态为异常时,最大可容忍异常次数,在存储状态最大异常次数范围内,可认为存储设备连接状态正常。存储异常状态扫描周期是指在主备机业务停止时对存储设备的连接状态的监听周期。应用服务资源监听周期是指主机恢复业务后对主机的资源启动状态监听周期。应用服务资源监听最大错误次数是指监听到主机的资源启动状态异常时,最大可容忍异常次数,在资源启动状态最大异常次数范围内,可认为主机的资源启动状态正常。可自由增加或减少监听参数的个数,根据需要调整监听参数。还可包括如磁盘状态扫描超时时间用于确定磁盘是否联通的命令执行后超时时间的正常范围,如果超时时间大于磁盘状态扫描超时时间则说明连接异常,磁盘状态扫描超时次数用于限定磁盘状态扫描超时次数的可接受范围,如果超过磁盘状态扫描超时次数,则认为磁盘状态异常。被监控的服务器名称用于当存储设备部署在服务器上时,确定被监控的服务器。被监控进程名称用于确定需要监控的进程。
在一个实施例中,如图3所示,步骤S230中启动主机对应的集群服务的步骤之前,还包括:
步骤S310,获取主机对应的资源数据,对资源数据进行完整性校验得到第一校验结果。
具体的,主机对应的资源数据可为主机上存储的文件等,完整性校验的算法可根据需要选择,如md5校验算法、crc循环冗余校验算法、奇偶校验法等,通过完整性校验算法对资源数据进行相应的运算得到第一校验结果,如对资源数据计算MD5值,得到第一校验结果。
步骤S320,获取上一次在存储设备正常连接状态时资源数据对应的标准完整性校验结果,将第一校验结果与标准完整性校验结果比较,如果相同,则进入启动主机对应的集群服务的步骤,否则,发出数据异常警告。
具体的,在监听存储设备的连接状态时,每到达一次监听周期就计算一次资源数据对应的完整性校验结果并保存为一个文件,并且周期性覆盖。从而可通过读取文件获取上一次在存储设备正常连接状态时资源数据对应的标准完整性校验结果。如果第一校验结果与标准完整性校验结果相同,则说明数据是完整无损的,可进行下面的步骤。如果不相同,则说明数据遭到了损坏,发出数据异常警告。
本实施例中,在启动主机对应的集群服务的步骤之前先对数据进行完整性校验,可提前判断数据是否完整无损,如果有损,可及时发出数据异常警告,提高响应速度和准确度。
在一个实施例中,方法还包括:通过通用接口接收第三方设备下发的监听参数和向第三方设备上报监控信息。
具体的,提供通用配置接口,可以全方位的定制各种业务监控场景,根据不同的监控需要由第三方设备下发对应的监听参数,同时得到监控信息后,如存储设备的连接状态信息、主机的资源启动状态信息等通过通用接口向第三方设备上报。如图4所示为监控装置与第三方设备之间通用接口时序图,包括以下步骤:
S1:第三方设备通过通用接口传入监听参数给监听装置;
S2:监听装置更新配置参数为新传入的参数;
S3:监听装置通过通用接口通知第三方设备配置完成;
S4:第三方设备通过通用接口传入启动命令给监听装置;
S5:监听装置根据启动命令启动对集群***的监控;
S6:集群***反馈相关监控信息给监听装置
S7:监听装置通过通用接口通知第三方设备启动完成,并产生建链关系;
S8:第三方设备发送心跳报文;
S9:第三方设备接收心跳报文;
S10:监听装置与第三方设备之间进行心跳处理;
S11:监听装置通过对磁阵的监听,接收到磁阵连接异常的通知并进行相应的处理;
S12:监听装置通过通用接口通知第三方设备磁阵连接异常;
S13-14:第三方设备通过通用接口接收到异常通知,并持续监听;
S15:监听装置监听到磁阵连接恢复,与集群***进行处理过程;
S16:监听装置通过通用接口向第三方设备通知磁阵恢复的结果。
下面结合附图对双机业务恢复的方法的实施做进一步的详细描述,如图5所示,包括以下步骤:
A:监听装置通过通用接口接收监听参数,存储状态监听周期30秒、存储状态最大异常次数4次、存储异常状态扫描周期60秒、应用服务资源监听周期40秒、应用服务资源监听最大错误次数5次,设置完成后启动监听装置。
B:监听装置持续监听存储设备的连接状态,每30秒检查一次。
C:当连续4次监听到的连接状态都是异常后,将集群管理服务器上的集群软件停止,同时通知集群管理服务器停止主备机的服务。
D:集群管理服务器控制主备机使其停止服务。
E:监听装置继续监听存储设备的连接状态,监听频率为60秒1次,判断连续2次连接状态恢复正常后,对主机对应的资源数据进行完整性校验,得到校验结果,如果校验结果为数据完整,则进入F:通知集群管理服务器启动主机对应的集群服务,否则进入G:发出数据异常警告。
H:监听装置监听主机的资源启动状态,如果资源启动状态正常,则进入I:通知集群管理服务器启动备机对应的集群服务,集群管理服务器通知监听装置集群已恢复。如果资源启动状态异常,则进入J:发出集群启动失败通知,通知集群管理服务器停止整个集群服务,发出数据损坏警告。
在一个实施例中,如图6所示,提供了一种双机业务恢复的装置,包括:
监听模块410,用于实时监听存储设备的连接状态。
停止模块420,用于如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态。
主机启动模块430,用于如果监听到连接状态为连接恢复,则启动主机对应的集群服务。
备机启动模块440,用于监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务。
在一个实施例中,如图7所示,装置还包括:
配置模块450,用于配置监听参数,监听参数包括:存储状态监听周期、存储状态最大异常次数、存储异常状态扫描周期、应用服务资源监听周期、应用服务资源监听最大错误次数中的至少一种。
在一个实施例中,如图8所示,装置还包括:
校验模块460,用于获取主机对应的资源数据,对资源数据进行完整性校验得到第一校验结果,获取上一次在存储设备正常连接状态时资源数据对应的标准完整性校验结果,将第一校验结果与标准完整性校验结果比较,如果相同,则进入主机启动模块430启动主机对应的集群服务,否则,发出数据异常警告。
在一个实施例中,如图9所示,装置还包括:
接口模块470,用于通过通用接口接收第三方设备下发的监听参数和向第三方设备上报监控信息。
在一个实施例中,如图10所示,提供了一种双机业务恢复的***,包括监听装置510和存储设备520,监听装置510用于实时监听存储设备520的连接状态,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态,监听装置510还用于如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务,监听装置510还用于监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务。
本实施例中,通过监听装置和存储设备的配合,监听装置实时监听存储设备的连接状态,如果监听到连接状态为连接异常,则停止主备机业务,并继续监听存储设备的连接状态,如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务,监听主机的资源启动状态,如果资源启动状态正常,则启动备机对应的集群服务,当存储设备的连接状态异常,在主备机业务停止后,能根据存储设备的连接恢复状态,根据监听结果自动启动主备机对应的集群服务,保证了业务的连续性。同时,在启动业务的过程中通过对主机的资源启动状态的监听验证了资源的有效性,保证了业务启动的正确性。
在一个实施例中,如图11所示,***还包括:
第三方设备530,用于通过通用接口向监听装置下发监听参数,第三方设备还用于接收监听装置上报的监控信息。
具体的,通过通用配置接口,根据不同的监控需要由第三方设备下发对应的监听参数,可以全方位的定制各种业务监控场景。监听装置得到监控信息后,如存储设备的连接状态信息、主机的资源启动状态信息等,第三方设备通过通用接口接收监听装置上报的监控信息。
在一个实施例中,如图12所示,***还包括:
集群管理服务器540,用于接收监听装置发送的控制指令,根据控制指令对主机和备机进行控制。
具体的,通过集群管理服务器接收监听装置发送的控制指令后统一对主机和备机进行控制管理,更方便有序。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述程序可存储于一计算机可读取存储介质中,如本发明实施例中,该程序可存储于计算机***的存储介质中,并被该计算机***中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种双机业务恢复的方法,所述方法包括:
实时监听存储设备的连接状态;
如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
2.根据权利要求1所述的方法,其特征在于,所述实时监听存储设备的连接状态的步骤包括:
对所述存储设备的文件***进行读写校验,根据读写校验的结果确定所述存储设备的连接状态;
或通过发送网络测试数据包至所述存储设备,根据返回的响应数据包确定所述存储设备的连接状态。
3.根据权利要求1所述的方法,其特征在于,在所述实时监听存储设备的连接状态的步骤之前,还包括:
配置监听参数,所述监听参数包括:存储状态监听周期、存储状态最大异常次数、存储异常状态扫描周期、应用服务资源监听周期、应用服务资源监听最大错误次数中的至少一种。
4.根据权利要求1所述的方法,其特征在于,所述启动主机对应的集群服务的步骤之前,还包括:
获取所述主机对应的资源数据;
对所述资源数据进行完整性校验得到第一校验结果;
获取上一次在存储设备正常连接状态时所述资源数据对应的标准完整性校验结果;
将所述第一校验结果与标准完整性校验结果比较,如果相同,则进入所述启动主机对应的集群服务的步骤,否则,发出数据异常警告。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
通过通用接口接收第三方设备下发的所述监听参数和向第三方设备上报监控信息。
6.一种双机业务恢复的装置,其特征在于,所述装置包括:
监听模块,用于实时监听存储设备的连接状态;
停止模块,用于如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
主机启动模块,用于如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
备机启动模块,用于监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
配置模块,用于配置监听参数,所述监听参数包括:存储状态监听周期、存储状态最大异常次数、存储异常状态扫描周期、应用服务资源监听周期、应用服务资源监听最大错误次数中的至少一种。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
校验模块,用于获取所述主机对应的资源数据,对所述资源数据进行完整性校验得到第一校验结果,获取上一次在存储设备正常连接状态时所述资源数据对应的标准完整性校验结果,将所述第一校验结果与标准完整性校验结果比较,如果相同,则进入主机启动模块启动主机对应的集群服务,否则,发出数据异常警告。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
接口模块,用于通过通用接口接收第三方设备下发的所述监听参数和向第三方设备上报监控信息。
10.一种双机业务恢复的***,其特征在于,所述***包括监听装置和存储设备;
所述监听装置用于实时监听所述存储设备的连接状态,如果监听到所述连接状态为连接异常,则停止主备机业务,并继续监听所述存储设备的连接状态;
所述监听装置还用于如果监听到所述连接状态为连接恢复,则启动主机对应的集群服务;
所述监听装置还用于监听主机的资源启动状态,如果所述资源启动状态正常,则启动备机对应的集群服务。
11.根据权利要求10所述的***,其特征在于,所述***还包括:
第三方设备,用于通过通用接口向监听装置下发监听参数;
所述第三方设备还用于接收监听装置上报的监控信息。
12.根据权利要求10所述的***,其特征在于,所述***还包括:
集群管理服务器,用于接收所述监听装置发送的控制指令,根据所述控制指令对主机和备机进行控制。
CN201610332931.0A 2016-05-17 2016-05-17 双机业务恢复的方法、装置和*** Pending CN107395387A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610332931.0A CN107395387A (zh) 2016-05-17 2016-05-17 双机业务恢复的方法、装置和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610332931.0A CN107395387A (zh) 2016-05-17 2016-05-17 双机业务恢复的方法、装置和***

Publications (1)

Publication Number Publication Date
CN107395387A true CN107395387A (zh) 2017-11-24

Family

ID=60338820

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610332931.0A Pending CN107395387A (zh) 2016-05-17 2016-05-17 双机业务恢复的方法、装置和***

Country Status (1)

Country Link
CN (1) CN107395387A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109981459A (zh) * 2019-02-28 2019-07-05 联想(北京)有限公司 一种信息发送方法、客户端和计算机可读存储介质
CN110221949A (zh) * 2019-06-17 2019-09-10 深圳前海微众银行股份有限公司 自动化运维管理方法、装置、设备及可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160794A (zh) * 2005-10-26 2008-04-09 华为技术有限公司 一种智能网业务控制设备容灾***和方法
JP2008287632A (ja) * 2007-05-21 2008-11-27 Panasonic Corp 制御装置復帰システム
CN101854253A (zh) * 2010-05-07 2010-10-06 无锡中星微电子有限公司 一种自动恢复监控和存储的方法及其监控***
CN103167517A (zh) * 2011-12-14 2013-06-19 中国电信股份有限公司 物联网中监测数据恢复方法、***
CN103500130A (zh) * 2013-09-11 2014-01-08 上海爱数软件有限公司 一种对双机热备数据进行实时备份的方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复***及虚拟机检测、恢复、启动方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101160794A (zh) * 2005-10-26 2008-04-09 华为技术有限公司 一种智能网业务控制设备容灾***和方法
JP2008287632A (ja) * 2007-05-21 2008-11-27 Panasonic Corp 制御装置復帰システム
CN101854253A (zh) * 2010-05-07 2010-10-06 无锡中星微电子有限公司 一种自动恢复监控和存储的方法及其监控***
CN103167517A (zh) * 2011-12-14 2013-06-19 中国电信股份有限公司 物联网中监测数据恢复方法、***
CN103500130A (zh) * 2013-09-11 2014-01-08 上海爱数软件有限公司 一种对双机热备数据进行实时备份的方法
CN105024879A (zh) * 2015-07-15 2015-11-04 中国船舶重工集团公司第七0九研究所 虚拟机故障检测、恢复***及虚拟机检测、恢复、启动方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109981459A (zh) * 2019-02-28 2019-07-05 联想(北京)有限公司 一种信息发送方法、客户端和计算机可读存储介质
CN110221949A (zh) * 2019-06-17 2019-09-10 深圳前海微众银行股份有限公司 自动化运维管理方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN110224858B (zh) 基于日志的告警方法及相关装置
CN110661659A (zh) 一种告警方法、装置、***及电子设备
CN104065526B (zh) 一种服务器故障报警的方法和装置
CN110554930B (zh) 一种数据存储方法及相关设备
CN103138988B (zh) 网络故障的定位处理方法及装置
CN107800783B (zh) 远程监控服务器的方法及装置
CN109508295B (zh) 区块链共识算法测试方法、装置、计算装置和存储介质
CN112395156A (zh) 故障的告警方法和装置、存储介质和电子设备
WO2021057855A1 (zh) 程序进程监控的方法、装置、计算机设备及可读存储介质
CN110209529A (zh) 射频参数的保护方法及电子设备
CN111930703A (zh) 日志文件自动抓取方法、装置和计算机设备
CN107395387A (zh) 双机业务恢复的方法、装置和***
CN113259996A (zh) 一种iot无线调试的方法及设备
CN112713996B (zh) 基于区块链的故障验证方法、服务器和终端
JP2010147804A (ja) 伝送装置と伝送装置に実装されるユニット
CN109460311A (zh) 固件异常状态的管理方法和装置
CN110825542B (zh) 一种分布式***中故障盘的检测方法、装置及检测***
CN115102862B (zh) 一种用于sdn设备的自动同步方法及装置
CN106406963A (zh) 一种Linux***的初始化方法和装置
CN106559249A (zh) 检查安全基线的方法及装置
CN109445993A (zh) 一种文件***健康状况的检测方法及相关装置
CN110968456A (zh) 分布式存储***中故障磁盘的处理方法及装置
CN114691395A (zh) 一种故障处理方法、装置、电子设备及存储介质
CN112069027A (zh) 一种接口数据处理方法、装置、电子设备及存储介质
CN114826884B (zh) 跨设备协议通信故障定位的方法、装置、设备及可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20200624

Address after: 518057 Zhongxing building, A3-01, A3-02, Nanshan District hi tech Industrial Park, Shenzhen, Guangdong

Applicant after: Shenzhen ZTE Technical Service Co.,Ltd.

Address before: 518000 Zhongxing building, science and technology south road, Nanshan District hi tech Industrial Park, Guangdong, Shenzhen

Applicant before: ZTE Corp.

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171124

WD01 Invention patent application deemed withdrawn after publication