CN114884803B - 多重冗余状态的处理方法、装置、设备和介质 - Google Patents

多重冗余状态的处理方法、装置、设备和介质 Download PDF

Info

Publication number
CN114884803B
CN114884803B CN202210469300.9A CN202210469300A CN114884803B CN 114884803 B CN114884803 B CN 114884803B CN 202210469300 A CN202210469300 A CN 202210469300A CN 114884803 B CN114884803 B CN 114884803B
Authority
CN
China
Prior art keywords
control center
main control
redundant
center host
host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210469300.9A
Other languages
English (en)
Other versions
CN114884803A (zh
Inventor
赵蕾
张辉
杨阳
李海金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Traffic Control Technology TCT Co Ltd
Original Assignee
Traffic Control Technology TCT Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Traffic Control Technology TCT Co Ltd filed Critical Traffic Control Technology TCT Co Ltd
Priority to CN202210469300.9A priority Critical patent/CN114884803B/zh
Publication of CN114884803A publication Critical patent/CN114884803A/zh
Application granted granted Critical
Publication of CN114884803B publication Critical patent/CN114884803B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0886Fully automatic configuration
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种多重冗余状态的处理方法、装置、设备和介质,包括:在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在冗余设备标识包含第一主控中心主机标识且冗余设备数量满足预设冗余设备数量的情况下,判定第一主控中心主机正常工作,并维持备控状态。由此通过冗余设备状态帧来明确当前正在工作的主机数量与主机标识,以判断是否需要备控中心升主,进而提高***可靠性。

Description

多重冗余状态的处理方法、装置、设备和介质
技术领域
本发明涉及信号处理技术领域,尤其涉及一种多重冗余状态的处理方法、装置、设备和介质。
背景技术
ATS(Automatic Train Supervision,列车自动监控)***是列车自动控制***(CBTC***)的重要部分,作为调度指挥监控列车运行的中枢,一旦发生故障,失去对列车的监视和控制,无人驾驶项目又没有司机操作,会严重影响正常运营。因此,***关键设备通常采用冗余热备的方式,保证***有高度的可靠性和可用性。
ATS***中,车载控制***相关信息通过网关计算机软件转换至***内部,应用服务器软件再整合形成统一的列车监控信息交由操作平台。目前国内新开通或在建的全自动运行线路多数设置一个控制中心和一个备用中心,应用服务器和网关计算机在主控中心和备控中心各部署双机热备软件,实现中心级服务器四重冗余。
在四重冗余方案中,单纯的四重冗余方案依赖冗余平台进行主备控制中心切换,然而在依赖冗余平台进行主备控制中心切换时,会出现控制中心双主,发生冗余故障,例如主控中心与备控中心发生通信故障但主控中心仍在正常运行时,备控中心主机通过冗余平台获取不到主控中心主机的冗余工作状态,如果自动升主则有可能造成控制中心双主,进而出现冗余故障。
发明内容
本发明提供一种多重冗余状态的处理方法、装置、设备和介质,用以解决现有技术中依赖冗余平台进行主备控制中心切换,导致出现控制中心双主,发生冗余故障的缺陷,实现了提高ATS***冗余信息交互的可靠性。
本发明提供一种多重冗余状态的处理方法,应用于第一备控中心主机,包括:
在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;
在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
根据本发明提供的一种多重冗余状态的处理方法,所述对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识之后,还包括:
在所述冗余设备标识不包含第一主控中心主机标识且所述冗余设备数量不满足预设冗余设备数量的情况下,判定所述第一主控中心主机发生故障。
在所述第一主控中心主机发生故障的情况下,执行自动升主操作。
根据本发明提供的一种多重冗余状态的处理方法,所述在所述第一主控中心主机发生故障的情况下,执行自动升主操作,具体包括:
在所述第一主控中心主机发生故障的情况下,判断所述第一主控中心主机的通信断链时长是否超过内部冗余断链时长;
在所述第一主控中心主机的通信断链超过内部冗余断链时长的情况下,执行自动升主操作。
根据本发明提供的一种多重冗余状态的处理方法,所述对第二主控中心主机反馈的冗余设备状态帧进行解析之前,还包括:
周期性向所述第二主控中心主机发送状态帧;
接收所述第二主控中心主机反馈的第一冗余设备状态帧或第二冗余设备状态帧。
其中,所述第一冗余设备状态帧的冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量,所述第二冗余设备状态帧的冗余设备标识不包含第一主控中心主机标识且所述冗余设备数量不满足预设冗余设备数量。
根据本发明提供的一种多重冗余状态的处理方法,所述接收所述第二主控中心主机反馈的第一冗余设备状态帧或第二冗余设备状态帧,具体包括:
接收所述第二主控中心主机反馈的第一冗余设备状态帧,其中,所述第二主控中心主机在接收到所述第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内接收到所述第一主控中心主机发送的第二状态帧的情况下,反馈第一冗余设备状态帧;或者,
接收所述第二主控中心主机反馈的第二冗余设备状态帧,其中,所述第二主控中心主机在接收到所述第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内未接收到所述第一主控中心主机发送的第二状态帧的情况下,反馈第二冗余设备状态帧。
根据本发明提供的一种多重冗余状态的处理方法,所述内部冗余断链时长是通过以下方式计算得到的:
获取第一备控中心主机升主时长及所述第一主控中心主机的内部通信断链时长;
计算出所述通信断链时长与所述第一备控中心主机升主时长之间的差值,根据所述差值得到内部冗余断链时长。
根据本发明提供的一种多重冗余状态的处理方法,所述第一备控中心主机包括网关计算机备控中心主机,所述第一主控中心主机包括网关计算机主控中心主机,所述第二主控中心主机包括应用服务器主控中心主机;或者,
所述第一备控中心主机包括应用服务器备控中心主机,所述第一主控中心主机包括应用服务器主控中心主机,所述第二主控中心主机包括网关计算机主控中心主机。
本发明还提供一种多重冗余状态的处理装置,包括:
解析单元,用于在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;
判定单元,用于在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述多重冗余状态的处理方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述多重冗余状态的处理方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述多重冗余状态的处理方法。
本发明提供的多重冗余状态的处理方法、装置、设备和介质,通过在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在冗余设备标识包含第一主控中心主机标识且冗余设备数量满足预设冗余设备数量的情况下,判定第一主控中心主机正常工作,并维持备控状态。由此通过冗余设备状态帧来明确当前正在工作的主机数量与主机标识,以判断是否需要备控中心升主,进而提高***可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的多重冗余状态的处理方法的流程示意图之一;
图2是本发明提供的网关计算机的通信连接示意图;
图3是本发明提供的多重冗余状态的处理方法的流程示意图之二;
图4是本发明提供的多重冗余状态的处理方法的流程示意图之三;
图5是本发明提供的多重冗余状态的处理方法的流程示意图之四;
图6是本发明提供的多重冗余状态的处理装置的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图5描述本发明的一种多重冗余状态的处理方法。
具体地,本发明提出的多重冗余状态的处理方法应用于第一备控中心主机,其中,第一备控中心主机可以为网关计算机备控中心主机,也可以为应用服务器备控中心主机。
在第一备控中心主机为网关计算机备控中心主机时,本发明中的第一主控中心主机为网关计算机主控中心主机,第二主控中心主机为应用服务器主控中心主机。在第一备控中心主机为应用服务器备控中心主机时,本发明中的第一主控中心主机为应用服务器主控中心主机,第二主控中心主机包括网关计算机主控中心主机。
需要说明的是,本发明中的第一及第二仅仅用于区分应用服务器和网关计算机,四重冗余方案中,部署在主备控制中心的四机软件同时热备运行。四台冗余设备的主备状态由软件冗余平台管理并进行切换,具体的切换优先级为:主控中心主机->主控中心备机->备控中心主机->备控中心备机,本发明中在备控中心与主控中心的主机和备机之间均发生通信故障时,备控中心的主机执行判定是否需要执行自动升主的逻辑,由此来保障***的正常运行。
本发明中在此以网关计算机备控中心主机为代表解释说明,应用服务器备控中心主机的多重冗余状态的处理方法与网关计算机备控中心主机同理,本发明在此不再赘述。
图1为本发明提供的多重冗余状态的处理方法的流程示意图之一,如图1所示,该方法包括:
步骤S1,在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;
具体地,网关计算机的主备控制中心之间存在通信连接,参考图2,图2中,网关计算机OCC-A为网关计算机主控中心主机,网关计算机OCC-B为网关计算机主控中心备机,网关计算机BOCC-A为网关计算机备控中心主机,网关计算机OCC-B为网关计算机备控中心备机,其中,各主控中心主机和各主控中心备机之间进行冗余设备直连网,四个冗余设备之间通过ATS***的内网通信连接。网关计算机的备控中心在接收不到网关计算机的主控中心的工作状态时,判定主控中心主机出现通信断链。
具体地,冗余设备数量为字节长度为1的字符,冗余设备数量指代应用服务器主控中心主机所连通的网关计算机的主机数量,冗余设备标识为字节长度为2的字符,冗余设备标识指代应用服务器主控中心主机所连通的网关计算机的主机ID。
在实际应用中,当应用服务器主控中心主机所连通的网关计算机的主机包括网关计算机主控中心主机和网关计算机备控中心主机时,冗余设备数量则为2,冗余设备标识包括网关计算机主控中心主机ID和网关计算机备控中心主机ID。当应用服务器主控中心主机所连通的网关计算机的主机仅包括网关计算机备控中心主机时,冗余设备数量则为1,冗余设备标识包括网关计算机备控中心主机ID。
步骤S2,在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
具体地,预设冗余设备数量为2个。该步骤中,在冗余设备标识包括网关计算机主控中心主机ID,且冗余设备数量为2个的情况下,判定网关计算机主控中心主机的工作状态仍然正常,排除网关计算机主控中心主机需要升主,由此提高***可靠性,避免出现控制中心双主的问题。
本发明提供的多重冗余状态的处理方法,通过在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在冗余设备标识包含第一主控中心主机标识且冗余设备数量满足预设冗余设备数量的情况下,判定第一主控中心主机正常工作,并维持备控状态,由此通过冗余设备状态帧来明确当前正在工作的主机数量与主机标识,以判断是否需要备控中心升主,进而提高***可靠性。
在另一实施例中,参考图3,图3为本发明提供的多重冗余状态的处理方法的流程示意图之二,如图3所示:所述对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识之后,还包括:
步骤S3,在所述冗余设备标识不包含第一主控中心主机标识且所述冗余设备数量不满足预设冗余设备数量的情况下,判定所述第一主控中心主机发生故障。
具体地,在冗余设备标识不包括网关计算机主控中心主机ID,且冗余设备数量为1个的情况下,判定网关计算机主控中心主机出现故障,再结合检测到第一主控中心主机出现通信断链的情况,由此通过双重故障检测,提高***可靠性。
步骤S4,在所述第一主控中心主机发生故障的情况下,执行自动升主操作。
其中,自动升主操作指代网关计算机备控中心主机进入输出控制信号状态。
在实际应用中,网关计算机主控中心主机处于正常工作状态时,网关计算机主控中心主机和网关计算机备控中心主机并行运行,但是仅由网关计算机主控中心主机输出控制信号,网关计算机备控中心主机不输出控制信号,当网关计算机主控中心主机出现故障时,网关计算机备控中心主机替代网关计算机主控中心主机输出控制信号,由此保证***能够正常运行。
在另一实施例中,参考图4,图4为本发明提供的多重冗余状态的处理方法的流程示意图之三,如图4所示:所述在所述第一主控中心主机发生故障的情况下,执行自动升主操作,具体包括:
步骤S41,在所述第一主控中心主机发生故障的情况下,判断所述第一主控中心主机的通信断链时长是否超过内部冗余断链时长;
具体地,通信断链时长指代第一备控中心主机获取不到第一主控中心主机的时长。
该步骤中,为了提高网关计算机与应用服务器等核心设备之间冗余信息交互的及时性,本发明中对内部冗余断链时长进行限制,具体地,内部冗余断链时长是通过以下方式计算得到的:
获取第一备控中心主机升主时长及第一主控中心主机的内部通信断链时长;计算出通信断链时长与第一备控中心主机升主时长之间的差值,根据差值得到内部冗余断链时长。
具体地,内部冗余断链时长的设定应小于通信断链时长与第一备控中心主机升主时长之间的差值,也即内部冗余断链时长可以在差值范围内任意取值,对此不进行限制。其中,第一备控中心主机升主时长是一个灵活可变动的值,例如第一备控中心主机的负载过大时,第一备控中心主机升主时长则要比第一备控中心主机的负载小时的升主时长的数值大一些。
步骤S42,在所述第一主控中心主机的通信断链超过内部冗余断链时长的情况下,执行自动升主操作。
当网关计算机主控中心主机发生网络或软件故障,已经不能正常工作时,基于以上方案,应用服务器主控中心主机在开始收不到网关计算机主控中心主机汇报的状态帧,并等待一个内部冗余断链时长后,向网关计算机备控中心主机汇报的冗余设备状态帧中,就只剩下了当前仍在工作的网关计算机备控中心主机ID。
同时,网关计算机备控中心主机与网关计算机主控中心主机的通信断链时间也已经超过了内部冗余断链时长,结合应用服务器主控中心主机汇报的冗余设备状态帧,网关计算机备控中心主机可以明确网关计算机主控中心主机已经失效。此时网关计算机备控中心主机立即升级成主控中心,进行输出控制信号操控。
综上,从网关计算机主控中心主机停止工作到网关计算机备控中心主机升主完成,网关计算机备控中心主机的逻辑处理的中断时间小于ATS***内部的通信断链时长。在ATS***内部的其他设备判断与网关计算机主控中心主机通信中断前,ATS***内部已经升主的新的网关计算机备控中心主机会及时建立起与其他软件或***信息传输的路径,保证了信息传输的连续性。
在另一实施例中,参考图5,图5为本发明提供的多重冗余状态的处理方法的流程示意图之四,如图5所示:所述对第二主控中心主机反馈的冗余设备状态帧进行解析之前,还包括:
步骤S11,周期性向所述第二主控中心主机发送状态帧;
该步骤中,为了避免出现控制中心双主的状况,本发明中的服务器主控中心主机、服务器备控中心主机、网关计算机备控中心主机、网关计算机主控中心主机之间均周期性的向对方主控中心主机汇报各自的状态帧,由此通过周期性汇报状态帧的方式保障***的可靠性。
步骤S12,接收所述第二主控中心主机反馈的第一冗余设备状态帧或第二冗余设备状态帧。
其中,第一冗余设备状态帧的冗余设备标识包含第一主控中心主机标识且冗余设备数量满足预设冗余设备数量,第二冗余设备状态帧的冗余设备标识不包含第一主控中心主机标识且冗余设备数量不满足预设冗余设备数量。
具体地,接收第二主控中心主机反馈的第一冗余设备状态帧,其中,第二主控中心主机在接收到第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内接收到第一主控中心主机发送的第二状态帧的情况下,反馈第一冗余设备状态帧;或者,
接收第二主控中心主机反馈的第二冗余设备状态帧,其中,第二主控中心主机在接收到第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内未接收到第一主控中心主机发送的第二状态帧的情况下,反馈第二冗余设备状态帧。
第一冗余设备状态帧指代用于表明网关计算机备控中心主机处于正常工作状态的信息帧,第二状态帧指代用于表明网关计算机主控中心主机处于非正常工作状态的信息帧。
换句话说,本发明中当网关计算机主控中心主机处于正常工作状态时,应用服务器主控中心主机反馈的第一冗余设备状态帧中的冗余设备数量为2,且冗余设备标识包括网关计算机主控中心主机ID。当网关计算机主控中心主机发生故障时,应用服务器主控中心主机反馈的第二冗余设备状态帧中的冗余设备数量为1,且冗余设备标识不包括网关计算机主控中心主机ID,由此通过第一冗余设备状态帧和第一冗余设备状态帧来明确当前网关计算机主控中心主机是否处于故障状态,从而可以保障***正常运行。
该步骤中,应用服务器主控中心主机在接收到网关计算机备控中心主机发送的第一状态帧后,应用服务器主控中心主机还可以向网关计算机主控中心主机发送状态帧请求信号,以通知网关计算机主控中心主机发送第二状态帧,来表明网关计算机主控中心主机处于正常工作状态。
另外需要说明的是,在网关计算机主控中心主机负载过大,网关计算机主控中心主机处理信号的速度可能会变慢,因此网关计算机主控中心主机可能不能及时发送状态帧。因此本发明中采用设定一个内部冗余断链时长来核实网关计算机主控中心主机是否发生故障。由此避免了网关计算机主控中心主机出现此种情况造成网关计算机备控中心主机误判,进入自动升主造成控制中心双主的问题,从而提高了***可靠性。
在另一实施例中,为了提高网关计算机与应用服务器等核心设备之间冗余信息交互的及时性,本发明中对内部冗余断链时长进行限制,具体地,内部冗余断链时长是通过以下方式计算得到的:
获取第一备控中心主机升主时长及第一主控中心主机的内部通信断链时长;计算出通信断链时长与第一备控中心主机升主时长之间的差值,根据差值得到内部冗余断链时长。
具体地,内部冗余断链时长的设定应小于通信断链时长与第一备控中心主机升主时长之间的差值,也即内部冗余断链时长可以在差值范围内任意取值,对此不进行限制。其中,第一备控中心主机升主时长是一个灵活可变动的值,例如第一备控中心主机的负载过大时,第一备控中心主机升主时长则要比第一备控中心主机的负载小时的升主时长的数值大一些。
综上,从网关计算机主控中心主机停止工作到网关计算机备控中心主机升主完成,网关计算机备控中心主机的逻辑处理的中断时间小于ATS***内部的通信断链时长。在ATS***内部的其他设备判断与网关计算机主控中心主机通信中断前,ATS***内部已经升主的新的网关计算机备控中心主机会及时建立起与其他软件或***信息传输的路径,保证了信息传输的连续性。
在另一实施例中,为了提高网关与应用等核心设备冗余信息交互的及时性,本发明中还可以在网关计算机备控中心主机检测到第一主控中心主机出现通信断链的情况下,主动向服务器备控中心主机发送第一状态帧,由此加快对网关计算机备控中心主机故障检测的速度。
具体地,在检测到第一主控中心主机出现通信断链的情况下,向所述第二主控中心主机发送第一状态帧;接收第二主控中心主机反馈的冗余设备状态帧,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识。
其中,第一状态帧指代用于表明网关计算机备控中心主机处于正常工作状态的信息帧,其中,第一状态帧中可以包括网关计算机备控中心主机标识,例如接口ID,第一状态帧中还可以包括逻辑指令,即应用服务器主控中心主机在接收到网关计算机备控中心主机发送的第一状态帧之后,应用服务器主控中心主机请求网关计算机主控中心主机发送第二状态帧,以验证网关计算机主控中心主机是否处于正常工作状态。
此外,在另一实施例中,本发明中的ATS***中还设有冗余平台,在检测到第一主控中心主机出现通信断链的情况下,向第二主控中心主机发送第一状态帧具体包括:
在通过冗余平台获取不到所述第一主控中心主机的工作状态的情况下,判定所述第一主控中心主机出现通信断链;向所述第二主控中心主机发送携带有第一备控中心主机标识的第一状态帧。
需要说明的是,本发明中的服务器主控中心主机、服务器备控中心主机、网关计算机备控中心主机、网关计算机主控中心主机各自均设有一个冗余平台,通过四个冗余平台的信息交互,彼此可以相互得知对方的工作状态。
冗余平台可以实时对各个冗余设备进行监测,例如网关计算机主控中心每间隔一段时间向冗余平台反馈工作状态信号以表明网关计算机主控中心处于正常工作,当冗余平台在间隔一段时间后未接收到网关计算机主控中心反馈的工作状态信号的情况下,冗余平台判定网关计算机主控中心出现通信断链故障。此外,冗余平台在间隔一段时间后未接收到网关计算机主控中心反馈的工作状态信号的情况下,还可以主动向网关计算机主控中心发送状态帧请求信号,在未接收到网关计算机主控中心反馈的状态帧的情况下判定网关计算机主控中心出现通信断链故障,由此通过双重验证提高了***可靠性,进而避免出现控制中心双主。
下面对本发明提供的多重冗余状态的处理装置进行描述,下文描述的多重冗余状态的处理装置与上文描述的多重冗余状态的处理方法可相互对应参照。
参考图6,图6是本发明提供的多重冗余状态的处理装置的结构示意图,如图6所示,所述多重冗余状态的处理装置包括:解析单元610,用于在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;判定单元620,用于在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
根据本发明提出的多重冗余状态的处理装置,通过在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在冗余设备标识包含第一主控中心主机标识且冗余设备数量满足预设冗余设备数量的情况下,判定第一主控中心主机正常工作,并维持备控状态。由此通过冗余设备状态帧来明确当前正在工作的主机数量与主机标识,以判断是否需要备控中心升主,进而提高***可靠性。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行多重冗余状态的处理方法,该方法包括:在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在检测到所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的多重冗余状态的处理方法,该方法包括:在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在检测到所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的多重冗余状态的处理方法,该方法包括:在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;在检测到所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (9)

1.一种多重冗余状态的处理方法,其特征在于,应用于第一备控中心主机,包括:
在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;
在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态;
所述第一备控中心主机包括网关计算机备控中心主机,所述第一主控中心主机包括网关计算机主控中心主机,所述第二主控中心主机包括应用服务器主控中心主机,所述冗余设备数量指代应用服务器主控中心主机所连通的网关计算机的主机数量,所述冗余设备标识指代应用服务器主控中心主机所连通的网关计算机的主机ID;
或者,
所述第一备控中心主机包括应用服务器备控中心主机,所述第一主控中心主机包括应用服务器主控中心主机,所述第二主控中心主机包括网关计算机主控中心主机,所述冗余设备数量指代网关计算机主控中心主机所连通的应用服务器的主机数量,所述冗余设备标识指代网关计算机主控中心主机所连通的应用服务器的主机ID。
2.根据权利要求1所述的多重冗余状态的处理方法,其特征在于,所述对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识之后,还包括:
在所述冗余设备标识不包含第一主控中心主机标识且所述冗余设备数量不满足预设冗余设备数量的情况下,判定所述第一主控中心主机发生故障;
在所述第一主控中心主机发生故障的情况下,执行自动升主操作。
3.根据权利要求2所述的多重冗余状态的处理方法,其特征在于,所述在所述第一主控中心主机发生故障的情况下,执行自动升主操作,具体包括:
在所述第一主控中心主机发生故障的情况下,判断所述第一主控中心主机的通信断链时长是否超过内部冗余断链时长;
在所述第一主控中心主机的通信断链超过内部冗余断链时长的情况下,执行自动升主操作。
4.根据权利要求1所述的多重冗余状态的处理方法,其特征在于,所述对第二主控中心主机反馈的冗余设备状态帧进行解析之前,还包括:
周期性向所述第二主控中心主机发送状态帧;
接收所述第二主控中心主机反馈的第一冗余设备状态帧或第二冗余设备状态帧;
其中,所述第一冗余设备状态帧的冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量,所述第二冗余设备状态帧的冗余设备标识不包含第一主控中心主机标识且所述冗余设备数量不满足预设冗余设备数量。
5.根据权利要求4所述的多重冗余状态的处理方法,其特征在于,所述接收所述第二主控中心主机反馈的第一冗余设备状态帧或第二冗余设备状态帧,具体包括:
接收所述第二主控中心主机反馈的第一冗余设备状态帧,其中,所述第二主控中心主机在接收到所述第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内接收到所述第一主控中心主机发送的第二状态帧的情况下,反馈第一冗余设备状态帧;或者,
接收所述第二主控中心主机反馈的第二冗余设备状态帧,其中,所述第二主控中心主机在接收到所述第一备控中心主机发送的第一状态帧,且在间隔内部冗余断链时长内未接收到所述第一主控中心主机发送的第二状态帧的情况下,反馈第二冗余设备状态帧。
6.根据权利要求3或5所述的多重冗余状态的处理方法,其特征在于,所述内部冗余断链时长是通过以下方式计算得到的:
获取第一备控中心主机升主时长及所述第一主控中心主机的内部通信断链时长;
计算出所述通信断链时长与所述第一备控中心主机升主时长之间的差值,根据所述差值得到内部冗余断链时长。
7.一种多重冗余状态的处理装置,其特征在于,应用于第一备控中心主机,包括:
解析单元,用于在检测到第一主控中心主机出现通信断链的情况下,对第二主控中心主机反馈的冗余设备状态帧进行解析,获得冗余设备数量及各冗余设备标识;
判定单元,用于在所述冗余设备标识包含第一主控中心主机标识且所述冗余设备数量满足预设冗余设备数量的情况下,判定所述第一主控中心主机正常工作,并维持备控状态;
所述第一备控中心主机包括网关计算机备控中心主机,所述第一主控中心主机包括网关计算机主控中心主机,所述第二主控中心主机包括应用服务器主控中心主机,所述冗余设备数量指代应用服务器主控中心主机所连通的网关计算机的主机数量,所述冗余设备标识指代应用服务器主控中心主机所连通的网关计算机的主机ID;
或者,
所述第一备控中心主机包括应用服务器备控中心主机,所述第一主控中心主机包括应用服务器主控中心主机,所述第二主控中心主机包括网关计算机主控中心主机,所述冗余设备数量指代网关计算机主控中心主机所连通的应用服务器的主机数量,所述冗余设备标识指代网关计算机主控中心主机所连通的应用服务器的主机ID。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述多重冗余状态的处理方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述多重冗余状态的处理方法。
CN202210469300.9A 2022-04-28 2022-04-28 多重冗余状态的处理方法、装置、设备和介质 Active CN114884803B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210469300.9A CN114884803B (zh) 2022-04-28 2022-04-28 多重冗余状态的处理方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210469300.9A CN114884803B (zh) 2022-04-28 2022-04-28 多重冗余状态的处理方法、装置、设备和介质

Publications (2)

Publication Number Publication Date
CN114884803A CN114884803A (zh) 2022-08-09
CN114884803B true CN114884803B (zh) 2024-02-20

Family

ID=82673624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210469300.9A Active CN114884803B (zh) 2022-04-28 2022-04-28 多重冗余状态的处理方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN114884803B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115257884B (zh) * 2022-08-19 2024-04-26 交控科技股份有限公司 基于载客状态的轨道交通节能控制方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1764191A (zh) * 2004-10-18 2006-04-26 国际商业机器公司 用于动态更新会话状态亲缘性的方法和***
US7477657B1 (en) * 2002-05-08 2009-01-13 Juniper Networks, Inc. Aggregating end-to-end QoS signaled packet flows through label switched paths
CN103780389A (zh) * 2012-10-26 2014-05-07 华为技术有限公司 基于端口认证的方法及网络设备
WO2014075596A1 (zh) * 2012-11-13 2014-05-22 中兴通讯股份有限公司 根据注册网关数量进行双归属自动倒换判决方法及***
CN105487413A (zh) * 2015-11-24 2016-04-13 北京交控科技股份有限公司 城市轨道交通主备控制***及主备切换方法
CN108924879A (zh) * 2018-06-22 2018-11-30 北京格瑞空间科技有限公司 一种用于无线物联网的负载均衡方法
CN110658718A (zh) * 2019-11-08 2020-01-07 北京市轨道交通建设管理有限公司 一种多主控冗余切换控制方法及***
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制***平台的动态冗余备份方法及***
CN114116321A (zh) * 2022-01-25 2022-03-01 苏州浪潮智能科技有限公司 一种冗余数据管理方法、装置、计算机设备和存储介质
CN114297296A (zh) * 2021-12-27 2022-04-08 广州市保伦电子有限公司 一种广播用的服务器主备切换***

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7477657B1 (en) * 2002-05-08 2009-01-13 Juniper Networks, Inc. Aggregating end-to-end QoS signaled packet flows through label switched paths
CN1764191A (zh) * 2004-10-18 2006-04-26 国际商业机器公司 用于动态更新会话状态亲缘性的方法和***
CN103780389A (zh) * 2012-10-26 2014-05-07 华为技术有限公司 基于端口认证的方法及网络设备
WO2014075596A1 (zh) * 2012-11-13 2014-05-22 中兴通讯股份有限公司 根据注册网关数量进行双归属自动倒换判决方法及***
CN105487413A (zh) * 2015-11-24 2016-04-13 北京交控科技股份有限公司 城市轨道交通主备控制***及主备切换方法
CN108924879A (zh) * 2018-06-22 2018-11-30 北京格瑞空间科技有限公司 一种用于无线物联网的负载均衡方法
CN110658718A (zh) * 2019-11-08 2020-01-07 北京市轨道交通建设管理有限公司 一种多主控冗余切换控制方法及***
CN112477919A (zh) * 2020-12-11 2021-03-12 交控科技股份有限公司 一种适用于列车控制***平台的动态冗余备份方法及***
CN114297296A (zh) * 2021-12-27 2022-04-08 广州市保伦电子有限公司 一种广播用的服务器主备切换***
CN114116321A (zh) * 2022-01-25 2022-03-01 苏州浪潮智能科技有限公司 一种冗余数据管理方法、装置、计算机设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
双冗余控制器的失效状态分析及面向高可靠度的设计;周树桥;李铎;;清华大学学报(自然科学版)(第04期);全文 *

Also Published As

Publication number Publication date
CN114884803A (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
CN105933407B (zh) 一种实现Redis集群高可用的方法及***
CN107404522B (zh) 一种跨节点的虚拟机集群高可用实现方法和装置
CN111385107B (zh) 一种服务器的主备切换处理方法及装置
CN112181660A (zh) 一种基于服务器集群的高可用方法
CN113726573B (zh) 冗余网络通信方法、装置、电子设备及存储介质
CN113608908B (zh) 服务器故障处理方法、***、设备及可读存储介质
CN114884803B (zh) 多重冗余状态的处理方法、装置、设备和介质
CN110224872B (zh) 一种通信方法、装置及存储介质
US8111625B2 (en) Method for detecting a message interface fault in a communication device
CN116347489A (zh) 一种基于数据中心的业务处理方法
JP3248485B2 (ja) クラスタシステム、クラスタシステムにおける監視方式およびその方法
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
CN110572292B (zh) 基于单向传输链路的高可用***及方法
CN112751688B (zh) 一种otn设备的流控处理方法、电子设备及存储介质
CN112219373B (zh) 海缆故障判断方法和装置
CN115514623A (zh) 故障处理方法、堆叠设备及存储介质
JP2555472B2 (ja) 信号ケーブル接続状態監視機能付きの分散制御システム
JP7417773B1 (ja) ネットワークインターフェースカード、および送信性能監視方法
US7724642B2 (en) Method and apparatus for continuous operation of a point-of-sale system during a single point-of-failure
CN115941447A (zh) 微服务故障处理方法及装置
JP3317278B2 (ja) Fddi障害監視方法、fddi障害監視装置、プログラムを記録した記録媒体、ネットワークシステム
CN118055009A (zh) 一种渠道在多数据中心环境下自动迁移容灾方法及设备
CN116340045A (zh) 数据库异常处理方法、装置、设备和计算机可读存储介质
CN116319412A (zh) 一种服务器网卡监测切换方法、装置、终端及存储介质
CN117221169A (zh) 一种车辆的mvb总线的故障诊断方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant