CN105959172B - 一种集群***的冗余网络管理方法及平台 - Google Patents

一种集群***的冗余网络管理方法及平台 Download PDF

Info

Publication number
CN105959172B
CN105959172B CN201610573169.5A CN201610573169A CN105959172B CN 105959172 B CN105959172 B CN 105959172B CN 201610573169 A CN201610573169 A CN 201610573169A CN 105959172 B CN105959172 B CN 105959172B
Authority
CN
China
Prior art keywords
communication network
network segment
group system
host
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610573169.5A
Other languages
English (en)
Other versions
CN105959172A (zh
Inventor
马怀旭
方浩
樊云龙
姜文涛
赵祯龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610573169.5A priority Critical patent/CN105959172B/zh
Publication of CN105959172A publication Critical patent/CN105959172A/zh
Application granted granted Critical
Publication of CN105959172B publication Critical patent/CN105959172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种集群***的冗余网络管理方法,包括:预先分别利用集群***的主通信网段和备通信网段,对所有主机进行通信网络连接,得到主环状通信网络和备环状通信网络,并以主环状通信网络作为工作网络;对上述两套通信网络进行实时监测,若它们均出现网络中断故障,则对当前集群***中每台主机内部通信网段的工作状态进行监测;若不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。本申请降低了集群***中主机因网段故障而被隔离的概率。另外,本申请还相应公开了一种冗余网络管理平台。

Description

一种集群***的冗余网络管理方法及平台
技术领域
本发明涉及集群网络监测技术领域,特别涉及一种集群***的冗余网络管理方法及平台。
背景技术
当前,随着计算机技术和网络技术的快速发展,集群***以其强大的运算能力和健壮的容错机制逐渐成为了计算机行业的焦点。为了保证集群***中网络的稳定性,通常采用冗余网络方式来进行集群管理。
然而,在传统的集群冗余网络管理过程中,只要某台主机内部的任一网段出现了故障,该台主机将会被强制进行隔离,即便这台主机内部此时还存在其他能够正常工作的网段。这样将会大幅增加集群***中主机被隔离的概率,而主机一旦被隔离,将会产生相应的业务迁移,这种业务迁移本身又会加重集群***整体的负担,不利于集群***性能的提升。
综上所述可以看出,如何降低集群***中主机因网段故障而被隔离的概率是目前有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种集群***的冗余网络管理方法及平台,降低了集群***中主机因网段故障而被隔离的概率。其具体方案如下:
一种集群***的冗余网络管理方法,所述集群***中的通信网段均包括主通信网段和备通信网段;所述方法包括:
预先分别利用所述主通信网段和所述备通信网段,对所述集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以所述主环状通信网络作为所述集群***的工作网络;
对所述主环状通信网络和所述备环状通信网络进行实时监测,若监测到当前所述主环状通信网络和所述备环状通信网络均出现网络中断故障,则对当前所述集群***中每台主机内部通信网段的工作状态进行监测;
若监测到当前所述集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
优选的,所述冗余网络管理方法,还包括:
在所述对当前所述集群***中每台主机内部通信网段的工作状态进行监测的过程中,若监测到当前所述集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前所述集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
优选的,所述冗余网络管理方法,还包括:
在所述隔离处理后,利用所述集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
优选的,所述冗余网络管理方法,还包括:
在所述对所述主环状通信网络和所述备环状通信网络进行实时监测的过程中,若监测到只有所述主环状通信网络出现网络中断故障,则将所述集群***的工作网络切换为所述备环状通信网络。
优选的,在利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程之前,所述冗余网络管理方法还包括:
统计当前所述集群***中主通信网段能够正常工作的主机的总数,得到第一数量;
统计当前所述集群***中备通信网段能够正常工作的主机的总数,得到第二数量。
优选的,所述利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程,包括:
当所述第一数量大于或等于所述第二数量,则基于第一预设网络搭建原则,重新搭建所述集群***中的环状通信网络;
其中,所述第一预设网络搭建原则具体为:
将第一类主机的主通信网段和第二类主机的备通信网段用于重新进行环状通信网络的搭建;其中,所述第一类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有主通信网段能够正常工作的主机;所述第二类主机包括当前只有备通信网段能够正常工作的主机。
优选的,所述利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程,包括:
当所述第一数量小于所述第二数量,则基于第二预设网络搭建原则,重新搭建所述集群***中的环状通信网络;
其中,所述第二预设网络搭建原则具体为:
将第三类主机的主通信网段和第四类主机的备通信网段用于重新进行环状通信网络的搭建;其中,所述第三类主机包括当前只有主通信网段能够正常工作的主机;所述第四类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有备通信网段能够正常工作的主机。
本发明还公开了一种集群***的冗余网络管理平台,所述集群***中的通信网段均包括主通信网段和备通信网段;所述冗余网络管理平台包括:
通信网络接连模块,用于预先分别利用所述主通信网段和所述备通信网段,对所述集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以所述主环状通信网络作为所述集群***的工作网络;
通信网络监测模块,用于对所述主环状通信网络和所述备环状通信网络进行实时监测;
主机网段监测模块,用于当所述网络监测模块监测到当前所述主环状通信网络和所述备环状通信网络均出现网络中断故障,则对当前所述集群***中每台主机内部通信网段的工作状态进行监测;
通信网络重连模块,用于当所述主机网段监测模块监测到当前所述集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
优选的,所述冗余网络管理平台,还包括:
主机隔离模块,用于当所述主机网段监测模块监测到当前所述集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前所述集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
优选的,所述通信网络重连模块,还用于在所述主机隔离模块进行所述隔离处理后,利用所述集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
可见,本发明在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,对当前每台主机内部的通信网段的工作状态进行实时监测,如果监测到不存在同一主机内部的主通信网段和备通信网段均出现网段故障,也即,如果监测到当前集群***的每台主机中均至少存在一个通信网段能够正常工作,则利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。由上可知,在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,只要某台主机内部还存在至少一个通信网段能够正常工作,那么这台主机依然能够加入到新的环状通信网络中,而无需被强制进行隔离,由此本发明降低了集群***中主机因网段故障而被隔离的概率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种集群***的冗余网络管理方法流程图;
图2为本发明实施例公开的一种集群***的冗余网络管理平台结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种集群***的冗余网络管理方法,上述集群***中的通信网段均包括主通信网段和备通信网段;上述方法包括:
步骤S11:预先分别利用集群***中的主通信网段和备通信网段,对集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以主环状通信网络作为集群***的工作网络。
也即,利用集群***中的主通信网段,将集群***中所有主机依次建立通信连接,相应地得到上述主环状通信网络;同理,利用集群***中的备通信网段,将将集群***中所有主机依次建立通信连接,相应地得到上述备环状通信网络。可见,本实施例中的集群***存在两套通信网络,一套是上述的主环状通信网络,另一套则是上述的备环状通信网络。
可以理解的是,在集群***的上述两套通信网络均能正常工作的情况下,集群***只需利用上述主环状通信网络作为当前的工作网络即可,而上述备环状通信网络则处于随时待命的状态。
步骤S12:对主环状通信网络和备环状通信网络进行实时监测,若监测到当前主环状通信网络和备环状通信网络均出现网络中断故障,则对当前集群***中每台主机内部通信网段的工作状态进行监测。
也即,在监测到当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,通过监测手段来获取当前每台主机内部通信网段的工作状态,以确定当前集群***中哪些主机的内部出现了网段故障以及出现网段故障的主机中具体是哪些通信网段出现了故障。
步骤S13:若监测到当前集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。
也即,在主环状通信网络和备环状通信网络均出现网络中断故障的情况下,如果监测到当前集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则意味着当前集群***的每台主机中均至少还存在一个通信网段能够正常工作,并且当前集群***中至少存在两台主机出现不同类型的网段故障,其中一个是主通信网段故障,另一个则是备通信网段故障。为了修复网络中断故障,本发明通过利用此时集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。
例如,假设上述主环状通信网络和备环状通信网络均出现网络中断故障的现象是由主机A内部出现主通信网段故障以及主机C内部出现备通信网段故障所导致的,那么后续进行网络修复时,主机A可通过还能正常工作的备通信网段连入新的环状通信网络,而主机C则可通过还能正常工作的主通信网段连入新的环状通信网络,而其他主机既可以通过主通信网段,也可以通过备通信网段连入新的环状通信网络,当然,本实施例优先令其他所有通信网段均能正常工作的主机通过主通信网段连入新的环状通信网络。而在传统的技术中,上述主机A和主机C会被进行强制隔离,而无法参与到新的网络构建过程中,这样导致集群***中产生大量的业务迁移。可见,本发明实施例降低了集群***中主机因网段故障而被隔离的概率,避免了频繁在集群***中进行主机的业务迁移。
可见,本发明实施例在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,对当前每台主机内部的通信网段的工作状态进行实时监测,如果监测到不存在同一主机内部的主通信网段和备通信网段均出现网段故障,也即,如果监测到当前集群***的每台主机中均至少存在一个通信网段能够正常工作,则利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。由上可知,在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,只要某台主机内部还存在至少一个通信网段能够正常工作,那么这台主机依然能够加入到新的环状通信网络中,而无需被强制进行隔离,由此本发明实施例降低了集群***中主机因网段故障而被隔离的概率。
本发明实施例公开了一种具体的集群***的冗余网络管理方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
相对于上一实施例,本实施例中的冗余网络管理方法,还可以进一步包括:在对当前集群***中每台主机内部通信网段的工作状态进行监测的过程中,若监测到当前集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
也即,如果监测到某台主机的主通信网段和备通信网段均出现了故障,则意味着该主机已经无法进行网络通信连接,此时可对其进行强制隔离,以隔绝其他主机向其发送的所有通信连接请求。
进一步的,本实施例中的冗余网络管理方法,还可以包括:在上述隔离处理后,利用集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。
也即,在进行上述隔离处理后,剩余的未被隔离的主机内部均至少还有一个通信网段能够正常工作,然后利用这些未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,进而将集群***的工作网络切换为该环状通信网络。
另外,本实施例中的冗余网络管理方法,还可以包括:在对主环状通信网络和备环状通信网络进行实时监测的过程中,若监测到只有主环状通信网络出现网络中断故障,则将集群***的工作网络切换为备环状通信网络。
上一实施例步骤S13中,在利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络的过程之前,还包括步骤S130;具体为:
步骤S130:统计当前集群***中主通信网段能够正常工作的主机的总数,得到第一数量,以及统计当前集群***中备通信网段能够正常工作的主机的总数,得到第二数量。
本实施例中,上述第一数量和上述第二数量之间的大小关系的不同,将会使得后续新的环状通信网络的构建过程也存在着差异。具体为:
在上述第一数量大于或等于上述第二数量的情况下,上一实施例步骤S13中,利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络的过程,具体为:基于第一预设网络搭建原则,重新搭建集群***中的环状通信网络;
其中,第一预设网络搭建原则具体为:将第一类主机的主通信网段和第二类主机的备通信网段用于重新进行环状通信网络的搭建;其中,第一类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有主通信网段能够正常工作的主机;第二类主机包括当前只有备通信网段能够正常工作的主机。
而在上述第一数量小于上述第二数量的情况下,上一实施例步骤S13中,利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络的过程,具体为:基于第二预设网络搭建原则,重新搭建集群***中的环状通信网络;
其中,第二预设网络搭建原则具体为:将第三类主机的主通信网段和第四类主机的备通信网段用于重新进行环状通信网络的搭建;其中,第三类主机包括当前只有主通信网段能够正常工作的主机;第四类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有备通信网段能够正常工作的主机。
相应的,本发明实施例进一步公开了一种集群***的冗余网络管理平台,上述集群***中的通信网段均包括主通信网段和备通信网段;参见图2所示,上述冗余网络管理平台包括:
通信网络接连模块21,用于预先分别利用主通信网段和备通信网段,对集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以主环状通信网络作为集群***的工作网络;
通信网络监测模块22,用于对主环状通信网络和备环状通信网络进行实时监测;
主机网段监测模块23,用于当网络监测模块监测到当前主环状通信网络和备环状通信网络均出现网络中断故障,则对当前集群***中每台主机内部通信网段的工作状态进行监测;
通信网络重连模块24,用于当主机网段监测模块监测到当前集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。
可见,本发明实施例在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,对当前每台主机内部的通信网段的工作状态进行实时监测,如果监测到不存在同一主机内部的主通信网段和备通信网段均出现网段故障,也即,如果监测到当前集群***的每台主机中均至少存在一个通信网段能够正常工作,则利用集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。由上可知,在当前主环状通信网络和备环状通信网络均出现网络中断故障的情况下,只要某台主机内部还存在至少一个通信网段能够正常工作,那么这台主机依然能够加入到新的环状通信网络中,而无需被强制进行隔离,由此本发明实施例降低了集群***中主机因网段故障而被隔离的概率。
进一步的,本实施例中的冗余网络管理平台,还可以包括:
主机隔离模块,用于当主机网段监测模块监测到当前集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
另外,上述通信网络重连模块,还可以进一步用于在上述主机隔离模块进行隔离处理后,利用集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建集群***中的环状通信网络,并将集群***的工作网络切换为该环状通信网络。
本实施例中的冗余网络管理平台,还可以进一步包括:网络直接切换模块,用于在上述通信网络监测模块监测到只有主环状通信网络出现网络中断故障,则将集群***的工作网络切换为备环状通信网络。
关于上述各个模块更加详尽的工作过程可参考前述实施例中的相关内容,在此不再进行一一赘述。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种集群***的冗余网络管理方法及平台进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种集群***的冗余网络管理方法,其特征在于,所述集群***中的通信网段均包括主通信网段和备通信网段;所述方法包括:
预先分别利用所述主通信网段和所述备通信网段,对所述集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以所述主环状通信网络作为所述集群***的工作网络;
对所述主环状通信网络和所述备环状通信网络进行实时监测,若监测到当前所述主环状通信网络和所述备环状通信网络均出现网络中断故障,则对当前所述集群***中每台主机内部通信网段的工作状态进行监测;
若监测到当前所述集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络;其中,在重新搭建所述集群***中的环状通信网络的过程中,若主机的主通信网段和备通信网段均未出现网段故障,则利用该主机的主通信网段或备通信网段来重新搭建所述集群***中的环状通信网络。
2.根据权利要求1所述的集群***的冗余网络管理方法,其特征在于,还包括:
在所述对当前所述集群***中每台主机内部通信网段的工作状态进行监测的过程中,若监测到当前所述集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前所述集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
3.根据权利要求2所述的集群***的冗余网络管理方法,其特征在于,还包括:
在所述隔离处理后,利用所述集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
4.根据权利要求1所述的集群***的冗余网络管理方法,其特征在于,还包括:
在所述对所述主环状通信网络和所述备环状通信网络进行实时监测的过程中,若监测到只有所述主环状通信网络出现网络中断故障,则将所述集群***的工作网络切换为所述备环状通信网络。
5.根据权利要求1至4任一项所述的集群***的冗余网络管理方法,其特征在于,在利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程之前,还包括:
统计当前所述集群***中主通信网段能够正常工作的主机的总数,得到第一数量;
统计当前所述集群***中备通信网段能够正常工作的主机的总数,得到第二数量。
6.根据权利要求5所述的集群***的冗余网络管理方法,其特征在于,所述利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程,包括:
当所述第一数量大于或等于所述第二数量,则基于第一预设网络搭建原则,重新搭建所述集群***中的环状通信网络;
其中,所述第一预设网络搭建原则具体为:
将第一类主机的主通信网段和第二类主机的备通信网段用于重新进行环状通信网络的搭建;其中,所述第一类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有主通信网段能够正常工作的主机;所述第二类主机包括当前只有备通信网段能够正常工作的主机。
7.根据权利要求5所述的集群***的冗余网络管理方法,其特征在于,所述利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络的过程,包括:
当所述第一数量小于所述第二数量,则基于第二预设网络搭建原则,重新搭建所述集群***中的环状通信网络;
其中,所述第二预设网络搭建原则具体为:
将第三类主机的主通信网段和第四类主机的备通信网段用于重新进行环状通信网络的搭建;其中,所述第三类主机包括当前只有主通信网段能够正常工作的主机;所述第四类主机包括当前主通信网段和备通信网段均能够正常工作的主机,以及当前只有备通信网段能够正常工作的主机。
8.一种集群***的冗余网络管理平台,其特征在于,所述集群***中的通信网段均包括主通信网段和备通信网段;所述冗余网络管理平台包括:
通信网络接连模块,用于预先分别利用所述主通信网段和所述备通信网段,对所述集群***中的所有主机进行通信网络连接,得到相应的主环状通信网络和备环状通信网络,并以所述主环状通信网络作为所述集群***的工作网络;
通信网络监测模块,用于对所述主环状通信网络和所述备环状通信网络进行实时监测;
主机网段监测模块,用于当所述网络监测模块监测到当前所述主环状通信网络和所述备环状通信网络均出现网络中断故障,则对当前所述集群***中每台主机内部通信网段的工作状态进行监测;
通信网络重连模块,用于当所述主机网段监测模块监测到当前所述集群***中不存在同一主机内部的主通信网段和备通信网段均出现网段故障,则利用所述集群***中每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络;其中,在重新搭建所述集群***中的环状通信网络的过程中,若主机的主通信网段和备通信网段均未出现网段故障,则利用该主机的主通信网段或备通信网段来重新搭建所述集群***中的环状通信网络。
9.根据权利要求8所述的集群***的冗余网络管理平台,其特征在于,还包括:
主机隔离模块,用于当所述主机网段监测模块监测到当前所述集群***中存在同一主机内部的主通信网段和备通信网段均出现网段故障,则对当前所述集群***中主通信网段和备通信网段均出现网段故障的主机进行隔离处理。
10.根据权利要求9所述的集群***的冗余网络管理平台,其特征在于,所述通信网络重连模块,还用于在所述主机隔离模块进行所述隔离处理后,利用所述集群***中未被隔离的每台主机内部当前能够正常工作的一个通信网段来重新搭建所述集群***中的环状通信网络,并将所述集群***的工作网络切换为该环状通信网络。
CN201610573169.5A 2016-07-19 2016-07-19 一种集群***的冗余网络管理方法及平台 Active CN105959172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610573169.5A CN105959172B (zh) 2016-07-19 2016-07-19 一种集群***的冗余网络管理方法及平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610573169.5A CN105959172B (zh) 2016-07-19 2016-07-19 一种集群***的冗余网络管理方法及平台

Publications (2)

Publication Number Publication Date
CN105959172A CN105959172A (zh) 2016-09-21
CN105959172B true CN105959172B (zh) 2019-01-18

Family

ID=56900408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610573169.5A Active CN105959172B (zh) 2016-07-19 2016-07-19 一种集群***的冗余网络管理方法及平台

Country Status (1)

Country Link
CN (1) CN105959172B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107360041A (zh) * 2017-08-18 2017-11-17 郑州云海信息技术有限公司 一种网络管理方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1658578A (zh) * 2005-04-05 2005-08-24 北京四方继保自动化股份有限公司 双网络通信***的不间断切换方法
CN101036330A (zh) * 2004-12-01 2007-09-12 思科技术公司 用于检测网络故障的***和方法
CN101079781A (zh) * 2007-02-01 2007-11-28 北京东土科技股份有限公司 一种工业以太网快速冗余的实现方法
CN101137974A (zh) * 2003-10-07 2008-03-05 思科技术公司 用于mpls快速重路由的增强切换
CN102394787A (zh) * 2011-12-14 2012-03-28 重庆邮电大学 基于epa交换机的双链路冗余控制方法
CN104660386A (zh) * 2015-03-03 2015-05-27 浪潮电子信息产业股份有限公司 一种基于安腾平台下提高db2容灾高可用性的方法
CN105681070A (zh) * 2014-11-21 2016-06-15 中芯国际集成电路制造(天津)有限公司 一种自动收集计算机集群节点信息并分析的方法及***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100389571C (zh) * 2005-03-25 2008-05-21 华为技术有限公司 检测混合网络中端到端节点间链路故障的方法
CN101577719B (zh) * 2009-06-09 2016-03-02 华为技术有限公司 一种双机热备方法、装置和***
CN102780635B (zh) * 2012-08-09 2015-09-09 华为技术有限公司 基于trill网络实现保护倒换的方法、tor交换机及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101137974A (zh) * 2003-10-07 2008-03-05 思科技术公司 用于mpls快速重路由的增强切换
CN101036330A (zh) * 2004-12-01 2007-09-12 思科技术公司 用于检测网络故障的***和方法
CN1658578A (zh) * 2005-04-05 2005-08-24 北京四方继保自动化股份有限公司 双网络通信***的不间断切换方法
CN101079781A (zh) * 2007-02-01 2007-11-28 北京东土科技股份有限公司 一种工业以太网快速冗余的实现方法
CN102394787A (zh) * 2011-12-14 2012-03-28 重庆邮电大学 基于epa交换机的双链路冗余控制方法
CN105681070A (zh) * 2014-11-21 2016-06-15 中芯国际集成电路制造(天津)有限公司 一种自动收集计算机集群节点信息并分析的方法及***
CN104660386A (zh) * 2015-03-03 2015-05-27 浪潮电子信息产业股份有限公司 一种基于安腾平台下提高db2容灾高可用性的方法

Also Published As

Publication number Publication date
CN105959172A (zh) 2016-09-21

Similar Documents

Publication Publication Date Title
US20200106662A1 (en) Systems and methods for managing network health
CN102624554B (zh) 一种结合了设备管理和业务管理的综合网络管理方法
CN106713056B (zh) 一种分布式集群下备机选举切换的方法
CN104317803B (zh) 数据库集群的数据存取***和方法
CN101013992A (zh) 一种以太网自动保护方法
CN103856357B (zh) 一种堆叠***故障处理方法及堆叠***
CN104468217B (zh) 一种1394网络管理者故障下的网络重建方法
CN105119820B (zh) 路由协议多实例并行执行***及其并行执行方法
CN105306272A (zh) 信息***故障场景信息收集方法及***
CN104283721A (zh) 双核心三层网络***架构
CN105207902A (zh) 一种基于sdn的主备虚拟网关的***及方法
WO2017177788A1 (zh) 业务自动变迁方法及装置
CN103441878B (zh) Vcf网络中pe设备的归属处理方法及设备
CN105915426A (zh) 环形网络的故障恢复方法及装置
CN106407045A (zh) 一种数据灾难恢复方法、***及服务器虚拟化***
CN104123183B (zh) 集群作业调度方法和装置
CN103414739B (zh) 采用自动漂移的云服务器自动监控***及方法
CN103338240B (zh) 监控自动漂移的云服务器自动监控***及方法
CN106789193A (zh) 一种集群投票仲裁方法及***
CN103490920A (zh) 电力光纤通信网络中的多重故障保护/恢复方法及***
CN103023815A (zh) 聚合链路负载分担方法及装置
CN105959172B (zh) 一种集群***的冗余网络管理方法及平台
CN103297279B (zh) 一种多软件进程***上软件控制的主备单盘倒换方法
CN107656847A (zh) 基于分布式集群的节点管理方法、***、装置及存储介质
CN102427411A (zh) 一种全网信令跟踪方法及***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant