CN109474694A - 一种基于san存储阵列的nas集群的管控方法及装置 - Google Patents

一种基于san存储阵列的nas集群的管控方法及装置 Download PDF

Info

Publication number
CN109474694A
CN109474694A CN201811474697.0A CN201811474697A CN109474694A CN 109474694 A CN109474694 A CN 109474694A CN 201811474697 A CN201811474697 A CN 201811474697A CN 109474694 A CN109474694 A CN 109474694A
Authority
CN
China
Prior art keywords
nas
node
nas node
business
exception
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811474697.0A
Other languages
English (en)
Inventor
戚勇
吕玉彬
李佩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811474697.0A priority Critical patent/CN109474694A/zh
Publication of CN109474694A publication Critical patent/CN109474694A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1008Server selection for load balancing based on parameters of servers, e.g. available memory or workload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1029Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1034Reaction to server failures by a load balancer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于SAN存储阵列的NAS集群的管控方法,SAN存储阵列连接有多个NAS节点,多个NAS节点组成NAS集群,NAS集群连接目标服务器以向目标服务器提供NAS业务和SAN业务,在NAS集群中出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了NAS节点向目标服务器提供的SAN业务和NAS业务不被中断。此外,本发明还公开了一种基于SAN存储阵列的NAS集群的管控装置,效果如上。

Description

一种基于SAN存储阵列的NAS集群的管控方法及装置
技术领域
本发明涉及存储领域,特别涉及一种基于SAN存储阵列的NAS集群的管控方法及装置。
背景技术
网络附属存储(Network Attached Storage,NAS),是一种连接在网络上具备资料存储功能的装置。它是一种专用数据存储服务器。它以数据为中心,将存储设备与服务器彻底分离,集中管理数据,从而释放带宽、提高性能。NAS包括存储器件,例如磁盘阵列、磁带驱动器或可移动的存储介质和内嵌***软件,可以提供跨平台文件共享功能。此外,NAS本身能够支持多种协议,如NFS协议、CIFS协议、FTP协议以及HTTP协议等,同时也能够支持各种操作***。
NAS能简化对存储区域网络(Storage Area Network and SAN Protocols,SAN)的访问,能够帮助SAN存储阵列提供的数据块以文件形式路由至适当的服务器中,与此同时,SAN能减轻非关键数据的大容量存储负担,使NAS更为有效的工作,重要文件则可以存储在本地的NAS存储设备上,一些非重要文件可以卸到SAN中。目前基于SAN存储阵列的NAS节点而言,NAS节点与SAN存储阵列之间是单路径连接,如此,当该NAS节点故障后,将会导致整个业务***瘫痪,无法继续为服务器提供SAN业务和NAS业务。
因此,在NAS节点出现故障后,如何保证NAS节点向服务器提供的SAN业务和NAS业务不被中断是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种基于SAN存储阵列的NAS集群的管控方法及装置,在NAS节点出现故障后,保证了NAS节点向服务器提供的SAN业务和NAS业务不被中断。
为实现上述目的,本发明实施例提供了如下技术方案:
第一,本发明实施例提供了一种基于SAN存储阵列的NAS集群的管控方法,应用于包含多个NAS节点的NAS集群,各所述NAS节点均与SAN存储阵列连接,包括:
实时监测所述NAS集群中各所述NAS节点的运行状态;
判断各所述NAS节点的运行状态是否均正常;
若否,则将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成所述异常NAS节点向目标服务器提供的NAS业务和SAN业务。
可选的,所述实时监测所述NAS集群中各所述NAS节点的运行状态包括:
获取各所述NAS节点的物理IP地址;
通过所述物理IP地址访问各所述NAS节点,以监测各个NAS节点的运行状态。
可选的,各所述NAS节点之间互相连接以对与各自连接的NAS节点的运行状态进行监测,对应的,所述实时监测所述NAS集群中各所述NAS节点的运行状态包括:
接收目标NAS节点发送的运行状态监测信号;
解析所述运行状态监测信号,以得到心跳IP地址和所述运行状态;
确定与所述心跳IP地址对应的NAS节点。
可选的,还包括:
监测各所述NAS节点的资源占有率;
当接收到所述目标服务器发送的业务请求时,将所述业务请求对应的业务分配至资源占有率最低的NAS节点。
可选的,所述将运行状态异常的异常NAS节点切换至运行正常的NAS节点包括:
将所述异常NAS节点切换至资源占有率最低的所述运行正常的NAS节点。
可选的,在所述将运行状态异常的异常NAS节点切换至运行正常的NAS节点之后,还包括:
控制所述异常NAS节点处于停机状态。
可选的,在所述控制所述异常NAS节点处于停机状态之后,还包括:
监测所述异常NAS节点处于所述停机状态的时间是否达到阈值;
若是,则重启所述异常NAS节点以使所述异常NAS节点处于运行状态,并执行以下步骤:
监测所述异常NAS节点是否恢复正常;
若未恢复正常,则执行所述控制所述异常NAS节点处于停机状态的步骤;
若恢复正常,则保持所述异常NAS节点处于所述运行状态。
可选的,在所述保持所述异常NAS节点处于所述运行状态之后,还包括:
监测所述异常NAS节点向所述目标服务器提供的所述NAS业务和所述SAN业务是否完成;
若未完成,则将所述NAS业务和所述SAN业务重新转移至恢复正常的异常NAS节点。
第二,本发明实施例提供了一种基于SAN存储阵列的NAS集群的管控装置,应用于包含多个NAS节点的NAS集群,各所述NAS节点均与SAN存储阵列连接,包括:
第一监测模块,用于实时监测所述NAS集群中各所述NAS节点的运行状态;
判断模块,用于判断各所述NAS节点的运行状态是否均正常;若否,则进入切换模块;
所述切换模块,用于将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成所述异常NAS节点向目标服务器提供的NAS业务和SAN业务。
可选的,所述第一监测模块包括:
获取单元,用于获取各所述NAS节点的物理IP地址;
监测单元,用于通过所述物理IP地址访问各所述NAS节点,以监测各个NAS节点的运行状态。
可选的,所述第一监测模块包括:
接收单元,用于接收目标NAS节点发送的运行状态监测信号;
解析单元,用于解析所述运行状态监测信号,以得到心跳IP地址和所述运行状态;
确定单元,用于确定与所述心跳IP地址对应的NAS节点。
可选的,还包括:
监测模块,用于监测各所述NAS节点的资源占有率;
分配单元,用于当接收到所述目标服务器发送的业务请求时,将所述业务请求对应的业务分配至资源占有率最低的NAS节点。
可选的,所述切换模块包括:
切换单元,用于将与所述故障信息对应的异常NAS节点切换至资源占有率最低的所述运行正常的NAS节点。
可选的,控制模块,用于控制所述异常NAS节点处于停机状态。
可选的,还包括:
第二监测模块,用于监测所述异常NAS节点处于所述停机状态的时间是否达到阈值;若是,则进入重启模块;
所述重启模块,用于重启所述异常NAS节点以使所述异常NAS节点处于运行状态;
第三监测模块,用于监测所述异常NAS节点是否恢复正常;若未恢复正常,则进入所述控制模块;若恢复正常,则保持所述异常NAS节点处于所述运行状态。
可选的,还包括:
第四监测模块,用于监测所述异常NAS节点向所述目标服务器提供的所述NAS业务和所述SAN业务是否完成;若未完成,则进入转移模块;
所述转移模块,用于将所述NAS业务和所述SAN业务重新转移至恢复正常的异常NAS节点。
第三,本发明实施例提供了另一种基于SAN存储阵列的NAS集群的管控装置,应用于包含多个NAS节点的NAS集群,各所述NAS节点均与SAN存储阵列连接,包括:
存储器,用于存储CTDB集群数据管控程序;
处理器,用于执行所述存储器中存储的计算机程序以实现以上任一种提到的基于SAN存储阵列的NAS集群的管控方法的步骤。
可见,本发明实施例公开的一种基于SAN存储阵列的NAS集群的管控方法,SAN存储阵列连接有多个NAS节点,多个NAS节点组成NAS集群,NAS集群连接目标服务器以向目标服务器提供NAS业务和SAN业务,在NAS集群中,实时监测各个NAS节点的运行状态,然后判断各个NAS节点的运行状态是否均正常,如果各个NAS节点中存在异常运行状态的异常NAS节点,则将异常NAS节点切换至运行正常的NAS节点,以完成与异常NAS节点向目标服务器提供的NAS业务和SAN业务。因此,采用本方案,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了NAS节点向目标服务器提供的SAN业务和NAS业务不被中断。此外,本发明实施例还公开了一种基于SAN存储阵列的NAS集群的管控装置,效果如上。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图;
图2为本发明第二种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图;
图3为本发明第三种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图;
图4为本发明第四种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图;
图5为本发明提供的一种基于SAN存储这里的NAS集群的管控装置结构示意图;
图6为本发明提供的另一种基于SAN存储这里的NAS集群的管控装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于SAN存储阵列的NAS集群的管控方法及装置,在NAS节点出现故障后,保证了对服务器提供SAN业务和NAS业务不被中断。
请参见图1,图1为本发明第一种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图,应用于包含多个NAS节点的NAS集群,各NAS节点均与SAN存储阵列连接,SAN存储阵列的存储介质可以选为SAS硬盘、NL-SAS硬盘以及SSD等,NAS节点与目标服务器之间支持CIFS网络协议、NFS网络协议、FTP网络协议和HTTP网络协议,以提供目标服务器(客户端)Windows、Linux所有主流操作***的兼容性支持,NAS节点基于Centos 7操作***以配置共享文件***,SAN存储阵列配置为FC-SAN存储阵列达到最大输出带宽大于等于1GB/s。该方法包括:
S11:实时监测NAS集群中各NAS节点的运行状态。
具体的,本实施例中,NAS集群中各个NAS节点均与SAN磁盘阵列连接,当目标服务器发送业务请求后,由NAS节点和SAN磁盘阵列为目标服务器提供的NAS业务和SAN业务。例如,业务请求为读取SAN存储阵列中存储的数据块时,通过NAS节点读取SAN存储阵列中存储的数据块,同时业务请求中包含存储目标服务器的数据块时,NAS节点可以通过自身的存储功能实现对目标服务器的数据库的存储。即对目标服务器提供NAS业务和SAN业务。NAS节点的运行状态包括NAS节点是否处于上电状态,NAS节点与SAN存储阵列的数据通讯是否正常等等。
其中,实时监测各NAS节点的运行状态可以分为以下两种情况:
第一种情况,可以通过安装有CTDB集群数据管理程序的服务器分别获取NAS节点的运行状态,即CTDB集群管理程序中存储有各个NAS节点的物理IP地址,在获取到各个NAS节点的物理IP地址后,通过该物理IP地址访问各个NAS节点,如果NAS节点处于掉电状态,则CTDB集群数据管理程序的服务器得到的反馈信息为NAS节点为掉电状态。
第二种情况,各个NAS节点之间可以互相进行状态监测,具体是将各个NAS节点互相连接,各个NAS节点间采用Active-Active工作模式,并在各个NAS节点之间设置心跳IP,以两个NAS节点为例,在两个NAS节点设置网络接口心跳IP地址,然后由两个NAS节点互相监管,并实时的将各自监测的NAS节点的运行状态监测信号发送至安装有CTDB集群数据管理程序的服务器或集群资源管理器Pacemaker,CTDB集群数据管理程序的服务器或集群资源管理器Pacemaker解析运行状态监测信号后,得到心跳IP地址和运行状态,并与原先定义存储的心跳IP地址相匹配,找到与该心跳IP地址对应的NAS节点,完成对NAS节点的监测。其中,CTDB集群数据管理程序的服务器或集群资源管理器Pacemaker配置心跳网络可以采用如下方法:
执行#vi/etc/ctdb/nodes,将NAS集群中所有NAS节点的心跳IP加入,例如两个NAS节点的心跳IP地址配置如下:
172.168.0.1
172.168.0.2
S12:判断各NAS节点的运行状态是否均正常,若否,则进入步骤S13。
S13:将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成异常NAS节点向目标服务器提供的NAS业务和SAN业务。
具体的,本实施例中,各个NAS节点之间可以互相备份,即在某一个NAS节点与目标服务器之间进行业务通讯时,该NAS节点与目标服务器之间进行业务通讯时的业务数据会实时备份至其余的NAS节点中,当该NAS节点出现故障时,可以快速切换至另外一个运行正常的NAS节点,保证与目标服务器之间进行业务通讯时不被中断。
目标服务器与NAS节点之间可以配置浮动IP地址以实现两者之间的业务通讯,配置的浮动IP可以存储于CTDB集群数据管理程序的服务器的配置文件中,配置浮动IP可以采用以下程序实现:
#vi/etc/ctdb/public_addresses,以两个NAS节点为例,配置的浮动IP的内容如下:
12.0.40.60/24bond1
12.0.40.61/24bond1
此外,在监测各个NAS节点的运行状态时,也可以实时监测各个NAS节点的资源占有率,在接收到目标服务器发送的业务请求时,可以将该业务请求分配至资源占有率最低的NAS节点,如此,提高各个NAS节点的使用效率。
对应的,当出现异常NAS节点时,可以将异常NAS节点切换至资源占有率最低的运行正常的NAS节点,即转移当前异常NAS节点所承载的业务至资源占有率最低的运行正常的NAS节点以完成剩余未完成的业务。
可见,本发明实施例公开的一种基于SAN存储阵列的NAS集群的管控方法,SAN存储阵列连接有多个NAS节点,多个NAS节点组成NAS集群,NAS集群连接目标服务器以向目标服务器提供NAS业务和SAN业务,在NAS集群中,实时监测各个NAS节点的运行状态,然后判断各个NAS节点的运行状态是否均正常,如果各个NAS节点中存在异常运行状态的异常NAS节点,则将异常NAS节点切换至运行正常的NAS节点,以完成与异常NAS节点向目标服务器提供的NAS业务和SAN业务。因此,采用本方案,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至另一个运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了对目标服务器提供SAN业务和NAS业务不被中断。
当存在异常NAS节点时,在将与故障信息对应的异常NAS节点切换至另一个运行正常的NAS节点之后,为了避免异常NAS节点造成额外资源的占用以及避免对其余运行正常的NAS节点造成影响,基于上述实施例,本发明提供了第二种实施例,请参见图2,图2为本发明第二种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图,包括:
S11:实时监测NAS集群中各NAS节点的运行状态。
S12:判断各NAS节点的运行状态是否均正常。
S13:将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成异常NAS节点向目标服务器提供的NAS业务和SAN业务。
S14:控制异常NAS节点处于停机状态。
本发明提供的第二种实施例,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至另一个运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了对目标服务器提供SAN业务和NAS业务不被中断,并将异常NAS节点控制在停机状态,避免了异常NAS节点造成额外资源的占用以及避免对其余运行正常的NAS节点造成影响。
在异常NAS节点停机后,由于NAS节点的自我恢复功能,在一定时间内,异常NAS节点可能会恢复正常,此时,为了避免该NAS节点被浪费以及被闲置。基于上述实施例,本发明提供了第三种实施例,请参见图3,图3为本发明第三种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图,包括:
S11:实时监测NAS集群中各NAS节点的运行状态。
S12:判断各NAS节点的运行状态是否均正常。
S13:将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成异常NAS节点向目标服务器提供的NAS业务和SAN业务。
S14:控制异常NAS节点处于停机状态。
S15:监测异常NAS节点处于停机状态的时间是否达到阈值,若是,则进入步骤S16。
S16:重启异常NAS节点以使异常NAS节点处于运行状态。
S17:监测异常NAS节点是否恢复正常,若恢复正常,则进入步骤S18,若未恢复正常,则进入步骤S14。
S18:保持异常NAS节点处于运行状态。
具体的,本实施例中,阈值可以根据NAS节点和SAN存储阵列的实际情况确定,本发明实施例对于阈值的大小在此并不作限定。
本发明提供的第三种实施例,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了对目标服务器提供SAN业务和NAS业务不被中断,并将异常NAS节点控制在停机状态,避免了异常NAS节点造成额外资源的占用以及避免对其余运行正常的NAS节点造成影响,避免该异常NAS节点在能恢复正常时被浪费以及被闲置。
在异常NAS节点恢复正常之后,此时异常NAS节点中存储有原先所承载的业务的业务数据,且此时恢复正常的NAS节点的资源占有率很低,此时,可以将该异常NAS承载的业务再转移回来以对实现对该异常NAS节点的高效利用。基于上述实施例,本发明提供了第四种实施例,请参见图4,图4为本发明第四种实施例公开的一种基于SAN存储阵列的NAS集群管控方法流程示意图,包括:
S11:实时监测NAS集群中各NAS节点的运行状态。
S12:判断各NAS节点的运行状态是否均正常。
S13:将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成异常NAS节点向目标服务器提供的NAS业务和SAN业务。
S14:控制异常NAS节点处于停机状态。
S15:监测异常NAS节点处于停机状态的时间是否达到阈值,若是,则进入步骤S16。
S16:重启异常NAS节点以使异常NAS节点处于运行状态。
S17:监测异常NAS节点是否恢复正常,若恢复正常,则进入步骤S18,若未恢复正常,则进入步骤S14。
S18:保持异常NAS节点处于运行状态。
S19:监测异常NAS节点向目标服务器提供的NAS业务和SAN业务是否完成,若未完成,则进入S20。
S20:将NAS业务和SAN业务重新转移至恢复正常的异常NAS节点。
本发明提供的第四种实施例,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了对目标服务器提供SAN业务和NAS业务不被中断,并将异常NAS节点控制在停机状态,避免了异常NAS节点造成额外资源的占用以及避免对其余运行正常的NAS节点造成影响,避免该异常NAS节点在能恢复正常时被浪费以及被闲置,此外,将该异常NAS承载的业务再转移至恢复正常的异常NAS节点,实现了对该异常NAS节点的高效利用。
下面对本发明实施例公开的一种基于SAN存储这里的NAS集群的管控装置进行介绍,请参见图5,图5为本发明提供的一种基于SAN存储这里的NAS集群的管控装置结构示意图,应用于包含多个NAS节点的NAS集群,各NAS节点均与SAN存储阵列连接,该装置包括:
第一监测模块501,用于实时监测NAS集群中各NAS节点的运行状态;
判断模块502,用于判断各NAS节点的运行状态是否均正常;若否,则进入切换模块。
切换模块503,用于将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成异常NAS节点向目标服务器提供的NAS业务和SAN业务。。
可见,本发明实施例公开的一种基于SAN存储阵列的NAS集群的管控装置,SAN存储阵列连接有多个NAS节点,多个NAS节点组成NAS集群,NAS集群连接目标服务器以向目标服务器提供NAS业务和SAN业务,在NAS集群中,实时监测各个NAS节点的运行状态,然后判断各个NAS节点的运行状态是否均正常,如果各个NAS节点中存在异常运行状态的异常NAS节点,则将异常NAS节点切换至运行正常的NAS节点,以完成与异常NAS节点向目标服务器提供的NAS业务和SAN业务。因此,采用本方案,在出现异常NAS节点时,异常NAS节点为目标服务器提供的NAS业务和SAN业务能转移至另一个运行正常的NAS节点,此时该运行正常的NAS节点能接管异常NAS节点继续为目标服务器提供NAS业务和SAN业务。保证了对目标服务器提供SAN业务和NAS业务不被中断。
基于以上实施例,作为可选的实施例,第一监测模块501包括:
获取单元,用于获取各NAS节点的物理IP地址;
监测单元,用于通过物理IP地址访问各NAS节点,以监测各个NAS节点的运行状态。
基于以上实施例,作为可选的实施例,第一监测模块501包括:
接收单元,用于接收目标NAS节点发送的运行状态监测信号;
解析单元,用于解析运行状态监测信号,以得到心跳IP地址和运行状态;
确定单元,用于确定与心跳IP地址对应的NAS节点。
基于以上实施例,作为可选的实施例,还包括:
监测模块,用于监测各NAS节点的资源占有率;
分配单元,用于当接收到目标服务器发送的业务请求时,将业务请求对应的业务分配至资源占有率最低的NAS节点。
基于以上实施例,作为可选的实施例,切换模块503包括:
切换单元,用于将与故障信息对应的异常NAS节点切换至资源占有率最低的运行正常的NAS节点。
基于以上实施例,作为可选的实施例,还包括:
控制模块,用于控制异常NAS节点处于停机状态。
基于以上实施例,作为可选的实施例,还包括:
第二监测模块,用于监测异常NAS节点处于停机状态的时间是否达到阈值;若是,则进入重启模块;
重启模块,用于重启异常NAS节点以使异常NAS节点处于运行状态;
第三监测模块,用于监测异常NAS节点是否恢复正常;若未恢复正常,则进入控制模块;若恢复正常,则保持异常NAS节点处于运行状态。
基于以上实施例,作为可选的实施例,还包括:
第四监测模块,用于监测异常NAS节点向目标服务器提供的NAS业务和SAN业务是否完成;若未完成,则进入转移模块;
转移模块,用于将NAS业务和SAN业务重新转移至恢复正常的异常NAS节点。
请参见图6,图6为本发明提供的另一种基于SAN存储这里的NAS集群的管控装置结构示意图,应用于包含多个NAS节点的NAS集群,各NAS节点均与SAN存储阵列连接,该装置包括:
存储器601,用于存储CTDB集群数据管控程序;
处理器602,用于执行存储器中存储的CTDB集群数据管控程序以实现如以上任意一个实施例提到的基于SAN存储阵列的NAS集群的管控方法的步骤。
本实施例提供的另一种基于SAN存储这里的NAS集群的管控装置,由于可以通过处理器调用存储器存储的计算机程序,实现如上述任一实施例提供的基于SAN存储阵列的NAS集群的管控方法的步骤,所以本管控装置具有同上述基于SAN存储阵列的NAS集群的管控方法同样的实际效果。
以上对本申请所提供的一种基于SAN存储阵列的NAS集群的管控方法及装置进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

Claims (10)

1.一种基于SAN存储阵列的NAS集群的管控方法,其特征在于,应用于包含多个NAS节点的NAS集群,各所述NAS节点均与SAN存储阵列连接,包括:
实时监测所述NAS集群中各所述NAS节点的运行状态;
判断各所述NAS节点的运行状态是否均正常;
若否,则将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成所述异常NAS节点向目标服务器提供的NAS业务和SAN业务。
2.根据权利要求1所述的基于SAN存储阵列的NAS集群的管控方法,其特征在于,所述实时监测所述NAS集群中各所述NAS节点的运行状态包括:
获取各所述NAS节点的物理IP地址;
通过所述物理IP地址访问各所述NAS节点,以监测各个NAS节点的运行状态。
3.根据权利要求1所述的基于SAN存储阵列的NAS集群的管控方法,其特征在于,各所述NAS节点之间互相连接以对与各自连接的NAS节点的运行状态进行监测,对应的,所述实时监测所述NAS集群中各所述NAS节点的运行状态包括:
接收目标NAS节点发送的运行状态监测信号;
解析所述运行状态监测信号,以得到心跳IP地址和所述运行状态;
确定与所述心跳IP地址对应的NAS节点。
4.根据权利要求1-3任意一项所述的基于SAN存储阵列的NAS集群的管控方法,其特征在于,还包括:
监测各所述NAS节点的资源占有率;
当接收到所述目标服务器发送的业务请求时,将所述业务请求对应的业务分配至资源占有率最低的NAS节点。
5.根据权利要求4所述的基于SAN存储阵列的NAS集群的管控方法,其特征在于,所述将运行状态异常的异常NAS节点切换至运行正常的NAS节点包括:
将所述异常NAS节点切换至资源占有率最低的所述运行正常的NAS节点。
6.根据权利要求1-3任意一项所述的基于SAN存储阵列的NAS集群的管控方法,其特征在于,在所述将运行状态异常的异常NAS节点切换至运行正常的NAS节点之后,还包括:
控制所述异常NAS节点处于停机状态。
7.根据权利要求6所述的基于SAN存储阵列的NAS集群的管控方法,在所述控制所述异常NAS节点处于停机状态之后,还包括:
监测所述异常NAS节点处于所述停机状态的时间是否达到阈值;
若是,则重启所述异常NAS节点以使所述异常NAS节点处于运行状态,并执行以下步骤:
监测所述异常NAS节点是否恢复正常;
若未恢复正常,则执行所述控制所述异常NAS节点处于停机状态的步骤;
若恢复正常,则保持所述异常NAS节点处于所述运行状态。
8.根据权利要求7所述的基于SAN存储阵列的NAS集群的管控方法,在所述保持所述异常NAS节点处于所述运行状态之后,还包括:
监测所述异常NAS节点向所述目标服务器提供的所述NAS业务和所述SAN业务是否完成;
若未完成,则将所述NAS业务和所述SAN业务重新转移至恢复正常的异常NAS节点。
9.一种基于SAN存储这里的NAS集群的管控装置,其特征在于,应用于包含多个NAS节点的NAS集群,各所述NAS节点均与SAN存储阵列连接,包括:
第一监测模块,用于实时监测所述NAS集群中各所述NAS节点的运行状态;
判断模块,用于判断各所述NAS节点的运行状态是否均正常;若否,则进入切换模块;
所述切换模块,用于将运行状态异常的异常NAS节点切换至运行正常的NAS节点,以完成所述异常NAS节点向目标服务器提供的NAS业务和SAN业务。
10.一种基于SAN存储这里的NAS集群的管控装置,其特征在于,包括:
存储器,用于存储CTDB集群数据管控程序;
处理器,用于执行所述存储器中存储的CTDB集群数据管控程序以实现如权利要求1至8任一项所述的基于SAN存储阵列的NAS集群的管控方法的步骤。
CN201811474697.0A 2018-12-04 2018-12-04 一种基于san存储阵列的nas集群的管控方法及装置 Pending CN109474694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811474697.0A CN109474694A (zh) 2018-12-04 2018-12-04 一种基于san存储阵列的nas集群的管控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811474697.0A CN109474694A (zh) 2018-12-04 2018-12-04 一种基于san存储阵列的nas集群的管控方法及装置

Publications (1)

Publication Number Publication Date
CN109474694A true CN109474694A (zh) 2019-03-15

Family

ID=65675555

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811474697.0A Pending CN109474694A (zh) 2018-12-04 2018-12-04 一种基于san存储阵列的nas集群的管控方法及装置

Country Status (1)

Country Link
CN (1) CN109474694A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212127A (zh) * 2019-12-29 2020-05-29 浪潮电子信息产业股份有限公司 一种存储集群及业务数据的维护方法、装置和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040088297A1 (en) * 2002-10-17 2004-05-06 Coates Joshua L. Distributed network attached storage system
CN105554074A (zh) * 2015-12-07 2016-05-04 上海爱数信息技术股份有限公司 一种基于rpc通信的nas资源监控***及监控方法
CN106656682A (zh) * 2017-02-27 2017-05-10 网宿科技股份有限公司 集群心跳检测方法、***及装置
CN108055333A (zh) * 2017-12-21 2018-05-18 创新科存储技术(深圳)有限公司 一种基于ufs的nas-cifs集群负载均衡方法
CN108923992A (zh) * 2018-08-23 2018-11-30 郑州云海信息技术有限公司 一种nas集群高可用方法、***及电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040088297A1 (en) * 2002-10-17 2004-05-06 Coates Joshua L. Distributed network attached storage system
CN105554074A (zh) * 2015-12-07 2016-05-04 上海爱数信息技术股份有限公司 一种基于rpc通信的nas资源监控***及监控方法
CN106656682A (zh) * 2017-02-27 2017-05-10 网宿科技股份有限公司 集群心跳检测方法、***及装置
CN108055333A (zh) * 2017-12-21 2018-05-18 创新科存储技术(深圳)有限公司 一种基于ufs的nas-cifs集群负载均衡方法
CN108923992A (zh) * 2018-08-23 2018-11-30 郑州云海信息技术有限公司 一种nas集群高可用方法、***及电子设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李小平编著: "《多媒体技术》", 30 November 2015 *
***: "《云计算及其应用》", 30 April 2018 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212127A (zh) * 2019-12-29 2020-05-29 浪潮电子信息产业股份有限公司 一种存储集群及业务数据的维护方法、装置和存储介质

Similar Documents

Publication Publication Date Title
Bailis et al. The network is reliable: An informal survey of real-world communications failures
US10609159B2 (en) Providing higher workload resiliency in clustered systems based on health heuristics
US9785691B2 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
US6986076B1 (en) Proactive method for ensuring availability in a clustered system
US9450700B1 (en) Efficient network fleet monitoring
CN102868754B (zh) 一种实现集群存储高可用性的方法、节点装置和***
CN110830283B (zh) 故障检测方法、装置、设备和***
CN106487486B (zh) 业务处理方法和数据中心***
JP2005209201A (ja) 高可用性クラスタにおけるノード管理
EP1874003A1 (en) High availability software based contact centre
CN102394914A (zh) 集群脑裂处理方法和装置
WO2021184587A1 (zh) 基于Prometheus的私有云监控方法、装置、计算机设备及存储介质
WO2012097588A1 (zh) 数据存储方法、设备和***
CN109391691A (zh) 一种单节点故障下nas服务的恢复方法及相关装置
CN111935244B (zh) 一种业务请求处理***及超融合一体机
CN112948128A (zh) Target端的选择方法、***及计算机可读介质
US11461123B1 (en) Dynamic pre-copy and post-copy determination for live migration between cloud regions and edge locations
CN108512753B (zh) 一种集群文件***中消息传输的方法及装置
CN111045602A (zh) 集群***控制方法及集群***
CN112887367B (zh) 实现分布式集群高可用的方法、***及计算机可读介质
CN109474694A (zh) 一种基于san存储阵列的nas集群的管控方法及装置
US11734038B1 (en) Multiple simultaneous volume attachments for live migration between cloud regions and edge locations
US11573839B1 (en) Dynamic scheduling for live migration between cloud regions and edge locations
CN113765690A (zh) 集群切换方法、***、装置、终端、服务器及存储介质
CN114553900B (zh) 一种分布式块存储管理***、方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190315