CN103684918A - 链路故障检测方法和装置 - Google Patents

链路故障检测方法和装置 Download PDF

Info

Publication number
CN103684918A
CN103684918A CN201310690351.5A CN201310690351A CN103684918A CN 103684918 A CN103684918 A CN 103684918A CN 201310690351 A CN201310690351 A CN 201310690351A CN 103684918 A CN103684918 A CN 103684918A
Authority
CN
China
Prior art keywords
port
controller
wwpn
address
memory device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310690351.5A
Other languages
English (en)
Inventor
张琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310690351.5A priority Critical patent/CN103684918A/zh
Publication of CN103684918A publication Critical patent/CN103684918A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供一种链路故障检测方法和装置。其中,方法包括:检测装置收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。本发明实施例提供的链路故障检测方法和装置,可以克服现有技术的FC链路检测不全面,导致FC网络可靠性低的问题。

Description

链路故障检测方法和装置
技术领域
本发明实施例涉及通信技术,尤其涉及一种链路故障检测方法和装置。
背景技术
光纤通道(Fiber Channel,简称:FC)协议主要应用于存储领域,是服务器扩展存储的一种主要方式。FC网络具体可区分为存储区域网络(Storage Area Network,简称:SAN)和直接附加存储(Direct AttachedStorage,简称:DAS)。其中,SAN是一种通过光纤集线器、光纤路由器、光纤交换机等连接设备将磁盘阵列、磁带等存储设备与相关服务器连接起来的高速专用子网。在DAS组网方式中,存储设备通过电缆直接到服务器,I/O(输入/输出)请求直接发送到存储设备。无论哪种组网,FC的整个链路都包含多个网络节点,例如主机总线适配器(Host Bus Adapter,简称:HBA)、交换机(Switch)、磁盘阵列等。链路上的任何一个节点故障,都会导致整个FC链路故障。
基于可靠性的考虑,FC存储通常采用冗余组网,在主机和逻辑存储设备之间有多条路径可以选择。当某条路径故障时,通过上层多路径软件自动检测故障并进行链路切换,避免业务受损。
但是,现有技术一般是基于某个节点的单点检测:例如在主机侧检测HBA卡端口的状态,link状态、link速率、光模块状态等;在交换机检测***温度、电压、光模块状态、端口变化等;在存储阵列侧检测端口状态、光模块等。即,现有的技术是在***中的各个节点单独进行的,每个节点只能进行最基本的检测,对于一些更加复杂的错误,比如光纤没有连接/光纤连接错误、对端设备不在位或者异常等故障无法进行检测,因此FC网络的可靠性仍然较低。
发明内容
本发明实施例提供一种链路故障检测方法和装置,以克服现有技术的FC链路检测不全面,导致FC网络可靠性低的问题。
第一方面,本发明实施例提供一种链路故障检测方法,包括:
检测装置收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
在第一方面的第一种可能的实现方式中,所述检测装置收集光纤信道网络中至少两个节点的互相对应的状态信息,包括:
所述检测装置通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
在第一方面的第二种可能的实现方式中,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称wwpn地址。
根据第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
所述检测装置将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
所述检测装置判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
根据第一方面的第三种可能的实现方式,在第四种可能的实现方式中,在所述检测装置确定所述HBA与所述Switch之间存在故障之后,还包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,所述检测装置确定所述故障的类型为所述故障的类型为误连接。
根据第一方面的第三种可能的实现方式,在第五种可能的实现方式中,在所述检测装置确定所述存储设备的控制器与所述Switch之间存在故障之后,还包括:
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则所述检测装置确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
根据第一方面的第二种可能的实现方式,在第六种可能的实现方式中,所述节点包括:主机总线适配器HBA和存储设备;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
根据第一方面的第六种可能的实现方式,在第七种可能的实现方式中,在所述检测装置确定所述HBA与所述存储设备的控制器之间存在故障之后,还包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,所述检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
根据第一方面的第二种可能的实现方式,在第八种可能的实现方式中,所述节点包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
第二方面,本发明实施例提供一种链路故障检测装置,包括:
收集模块,用于收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;
确定模块,用于将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
在第二方面的第一种可能的实现方式中,所述收集模块具体用于:
通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
在第二方面的第二种可能的实现方式中,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称wwpn地址。
根据第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备;
所述确定模块具体用于:
将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
根据第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述确定模块还用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,确定所述故障的类型为所述故障的类型为误连接。
根据第二方面的第三种可能的实现方式,在第五种可能的实现方式中,所述确定模块还用于:
当确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
根据第二方面的第二种可能的实现方式,在第六种可能的实现方式中,所述节点包括:主机总线适配器HBA和存储设备;
所述确定模块具体用于:
将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
根据第二方面的第六种可能的实现方式,在第七种可能的实现方式中,所述确定模块还用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
根据第二方面的第二种可能的实现方式,在第八种可能的实现方式中,所述节点包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
所述确定模块具体用于:
将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
本发明实施例提供的链路故障检测方法和装置,通过统一收集整个链路中各端口的状态信息,并通过将至少两个所述节点的互相对应的端口的状态信息进行比较,检查所述比较结果是否符合预期,从而判断是否存在故障,相比与现有技术的检测方法,能够检测更为复杂和隐蔽的故障,从而提高FC网络的可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为一种典型的SAN网络的结构示意图;
图2为一种典型的DAS网络的结构示意图;
图3为本发明链路故障检测方法实施例的流程图;
图4为本发明链路故障检测装置实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为一种典型的SAN网络的结构示意图,如图1所示,SAN网络中包括HBA、交换机和磁盘阵列,其中磁盘阵列包括控制器Controller和存储器。图1所示的SAN组网中,主用链路是第一交换机(例如Slot7FC Switch)一端连接磁盘阵列的第一控制器(Controller A),另一端连接HBA的零号端口(port0端口),备份链路是第二交换机(例如Slot8FC Switch)的一端连接磁盘阵列的第二控制器(Controller B),另一端连接HBA的一号端口(port1端口)。如果Slot8FC Switch与Controller B之间的光纤线没有连接或者损坏。一旦主用链路发生故障,备份链路也是不可用的,此时上层的业务将中断。
图2为一种典型的DAS网络的结构示意图,如图2所示,FC网络中包括HBA和磁盘阵列,一种常见的连接方式为:所有HBA的零号端口(port0)连接磁盘阵列的第一控制器Controller A;所有HBA卡一号端口(port1)端口连接磁盘阵列的第二控制器Controller B,当某个HBA的port1出现故障,端口不能连接,上层的业务将中断。
图3为本发明链路故障检测方法实施例的流程图,本实施例的方法可以应用于如图1和图2所示的FC网络,也可以应用于其他FC网络。本实施例中,检测装置可以为网管软件进程。如图3所示,本实施例的方法可以包括:
步骤301、检测装置收集光纤信道网络中至少两个节点的互相对应的端口的状态信息。
其中,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称(World Wide Port Name,简称:wwpn)地址。状态信息也可以包括其他参数,例如链路两端的端口速率是否一致,是否能够从一个端口正确获取对端的WWPN号等,本发明实施例对此不做限定。
进一步地,在具体实现时,可以设置为,检测装置通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
相比于现有技术的检测方法,本实施例中,统一收集端口的状态信息:而不是各个节点单独进行。
步骤302、所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
具体地,检测装置可以校验FC组网中所有端口的状态信息是否符合预期,如果检测到实际结果不符合预期则可以确定存在故障,可以上报告警。
具体实现时,可以将HBA卡的wwpn地址与Switch上对应端口已连接设备的地址进行比较,如果对应端口没有查询到wwpn地址说明HBA卡与Switch之间链路异常,如果wwpn地址错误说明存在误连接;
也可以将存储设备控制器的wwpn地址与Switch上对应端口已连接设备的地址进行比较,如果对应端口没有查询到wwpn地址说明存储设备与Switch之间链路异常,如果wwpn地址错误说明存储设备与Switch之间没有连接光纤。
并且,交换机上连接不同设备的端口的端口类型应该不同,因此,通过判断端口类型也可以确定是否存在配置错误或者连接错误的情况。
本实施例,通过统一收集整个链路中各端口的状态信息,并通过将至少两个所述节点的互相对应的端口的状态信息进行比较,检查所述比较结果是否符合预期,从而判断是否存在故障,相比与现有技术的检测方法,能够检测更为复杂和隐蔽的故障,从而提高FC网络的可靠性。
可选地,在一种场景中,当上述实施例的方法应用于SAN网络时,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备,步骤302具体为:
所述检测装置将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
所述检测装置将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
所述检测装置判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
进一步可选地,若所述检测装置确定所述HBA与所述Switch之间存在故障,则步骤302之后,还可以包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,所述检测装置确定所述故障的类型为所述故障的类型为误连接。
进一步可选地,若所述检测装置确定所述存储设备的控制器与所述Switch之间存在故障,则步骤302之后,还可以包括:
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则所述检测装置确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
以图1所示SAN网络的主链路为例,步骤302具体可以为:所述检测装置将所述HBA的port0端口的wwpn地址与Slot7FC Switch上对应端口已连接设备的地址进行比较,若所述HBA的port0端口的wwpn地址与Slot7FCSwitch上对应端口已连接设备的地址不一致,则确定所述HBA与Slot7FCSwitch之间存在故障;和\或,所述检测装置将所述磁盘阵列的Controller A的端口的wwpn地址与Slot7FC Switch上对应端口已连接设备的地址进行比较,若所述磁盘阵列的Controller A的端口的wwpn地址与Slot7FC Switch上对应端口已连接设备的地址不一致,则确定所述磁盘阵列的控制器与Controller A之间存在故障;和\或,所述检测装置判断Controller A上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
对于备链路的检测与上述对主链路的检测类似,只要将相应的设备及端口替换为备链路中的设备及端口即可。若对备链路检测结果为:可以在Slot8FC Switch上查询到所有连接的HAB的port1端口的wwpn地址,但在连接磁阵的端口却查询不到磁阵控制器Controller B的wwpn地址,则可以确定备份链路存在误连接或连接异常,此时可以产生告警,提示用户排查备份链路的状态。
可选地,在另一种场景中,当上述实施例的方法应用于DSA网络时,所述节点包括:主机总线适配器HBA和存储设备;
步骤302具体为:
所述检测装置将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
进一步地,若所述检测装置确定所述HBA与所述存储设备的控制器之间存在故障,则步骤302之后,还可以包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,所述检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
以图2所示的DAS网络的主链路为例,步骤302具体可以为:
所述检测装置将HBA的port0端口的wwpn地址与磁盘阵列的ControllerA的wwpn地址进行比较,若所述HBA的port0端口的wwpn地址与所述磁盘阵列的Controller A的wwpn地址不一致,则可以确定所述HBA与所述存储设备的控制器之间存在故障。
在本发明链路故障检测方法的另一种应用场景为,所述节点包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
步骤302可以包括:
所述检测装置将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
例如针对图1或图2的FC网络,都可以比较Controller A和Controller B的对应端口的wwpn地址,如果两个对应端口的wwpn地址不一致,则可以确定所述存储设备的连接存在故障。例如,若检测到Controller A在某个端口有连接设备的wwpn地址,而在Controller B上对应的端口没有发现该连接设备的wwpn地址,则可以确定存储设备的连接存在故障,此时可以产生告警,提示用户排查故障。
图4为本发明链路故障检测装置实施例的结构示意图,如图4所示,本实施例的装置400可以包括:收集模块11和确定模块12,其中,
收集模块11,可以用于收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;
确定模块12,可以用于将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
本实施例的装置,可以用于执行图3所示方法实施例的技术方案,其实现原理类似,此处不再赘述。
本实施例的链路故障检测装置实施例,通过统一收集整个链路中各端口的状态信息,并通过将至少两个所述节点的互相对应的端口的状态信息进行比较,检查所述比较结果是否符合预期,从而判断是否存在故障,相比与现有技术的检测方法,能够检测更为复杂和隐蔽的故障,从而提高FC网络的可靠性。
进一步可选地,所述收集模块11具体可以用于:
通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
进一步可选地,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称wwpn地址。
进一步可选地,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备;
所述确定模块12具体可以用于:
将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
进一步可选地,所述确定模块12还可以用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,确定所述故障的类型为所述故障的类型为误连接。
进一步可选地,所述确定模块12还可以用于:
当确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
进一步可选地,所述节点可以包括:主机总线适配器HBA和存储设备;
所述确定模块12具体可以用于:
将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
进一步可选地,所述确定模块12还可以用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
进一步可选地,所述节点可以包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
所述确定模块12具体可以用于:
将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (18)

1.一种链路故障检测方法,其特征在于,包括:
检测装置收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
2.根据权利要求1所述的方法,其特征在于,所述检测装置收集光纤信道网络中至少两个节点的互相对应的状态信息,包括:
所述检测装置通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
3.根据权利要求1所述的方法,其特征在于,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称wwpn地址。
4.根据权利要求3所述的方法,其特征在于,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
所述检测装置将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
所述检测装置判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
5.根据权利要求4所述的方法,其特征在于,在所述检测装置确定所述HBA与所述Switch之间存在故障之后,还包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,所述检测装置确定所述故障的类型为所述故障的类型为误连接。
6.根据权利要求4所述的方法,其特征在于,在所述检测装置确定所述存储设备的控制器与所述Switch之间存在故障之后,还包括:
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,所述检测装置确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当所述检测装置确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则所述检测装置确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
7.根据权利要求3所述的方法,其特征在于,所述节点包括:主机总线适配器HBA和存储设备;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
8.根据权利要求7所述的方法,其特征在于,在所述检测装置确定所述HBA与所述存储设备的控制器之间存在故障之后,还包括:
当所述检测装置确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当所述检测装置确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,所述检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
9.根据权利要求3所述的方法,其特征在于,所述节点包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
所述检测装置将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障,包括:
所述检测装置将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
10.一种链路故障检测装置,其特征在于,包括:
收集模块,用于收集光纤信道网络中至少两个节点的互相对应的端口的状态信息;
确定模块,用于将至少两个所述节点的互相对应的端口的状态信息进行比较,根据比较结果确定是否存在故障。
11.根据权利要求10所述的装置,其特征在于,所述收集模块具体用于:
通过同一接口收集光纤信道网络中所有节点的所有端口的状态信息。
12.根据权利要求10所述的装置,其特征在于,所述端口的状态信息包括以下至少一个:端口类型、连接状态、工作模式、自协商结果和全球端口名称wwpn地址。
13.根据权利要求12所述的装置,其特征在于,所述节点包括:主机总线适配器HBA、交换机Switch和存储设备;
所述确定模块具体用于:
将所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址进行比较,若所述HBA的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述HBA卡与所述Switch之间存在故障;或者
将所述存储设备的控制器的端口的wwpn地址与Switch上对应端口已连接设备的地址进行比较,若所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址不一致,则确定所述存储设备的控制器与所述Switch之间存在故障;或者
判断所述Switch上连接不同设备的端口的端口类型是否相同,若相同,则确定所述Switch的连接或配置存在故障。
14.根据权利要求13所述的装置,其特征在于,所述确定模块还用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述Switch上对应端口的wwpn均不为空,且所述两个wwpn地址不一致时,确定所述故障的类型为所述故障的类型为误连接。
15.根据权利要求13所述的装置,其特征在于,所述确定模块还用于:
当确定所述存储设备的控制器的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,确定所述存储设备与所述Switch之间的故障的类型为链路异常;或者
当确定所述存储设备的控制器的端口的wwpn地址与所述Switch上对应端口已连接设备的地址均不为空,且所述两个wwpn地址不一致时,则确定所述存储设备的控制器与所述Switch之间的故障的类型为所述存储设备的控制器与所述Switch之间未连接光纤。
16.根据权利要求12所述的装置,其特征在于,所述节点包括:主机总线适配器HBA和存储设备;
所述确定模块具体用于:
将HBA的端口的wwpn地址与存储设备的控制器的wwpn地址进行比较,若所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址不一致,则确定所述HBA与所述存储设备的控制器之间存在故障。
17.根据权利要求16所述的装置,其特征在于,所述确定模块还用于:
当确定所述HBA的端口的wwpn地址不为空,而所述Switch上对应端口的wwpn地址为空时,则检测装置确定所述HBA与所述存储设备的控制器之间的故障的类型为链路异常;或者
当确定所述HBA的端口的wwpn地址与所述存储设备的控制器的wwpn地址均不为空且所述两个wwpn地址不一致时,确定所述HBA与所述存储设备的控制器之间的故障的类型为误连接。
18.根据权利要求12所述的装置,其特征在于,所述节点包括:存储设备的第一控制器和第二控制器,所述第一控制器和第二控制器分别与主机总线适配器HBA连接,构成第一链路和第二链路,或分别与交换机Switch连接,构成第一链路和第二链路,所述第一控制器和第二控制器的链路互为备份;
所述确定模块具体用于:
将所述第一链路对应的所述第一控制器的端口的wwpn地址与所述第二链路对应的所述第二控制器的端口的wwpn地址进行比较,若所述两个wwpn地址不一致,则确定所述存储设备的连接存在故障。
CN201310690351.5A 2013-12-16 2013-12-16 链路故障检测方法和装置 Pending CN103684918A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310690351.5A CN103684918A (zh) 2013-12-16 2013-12-16 链路故障检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310690351.5A CN103684918A (zh) 2013-12-16 2013-12-16 链路故障检测方法和装置

Publications (1)

Publication Number Publication Date
CN103684918A true CN103684918A (zh) 2014-03-26

Family

ID=50321297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310690351.5A Pending CN103684918A (zh) 2013-12-16 2013-12-16 链路故障检测方法和装置

Country Status (1)

Country Link
CN (1) CN103684918A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105915385A (zh) * 2016-05-31 2016-08-31 深圳市双赢伟业科技股份有限公司 一种交换机端口状态提醒方法及装置
CN106452880A (zh) * 2016-10-19 2017-02-22 深圳市深信服电子科技有限公司 网络接线检测方法及装置
WO2017193966A1 (zh) * 2016-05-13 2017-11-16 华为技术有限公司 一种存储***中业务的链路切换方法和存储设备
CN107547240A (zh) * 2017-05-11 2018-01-05 新华三云计算技术有限公司 一种链路检测方法和装置
CN109428744A (zh) * 2017-08-23 2019-03-05 华为技术有限公司 网络检查方法及装置、存储介质
CN110138446A (zh) * 2019-05-09 2019-08-16 中国航空工业集团公司西安航空计算技术研究所 一种双余度光纤通道网络余度降级故障的检测方法
CN112463487A (zh) * 2020-11-25 2021-03-09 苏州浪潮智能科技有限公司 一种全闪存阵列的连接错误检测方法、***及相关组件

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1902578A (zh) * 2004-01-21 2007-01-24 国际商业机器公司 用于控制对逻辑单元的访问的方法和设备
CN101577585A (zh) * 2009-06-05 2009-11-11 中兴通讯股份有限公司 自动交换光网络中故障确定方法与装置
CN101729408A (zh) * 2009-11-23 2010-06-09 福建星网锐捷网络有限公司 一种判定接口网络类型的方法及路由设备
CN101753207A (zh) * 2008-12-16 2010-06-23 华为技术有限公司 光纤链路故障识别方法、装置及***
CN102457403A (zh) * 2010-10-15 2012-05-16 无锡江南计算技术研究所 一种网络连接的故障检测方法及装置
CN102742184A (zh) * 2011-12-07 2012-10-17 华为技术有限公司 光纤链路检测方法、光线路终端和无源光网络***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1902578A (zh) * 2004-01-21 2007-01-24 国际商业机器公司 用于控制对逻辑单元的访问的方法和设备
CN101753207A (zh) * 2008-12-16 2010-06-23 华为技术有限公司 光纤链路故障识别方法、装置及***
CN101577585A (zh) * 2009-06-05 2009-11-11 中兴通讯股份有限公司 自动交换光网络中故障确定方法与装置
CN101729408A (zh) * 2009-11-23 2010-06-09 福建星网锐捷网络有限公司 一种判定接口网络类型的方法及路由设备
CN102457403A (zh) * 2010-10-15 2012-05-16 无锡江南计算技术研究所 一种网络连接的故障检测方法及装置
CN102742184A (zh) * 2011-12-07 2012-10-17 华为技术有限公司 光纤链路检测方法、光线路终端和无源光网络***

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017193966A1 (zh) * 2016-05-13 2017-11-16 华为技术有限公司 一种存储***中业务的链路切换方法和存储设备
US10764119B2 (en) 2016-05-13 2020-09-01 Huawei Technologies Co., Ltd. Link handover method for service in storage system, and storage device
CN105915385A (zh) * 2016-05-31 2016-08-31 深圳市双赢伟业科技股份有限公司 一种交换机端口状态提醒方法及装置
CN106452880A (zh) * 2016-10-19 2017-02-22 深圳市深信服电子科技有限公司 网络接线检测方法及装置
CN106452880B (zh) * 2016-10-19 2020-04-14 深信服科技股份有限公司 网络接线检测方法及装置
CN107547240A (zh) * 2017-05-11 2018-01-05 新华三云计算技术有限公司 一种链路检测方法和装置
CN109428744A (zh) * 2017-08-23 2019-03-05 华为技术有限公司 网络检查方法及装置、存储介质
CN110138446A (zh) * 2019-05-09 2019-08-16 中国航空工业集团公司西安航空计算技术研究所 一种双余度光纤通道网络余度降级故障的检测方法
CN110138446B (zh) * 2019-05-09 2022-02-11 中国航空工业集团公司西安航空计算技术研究所 一种双余度光纤通道网络余度降级故障的检测方法
CN112463487A (zh) * 2020-11-25 2021-03-09 苏州浪潮智能科技有限公司 一种全闪存阵列的连接错误检测方法、***及相关组件

Similar Documents

Publication Publication Date Title
CN103684918A (zh) 链路故障检测方法和装置
US7533292B2 (en) Management method for spare disk drives in a raid system
CN103401726A (zh) 网络路径探测方法及装置、***
CN101651559A (zh) 一种存储服务在双控制器存储***中故障切换的方法
US9286178B2 (en) Controller, storage apparatus, method of testing storage apparatus, and computer-readable storage medium
US9208039B2 (en) System and method for detecting server removal from a cluster to enable fast failover of storage
CN109120522B (zh) 一种多路径状态监测方法及装置
CN112332914B (zh) 一种存储网络中光纤链路故障监控方法及***
CN110677292A (zh) 一种光口速率配置方法及装置
CN103001998A (zh) 一种fc-san存储***及提高光纤通道稳定性的方法
US8417849B2 (en) Apparatus and method to adjust a multi-path device reservation
CN109117342A (zh) 一种服务器及其硬盘健康状态监测***
US20090228610A1 (en) Storage system, storage apparatus, and control method for storage system
CN110096112B (zh) 硬盘装置、硬盘转接装置、网络设备与硬盘的连接方法
US8019217B2 (en) Storage system and optical module switching method for storage system
US20160197994A1 (en) Storage array confirmation of use of a path
CN111988169B (zh) 一种云平台异常磁盘清理修复的方法、***、设备及介质
CN103761202B (zh) 一种数据存储节点硬盘盘位识别方法及***
CN102495815B (zh) I/o数据访问中断的处理方法和***以及设备
CN107294759A (zh) 服务器***及数据存取方法
CN103150127A (zh) 一种存储多路径的访问***及其配置和访问方法
CN105119765A (zh) 一种智能处理故障体系架构
TW201324171A (zh) SAS Expander設備的PHY切換方法及系統
CN116909494A (zh) 服务器的存储切换方法和装置,以及服务器***
US9747154B2 (en) Isolating hardware and network failures in a computing environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140326