CN109120522B - 一种多路径状态监测方法及装置 - Google Patents

一种多路径状态监测方法及装置 Download PDF

Info

Publication number
CN109120522B
CN109120522B CN201810953868.1A CN201810953868A CN109120522B CN 109120522 B CN109120522 B CN 109120522B CN 201810953868 A CN201810953868 A CN 201810953868A CN 109120522 B CN109120522 B CN 109120522B
Authority
CN
China
Prior art keywords
storage
judging
port
path
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810953868.1A
Other languages
English (en)
Other versions
CN109120522A (zh
Inventor
黄远超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810953868.1A priority Critical patent/CN109120522B/zh
Publication of CN109120522A publication Critical patent/CN109120522A/zh
Application granted granted Critical
Publication of CN109120522B publication Critical patent/CN109120522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种多路径状态监测方法,包括以下步骤:通过周期查询多路径输出信息判断路径故障;根据存储类型分类执行路径故障诊断判断流程;发送链路故障点至监控端。本发明还公开了一种多路径状态监测装置,本发明可以自动进行多路径状态扫描,实现对多类型存储的多路径状态的统一监测,不需要考虑存储类型的区别,从而实现了简单、方便的对多型号存储的链路状态进行监测、诊断。

Description

一种多路径状态监测方法及装置
技术领域
本发明涉及计算机存储技术领域,尤其是存储基于Linux***下的多路径功能,以及存储到主机链路异常的故障诊断的功能实现。
背景技术
随着云计算、大数据等新型技术的发展,人们对存储服务器的使用越来越多,同一个数据中心机房一般都会涉及多种不同型号的存储服务器,而每台存储服务器到主机端的一般都具有多条链路,这就涉及到多路径冗余的概念。多路径冗余I/O(Multipath I/O)是指服务器通过多条物理路径连接到存储设备。其主要作用就是当主机HBA卡、线缆、交换机或者存储设备的RAID控制器故障等原因造成一条物理路径失效时,服务器可以将通过此物理路径的I/O转移到其他正常的物理路径上面,应用程序不会觉察到这种改变,从而提高***的可用性。对于管理员来说没有物理硬件报警时,多路径故障切换不容易在主机端被管理员察觉,如果不及时修复故障进而可能导致更严重后果。
发明内容
本发明的目的是提供一种多路径状态监测方法及装置,该方法具有自动扫描多路径状态,链路故障初步诊断,链路故障报警的特点。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种多路径状态监测方法,包括以下步骤:
通过周期查询多路径输出信息判断路径故障;
根据存储类型分类执行路径故障诊断判断流程;
发送链路故障点至监控端。
结合第一方面,在第一方面第一种可能的实现方式中,所述通过周期查询多路径输出信息判断路径故障步骤之前,还包括:
设定周期查询的间隔时间和执行权限。
结合第一方面,在第一方面第二种可能的实现方式中,所述通过周期查询多路径输出信息判断路径故障,包括:
周期查询多路径输出信息,在检测到多路径状态信息中某条路径的状态中存在faulty关键字时就会判定该路径发生故障。
结合第一方面,在第一方面第三种可能的实现方式中,所述根据存储类型分类执行故障诊断判断流程,包括:
判断存储类型为IP存储,分别测试存储业务口、存储管理口和交换机管理口通信是否正常,判断链路故障点;
判断存储类型为FC存储,分别测试存储光口、存储管理口和光纤交换机管理口通信是否正常,判断链路故障点。
结合第一方面,在第一方面第四种可能的实现方式中,所述根据存储类型分类执行故障诊断判断流程,还包括:查找***内是否含有IP存储连接设备信息,如果是,则判断该存储类型为IP存储,否则,判断该存储为FC存储。
结合第一方面,在第一方面第五种可能的实现方式中,所述判断存储类型为IP存储,分别测试存储业务口、存储管理口和交换机管理口通信是否正常,包括:
在主机***下通过“ping+存储业务口IP地址”测试存储业务口,如果能ping通对端IP地址,则判定该链路正常,如果无法ping通,判定该链路发生故障;通过“ping+存储管理口IP地址”测试存储管理口通信是否正常,通过“ping+交换机管理口IP地址”测试交换机管理口通信是否正常。
结合第一方面,在第一方面第六种可能的实现方式中,所述判断存储类型为FC存储,分别测试存储光口、存储管理口和光纤交换机管理口通信是否正常,包括:
在主机***下通过“fcping+存储光口wwn地址”命令检测主机到存储光口通信是否正常,如果能通说明该链路正常,如果不通说明该链路故障;通过“ping+存储管理口IP地址”和“ping+光纤交换机管理口IP地址”判断存储管理口和光纤交换机管理口通信通信是否正常。
本发明第二方面提供了一种多路径状态监测装置,包括:
查询设置模块,设定周期查询的间隔时间和执行权限;
路径故障判断模块,通过周期查询多路径输出信息判断路径故障;
故障点诊断模块,根据存储类型分类执行路径故障诊断判断流程;
故障发送模块,发送链路故障点至监控端。
本发明第二方面的所述多路径状态监测装置能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明提出一种基于Linux操作***的多路径状态监测的方法,本发明可以自动进行多路径状态扫描,实现对多类型存储的多路径状态的统一监测,不需要考虑存储类型的区别,从而实现了简单、方便的对多型号存储的链路状态进行监测、诊断。并对产生的链路故障进行初步诊断,同时对链路故障进行报警,对管理员及时处理故障启动很好的辅助作用。该发明易用性高,对物理设备和操作***都没有兼容性问题。
附图说明
图1是本发明方法实施例一流程图;
图2是本发明方法实施例二流程图;
图3是本发明装置实施例结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
实施例一
如图1所示,一种多路径状态监测方法,包括以下步骤:
S1、通过周期查询多路径输出信息判断路径故障;
S2、根据存储类型分类执行路径故障诊断判断流程;
S3、发送链路故障点至监控端。
实施例二
如图2所示,一种多路径状态监测方法,包括以下步骤:
S1、设定周期查询的间隔时间和执行权限。
S2、周期查询多路径输出信息,在检测到多路径状态信息中某条路径的状态中存在faulty关键字时就会判定该路径发生故障。
S3、判断存储类型为IP存储,分别测试存储业务口、存储管理口和交换机管理口通信是否正常,判断链路故障点。
S4、判断存储类型为FC存储,分别测试存储光口、存储管理口和光纤交换机管理口通信是否正常,判断链路故障点。
S5、发送链路故障点至监控端。
实施例三
一种多路径状态监测方法,包括以下步骤:
S1、安装multipath多路径软件,将脚本拷贝到Linux***下目录中,使用chmod+x对脚本添加可执行权限。
S2、通过Linux***下的Crontab命令,编写指定时间或者间隔的指令,让***按照定时计划自动执行该脚本程序。
S3、程序自动按照定时计划不停的对multipath的状态进行监控,当脚本检测到多路径状态信息中某条路径的状态中faulty关键字时就会判定路径发生故障,然后才会往下执行故障诊断流程。
S4、当脚本程序发现多路径发送故障时,首先在Linux***下通过iscsiadm命令查找***内是否有IP存储的链接信息,如果能找到IP存储连接设备的信息,就判断该存储类型是IP存储,否则判定存储为FC存储,然后再进入相应的故障诊断流程。
S5、如果是IP存储,会在主机***下通过“ping+存储业务口IP地址”的方法测试,如果能ping通对端IP地址判定该设备正常,如果ping不通判定该设备发生故障。使用同样的方法测试存储管理口、交换机管理口通信是否正常,进而判断可能发生链路故障的故障点。
S6、如果是FC存储,首先会在主机***下通过“fcping+存储光口wwn地址”命令检测主机到存储光口通信是否正常,如果能通说明该链路正常,如果不通说明该链路故障。然后会通过“ping+存储管理口IP地址”和“ping+光纤交换机管理口IP地址”通信是否正常,进而判断可能发生链路的故障点。
S7、当诊断流程结束后,会将诊断结果已警报的方式在屏幕输出,同时以邮件的方式发送给管理员。待管理员确认故障后,重新进入检测流程。
Ping是Windows、Unix和Linux***下的一个命令。ping也属于一个通信协议,是TCP/IP协议的一部分。利用“ping+ip地址”命令可以检查以太网口网络是否连通,可以很好地帮助我们分析和判定网络故障。
fcping类似于以太网的ping命令,由于光口没有IP地址,只有唯一的wwn地址,所以可以使用“fcping+wwn地址”命令检测主机到指定光纤端口的链路通信状态,并且可以得到链路延时信息。
本发明使用if和grep语句对多路径状态关键字进行查找并进行分类处理,可以很好的应对不同类型的存储服务器。该发明易用性上也较高,只用将脚本程序拷贝到主机任意目录下,使用命令chmod添加脚本可执行权限,然后配置crontab定时执行任务即可。
如图3所示,一种多路径状态监测装置,包括:
查询设置模块101,设定周期查询的间隔时间和执行权限;
路径故障判断模块102,通过周期查询多路径输出信息判断路径故障;
故障点诊断模块103,根据存储类型分类执行路径故障诊断判断流程;
故障发送模块104,发送链路故障点至监控端。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (1)

1.一种多路径状态监测方法,其特征是,包括以下步骤:
设定周期查询的间隔时间和执行权限;
通过周期查询多路径输出信息判断路径故障;
所述通过周期查询多路径输出信息判断路径故障,包括:
周期查询多路径输出信息,在检测到多路径状态信息中某条路径的状态中存在faulty关键字时就会判定该路径发生故障;
根据存储类型分类执行路径故障诊断判断流程;
所述根据存储类型分类执行故障诊断判断流程,包括:
判断存储类型为IP存储,分别测试存储业务口、存储管理口和交换机管理口通信是否正常,判断链路故障点;
判断存储类型为FC存储,分别测试存储光口、存储管理口和光纤交换机管理口通信是否正常,判断链路故障点;
查找***内是否含有IP存储连接设备信息,如果是,则判断该存储类型为IP存储,否则,判断该存储为FC存储;
所述判断存储类型为IP存储,分别测试存储业务口、存储管理口和交换机管理口通信是否正常,包括:
在主机***下通过“ping+存储业务口IP地址”测试存储业务口,如果能ping通对端IP地址,则判定该链路正常,如果无法ping通,判定该链路发生故障;通过“ping+存储管理口IP地址”测试存储管理口通信是否正常,通过“ping+交换机管理口IP地址”测试交换机管理口通信是否正常;
所述判断存储类型为FC存储,分别测试存储光口、存储管理口和光纤交换机管理口通信是否正常,包括:
在主机***下通过“fcping+存储光口wwn地址”命令检测主机到存储光口通信是否正常,如果能通说明该链路正常,如果不通说明该链路故障;通过“ping+存储管理口IP地址”和“ping+光纤交换机管理口IP地址”判断存储管理口和光纤交换机管理口通信通信是否正常;
发送链路故障点至监控端。
CN201810953868.1A 2018-08-21 2018-08-21 一种多路径状态监测方法及装置 Active CN109120522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810953868.1A CN109120522B (zh) 2018-08-21 2018-08-21 一种多路径状态监测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810953868.1A CN109120522B (zh) 2018-08-21 2018-08-21 一种多路径状态监测方法及装置

Publications (2)

Publication Number Publication Date
CN109120522A CN109120522A (zh) 2019-01-01
CN109120522B true CN109120522B (zh) 2021-07-27

Family

ID=64853293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810953868.1A Active CN109120522B (zh) 2018-08-21 2018-08-21 一种多路径状态监测方法及装置

Country Status (1)

Country Link
CN (1) CN109120522B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109982450B (zh) * 2019-02-19 2020-09-29 生迪智慧科技有限公司 通信链路修复方法、装置、协调器及***
CN110071843B (zh) * 2019-05-08 2021-11-26 浪潮云信息技术股份公司 一种基于流路径分析的故障定位方法及装置
CN110362445A (zh) * 2019-05-28 2019-10-22 平安普惠企业管理有限公司 一种基于用户行为的监控信息反馈方法及信息反馈***
CN111901399B (zh) * 2020-07-08 2022-12-09 苏州浪潮智能科技有限公司 云平台块设备异常审计方法、装置、设备及存储介质
CN113886291B (zh) * 2021-08-29 2023-08-18 苏州浪潮智能科技有限公司 一种路径的禁用方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105630715A (zh) * 2015-12-18 2016-06-01 国云科技股份有限公司 一种基于Multipath的存储预警方法
US9509555B2 (en) * 2013-12-13 2016-11-29 International Business Machines Corporation Multipath fiber channel over ethernet networks
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂***及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9509555B2 (en) * 2013-12-13 2016-11-29 International Business Machines Corporation Multipath fiber channel over ethernet networks
CN105630715A (zh) * 2015-12-18 2016-06-01 国云科技股份有限公司 一种基于Multipath的存储预警方法
CN107147528A (zh) * 2017-05-23 2017-09-08 郑州云海信息技术有限公司 一种存储网关智能防脑裂***及方法

Also Published As

Publication number Publication date
CN109120522A (zh) 2019-01-01

Similar Documents

Publication Publication Date Title
CN109120522B (zh) 一种多路径状态监测方法及装置
US8204980B1 (en) Storage array network path impact analysis server for path selection in a host-based I/O multi-path system
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
US6742059B1 (en) Primary and secondary management commands for a peripheral connected to multiple agents
EP2951963B1 (en) Failover in response to failure of a port
WO2021027481A1 (zh) 故障处理方法、装置、计算机设备、存储介质及存储***
US8250202B2 (en) Distributed notification and action mechanism for mirroring-related events
JP2018533788A (ja) 自動スイッチオーバーの実装
US20080058961A1 (en) Methods and arrangements to collect data
JP2001249856A (ja) ストレージ・エリア・ネットワーク(san)内でのエラー処理方法及びデータ処理システム
US20240048468A1 (en) Traffic monitoring method and apparatus for open stack tenant network
US20040073648A1 (en) Network calculator system and management device
US20160197994A1 (en) Storage array confirmation of use of a path
US20050268043A1 (en) Reconfiguring logical settings in a storage system
CN114035997A (zh) 一种基于mgr的高可用故障切换方法
CN109117317A (zh) 一种集群故障恢复方法和相关装置
CN111404780B (zh) 一种远程直接存储器访问网络集群的功能测试方法和装置
US7925728B2 (en) Facilitating detection of hardware service actions
US5517616A (en) Multi-processor computer system with system monitoring by each processor and exchange of system status information between individual processors
CN109885420B (zh) 一种PCIe链路故障的分析方法、BMC及存储介质
CN111817892B (zh) 一种网络管理方法、***、电子设备及存储介质
CN113688017B (zh) 多节点BeeGFS文件***自动化异常测试方法及装置
US11805039B1 (en) Method and apparatus for detecting degraded network performance
US12032432B1 (en) Identifying host bus adapater faults
CN114048057A (zh) 超融合***的测试方法及装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant