CN111158608B - 硬盘故障处理方法、装置及分布式*** - Google Patents

硬盘故障处理方法、装置及分布式*** Download PDF

Info

Publication number
CN111158608B
CN111158608B CN201911419846.8A CN201911419846A CN111158608B CN 111158608 B CN111158608 B CN 111158608B CN 201911419846 A CN201911419846 A CN 201911419846A CN 111158608 B CN111158608 B CN 111158608B
Authority
CN
China
Prior art keywords
hard disk
fault
target
storage node
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911419846.8A
Other languages
English (en)
Other versions
CN111158608A (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yunhe Enmo Beijing Information Technology Co ltd
Original Assignee
Yunhe Enmo Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yunhe Enmo Beijing Information Technology Co ltd filed Critical Yunhe Enmo Beijing Information Technology Co ltd
Priority to CN201911419846.8A priority Critical patent/CN111158608B/zh
Publication of CN111158608A publication Critical patent/CN111158608A/zh
Application granted granted Critical
Publication of CN111158608B publication Critical patent/CN111158608B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种硬盘故障处理方法、装置及分布式***。其中,该方法包括:在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在所述人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在所述更换指令的触发下,展示所述存储节点上的可用硬盘列表;响应于用户的选择指令,从所述可用硬盘列表中选择目标硬盘,并使能所述目标硬盘,其中,所述目标硬盘用于替代所述存储节点中硬盘状态为故障的硬盘。本发明解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。

Description

硬盘故障处理方法、装置及分布式***
技术领域
本发明涉及硬盘修复领域,具体而言,涉及一种硬盘故障处理方法、装置及分布式***。
背景技术
现有技术中在发现故障盘时,往往通过人工的方式删除或修复故障盘,存在操作步骤过多,替换繁琐的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种硬盘故障处理方法、装置及分布式***,以至少解决由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。
根据本发明实施例的一个方面,提供了一种硬盘故障处理方法,包括:在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
可选地,接收用户输入的更换指令,包括:检测人机交互界面中指定控件的触发指令;在检测到触发指令时,基于触发指令生成更换指令。
可选地,展示存储节点上的可用硬盘列表,包括:获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。
可选地,使能目标硬盘,包括:将目标硬盘对应的指示信息发送至分布式存储***中的计算节点,该指示信息用于指示目标硬盘已经被使能。
可选地,将目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,方法还包括:计算节点向目标硬盘发送查询请求;并接收依据查询请求查询得到的目标硬盘的卷标信息;为卷标信息对应的磁盘分配路径配置信息。
可选地,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。
可选地,目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,方法还包括:计算节点确定目标硬盘的属性信息;计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。
根据本发明实施例的另一方面,还提供了一种硬盘故障处理装置,包括:第一展示模块,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;接收模块,用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;第二展示模块,用于在更换指令的触发下,展示存储节点上的可用硬盘列表;使能模块,用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
根据本发明实施例的另一方面,还提供了一种分布式***,其特征在于,包括:存储节点、计算节点和管理服务器,其中,存储节点用于存储数据;计算节点,用于从存储节点中调取数据;管理服务器,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上所述的硬盘故障处理方法。
在本发明实施例中,采用在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘的方式,通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本申请实施例的一种硬盘故障处理方法的流程示意图;
图2是根据本申请实施例的一种硬盘故障处理装置的结构示意图;
图3是根据本申请实施例的一种分布式***的框架示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种硬盘故障处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的硬盘故障处理方法,如图1所示,该方法包括如下步骤:
步骤S102,在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;
步骤S104,在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;
步骤S106,在更换指令的触发下,展示存储节点上的可用硬盘列表;
步骤S108,响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
上述的硬盘故障处理方法中,首先,在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态,其次,在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘,然后,在更换指令的触发下,展示存储节点上的可用硬盘列表,最后,响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。该处理方法通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。
需要说明的是,人机交互界面中可以展示分布式存储***每个节点中所有硬盘的状态,还可以展示硬盘标识和硬盘标识对应的硬盘状态。
为了更加方便地更换故障盘,使更换故障盘的操作更加简单,本申请的一些实施例中,可以提供一键切换的功能,例如:检测人机交互界面中指定控件的触发指令;在检测到触发指令时,基于触发指令生成更换指令。具体地,在检测到指定控件被首次触发时,生成更换指令;在检测到在预定时间段内(例如3s内)再次被点击时,则取消更换。
本申请一种可选的实施例中,展示存储节点上的可用硬盘列表,包括:获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。这两种类型的硬盘都可以用来替换存在故障的硬盘,更有利于用户进行多种选择,也充分利用了硬盘资源。
备用硬盘和基于负载状态确定的第二候选硬盘,都可以用来替换存在故障的硬盘,需要说明的是,在具体地应用中,两种候选硬盘可以结合使用,其中,备用硬盘为***中预先设置的备份硬盘。
本申请的一些实施例中,使能目标硬盘,包括:将目标硬盘对应的指示信息发送至分布式存储***中的计算节点,该指示信息用于指示目标硬盘已经被使能。
本申请一种可选的实施例中,目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,计算节点向目标硬盘发送查询请求;并接收依据查询请求查询得到的目标硬盘的卷标信息;为卷标信息对应的磁盘分配路径配置信息。
本申请的一些实施例中,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。
为了进一步保证在使用候选硬盘更换故障硬盘后,***可以平稳、良好地运行,本申请的一种可选的实施例中,将目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,计算节点确定目标硬盘的属性信息;计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。
需要说明的是,目标硬盘的属性信息包括硬盘的存储容量、支持的访问速度等。
本申请的实施例中,还提供了一种硬盘故障处理装置,该处理装置可以执行本申请的故障处理方法,如图2所示,该硬盘故障处理装置包括:
第一展示模块20,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;
第一接收模块22,用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;
第二展示模块24,用于在更换指令的触发下,展示存储节点上的可用硬盘列表;
使能模块26,用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
上述的硬盘故障处理装置中,首先,第一展示模块用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态,其次,第一接收模块用于在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘,然后,第二展示模块用于在更换指令的触发下,展示存储节点上的可用硬盘列表,最后,使能模块用于响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。该处理装置通过人工交互界面收发指令的方式,达到了更换故障盘的目的,从而实现了自动删除或修复故障盘的技术效果,进而解决了由于硬盘出现故障时,删除或修复故障盘造成的操作步骤过多,替换繁琐的技术问题。
需要说明的是,人机交互界面中可以展示分布式存储***每个节点中所有硬盘的状态,还可以展示硬盘标识和硬盘标识对应的硬盘状态。
为了更加方便地更换故障盘,使更换故障盘的操作更加简单,本申请的一些实施例中,第一接收模块包括检测子模块和生成子模块,检测子模块用于检测人机交互界面中指定控件的触发指令;生成子模块用于在检测到触发指令时,基于触发指令生成更换指令。具体地,在检测到指定控件被首次触发时,生成更换指令;在检测到在预定时间段内(例如3s内)再次被点击时,则取消更换。
本申请一种可选的实施例中,第二展示模块包括获取子模块、确定子模块和展示子模块,获取子模块用于获取存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;确定子模块用于获取存储节点中已用硬盘的负载状态,基于已用硬盘的负载状态确定第二候选硬盘;展示子模块用于将第一候选硬盘和第二候选硬盘存储至可用硬盘列表,并展示可用硬盘列表。这两种类型的硬盘都可以用来替换存在故障的硬盘,更有利于用户进行多种选择,也充分利用了硬盘资源。
备用硬盘和基于负载状态确定的第二候选硬盘,都可以用来替换存在故障的硬盘,需要说明的是,在具体地应用中,两种候选硬盘可以结合使用,其中,备用硬盘为***中预先设置的备份硬盘。
本申请的一些实施例中,使能模块包括发送子模块,发送子模块用于将目标硬盘对应的指示信息发送至分布式存储***中的计算节点,该指示信息用于指示目标硬盘已经被使能。
本申请一种可选的实施例中,该装置还包括发送模块、第二接受模块、分配模块,发送子模块将目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,发送模块用于计算节点向目标硬盘发送查询请求;第二接受模块用于接收依据查询请求查询得到的目标硬盘的卷标信息;分配模块用于为卷标信息对应的磁盘分配路径配置信息。
本申请的一些实施例中,路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。
为了进一步保证在使用候选硬盘更换故障硬盘后,***可以平稳、良好地运行,本申请的一种可选的实施例中,该装置还包括确定模块和调整模块,发送子模块将目标硬盘对应的指示信息发送至分布式存储***中的计算节点之后,确定模块用于计算节点确定目标硬盘的属性信息;调整模块用于计算节点确定计算节点基于属性信息调整计算节点的数据同步速率。
需要说明的是,目标硬盘的属性信息包括硬盘的存储容量、支持的访问速度等。
本申请的实施例中,还提供了一种分布式***,如图3所示,该分布式***包括:存储节点、计算节点和管理服务器。
存储节点30,用于存储数据;
计算节点32,用于从存储节点中调取数据;
管理服务器34,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在更换指令的触发下,展示存储节点上的可用硬盘列表;响应于用户的选择指令,从可用硬盘列表中选择目标硬盘,并使能目标硬盘,其中,目标硬盘用于替代存储节点中硬盘状态为故障的硬盘。
具体地,存储节点包括元数据存储模块(MDS):元数据存储模块使用etcd分布式键值对存储***,它用于存放服务器的配置信息。etcd是一个开源的、分布式的键值对数据存储***,提供共享配置、服务的注册和发现。由多个节点相互通信构成整体对外服务,每个节点都存储节点完整的数据,包括软件相关和硬件相关数据。etcd数据存储***通过Raft协议保证每个节点维护的数据是一致的;数据上报模块(HMS):数据上报模块的agent运行在每台需被采集数据的服务器上,它支持Linux及Windows 等操作***。数据上报模块接收硬件扫描模块发现的数据,并将数据存放在数据存储模块(MDS)。数据上报模块只能看见自己提交的数据,无法看见其他节点的数据。HMS 采集的硬件数据包括硬盘的信息,如温度,寿命(ssd专属参数),坏块数量,预损坏信息。HMS同时采集硬盘的性能数据,如IOPS,MBPS,IO延迟,磁盘负载。通过结合软硬件信息,可综合得出硬盘的状态,为一键换盘提供数据支撑。
具体地,计算节点包括自动化操作模块(AOM):自动化操作模块运行在数据库一体机的计算节点,它用于主动发现存储节点替换后新分配的卷。当新的卷被替换后,处于计算节点的AOM模块可以通过接口自动查询到存放在元数据存储模块(MDS)里的卷的变更信息。当通过对比发现卷是新增的,AOM模块自动对这些卷设置多路径配置文件,发现新的多路径设备;存储数据重平衡模块(DRM):新盘更换后,存储自动化将新盘加入存储池,数据重新平衡至新增的盘。数据重新平衡可通过参数控制数据同步数据,既可加速同步进度,以保证数据安全,也可降低速度,减少数据同步对现有业务的负面影响。
具体地,管理服务器包括WEB操作模块(WebM):通过WEB操作直接更换硬盘。当出现故障盘后,在WEB里会出现对于硬盘损坏的状态提示,同时在右侧出现换盘的按钮。维护人员点击一键换盘,根据向导,选择更换后的磁盘,后台自动进行相关操作。此操作整体简化了故障盘处理,降低了运维成本。
本申请的实施例中,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,在程序运行时控制非易失性存储介质所在设备执行以上所述的硬盘故障处理方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种硬盘故障处理方法,其特征在于,包括:
在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;
在所述人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;
在所述更换指令的触发下,展示所述存储节点上的可用硬盘列表;
响应于用户的选择指令,从所述可用硬盘列表中选择目标硬盘,并使能所述目标硬盘,其中,所述目标硬盘用于替代所述存储节点中硬盘状态为故障的硬盘;
其中,展示所述存储节点上的可用硬盘列表,包括:获取所述存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取所述存储节点中已用硬盘的负载状态,基于所述已用硬盘的负载状态确定第二候选硬盘;将所述第一候选硬盘和所述第二候选硬盘存储至所述可用硬盘列表,并展示所述可用硬盘列表。
2.根据权利要求1所述的方法,其特征在于,接收用户输入的更换指令,包括:
检测所述人机交互界面中指定控件的触发指令;
在检测到所述触发指令时,基于所述触发指令生成所述更换指令。
3.根据权利要求1所述的方法,其特征在于,使能所述目标硬盘,包括:
将所述目标硬盘对应的指示信息发送至所述分布式存储***中的计算节点,该指示信息用于指示所述目标硬盘已经被使能。
4.根据权利要求3所述的方法,其特征在于,将所述目标硬盘对应的指示信息发送至所述分布式存储***中的计算节点之后,所述方法还包括:
所述计算节点向所述目标硬盘发送查询请求;并接收依据查询请求查询得到的所述目标硬盘的卷标信息;为所述卷标信息对应的磁盘分配路径配置信息。
5.根据权利要求4所述的方法,其特征在于,所述路径配置信息包括:为每个卷标信息对应的磁盘分配至少两个访问路径。
6.根据权利要求3所述的方法,其特征在于,将所述目标硬盘对应的指示信息发送至所述分布式存储***中的计算节点之后,所述方法还包括:
所述计算节点确定所述目标硬盘的属性信息;
所述计算节点确定所述计算节点基于所述属性信息调整所述计算节点的数据同步速率。
7.一种硬盘故障处理装置,其特征在于,包括:
第一展示模块,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;
第一接收模块,用于在所述人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;
第二展示模块,用于在所述更换指令的触发下,展示所述存储节点上的可用硬盘列表;
使能模块,用于响应于用户的选择指令,从所述可用硬盘列表中选择目标硬盘,并使能所述目标硬盘,其中,所述目标硬盘用于替代所述存储节点中硬盘状态为故障的硬盘;
其中,展示所述存储节点上的可用硬盘列表,包括:获取所述存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取所述存储节点中已用硬盘的负载状态,基于所述已用硬盘的负载状态确定第二候选硬盘;将所述第一候选硬盘和所述第二候选硬盘存储至所述可用硬盘列表,并展示所述可用硬盘列表。
8.一种分布式***,其特征在于,包括:存储节点、计算节点和管理服务器,其中,所述存储节点用于存储数据;
计算节点,用于从所述存储节点中调取数据;
所述管理服务器,用于在人机交互界面中展示分布式存储***中存储节点的硬盘工作状态,该硬盘工作状态包括:故障状态和正常状态;在所述人机交互界面中存在硬盘工作状态为故障的硬盘的情况下,接收用户输入的更换指令,该更换指令用于替换硬盘状态为故障的硬盘;在所述更换指令的触发下,展示所述存储节点上的可用硬盘列表;响应于用户的选择指令,从所述可用硬盘列表中选择目标硬盘,并使能所述目标硬盘,其中,所述目标硬盘用于替代所述存储节点中硬盘状态为故障的硬盘;
其中,展示所述存储节点上的可用硬盘列表,包括:获取所述存储节点中的备用硬盘标识,将备用硬盘标识对应的硬盘作为第一候选硬盘;获取所述存储节点中已用硬盘的负载状态,基于所述已用硬盘的负载状态确定第二候选硬盘;将所述第一候选硬盘和所述第二候选硬盘存储至所述可用硬盘列表,并展示所述可用硬盘列表。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至6中任意一项所述的硬盘故障处理方法。
CN201911419846.8A 2019-12-31 2019-12-31 硬盘故障处理方法、装置及分布式*** Active CN111158608B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911419846.8A CN111158608B (zh) 2019-12-31 2019-12-31 硬盘故障处理方法、装置及分布式***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911419846.8A CN111158608B (zh) 2019-12-31 2019-12-31 硬盘故障处理方法、装置及分布式***

Publications (2)

Publication Number Publication Date
CN111158608A CN111158608A (zh) 2020-05-15
CN111158608B true CN111158608B (zh) 2021-11-23

Family

ID=70560462

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911419846.8A Active CN111158608B (zh) 2019-12-31 2019-12-31 硬盘故障处理方法、装置及分布式***

Country Status (1)

Country Link
CN (1) CN111158608B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111625189B (zh) * 2020-05-19 2023-07-28 华云数据控股集团有限公司 一种数据重平衡状态的检测方法、装置、设备及介质
CN112732494B (zh) * 2020-12-29 2024-02-13 北京浪潮数据技术有限公司 一种存储***的坏盘更换方法、装置、设备及介质
CN113824584A (zh) * 2021-07-19 2021-12-21 上海瀚银信息技术有限公司 网络设备管理方法及装置
CN114035994B (zh) * 2021-11-17 2022-06-07 北京极光星通科技有限公司 数据存储***、故障处理方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488547A (zh) * 2013-09-24 2014-01-01 浪潮电子信息产业股份有限公司 一种raid组故障硬盘快速重建的方法
CN107346210A (zh) * 2016-05-06 2017-11-14 阿里巴巴集团控股有限公司 硬盘数据擦除方法、服务器及***
CN107357689A (zh) * 2017-08-02 2017-11-17 郑州云海信息技术有限公司 一种存储节点的故障处理方法及分布式存储***
CN107526651A (zh) * 2016-06-21 2017-12-29 深圳中电长城信息安全***有限公司 一种磁盘阵列备份的方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488547A (zh) * 2013-09-24 2014-01-01 浪潮电子信息产业股份有限公司 一种raid组故障硬盘快速重建的方法
CN107346210A (zh) * 2016-05-06 2017-11-14 阿里巴巴集团控股有限公司 硬盘数据擦除方法、服务器及***
CN107526651A (zh) * 2016-06-21 2017-12-29 深圳中电长城信息安全***有限公司 一种磁盘阵列备份的方法和***
CN107357689A (zh) * 2017-08-02 2017-11-17 郑州云海信息技术有限公司 一种存储节点的故障处理方法及分布式存储***

Also Published As

Publication number Publication date
CN111158608A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN111158608B (zh) 硬盘故障处理方法、装置及分布式***
JP4345313B2 (ja) ポリシーに基づいたストレージシステムの運用管理方法
CN106844510B (zh) 一种分布式数据库集群的数据迁移方法和装置
US7609654B2 (en) Method of evaluating network connectivity between network resources
US9348724B2 (en) Method and apparatus for maintaining a workload service level on a converged platform
US9965200B1 (en) Storage path management host view
US20120005609A1 (en) Management system and management system control method
US9201740B2 (en) Computer system, cluster management method, and management computer
US8380951B1 (en) Dynamically updating backup configuration information for a storage cluster
US10225158B1 (en) Policy based system management
WO2012120634A1 (ja) 管理計算機、ストレージシステム管理方法、及び、ストレージシステム
JP6190468B2 (ja) 管理システム、プラン生成方法、およびプラン生成プログラム
CN105335256B (zh) 在整机柜服务器中切换备份磁盘的方法、装置和***
US8520533B1 (en) Storage path management bus view
US7870045B2 (en) Computer system for central management of asset information
US9021078B2 (en) Management method and management system
CN105354102B (zh) 一种文件***维护和修复的方法和装置
CN114064374A (zh) 一种基于分布式块存储的故障检测方法和***
WO2017220013A1 (zh) 业务处理方法及装置、存储介质
CN102959523B (zh) 管理计算机***的管理***及管理方法
US7281165B2 (en) System and method for performing product tests utilizing a single storage device
CN111309515A (zh) 一种容灾控制方法、装置及***
JP2013025742A (ja) 分散ファイル管理装置、分散ファイル管理方法及びプログラム
JP3974150B2 (ja) 資産情報の一元管理を行うコンピュータシステム
JP6259547B2 (ja) 管理システム、及び、管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant