CN106708646A - 硬盘异常自动复位方法及其装置 - Google Patents

硬盘异常自动复位方法及其装置 Download PDF

Info

Publication number
CN106708646A
CN106708646A CN201611200471.2A CN201611200471A CN106708646A CN 106708646 A CN106708646 A CN 106708646A CN 201611200471 A CN201611200471 A CN 201611200471A CN 106708646 A CN106708646 A CN 106708646A
Authority
CN
China
Prior art keywords
hard disk
abnormal
reset
module
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611200471.2A
Other languages
English (en)
Inventor
孙磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201611200471.2A priority Critical patent/CN106708646A/zh
Publication of CN106708646A publication Critical patent/CN106708646A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明属于硬盘性能检测领域,公开了一种硬盘异常自动复位方法,包括磁盘阵列***检测到异常硬盘;通过磁盘阵列柜的机箱管理体系定位出异常硬盘;对异常硬盘进行复位;验证复位后的硬盘。本发明还公开了一种硬盘异常自动复位装置,包括:检测模块,用于检测异常硬盘;触发模块,用于对异常硬盘进行定位;复位模块,用于对异常硬盘进行复位;验证模块,用于验证复位后的硬盘。本发明能够实现自动对硬盘的复位,使得假死状态的硬盘能够以毫秒级时间重新上线,及时在***中恢复硬盘的使用,从而避免硬盘被误剔除,有效保证***工作的稳定性,降低硬盘应用的风险。

Description

硬盘异常自动复位方法及其装置
技术领域
本发明属于硬盘性能检测领域,尤其涉及一种硬盘异常自动复位方法及其装置。
背景技术
硬盘作为电脑主要的存储核心部件之一,其可靠性至关重要;但是目前的***设计中,关于硬盘的关注度主要集中在软件方面,比如硬盘修改、raid、数据克隆等等,而对于硬盘本身的可靠性问题关注度不高。
据统计数字显示,在被存储厂家换下来的硬盘中,有60%的硬盘属于无异常、可使用的硬盘,只不过在***因为一次的某种原因硬盘无响应夯住,使硬盘处于“假死”状态,导致***误以为硬盘损坏而剔除硬盘,使硬盘被迫下线退回至存储厂家,但这时候硬盘其实是没有损坏的、可使用的,只要重新对硬盘进行一次插拔作业,硬盘又会重新上线;硬盘“假死”故障属于不定时现象,没有规则性,有时候一天出现一次,有时候长时间不出现一次,影响***的正常运行,增加维修成本,因此,对于本技术领域成员而言,如何在***运行过程中解决硬盘的假死故障为亟需解决的技术问题。
发明内容
本发明提供一种硬盘异常自动复位方法及其装置,当硬盘无响应时,能够自动对硬盘进行复位,使得硬盘重新上线,及时在***中恢复硬盘的使用,从而避免硬盘被误剔除。
为了实现上述目的,本发明采用以下的技术方案:
一种硬盘异常自动复位方法,包括以下步骤:
磁盘阵列***检测到异常硬盘;
通过磁盘阵列柜的机箱管理体系定位出异常硬盘;
对异常硬盘进行复位;
验证复位后的硬盘。
优选地,磁盘阵列***检测到异常硬盘,包括:磁盘阵列***向硬盘读写数据时进行校验,当校验发生无响应或错误时,则判定该硬盘为异常硬盘。
优选地,对异常硬盘进行复位,包括:磁盘阵列柜的机箱管理体系发送信号至控制器,控制器控制逻辑线路断电,间隔预设时间后,再次恢复供电,并通过总线返回操作信号给计算机管理***。
优选地,所述验证为对复位后的硬盘进行读写测试。
优选地,验证复位后的硬盘之后,还包括:复位后的硬盘通过验证测试,则上线;否则,下线。
一种硬盘异常自动复位装置,包括:
检测模块,用于检测异常硬盘;
触发模块,用于对异常硬盘进行定位;
复位模块,用于对异常硬盘进行复位;
验证模块,用于验证复位后的硬盘。
优选地,还包括:处理模块,用于处理验证后硬盘的上线或下线。
本发明的有益效果:
本发明在读写时的校验判定硬盘是否处于异常,若硬盘异常,继而通过触发、复位操作,复位之后再对复位后的硬盘进行验证,若验证成功,则判定硬盘为假死状态,在***中对硬盘进行重新上线,实现对硬盘的自动复位,使硬盘以毫秒级时间重新上线,及时在***中恢复硬盘的使用,而且不需要对硬盘进行插拔即可恢复硬盘,避免硬盘被误剔除,有效保证***工作的稳定性,降低硬盘应用的风险,提高硬盘的使用寿命。
现有的技术是,硬盘因出现异常情况被夯住短时间无响应,导致***误以为硬盘损坏而剔除硬盘,其实被剔除的硬盘可能是出于“假死”状态,导致硬盘被误判,继而进行下线处理,增加了硬盘的维护费用,本发明通过触发、复位和验证对于硬盘短时间无响应的问题进行甄别,来确定硬盘是否可以继续使用,防止硬盘被***误判,可以有效的节省60%的硬盘维护费用。
附图说明
图1为本发明硬盘异常自动复位方法的流程示意图之一;
图2为本发明硬盘异常自动复位方法的流程示意图之二;
图3为本发明硬盘异常自动复位装置的结构示意图。
具体实施方式
为了便于理解,对本发明中出现的部分名词作以下解释说明:
磁盘阵列:英文全称为Redundant Arrays of Independent Disks,以下简称RAID,是由多个磁盘组合成一个磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘***效能。
SES管理体系:SES为SCSI Enclosure Service的简称,是T10技术委员会制定的用于机箱管理的标准,主要负责SSA/SCSI/SAS等技术、标准的开发和制定,硬盘阵列柜都设计了总线环路来获许各种状态数据和传输SES规范中的命令,在发送的时候把SES规范中的SCSI命令包裹到I2C总线中进行传递,之后传输到硬盘阵列柜的控制器中。
复杂可编程逻辑器件: 英文全称为Complex Programmable Logic Device,以下简称CPLD,是以乘积项结构方式构成逻辑行为的器件,由可编程逻辑宏单元(Macro Cell)围绕中心的可编程互连矩阵单元组成。
I2C总线:是一个双向的两线连续总线,提供集成电路(integrated circuit)之间的通信线路。
操作***: 英文全称为Operating System,以下简称OS,是管理和控制计算机硬件与软件资源的计算机程序。
脚本:英文全称为script,是批处理文件的延伸,是一种纯文本保存的程序;脚本可以由应用程序临时调用并执行。
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述:
实施例一
如图1所示,一种硬盘异常自动复位方法,包括以下步骤:
步骤S101:使用RAID作为本发明磁盘阵列***,***RAID读写数据时进行校验,当校验发生无响应或错误时,则判定该硬盘发生异常。
步骤S102:使用SES管理体系作为本发明的磁盘阵列柜的机箱管理体系,发现硬盘异常后,通过SES管理体系定位出异常硬盘。
步骤S103:使用CPLD作为本发明的控制器,SES管理体系通过管理总线将信号发送至CPLD,CPLD控制逻辑线路断电,间隔预设时间后,再次恢复供电,并通过管理总线返回操作信号给SES管理体系。
上述管理总线为I2C总线。
作为一种可实施方式,间隔预设时间为毫秒级时间,毫秒级时间可以设置为10ms。
步骤S104:SES管理体系触发OS下脚本程序,完成读写测试。
步骤S105:通过读写测试的硬盘,则上线,转步骤S101。
步骤S106:不通过读写测试的硬盘,则下线。
实施例二
如图2所示,一种硬盘异常自动复位方法,包括以下步骤:
步骤S201:磁盘阵列***检测到异常硬盘。
步骤S202:通过磁盘阵列柜的机箱管理体系定位出异常硬盘。
步骤S203:对异常硬盘进行复位。
步骤S204:验证复位后的硬盘。
实施例三
如图3所示,一种硬盘异常自动复位装置,包括检测模块301、触发模块302、复位模块303、验证模块304和处理模块305,所述检测模块301依次顺序连接触发模块302、复位模块303、验证模块304和处理模块305。
检测模块301,用于检测异常硬盘;触发模块302,用于对异常硬盘进行定位;复位模块303,用于对异常硬盘进行复位;验证模块304,用于验证复位后的硬盘;处理模块305,用于处理验证后硬盘的上线或下线。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种硬盘异常自动复位方法,其特征在于,包括以下步骤:
磁盘阵列***检测到异常硬盘;
通过磁盘阵列柜的机箱管理体系定位出异常硬盘;
对异常硬盘进行复位;
验证复位后的硬盘。
2.根据权利要求1所述的硬盘异常自动复位方法,其特征在于,磁盘阵列***检测到异常硬盘,包括:磁盘阵列***向硬盘读写数据时进行校验,当校验发生无响应或错误时,则判定该硬盘为异常硬盘。
3.根据权利要求1所述的硬盘异常自动复位方法,其特征在于,对异常硬盘进行复位,包括:磁盘阵列柜的机箱管理体系发送信号至控制器,控制器控制逻辑线路断电,间隔预设时间后,再次恢复供电,并通过总线返回操作信号给计算机管理***。
4.根据权利要求1所述的硬盘异常自动复位方法,其特征在于,所述验证为对复位后的硬盘进行读写测试。
5.根据权利要求1或4所述的硬盘异常自动复位方法,其特征在于,验证复位后的硬盘之后,还包括:复位后的硬盘通过验证测试,则上线;否则,下线。
6.一种硬盘异常自动复位装置,其特征在于,包括:
检测模块,用于检测异常硬盘;
触发模块,用于对异常硬盘进行定位;
复位模块,用于对异常硬盘进行复位;
验证模块,用于验证复位后的硬盘。
7.根据权利要求6所述的硬盘异常自动复位装置,其特征在于,还包括:处理模块,用于处理验证后硬盘的上线或下线。
CN201611200471.2A 2016-12-22 2016-12-22 硬盘异常自动复位方法及其装置 Pending CN106708646A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611200471.2A CN106708646A (zh) 2016-12-22 2016-12-22 硬盘异常自动复位方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611200471.2A CN106708646A (zh) 2016-12-22 2016-12-22 硬盘异常自动复位方法及其装置

Publications (1)

Publication Number Publication Date
CN106708646A true CN106708646A (zh) 2017-05-24

Family

ID=58903019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611200471.2A Pending CN106708646A (zh) 2016-12-22 2016-12-22 硬盘异常自动复位方法及其装置

Country Status (1)

Country Link
CN (1) CN106708646A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287770A (zh) * 2018-03-01 2018-07-17 联想(北京)有限公司 电子设备、信息处理方法及可读存储介质
CN109284207A (zh) * 2018-08-30 2019-01-29 紫光华山信息技术有限公司 硬盘故障处理方法、装置、服务器和计算机可读介质
CN109376029A (zh) * 2018-09-27 2019-02-22 郑州云海信息技术有限公司 一种scsi硬盘异常超时的处理方法及处理***
CN109710323A (zh) * 2018-12-28 2019-05-03 联想(北京)有限公司 一种控制方法和电子设备
CN110457278A (zh) * 2018-05-07 2019-11-15 百度在线网络技术(北京)有限公司 一种文件拷贝方法、装置、设备和存储介质
CN113110958A (zh) * 2021-03-30 2021-07-13 宁波三星医疗电气股份有限公司 一种基于智能电力终端***文件校验方法
CN113868009A (zh) * 2021-10-20 2021-12-31 南昌逸勤科技有限公司 一种sas扩展器的自动修复方法、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列***中磁盘故障处理和数据重构方法
CN102819480A (zh) * 2011-06-08 2012-12-12 联想(北京)有限公司 一种监控计算机存储器的方法和计算机
CN105119767A (zh) * 2015-06-29 2015-12-02 北京宇航时代科技发展有限公司 一种数据自检及自清理的软件运行状态监测方法及***
CN105808161A (zh) * 2016-02-26 2016-07-27 四川效率源信息安全技术股份有限公司 一种硬盘坏道数据的读取方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276302A (zh) * 2007-03-29 2008-10-01 中国科学院计算技术研究所 一种磁盘阵列***中磁盘故障处理和数据重构方法
CN102819480A (zh) * 2011-06-08 2012-12-12 联想(北京)有限公司 一种监控计算机存储器的方法和计算机
CN105119767A (zh) * 2015-06-29 2015-12-02 北京宇航时代科技发展有限公司 一种数据自检及自清理的软件运行状态监测方法及***
CN105808161A (zh) * 2016-02-26 2016-07-27 四川效率源信息安全技术股份有限公司 一种硬盘坏道数据的读取方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108287770A (zh) * 2018-03-01 2018-07-17 联想(北京)有限公司 电子设备、信息处理方法及可读存储介质
CN108287770B (zh) * 2018-03-01 2020-12-18 联想(北京)有限公司 电子设备、信息处理方法及可读存储介质
CN110457278A (zh) * 2018-05-07 2019-11-15 百度在线网络技术(北京)有限公司 一种文件拷贝方法、装置、设备和存储介质
CN109284207A (zh) * 2018-08-30 2019-01-29 紫光华山信息技术有限公司 硬盘故障处理方法、装置、服务器和计算机可读介质
CN109376029A (zh) * 2018-09-27 2019-02-22 郑州云海信息技术有限公司 一种scsi硬盘异常超时的处理方法及处理***
CN109376029B (zh) * 2018-09-27 2021-11-19 郑州云海信息技术有限公司 一种scsi硬盘异常超时的处理方法及处理***
CN109710323A (zh) * 2018-12-28 2019-05-03 联想(北京)有限公司 一种控制方法和电子设备
CN113110958A (zh) * 2021-03-30 2021-07-13 宁波三星医疗电气股份有限公司 一种基于智能电力终端***文件校验方法
CN113868009A (zh) * 2021-10-20 2021-12-31 南昌逸勤科技有限公司 一种sas扩展器的自动修复方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN106708646A (zh) 硬盘异常自动复位方法及其装置
US6708285B2 (en) Redundant controller data storage system having system and method for handling controller resets
CN100504795C (zh) 一种计算机raid阵列预警***及方法
US6715101B2 (en) Redundant controller data storage system having an on-line controller removal system and method
CN100388217C (zh) 用于通信***中的动态阈值缩放的方法和***
US20020133743A1 (en) Redundant controller data storage system having hot insertion system and method
CN100353328C (zh) 用于控制存储的装置和方法
CN102279775B (zh) 一种Linux***下的硬盘故障处理方法
EP2366148B1 (en) Apparatus and method for controlling a solid state disk ( ssd ) device
CN207529373U (zh) 连接器、NVMe存储设备及计算机设备
JP2004038290A (ja) 情報処理システムおよび同システムで用いられるディスク制御方法
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
CN105259863B (zh) 一种plc温备份冗余方法及***
CN112732477B (zh) 一种带外自检故障隔离的方法
CN109684141A (zh) 一种磁盘故障诊断方法、装置、终端及可读存储介质
CN103389918A (zh) 一种适用于raid***中假性故障的修复方法
CN102915260B (zh) 固态硬盘容错的方法及其固态硬盘
CN103049345B (zh) 基于异步通信机制的磁盘状态变迁检测方法及装置
CN109032863A (zh) 一种NVMe固态硬盘及其故障原因的确定方法、***
CN101430658A (zh) 异常复位信息的保存方法及装置
CN102662787A (zh) 一种保护***盘raid的方法
CN102520223B (zh) 用于电能表的软件抗干扰方法
CN103617102A (zh) 一种隔离故障硬盘的方法、装置及存储***
CN104020963B (zh) 一种防止误判硬盘读写错误的方法和装置
CN104636082A (zh) 磁盘阵列raid的控制方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication