CN110795276A - 一种存储介质的修复方法、计算机设备、存储介质 - Google Patents

一种存储介质的修复方法、计算机设备、存储介质 Download PDF

Info

Publication number
CN110795276A
CN110795276A CN201810864296.XA CN201810864296A CN110795276A CN 110795276 A CN110795276 A CN 110795276A CN 201810864296 A CN201810864296 A CN 201810864296A CN 110795276 A CN110795276 A CN 110795276A
Authority
CN
China
Prior art keywords
storage medium
target storage
processing parameters
target
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810864296.XA
Other languages
English (en)
Inventor
王勇
闫宁
王鹏
朱家稷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810864296.XA priority Critical patent/CN110795276A/zh
Publication of CN110795276A publication Critical patent/CN110795276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种存储介质的修复方法和装置。所述方法包括:监测存储介质对访问请求的处理参数,并根据处理参数,确定目标存储介质,对所述目标存储介质执行修复策略,修复策略包括:数据备份、格式化处理或重新启用。在存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的目标存储介质,避免目标存储介质的故障对整个存储***产生影响,而且不必依赖存储介质的历史日志数据和外部的监测程序,并对其进行修复,避免出现故障后要将目标存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。

Description

一种存储介质的修复方法、计算机设备、存储介质
技术领域
本申请涉及介质修复技术领域,具体涉及一种存储介质的修复方法、一种计算机设备、一种计算机可读存储介质。
背景技术
分布式存储***管理大量的机械硬盘,机械硬盘一般会有3%~4%的年故障率,大规模部署的存储***中,会频繁发生硬盘故障。造成硬盘故障的原因包括硬盘本身、文件***、操作***等多方面的因素,大部分情况下无须返厂维修。
申请人经研究发现,业界常用的方法依赖于硬盘的日志数据来发现出问题的硬盘,并将问题硬盘从存储***中摘除,这种方式依赖历史数据和存储***外部的监测程序,难以避免硬盘故障影响整个存储***,***稳定性和资源利用率低,运维成本高。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的存储介质的修复方法、以及计算机设备、计算机可读存储介质。
依据本申请的一个方面,提供了一种存储介质的修复方法,包括:
监测存储介质对访问请求的处理参数;
根据所述处理参数,确定目标存储介质;
对所述目标存储介质执行修复策略,其中,所述修复策略包括:数据备份、格式化处理或重新启用。
可选地,所述监测存储介质对访问请求的处理参数包括:
针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
可选地,所述针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数包括:
在每个存储设备上为其上各个存储介质分别建立请求队列,其中,所述存储设备包括至少一个存储介质;
记录所述请求队列中各个访问请求的处理参数。
可选地,所述根据所述处理参数,确定目标存储介质包括:
确定针对所述存储介质记录的处理参数满足待修复条件;
将处理参数满足待修复条件的存储介质,确定为目标存储介质。
可选地,在所述根据所述处理参数,确定目标存储介质之前,所述方法还包括:
从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;
所述确定针对所述存储介质记录的处理参数满足待修复条件包括:
查找各个存储介质中最大的预设分位点的处理参数;
确定所述最大的预设分位点的处理参数超出预设处理阈值。
可选地,在所述确定针对所述存储介质记录的处理参数满足待修复条件之前,所述根据所述处理参数,确定目标存储介质还包括:
确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
可选地,在所述对所述目标存储介质执行修复策略之前,所述方法包括:
停用所述目标存储介质。
可选地,在所述停用所述目标存储介质之前,所述方法还包括:
若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
可选地,所述停用所述目标存储介质包括:
在存储***中标记所述目标存储介质不接受新的访问请求;
可选地,在所述对目标存储介质执行修复策略之前,所述方法包括:
确定针对所述目标存储介质的已在处理的访问请求全部完成。
可选地,所述对所述目标存储介质执行修复策略包括:
对所述目标存储介质上的数据进行备份;
删除存储***中目标存储介质的元数据;
对所述目标存储介质进行格式化处理。
可选地,所述对所述目标存储介质执行修复策略包括:
识别修复后的目标存储介质;
生成存储***对修复后的目标存储介质的管理数据。
可选地,所述处理参数包括访问延时。
相应地,根据本申请的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述一个或多个的方法。
相应地,根据本申请的另一方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一个或多个的方法。
依据本申请实施例,通过监测存储介质对访问请求的处理参数,并根据处理参数,确定目标存储介质,对所述目标存储介质执行修复策略,修复策略包括:数据备份、格式化处理或重新启用。在存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的目标存储介质,避免目标存储介质的故障对整个存储***产生影响,而且不必依赖存储介质的历史日志数据和外部的监测程序,并对其进行修复,避免出现故障后要将目标存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。
进一步,在确定处理参数满足待修复条件之前,需要先满足如下至少一个条件,处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量,避免因记录的时间过短,或者记录的数量过少而不具有代表性,降低对存储介质的误诊概率。
进一步,根据预设分位点的处理参数判断是否满足待修复条件,克服了最大的处理参数这样的特例不具有代表性的问题,避免因处理参数的极端值不具有代表性造成的误诊,提高确定待修复的存储介质的准确率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了存储介质的修复过程的示意图;
图2示出了根据本申请实施例一的一种存储介质的修复方法实施例的流程图;
图3示出了根据本申请实施例二的一种存储介质的修复方法实施例的流程图;
图4示出了异常磁盘的自动处理过程的示意图;
图5示出了根据本申请实施例三的一种存储介质的修复装置实施例的结构框图;
图6示出了可被用于实现本公开中所述的各个实施例的示例性***。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为使本领域技术人员更好地理解本申请,以下对本申请涉及的概念进行说明:
存储介质包括硬盘、闪存、软盘、光盘、记忆卡等、或者其他任意适用的存储介质,本申请实施例对此不做限制。例如,在分布式存储***中,管理着大量的存储介质,尤其是机械硬盘(HDD)因其更大的容量/价格比,广泛应用于各种存储***中。
由存储介质组成的存储***中,会有大量的针对各个存储介质的访问请求。访问请求包括对存储介质进行读、写等请求,或者其他任意适用的访问请求,本申请实施例对此不做限制。例如,分布式存储***可以由多个存储服务器(存储节点)组成,每个存储服务器上可以有至少一个存储介质,分布式存储***可以处理来自网络的大量访问请求,访问请求被分发到存储服务器,再由存储服务器上的存储介质处理。
存储介质在对访问请求进行处理时,通过监测可以得到存储介质对访问请求的处理参数。处理参数包括一次访问请求的访问延时、出错次数、多次访问请求的访问延时的平均值等,或者其他任意适用的处理参数,本申请实施例对此不做限制。处理参数可以是针对每次访问请求得到的,也可以是针对多次访问请求得到的。
在存储介质因故障而无法使用之前,往往会出现访问慢、访问延时不稳定、甚至挂起访问盘的应用程序,也就是说,存储介质对访问请求的处理参数会出现异常,当有处理参数出现异常时,就将对应的存储介质确定为目标存储介质。例如,监测到存储介质对访问请求的访问延时不稳定,则将该存储介质确定为目标存储介质。
为了修复目标存储介质,消除掉目标存储介质上发生的错误,可以对目标存储介质执行修复策略。修复策略包括数据备份、删除存储介质的元数据、格式化处理或重新启用等自动执行的处理,或者其他任意适用的处理,本申请实施例对此不做限制。
在本申请的一种可选实施例中,处理参数包括访问延时,访问延时的监测,具体可以通过记录每个访问请求从开始执行到返回结果之间的时间得到,或者其他任意适用的监测方式,本申请实施例对此不做限制。
在本申请的一种可选实施例中,存储***包括至少一个存储设备,存储设备包括至少一个存储介质。存储设备包括存储服务器等,或者其他任意适用的存储设备,本申请实施例对此不做限制。存储设备上可以为每个存储介质分别建立请求队列,请求队列中包括针对该存储介质的访问请求。
在本申请的一种可选实施例中,存储***中存储有存储介质的元数据,用于描述存储介质中存储的数据,存储***根据元数据,可以确定数据存储在哪个存储介质上。
在本申请的一种可选实施例中,存储***针对所使用的每个存储介质,都要生成对应的管理数据,管理数据包括存储介质的位置、总容量、剩余容量等,或者其他任意适用的用于管理存储介质的数据,本申请实施例对此不做限制。
根据本申请的一种实施例,在存储***运行过程中,依赖硬盘的日志数据来发现出问题的硬盘,并将问题硬盘从存储***中摘除,存在硬盘故障影响到整个存储***的风险,导致***稳定性和资源利用率低,运维成本高等问题。如图1所示的存储介质的修复过程的示意图,本申请提供了一种存储介质的修复机制,通过监测存储介质对访问请求的处理参数,并根据处理参数,确定目标存储介质,对所述目标存储介质执行修复策略,修复策略包括:数据备份、格式化处理、重新启用。在目标存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的目标存储介质,避免目标存储介质的故障对整个存储***产生影响,而且不必依赖目标存储介质的历史日志数据和存储***外部的监测程序,并对其进行修复,避免出现故障后要将目标存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。本申请适用但不局限于上述应用场景。
参照图2,示出了根据本申请实施例一的一种存储介质的修复方法实施例的流程图,该方法具体可以包括以下步骤:
步骤101,监测存储介质对访问请求的处理参数。
在本申请实施例中,存储***中不断有针对各个存储介质的访问请求,各个存储介质分别对各自的访问请求进行处理,在处理过程中,可以监测每个访问请求的处理参数。监测存储介质对访问请求的处理参数的实现方式可以包括针对存储***的每个存储***,记录针对存储介质的每个访问请求的处理参数,或者其他任意适用的监测方式,本申请实施例对此不做限制。
步骤102,根据所述处理参数,确定目标存储介质。
在本申请实施例中,处理参数出现异常的存储介质可以被确定为目标存储介质,具体实现方式可以包括多种,例如,确定针对存储介质记录的处理参数满足待修复条件,将处理参数满足待修复条件的存储介质,确定为目标存储介质,或者其他任意适用的方式,本申请实施例对此不做限制。
例如,存储***包括多个存储设备,在每个存储设备上,针对每个磁盘建立一个请求队列,记录每个请求的访问延时,当记录时间超过5分钟,并且记录总数不少于1000次,则从记录的访问延时中找出99.9%分位点处的延时值,即将访问延时从小到大排列后第99.9%的延时值。值得说明的是,常见的分位点为二分位点(即中位数),四分位点等,本申请中的预设分位点是根据经验确定的,也可以根据实际情况进行调整,本申请实施例对此不做限制。
步骤103,对所述目标存储介质执行修复策略。
在本申请实施例中,确定目标存储介质后,可以对目标存储介质执行修复策略,目标存储介质的故障也会随之消失,以避免该目标存储介质变得完全无法使用,甚至影响整个存储***。修复策略是自动执行的,无须从存储***中摘除待修复的存储介质,只做隔离,自动修复成功后,存储***可以自动识别到修复好的目标存储介质,并将修复好的目标存储介质作为新的存储介质继续使用。
值得说明的是,在大规模部署的存储***中,管理着数以万计的存储介质,存储介质一般会有一定的年故障率。本申请在存储***在线的情况下,根据存储介质对访问请求的处理参数,将存在完全无法使用,甚至影响整个存储***的隐患的存储介质找出来,确定为目标存储介质,进而自动修复存在隐患的目标存储介质,极大地减少了目标存储介质因故障而完全无法使用,甚至对整个存储***产生不良影响的几率。
依据本申请实施例,通过监测存储介质对访问请求的处理参数,并根据处理参数,确定目标存储介质,对所述目标存储介质执行修复策略,修复策略包括:数据备份、格式化处理、重新启用。在目标存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的目标存储介质,避免目标存储介质的故障对整个存储***产生影响,而且不必依赖存储介质的历史日志数据和存储***外部的监测程序,并对其进行修复,避免出现故障后要将存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。
参照图3,示出了根据本申请实施例二的一种存储介质的修复方法实施例的流程图,该方法具体可以包括以下步骤:
步骤201,针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
在本申请实施例中,针对每个存储介质,分别记录针对存储介质的每个访问请求的处理参数。例如,记录每个访问请求的访问延时。
在本申请的一种实施例中,可选地,存储设备包括至少一个存储介质,针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数的一种实现方式包括:在每个存储设备上为其上各个存储介质分别建立请求队列,记录请求队列中各个访问请求的处理参数。
步骤202,确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
在本申请实施例中,在确定处理参数满足待修复条件之前,需要先满足如下至少一个条件,处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量,避免因记录的时间过短,或者记录的数量过少而不具有代表性,降低对存储介质的误诊概率。预设周期和预设数量可以根据运行情况不断调整,具体可以为任意适用的值,本申请实施例对此不做限制。
例如,访问延时的记录周期超过5分钟,记录数量超过1000次,则触发一次诊断,判断处理参数是否满足待修复条件。
步骤203,确定针对所述存储介质记录的处理参数满足待修复条件。
在本申请实施例中,待修复条件可以包括多种,例如,一种实现方式中包括:当访问延时的记录周期超过预设周期、且记录数量超过预设数量时,从记录的处理参数中找出99.9%分位点的访问延时,在所有的存储介质中找出99.9%分位点的访问延时的最大的一个,超过设定阈值,则该存储介质的处理参数满足待修复条件。另一种实现方式中,当访问延时的记录周期超过预设周期、且记录数量超过预设数量时,将记录的处理参数求平均值,如果处理参数的平均值超过设定阈值,则该存储介质的处理参数满足待修复条件。具体可以包括任意适用的待修复条件,本申请实施例对此不做限制。
在本申请的一种实施例中,可选地,在根据所述处理参数,确定所述存储***中目标存储介质之前,还可以包括:从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;确定针对所述存储介质记录的处理参数满足待修复条件的一种实现方式可以包括:查找各个存储介质中最大的预设分位点的处理参数;确定所述最大的预设分位点的处理参数超出预设处理阈值。
针对各个存储介质,提取预设分位点的处理参数,即预设分位点的处理参数等于记录的所有处理参数从小到大排列后预设分位点处的数字。例如,从记录的处理参数中找出99.9%分位点的访问延时。
每个存储介质都可以提取出预设分位点的处理参数,然后再在各个存储介质中查找出最大的预设分位点的处理参数,具体可以是针对每个存储设备都找出最大的预设分位点的处理参数,也可以是针对多个存储设备找出最大的预设分位点的处理参数,本申请实施例对此不做限制。
然后判断最大的预设分位点的处理参数是否超出预设处理阈值,如果超出预设处理阈值,则表明该存储介质的处理参数满足待修复条件,否则不满足待修复条件。预设处理阈值可以设置为任意适用的值,具体根据运行情况进行调整,本申请实施例对此不做限制。根据预设分位点的处理参数判断是否满足待修复条件,克服了最大的处理参数这样的特例不具有代表性的问题,避免因处理参数的极端值不具有代表性造成的误诊,提高确定待修复的存储介质的准确率。
步骤204,将处理参数满足待修复条件的存储介质,确定为目标存储介质。
在本申请实施例中,处理参数满足待修复条件的存储介质,即是存在完全无法使用,甚至对整个存储***产生影响的存储介质,可以确定为目标存储介质。具体可以针对每个存储设备,单独确定满足待修复条件的存储介质,也可以针对多个存储设备,一同确定满足待修复条件的存储介质,或者其他任意使用的方式,本申请实施例对此不做限制。
步骤205,若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
在本申请实施例中,确定目标存储介质后,可以向存储***请求停用目标存储介质。存储***判断预设时间段内存储介质的停用数量是否超过预设阈值,若不超过预设阈值,则可以确定目标存储介质可停用,避免因存储***的问题导致大量存储介质被停用。
步骤206,停用所述目标存储介质。
在本申请实施例中,在执行修复策略之前,先停用目标存储介质,具体需要向存储***发起请求,在存储***内将目标存储介质标记为不可用,或者其他任意适用的停用方式,本申请实施例对此不做限制。
在本申请的一种实施例中可选地,停用所述目标存储介质的一种实现方式可以包括:在所述存储***中标记目标存储介质不接受新的访问请求,停用存储介质也就是,在存储***中标记目标存储介质不可以接受新的访问请求。
步骤207,确定针对所述目标存储介质的已在处理的访问请求全部完成。
在本申请实施例中,停用目标存储介质后,监测目标存储介质上已经在处理的访问请求的处理状态,当全部访问请求被处理完成,可以执行修复策略,避免已经在处理的访问请求出错。
步骤208,对所述目标存储介质上的数据进行备份。
在本申请实施例中,修复存储介质需要先对目标存储介质上的数据进行备份,可以将数据备份到存储***的其他存储介质上,具体可以包括任意适用的备份方式,本申请实施例对此不做限制。
步骤209,删除存储***中目标存储介质的元数据。
在本申请实施例中,备份好数据后,就可以删除存储***中目标存储介质的元数据,使得存储***不再使用该存储介质,也就是说,原本针对该存储介质的访问请求将不再被存储***分配到
步骤210,对所述目标存储介质进行格式化处理。
在本申请实施例中,为了消除存储介质上的故障,最后对目标存储介质进行格式化处理,具体可以采用任意适用的格式化处理方式,例如,采取低级格式化的方式,将存储介质硬件上reset(复位)等修复手段,本申请实施例对此不做限制。
步骤211,识别修复后的目标存储介质。
在本申请实施例中,修复完成后,存储介质对于存储***或者存储设备来说,就是一块新的存储介质,不再是先前的存储介质。存储***或者存储设备可以识别到新的存储介质(即修复后的目标存储介质)。
步骤212,生成存储***对修复后的目标存储介质的管理数据。
在本申请实施例中,识别到修复后的目标存储介质后,存储***要使用存储介质,就要生成对修复后的存储介质的管理数据,以使存储介质可以重新嵌入到存储***中,也就是重新添加到存储***中。
依据本申请实施例,通过针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数,确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量,确定针对所述存储介质记录的处理参数满足待修复条件,将处理参数满足待修复条件的存储介质,确定为目标存储介质,若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用,停用所述目标存储介质,确定针对所述目标存储介质的已在处理的访问请求全部完成,对所述目标存储介质上的数据进行备份,删除存储***中目标存储介质的元数据,识别修复后的目标存储介质,生成存储***对修复后的目标存储介质的管理数据。在存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的存储介质,避免存储介质的故障对整个存储***产生影响,而且不必依赖存储介质的历史日志数据和存储***外部的监测程序,并对其进行修复并重新添加到存储***中,避免出现故障后要将存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。
为使本领域技术人员更好地理解本申请,以下通过具体的示例对本申请的一种实现方式进行说明。
如图4所示的异常磁盘的自动处理过程的示意图。
步骤1、统计每个访问请求的访问延时。为每个磁盘建立一个请求队列,记录每个请求的访问延时。并统计一个周期以上(例如,超过5分钟),并且总数不少于某一阈值,如1000次请求的记录。找出分位数为99.9%的目标延时值。
步骤2、找出延时不稳定的磁盘。找出所有盘中目标延时值最大的,并且该最大的目标延时值超过某一延时阈值的磁盘。
步骤3、判断是否可以将坏盘隔离。向存储***的中心决策程序请求停用该盘,中心决策程序根据过去一段时间是否有较多磁盘请求停用,来避免因***问题导致大量盘被处理。
步骤4、将磁盘从存储***中停用。若过去一段时间内没有较多磁盘请求停用,则在存储***内将找出的磁盘标记为不可用,等待该磁盘上的所有请求完成。然后触发数据修复,即将数据备份到***的其他磁盘。最后将描述存储***的元数据从存储***中清除。这里的停用并不从存储***中摘除,只做隔离。
步骤5、在线格式化。对该磁盘重新做格式化处理,清除掉磁盘的数据。在linux***下,一般是重新创建文件***,这个过程因为放弃了原来盘上已有的数据,访问盘的故障也会随之消失。
步骤6、重新加入存储***。存储***重新将格式化后的磁盘识别出来,生成对该磁盘的管理数据结构。
参照图5,示出了根据本申请实施例三的一种存储介质的修复装置实施例的结构框图,具体可以包括:
参数监测模块301,用于监测存储介质对访问请求的处理参数;
介质确定模块302,用于根据所述处理参数,确定目标存储介质;
介质修复模块303,用于对所述目标存储介质执行修复策略,其中,所述修复策略包括:数据备份、格式化处理或重新启用。
在本申请的一种实施例中,可选地,所述参数监测模块包括:
参数记录子模块,用于针对所每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
在本申请的一种实施例中,可选地,所述参数记录子模块包括:
队列建立单元,用于在每个存储设备上为其上各个存储介质分别建立请求队列,其中,所述存储设备包括至少一个存储介质;
参数记录单元,用于记录所述请求队列中各个访问请求的处理参数。
在本申请的一种实施例中,可选地,所述介质确定模块包括:
第一条件确定子模块,用于确定针对所述存储介质记录的处理参数满足待修复条件;
介质确定子模块,用于将处理参数满足待修复条件的存储介质,确定为目标存储介质。
在本申请的一种实施例中,可选地,所述装置还包括:
参数提取模块,用于在所述根据所述处理参数,确定目标存储介质之前,从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;
所述第一条件确定子模块包括:
参数查找单元,用于查找各个存储介质中最大的预设分位点的处理参数;
阈值确定单元,用于确定所述最大的预设分位点的处理参数超出预设处理阈值。
在本申请的一种实施例中,可选地,所述介质确定模块还包括:
第二条件确定子模块,用于在所述确定针对所述存储介质记录的处理参数满足待修复条件之前,确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
在本申请的一种实施例中,可选地,所述装置包括:
介质停用模块,用于在所述对所述目标存储介质执行修复策略之前,停用所述目标存储介质。
在本申请的一种实施例中,可选地,所述装置还包括:
可停用确定模块,用于在所述停用所述目标存储介质之前,若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
在本申请的一种实施例中,可选地,所述介质停用模块包括:
请求标记子模块,用于在存储***中标记所述目标存储介质不接受新的访问请求;
在本申请的一种实施例中,可选地,所述装置包括:
完成确定模块,用于在所述对所述目标存储介质执行修复策略之前,确定针对所述目标存储介质的已在处理的访问请求全部完成。
在本申请的一种实施例中,可选地,所述介质修复模块包括:
备份子模块,用于对所述目标存储介质上的数据进行备份;
数据删除子模块,用于删除所述存储***中目标存储介质的元数据;
格式化子模块,用于对所述目标存储介质进行格式化处理。
在本申请的一种实施例中,可选地,所述介质修复模块包括:
介质识别子模块,用于识别修复后的目标存储介质;
管理数据生成子模块,用于生成存储***对修复后的目标存储介质的管理数据。
在本申请的一种实施例中,可选地,所述处理参数包括访问延时。
依据本申请实施例,通过通过监测存储介质对访问请求的处理参数,并根据处理参数,确定目标存储介质,对所述目标存储介质执行修复策略,修复策略包括:数据备份、格式化处理、重新启用。在存储介质因故障而无法使用之前,申请人发现处理参数会先出现异常,据此实现了存储介质在线运行时,更早地发现可能要出故障的目标存储介质,避免目标存储介质的故障对整个存储***产生影响,而且不必依赖存储介质的历史日志数据和外部的监测程序,并对其进行修复,避免出现故障后要将目标存储介质从存储***中摘除,提高了存储***的稳定性和资源利用率,减少了存储***的运维成本。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的***。图6示意性地示出了可被用于实现本公开中所述的各个实施例的示例性***(或装置)400。
对于一个实施例,图6示出了示例性***400,该***具有一个或多个处理器402、被耦合到(一个或多个)处理器402中的至少一个的***控制模块(芯片组)404、被耦合到***控制模块404的***存储器406、被耦合到***控制模块404的非易失性存储器(NVM)/存储设备408、被耦合到***控制模块404的一个或多个输入/输出设备410,以及被耦合到***控制模块406的网络接口412。
处理器402可包括一个或多个单核或多核处理器,处理器402可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,***400能够作为本申请实施例中所述的浏览器。
在一些实施例中,***400可包括具有指令的一个或多个计算机可读介质(例如,***存储器406或NVM/存储设备408)以及与该一个或多个计算机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器402。
对于一个实施例,***控制模块404可包括任意适当的接口控制器,以向(一个或多个)处理器402中的至少一个和/或与***控制模块404通信的任意适当的设备或组件提供任意适当的接口。
***控制模块404可包括存储器控制器模块,以向***存储器406提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
***存储器406可被用于例如为***400加载和存储数据和/或指令。对于一个实施例,***存储器406可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,***存储器406可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,***控制模块404可包括一个或多个输入/输出控制器,以向NVM/存储设备408及(一个或多个)输入/输出设备410提供接口。
例如,NVM/存储设备408可被用于存储数据和/或指令。NVM/存储设备408可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备408可包括在物理上作为***400被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备408可通过网络经由(一个或多个)输入/输出设备410进行访问。
(一个或多个)输入/输出设备410可为***400提供接口以与任意其他适当的设备通信,输入/输出设备410可以包括通信组件、音频组件、传感器组件等。网络接口412可为***400提供接口以通过一个或多个网络通信,***400可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器402中的至少一个可与***控制模块404的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器402中的至少一个可与***控制模块404的一个或多个控制器的逻辑封装在一起以形成***级封装(SiP)。对于一个实施例,(一个或多个)处理器402中的至少一个可与***控制模块404的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器402中的至少一个可与***控制模块404的一个或多个控制器的逻辑集成在同一模具上以形成片上***(SoC)。
在各个实施例中,***400可以但不限于是:浏览器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,***400可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,***400包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,如果显示器包括触摸面板,显示屏可以被实现为触屏显示器,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在终端设备时,可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。
在一个示例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本申请实施例的方法。
在一个示例中还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请实施例的一个或多个的方法。
本申请实施例公开了一种存储介质的修复方法和装置,示例1包括一种存储介质的修复方法,包括:
监测存储介质对访问请求的处理参数;
根据所述处理参数,确定目标存储介质;
对所述目标存储介质执行修复策略,其中,所述修复策略包括:数据备份、格式化处理或重新启用。
示例2可包括示例1所述的方法,其中,所述监测存储介质对访问请求的处理参数包括:
针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
示例3可包括示例1和/或示例2所述的方法,其中,所述针对所述存储***的每个存储介质,记录针对所述存储介质的每个访问请求的处理参数包括:
在每个存储设备上为其上各个存储介质分别建立请求队列,其中,所述存储设备包括至少一个存储介质;
记录所述请求队列中各个访问请求的处理参数。
示例4可包括示例1-示例3一个或多个所述的方法,其中,所述根据所述处理参数,确定目标存储介质包括:
确定针对所述存储介质记录的处理参数满足待修复条件;
将处理参数满足待修复条件的存储介质,确定为目标存储介质。
示例5可包括示例1-示例4一个或多个所述的方法,其中,在所述根据所述处理参数,确定目标存储介质之前,所述方法还包括:
从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;
所述确定针对所述存储介质记录的处理参数满足待修复条件包括:
查找各个存储介质中最大的预设分位点的处理参数;
确定所述最大的预设分位点的处理参数超出预设处理阈值。
示例6可包括示例1-示例5一个或多个所述的方法,其中,在所述确定针对所述存储介质记录的处理参数满足待修复条件之前,所述根据所述处理参数,确定目标存储介质还包括:
确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
示例7可包括示例1-示例6一个或多个所述的方法,其中,在所述对所述目标存储介质执行修复策略之前,所述方法包括:
停用所述目标存储介质。
示例8可包括示例1-示例7一个或多个所述的方法,其中,在所述停用所述目标存储介质之前,所述方法还包括:
若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
示例9可包括示例1-示例8一个或多个所述的方法,其中,所述停用所述目标存储介质包括:
在存储***中标记所述目标存储介质不接受新的访问请求;
示例10可包括示例1-示例9一个或多个所述的方法,其中,在所述对所述目标存储介质执行修复策略之前,所述方法包括:
确定针对所述目标存储介质的已在处理的访问请求全部完成。
示例11可包括示例1-示例10一个或多个所述的方法,其中,所述对所述目标存储介质执行修复策略包括:
对所述目标存储介质上的数据进行备份;
删除存储***中目标存储介质的元数据;
对所述目标存储介质进行格式化处理。
示例12可包括示例1-示例11一个或多个所述的方法,其中,所述对所述目标存储介质执行修复策略包括:
识别修复后的目标存储介质;
生成存储***对修复后的目标存储介质的管理数据。
示例13可包括示例1-示例12一个或多个所述的方法,其中,所述处理参数包括访问延时。
示例14包括一种存储介质的修复装置,包括:
参数监测模块,用于监测存储介质对访问请求的处理参数;
介质确定模块,用于根据所述处理参数,确定目标存储介质;
介质修复模块,用于对所述目标存储介质执行修复策略,其中,所述修复策略包括:数据备份、格式化处理或重新启用。
示例15可包括示例14所述的装置,其中,所述参数监测模块包括:
参数记录子模块,用于针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
示例16可包括示例14和/或示例15所述的装置,其中,所述参数记录子模块包括:
队列建立单元,用于在每个存储设备上为其上各个存储介质分别建立请求队列,其中,所述存储设备包括至少一个存储介质;
参数记录单元,用于记录所述请求队列中各个访问请求的处理参数。
示例17可包括示例14-示例16一个或多个所述的装置,其中,所述介质确定模块包括:
第一条件确定子模块,用于确定针对所述存储介质记录的处理参数满足待修复条件;
介质确定子模块,用于将处理参数满足待修复条件的存储介质,确定为目标存储介质。
示例18可包括示例14-示例17一个或多个所述的装置,其中,所述装置还包括:
参数提取模块,用于在所述根据所述处理参数,确定目标存储介质之前,从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;
所述第一条件确定子模块包括:
参数查找单元,用于查找各个存储介质中最大的预设分位点的处理参数;
阈值确定单元,用于确定所述最大的预设分位点的处理参数超出预设处理阈值。
示例19可包括示例14-示例18一个或多个所述的装置,其中,所述介质确定模块还包括:
第二条件确定子模块,用于在所述确定针对所述存储介质记录的处理参数满足待修复条件之前,确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
示例20可包括示例14-示例19一个或多个所述的装置,其中,所述装置包括:
介质停用模块,用于在所述对所述目标存储介质执行修复策略之前,停用所述目标存储介质。
示例21可包括示例14-示例20一个或多个所述的装置,其中,所述装置还包括:
可停用确定模块,用于在所述停用所述目标存储介质之前,若所述存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
示例22可包括示例14-示例21一个或多个所述的装置,其中,所述介质停用模块包括:
请求标记子模块,用于在存储***中标记所述目标存储介质不接受新的访问请求;
示例23可包括示例14-示例22一个或多个所述的装置,其中,所述装置包括:
完成确定模块,用于在所述对所述目标存储介质执行修复策略之前,确定针对所述目标存储介质的已在处理的访问请求全部完成。
示例24可包括示例14-示例23一个或多个所述的装置,其中,所述介质修复模块包括:
备份子模块,用于对所述目标存储介质上的数据进行备份;
数据删除子模块,用于删除所述存储***中目标存储介质的元数据;
格式化子模块,用于对所述目标存储介质进行格式化处理。
示例25可包括示例14-示例24一个或多个所述的装置,其中,所述介质修复模块包括:
介质识别子模块,用于识别修复后的目标存储介质;
管理数据生成子模块,用于生成存储***对修复后的目标存储介质的管理数据。
示例26可包括示例14-示例25一个或多个所述的装置,其中,所述处理参数包括访问延时。
示例27包括一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如示例1-13一个或多个的方法。
示例28包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如示例1-13一个或多个的方法。
虽然某些实施例是以说明和描述为目的的,各种各样的替代、和/或、等效的实施方案、或计算来达到同样的目的实施例示出和描述的实现,不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此,显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims (15)

1.一种存储介质的修复方法,其特征在于,包括:
监测存储介质对访问请求的处理参数;
根据所述处理参数,确定目标存储介质;
对所述目标存储介质执行修复策略,其中,所述修复策略包括:数据备份、格式化处理或重新启用。
2.根据权利要求1所述的方法,其特征在于,所述监测存储介质对访问请求的处理参数包括:
针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数。
3.根据权利要求2所述的方法,其特征在于,所述针对每个存储介质,记录针对所述存储介质的每个访问请求的处理参数包括:
在每个存储设备上为其上各个存储介质分别建立请求队列,其中,所述存储设备包括至少一个存储介质;
记录所述请求队列中各个访问请求的处理参数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述处理参数,确定目标存储介质包括:
确定针对所述存储介质记录的处理参数满足待修复条件;
将处理参数满足待修复条件的存储介质,确定为目标存储介质。
5.根据权利要求4所述的方法,其特征在于,在所述根据所述处理参数,确定目标存储介质之前,所述方法还包括:
从针对各个存储介质记录的多个处理参数中提取预设分位点的处理参数;
所述确定针对所述存储介质记录的处理参数满足待修复条件包括:
查找各个存储介质中最大的预设分位点的处理参数;
确定所述最大的预设分位点的处理参数超出预设处理阈值。
6.根据权利要求4所述的方法,其特征在于,在所述确定针对所述存储介质记录的处理参数满足待修复条件之前,所述根据所述处理参数,确定目标存储介质还包括:
确定所述存储介质满足如下至少一个条件:处理参数的记录周期超过预设周期、处理参数的记录数量超过预设数量。
7.根据权利要求1所述的方法,其特征在于,在所述对所述目标存储介质执行修复策略之前,所述方法包括:
停用所述目标存储介质。
8.根据权利要求7所述的方法,其特征在于,在所述停用所述目标存储介质之前,所述方法还包括:
若存储***中预设时间段内存储介质的停用数量未超过预设阈值,则确定所述目标存储介质可停用。
9.根据权利要求7所述的方法,其特征在于,所述停用所述目标存储介质包括:
在存储***中标记所述目标存储介质不接受新的访问请求。
10.根据权利要求1所述的方法,其特征在于,在所述对目标存储介质执行修复策略之前,所述方法包括:
确定针对所述目标存储介质的已在处理的访问请求全部完成。
11.根据权利要求1所述的方法,其特征在于,所述对所述目标存储介质执行修复策略包括:
对所述目标存储介质上的数据进行备份;
删除存储***中目标存储介质的元数据;
对所述目标存储介质进行格式化处理。
12.根据权利要求1所述的方法,其特征在于,所述对所述目标存储介质执行修复策略包括:
识别修复后的目标存储介质;
生成存储***对修复后的目标存储介质的管理数据。
13.根据权利要求1所述的方法,其特征在于,所述处理参数包括访问延时。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-13一个或多个的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-13一个或多个的方法。
CN201810864296.XA 2018-08-01 2018-08-01 一种存储介质的修复方法、计算机设备、存储介质 Pending CN110795276A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810864296.XA CN110795276A (zh) 2018-08-01 2018-08-01 一种存储介质的修复方法、计算机设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810864296.XA CN110795276A (zh) 2018-08-01 2018-08-01 一种存储介质的修复方法、计算机设备、存储介质

Publications (1)

Publication Number Publication Date
CN110795276A true CN110795276A (zh) 2020-02-14

Family

ID=69426143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810864296.XA Pending CN110795276A (zh) 2018-08-01 2018-08-01 一种存储介质的修复方法、计算机设备、存储介质

Country Status (1)

Country Link
CN (1) CN110795276A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984195A (zh) * 2020-08-19 2020-11-24 广州邦讯信息***有限公司 一种提高嵌入式Linux***稳定性的方法及装置
CN115114065A (zh) * 2022-06-24 2022-09-27 苏州浪潮智能科技有限公司 一种内存修复方法、***、存储介质及设备
CN116110562A (zh) * 2023-04-12 2023-05-12 深圳英美达医疗技术有限公司 医疗设备的错误管理方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020065833A1 (en) * 2000-11-30 2002-05-30 Emc Corporation System and method for evaluating changes in performance arising from reallocation of files among disk storage units
CN105468484A (zh) * 2014-09-30 2016-04-06 伊姆西公司 用于在存储***中确定故障位置的方法和装置
CN106407083A (zh) * 2016-10-26 2017-02-15 华为技术有限公司 故障检测方法及装置
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储***硬盘挂住故障检测、处理方法及装置
CN107577545A (zh) * 2016-07-05 2018-01-12 北京金山云网络技术有限公司 一种故障磁盘检测与修复方法和装置
CN107643877A (zh) * 2016-07-22 2018-01-30 中国电信股份有限公司 磁盘故障检测方法以及装置
CN107844381A (zh) * 2016-09-21 2018-03-27 中国电信股份有限公司 存储***的故障处理方法以及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020065833A1 (en) * 2000-11-30 2002-05-30 Emc Corporation System and method for evaluating changes in performance arising from reallocation of files among disk storage units
CN105468484A (zh) * 2014-09-30 2016-04-06 伊姆西公司 用于在存储***中确定故障位置的方法和装置
CN107273231A (zh) * 2016-04-07 2017-10-20 阿里巴巴集团控股有限公司 分布式存储***硬盘挂住故障检测、处理方法及装置
CN107577545A (zh) * 2016-07-05 2018-01-12 北京金山云网络技术有限公司 一种故障磁盘检测与修复方法和装置
CN107643877A (zh) * 2016-07-22 2018-01-30 中国电信股份有限公司 磁盘故障检测方法以及装置
CN107844381A (zh) * 2016-09-21 2018-03-27 中国电信股份有限公司 存储***的故障处理方法以及装置
CN106407083A (zh) * 2016-10-26 2017-02-15 华为技术有限公司 故障检测方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘榴等: "分布式存储***中磁盘故障检测机制", 《信息技术》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111984195A (zh) * 2020-08-19 2020-11-24 广州邦讯信息***有限公司 一种提高嵌入式Linux***稳定性的方法及装置
CN115114065A (zh) * 2022-06-24 2022-09-27 苏州浪潮智能科技有限公司 一种内存修复方法、***、存储介质及设备
CN115114065B (zh) * 2022-06-24 2024-06-28 苏州浪潮智能科技有限公司 一种内存修复方法、***、存储介质及设备
CN116110562A (zh) * 2023-04-12 2023-05-12 深圳英美达医疗技术有限公司 医疗设备的错误管理方法、装置、计算机设备和存储介质
CN116110562B (zh) * 2023-04-12 2023-11-24 深圳英美达医疗技术有限公司 医疗设备的错误管理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US10599536B1 (en) Preventing storage errors using problem signatures
US12014791B2 (en) Memory fault handling method and apparatus, device, and storage medium
US9389937B2 (en) Managing faulty memory pages in a computing system
US10768826B2 (en) Disk detection method and apparatus
JP6818014B2 (ja) ジョブ用の動作リトライ方法及び機器
US20170300505A1 (en) Snapshot creation
CN110795276A (zh) 一种存储介质的修复方法、计算机设备、存储介质
US20100083043A1 (en) Information processing device, recording medium that records an operation state monitoring program, and operation state monitoring method
US20240103961A1 (en) PCIe Fault Auto-Repair Method, Apparatus and Device, and Readable Storage Medium
US10324794B2 (en) Method for storage management and storage device
CN104685474A (zh) 包括不可纠正的错误的地址范围的通知
WO2023179684A1 (zh) 一种中央处理器状态监测方法、装置、设备、存储介质
CN115793963A (zh) 一种硬盘故障处理方法、装置、设备及存储介质
US20150286548A1 (en) Information processing device and method
US9513983B2 (en) Method for maintaining file system of computer system
CN111478792A (zh) 一种割接信息处理方法、***及装置
CN111124818B (zh) 一种扩展器Expander的监控方法、装置及设备
CN115061641B (zh) 一种磁盘故障处理方法、装置、设备以及存储介质
CN108845772B (zh) 一种硬盘故障处理方法、***、设备及计算机存储介质
CN111130856A (zh) 一种服务器配置方法、***、设备及计算机可读存储介质
CN113905092B (zh) 一种确定可复用代理队列的方法、装置、终端及存储介质
CN107154960B (zh) 用于确定分布式存储***的服务可用性信息的方法与设备
CN113312197A (zh) 批量故障的确定方法和装置,计算机存储介质和电子设备
US9552247B2 (en) Method for detection of soft media errors for hard drive
US11409566B2 (en) Resource control device, resource control method, and computer readable medium

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination