CN112005223A - 设备状态评估 - Google Patents

设备状态评估 Download PDF

Info

Publication number
CN112005223A
CN112005223A CN201880092833.1A CN201880092833A CN112005223A CN 112005223 A CN112005223 A CN 112005223A CN 201880092833 A CN201880092833 A CN 201880092833A CN 112005223 A CN112005223 A CN 112005223A
Authority
CN
China
Prior art keywords
score
module
processor
group
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880092833.1A
Other languages
English (en)
Inventor
A·艾扬格
G·罗伊
M·萨尔马
K·威廉斯
A·K·辛格
N·加瓦利
S·J·加姆布勒
C·萨普特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN112005223A publication Critical patent/CN112005223A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Debugging And Monitoring (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

提供了一种***,该***包括与处理器通信的存储器。存储器可以存储用于设备的模块的状态数据。处理器可以基于状态数据而生成模块得分,并且通过将变换应用于模块得分来生成设备得分。此外,基于设备得分,处理器可以将设备分配给状态组。状态组可以包括健康组和不健康组中的一个。另外,处理器可以输出与设备的标识符相关联的状态组。

Description

设备状态评估
背景技术
电气设备可以被大量使用或部署。这样的设备可以具有多个组件。此外,这些设备可以在延长的时间段内使用。
附图说明
图1示出了可以用于评估设备的状态的示例方法的流程图。
图2示出了示例数据表。
图3示出了另外的示例数据表。
图4示出了示例设备即服务生态***的示意性表示。
图5示出了示例计算***的框图。
图6示出了示例计算机可读存储介质的框图。
具体实施方式
随着时间的推移,电气设备随着它们被使用而退化。这样的电气设备的示例包括计算设备和其它智能设备。大量的这样的设备可以部署在设备即服务(DaaS)生态***内。在DaaS生态***中,DaaS提供商向客户提供设备(诸如计算设备)的使用。DaaS提供商可以保留对设备的责任,例如通过维修或替换设备来修复设备。为了知道要修复哪些设备以及在何时修复,DaaS提供商可以评估设备的状态;例如,以确定设备是否健康。
图1示出了可以用于评估设备的状态的示例方法100的流程图。在框105处,可以获得用于设备模块的状态数据。在一些示例中,设备可以包括电气设备,诸如计算设备、智能设备等。该模块可以包括设备的属性、功能或物理组件。例如,当设备是笔记本计算机时,一些示例模块可以包括电池、处理器、存储盘、操作***等。不同的设备可能具有不同的模块。
对于给定的设备,被选择以用于监视的模块可以是对设备的总体性能或健康具有相对更大影响的那些模块。例如,对于笔记本计算机,操作***的状态和性能对设备的健康和性能具有的影响可能比摄像机是否可操作更大。取决于给定设备的性质和意图功能,不同的模块可能被视为对设备的总体性能或健康具有显著影响。
所获得的状态数据的类型可以对应于状态数据与其相关的模块。例如,对于电池,状态数据可以包括实际或预计的电池寿命;对于存储盘,状态数据可以包括未使用的存储空间的数量;对于处理器,状态数据可以包括处理器的操作温度;并且对于操作***,状态数据可以包括操作***崩溃的次数。其它适当类型的状态数据可以用于这些和/或其它模块类型。
在一些示例中,针对设备而监视的不同类型的状态数据集可以包括中央处理单元(CPU)等级、存储器等级、电池等级、盘空闲空间、盘错误、图形等级、热等级、操作***崩溃、软件应用错误、设备引导时间、软件应用启动时间等。
取决于模块,可以以不同的方式获得这样的状态数据。一些模块可以包括板载感测或测量能力,而其它模块可以由设备的其它模块或由设备外部的模块监视。例如,操作***可能能够维护其崩溃的计数器,而电池的电池寿命可以由CPU监视。
此外,可以随着时间的推移而收集状态数据。这继而可以允许随着时间的推移而监视模块的状态。此外,随着时间的推移所收集的历史状态数据可以用于监视和调节状态数据的质量。例如,如果历史上电池寿命一直在八到六小时的范围内,并且随后获得了示出六百小时为电池寿命的新的状态数据点,则新的状态数据点可能由于其与电池寿命的历史记录的大的偏差而被确定为错误的。类似地,历史状态数据记录可以用于通过移除重复的或以其它方式损坏的状态数据点来调节状态数据。
接下来转到方法100的框110,可以基于状态数据而生成模块得分。在一些示例中,模块得分可以包括数值得分。例如,模块得分的范围可以从一到五,其中五表示最高级别状态并且一表示最低级别状态。基于健康、性能等,状态可以反映设备的特性。
在一些示例中,可以通过将状态数据与关联于可与模块比较的其它模块的其它状态数据进行比较来生成模块得分。其它可比较模块可以是与该模块具有类似的物理或操作规范的那些模块。在一些示例中,物理或操作规范类似可以指的是其它模块与设备中的模块可互换而不引起对设备的规范、能力或性能的实质改变的情况。
在一些示例中,其它可比较模块可以包括与该设备的模块具有类似的品牌和型号的那些模块。此外,在一些示例中,其它可比较模块可以包括与该设备的模块具有类似的品牌、型号和配置的那些模块。配置可以包括模块与其协作的设备的其它组件、设备的典型使用场景或设备上的负载、模块或设备的年龄等。
在其中通过与可比较模块的比较而生成模块得分的示例中,模块得分可以被描述为与类似的或可比较模块相对。这样的相对模块得分不同于绝对性能基准,所述绝对性能基准意图针对最有能力和表现最佳的可用模块的性能来测量模块的性能。例如,为了获得三年的中等容量电池的相对模块得分,可以将中等容量电池的电池寿命与同样是三年的其它中等容量电池的电池寿命进行比较,而不是与新的最大容量电池的电池寿命进行比较。
相对模块得分可以继而提供关于模块相对于可比较模块是否表现不佳或不健康的信息。该信息然后可以用于评估包含模块的设备的状态,并且确定是否要发起修复动作。
在一些示例中,用于其它可比较模块的聚合状态数据可以用于生成模块得分。例如,如果状态数据在聚合状态数据的前二十个百分位中,则可以为该模块分配数值模块得分五以反映性能或健康的最高级别。如果,另一方面,状态数据在聚合状态数据的后二十个百分位中,则可以为该模块分配数值模块得分一以反映性能或健康的最低级别。类似地,基于状态数据落入其中的聚合状态数据的百分位带,可以为模块分配模块得分四、三或二。
在部署具有可比较模块的多个设备的DaaS生态***的示例中,来自这些可比较模块的聚合状态数据可以用于生成用于给定设备的模块的相对模块得分。此外,在一些示例中,可以生成经验性能或状态模型以用于可比较模块的状态或性能。例如,这样的模型可以将可比较模块组的状态或性能作为年龄或使用程度的函数呈现。这样的模型的示例可以包括机器学习模型、统计模型等。这样的模型可以基于来自给定DaaS生态***内的设备的聚合状态数据,或者来自设备(该设备来自多个生态***、部署等)的聚合状态数据。
现在转到方法100的框115,基于模块得分可以生成该设备的设备得分。在一些示例中,模块得分可以是范围从五到一的数值得分,其中五表示性能或健康的最高级别,并且一表示性能或健康的最低级别。
在一些示例中,通过将变换应用于模块得分可以生成设备得分。此外,在一些示例中,变换可以包括应用于模块得分的合适的函数或运算。另外,在一些示例中,变换可以包括将加权因子应用于模块得分。例如,使用以下公式可以计算具有n个模块的设备的设备得分:
Figure 610058DEST_PATH_IMAGE001
(公式-1)。
根据公式-1,当n=1时,设备得分是模块得分乘以其对应的加权因子的乘积。当n>1时,方法100可以包括生成用于设备的另外模块的另外模块得分。生成设备得分继而可以包括计算由它们的加权因子所修改的模块得分的和。加权因子可以用作乘数以修改它们对应的模块得分。
使用公式-1计算的设备得分可以提供考虑相关模块得分的单个数值得分,以提供诸如设备的性能或健康之类的状态的相对度量。这样,设备得分可以用于将多个设备(例如在DaaS生态***中)排名或分组为诸如健康或不健康组之类的状态组。这继而可以允许确定给定设备是否是修复的候选者,并且如果是,则发起修复过程。
可以选择用于模块得分的加权因子以反映给定模块得分对设备的总体性能或健康的影响或贡献。在其中一到五标度用于设备得分的示例中,也可以选取加权因子以产生一到五范围内的设备得分。
在一些示例中,使用机器学习模型可以生成加权因子。机器学习模型可以包括深度学习模型。示例机器学习模型可以包括Deep Feed Forrest等。在这样的示例中,可以提供训练数据集以用于训练机器学习模型。训练数据集可以包括与对应的训练模块得分相关联的训练设备得分。在一些示例中,可以手动生成训练设备得分。换句话说,给定用于给定设备的训练模块得分,然后可以基于训练模块得分而对给定设备手动评分以确定相关联的训练设备得分。此外,在一些示例中,使用实际设备的健康或性能结果的历史数据可以经验地生成训练设备得分。
使用公式-1作为示例,使用使用了以下示例方法的机器学习模型可以生成加权因子:加权因子可以初始被设置为彼此相等。例如,如果公式-1要考虑n个模块得分,则每个加权因子可以初始被设置为1/n。然后,公式-1用于计算设备得分,然后将其与训练设备得分进行比较。如果所计算的设备得分与训练设备得分具有大于准确率阈值的偏差,则更改加权因子,并且重新计算设备得分。
可以重复更改加权因子和重新计算设备得分的过程直到所计算的设备得分与训练设备得分的偏差在准确率阈值内。然后可以保留允许所计算的设备得分满足准确率阈值的加权因子集并且用于训练阶段之后的设备得分的计算。其中加权因子从一个迭代到另一个迭代更改的方式可以由所使用的机器学习模型来确定。
虽然在公式-1的上下文中作为示例描述了生成加权因子的方法,但是预计的是,可以使用类似的方法来获得加权因子或其它公式的其它特性或常数,以用于计算设备得分。在其中训练数据集在给定设备类型的上下文中或与给定设备类型相关联的示例中,在这样的训练数据集上训练的机器学习模型可以产生也与该给定设备类型相关联或特定于该给定设备类型的加权因子。此外,在一些示例中,训练数据集可以包括设备的性能或故障的历史数据,或设备的性能或故障的历史和当前实时数据的组合。
在一些示例中,用于计算设备得分的公式可以另外指示,如果模块得分低于阈值,则设备得分被设置为预确定的值。在其中模块得分和设备得分在一到五标度上的示例中,用于计算设备得分的公式可以指示,如果模块得分是一,则设备得分也将被设置为一。这可能反映评估,即如果模块的状态、性能或健康处于最低级别,则该设备也可能由于其不健康的模块而脆弱或不稳定。这样,设备得分也可以被设置为一以反映设备的该脆弱性或不稳定性。
此外,在一些示例中,可以将所生成的设备得分与历史设备得分进行比较以确定设备得分与历史设备得分的偏差。在一些示例中,历史设备得分可以包括一个得分,诸如在设备得分的时间序列中的先前设备得分。在其它示例中,历史设备得分可以包括聚合设备得分,诸如平均或中位设备得分、设备得分的所有时间平均值、若干先前设备得分的移动平均值等。
如果设备得分与历史设备得分的偏差超过阈值,则设备得分可以被指定为无效。这可能有助于标准化设备得分,以过滤掉与历史或预期设备得分偏差太大的无效设备得分。虽然在一些示例中可以使用该类型的设备得分标准化,但是在其它示例中,可以保留未标准化的设备得分以反映设备状态、健康或性能中的非预期或突发的退化。这样的非预期或突发的退化可能是例如由机械故障、恶意软件感染等引起的。
现在转到方法100的框120,基于设备得分设备可以被分配给状态组。在一些示例中,状态组可以包括健康组和不健康组中的一个。在其中在一到五标度上测量设备得分的示例中,具有设备得分一的设备可以被分配给不健康组,而具有设备得分在二到五范围内的设备可以被分配给健康组。
在一些示例中,通过将设备的标识符与状态组相关联可以将设备分配给状态组。例如,设备的标识符可以存储在数据表的列中,该列与状态组相关联。在一些示例中,设备的标识符可以包括序列号、设备昵称等。
此外,在一些示例中,状态组可以不同于健康和不健康组。这样的状态组的示例可以包括基于性能的状态组等。例如,具有设备得分五的设备可以被放置在高性能组中,而具有设备得分四的另一设备可以被放置在相对较低的性能组中。
另外,在一些示例中,如果一个模块得分低于给定阈值,则设备可以被分配给不健康组。换句话说,具有其中模块得分低于阈值的模块的设备可以被分配给不健康状态组,即使该设备得分本身不指示该设备要被分配给不健康组。
例如,当在一到五标度上确定模块得分时,阈值可以设置为低于二。在该示例中,如果设备具有有模块得分1且设备得分3的模块,则该设备可能被分配给不健康组,因为其模块的模块得分低于阈值,即低于二。在一些示例中,当模块得分低于阈值时,由于设备可以在不将状态组分配基于设备分数的情况下被分配给不健康状态组,因此可能不生成设备得分。
现在转到方法100的框125,可以输出与设备的标识符相关联的状态组。为了输出状态组和相关联的标识符,状态组和标识符可以存储在存储器中、发送到输出终端、传送到另一组件或到另一***等。在一些示例中,可以在状态组表的列中呈现设备的标识符,该列可以与诸如健康或不健康之类的状态组相关联。
此外,在一些示例中,可以图形化地呈现设备的标识符和状态组,以允许视觉确定设备是否已经被分配给健康或不健康组。在一些示例中,可以与设备的标识符相关联地输出设备得分。除了状态组之外或代替状态组,可以输出设备得分。
另外,在一些示例中,如果确定设备已经被分配给不健康组,则可以发起设备的修复。修复可以包括维修或替换设备或设备的一些或所有模块。状态数据可以传送到修复器,该修复器然后可以发起修复处理器。
修复器可以包括***或设备。例如,如果不健康状态组是太多操作***崩溃的结果,则修复器可以包括在设备上调试或重新安装操作***的计算***。在一些示例中,修复器可以包括操作者。例如,如果设备由于具有非常短的电池寿命的电池而已经被分配给不健康组,则在接收到该设备的状态组指定时,操作者可以物理替换该设备的电池。在一些示例中,修复器可以包括***和操作者的混合或组合。
现在转到图2和3,示出了示例数据表以图示方法100和本文中所描述的其它方法的示例操作。图2和3是说明性示例,并且方法100和本文中所描述的其它方法不限于图2和3中所示出的示例。
图2示出了示例数据表205,其总结了在三个时间点上与三个模块相关的状态数据210。三个模块是电池215,其状态数据包括以小时测量的电池寿命;设备引导功能220,其状态数据包括以秒测量的设备引导时间;以及盘225,其状态数据包括以千兆字节测量的盘空闲空间。三个时间点是日期-1 230、日期-2 235和日期-3 240。三个日期也可以表示可能在相同日期的不同时间。
图2示出了类似于表205的另一示例数据表245,除了在日期-3(240)上用于电池215的状态数据210之外。表205示出电池215的电池寿命在日期-1上为八小时、在日期-2上为七小时以及在日期-3上为六百小时。存在高可能性的是,六百小时是错误的电池寿命状态数据,因为它与日期-1上和日期-2上的八小时和七小时的电池寿命偏差很大。
通过调节表205中的状态数据210,可以获得表245中的雕像数据。例如,错误的六百小时电池寿命可以被删除并且由不同的值来替换。在一些示例中,可以使用最后观察推进的推算,由此电池寿命的最后可接受的、所观察的值,即在日期-2上的七小时,被推进并推算到日期-3上的电池寿命。这样,日期-3上的电池寿命也可以在经调节的状态数据的表245中被指示为七小时。
图2还示出了另一示例数据表250,该示例数据表250总结了在日期-1 230、日期-2235和日期-3 240这三个日期上用于电池215、设备引导功能220和盘225这三个模块的模块得分255。模块得分255可以包括在一到五标度上的值,其中五表示最高或最佳状态或性能并且一表示最低或最差状态或性能。如上面所讨论的,在相对基础上并且使用与其它可比较模块的状态数据的比较,可以生成模块得分255。
图3示出了表250并且也示出了示例数据表305。表305总结了用于具有三个模块215、220和225的设备的设备得分310,其中设备得分310在日期-1 230、日期-2 235和日期-3 240这三个日期上示出。设备可以具有设备标识符315。设备得分310也可以在一到五标度上呈现。通过将与来自表250的日期-1相关联的模块得分255***公式-1或另一类似公式中,可以生成日期-1上的设备得分四。如上面所描述的,使用在训练数据集上训练的机器学习模型可能已经生成公式中使用的加权因子。以类似的方式并且基于分别来自表250的日期-2和日期-3列的模块得分255,可以生成日期-2 235和日期-3 240的设备得分310。
图3也示出了类似于表305的示例数据表320,除了在日期-3 240上的设备得分310的值从表305中的二改变为表320中的一之外。在一些示例中,基于来自表250的模块得分255,可以对设备得分310做出该改变。因为用于盘225的模块得分255在日期-3 240上是一,即最低级别,所以在日期-3 240上的设备得分310也可以调整为一,即最低值。如较早所讨论的,该类型的调整可以表示评估,即具有其中模块得分低于给定阈值的模块的设备可能脆弱或不稳定。这样,设备得分310可以被设置为也低于阈值(在该示例中设置为最低值一)以反映由于具有低模块得分的模块而导致的设备的脆弱性或不稳定性。
另外,图3示出了示例数据表325,其总结了在日期-1 230、日期-2 235和日期-3240的设备的状态组330。在表325中,设备标识符315在日期-1 230和日期-2 235上与状态组健康335相关联,并且在日期-3 240上与状态组不健康340相关联。基于来自表320的设备得分310,可以确定状态组330。在一些示例中,具有设备得分二或更高的设备可以被分配给健康状态组,如针对表325中的日期-1 230和日期-2 235所示出的。具有设备得分低于2的设备可以被分配给不健康状态组,如针对表325中日期-3 240所示出的。
虽然表250示出了列出三个模块的三行,但是预计的是,在其它示例中,表250可以包括列出不同、更少或更多模块的更少或更多行。此外,虽然表325示出了列出设备标识符315的一行,但是预计的是,在其它示例中,表325可以包括列出用于多个设备的标识符的多行。例如,这些可能是作为DaaS生态***的一部分的设备。另外,在其它示例中,数据表可以具有状态数据、模块得分和设备得分,以用于少于或大于图2和3的表中所示出的三个日期。
现在转到图4,示出了包括DaaS提供商405的示例DaaS生态***的示意性表示,其服务客户410-1、410-2至410-n,统称为客户410。
DaaS提供商405可以向客户提供多个设备415-1、415-2至415-n,统称为设备415。虽然在图4中示出了仅用于客户410-2的设备,但是其它客户也可以被提供有设备。此外,虽然设备415被示出为通过客户410-2被连接到DaaS提供商405,但是预计的是,设备415可以与DaaS提供商405直接通信。
设备可以具有多个关联的模块。例如,设备415-2可以具有模块420-1至420-n,统称为模块420。类似地,设备415-n可以具有模块425-1至425-n,统称为模块425。虽然在图4中未示出,但是诸如设备415-1之类的其它设备也可以具有模块。
与这些模块相关的状态数据可以用于生成模块得分,其继而可以用于生成设备得分。设备得分继而可以用于将DaaS生态***中的设备分配给状态组。设备得分和状态组可以允许DaaS生态***的操作者或修复器量化设备415的状态或性能,并且确定设备415中的哪些要优先修复。例如,可以优先修复具有最低设备得分的设备或者被分配给不健康状态组的设备。
方法100和本文中所描述的其它方法可以允许设备得分的生成,所述设备得分可以包括总结了用于多个设备模块的状态数据的一个数字。在具有大量具有多个模块(其状态数据在长时间段内被收集以用于许多数据收集时间点)的设备的生态***的情况下,与生态***设备的状态相关的数据集可能变得大且复杂。本文中所描述的设备得分可以总结该庞大的状态信息,这继而可以允许使用更少的存储器和更少的处理能力以设备得分的形式存储、检索、操纵或输出该状态信息。
此外,由于可以以相对于可比较模块的方式生成模块得分,模块得分以及继而设备得分可以用于确定设备的健康并且决定何时要修复该设备。另外,由于机器学习模型可以用于生成或导出用于计算设备得分的公式,例如通过确定公式-1中的加权因子,方法100和本文中所描述的其它方法可以减少对设备手动评分的需要。
现在转到图5,示出了可以用于评估设备的状态的***500。***500包括与处理器510通信的存储器505。处理器510可以包括中央处理单元(CPU)、图形处理单元(GPU)、微控制器、微处理器、处理核心、现场可编程门阵列(FPGA)或能够执行指令的类似设备。处理器510可以与存储器505协作以执行指令。
存储器505可以包括非暂时性机器可读存储介质,其可以是存储可执行指令的电子、磁性、光学或其它物理存储设备。机器可读存储介质可以包括,例如,随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪速存储器、存储驱动、光盘等。机器可读存储介质可以用可执行指令编码。在一些示例***中,存储器505可以包括数据库。
存储器505可以存储用于设备的模块的状态数据515。在一些示例中,处理器510可以调节状态数据515以生成经调节的状态数据520。为了调节状态数据515,处理器510可以例如从状态数据515移除超出范围或冗余的数据点。此外,处理器510可以基于状态数据515而生成模块得分525。在其中状态数据515被调节以形成经调节的状态数据520的示例中,基于经调节的状态数据520可以生成模块得分525。
此外,基于模块得分525,处理器510可以生成设备得分530。例如,通过将变换应用于模块得分525可以生成设备得分530。在一些示例中,通过将加权因子535应用于模块得分525可以生成设备得分530。例如,处理器510可以通过将模块得分525和加权因子535***公式-1来生成设备得分530。
此外,处理器510可以基于设备得分530而将设备分配给状态组540。在一些示例中,存储器505可以存储状态组540的状态组标识符。另外,在一些示例中,状态组540可以包括健康组和不健康组中的一个。处理器510也可以输出与设备的标识符545相关联的状态组540。
在图5中,以虚线示出了经调节的状态数据520、模块得分525、设备得分530、加权因子535、状态组540和标识符545,以表明虽然该信息可以存储在***500的存储器505中,但是在一些示例中,一些或所有信息可以存储在***500之外或***500中的存储器505之外。另外,在一些示例中,状态数据515可以不存储在存储器505中,并且可以存储在***500之外或***500中的存储器505之外。
在一些示例中,通过将状态数据515与关联于可与其模块得分正在被生成的模块比较的其它模块的其它状态数据进行比较,处理器510可以生成模块得分525。在其中处理器510调节状态数据515以形成经调节的状态数据520的示例中,经调节的状态数据520可以与关联于可与其模块得分正在被生成的模块比较的其它模块的其它状态数据进行比较。
此外,在一些示例中,处理器510也可以生成用于设备的另外模块的另外模块得分。为了生成设备得分530,处理器510然后可以对由加权因子535所修改的模块得分525和由对应的另外加权因子所修改的另外模块得分进行求和。在一些示例中,处理器510可以使用公式-1来计算和,其中n被设置为大于1。
为了生成加权因子535,在一些示例中,处理器510可以使用在数据集上训练的机器学习模型,所述数据集包括与对应的训练模块得分相关联的训练设备得分。在一些示例中,加权因子535可以由除处理器510以外的处理器或由除***500以外的***生成。
此外,在一些示例中,处理器510可以确定模块得分525是否低于阈值。如果模块得分525低于阈值,则处理器510然后可以将该设备分配给不健康组。
关于***500所描述的特征和功能可以类似于关于方法100和本文中所描述的其它方法所描述的对应的特征和功能。另外,本文中所描述的示例***可以施行方法100和本文中所描述的其它方法和功能,例如关于图1-3。示例***也可以在DaaS生态***的上下文中使用,例如如图4中所示出的。
现在转到图6,示出了非暂时性计算机可读存储介质(CRSM)600,其包括可由处理器执行的指令。CRSM可以包括存储可执行指令的电子、磁性、光学或其它物理存储设备。指令可以包括指令605,其用于使处理器获得用于设备的模块的状态数据。指令也可以包括指令610,其用于使处理器基于状态数据而生成模块得分。在一些示例中,通过将状态数据与关联于可与其模块得分正在被生成的模块比较的其它模块的其它状态数据进行比较,可以生成模块得分。
此外,指令也可以包括指令615,其用于通过将变换应用于模块得分来使处理器生成设备得分。在一些示例中,变换可以包括将加权因子应用于模块得分。例如,处理器可以通过将模块得分和加权因子***公式-1中来生成设备得分。
指令也可以包括指令620,其用于使处理器基于设备得分而将设备分配给状态组。在一些示例中,状态组可以包括健康组和不健康组中的一个。另外,指令还可以包括指令625,其用于使处理器输出与设备的标识符相关联的状态组。
在一些示例中,指令还可以包括指令,其用于使处理器生成用于设备的另外模块的另外模块得分。为了生成设备得分,指令可以然后使处理器对由加权因子所修改的模块得分和由对应的另外加权因子所修改的另外模块得分进行求和。在一些示例中,处理器可以使用公式-1来计算和,其中n被设置为大于1。
此外,在一些示例中,指令还可以使处理器使用机器学习模型来生成加权因子。机器学习模型可能已经在包括与对应的训练模块得分相关联的训练设备得分的数据集上被训练。
此外,在一些示例中,指令还可以使处理器确定模块得分是否低于阈值。如果模块得分低于阈值,则指令也可以使处理器将设备分配给不健康组。
关于CRSM 600所描述的特征和功能可以类似于关于方法100和本文中所描述的其它方法和***所描述的对应的特征和功能。另外,本文中所描述的示例CRSM也可以包括指令,其用于使处理器和/或***施行本文中所描述的方法,以施行图1-3中所展示的功能,并且用于DaaS生态***的上下文中,例如如图4中所示出的。
此外,本文中所描述的方法、***和CRSM可以与本文中所描述的其它方法、***和CRSM中的一个或组合相关联地包括特征和/或施行本文中所描述的功能。
本文中所描述的方法、***和CRSM可以允许生成一个数值设备得分,以总结和反映设备的多个模块的状态数据。这样的设备得分可以减少用于存储、检索、操纵和分析关于设备的状态和健康的信息的计算能力和存储器的量。
针对具有大量设备的设备生态***(诸如DaaS生态***),所述设备的模块状态数据可以在长时间段内以时间序列被收集,状态数据的量可能对应大。本文中所描述的设备得分在给定日期上将状态信息总结为用于给定设备的一个数值设备得分的能力可以在存储器和计算能力上产生对应大节省。
此外,由于机器学习模型可以用于导出用于计算设备得分的公式,例如通过确定公式-1中的加权因子,本文中所描述的方法、***和CRSM可以减少对设备手动评分的需要。大量设备的手动评分可能耗时并且容易错误或不一致。错误和不一致可能由于诸如评分者之间的主观可变性、给定评分者随着时间的推移的可变性等之类的因素而出现。包括在设备评分过程中机器学习的使用的本文中所描述的方法、***和CRSM的使用可以使评分过程和得分本身更客观和一致。
此外,由于模块得分可以是相对的并且在与可比较模块比较地生成,基于那些相对模块得分而生成的设备得分可以提供设备的状态和健康的指示。健康或状态的该指示可以继而用于确定设备是否要修复。另外,可以容易地对数值设备得分进行排序和分类,这可以促进审查和分析设备的状态和健康。这继而可以促进修复器的能力,以确定哪些设备要修复并且以优先该修复过程。
应当认识到,上面所提供的各种示例的特征和方面可以组合成也落入当前公开的范围内的另外示例。

Claims (15)

1.一种方法,包括:
获得用于设备的模块的状态数据;
基于状态数据而生成模块得分;
通过将加权因子应用于模块得分来生成设备得分;
基于设备得分而将设备分配给状态组,所述状态组包括健康组和不健康组中的一个;以及
输出与设备的标识符相关联的状态组。
2.根据权利要求1所述的方法,还包括:
生成用于设备的另外模块的另外模块得分;以及
其中生成设备得分包括计算由加权因子所修改的模块得分和由对应的另外加权因子所修改的另外模块得分的和。
3.根据权利要求1所述的方法,还包括使用在数据集上训练的机器学习模型来生成加权因子,所述数据集包括与对应的训练模块得分相关联的训练设备得分。
4.根据权利要求1所述的方法,还包括:
确定状态组是否包括不健康组;以及
如果状态组包括不健康组,则发起设备的修复。
5.根据权利要求1所述的方法,还包括:
将设备得分与历史设备得分进行比较以确定设备得分与历史设备得分的偏差;以及
如果偏差超过阈值偏差,则指定设备得分为无效。
6.一种***,包括:
存储器,其用于存储用于设备的模块的状态数据;
处理器,其与存储器通信,所述处理器用于:
调节状态数据;
基于状态数据而生成模块得分;
通过将加权因子应用于模块得分来生成设备得分;
基于设备得分而将设备分配给状态组,所述状态组包括健康组和不健康组中的一个;以及
输出与设备的标识符相关联的状态组。
7.根据权利要求6所述的***,其中所述处理器要通过将状态数据与关联于可与模块比较的其它模块的其它状态数据进行比较来生成模块得分。
8.根据权利要求6所述的***,其中:
所述处理器还要生成用于设备的另外模块的另外模块得分;以及
为了生成设备得分,处理器要对由加权因子所修改的模块得分和由对应的另外加权因子所修改的另外模块得分进行求和。
9.根据权利要求6所述的***,其中所述处理器还要使用在数据集上训练的机器学习模型来生成加权因子,所述数据集包括与对应的训练模块得分相关联的训练设备得分。
10.根据权利要求6所述的***,其中所述处理器还要:
确定模块得分是否低于阈值;以及
其中如果模块得分低于阈值,则处理器要将设备分配给不健康组。
11.一种包括可由处理器执行的指令的非暂时性计算机可读存储介质,所述指令用于使处理器进行以下操作:
获得用于设备的模块的状态数据;
通过将状态数据与关联于可与模块比较的其它模块的其它状态数据进行比较,基于状态数据而生成模块得分;
通过将变换应用于模块得分来生成设备得分;
基于设备得分而将设备分配给状态组,所述状态组包括健康组和不健康组中的一个;以及
输出与设备的标识符相关联的状态组。
12.根据权利要求11所述的非暂时性计算机可读存储介质,其中所述变换包括将加权因子应用于模块得分。
13.根据权利要求12所述的非暂时性计算机可读存储介质,
其中所述指令还要使处理器生成用于设备的另外模块的另外模块得分;以及
其中为了生成设备得分,所述指令要使处理器对由加权因子所修改的模块得分和由对应的另外加权因子所修改的另外模块得分进行求和。
14.根据权利要求12所述的非暂时性计算机可读存储介质,其中所述指令还要使处理器使用在数据集上训练的机器学习模型来生成加权因子,所述数据集包括与对应的训练模块得分相关联的训练设备得分。
15.根据权利要求11所述的非暂时性计算机可读存储介质,其中所述指令还要使处理器进行以下操作:
确定模块得分是否低于阈值;以及
其中如果模块得分低于阈值,则指令要使处理器将设备分配给不健康组。
CN201880092833.1A 2018-09-24 2018-09-24 设备状态评估 Pending CN112005223A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2018/052446 WO2020068036A1 (en) 2018-09-24 2018-09-24 Device status assessment

Publications (1)

Publication Number Publication Date
CN112005223A true CN112005223A (zh) 2020-11-27

Family

ID=69953080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880092833.1A Pending CN112005223A (zh) 2018-09-24 2018-09-24 设备状态评估

Country Status (4)

Country Link
US (1) US20210192390A1 (zh)
EP (1) EP3756098A4 (zh)
CN (1) CN112005223A (zh)
WO (1) WO2020068036A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11693721B2 (en) * 2021-09-25 2023-07-04 Intel Corporation Creating robustness scores for selected portions of a computing infrastructure
US12003489B2 (en) 2021-12-07 2024-06-04 Intel Corporation Mechanisms to reduce exposure of sensitive telemetry data in computing networks
JP7292454B1 (ja) 2022-03-04 2023-06-16 MONET Technologies株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728658B1 (en) * 2001-05-24 2004-04-27 Simmonds Precision Products, Inc. Method and apparatus for determining the health of a component using condition indicators
US20040268358A1 (en) * 2003-06-30 2004-12-30 Microsoft Corporation Network load balancing with host status information
US20120017127A1 (en) * 2010-07-16 2012-01-19 Hitachi, Ltd. Computer system management method and management system
CN102629364A (zh) * 2012-03-13 2012-08-08 凯里供电局 一种电力设备状态的量化评分方法
US20150200824A1 (en) * 2014-01-10 2015-07-16 Microsoft Corporation Overall system health monitoring of an online service
CN104919384A (zh) * 2012-11-19 2015-09-16 Abb技术有限公司 用于设备维护和/或风险减缓的电力***设备的评估
US20160155315A1 (en) * 2014-12-01 2016-06-02 Uptake, LLC Adaptive Handling of Operating Data
US20160306675A1 (en) * 2015-04-17 2016-10-20 Vmware, Inc. Proactive high availability in a virtualized computer system
WO2017184157A1 (en) * 2016-04-22 2017-10-26 Hewlett-Packard Development Company, L.P. Determining the health of a storage drive
WO2018077285A1 (zh) * 2016-10-31 2018-05-03 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、服务器及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10102056B1 (en) * 2016-05-23 2018-10-16 Amazon Technologies, Inc. Anomaly detection using machine learning
US11080127B1 (en) * 2018-02-28 2021-08-03 Arizona Public Service Company Methods and apparatus for detection of process parameter anomalies
US10600003B2 (en) * 2018-06-30 2020-03-24 Microsoft Technology Licensing, Llc Auto-tune anomaly detection

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6728658B1 (en) * 2001-05-24 2004-04-27 Simmonds Precision Products, Inc. Method and apparatus for determining the health of a component using condition indicators
US20040268358A1 (en) * 2003-06-30 2004-12-30 Microsoft Corporation Network load balancing with host status information
US20120017127A1 (en) * 2010-07-16 2012-01-19 Hitachi, Ltd. Computer system management method and management system
CN102629364A (zh) * 2012-03-13 2012-08-08 凯里供电局 一种电力设备状态的量化评分方法
CN104919384A (zh) * 2012-11-19 2015-09-16 Abb技术有限公司 用于设备维护和/或风险减缓的电力***设备的评估
US20150200824A1 (en) * 2014-01-10 2015-07-16 Microsoft Corporation Overall system health monitoring of an online service
US20160155315A1 (en) * 2014-12-01 2016-06-02 Uptake, LLC Adaptive Handling of Operating Data
US20160306675A1 (en) * 2015-04-17 2016-10-20 Vmware, Inc. Proactive high availability in a virtualized computer system
WO2017184157A1 (en) * 2016-04-22 2017-10-26 Hewlett-Packard Development Company, L.P. Determining the health of a storage drive
WO2018077285A1 (zh) * 2016-10-31 2018-05-03 腾讯科技(深圳)有限公司 机器学习模型训练方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
EP3756098A1 (en) 2020-12-30
WO2020068036A1 (en) 2020-04-02
EP3756098A4 (en) 2021-10-20
US20210192390A1 (en) 2021-06-24

Similar Documents

Publication Publication Date Title
CN109074302B (zh) 确定存储驱动器的健康的方法和***
US8751867B2 (en) Method and apparatus for root cause and critical pattern prediction using virtual directed graphs
CN112005223A (zh) 设备状态评估
US20150269120A1 (en) Model parameter calculation device, model parameter calculating method and non-transitory computer readable medium
CN107992410B (zh) 软件质量监测方法、装置、计算机设备和存储介质
WO2018063225A1 (en) Component failure prediction
CN111242323A (zh) 用于修理机器次优操作的主动自动***和方法
CN110083514B (zh) 软件测试缺陷评估方法、装置、计算机设备及存储介质
US11115288B2 (en) Parameter setting method, data analysis device and data analysis system
KR20210108874A (ko) 기계 학습을 사용하여 스토리지 장치 장애를 예측하는 시스템 및 장치
EP4078380A1 (en) Behavior-driven die management on solid-state drives
WO2020166236A1 (ja) 作業効率評価方法、作業効率評価装置、及びプログラム
CN108021484B (zh) 云端服务***中磁盘预期寿命值的延长方法及其***
CN117170915A (zh) 数据中心设备故障预测方法、装置和计算机设备
CN113946983A (zh) 产品可靠性薄弱环节评估方法、装置和计算机设备
CN113688564B (zh) 一种预测ssd硬盘剩余寿命的方法、装置、终端及存储介质
CN113760879B (zh) 数据库异常监测方法、***、电子设备及介质
CN115617604A (zh) 基于图像模式匹配的磁盘故障预测方法及***
US20180137024A1 (en) Non-intrusive performance monitor and service engine
CN112052147B (zh) 监控方法、电子设备及存储介质
WO2022221109A1 (en) Automated outlier removal for multivariate modeling
CN112069168A (zh) 一种设备运行数据云端存储方法
JP2009134518A (ja) 試験プログラムの検証方法及びその検証システム
CN118245297A (zh) 基于多维度监测数据的ssd寿命预测方法、装置及介质
CN114580792B (zh) 膨化机工作状态识别方法、装置、计算机设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination