CN116430976A - 预测数据中心内电源的故障 - Google Patents

预测数据中心内电源的故障 Download PDF

Info

Publication number
CN116430976A
CN116430976A CN202310034466.2A CN202310034466A CN116430976A CN 116430976 A CN116430976 A CN 116430976A CN 202310034466 A CN202310034466 A CN 202310034466A CN 116430976 A CN116430976 A CN 116430976A
Authority
CN
China
Prior art keywords
component
power supply
fan
life expectancy
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310034466.2A
Other languages
English (en)
Inventor
鲁群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aa Power Co ltd
Original Assignee
Aa Power Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aa Power Co ltd filed Critical Aa Power Co ltd
Publication of CN116430976A publication Critical patent/CN116430976A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3296Power saving characterised by the action undertaken by lowering the supply or operating voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Testing Electric Properties And Detecting Electric Faults (AREA)

Abstract

一种装置,包括电源和与该电源通信的精算电路,该电源具有第一组件和第二组件。精算电路基于第一组件和第二组件的运行参数的实时测量预测电源的预期寿命。

Description

预测数据中心内电源的故障
背景技术
本发明涉及用于冷却数据处理装置的电源,尤其是涉及依赖于风扇进行冷却的电源。
对于数据中心的预期是尽可能无限期地连续运行。然而,时常会有各种部件出现故障。需要在不中断运行的情况下更换这些部件。
数据中心包括许多电源,每个电源接收交流电并且将其转换为合适的直流电以供数据处理设备使用。在此过程中,电源承受了相当大的压力。因此,电源尤其容易出现故障。
由于预期之外的电源故障往往会导致数据处理装置停止运行,因此尤其不期望出现这种故障。因此,期望在出现故障之前对电源进行更换。另一方面,在故障出现之前过早地对电源进行更换也是不期望的。
发明内容
在一个方面中,本发明的特征在于电源和与该电源通信的精算电路。电源包括第一和第二组件。精算电路用于基于第一组件和第二组件的运行参数的实时测量预测电源的预期寿命。
电源的特征在于有若干个组件,每个组件有预期寿命。使用统计方法获取预期寿命的值。在任何这样的电源中,都会有一个或多个寿命尤其短的组件,比其他组件的寿命短得多。更换或维修这种组件在一定程度上是不现实的,这样的组件是“有寿组件(life-limiting component)”。有寿组件出现故障会损害电源的运行,并且通常会引发对电源进行更换的需求。
实施例包括第一组件和第二组件是电源的有寿组件的实施例。这些有寿组件是预期寿命最短的组件。在这些实施例之中,存在第一组件和第二组件包括风扇和电解电容的实施例,以及第一组件和第二组件包括多个电解电容的实施例。
此外,在实施例之中,还包括提供第一组件和第二组件的模型的数据库的实施例。
在一些实施例中,电源用于向精算电路提供第一数据流和第二数据流。这些数据流包括实时测量。
在其他实施例中,精算电路包括第一故障预测电路和第二故障预测电路,该第一故障预测电路和第二故障预测电路从电源接收实时数据并预测对应的第一组件和第二组件的预期寿命。
在一些实施例中,精算电路用于从具有电解电容和风扇的电源接收电容数据流和风扇数据流。精算电路包括接收随机风扇模型的实时风扇故障预测电路和接收随机电容模型的实时电容故障预测电路。基于实时风扇故障预测电路和实时电容故障预测电路的输出,精算电路输出选自由第一电压和第二电压组成的组中的多个电压。该多个电压形成指示电源预期寿命的图案,将该电源预期寿命作为安排更换电源的基础。
实施例还包括那些精算电路包括比较器的实施例,该比较器接收电源的多个组件的多个预测预期寿命,并且输出所述多个预测预期寿命中最小的预测预期寿命。这些组件包括其中的第一组件和第二组件。在这些实施例之中,多个组件仅由第一组件和第二组件组成。
其他实施例包括,第一传感器***耦合到第一组件以测量第一组件的运行参数,第二传感器***耦合到第二组件以用于测量第二组件的运行参数。
在第一组件是风扇的那些实施例中,实施例是装置还包括测量风扇的温度的温度计、耦合以测量风扇的累计使用时间的霍布斯计、以及测量风扇每单位时间内的转数的转速计。
在第二组件是电解电容的那些实施例中,实施例是装置还包括测量电解电容的温度的温度计、用于测量电解电容两端电压的电压计、以及用于测量通过电解电容的电流的电流计。
另一方面,本发明的特征在于一种过程,该过程包括:获取第一组运行参数和第二组运行参数的实时测量。第一组包括向IT设备供电的电源的第一组件的运行参数,第二组包括该电源的第二组件的操作参数。该过程还包括:预测第一组件和第二组件的预期寿命,至少部分地基于第一组件和第二组件的预期寿命预测电源的预期寿命。之后,确定电源的预期寿命低于预期寿命阈值。之后,发出警报以引起对预期寿命的注意。
在该过程的实践之中,实践还包括选择第一组件为风扇,选择第二组件为电解电容。
虽然根据电源描述了本发明,但是依据的原理也适用于具有容易出现故障的组件并且需要对这种组件的寿命进行估计以优化更换时间的其他电子设备或机械设备。
以抽象的方式实现本文中描述的***和方法在理论上是可能的。然而,已经特意省略了这种实现方式的描述。因此,权利要求仅涵盖非抽象的实现方式。任何人将权利要求解释为涵盖抽象主题,仅仅说明有可能是以与说明书矛盾的方式不恰当地解释了权利要求。
如在本文中使用的,术语“非抽象的”应该被解释为表示与在本申请的递交日法院所定义的“抽象的”的相反含义。
在本文中描述的各种设备被实现为包括物质并且在运行中消耗能量的电子电路。描述中省略了不是由物质制成并且在运行中不消耗能量的设备。
从以下具体实施方式和附图中,本发明的这些和其他特征将变得明显,其中:
附图说明
图1示出了具有伴随精算电路的电源;
图2示出了安装在数据中心的图1的精算电路;
图3示出了图2的数据中心中的连接到图1的精算电路的电源;
图4示出了由图1的精算电路执行的方法。
具体实施方式
图1示出了电源10,该电源10具有风扇12、电解电容14、耦合到风扇12的风扇传感器***16、以及耦合到电容14的电容传感器***18。
风扇传感器***16测量与风扇运行关联的运行参数。这种参数包括风扇12已经运行了多久、风扇邻近处的温度、以及风扇的速度。这些参数定义了作为风扇数据流20提供给精算电路22的所测量的时变函数。
为了感测这些运行参数,风扇传感器***16包括测量风扇的温度的风扇温度计54、测量风扇累计使用时间的霍布斯计(Hobbs meter)56、以及测量风扇12每单位时间内的转数的转速计58。
类似地,电容传感器***18测量与电容运行关联的运行参数。这种参数包括电容14两端的电压(包括电压的符号)、流入电容14的电流(包括电流的符号)、以及电容外壳的温度。这些参数定义了作为电容数据流24提供给精算电路22的三个附加的所测量的时变函数。
为了感测这些运行参数,电容传感器***18包括测量电容的温度的电容温度计60、测量电容14两端电压的电压计62、以及测量流入电容14的电流的电流计64,从而提供了确定电容内阻的方式。
精算电路22包括实时风扇故障预测电路26和实时电容故障预测电路28。实时风扇故障预测电路26接收风扇数据流20和来自风扇数据库32的随机风扇模型30。实时电容故障预测电路28接收电容数据流24和来自电容数据库36的随机电容模型34。
随机风扇模型30通常由风扇制造商提供。这种模型反映了制造商基于与风扇运行关联的参数对风扇剩余寿命的预测。类似地,随机电容模型34通常由电容制造商提供,反映了制造商基于与电容运行关联的参数对电容剩余寿命的预测。
实时风扇故障预测电路26使用风扇数据流20和随机风扇模型30实时动态地调整风扇的预期寿命38。类似地,实时电容故障预测电路28使用电容数据流24和随机电容模型34实时动态地调整电容的预期寿命40。
在一些实施例中,随机风扇模型30包括从过去已经出现故障的类似的风扇处收集的数据。这一数据与预期寿命密切相关。因此,通过将风扇数据流20与包括随机风扇模型30的存储数据进行比较,实时风扇故障预测电路26可以以合理的准确度预测风扇12的预期寿命。
在一些实施例中,随机电容模型34包括从过去已经出现故障的类似的电容处收集的数据。这一数据与预期寿命密切相关。因此,通过将电容数据流24与包括随机电容模型34的存储数据进行比较,实时电容故障预测电路28可以以合理的准确度预测电容14的预期寿命。
在其他实施例中,随机电容模型34基于对施加在电容14两端的电压、电容14的温度、以及对流入电容14的电流中的纹波和/或流入电容14的电流浪涌的检测的观察结果,预测电容的预期寿命。在电源10运行时观察到这些观察结果,并将这些观察结果用作确定从电容的初始期望寿命中扣减预期寿命的基础。
实时电容故障预测电路28向比较器42提供电容的预期寿命40。类似地,实时风扇故障预测电路26向比较器42提供风扇的预期寿命38。比较器输出多个电压,该多个电压的图案指示风扇的预期寿命38和电容的预期寿命40中较小的一个。因此将电压的这一图案作为预测电源预期寿命44。这一预测电源预期寿命44为在故障概率上升超过所选阈值之前的适当时间安排电源更换提供了基础。
图2示出了具有容纳IT设备的数据室48的互联网数据中心46,该IT设备包括例如服务器52和路由器54的用电设备50。这些用电设备通常安装在机架56上。在一些实施例中,电源10及其伴随精算电路22在互联网数据中心46内运行。
数据中心46接收从供电单位54传输的交流电。这一交流电通常不适合于运行用电设备50,必须被转换为合适的直流电。电源10执行这一功能。在典型的数据中心46内有许多这种电源10,每个电源10将交流电转换为合适的直流电。这种电源10通常被称为ac/dc转换器。
在一些实施例中,精算电路22位于电源10本地。因此,每个电源10将具有其独属的精算电路22。然而,在其他实施例中,精算电路22是连接到电源10和多个其他电源的共享资源。在这些实施例之中,如图3所示,精算电路22由数据中心46中的所有电源10共享。
在一些实施例中,精算电路22接收指示电源的其他属性的信息,例如电源的制造日期或电源在数据中心46的位置。例如,如果已知在特定时期内制造的电源与在其他时期内制造的电源具有不同的寿命,则关于电源制造日期的信息可能是有用的。在数据中心46内的位置的信息对于识别数据中心的冷却***的缺陷是有用的。例如,如果确定数据中心46的特定侧厅中的所有电源都在变热,则可以推断该侧厅中的冷却***可能有问题,因此可以对应地派出维护人员。
图4示出了一种用于通知更换电源10的建议的方法,该方法开始于获取电源的两个或多个组件的运行参数的测量(步骤66),将这些测量用作动态预测该两个或多个组件相应的预期寿命的基础(步骤68、70)。随后,基于预测的预期寿命,预测电源的预期寿命(步骤72),并且将电源的预期寿命和某个用户定义的阈值进行比较(步骤74)。如果电源的预期寿命比阈值短,则发出警报(步骤76)。否则,获取运行参数的进一步测量(步骤66)。
本文中描述的实施例阐明了本发明的原理而不限制本发明的范围,本发明的范围由所附权利要求的范围定义。

Claims (18)

1.一种装置,包括电源和与所述电源通信的精算电路,所述电源包括第一组件和第二组件,其中,所述精算电路用于至少部分地基于所述第一组件和所述第二组件的运行参数的实时测量,预测所述电源的预期寿命。
2.根据权利要求1所述的装置,其中,所述第一组件和所述第二组件包括风扇和电解电容。
3.根据权利要求1所述的装置,其中,所述第一组件和所述第二组件包括多个电解电容。
4.根据权利要求1所述的装置,还包括:
提供所述第一组件和所述第二组件的模型的数据库。
5.根据权利要求1所述的装置,其中,所述电源用于向所述精算电路提供第一数据流和第二数据流,所述第一数据流和所述第二数据流包括所述实时测量。
6.根据权利要求1所述的装置,其中,所述精算电路包括第一故障预测电路和第二故障预测电路,所述第一故障预测电路和所述第二故障预测电路从所述电源接收实时数据并预测对应的所述第一组件和所述第二组件的预期寿命。
7.根据权利要求1所述的装置,其中,所述精算电路用于从所述电源接收电容数据流和风扇数据流,所述电源具有电解电容和风扇,其中,所述精算电路包括接收随机风扇模型的实时风扇故障预测电路和接收随机电容模型的实时电容故障预测电路,其中,基于所述实时风扇故障预测电路和所述实时电容故障预测电路的输出,所述精算电路输出多个电压,所述多个电压从由第一电压和第二电压组成的组中选择,所述多个电压形成指示电源预期寿命的图案,将所述电源预期寿命作为安排更换所述电源的基础。
8.根据权利要求1所述的装置,其中,所述精算电路包括比较器,所述比较器接收所述电源的多个组件的多个预测预期寿命,并且输出所述多个预测预期寿命中最小的预测预期寿命,所述多个组件包括所述第一组件和所述第二组件。
9.根据权利要求1所述的装置,还包括:
第一传感器***,所述第一传感器***耦合到所述第一组件以测量所述第一组件的所述运行参数,以及
第二传感器***,所述第二传感器***耦合到所述第二组件以测量所述第二组件的所述运行参数。
10.根据权利要求1所述的装置,其中,所述第一组件是风扇,所述装置还包括:
测量所述风扇的温度的温度计、耦合以测量所述风扇的累计使用时间的霍布斯计、以及测量所述风扇每单位时间内的转数的转速计。
11.根据权利要求1所述的装置,其中,所述第二组件是电解电容,所述装置还包括:
测量所述电解电容的温度的温度计、用于测量所述电解电容两端电压的电压计、以及用于测量通过所述电解电容的电流的电流计。
12.根据权利要求1所述的装置,其中,所述电源是数据中心内的多个电源之一,并且其中,精算电路用于至少部分地基于从所述数据中心内的其他电源获取的信息预测所述预期寿命。
13.根据权利要求1所述的装置,其中,所述精算电路用于至少部分地基于从所述电源的制造商获取的信息预测所述预期寿命,所述信息指示与所述电源类似的电源的预期寿命。
14.根据权利要求1所述的装置,其中,所述第一组件和所述第二组件是预期寿命最短的组件。
15.根据权利要求1所述的装置,其中,所述精算电路包括非通用计算机***。
16.一种非抽象方法,包括:
获取第一组运行参数和第二组运行参数的实时测量,其中,所述第一组包括向IT设备供电的电源的第一组件的运行参数,所述第二组包括所述电源的第二组件的操作参数,
预测所述第一组件的预期寿命,
预测所述第二组件的预期寿命,
至少部分地基于所述第一组件和所述第二组件的所述预期寿命,预测所述电源的预期寿命,
确定所述电源的所述预期寿命低于阈值,以及,
提供警报以引起对所述预期寿命的注意。
17.根据权利要求16所述的方法,还包括:
选择所述第一组件为风扇,选择所述第二组件为电解电容。
18.根据权利要求16所述的方法,其中,所有的步骤都以非抽象的方式在人脑之外在非通用计算机***中执行。
CN202310034466.2A 2022-01-12 2023-01-10 预测数据中心内电源的故障 Pending CN116430976A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202263298768P 2022-01-12 2022-01-12
US63/298,768 2022-01-12

Publications (1)

Publication Number Publication Date
CN116430976A true CN116430976A (zh) 2023-07-14

Family

ID=87069505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310034466.2A Pending CN116430976A (zh) 2022-01-12 2023-01-10 预测数据中心内电源的故障

Country Status (2)

Country Link
US (1) US20230221790A1 (zh)
CN (1) CN116430976A (zh)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW525329B (en) * 2000-05-29 2003-03-21 Omron Tateisi Electronics Co Power supply module and power supply unit using the same
JP4349408B2 (ja) * 2005-12-28 2009-10-21 日本電気株式会社 寿命予測監視装置、寿命予測監視方法及び寿命予測監視プログラム
WO2008016050A1 (fr) * 2006-07-31 2008-02-07 Mitsubishi Electric Corporation Dispositif d'alimentation et système de séquenceur
WO2012086072A1 (ja) * 2010-12-24 2012-06-28 富士通株式会社 ストレージ装置,制御装置および制御方法
CN103076573A (zh) * 2011-10-25 2013-05-01 鸿富锦精密工业(深圳)有限公司 能自动监测使用寿命的电源及电源使用寿命监测方法
US9665144B2 (en) * 2011-12-21 2017-05-30 Intel Corporation Methods and systems for energy efficiency and energy conservation including entry and exit latency reduction for low power states
JP6354397B2 (ja) * 2014-07-04 2018-07-11 富士通株式会社 電源装置、制御装置及びそのプログラム
JP6227581B2 (ja) * 2015-03-20 2017-11-08 ファナック株式会社 直流コンデンサの寿命判定手段を有するモータ駆動装置
JP6262686B2 (ja) * 2015-04-27 2018-01-17 ファナック株式会社 平滑コンデンサの寿命予測手段を有するモータ制御装置
US10345360B2 (en) * 2015-06-04 2019-07-09 Fujitsu Limited Capacitor life diagnosis device, capacitor life diagnosis method, and program
US20170154475A1 (en) * 2015-11-27 2017-06-01 Flytech Technology Co., Ltd System for calculating life percentage of electronic device
JP7338189B2 (ja) * 2019-03-25 2023-09-05 Tdk株式会社 電源装置

Also Published As

Publication number Publication date
US20230221790A1 (en) 2023-07-13

Similar Documents

Publication Publication Date Title
US7142125B2 (en) Fan monitoring for failure prediction
EP3079062A1 (en) Electronic system and method for estimating and predicting a failure of that electronic system
US20080244326A1 (en) Prognosis of faults in electronic circuits
CN109325601A (zh) 物流设备故障监测运维管理方法
CN113167834A (zh) 重型电机健全性分析平台及使用其的分析方法
CN109538459B (zh) 基于联网的机泵设备故障监测运维***及方法
US10401401B2 (en) System and methods thereof for monitoring of energy consumption cycles
CN108229538B (zh) 交通工具***预测装置和方法
WO2015023201A2 (en) Method and system for determining hardware life expectancy and failure prevention
EP2277778A2 (en) Vehicle health management systems and methods with predicted diagnostic indicators
CA2730165A1 (en) Automatic discovery of physical connectivity between power outlets and it equipment
CN101999101B (zh) ***运行预测的确定方法
CN111858230A (zh) 用于监控服务器基础设施的健康状况的方法和***
JP2017117013A (ja) 保守時期予測システム及び保守時期予測装置
EP3163897A1 (en) Building management device, wide-area management system, data acquisition method, and program
CN109976971B (zh) 硬盘状态监测方法和装置
CN110191017A (zh) 一种用于监测路由设备异常的监控***及方法
CN110807563A (zh) 一种基于大数据的设备寿命预测***及方法
CN116430976A (zh) 预测数据中心内电源的故障
KR20220167008A (ko) 선박용 고장 예측진단 시스템 및 그 예측진단 방법
CN113704487A (zh) 知识图谱的生成方法、装置、计算机设备及存储介质
JP2002267708A (ja) 電解コンデンサの劣化診断方法および装置
CN116203384A (zh) 使用加速可靠性模型和传感器数据的电路的寿命终止预测
JP6328036B2 (ja) 計量メータの状態変化検出装置及びプログラム
JP7378689B1 (ja) 処理装置及び処理システム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination