CN102687111B - 用于功率分析的技术 - Google Patents

用于功率分析的技术 Download PDF

Info

Publication number
CN102687111B
CN102687111B CN201080041811.6A CN201080041811A CN102687111B CN 102687111 B CN102687111 B CN 102687111B CN 201080041811 A CN201080041811 A CN 201080041811A CN 102687111 B CN102687111 B CN 102687111B
Authority
CN
China
Prior art keywords
data
power
physical unit
data center
parts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080041811.6A
Other languages
English (en)
Other versions
CN102687111A (zh
Inventor
迈克尔·T·罗温
克里斯多佛·罗卡
迈克尔·D·安东尼
亚当·马图夏克
迈克尔·亨里克森
威廉·怀特
阿罗克·古哈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Schneider Electric IT Corp
Original Assignee
American Power Conversion Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by American Power Conversion Corp filed Critical American Power Conversion Corp
Publication of CN102687111A publication Critical patent/CN102687111A/zh
Application granted granted Critical
Publication of CN102687111B publication Critical patent/CN102687111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • G06F11/3062Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations where the monitored property is the power consumption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3096Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents wherein the means or processing minimize the use of computing system or of computing system component resources, e.g. non-intrusive monitoring which minimizes the probe effect: sniffing, intercepting, indirectly deriving the monitored data from other directly available data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S40/00Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)

Abstract

公开了用于数据中心的功率分析的技术,在一个具体的示例性实施方案中,该技术可以被实现为用于对多个计算平台部件进行功率分析的方法,该方法包括接收与部件相关联的信息,使用计算机处理器检索与所述部件相关联的电子存储的数据,至少部分地基于所存储的数据估计所述部件的功率使用,以及输出功率使用的指示。

Description

用于功率分析的技术
本公开内容的领域
本公开内容大体上涉及功率分析并且更具体地涉及用于数据中心的功率分析的技术。
本公开内容的背景
数据中心正在迅速地成为最大的能量消耗者之一,尤其是在美国。当需求正在以惊人的速度增长时,数据中心的能量消耗是非常低效的。迄今为止,似乎没有用于使数据中心的能量完全高效同时满足业务需要的可行的整体方法。
考虑到上文,可以理解的是,可能具有与当前的数据中心的功率分析技术相关联的显著的问题和缺点。
本公开内容的概述
公开了用于数据中心的功率分析的技术。在一个具体的示例性的实施方案中,该技术可以实现为用于对多个计算平台部件进行功率分析的方法,所述方法包括接收与部件相关联的信息,使用计算机处理器检索与所述部件相关联的电子存储数据,至少部分地基于所述存储数据估计所述部件的功率使用,以及输出功率使用的指示(indicator)。
根据本具体的示例性的实施方案的其他方面,所述部件可以包括计算机处理器、电子存储部和联网部件中的至少一个。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括对设备的多个部件重复所述过程,以及汇集所述设备的部件的功率使用的功率估计,以提供所述设备的所估计的功率使用。
根据本具体的示例性的实施方案的另外的方面,所述设备可以包括服务器、网络设备、主机和存储设备中的至少一个。
根据本具体的示例性的实施方案的另外的方面,还包括对区域中的多个设备重复所述过程。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括接收与部件相关联的一个或多个测量结果,以及至少部分地基于所述一个或多个所接收的测量结果来估计所述部件的功率使用。
根据本具体的示例性的实施方案的另外的方面,所述一个或多个测量结果可以包括来自下列项中的至少一个的读数:温度传感器、处理器芯片、散热器、磁盘控制器、电源和网络部件。
根据本具体的示例性的实施方案的另外的方面,所述一个或多个测量结果可以包括CPU使用率、事务处理速率、通信速率、配置信息、活动进程和多种虚拟机中的至少一个。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括至少部分地基于所述部件的所述估计的功率使用和一个或多个所接收的测量结果中的一个或多个来估计部件的热变化曲线(thermal profile)。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括基于所述热变化曲线来估计功率使用。
根据本具体的示例性的实施方案的另外的方面,基于所述热变化曲线来估计功率使用可以包括使用所述热变化曲线来估计冷却成本。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括接收来自配电单元和计算机机房空气调节器中的至少一个的一个或多个测量结果。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括使用所接收的一个或多个测量结果来估计功率使用和热变化曲线中的至少一个。
根据本具体的示例性的实施方案的另外的方面,接收与部件相关联的信息可以包括通过网络接口发现部件。
根据本具体的示例性的实施方案的另外的方面,通过网络接口发现部件可以包括使用以下项中的至少一个:简单网络管理协议(SNMP)、存储管理计划规范(SMI-S)、智能平台管理接口(IPMI)、Windows管理规范(WMI)、安全外壳(SSH)、BACNet和ModBus。
根据本具体的示例性的实施方案的另外的方面,通过网络接口发现部件可以包括在来自远程地点的数据中心上进行的发现。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括在未检索到与所述部件相关联的电子存储的数据的情况下接受用于未被识别的部件的输入。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括发现与部件相关联的一个或多个逻辑要素,以及至少部分地基于所述一个或多个发现的逻辑要素来估计功率使用。
根据本具体的示例性的实施方案的另外的方面,所述一个或多个逻辑要素可以包括与部件相关联的操作***组成部分、与部件相关联的进程、与部件相关联的虚拟机和与部件相关联的应用程序中的至少一个。
根据本具体的示例性的实施方案的另外的方面,与所述部件相关联的电子存储的数据可以包括以下项中的至少一个的数据库:部件的配置文件、服务器阵列、计算机机房空气调节器、配电单元和数据中心物理基础设施。
根据本具体的示例性的实施方案的另外的方面,所述技术还可以包括基于以下项中的至少一个提供一个或多个建议:部件的估计的功率使用、设备的估计的功率使用、区域的估计的功率使用、数据中心的估计的功率使用、区域的热变化曲线和区域的热变化曲线。
根据本具体的示例性的实施方案的另外的方面,所述一个或多个建议包括以下项中的至少一个:去除未利用的部件、整合未充分利用的部件、升级低效的部件、更换低效的部件、将一地理位置内的部件重新布置以改进热变化曲线、和将工作负荷在地理区域内的部件上重新分布以改进热变化曲线。
根据本具体的示例性的实施方案的另外的方面,可以使用计算流体动力学估计所述热变化曲线。
根据本具体的示例性的实施方案的另外的方面,所述技术可以实现为至少一种非瞬时性处理器可读存储介质,所述至少一个非瞬时性处理器可读存储介质用于存储被配置为可由至少一个处理器读取以指示所述至少一个处理器执行用于进行所述方法的计算机进程的计算机程序指令(computer program of instructions)。
在另一个具体的示例性的实施方案中,所述技术可以实现为用于多个计算平台部件的功率分析的制造物品(article of manufacture),所述制造物品包括:至少一个非瞬时性处理器可读介质,以及存储在所述至少一个介质上的指令,其中所述指令被配置为可由至少一个处理器从所述至少一个介质读取并且由此使所述至少一个处理器操作从而:接收与部件相关联的信息,检索与所述部件相关联的电子存储的数据,至少部分地基于所述存储的数据估计所述部件的功率使用,以及输出功率使用的指示。
在又一个具体的示例性的实施方案中,所述技术可以实现为用于多个计算平台部件的功率分析的***,所述***包括:通信地耦合于网络的一个或多个处理器,其中所述一个或多个处理器被配置为:接收与部件相关联的信息,检索与所述部件相关联的电子存储的数据,至少部分地基于所述存储的数据估计所述部件的功率使用,以及输出功率使用的指示。
现在将参照在附图中所示的其示例性的实施方案更详细地描述本公开内容。虽然在下文参照示例性的实施方案描述了本公开内容,但是应当理解,本公开内容不限于此。可以获得本文的教导的本领域的技术人员将意识到,在本文描述的本公开内容的范围内并且本公开内容可以关于其具有重要的用途的另外的实现、修改和实施方案以及其他的使用领域。
附图简述
为了便于本公开内容的更充分理解,现在参照附图,在附图中相似的元件用相似的数字标示。这些附图不应当被解释为限制本公开内容,其意图仅是示例性的。
图1示出了描绘了根据本公开内容的实施方案的含有用于功率分析的平台的网络体系结构的框图。
图2示出了描绘了根据本公开内容的实施方案的含有用于功率分析的平台的网络体系结构的框图。
图3描绘了根据本公开内容的实施方案的计算机***的框图。
图4示出了根据本公开内容的实施方案的用于功率分析的模块。
图5描绘了根据本公开内容的实施方案的用于功率分析的方法。
图6描绘了根据本公开内容的实施方案的用于功率分析的方法。
图7描绘了根据本公开内容的实施方案的功率分析***的对象和数据。
图8描绘了根据本公开内容的实施方案的用于功率分析***中的命令执行的管道设计。
图9是描绘了根据本公开内容的实施方案的识别数据中心内的僵尸服务器(即未利用的服务器)的数据流图。
图10描绘了根据本公开内容的实施方案的用于分析数据中心的功率的***。
图11描绘了根据本公开内容的实施方案的用于分析数据中心的功率的软件体系结构。
图12描绘了根据本公开内容的实施方案的用于优化数据中心的能量节约的***图。
图13描绘了根据本公开内容的实施方案的数据中心的热流图。
图14描绘了根据本公开内容的实施方案的用于监测数据中心的功率计量的用户界面。
图15描绘了根据本公开内容的实施方案的用于监测数据中心的目录的用户界面。
图16描绘了根据本公开内容的实施方案的用于识别数据中心内的设备的放置的用户界面。
图17描绘了根据本公开内容的实施方案的用于识别数据中心内的僵尸服务器的用户界面。
图18描绘了根据本公开内容的实施方案的数据中心的热图(thermalmap)。
图19描绘了根据本公开内容的实施方案的将一个或多个资源分配给数据中心内的区域的图。
图20描绘了根据本公开内容的实施方案的将一个或多个资源分配给数据中心内的区域的图。
图21描绘了根据本公开内容的实施方案的数据中心内的设备故障和使用年限之间的关系。
图22描绘了根据本公开内容的实施方案的设备故障和温度之间的关系。
图23描绘了根据本公开内容的实施方案的使用指标来识别数据中心内的温度问题。
图24描绘了根据本公开内容的实施方案的使用指标来识别数据中心内的温度问题。
图25描绘了根据本公开内容的实施方案的使用指标来识别数据中心内的温度问题。
图26描绘了根据本公开内容的实施方案的用于数据中心的功率分析的示例性的用户界面。
图27描绘了根据本公开内容的实施方案的用于数据中心的功率分析的示例性的用户界面。
图28描绘了根据本公开内容的实施方案的用于数据中心的功率分析的示例性的用户界面。
图29描绘了根据本公开内容的实施方案的用于数据中心的功率分析的示例性的用户界面。
图30描绘了根据本公开内容的实施方案的用于数据中心优化的技术的高水平概览。
示例性实施方案的详细描述
图1示出了根据本公开内容的实施方案的用于功率分析的网络体系结构100的框图。图1是网络体系结构100的简化的视图,其可以包括未描绘的另外的元件。网络体系结构100可以含有数据中心110(1)至110(N)。虽然传统上是较大的设施,但是用于本公开内容的目的的数据中心可以被理解为是专用于支持多个计算平台的大型结构、服务器机房、或甚至支持单个计算平台的小房间。数据中心110(1)可以含有多个单元110和单元130。单元110和130可以含有一个或多个部件120。数据中心110(1)还可以含有电源150和冷却部160。在数据中心110中可以含有其他的部件和设备(例如存储单元、磁带库、光盘库和大型计算机)。单元110和130可以通信地耦合于彼此和/或其他的部件。单元110和130还可以通信地耦合于网络190。
根据某些实施方案,单元110和130可以是用于支承一个或多个计算设备和/或部件(例如部件120)的机架。单元110可以布置在数据中心中的第一通道中并且单元130可以布置在数据中心中的第二通道中。单元110和130与部件120可以由电源150中的一个或多个供应功率。单元110和130与部件120可以将热散发到数据中心110中并且可以由冷却部160冷却。
电源150可以是一个或多个配电单元(PDU)、不间断电源(UPS)、主配电单元(MDU)和/或发电机。电源150可以含有用于远程管理和/或监测的网络访问接口(例如RS-232接口和/或以太网接口)。电源150可以向数据中心110中的一个或多个设备提供数据和从数据中心110中的一个或多个设备接收数据。电源150还可以通过网络190向平台170提供数据和从平台170接收数据。
冷却部160可以是一个或多个计算机机房空气调节器(CRACS)或其他的温度监测设备、温度控制设备和湿度控制设备。冷却部160可以向数据中心110中的一个或多个设备提供数据和从数据中心110中的一个或多个设备接收数据。冷却部160还可以通过网络190向平台170提供数据和从平台170接收数据。
网络190可以是局域网(LAN)、广域网(WAN)、因特网、蜂窝网络、卫星网络或另一种允许在通信地耦合于网络190的设备之间进行通信的网络。网络190可以还包括一个或任何数量的上文提到的示例性类型的作为独立网络或通过彼此协作来运行的网络。网络190可以利用通信地耦合于它们的一个或多个客户端或服务器的一个或多个协议。网络190可以将其他的协议或从其他协议转换为网络设备的一个或多个协议。虽然将网络190作为一个网络描绘,但是应意识到,根据一个或多个实施方案、网络190可以包括多个互相连接的网络。
根据某些实施方案,部件120可以是计算平台(例如,服务器计算机、刀片式服务器、网络部件、网络存储设备或其他的设备)。根据某些实施方案,部件120可以是较大设备的部件(例如用于网络设备或服务器的卡)。部件120和/或单元110和120可以用于一个或多个目的(例如,档案平台、备份服务器、网络存储设备、媒体服务器、电子邮件服务器、文档管理平台、企业搜索服务器和应用服务器)。
下文描述可以包括一个或多个模块的用于功率分析的***和方法的网络元件、计算机和/或部件。如本文所使用的,术语“模块”可以理解为是指计算软件、固件、硬件和/或其各种组合。然而,模块应被解释为在硬件、固件上实施的软件或记录在处理器可读取可记录的存储介质上的软件(即就其本身而论,模块不是软件)。注意,模块是示例性的。可以将模块组合、集成、分离和/或复制以支持各种应用。此外,代替在特定的模块处执行的功能或除了在特定的模块处执行的功能之外,在本文中描述为在特定的模块上执行的功能可以在一个或多个其他的模块上执行和/或由一个或多个其他的设备执行。此外,模块可以在彼此相距较近或较远的多个设备和/或其他的部件上实施。此外,模块可以从一个设备移动并且添加到另一个设备中,和/或可以包括在两个设备中。
平台170可以通信地耦合于网络190。根据某些实施方案,平台170可以是支持功率分析模块172的一个或多个主机或计算平台。功率分析模块172可以分析数据中心110、单元110、单元130、部件120、电源150、冷却部160中的一个或多个、和一个或多个元件的子部件的功率使用。功率分析模块172还可以分析数据中心110、单元110、单元130、部件120、电源150、冷却部160中的一个或多个、和一个或多个元件的子部件的热变化曲线(例如温度、散热等等)。根据某些实施方案,功率分析模块172可以位于远离数据中心110的位置(例如在服务中心处)。根据某些实施方案,功率分析模块172的一个或多个部件或模块可以包含在数据中心110中或与数据中心110处于同一位置。
数据存储部192可以是网络可访问的存储部,并且可以是距平台170较近、较远或其组合。数据存储部192可以利用廉价磁盘的冗余阵列(“RAID”)、磁带、磁盘、存储区域网络(“SAN”)、因特网小型计算机***接口(“iSCSI”)SAN、光纤通道SAN、通用因特网文件***(“CIFS”)、网络连接式存储(“NAS”)、网络文件***(“NFS”)、或其他的计算机可访问的存储部。在一个或多个实施方案中,数据存储部192可以是数据库,例如Oracle数据库、Microsoft SQL Server数据库、DB2数据库、MySQL数据库、Sybase数据库、面向对象的数据库、分层数据库或其他的数据库。在某些实施方案中,数据存储部192可以利用平面文件结构或XML进行数据的存储。
数据存储部192可以存储关于多种数据中心资产的经销商可靠性和功率规格配置文件数据。这种数据可以用于估计资产的功率和可靠性。数据可以包括一个或多个数据中心的资产的资产数据、配置文件数据、地理空间数据和相关数据。这些类型的数据可以人工发现、导入或键入。历史数据、分析数据和可靠性数据可以是计算结果、所搜集的资产的调查数据或二者的组合。数据存储部192可以通过基于从数据中心接收的信息增加和/或修正数据库中数据来维护数据。
功率分析模块172可以含有分析模块174、发现模块176、数据收集模块178和优化器模块180。
发现模块176可以使用一种或多种方法识别和编目数据中心资源。例如,发现模块176可以使用简单网络管理协议(SNMP)、存储管理计划规范(SMI-S)、智能平台管理接口(IPMI)、Windows管理规范(WMI)、安全外壳(SSH)、BACNet、ModBus和/或私有协议中的一个或多个来识别数据中心的资源。根据某些实施方案,发现模块176可以提供允许手动录入资源的用户界面和/或提供资源信息(例如格式化为XML的供给信息)的API。根据一个或多个实施方案,可以提供快照工具、导出工具或另一个工具以从不能够被远程地访问的数据中心(例如安全设施)发现和导出数据到便携式电子存储部。
发现模块176能够向数据收集模块178和/或数据存储部192提供数据。
数据收集模块178可以监测所发现的数据中心资源以采集和存储一个或多个资源测量用于分析。资源测量可以包括例如CPU性能数据、内存使用、存储部使用和性能、温度传感器、进程表性能、PDU功率使用、UPS状态信息、CRAC单元状态信息、功率调节状态信息、开关配置和状态信息、以及致冷器状态信息。可以使用一个或多个协议和/或API(例如SNMP)采集资源测量。测量和其他的数据可以存储在电子存储部(例如数据存储部192)中或从电子存储部(例如数据存储部192)获取。
分析模块174可以使用存储的测量(例如来自数据存储部192的测量)估计或计算功率使用。分析模块174还可以汇集一个或多个部件上的功率使用(例如用于服务器、区域或数据中心的总功率消耗)。分析模块174可以确定或估计一个或多个部件的热变化曲线。分析模块174可以基于接收的温度数据、估计的温度数据(例如基于功率使用)、其他的数据(例如使用数据或活动数据)或前述的组合来估计热变化曲线。分析模块174可以基于一个或多个热变化曲线或汇集的热变化曲线(例如所汇集的服务器的部件的、机架中的设备的、区域中的设备的、区域中的机架的、数据中心的通道的、整个数据中心的等等的热变化曲线)估计冷却单元的功率要求。分析模块174可以使用计算流体动力学(CFD)产生热变化曲线。根据某些实施方案,分析模块174可以使用与一个或多个设备的逻辑配置相关联的数据,如在下文参照图2更详细地讨论的。
优化器模块180可以使用来自分析模块174的分析数据识别一个或多个问题。优化器模块180可以产生和提供对所识别的问题的一个或多个建议和/或解决方案。优化器模块180可以进行建模以识别和图示所建议的改变的影响。根据某些实施方案,一个或多个策略可以用于识别改进。例如,可以识别未利用的部件(例如未使用的服务器)。如果可能的话,可以去除未利用的部件(例如将其断电和/或从数据中心去除)。可以组合未充分利用的部件并且可以去除一个或多个部件(例如,可以将负载从第一服务器转移至第二服务器并且可以将第二服务器断电和/或去除)。可以将低效率的部件升级或更换(例如,可以将每秒的事务处理或每秒的数据包与其他的可选择设备的功率使用和发热进行比较)。可以识别热点。计算流体动力学可以用于产生数据中心内的温度模型。可以基于一个区域、多个区域或数据中心的热场建议设备的放置(现有设备的重新放置或新设备的放置)。可以按照区域来汇集温度。用户或管理员可以定制区域以包括部件、单个设备、多个设备、一个机架、多个机架、数据中心的通道、或跨过数据中心的其他区域或部分。区域可以竖直地(例如整个机架的上下方向)、水平地(例如跨过多个机架的所有底部隔间或插槽、或跨过多个机架的顶部两个隔间或插槽)或在其他的方向(例如跨过热或冷通道或沿着单个通道)聚集部件和/或设备。根据某些实施方案,可以改变冷却通风部、穿孔地砖或其他的冷却结构,以提供数据中心的冷却区域到较热区域的更高效的传递,或以引入热阻挡层以创建热通道和冷通道之间的隔离。除了一个或多个其他的策略之外或代替一个或多个其他的策略,可以执行这个策略。根据某些实施方案,优化器模块180可以使用与一个或多个设备的逻辑配置相关联的数据,如在下文参照图2更详细地讨论的。
平台170可以与多个数据中心110通信以向数据中心提供功率分析数据,并且在某些实施例中,所接收的信息与数据中心的配置、计算机器的在物理级和/或逻辑级的用途、和/或功率使用和/或散热数据相关。
在某些实施例中,由功率分析模块172向数据中心提供的信息可以允许数据中心的管理员和/或软件控制进程确定或估计数据中心内的设备的功率使用和/或散热方面。在某些实施例中,这提供功率使用与单独的计算机器的关联,或聚集为较大的单元,诸如机器的组(例如整个机架)。在某些实施例中,可以更精细地获得功率使用,例如根据机器中的具体的物理部件,或根据在计算机器上执行的不同的进程或应用的***的共享(factional share)。
参照图2,单元210的物理视图可以是计算机器(例如服务器计算机)的物理视图。单元210的物理视图可以包括多种分离的物理部件220,例如处理器芯片、磁盘控制器和半导体存储器件。此外,单元210的物理视图还可以包括多个监视器230,其可以监测部件的物理属性,诸如功率使用(例如,瓦特)、散热(例如散热器温度)和操作特性(例如,处理器时钟速率、磁盘转速、数据信号传输速度)。监视器可以是软件可访问的。
继续参照图2,单元210的逻辑视图可以是在单元210的物理视图中描绘的相同的物理机器或平台的逻辑视图。单元210逻辑视图可以包括多个逻辑/软件部件240-266。例如,单元210的逻辑视图可以包括操作***/内核部件240和进程250。在一个或多个实施方案中,单元210的逻辑视图可以包括用于虚拟机部件262的监视器和/或虚拟环境260(例如“管理程序”),虚拟机部件262本身可以包括进程264、266和其他的软件部件。单元210的逻辑视图还可以包括一个或多个软件监视器268,软件监视器268可以提供逻辑/软件部件的属性,例如CPU使用率、事务处理速率(例如每秒的数据库查询数量)和通信速率(例如各种协议级的消息或数据包),以及配置信息,例如活动进程的身份、虚拟机等等。
来自监视器230和监视器268的信息可以传递至平台170,平台170可以包括功率分析模块172。根据某些实施方案,该模块可以估计物理和/或逻辑部件和/或计算机器/软件环境的功率使用。功率分析模块172可以使用数据存储部192,数据存储部192可以包括所估计的统计参数以提供在数据存储部192中表示的各种元件的从使用数据到所估计的功率使用的映射。功率估计可以传递至优化器模块180,优化器模块180可以提供所估计的功率使用的表格化或图形化的表示。
根据某些实施方案,平台170还可以包括分析模块274,分析模块274可以用于更新数据存储部192。例如,可以基于从数据中心接收的数据估计新元件(例如在数据中心发现的之前未看到的部件)的数据,或可以基于从数据中心接收的另外的监测数据细化现有部件的统计参数。即,数据存储部192最初可以具有几乎没有可用数据的部件的相对不精确的或过于保守的估计,并且分析部件可以用于结合该信息用于数据中心监测以改进估计的精确度。
作为实施例,来自监视器230的机器监测数据可以与特定的计算机器(例如单元210)相关联。这种相关联的数据可以提供至功率分析模块174。机器监测数据可以包括用于物理部件的数据和/或用于逻辑部件的数据(例如分别从监视器230和268采集)。功率分析模块174可以利用数据存储部192中的功率配置文件,功率配置文件可以包括与每种类型的部件相关联的(例如与部件类型的标识符相关联的)数据。这可以允许从每个部件的所监测的数据到估计的功率消耗的绘图(例如基于参数函数,诸如多项式曲线拟合)。功率分析模块174的输出可以是总功率,以及各种物理和/或逻辑部件的功率分配。
根据某些实施方案,与多个计算机器相关联的功率估计可以与机器的位置数据组合,以确定数据中心的空间功率损耗配置文件。在某些实施例中,空间配置文件还可以将冷却设备的位置考虑在内,以确定所估计的散热或温度配置文件。
应当理解,虽然在某些实施方案中分析和功率预测功能可以集中,使数据中心向集中功能提供监测数据,其中可以组合功率配置文件数据以确定估计的功率使用。在其他的实施方案中,功率配置文件数据可以分发至距离数据中心较近或距离单独的计算机器较近的功率估计部件。在某些这样的实施方案中,监测数据或这样的数据的汇集或处理后的形式可以提供至中心计算平台,在中心计算平台可以增加和/或细化功率配置文件数据。
图3描绘了根据一种实施方案的计算机***300的框图。计算机***300可以适合于实施根据一种或多种实施方案的技术。计算机***300可以是客户端、服务器、网络节点、网关或其他的网络可处理平台。计算机***300可以包括总线302,总线302可以通信地耦合于计算机***300的一个或多个部件,例如计算机处理器304、存储器306(例如RAM(随机存取存储器)、ROM(只读存储器)、闪存RAM等等)、输入/输出(I/O)控制器308、网络接口310、提供到固定磁盘314的连接的存储接口312、可操作以接收可移动磁盘318的磁盘驱动器316、通过显示适配器320连接的显示器322、串行端口324和328、通过键盘控制器332的键盘334、可操作以连接SCSI设备338(例如存储部、扫描仪等等)的SCSI适配器336、可操作以接收光盘342的光盘驱动器340以及通过多媒体接口344耦合的多媒体设备346(例如扬声器、照相机、话筒等等)。其他的部件可以包括指点设备330(例如鼠标、轨迹球、控制杆等等,通过串行端口328耦合于总线302)、调制解调器326(通过串行端口324耦合于总线312)、功率管理器348和电池350。
总线302可以允许在计算机处理器304、存储器306和一个或多个其他的部件之间的数据通信。根据某些实施方案,存储器306可以是主存储器,其中可以加载操作***和一个或多个应用程序。应用程序或其他的软件可以存储在计算机可读介质上和通过计算机可读介质访问,计算机可读介质例如硬盘驱动器(例如固定磁盘314)、光盘驱动器(例如光盘驱动器340)、磁盘驱动器316或其他的存储介质(例如通过网络接口310访问的网络可访问存储器)。例如,扩展名赋值模块114可以驻留在存储器306中。
存储接口312可以连接于用于信息的存储和检索的标准计算机可读介质,例如固定硬盘驱动器314。固定硬盘驱动器314可以是计算机***300的一部分或可以是分离的并且通过其他的接口***被访问。调制解调器326可以通过电话链路提供到远程服务器的直接连接或通过因特网服务提供商(ISP)提供到因特网的直接连接。网络接口310可以通过直接网络链路提供到远程服务器的直接连接或通过POP(入网点)提供到因特网的直接连接。
功率管理器348可以监测电池350的功率水平。根据某些实施方案,电池350可以是距计算机***300较近或较远的不间断电源(UPS)。在这样的实施方案中,功率管理器348可以提供关于UPS的功率水平的信息。
其他的设备或部件可以以相似的方式连接(例如数字照相机、不间断电源等等)。图3的部件不是必要的,并且图示的部件中的一个或多个可以在实施方案中不存在。在某些实施方案中,可以包括相同类型的多个部件(例如多个计算机处理器304、多个存储接口312等等)。设备和子***可以以与图3中示出的方式不同的方式互相连接。用于实施一个或多个实施方案的代码可以存储在计算机可读存储介质中,例如存储器306、固定磁盘314、光盘342或可移动磁盘318中的一个或多个。用于实施一个或多个实施方案的代码还可以通过一个或多个接口接收并且存储在存储器中。设置在计算机***300上的操作***可以是MS- MacMac OS或另一种操作***。
参照图4,示出了根据本公开内容的实施方案的功率分析模块410。如图示的,功率分析模块410可以含有一个或多个部件,包括部件检测模块412、部件配置文件模块414、部件监测模块416、逻辑分析模块418、部件分析模块420、区域和中心分析模块422、优化策略模块424以及错误记录和报告模块426。
部件检测模块412可以使用一种或多种方法识别和编目数据中心资源。例如,部件检测模块412可以使用简单网络管理协议(SNMP)、存储管理计划规范(SMI-S)、智能平台管理接口(IPMI)、Windows管理规范(WMI)、安全外壳(SSH)、BACNet、ModBus和/或私有协议中的一个或多个来识别数据中心的资源。根据某些实施方案,部件检测模块412可以提供允许手动录入资源的用户界面和/或允许提供资源信息(例如格式化为XML的供应信息)的API。根据一个或多个实施方案,可以提供快照工具、导出工具或另一种工具以从不能够被远程访问的数据中心(例如安全设施)发现和导出数据到便携式电子存储部。
部件配置文件模块414可以存储关于多种数据中心资产的经销商可靠性和功率规格配置文件数据。这种数据可以用于估计资产的功率和可靠性。数据可以包括一个或多个数据中心的资产的资产数据、配置文件数据、地理空间数据和相关数据。这些类型的数据可以人工发现、导入或键入。历史数据、分析数据和可靠性数据可以是计算结果、所搜集的资产的调查数据或二者的组合。部件配置文件模块414可以通过基于从数据中心接收的信息增加和/或修正数据库中数据来维护数据。
部件监测模块416可以监测数据中心的所发现的资源以采集和存储一个或多个资源测量以进行分析。资源测量可以包括例如CPU性能数据、内存使用、存储部使用和性能、温度传感器、进程表性能、PDU功率使用、UPS状态信息、CRAC单元状态信息、功率调节状态信息、开关配置和状态信息、以及制冷器状态信息。可以使用一种或多种协议和/或API(例如SNMP)采集资源测量。测量和其他的数据可以存储在电子存储部(例如数据存储部192)中或从电子存储部(例如数据存储部192)中获取。
逻辑分析模块418可以使用所存储的测量(例如来自数据存储部192的测量)估计或计算功率使用。逻辑分析模块418可以使用与一个或多个设备的逻辑配置相关联的数据(例如CPU使用率、事务处理速率(例如每秒的数据库查询数量)和通信速率(例如各种协议级别的消息或数据包),以及配置信息,例如活动进程的身份、虚拟机等等)。活动进程的身份可以用于基于历史数据、配置文件数据或其他的数据来估计功率使用(例如,报告进程的数据库可以已知为是使用涉及大计算负荷和频繁磁盘存取的进程的强功率(intensive power))。可以对一个或多个物理部件或设备绘制逻辑利用率以估计功率使用、散热和其他的影响数据中心成本和性能的因素。
部件分析模块420可以使用所存储的测量(例如来自数据存储部192的测量)估计或计算一个或多个部件的功率使用。部件分析模块420可以使用所接收的实际测量、历史数据和配置文件数据(例如制造商的规格或其他的与部件或设备相关联的统计数据)计算和/或估计部件或设备的功率使用和热性质。设备或部件的功率使用可以用于估计散热和相关联的冷却成本。
区域和中心分析模块422可以汇集一个或多个部件、设备或数据中心的部分上的功率使用(例如服务器、区域或数据中心的总功率消耗)。区域和中心分析模块422可以确定或估计一个或多个部件的热变化曲线。区域和中心分析模块422可以基于所接收的温度数据、估计的温度数据(例如基于功率使用)、其他的数据(例如使用数据或活动数据)或前述的组合来估计热变化曲线。区域和中心分析模块422可以基于一个或多个热变化曲线或汇集的热变化曲线(例如所汇集的服务器的部件的、机架中的设备的、区域中的设备的、区域中的机架的、数据中心的通道的、整个数据中心的等等的热变化曲线)估计冷却单元的功率要求。区域和中心分析模块422可以使用计算流体动力学(CFD)产生热变化曲线。
优化策略模块424可以使用分析数据来识别一个或多个问题。优化策略模块424可以产生和提供对所识别的问题的一个或多个建议和/或解决方案。优化策略模块424可以进行建模以识别和图示所建议的改变的影响。根据某些实施方案,一个或多个策略可以用于识别改进。例如,可以识别未利用的部件(例如未使用的服务器(即,“僵尸服务器”))。如果可能的话,可以去除未利用的部件(例如将其断电和/或从数据中心去除)。可以组合未充分利用的部件并且可以去除一个或多个部件(例如,可以将负载从第一服务器转移至第二服务器并且可以将第二服务器断电和/或去除)。可以将低效率的部件升级或更换(例如,可以将每秒的事务处理或每秒的数据包与其他的可选择设备的功率使用和发热进行比较)。可以识别热点。计算流体动力学可以用于产生数据中心内的温度模型。可以按照区域来汇集温度。用户或管理员可以定制区域以包括部件、单个设备、多个设备、一个机架、多个机架、数据中心的通道、或跨过数据中心的其他区域或部分。区域可以竖直地(例如整个机架的上下方向)、水平地(例如跨过多个机架的所有底部隔间或插槽、或跨过多个机架的顶部两个隔间或插槽)或在其他的方向(例如跨过热或冷通道或沿着单个通道)聚集部件和/或设备。根据某些实施方案,根据某些实施方案,优化策略模块424可以使用与逻辑配置相关联的数据。来自优化策略模块424的输出可以是用户显示(例如网页)、报告、警报(SMS消息、电子邮件等等)和其他的电子通信。
错误日志和报告模块426可以产生日志、报告或其他的与计算平台部件的功率分析相关联的信息。
参照图5,描绘了根据本公开内容的实施方案的用于计算平台部件的功率分析的方法500。在块502,方法500可以开始。
在块504,可以接收关于部件的信息。可以发现或可以从数据中心输出或通过用户录入接收信息。发现可以使用一种或多种方法识别和编目数据中心资源。例如,发现可以使用简单网络管理协议(SNMP)、存储管理计划规范(SMI-S)、智能平台管理接口(IPMI)、Windows管理规范(WMI)、安全外壳(SSH)、BACNet、ModBus和/或私有协议中的一个或多个来识别数据中心的资源。根据某些实施方案,发现进程可以提供允许手动录入资源的用户界面和/或允许提供资源信息(例如格式化为XML的供应信息)的API。根据一个或多个实施方案,可以提供快照工具、导出工具或另一种工具以从不能远程访问的数据中心(例如安全设施)发现和导出数据到便携式电子存储部。
在块506,方法500可以确定所发现的部件是否被识别。方法500可以访问电子资源库以试图使用一个或多个发现的属性来匹配发现的部件。如果部件被识别,那么方法500可以在块512继续。如果部件不被识别,那么方法500可以在块508继续。
在块508,可以请求关于发现的但是未被识别的部件的数据。方法500可以将电子通信发送至用户或管理员(例如SMS消息、电子邮件),可以在用户界面或报告上列出未被识别的部件,或可以以其他方式提示用户或管理员与未被识别的部件相关联的配置文件数据。
在块510,可以通过用户输入或另一个界面(例如使用新的制造商的规范更新已知的配置文件数据的刷新)接收数据。在接收配置文件数据之后,该方法可以更新配置文件数据资源库并且以其他方式处理接收的配置文件数据。然后该方法可以在块514继续。
在块512,可以从电子资源库获取部件配置文件数据。配置文件数据可以包括历史的和/或估计的功率使用、热性质(例如产生的热)、相关联的逻辑过程(例如驱动器)以及其他的数据。
在块514,逻辑基础架构或部件可以被对物理部件绘图。例如,内核或O/S部件、进程、线程、应用程序、虚拟机和/或虚拟机的进程、线程和应用程序可以与物理部件相关联。例如,报告进程可以与磁盘阵列或其他的电子存储部上的负荷相关联,以方便功率使用和产生的热的估计。
在块516,可以监测物理和/或逻辑部件。监测可以以一个或多个精度级别(例如处理器、磁盘控制器、刀片服务器、机架、区域、数据中心通道、数据中心、跨过多个数据中心的业务单元/客户端/成本中心等等)采集数据。
在块518,可以基于存储的数据配置功率使用和热性质。还可以基于所监测的逻辑和物理部件计算功率使用。测量的功率使用和/或配置的(profiled)功率使用可以被平均、汇集或以其他方式处理以确定在一个或多个精度级别的功率使用输出。计算和估计的类型和数量可以取决于测量的量值的可用性、为了获得这样的量值的潜在的干涉性和影响或负载、所配置的数据或历史数据的可用性和其他的因素。用于获得数据的负载可以被在数据中心中最小化至可能的程度(例如,在较低的峰值使用时间收集并且在较高的负载估计的,或收集但是被以较低的峰值使用时间传输)。
在块520,由一个或多个部件产生和散发的热可以基于功率使用测量、功率使用估计、热配置文件数据和其他的因素来估计。可以使用计算流体动力学计算。
在块522,方法500可以确定是否仍然存在要发现和/或分析的其他的部件。如果仍然存在要发现和/或分析的其他的部件,那么该方法可以返回至块504。如果不存在其他的部件,那么该方法可以在块524继续。
在块524,方法524可以提供与功率使用相关联的输出。输出可以是用户显示(例如网页)、报告、警报(SMS消息、电子邮件等等)和其他的电子通信。
在块526,方法500可以结束。
参照图6,描绘了根据本公开内容的实施方案的用于计算平台部件的功率分析的方法600。在块602,方法600可以开始。
在块604,方法可以分析功率使用和温度输出以识别一个或多个问题、热点和/或优化策略。可以进行建模以识别和图示所建议的改变的影响。根据某些实施方案,一个或多个策略可以用于识别改进。一个或多个量值可以用于确定利用率、效率和部件因素。例如,CPU使用率、磁盘使用率和存取模式、可以相对于功率使用和/或散热测量数据吞吐量和其他的因素。
在块606,该方法可以确定是否可以识别未利用的部件(例如未使用的服务器)。如果识别了未利用的部件,那么方法可以在块608继续。如果没有识别未利用的部件,那么方法可以在块610继续。
在块608,可以去除未利用的部件(例如将其断电和/或从数据中心去除)。
在块610,该方法可以确定是否具有任何未被充分利用的部件。如果具有未被充分利用的部件,那么该方法可以在块612继续。如果不具有未被充分利用的部件,那么该方法可以在块614继续。
在块612,可以组合未被充分利用的部件并且可以去除一个或多个部件(例如,可以将负载从第一服务器转移至第二服务器并且可以将第二服务器断电和/或去除)。
在块614,该方法可以确定是否检测到任何低效率的部件。如果检测到低效率的部件,那么该方法可以在块616继续。如果未检测到一个或多个低效率的部件,那么该方法可以在块618继续。
在块616,可以升级或更换低效率的部件(例如,可以将每秒的事务处理或每秒的数据包与其他的可选择设备的功率使用和发热比较)。
在块618,可以将部件和/或设备按区域进行分类和/或组织。分析可以根据所识别的区域被分组或汇集。可以识别热点。计算流体动力学可以用于产生数据中心内的温度模型。
在块620,可以确定是否具有任何热点。如果识别了热点,那么该方法600可以在块622继续。如果没有识别热点,那么该方法可以在块624结束。
在块622,可以基于一个区域、多个区域或数据中心的热场建议设备的放置(现有设备的重新放置或新设备的放置)。根据某些实施方案,可以改变冷却通风部、穿孔地砖或其他的冷却结构,以提供数据中心的冷却区域到较热区域的更高效的传递,或以引入热阻挡层以创建热通道和冷通道之间的隔离。除了一个或多个其他的策略之外或代替一个或多个其他的策略,可以执行这个策略。
在块624,方法600可以结束。
根据某些实施方案,数据中心功率分析软件可以发现数据中心的资产并且周期性地收集利用率数据和环境数据,以提供分析、优化和控制机制。这些机制可以协作地工作以优化功率、冷却、空间和可靠性,从而最大化数据中心效率。此外,这种环境数据的一个或多个部分可以被向应用程序上绘图。这可以提供数据中心效率和使用的可选择的业务水平视图。
根据某些实施方案,软件可以发现、收集、分析并且然后优化数据中心部件。根据某些实施方案,为了遵照该流程,可以将软件体系结构组织为三个主要的逻辑处理域。这些处理域可以是发现引擎、数据收集器和分析引擎。处理域的逻辑视图可以是自然边界,通过自然边界特征设置可以被内容定义并且工作可以被分割。此外,从功能的观点来看,这些域中的每个可以与其他的域相互独立,其功能可以被容易地分解或代替同时对***的其余部分具有最小的影响。
根据某些实施方案,体系结构可以支持必须操纵数百万个数据中心的元件的产品。这可以包括调查的数据、分析、优化、控制、发现和/或报告。这进而可以需要体系结构的元件在分布式环境中操作,使得可以划分工作。每个部件在设计时应当考虑这些因素。
根据一个或多个实施方案,体系结构可以足够灵活,以允许功能的主要部分被取代,而不影响***的其余部分。这可以利用在***的主要部件之间的定义明确的接口和抽象层。此外,可能的是,分析特征的集合可以非常频繁地改变。作为结果,框架可以存在,以允许新的分析特征的迅速利用和可能地在地理上分散的开发。最后,***中的某些分析特征可以是部分托管的服务,而某些可能仅为本地服务。分析框架可以能够操纵这些模型。
根据某些实施方案,诸如计算流体动力学(CFD)分析和某些报告的许多产品特征的运行可以需要耗费以小时计的时间。其他的特征可能耗费数秒。对于一般的体系结构,性能考虑和实践可以在部件的设计时考虑,因为每一个可能具有不同的性能要求。每个特征或***部件可以以不干扰可能需要迅速响应的关键任务(例如轮询和交互任务)的方式操作。此外,软件可以对其正在监测的实体具有最小的影响。
根据某些实施方案,体系结构中的一个或多个主要部件的逻辑视图可以被分类为多个不同的功能和责任区域。图7描绘了根据一个或多个实施方案的主要部件。在下文更详细地描述图7的每个部件。
发现引擎可以是负责发现数据中心内的对象并且将它们存储在***的资产数据库中的实体。这些对象可以包括物理资产和逻辑资产二者。发现引擎可以支持多种用于实现这一点的协议和方法,包括但不限于SNMP、SMI-S、IPMI、WMI、SSH、BACNet、ModBus和/或私有协议。
数据收集器可以周期性地收集关于资产数据库中的所述对象的利用率数据和环境数据。与发现引擎很相似地,数据收集器可以支持很多协议和方法。
分析引擎可以提供支持性设施的综合的框架和集合,以用于分析、优化和控制特征。框架可以是最大化代码的再使用率并且允许快速和独立地开发特征的管道和过滤器设计。
对象模型可以是资产、相关联的数据、以及在存储在电子存储部(例如数据库)中的资产之间的关系的代表。该层可以贯穿所有的三个处理域。这可以提供普遍的用于向所有的三个处理域的提取和访问的方法。
图7的管理层和配置对象可以是对象模型的管理代表。其可以含有用于在用户界面(UI)和***的一个或多个其他部分之间通信状态、配置、同步和控制信息的对象。其主要目的之一可以是允许对象模型的管理视图从处理域的视图变化。在该级可以包括从对象模型到管理模型的翻译层。
图7的持久层对象可以是对象模型的持久层代表。其可以是负责在对象模型代表对象和持久层代表对象之间的翻译的层。其还可以含有用于表格管理、查询和数据库管理的逻辑。
根据某些实施方案,GxDB可以是向***提供关于多种数据中心资产的经销商可靠性和功率规格配置文件数据的托管服务。该数据可以与发现引擎和分析引擎结合使用,以估计功率和可靠性而无需周期性搜集实际的资产利用率数据。分析引擎可以含有用于与GxDB中的具体的资产类型通信的设施以及用于查询关于GxDB中的具体的资产类型的信息的逻辑。
根据至少一个实施方案,可以具有两种主要的由***存储的数据类型。GxBD可以含有描述资产和它们的特征的数据以及周期性地收集或计算的数据。资产数据、配置文件数据、地理空间数据和依赖性数据都可以描述数据中心的资产。这些类型的数据可以手动地发现、导入或键入。历史数据、分析数据和可靠性数据可以是由分析引擎写入的计算结果或所搜集的来自在数据中心中发现的资产的调查数据。
根据某些实施方案,***中的数据可以被组织为三个主要的逻辑模型。这些模型可以是对象模型、持久模型和管理层模型。这些模型可以允许在软件的不同的水平的提取数据组织和独立数据组织二者。这还可以允许每个层独立于其他的层而变化,仅使薄的翻译层受到影响。
数据模型可以水平地扩展,以表示多种设备和这些设备的相关联的数据。其还可以适应较宽范围的收集数据和计算数据。随时间推移所存储的收集数据的量可以在数十TB的范围内。数据可以以允许快速存取而几乎没有竞争的方式进行组织和分割。
在至少一个实施方案中,数据模型可以足够灵活,以适应模型的不同层的变化,而不影响模型层的其余部分。例如,持久层的变化可以不影响管理层模型或任何其他的对复制模型之间的数据的薄的翻译层的代码接受。
在本文中的性能可以是指对象从一个层向另一个层的翻译以及数据存取。通常,设备属性在层之间的复制可以是少量的数据。然而,被收集的数据在层之间的复制可以由于大数量被避免。此外,对数据的访问可以能够同时地适应至少数百次事务处理。
对象模型层可以是由收集引擎、发现引擎和分析引擎共享和直接使用的视图。其可以包括7种不同的主要类别的数据:资产数据、历史数据、分析数据、地理空间数据、可靠性/功率配置文件数据、计算的可靠性数据以及依赖性数据。在以下的部分更详细地描述这些种类中的每一类。
资产数据可以描述数据中心的软件资产和硬件资产以及它们如何彼此相关。其可以包括属性,例如设备的地址、访问设备的方法以及设备的类型。其可以是回答问题“这是什么以及我如何寻址它”的元数据。
历史数据可以是从资产收集的实际使用数据。例如,对于磁盘驱动器,其可以是多个被转移的块,并且对于CPU,其可以是非空闲时间的百分比。可以随时间推移以周期性的间隔收集这种数据并且可以将其用于获取其他的数据,例如实际功率利用率。
分析数据可以大体上指从其他类型的数据的组合计算的数据。例如,可以使用历史数据或配置文件数据中的一个及资产数据、地理空间数据的组合来计算CFD分析数据。
地理空间数据可以是描述资产或甚至非资产例如门或窗的物理尺寸和放置的元数据。例如,这种数据可以用于计算封闭空间中的环境方面,例如空气流和温度。
配置文件数据可以是描述资产的功率/温度足迹和设备的可靠性特征的元数据。这种数据可以在例如GxDB中使用,使得可以估计功率,而无需收集历史利用率数据。
根据某些实施方案,计算的可靠性数据可以简单地是***的基于环境的正在进行的被计算的可靠性。其可以从更宽泛的分析数据分离地调用,以强调其的与可靠性配置文件数据的差异。
依赖性数据可以是描述资产之间的依赖性的元数据。例如,进程依赖于服务器和存储阵列以及存储阵列内含有的物理驱动器的集合。该数据可以用于例如分析服务的端对端的可靠性。
持久性模型可以提取数据如何被从***的其余部分存储。其可以由在对象模型和持续模型之间翻译以进行修改和查询二者的薄层组成。该层还可以含有在数据中心功率分析产品中使用的用于数据库的维护和管理的逻辑。
持久层的架构可以是对象模型的标准化的代表。架构还可以以最大化数据的高效检索和存储的方式布局。
数据存取层可以是从关于数据库查询、事务处理和表格操作的细节提取的对象的集合。
数据库管理总监可以是管理数据库的子***。其可以管理数据库创建,包括架构的实现、数据库毁坏、数据库备份/恢复、架构升级、表格维护和空间管理。
管理层模型可以从***的其余部分提取对象模型的管理级视图。其可以由向和从对象模型视图翻译的薄层组成。
分析引擎可以是管理数据中心功率分析软件中的报告特征、分析特征、优化特征和控制特征的域。其可以以最大化代码在多个特征中的反复使用率、提供对独立开发的自然提取以及向要改变的特征的集合提供最大的灵活性(甚至在必要时动态地)的方式设计结构。其可以是可以扩展以同时处理许多任务(无论这些任务是针对相同的特征还是不同的特征)的多任务状态机。
分析引擎可以扩展以在非常大的量的数据上同时地处理数百个任务。这些任务可以包括需要实时状态和返回数据的由用户发起的任务以及不需要返回数据和基于日志的状态的***内部任务。
来自***透视图的特征集合可以是在所得到的数据和其存在的方式的方面不同的,虽然相同数据中的大部分可以用于计算和制造中间结果。然而,这些计算的实现方式可以有很大的不同。分析引擎可以支持范围从部分托管的分布式服务至I/O密集的本地服务的特征。其还可以管理可能耗费大量的时间运行的特征以及需要即时的结果的特征。
分析引擎执行完全从彼此提取的任务。作为结果,实体的集合可以存在以限制这些独立的任务耗尽资源。资源池用于在可能时实现这一点(例如线程池、内存池等等)。在分析引擎内构建的特征还可以考虑它们正在监测的***的资源利用率。
用于分析引擎的面向对象的框架可以被构建在设计的管道和过滤器类型上,其中被称为过滤器对象(也被称为管道阶段)的小的集中的独立的功能模块可以在管道中有序地共同存在。命令可以在一个方向运行经过管道,给予每个阶段对象沿途收集或处理数据的机会。当到达管道的尾部时,命令可以在相反的方向运行经过管道,给予每个阶段对象再一次收集或处理数据的机会。图8描绘了管道设计,其将在以下的部分中解释。
工厂对象可以是根据负责创建和销毁管道的特征对象。它们可以接收指定用于管道自身的建立参数,例如资源限制以及阶段的参数的创建事件。在大多数情况下,这些管道可以在启动时建立并且在本质上可以是静态的,但是可能没有任何防止它们成为根据需要霎来即去的短暂地存活的动态实体的事情。
阶段对象可以是定义特征如何工作的逻辑块。它们可以是共同地创建复杂特征的简单的集中的独立的功能模块。阶段对象每个可以接收命令并且对附属于命令的数据执行计算或检索进行进一步处理所需要的另外的数据。阶段对象还可以选择不处理某些类型的命令,在这种情况下不受干扰地传递命令。阶段对象相对于单独的命令可以是无状态的。它们可以简单地作用于携带状态信息随它们经过管道的命令,然而它们可以追踪管道或***的一部分的不涉及任何单命令情况的状态。
命令对象可以运行经过管道并且可以不经过阶段对象。命令对象可以含有命令的参数、计算和/或检索的数据的参数、命令的当前状态以及最终状态的参数。
命令处理器可以是可以创建、销毁和引导命令通过所有的阶段对象实现的熟知的接口经过管道的单件对象。其还可以是含有线程内容的实体,其中命令运行经过管道。可以具有携带命令经过管道的根据命令的线程。命令处理器可以接收来自管理接口层的请求并且将这些请求转换为管道命令。当完成时,可以将命令数据和状态传送至管理层。
除了根据特征的单独的管道外,存在两个其他的管道。一个称为总体管道(Global Pipeline),其可以是跨过整个***的单个实例。总体管道中含有的阶段适用于整套特征。例如,其可以含有将内存分配到要在某些实例中返回的数据的阶段,或其可以是确定许可证限制已经被超出并且不允许命令继续至其他的管道的许可证阶段。根据某些实施方案,所有的命令在通过其他的管道之前可以运行经过总体管道。
另一管道可以称为首先运行管道。可以具有这种类型的根据常规的管道实例的管道实例,然而其可以含有可能仅适用于正被讨论的分别的管道实例的共有的阶段。例如,防止由错误条件导致的命令在特征管道惰转的健康阶段可以在这种管道上存在。所有的命令在运行经过总体管道之后运行经过首先运行管道的合适的实例,但是在运行经过特征管道的分别的实例之前。
可以具有多种可以由分析引擎支持的一般特征型式。可以具有内部***维护特征,例如数据卷和数据库表格维护。可以具有托管服务,例如可以被与分析引擎通信的GxDB和CFD分析。可以具有报告服务,例如僵尸服务器探测器和功率利用率报告。还可以具有控制特征,例如光输出控制和功率上限设置。所有这些类型的服务可以被构建在上文描绘的框架内。
可以在分析引擎中以多种方式处理错误。命令可以将错误状态随它们携带,并且每个阶段可以基于错误确定其应当执行的动作。当严重的错误发生并且可以确定命令不能够继续时,阶段设备可以返回将命令反转的状态,如同已经到达管道的末端。在这种情况下,命令处理器可以简单地模拟管道条件的末端。
可能具有需要进行重大处理以及因此需要大量的时间以完成命令的特征。状态子***可以存在于分析引擎框架的外部,然而,该子***可以通过向命令处理器请求而查询框架内的状态。命令处理器知晓在任何给定的时间,命令可能在管道中的地点以及命令处理器可以根据阶段来计算所完成的百分比。可以查询命令本身以获取有关其当前可以在分别的阶段过程中进行的程度。
可以通过管道本身实现许可强制。在总体管道和每个首先运行管道二者上可能存在许可阶段。当已经达到许可限制时,这些阶段随错误状态反转命令。
由于框架以及体系结构在本质上可能有些抽象,所以关于如何可以实现特征的例子在图9中的布局中图示。特征可以是僵尸服务器***,其返回属于具体的组容器的僵尸服务器的标识和地理空间位置。其他的特征也可以使用框架实现。
在图9中可以具有三个阶段。第一个可以是组至元件阶段,其仅解决了给定一个组容器名称,哪些服务器属于它。如果我们仅寻找组中的僵尸服务器,那么阶段对象可以仅使用其从资产数据库检索到的属于该组的那些服务器填充命令数据。下一个阶段可以是识别僵尸块。该阶段简单地基于命令中含有的要素的利用率数据发现僵尸服务器。最后一个阶段可以是定位服务器块。该阶段简单地查询地理空间数据库以返回关于其接收的命令中的资产的位置信息。
这三个阶段全部可以被自包含和提取,使得一个阶段不知道在其之前的阶段已经完成的动作或在其之后的阶段将进行的动作。这些阶段中的每一个可以是足够通用的,使它们可以容易地使用在其他的特征中。例如,定位服务器阶段可以在服务器放置类型的特征中使用。
发现引擎可以负责将数据中心资产和相关联的属性编目到永久存储部中。
数据中心资产不但包括典型的IT资产,例如服务器、磁盘、磁盘阵列、存储器、主板、扩展卡和开关,而且包括设施资产,例如计算机机房空气调节器(CRACS)、配电单元(PDU)、发电机、电路、表示在服务器上运行的应用程序的软件资产、以及最后,结构资产,例如建筑物、墙壁、地板、机架等等。
资产可以具有某些共有的属性,例如描述资产当前驻留或可能驻留的位置的地理空间信息。可以收集这些共有的属性并将其写入永久存储部并且将其与资产相关联。
此外,可能需要收集资产专有的属性、并将其写入永久存储部并且与资产相关联。例如:
●IT资产属性可以包括,制造/模型,串联,存储器或存储部的量等等;
●结构资产属性可以具有表面类型、密度等等;
●设施资产属性可以具有制造/模型和冷却能力等等;以及
●软件资产属性可以具有卖方和版本信息等等。
可以支持多个同时发现的实例以适应大型网络。这可以意味着单个操作者运行多个实例或多个操作者运行发现的实例。
发现引擎的规模可以是从具有单个服务器的小房间扩大至可以容纳百万资产的最大的数据中心。来源于资产和属性的编目的发现过程和数据库足迹可以据此增减规模。
除用户界面(UI)和永久存储部层之外,发现引擎可能不知道***的任何其他的部分。可能的是,可以在此利用(leverage)第三方的解决方案,所以可以最少地知晓关于其他的部件的知识。
实际的资产和资产属性可能是未知的,并且所以它们可以是可扩展的。
资产和属性的发现方法和发现顺序可以是灵活的。在某些情况下,数据中心的资产发现的一个或多个部分可以直接地来自电子表格。在其它情况下,部分可以从自动的资产发现和某个量的计算机辅助数据录入检测到。在其它情况下,地理空间信息可以来自电子表格、辅助手动输入、手动输入或可以完全不采集该信息。可以进行发现而使其对数据中心具有最小影响。
根据某些实施方案,可以不太频繁地发起发现过程。相似地,发现过程可以不是实时的,但是可以尽可能地高效。
用户可以发现数据中心资产和属性(包括地理空间属性例如资产的位置),至在使用工具的几分钟至一小时内至少一个密集的(pod)水平,与之相反,其当前使用常规的方法要耗费几周时间。
发现引擎可以由数据中心的操作者调用以初始地发现资产,或可能作为周期性的安排任务。可以在一个服务器、特定的子网或IP范围或整个数据中心引导发现过程。
发现引擎可以利用现有的技术,其中所述技术可用于自动地发现资产和属性。这可以包括或不包括使用SNMP、WMI、IPMI、SSH、BACNet、ModBus或甚至私有协议。单个发现可能需要多个协议以完成过程。此外,在某些情况下,可以在采集关于资产的更多细节之前,首先发现高水平的资产。可以进行多个发现过程以完全地捕获资产。
可以发现资产和属性并将其写入永久存储部,而不需要直接知晓获得数据所使用的协议。此外,发现引擎可以不具有永久存储部层细节的直接知识。
发现引擎可以不直接地依赖于任何协议。在本文中,手动录入数据或从文件导入数据可以是另一个“协议”。代替地,可以使用基于协议的提取。以这种方式,可以增加用于收集和写入数据的另外的协议或甚至习惯性方法。
不是所有的协议都具有同样的功能。因此,每个协议可以定义其支持什么功能。
设计可以假设多个协议和多个过程可能用于完成单个发现。
从协议返回的数据可以匹配或不匹配内部对象模型表示。因此,可以将所收集的数据进行转换。这种转换可以客观化,使得可以支持新的设备,而不要求重新编译核心代码。
存储器内对象模型对象可以写入到/读取自永久存储部。该过程的细节可以被提取。实际的备用存储部可以是服务中心的本地/托管的数据库或数据中心的本地/托管的数据库、平面文件、调试日志等等。数据持续提取层可以负责将存储器内对象转换为数据持续对象,被向后备存储写出的中,以及在读取操作期间负责将后备存储对象转换为存储器内表示。
可以将对永久存储部层的请求汇集在一起以最小化后备存储访问的量。如果认为是必需的,那么最近使用的存储器内对象的写入缓存或回写缓存可以减轻重复访问的需要。
配置管理数据库(CMDB)导入请求可以只是发现启动,其中在协议提取以下的实现可以是特定类型的“CMDB导入”协议。
用于资产和相关联的属性的数据库存储部可以是服务资源或数据中心资源。因此,设计应当不排除距备用存储部的位置较远地运行的发现引擎。此外,可以设想,发现过程本身可以是完全地距正在被发现的数据中心远程的或具有距正在被发现的数据中心远程的部分。然而,可以在中心分析数据。
错误处理具有两个方面、即检测和恢复。如果特定的发现实例“再次发现”资产并且检测到冲突,那么其可以与已经被编目的内容调和。例如,其可以发现,在给定的IP地址的服务器已经被另一个服务器代替,或其被升级为具有更多存储器或容纳新的扩展卡。
如果发现过程检测到资产,但是在详细或深入的发现期间时间超时,那么发现引擎可以作出备注并且继续前进。
如果在与数据中心操作者交谈或计算机辅助交互期间发生错误,那么发现引擎可以提供关于恢复方法的建议。可以备注错误并且在发现结束时提供该错误,以减小发现过程受到的阻碍。例如,不大可能的是,操作者可能在较长的导入或自动发现期间站在控制台的前方。
在发现期间,引擎可以提供进度信息(例如所发现的资产的数量和类型的可见的递增计数、丢失的连接计数等等)。如果发现具有多个阶段,那么引擎可以报告目前活动的可能是哪一阶段。如果具有多个发现实例,那么每个实例可以独立地报告并且还提供汇集的视图。
当发现完成时,状态可以指示完成并且提供关于如何处理任何错误情况的建议。
发现引擎可以通过用户界面层从UI轮询状态命令发送状态信息。
数据收集引擎可以是资产监视器。数据收集引擎的工作可以是收集关于资产的关键信息以及将该信息存档到永久存储部中。所收集的信息的类型可以根据资产的类型变化并且可以通过分析引擎要求驱动。之前发现的数据中心资产(IT、设施和软件)可以被轮询并且所收集的数据与时间戳记可以共同写入历史永久存储部中。
待收集的数据实例 可能/可行的源
CPU性能数据 SNMP
内存使用 SNMP
存储部使用和性能 SNMP、SMI-s、API
温度传感器 SNMP、API
进程表性能 SNMP、SSH
PDU功率使用 SNMP、API
UPS状态信息 SNMP、API
CRAC单元状态信息 SNMP、API
功率调节状态信息 SNMP、API
开关配置和状态信息 SNMP、SMI-S、API
制冷器状态信息 SNMP、API
轮询频率可以由用户根据合理的默认值来指定。
可以支持多个同时的数据收集实例以适应大型网络。这可以意味着单个操作者运行多个实例或多个操作者运行数据收集实例。
根据某些实施方案,***能够在5分钟内轮询一百万个资产,而不会消极地影响数据中心服务的表现。
历史数据可以被连续地写入永久存储部。因此,历史数据的足迹可以对于被配置的时间的某个量扩大规模至每5分钟一百万个被轮询的资产。分开安排的“卷起”分析任务可以通过将数据平均以避免数据超程来汇集统计量。然而,在卷起之间的存储量可以据此进行增减。
实际收集的数据可以是未知的,所以其可以被配置为可扩展的。
收集的方法和顺序可以是灵活的。在某些情况下,数据可能直接来自电子表格。在其它情况下,部分数据可以从自动轮询和一些计算机辅助数据录入收集。可以将收集设计为最小化对数据中心的影响。
数据收集可以是连续的轮询过程并且因此可以非常高效。***能够在5分钟内轮询一百万个资产,而不会消极地影响数据中心服务(服务器、网络等等)。
数据收集引擎可以使用之前发现的资产计算出待轮询的内容,从这些资产收集关键信息,并且将与资产相关的关键信息与时间戳记一起写入历史永久存储部。
如果监视器不能够发现之前发现的服务器,那么可以向用户发起警报。冲突可以被备注并且在数据收集过程结束时提出。
分开安排的“卷起”分析任务可以通过将数据平均以避免数据超程来汇集统计量。监测任务可以记录关键信息但是可以不进行数据汇集。
可以收集资产关键信息并且将其存档到永久存储部中,而不需要直接知晓用于获得数据的协议。此外,数据收集引擎可以不直接知晓永久存储部层的细节。
数据收集引擎可以不直接地依赖于任何协议。在本文中,手动录入历史数据或从文件导入数据可以是另一个“协议”。可以使用基于协议的提取。以这种方式,可以增加用于收集和写入数据的另外的协议或甚至习惯性方法。
不是所有的协议都具有同样的功能。因此,每个协议可以定义其支持什么功能。
从协议返回的数据可以匹配或不匹配内部对象模型表示。因此,可以将所收集的数据进行转换。这种转换可以客观化,使得可以支持新的设备,而不要求重新编译核心代码。
存储器内对象模型对象可以写入到/读取自永久存储部。该过程的细节可以被提取。实际的备用存储部可以是本地/托管的服务中心数据库或本地/托管的客户数据库、平面文件、调试日志等等。数据持续提取层可以负责将存储器内对象转换为数据持续对象,被向后备存储写出的中,以及在读取操作期间负责将后备存储对象转换为存储器内表示。
在可能时,可以将对永久存储部层的请求汇集在一起以最小化后备存储访问的量。如果认为是必需的,那么最近使用的存储器内对象的写入缓存或回写缓存可以减轻重复访问的需要。
某些资产的数据收集可能手动地从电子表格或某些定制的格式导入。例如,可能的是,某些第三方工具可以以某个频率收集某些资产的某些数据并且可以产生某个特定格式的历史报告。收集引擎可以被足够地提取以支持历史数据的该习惯源。
收集引擎可以距备用存储部的位置较远地运行。发现过程本身可以是完全地距正在被发现的数据中心远程的或具有距正在被发现的数据中心远程的部分。然而,可以在中心分析数据。
错误处理具有两个方面、即检测和恢复。如果在与数据中心操作者交谈或计算机辅助交互期间发生错误,那么数据收集引擎可以提供关于恢复方法的建议。错误可以被备注并且在结束时提供该错误,以允许数据的收集完成。例如,不大可能的是,操作者在较长的导入或收集期间站在控制台的前方。
可以具有良好的用于控制数据超程的方式。收集引擎可以没有假设用户已经正确地配置和提供了卷起。
在数据收集期间,引擎可以提供进度信息(例如所轮询的资产的数量和类型的可见的递增计数、丢失的连接计数等等)。如果数据收集具有多个阶段,那么引擎可以报告目前活动的可能是哪一阶段。如果具有多个数据收集实例,那么每个实例可以独立地报告并且还提供汇集的视图。
当数据收集完成时,状态可以指示完成并且提供关于如何处理错误情况的建议。
数据收集引擎可以通过UI层(例如,从UI轮询状态命令)发送状态信息。
数据中心基因组图谱(GxDB)可以是可能含有通用的数据中心设备的详细特征的web托管的数据库,通用的数据中心设备包括但不限于服务器、阵列、CRAC、功率管理***和物理基础设施。一般的途径可以是将***(例如服务器或存储阵列)描述为它们的构成部件即CPU、存储器、磁盘等等的汇集。对于每个部件,可以关于功率消耗、可靠性、功能、性能和接口以及在合适时尺寸和重量来收集和维护数据。数据库中的信息可以用于执行基于软件的功率测量、可靠性分析和逻辑/物理仿真。
图10图示了根据一个或多个实施方案的组成配置数据库或配置文件数据库(例如GxDB)的托管服务以及服务的多个客户端的主要部件。
GxDB能够保持在客户的数据中心发现的设备和部件的详细特征。随时间推移,这种收集信息可以增长以包括所有的普遍可用的IT设备。数据库可以含有以数万的数量级的部件描述。
数据库的内容和形式可以随时间推移而演变。架构可以是足够通用和可扩展,以允许容易添加关于在测试期间发现的各种部件类型的新信息。
部件或配置文件数据库(例如GxDB)可能具有非常低的信息增长速率;仅相对少量的记录可以被每日加入至可以可能地具有数十或数百范围的地点。数据库能够以每秒数十个复杂查询的数量级进行服务。根据某些实施方案,GxDB通常可以是一次写入多次读取的资源库,并且可以容易地创建***的多个复件。
根据某些实施方案,可以使用标准开放源数据库和web托管工具实现GxDB。在其他的实施方案中,可以使用用于支持SQL引擎或web中间件的定制数据库***或较大的商业***。
GxDB架构可以来源于上文描述的数据中心对象模型。可以组织关于数据中心部件类型的表格(例如CPU表格、磁盘表格、主板表格等等)。表格内的数据中心部件可以具有唯一的键以用于识别组成较大的***例如服务器和存储阵列的特定部件。
对于给定的数据中心部件,架构区分关于该部件的信息的来源和质量:根据某些实施方案,可以具有三个水平的信息:
i.规格表-来自制造商的规格数据;
ii.用户贡献-由用户社团贡献的数据;以及
iii.由服务提供商验证的信息-使用供应的工具收集的功率和可靠性数据。
根据某些实施方案,可以在web上托管GxDB。托管服务可以使用由任何web托管的应用所需要的Linux服务器平台、存储、维护和备份/恢复操作。GxDB可以使用具有ssh访问以及安装任意的程序包的功能的专用服务器(有形的或虚拟的)。带宽可以不是主要关心的问题。
GxDB可以具有两个类型的接口:
●用于结束用户访问的异步Web GUI
●用于其他部件的计划性的访问的API
这些接口中的一个或两个可以支持:查找/查询、***新数据、对日志的访问、维护、表格空间、备份、恢复以及基因组用途。
为了便于GxDB的广泛使用,可以具有用于帮助表征现场的IT设备的一套工具。这些工具包括但不限于:CPU负荷发生器、I/O负荷发生器(存储和数据网络)、用于读取配置信息的发现工具、来自基于PDU或USB的功率计的自动功率读数以及用于将收集的数据***中央GxDB中的用具。
根据某些实施方案,客户私人信息不能被传输至或存储在GxDB中。可以实施用于保护托管的数据的最好的措施。API和用户界面二者都可能需要用户认证。可以追踪任何由用户贡献的信息的来源。
GxDB中的信息可能对于客户数据中心部署的软件部件的操作是重要的。由于性能和网络访问/安全方面的原因,GxDB的子集可以缓存或复制至在客户位置处部署的软件上。
作为可以由一个或多个客户连续地使用的集中托管的服务,GxDB可以检测到多种***故障并且自动地从多种***故障恢复。可以以冗余的方式部署数据库本身,其还可以实施监测以检测功能上和性能上的问题,并且可以在检测到潜在的故障时“致电家中”和/或报警。
用于产品的用户界面可以支持多种特征,从软件部件的基本配置到大型复杂的数据中心的三维建模和仿真的技术现状。可以具有多种分立的用于支持特定的用户情况的接口。
用户界面体系结构可以提供缓存机制以高效地保持信息的当前工作设置。显示部件可以具有页入IT部件和结果设置的子集的能力。多个用户可以同时与功率分析***交互。
GUI体系结构可以支持简单的数据收集用途、***配置向导、CAD风格布局工具和先进的数据可视化。GUI的通用的高水平可以在图11中图示。
图11描绘了多个示例性的视图。
数据模型层可以提供从OM的核心部件视图到为了高效的GUI操作而组织的模型的转换。在许多情况下这可能是不重要的,然而该体系结构可以允许视图从***中的处理元件完全分离。该层还可以实施在视图中普遍的业务逻辑,但是不适于在分析***、发现***或监测***中实施。
用户界面可以是在两个水平上多线程的。GUI窗口***可以是由事件驱动和多线程的以确保响应的非阻挡的小部件,并且远程API可以围绕可以处理多个重要的请求的异步的命令/响应机制构建。
远程API层可以便利在GUI、GxDB和核心软件之间的通信。该层可以实施异步的命令/响应机制以及某种形式的结果缓存。
基于角色的安全性可以用于控制对数据收集和***控制特征的访问。软件还可以支持对通过公共网络被远程地监测和管理的数据中心的线加密(wire encryption)。
数据中心功率分析产品可以包括托管的GxDB Web服务器、客户安装的软件以及Web部署服务器,从所述Web部署服务器,用户和/或客户可以下载其软件补丁。
属性管理器可以是在***中的一个或多个部件普遍地使用的单件。
该子***可以允许每个产品具有可以被修改(甚至在运行时间)的一组默认值,以避免对重构建、重部署的需要,以及在某些情况下重启我们的产品服务以改变行为的需要。
用于察看和修改当前属性值的用户界面可以通过仅由内部或现场支持人员使用的命令行接口可用。
某些属性的几个实例可以包括:
●总体或部件水平的调试使能够/使不能够进行布尔运算;
●边界限制;
●超时设置;以及
●记录日志。
记录日志管理者可以是在***中的一个或多个部件普遍使用的单件。其可以是可以利用属性管理器使能/禁止各种日志设置的子***的实施例。
每个部件可以具有提供清楚和简明的错误、警告和信息性消息的单独的日志文件。这样的消息提供足够的用于监测我们产品的运行时间状态的信息。日志文件可以在我们的服务开始时创建并且可以被增补,直到服务停止。之前的日志文件可以被轮换(达到上限;例如10)以用于历史回顾。
根据某些实施方案,记录日志管理器可以由一个或多个部件和子***采用以提供各种部件的输出风格(即日期/时间格式)的一致性,并且在错误和警告的情况下,消息可以分别以“错误:”和“警告:”开头。
可以提高记录日志级别以通过开发、QA和现场支持来帮助调试。这样的记录日志级别将被认为是调试水平输出,其通过管理器管理的属性来使能。
可以具有使所有的调试消息发出以及特定的部件或子***的更细化的记录日志的总体调试选项。这样的调试输出可以被预先设置其的具体的调试标签,以用于容易地搜索日志文件;例如发现调试。
调试种类的类型的实例可以包括:发现、数据收集、分析、安全、作业排程、持续/数据库访问、配置、作业排程、用户界面以及需要的其他类型。
审计管理器可以是在数据中心功率分析***中的一个或多个部件中普遍使用以管理与安全审计相关的信息的一个或多个部分的单件。
在每个VSS上的审计日志引用与安全相关的信息,所述与安全相关的信息识别日期/时间、用户和在我们的***中发起的请求及任何与安全相关的警报或错误。对于Web服务器访问,也将记录进行请求的客户端的IP地址。
所有的VSS部件可以提供跟踪设施,其在默认情况下被禁用,但可以根据需要通过属性管理器动态地启用。轨迹水平信息可以包括日期/时间、类名称、方法名称、进入/离开指示器(entry/exit indicator)和方法参数。
调试命令行接口可以是能够访问活动***的调试实用程序。其使用户能够显示和修改对象信息,包括对象属性值,以及堆栈信息。
虽然软件可以是安装有Linux发行版的白盒,所述Linux发行版后安装数据中心功率分析产品,但是用户可能将它视为黑盒(即不与其他的产品和/或服务共享),从而确保合适的***资源是可用的。
升级在Viridity Web服务器上进行并且可用于。
作业排程程序可以是在数据中心功率分析***中的一个或多个部件中普遍使用的单件。其支持在指定的时间由用户或我们***中的部件安排和执行任务。
软件的主要内部部件或用户可以依赖于时间密集型任务的作业排程程序,我们在其上没有阻碍的用于,例如大型数据中心绘图发现会话或长期分析运行。此外,客户可以依赖于作业排程程序以进行过时(aged-out)的数据的以预赋值的间隔的数据库清理或以进行为了灾难恢复目的的管理配置备份。
作业排程程序可以接受用于解决以下问题的输入:
●待执行什么作业?
●谁安排作业?
●作业安排在何时?
●作业被安排执行多长时间?
●作业是否重复发生,如果是的话,以多长的间隔发生?
状态管理器可以是在数据中心分析平台的一个或多个部件中普遍使用的单件。其可以提供允许用户理解当前运行状态(包括进行中的作业和所安排的用于将来执行的作业)的状态信息。
该子***可以提供对即将进行的内容和其如何进行的洞察。由于作业安排最终需要对作业状态的可见性,所以作业排程程序的结果可以是状态管理器角色的不可缺的一部分,显示任务的当前状态(例如安排的、在进行中的、已完成的),以及,如果在进行中,则显示其完成的百分比。对于任何任务的完成状态(例如成功、失败、时间超时等等)也可能是可用的。
状态管理器可以追踪作业的以下属性:
●安排了什么作业。
●谁请求了该作业。
●发起执行作业的请求的时间。
●作业被排程多长时间以开始执行。
●作业状态(例如已安排的、在进行中的、已完成的)。
●作业状态(例如,完成的百分比)。
●作业返回码(例如成功、失败、时间超时等等)
用户界面(UI)可以提供仪表板(例如图26),提供主要部件的当前状态的可见性,例如已安排的任务、正在运行的任务和完成的任务。任务信息可以持续可配置的时间期间,在其之后可以将历史信息去除。
用于普遍使用的功能的程序库的集合可以提供部件实现之间的一致性,并且最大化代码反复使用率和维护的容易性。
程序库可以包括但不限于线程池和存储器管理工具、用于信号量和互斥锁的与锁定相关的功能、以及用于字符串处理的方便功能和类似的功能。
用于开发类程序库的源可以存储在公共源控制程序包中,并且可以不与任何一个具体的部件相关联。
此外,持续的数据,以及配置和数据库数据,可以以UTF-8格式存储。
含有数据中心资产和收集的数据的数据库或电子存储部可有助于对客户问题的理解。导入/导出设施可以用于使获取具体的配置并且将它们导入到其他***上的功能容易。该设施可以被局部地采用以帮助自动的质量保证(QA)测试配置以及允许支持人员对客户地点配置问题的洞察。
对于具有到托管的服务器的外部网络连接的客户地点,存在远程访问设施以通知用户他们当前安装的软件的升级。
在数据中心,安全具有高优先级。即,可能不具有对客户***的用于辅助产品使用或调试产品问题的访问。存在用于对服务***进行快照拍摄的工具,以收集各种产品和***日志文件,包括配置和性质信息。客户可以将压缩的收集信息上传至我们的现场支持地点。包含在收集信息内的状态可以足以远程地调试客户问题。
实现数据中心效率可能需要不同的但是在技术上严谨的方法,所述方法自动地识别低效率并且应用被证明为最大化能量节约的特定的策略。
根据某些实施方案,所述方法可以被概括为以下的步骤:
i.理解现有的物理基础设施:
捕获数据中心的物理结构;
ii.监测操作(仪表和测量,以连续地识别所有的能量***和IT设备使用的当前的操作效率);以及
iii.理解物理基础设施的逻辑:
将物理IT设备对逻辑业务水平IT使用绘图。
基于识别的与功率相关的低效率,可以提出计划策略以解决低效率问题。
逻辑、操作和计划步骤可以结合起来工作,以创建用于优化数据中心的能量消耗的自动化过程。
在图12的示例性的实施方案中所示的自动化过程具有五个要素:
1)逻辑模拟器(IT资源的功率消耗);
2)物理工厂模拟器(物理工厂热变化曲线估计);
3)工厂能量模型(数据中心冷却功率估计模型);
4)策略选择器(用于能量节约);以及
5)能量优化器(数据中心范围)。
逻辑模拟器可以在逻辑级工作,以估计IT***需要的功率,并且产生作为输出的可行的能量节约策略和候选的放置或位置的列表,并且将列表提供至物理工厂模拟器。
逻辑模拟器的输入可以包括:
i)用于所有的IT设备的物理网络和连接布局;
ii)维护部署的所有IT设备的IT资产数据库;
iii)IT设备利用率、效率、功率消耗等等的历史数据库;
iv)测量-关于温度、空气流的所有传感器数据或来自任何IT设备的其他设备内测量的相关数据;以及
v)新的IT设备部署(或IT设备部署的任何变化):提出新的IT部署或重新部署或报废,或可能的重新定位等等。
逻辑模拟器可以使用基于约束的优化来产生其推荐。
物理工厂模拟器可以用于获取逻辑模拟器的输出并且将IT功率消耗转换为物理工厂的热变化曲线,例如提出30热图。可以使用计算流体动力学(CFD)建模获取在数据中心的不同区域的热图(如图13所示的)。
一旦获得热图,那么我们可以估计冷却负荷(例如BTU)。根据某些实施方案,这可以使用参考表(例如来自ASHME的那些参考表)来进行,以确定为了保持期望的数据中心在设定点温度操作所需要的总冷却能量。
模型可以捕获估计冷却负荷的非线性模型,所述冷却负荷为在数据中心部署给定的热源(即,新的IT设备)时工厂所需要的冷却负荷。由于模型可以依赖于数据中心的具体的物理配置和IT布局及冷却***,所以其可以通过适配(反馈)并且利用工厂的热力学性质的任何现有技术来构建。
基于由物理工厂模拟器和逻辑模拟器提供的冷却负荷需要的策略和放置选项,该模块可以使用博弈论技术确定来自数据中心的测量和我们称为V指标(在下文定义的)的量值,其是设备的最小化对于数据中心的总冷却和功率的最佳放置选项。
优化器可以基于计划的总能量(来自逻辑模拟器的IT功率消耗和来自物理工厂模拟器的冷却负荷)成本来评价和分析由能量策略选择器推荐的放置选项。其可以确定最优的策略和放置选项。
当执行最优策略和放置选项时,优化器可以比较实际的冷却和总能量负荷,并且基于来自计划的值的错误,更新工厂能量模型。
使用闭环控制,数据中心物理工厂模型可以为了精确度而连续地更新。这进而可以改进给定的数据中心的总能量节约的可预测性。
如在图14的示例性的GUI中示出的,可以监测数据中心的操作以理解在任何时间每个IT部件消耗多少功率。
可以使用基于配置部件,例如在服务器的情况下,CPU核、存储器等等的数量,估计不同的卖方IT设备(例如服务器、存储部等等)的功率抽运的数据库或电子存储部。一旦数据中心的物理布局和逻辑IT基础架构已知,那么该数据库可以允许自动化软件预测在设备级的功率消耗。
该数据库和用于使用的仪表的关键的使用情况可以是在任何时间被任何设备的实际的功率消耗的预测中。
根据某些实施方案,可以通过连续地监测功率和冷却能量使用,执行对能量和功率消耗的当前状态的理解。其可以具有多个原因:
首先,由设备卖方列出的功率消耗和冷却规格可以是最坏情况的值。使用卖方的面板数量可以因此导致高水平的超量供应,这进而可以导致功率***的较高成本以及因此功率输送的较低效率和较高成本。
第二,IT设备的功率消耗水平可以随利用率的水平显著地变化。当服务器从很少使用变为完全利用时,功率水平的50%的波动可能是常见的。当功率消耗的这种变化在数据中心的很多服务器中放大时,总功率抽运的差异可以是非常大的。
第三,可能由于服务器的物理配置的相对小的变化而引起功率抽运的大的变化。
第四,精确的功率抽运测量可以需要干涉性仪表,尤其在多个设备例如服务器从单个电路抽运功率并且安装分别的服务器水平计可能不是可能的时。
第五,虽然估计功率是困难的,但是当不同的IT设备被放置在数据中心的不同区域时,预测在数据中心的不同区域的冷却负荷是更困难的。目前没有用于与数据中心内的每个物理区域相关联的冷却负荷或成本的良好的可承受或可行的实时测量。
构建数据中心内的物理IT和功率资源的目录可以使用手动检查数据中心和使用仪表检测数据中心二者。可以使用详细的目录以测量在地板上部署了什么消耗功率的物理IT设备。细节的水平可以包括位置,即在服务器机架内的位置、数据中心内的机架的通过通道的位置等等,由于冷却所需要的能量可能依赖于可以具有较宽地变化的热力学配置文件的具***置。
然后可以检索和搜索物理目录,如图15中所示的,其中对于每个已经通过位置标识的服务器,可以使用以足够的精确度测量功率消耗的仪表检测。由于预期的能量节约水平可能在20%-40%的范围内,所以任何具有高于几个百分点的公差的仪表检测方法可能不足以精确地表征操作功率消耗和能量节约的潜力。因为功率消耗目前不在设备处测量而是在数据中心中的粗略的水平处测量,所以可能缺乏精确而详细的仪表检测。
可以在单独的IT设备(或电路)级估计功率抽运。这种新技术可以使用设备内信息来预测消耗的功率,而不需要任何专门的测量或接线。这可以解决两个问题:
●首先,可能不能物理地安装仪表以得到分别的设备,例如在机架内的服务器。
●第二,即使仪表检测是可能的,某些数据中心的所有者可能不情愿允许侵入性的仪表检测。
考虑到这些限制并且因为文献上一直没有用于解决该问题的途径,这种新的归纳法可以通过从设备直接地读取其他的数据来估计在单独的设备级的功率消耗,而不考虑它们所在的电路。这可以提供与设备相关的功率,而与设备配置无关。
一旦捕获了所有的IT设备的物理目录,那么我们使用数据库可以允许对什么业务应用软件被逻辑地对物理设备绘图,例如什么服务器用于电子邮件服务。
使用这种逻辑搭配,可以确定什么IT设备用于什么业务关键的(或,相反地,业务上不重要的)应用程序以及其是否被分配了功率预算的不公平的份额。
物理工厂模拟器可以提供物理工厂的热图。然而,为了估计冷却负荷,策略选择器可以使用物理工厂模拟器和数据中心工厂能量模型的输出。
这种估计可以帮助定量地评价任何新的或改变的IT负荷的总能量影响,并且可以辅助提供所选择的能量节约策略的预测能力。就我们所知,虽然现有的用于减小数据中心的能量的方法使用手动方法和点对点方法,但是本发明的方法可以提供用于数据中心的能量减小的自动的和可扩展的方法。
目前的数据中心的能量效率的测量是非常粗略的并且不能帮助确定可以节约能量的具体区域。其包括仅指示由数据中心使用的总功率的哪一部分由IT设备使用的功率使用效率(PUE)测量。其可以具有严重的限制:
例如,PUE不提供关于区域中的热点(数据中心内的比其他的区域更热的区域或区)或冷却低效率如何增加冷却成本的信息,因为热点升高了毗邻区域中的温度,所述毗邻区域在正常情况下会较冷。这种低效率可以将冷却成本增加20%或更多。
如果PUE不能够隔离导致低效率的局部区域,那么其不指示数据中心的哪个区域可以导致最大的能量节约,以及低效率的本质原因。
因为目前的效率测量提供有限的信息,所以识别数据中心的低效率来源是一个手动过程。
新的定量的细化的效率量值,即“Viridity指标”或“V指标”可以以小于机架的单元和机架内的单元来表征数据中心。其可以从数据中心内的可测量的参数导出或计算。其可以定量地指示在应用任何能量节约策略之后能量效率的改进。
已经开发了多种不同的V指标,包括关于IT设备在数据中心内的最好的放置、关于IT设备的能量效率以及关于数据中心内的任何区域的冷却效率的指标。
作为关于如何使用V指标的简单的例证,考虑新的IT设备即服务器在数据中心内的放置。
图13示出了数据中心的热配置文件(其通过称为计算流体动力学或CFD的计算密集型过程产生)。在数据中心上标记了两个区域,即一个热区域和一个冷区域。简单的方法将是将服务器定位在冷区域中。然而,设备的放置更复杂,因为其必须考虑到在该区域的冷却成本(效率)、在机架和空间中可用的总功率(瓦特)。
使用放置V指标,我们可以自动地确定数据中心内的最小化冷却成本同时确保满足可用的功率和空间限制等等的最好区域。
图16示出了使用V指标进行服务器在数据中心内的最优放置的可视化结果。绿色区域指示服务器的理想位置。
作为计划步骤的一部分,可以提供可以在数据中心内实现的策略的按优先级列出且可行的列表。该列表由策略选择器使用。
图17描绘了消除僵尸服务器策略的可视视图。红色区域指示可以去除的僵尸服务器(例如未使用的服务器或其他的未利用的资源)的位置。
可行的策略的几个实施例包括:
●热点消除:
识别热点可以包括识别数据中心内的比其他的区域更热的区域。通过移动设备或修改负荷,我们可以减小所使用的功率(产生的热)或改进冷却(例如空气流)。该策略可以导致较低的冷却负荷和较低的成本。
●设备放置:
设备放置可以涉及明智地将新的设备放置在较冷的点而不是较热的点处,以降低数据中心的总体温度。
●在较高的温度运行数据中心
在较高的温度运行数据中心可以减小总的冷却负荷并且因此提高数据中心的功率消耗效率。
●去除僵尸服务器:
通过识别和弃用“僵尸”服务器(即数据中心内的不用于任何应用程序的服务器),可以减小功率消耗和冷却负荷。
●IT资源的整合
整合IT资源使得计算和存储资源具有较高的容量,可以减小消耗的总功率(即可以减小KW/单元)。
●更换较低能效的设备
使用较高能效的设备更换较低能效的设备可以减小总的功率消耗。
这些策略中的大多数,无论设备放置还是技术革新,都不是简单的决定。其要求考虑以下因素:
i.将逻辑IT设备使用对其的当前物理位置绘图;以及
ii.空间和可用功率的限制。
做出变化,无论是放置还是重新定位新的设备,将局部地和在毗邻的区域中改变功率负荷和相关联的冷却负荷。
典型地,这样的问题的解决方案在能量优化器中实现,其要求解决多约束的优化问题。
根据一个实施方案,一种方法是监测-理解-控制整个数据中心的能量效率。
根据某些实施方案,一个或多个计算可以包括含有其他的成本因素(包括冷却成本)的指标。例如,可以具有可计算瓦特的实际成本的Viridity指标。功率的成本可以等于IT-功率-成本+冷却-功率-成本+损失。其他的计算可以包括:
●功率的成本~PUE*瓦特_成本;
●空间的成本=数据中心/瓦特的分摊的资本成本;以及
●超量供应的功率+冷却HW/瓦特的成本=>过量的PDU、制冷器、UPS、UPS电池等等/瓦特。
此外,数据中心内的任何IT部署可以影响:功率、冷却、空间和可用性(可靠性)。传统的PUE计算可能是不足够的。例如,图18可以是表示数据中心内的用于放置设备的两个不同位置的热图。选项1可以是热位置并且选项2可以是冷位置。根据某些实施方案,可以使用计算流体力学识别这些位置。传统的PUE计算可能不足以识别它们。
计算范围可以被细化:其中可以放置设备的次机架级“区域”。这可以用于设备的最优放置。功率的效率的指示被向区域传送(对于被IT设备完成的功)。数据中心可以被分解或组织为区域。区域的精细度可以小于机架(例如跨过两个机架1U或2U)或大于或等于机架(例如多个机架)。基座、槽或U可以被汇集入区域中。例如,图19可以是在划分区域之前的单个机架单元。图20可以是根据某些实施方案的机架单元的示例性的区域划分。区域还可以跨越机架和/或包括一个或多个机架。
示例性的指标包括:
●Vt-相对温度指标/区域
其是可以指示如何在可能被不均匀地冷却(例如具有热点)的数据中心分布冷却成本的指标。
●Vw-瓦特指标
该指标指示在具体的区域中使用的瓦特相对于所提供的总潜在瓦特。
●Vs-区域中可用的标准化空间
该指标指示可用的槽(U的)和连续的槽(U的)。
●Vu-区域中的IT设备的利用率
为了计算该指标,人们可能首先需要归一化核×时钟频率×利用率的数字。
●Vp:区域(矢量)或数据中心的放置指标(成本)
Vp=VtVwVs
Vp是温度指标、瓦特指标和空间指标的函数。
较高值的区域可能是不太期望的位置。
●Ve:IT的归一化效率
Ve=f(VtVu)(非线性函数!)
Ve是IT利用率和温度指标的函数。较低值的区域的效率较低在利用率Vu是较高时。Ve可能较高。如果热指标Vt较高,那么Ve可能较低。
其可以从CPU温度、服务器的GxDB配置文件等等来估计。
●Vr:IT设备/区域的可靠性指标
如图21中图示的,可靠性可以取决于区域中的设备的使用年限。如图22中图示的,其可以取决于区域的温度Vt
关于设备的放置的热指标可以包括:
●总体(数据中心范围)Vt
其可以测量数据中心(DC)内的热配置文件的不平衡。
其可以提供示出了不平衡的品质的单个数值(特别是冷却低效率)。其可以与区域温度的加权差值相关。
V t = Σ i Σ j ≠ i ( Z i - Z j ) 2 d i j - 1 / 3 N
Zi、Zj意指区域i和j的温度
dij:区域i和j之间的距离
N:总#区域
●局部Vt
其可以测量单个区域的热配置文件的不平衡。其可以是区域中的任何IT设备的放置成本。其可以是相对成本测量。
其可以与数据中心热配置文件相关。
可以使用计算流体动力学验证热点。
V t i = Σ j ≠ i ( Z i - Z j ) 2 d i j - 1 / 3 N - 1
图23可以是用于比较两个数据中心配置的总体Vt指标的使用的实施例。可以具有在不同温度的16个均一的(机架级)区域。
图24可以是总体Vt的第二实施例。两个数据中心配置可以含有相同的区域温度设置,但是具有不同的分布。
图25可以是局部(区域)Vt的另一个实施例。局部区域Vt可以是用于将设备放置在那儿的“租金”成本。如果区域温度比毗邻的区域具有更大的差异的话,其可能较高:这可以反映热-冷空气混合的较高成本。
总之,许多不同的能量节约策略是可能的,每种策略在不同的参数工作并且产生不同的V指标。
能量节约策略
通过平衡功率、冷却和利用率,可以恢复数据中心的灵敏性。这可以释放资源,提高服务水平和响应性、并且延长数据中心的寿命。
根据某些实施方案,可以在数据中心仅使用软件。可以不需要另外的传感器或代理。标准的协议和API的使用可以提供多经销商支持。可以通过许多数据源提供数据的汇集。
这可以提高数据中心、电路和机架的功率利用率。这可以提供对数据中心的物理层和逻辑层的综合理解。这可以允许在服务器、应用和业务水平的功率结算(收费-返回)的开发。其可以允许SLA(服务水平协议)被通知更好的风险和可用性分析,改进技术性优化和战略性计划,并且使数据中心效率管理成为可能。
所讨论的功率和温度分析技术可以提供真实的部件功率/冷却消耗、实时的功率管理、实时的冷却管理、趋势线和预测分析、拒付能力、策略性设备放置、风险和可用性管理、以及效率优化***和仿真。
根据某些实施方案,所讨论的功率和温度分析技术中的一个或多个可以作为服务模型在软件中提供。可能具有不同的定价模型。可以提供对功率和热模型的定期更新。根据某些实施方案,技术可以被订购,对被数据中心管理的部件的数量定价。可以根据模块增减成本。
图26-29可以提供示例性的监测、报告和管理屏幕。图30可以提供本文讨论的技术的一个或多个实施方案的高级别概览。
在这点上,应当注意,根据上文描述的本公开内容的用于数据中心的功率分析的技术在某种程度上典型地涉及输入数据的处理和输出数据的产生。这种输入数据的处理和输出数据的产生可以在硬件或软件中实施。例如,根据上文描述的本公开内容,在数据中心的功率分析模块或相似的或相关的电路中可以采用特别的电子部件,以实施与数据中心的功率分析相关联的功能。可选择地,根据上文描述的本公开内容,根据指令操作的一个或多个处理器可以实施与数据中心的功率分析相关联的功能。如果这样的话,那么这将在本公开内容的范围内,即,这样的指令可以存储在一个或多个处理器可读的存储介质(例如磁盘或其他的存储介质)上,或通过包含在在一个或多个载波中的一个或多个信号传输至一个或多个处理器。
本公开内容不限于本文描述的具体的实施方案的范围。实际上,从上文的描述和附图,除了本文描述的那些内容之外,本公开内容的其他的多种实施方案以及对本公开内容的修改,对于本领域的技术人员将是明显的。因此,意在这些其他的实施方案和修改落入本公开内容的范围内。此外,虽然本公开内容在本文中为了特定的目的在特定的环境中的特定的实现的背景中进行了描述,但是本领域的技术人员将意识到,其用途不限于此并且本公开内容可以为了任何数量的目的在任何数量的环境中被有益地实施。据此,下文提出的权利要求应当考虑本文描述的本公开内容的全部范围和精神进行解释。

Claims (21)

1.一种用于多个计算平台部件的功率分析的方法,所述方法包括:
发现与所述多个计算平台部件的至少一个物理部件相关联的一个或多个逻辑要素,所述一个或多个逻辑要素包括与所述至少一个物理部件相关联的操作***组成部分、与所述至少一个物理部件相关联的虚拟机和与所述至少一个物理部件相关联的应用程序中的至少一个;
由计算机处理器执行所述多个计算平台部件的每个物理部件的过程,所述过程包括:
接收与物理部件相关联的信息;
检索与所述物理部件相关联的电子存储的数据,该数据至少包括功率消耗数据;以及
至少部分地基于所存储的功率消耗数据和与所述物理部件相关联的任何逻辑要素估计所述物理部件的估计的功率使用;
汇集包括在设备中的每个物理部件的所述估计的功率使用,以产生所述设备的估计的功率使用;
输出所述设备的所述估计的功率使用的指示;
基于所述设备的所述估计的功率使用来识别一个或多个问题;
产生一个或多个建议以解决所识别的一个或多个问题;以及
识别和图示所述一个或多个建议的影响。
2.根据权利要求1所述的方法,其中接收与所述物理部件相关联的所述信息包括接收与计算机处理器、电子存储部和联网部件中的至少一个相关联的信息。
3.根据权利要求1所述的方法,其中,汇聚每个物理部件的所述估计的功率使用包括汇集包括在设备中的每个物理部件的所述估计的功率使用,所述设备包括服务器、网络设备、主机和存储设备中的至少一个。
4.根据权利要求1所述的方法,还包括:
对区域中的多个设备重复所述过程。
5.根据权利要求1所述的方法,还包括:
接收与所述多个计算平台部件的所述至少一个物理部件相关联的一个或多个测量结果;以及
至少部分地基于所接收的一个或多个测量结果来估计所述至少一个物理部件的功率使用。
6.根据权利要求5所述的方法,其中接收所述一个或多个测量结果包括接收来自温度传感器、处理器芯片、散热器、磁盘控制器、电源和网络部件中的至少一个的读数中的至少一个。
7.根据权利要求5所述的方法,其中接收所述一个或多个测量结果包括接收CPU使用率、事务处理速率、通信速率、配置信息、活动进程和多种虚拟机中的至少一个。
8.根据权利要求1所述的方法,还包括至少部分地基于所接收的一个或多个测量结果来估计所述多个计算平台部件的所述至少一个物理部件的热变化曲线。
9.根据权利要求8所述的方法,还包括基于所述热变化曲线估计估计的功率使用。
10.根据权利要求9所述的方法,其中基于所述热变化曲线估计所述估计的功率使用包括使用所述热变化曲线来估计冷却成本。
11.根据权利要求1所述的方法,还包括接收来自配电单元和计算机机房空气调节器中的至少一个的一个或多个测量结果。
12.根据权利要求11所述的方法,还包括使用所接收的一个或多个测量结果来估计功率使用和热变化曲线中的至少一个。
13.根据权利要求1所述的方法,其中接收与所述物理部件相关联的信息包括通过网络接口发现所述物理部件。
14.根据权利要求13所述的方法,其中通过网络接口发现所述物理部件包括使用以下项中的至少一个:简单网络管理协议(SNMP)、存储管理计划规范(SMI-S)、智能平台管理接口(IPMI)、Windows管理规范(WMI)、安全外壳(SSH)、BACNet和ModBus。
15.根据权利要求13所述的方法,其中通过所述网络接口发现所述物理部件包括在来自远程地点的数据中心上进行的发现。
16.根据权利要求1所述的方法,还包括在没有检索到与未被识别的部件相关联的电子存储的数据的情况下接受用于所述未被识别的部件的输入。
17.根据权利要求1所述的方法,其中检索与所述物理部件相关联的所述电子存储的数据包括从以下项中的至少一个的数据库检索所述电子存储的数据:部件的配置文件、服务器阵列、计算机机房空气调节器、配电单元和数据中心物理基础设施。
18.根据权利要求1所述的方法,还包括基于以下项中的至少一个提供一个或多个建议:所述多个计算平台部件的至少一个物理部件的估计的功率使用、所述设备的估计的功率使用、区域的估计的功率使用、数据中心的估计的功率使用、区域的热变化曲线和数据中心的热变化曲线。
19.根据权利要求18所述的方法,其中提供所述一个或多个建议包括提供以下项中的至少一个:去除未利用的物理部件的建议、整合未充分利用的物理部件的建议、升级低效的物理部件的建议、更换低效的物理部件的建议、将一地理位置内的物理部件重新布置以改进热变化曲线的建议、和将工作负荷在地理位置内的物理部件上重新分布以改进热变化曲线的建议。
20.根据权利要求8所述的方法,其中使用计算流体动力学估计所述热变化曲线。
21.一种用于多个计算平台部件的功率分析的***,所述***包括:
用于发现与所述多个计算平台部件的至少一个物理部件相关联的一个或多个逻辑要素的模块,所述一个或多个逻辑要素包括与所述至少一个物理部件相关联的操作***组成部分、与所述至少一个物理部件相关联的虚拟机和与所述至少一个物理部件相关联的应用程序中的至少一个;
用于执行所述多个计算平台部件的每个物理部件的过程的模块,其包括:
用于接收与物理部件相关联的信息的模块;
用于检索与所述物理部件相关联的、至少包括功率消耗数据的电子存储的数据的模块;以及
用于至少部分地基于所存储的功率消耗数据和与所述物理部件相关联的任何逻辑要素来估计所述物理部件的估计的功率使用的模块;
用于汇集包括在设备中的每个物理部件的所述估计的功率使用以产生所述设备的估计的功率使用的模块;
用于输出所述设备的所述估计的功率使用的指示的模块;
用于基于所述设备的所述估计的功率使用来识别一个或多个问题的模块;
用于产生一个或多个建议以解决所识别的一个或多个问题的模块;以及
用于识别和图示所述一个或多个建议的影响的模块。
CN201080041811.6A 2009-07-20 2010-07-20 用于功率分析的技术 Active CN102687111B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US22699809P 2009-07-20 2009-07-20
US61/226,998 2009-07-20
PCT/US2010/042596 WO2011011408A1 (en) 2009-07-20 2010-07-20 Techniques for power analysis

Publications (2)

Publication Number Publication Date
CN102687111A CN102687111A (zh) 2012-09-19
CN102687111B true CN102687111B (zh) 2016-11-16

Family

ID=43466087

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080041811.6A Active CN102687111B (zh) 2009-07-20 2010-07-20 用于功率分析的技术

Country Status (9)

Country Link
US (1) US9116897B2 (zh)
EP (1) EP2457153B1 (zh)
CN (1) CN102687111B (zh)
AU (1) AU2010276368B2 (zh)
BR (1) BR112012001315A2 (zh)
CA (1) CA2768724A1 (zh)
DK (1) DK2457153T3 (zh)
RU (1) RU2636848C2 (zh)
WO (1) WO2011011408A1 (zh)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2568377C2 (ru) 2009-06-02 2015-11-20 ШНАЙДЕР ЭЛЕКТРИК ЮЭсЭй, ИНК. Способ интеграции нескольких доменов управления
JP5240132B2 (ja) * 2009-09-04 2013-07-17 富士通株式会社 熱流体シミュレーション解析装置
US9621360B2 (en) * 2010-01-22 2017-04-11 Alcatel Lucent System and method for analyzing network power consumption
US8798834B2 (en) * 2010-02-17 2014-08-05 Lg Electronics Inc. Movable component for a network system
US8374928B2 (en) * 2010-02-25 2013-02-12 International Business Machines Corporation Data center power cost accounting system
US8543858B2 (en) * 2010-04-07 2013-09-24 Broadcom Corporation System and method for managing network devices that deliver an application service using energy savings information
US8560291B2 (en) * 2010-06-22 2013-10-15 International Business Machines Corporation Data center physical infrastructure threshold analysis
US8532974B2 (en) * 2010-09-28 2013-09-10 Sentelic Corporation Developing system and method for optimizing the energy consumption of an application program for a digital signal processor
EP2625585A2 (en) 2010-10-04 2013-08-14 Avocent Huntsville Corporation System and method for monitoring and managing data center resources in real time
JP5785725B2 (ja) * 2010-10-15 2015-09-30 富士通株式会社 電力見積装置、電力見積方法及びプログラム
US20120109619A1 (en) * 2010-10-29 2012-05-03 Daniel Juergen Gmach Generating a resource management plan for an infrastructure
KR20120057066A (ko) * 2010-11-26 2012-06-05 한국전자통신연구원 네트워크 보안관제 시스템 및 방법, 네트워크 보안관제를 위한 보안 이벤트 처리 장치 및 시각화 처리 장치
US8676397B2 (en) * 2010-12-20 2014-03-18 International Business Machines Corporation Regulating the temperature of a datacenter
US8694279B1 (en) 2010-12-30 2014-04-08 Exaflop Llc Data center thermal monitoring
US8630822B2 (en) * 2011-02-11 2014-01-14 International Business Machines Corporation Data center design tool
US20120215373A1 (en) * 2011-02-17 2012-08-23 Cisco Technology, Inc. Performance optimization in computer component rack
US9020770B2 (en) * 2011-06-27 2015-04-28 International Business Machines Corporation Estimating component power usage from aggregate power usage
US10423509B2 (en) * 2011-08-05 2019-09-24 Entit Software Llc System and method for managing environment configuration using snapshots
CA2845402A1 (en) * 2011-08-16 2013-02-21 Cirba Inc. System and method for determining and visualizing efficiencies and risks in computing environments
WO2013042271A1 (ja) * 2011-09-22 2013-03-28 富士通株式会社 電子計算機システム及び仮想マシン配置方法
WO2013055373A1 (en) 2011-10-15 2013-04-18 Hewlett-Packard Development Company, L.P. Quantifying power usage for a service
US8713562B2 (en) 2012-01-06 2014-04-29 International Business Machines Corporation Intelligent and automated code deployment
CN102545707B (zh) * 2012-01-11 2016-04-20 云南电力试验研究院(集团)有限公司电力研究院 以发电单元为基本预测单元的发电功率预测方法及***
US20130198362A1 (en) * 2012-01-26 2013-08-01 International Business Machines Corporation System for Identifying a Server to be Decommissioned
US20130197895A1 (en) * 2012-01-31 2013-08-01 Zhikui Wang Real-time server management
US8965591B2 (en) 2012-02-16 2015-02-24 General Electric Company Regenerating electric power distribution switching plans based on changing power distribution network conditions
US9093841B2 (en) * 2012-02-16 2015-07-28 General Electric Company Power distribution network event correlation and analysis
US9484743B2 (en) * 2012-02-16 2016-11-01 General Electric Company Power distribution network event analysis using data from different data sources
US9176560B2 (en) * 2012-02-27 2015-11-03 Hewlett-Packard Development Company, L.P. Use and state based power management
US20130231979A1 (en) * 2012-03-05 2013-09-05 Ebay Inc. Service efficiency metric
FR2991067B1 (fr) * 2012-05-25 2015-11-20 Bull Sas Procede, programme d'ordinateur et dispositif de gestion du refroidissement d'un cluster
EP2862337B1 (en) * 2012-06-15 2020-03-04 Alcatel Lucent Architecture of privacy protection system for recommendation services
US10082857B1 (en) * 2012-08-07 2018-09-25 Amazon Technologies, Inc. Cooling electrical systems based on power measurements
US20140052850A1 (en) * 2012-08-13 2014-02-20 Panduit Corp. Datacenter Capacity Planning and Management
CN102854418B (zh) * 2012-08-27 2014-11-26 北京华胜天成科技股份有限公司 一种能源使用效率检测仪及检测***
US9959371B2 (en) 2012-09-12 2018-05-01 Tata Consultancy Services Limited Method for efficient designing and operating cooling infrastructure in a data center
US20140115371A1 (en) * 2012-10-18 2014-04-24 International Business Machines Corporation Decommission of a Server in Wireless Environment
US10192183B2 (en) * 2012-11-30 2019-01-29 Trane International Inc. System and method for real cost analysis of a cooling system
US9081957B2 (en) * 2013-02-07 2015-07-14 Ryatheon BBN Technologies Corp Dynamic operational watermarking for software and hardware assurance
US20140228993A1 (en) * 2013-02-14 2014-08-14 Sony Europe Limited Apparatus, system and method for control of resource consumption and / or production
US9092508B1 (en) * 2013-02-15 2015-07-28 Emc Corporation Overseeing data storage equipment power usage via local collection of power consumption data and remote evaluation and reporting of performance
US10114719B2 (en) 2013-02-21 2018-10-30 International Business Machines Corporation Estimating power usage in a computing environment
US20140278617A1 (en) * 2013-03-15 2014-09-18 Rockwell Automation Technologies, Inc. Systems and methods for updating confidence values for energy information associated with an industrial automation system
US20140278333A1 (en) * 2013-03-15 2014-09-18 Arizona Board of Regents, a body corporate of the State of Arizona, acting on behalf of Arizona Sta Systems, methods, and media for modeling transient thermal behavior
US20140277809A1 (en) * 2013-03-18 2014-09-18 Hjalmar Nilsonne Method and System for Energy Savings
GB2513141A (en) * 2013-04-17 2014-10-22 Ibm Data processing system with real-time data center air flow simulator
KR20140144520A (ko) * 2013-06-11 2014-12-19 삼성전자주식회사 프로세서 모듈, 마이크로 서버 및 프로세서 모듈의 제어 방법
US20150032283A1 (en) * 2013-07-29 2015-01-29 International Business Machines Corporation Data center cooling
GB2517195A (en) 2013-08-15 2015-02-18 Ibm Computer system productivity monitoring
US10591968B2 (en) * 2013-09-30 2020-03-17 Hewlett Packard Enterprise Development Lp Selectively-enabling battery back-up power based on a power demand
US9355010B2 (en) * 2013-10-29 2016-05-31 Seagate Technology Llc Deriving an operational state of a data center using a predictive computer analysis model
IN2013CH05013A (zh) * 2013-11-07 2015-05-08 Schneider Electric It Corp
US20150261648A1 (en) * 2014-03-13 2015-09-17 Parth Malani Power monitoring system for virtual platform simulation
US10606642B1 (en) * 2014-09-16 2020-03-31 Amazon Technologies, Inc. Dynamic power budgets
US10129611B2 (en) 2014-09-27 2018-11-13 Rf Code, Inc. System and method for monitoring sensor output
SG11201703350WA (en) * 2014-10-28 2017-05-30 Univ Singapore Software productivity tool to detect power inefficiencies caused by a software program
US10281507B2 (en) 2014-11-21 2019-05-07 Kohler Co. Generator sizing
US9819583B2 (en) * 2015-01-29 2017-11-14 Dell Products Lp Systems and methods for energy cost aware routing
US10243879B2 (en) * 2015-03-13 2019-03-26 Microsoft Technology Licensing, Llc Intelligent placement within a data center
US9915965B2 (en) * 2015-03-16 2018-03-13 The Florida International University Board Of Trustees Flexible, secure energy management system
US10114649B2 (en) 2015-05-26 2018-10-30 International Business Machines Corporation Thermal availability based instruction assignment for execution
US10447546B1 (en) * 2015-06-24 2019-10-15 EMC IP Holding Company LLC Customized visualizations for data centers
US11049051B2 (en) * 2015-09-14 2021-06-29 Schlumberger Technology Corporation Wellsite power mapping and optimization
US10234927B2 (en) * 2015-11-12 2019-03-19 International Business Machines Corporation Storage system power usage
USD810104S1 (en) 2015-11-16 2018-02-13 Kohler, Co. Display screen with graphical user interface
USD811423S1 (en) 2015-11-16 2018-02-27 Kohler, Co. Display screen with graphical user interface
CN105744232B (zh) * 2016-03-25 2017-12-12 南京第五十五所技术开发有限公司 一种基于行为分析技术的输电线路视频防外破的方法
US10904127B2 (en) * 2016-06-13 2021-01-26 Intel Corporation Systems and methods for detecting a zombie server
US10644963B2 (en) 2016-06-13 2020-05-05 Intel Corporation Systems and methods for detecting a zombie server
US11308064B2 (en) * 2016-06-29 2022-04-19 Dell Products L.P. System and method for supporting similar thermal devices
US11175708B2 (en) * 2016-07-12 2021-11-16 American Megatrends International, Llc Thermal simulation for management controller development projects
US20180052574A1 (en) * 2016-08-22 2018-02-22 United States Of America As Represented By Secretary Of The Navy Energy Efficiency and Energy Security Optimization Dashboard for Computing Systems
US11076509B2 (en) 2017-01-24 2021-07-27 The Research Foundation for the State University Control systems and prediction methods for it cooling performance in containment
US10860071B2 (en) 2017-05-04 2020-12-08 Microsoft Technology Licensing Llc Thermal excursion detection in datacenter components
US10656700B2 (en) * 2017-07-10 2020-05-19 Oracle International Corporation Power management in an integrated circuit
US20190057180A1 (en) * 2017-08-18 2019-02-21 International Business Machines Corporation System and method for design optimization using augmented reality
EP3454201B1 (en) * 2017-09-07 2020-04-01 Canon Production Printing Holding B.V. A power management arbiter system for a print fleet and a method of using said system
US10496460B2 (en) 2017-11-15 2019-12-03 Bank Of America Corporation System for technology anomaly detection, triage and response using solution data modeling
US10579032B2 (en) * 2018-02-23 2020-03-03 Red Hat, Inc. Power distribution unit interface system
US11023835B2 (en) * 2018-05-08 2021-06-01 Bank Of America Corporation System for decommissioning information technology assets using solution data modelling
CN109039785B (zh) * 2018-09-27 2021-05-04 郑州云海信息技术有限公司 基于SNMP的Trap告警恢复方法和装置
US20220091654A1 (en) * 2019-06-07 2022-03-24 Hewlett-Packard Development Company, L.P. Device operation modifications based on monitored power levels
CN112113629A (zh) * 2019-06-19 2020-12-22 中国信息通信研究院 一种数据中心的水使用率确定方法和装置
US11861402B2 (en) * 2020-06-25 2024-01-02 Vmware, Inc. Methods and apparatus for tenant aware runtime feature toggling in a cloud environment
CN111950171B (zh) * 2020-07-03 2022-03-15 南京东博智慧能源研究院有限公司 一种气热惯性备用参与园区综合能源***备用配置方法
CN112162142B (zh) * 2020-09-30 2023-11-03 厦门科灿信息技术有限公司 一种应用于电力***的功率确定方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1801046A (zh) * 2005-01-07 2006-07-12 戴尔产品有限公司 多个信息处理***的功率管理的***和方法
US7197411B1 (en) * 2005-08-02 2007-03-27 Sun Microsystems, Inc. Real-time power harness

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8095340B2 (en) * 1992-11-17 2012-01-10 Health Hero Network, Inc. Home power management system
US7188001B2 (en) * 1998-03-23 2007-03-06 Cepheid System and method for temperature control
US6167524A (en) * 1998-04-06 2000-12-26 International Business Machines Corporation Apparatus and method for efficient battery utilization in portable personal computers
JP2000045869A (ja) * 1998-07-29 2000-02-15 Hitachi Ltd エネルギー供給システム
KR100371181B1 (ko) * 2000-11-28 2003-02-06 엘지전자 주식회사 휴대용 기기의 절전방법
JP3539398B2 (ja) * 2001-03-30 2004-07-07 ミノルタ株式会社 管理装置、画像処理装置、管理方法、管理プログラムおよび記録媒体
US7039532B2 (en) 2001-06-28 2006-05-02 Hunter Robert R Method and apparatus for reading and controlling utility consumption
US6622097B2 (en) 2001-06-28 2003-09-16 Robert R. Hunter Method and apparatus for reading and controlling electric power consumption
US6937946B1 (en) * 2001-12-04 2005-08-30 The Texas A&M University System System and method for remote identification of energy consumption systems and components
US6804616B2 (en) * 2001-12-13 2004-10-12 Intel Corporation Method to estimate power and cooling requirements of systems
US7051215B2 (en) * 2003-06-13 2006-05-23 Intel Corporation Power management for clustered computing platforms
EP1489719A3 (en) 2003-06-20 2007-05-02 Matsushita Electric Industrial Co., Ltd. Energy management system, energy management method, and unit for providing information on energy-saving recommended equipment
US7401644B2 (en) * 2004-03-26 2008-07-22 Hewlett-Packard Development Company, L.P. Computer systems and related methods for cooling such systems
US7925902B1 (en) * 2004-09-10 2011-04-12 Micro Industries Corporation System and method for controlling an integrated display computer heat sink temperature
US7254034B2 (en) 2004-12-15 2007-08-07 Lucent Technologies Inc. Thermal management for shielded circuit packs
US7409719B2 (en) 2004-12-21 2008-08-05 Microsoft Corporation Computer security management, such as in a virtual machine or hardened operating system
US7383451B2 (en) * 2005-02-18 2008-06-03 Lenovo (Singapore) Pte. Ltd. Controlling power usage of computing device components in holistic manner
US7340619B2 (en) * 2005-03-16 2008-03-04 International Business Machines Corporation System and method for circulating power usage information on a closed ring communication path within a multi-node computer system
US20060207268A1 (en) 2005-03-17 2006-09-21 International Business Machines Corporation System and method for increasing the efficiency of a thermal management profile
US7596476B2 (en) 2005-05-02 2009-09-29 American Power Conversion Corporation Methods and systems for managing facility power and cooling
US20070011473A1 (en) * 2005-07-05 2007-01-11 Sung Chih-Ta S Method and apparatus of power management for video playback device
JP4584056B2 (ja) * 2005-07-08 2010-11-17 株式会社日立製作所 電力需給予測・制御システム
US7562234B2 (en) * 2005-08-25 2009-07-14 Apple Inc. Methods and apparatuses for dynamic power control
US20070112694A1 (en) 2005-11-14 2007-05-17 Sempa Power Systems Ltd. Facility energy management system
US7512530B2 (en) 2005-11-29 2009-03-31 International Business Machines Corporation Generation of software thermal profiles for applications in a simulated environment
US7349828B1 (en) * 2006-02-15 2008-03-25 Hewlett-Packard Development Company, L.P. Estimating an electronic device condition
US7739548B2 (en) * 2006-06-27 2010-06-15 Hewlett-Packard Development Company, L.P. Determining actual power consumption for system power performance states
US7584376B2 (en) * 2006-08-23 2009-09-01 Palm, Inc. Method and apparatus for power management
DE102006046184B4 (de) * 2006-09-29 2009-01-02 Infineon Technologies Ag Verfahren, Vorrichtung und Computerprogrammprodukt zur Ermittlung einer voraussichtlichen Überschreitung einer maximal erlaubten Leistungsaufnahme eines mobilen elektronischen Geräts und mobiles elektronisches Gerät
US7787405B2 (en) * 2007-01-08 2010-08-31 International Business Machines Corporation Method for utilization of active power profiles used in prediction of power reserves for remote devices
CA2573941A1 (en) * 2007-01-15 2008-07-15 Coolit Systems Inc. Computer cooling system
JP5479112B2 (ja) 2007-01-24 2014-04-23 シュナイダー エレクトリック アイティー コーポレーション 装置ラックの冷却性能を評価するためのシステムおよび方法
US8208386B2 (en) * 2007-03-05 2012-06-26 Hewlett-Packard Development Company, L.P. Discovery of network devices
EP2147585B1 (en) 2007-05-15 2016-11-02 Schneider Electric IT Corporation Method and system for managing facility power and cooling
US7945797B2 (en) * 2007-07-12 2011-05-17 Research In Motion Limited System and method for portable power source management
US8041521B2 (en) * 2007-11-28 2011-10-18 International Business Machines Corporation Estimating power consumption of computing components configured in a computing system
JP4973490B2 (ja) * 2007-12-26 2012-07-11 富士通株式会社 消費電力監視プログラム
US8996890B2 (en) * 2008-02-07 2015-03-31 Dell Products L.P. Method for power conservation in virtualized environments
US8438125B2 (en) * 2008-02-12 2013-05-07 Acenture Global Services Limited System for assembling behavior models of technology components
US7958229B2 (en) * 2008-03-31 2011-06-07 Verizon Patent And Licensing Inc. Method and system for energy efficient routing and network services
US8250538B2 (en) * 2008-06-07 2012-08-21 International Business Machines Corporation Optimization of system performance through scenario evaluation
US8458722B2 (en) * 2008-06-09 2013-06-04 International Business Machines Corporation Thread selection according to predefined power characteristics during context switching on compute nodes
US8214658B2 (en) * 2008-08-20 2012-07-03 International Business Machines Corporation Enhanced thermal management for improved module reliability
US8461861B2 (en) * 2008-11-11 2013-06-11 Bsh Home Appliances Corporation Energy usage monitor for a household appliance
US9778718B2 (en) * 2009-02-13 2017-10-03 Schneider Electric It Corporation Power supply and data center control
US8560677B2 (en) 2009-02-13 2013-10-15 Schneider Electric It Corporation Data center control
US9519517B2 (en) * 2009-02-13 2016-12-13 Schneider Electtic It Corporation Data center control
US8086359B2 (en) * 2009-02-23 2011-12-27 Novell, Inc. Dynamic thermal load balancing
JP4966327B2 (ja) * 2009-03-17 2012-07-04 株式会社東芝 情報処理装置及び省電力設定方法
US20100292961A1 (en) * 2009-05-15 2010-11-18 David Moss Wireless tracking device for tracking appliance usage and modifying user behavior
US9026640B2 (en) * 2009-06-03 2015-05-05 Microsoft Technology Licensing, Llc Determining server utilization
US8406933B2 (en) * 2009-08-18 2013-03-26 Control4 Corporation Systems and methods for estimating the effects of a request to change power usage
KR101648978B1 (ko) * 2009-11-05 2016-08-18 삼성전자주식회사 저전력 멀티코어 시스템에서의 전력 제어 방법 및 장치
JP2011159051A (ja) * 2010-01-29 2011-08-18 Sharp Corp 電力管理装置、および電力管理方法、ならびに当該電力管理装置を備えた電力管理システム、当該電力管理システムを備えた家屋、電力管理装置のプログラム、およびコンピュータ読み取り可能な記録媒体
KR101932177B1 (ko) * 2012-03-30 2019-03-20 삼성전자주식회사 전력 공급 제어 방법 및 장치
JP2013218568A (ja) * 2012-04-10 2013-10-24 Toshiba Corp 情報処理装置、プログラムおよび省電力設定方法
US9529642B2 (en) * 2013-03-28 2016-12-27 Vmware, Inc. Power budget allocation in a cluster infrastructure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1801046A (zh) * 2005-01-07 2006-07-12 戴尔产品有限公司 多个信息处理***的功率管理的***和方法
US7197411B1 (en) * 2005-08-02 2007-03-27 Sun Microsystems, Inc. Real-time power harness

Also Published As

Publication number Publication date
US9116897B2 (en) 2015-08-25
EP2457153A4 (en) 2012-11-28
DK2457153T3 (da) 2017-02-06
US20110016342A1 (en) 2011-01-20
EP2457153A1 (en) 2012-05-30
RU2012102508A (ru) 2013-08-27
AU2010276368B2 (en) 2016-02-25
WO2011011408A1 (en) 2011-01-27
CA2768724A1 (en) 2011-01-27
CN102687111A (zh) 2012-09-19
EP2457153B1 (en) 2016-11-02
BR112012001315A2 (pt) 2017-07-11
AU2010276368A1 (en) 2012-02-09
RU2636848C2 (ru) 2017-11-28

Similar Documents

Publication Publication Date Title
CN102687111B (zh) 用于功率分析的技术
US11190918B1 (en) Systems and methods for sensing, recording, analyzing and reporting environmental conditions in data centers and similar facilities
CN105357311B (zh) 一种云计算技术的二次设备大数据存储与处理方法
CN105900540B (zh) 数据中心控制方法和***
CN102959510B (zh) 用于计算机功率和资源消耗建模的方法和***
US20170322241A1 (en) Non-intrusive fine-grained power monitoring of datacenters
CN111505938A (zh) 具有能源优化构建器和类属数据模型设计器的建筑物自动化***
Yamamoto et al. Using cloud technologies for large-scale house data in smart city
CN106020715A (zh) 存储池容量管理
CN105022769A (zh) 一种城市地下管线数据交互***及其方法
CN108700851A (zh) 用于预测能量消耗的***、方法和基于云的平台
CN104040583A (zh) 在能源管理***中动态加标签以创建逻辑模型及优化缓存相关申请的交叉引用
CN100465918C (zh) 基于事务处理的性能模型的自动化确认和校准***和方法
JP2019522305A (ja) データセンターオペレーティングシステムを実装するための方法およびシステム
CN104112084B (zh) 用于基于执行的许可发现和优化的方法和***
CN108369489A (zh) 预测固态驱动器可靠性
Tang et al. Nipd: Non-intrusive power disaggregation in legacy datacenters
Netti et al. Operational data analytics in practice: experiences from design to deployment in production HPC environments
Acquaviva et al. Enhancing Energy Awareness Through the Analysis of Thermal Energy Consumption.
Yang et al. On construction of the air pollution monitoring service with a hybrid database converter
Wang et al. Block storage optimization and parallel data processing and analysis of product big data based on the hadoop platform
Jin et al. The Building Data Genome Directory–An open, comprehensive data sharing platform for building performance research
Wilde et al. Increasing data center energy efficiency via simulation and optimization of cooling circuits-a practical approach
CN110235128A (zh) 用于构造紧凑壁模型的***和方法
CN103098046A (zh) 将***监视信息格式化

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
CB02 Change of applicant information

Address after: rhode island

Applicant after: American Power Conversion Corporation

Address before: rhode island

Applicant before: American Power Conversion Corp.

COR Change of bibliographic data
GR01 Patent grant