CN111795488B - 一种分布式机房温度的智能调控***及方法 - Google Patents

一种分布式机房温度的智能调控***及方法 Download PDF

Info

Publication number
CN111795488B
CN111795488B CN202010662510.0A CN202010662510A CN111795488B CN 111795488 B CN111795488 B CN 111795488B CN 202010662510 A CN202010662510 A CN 202010662510A CN 111795488 B CN111795488 B CN 111795488B
Authority
CN
China
Prior art keywords
machine room
temperature
module
strategy
temperature control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010662510.0A
Other languages
English (en)
Other versions
CN111795488A (zh
Inventor
李晋
刘崇鹏
于爱民
杨贝宁
刘陆
孟丹
白玉
程建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202010662510.0A priority Critical patent/CN111795488B/zh
Publication of CN111795488A publication Critical patent/CN111795488A/zh
Application granted granted Critical
Publication of CN111795488B publication Critical patent/CN111795488B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/89Arrangement or mounting of control or safety devices
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • F24F11/46Improving electric energy efficiency or saving
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • F24F11/64Electronic processing using pre-stored data
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/88Electrical aspects, e.g. circuits
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20536Modifications to facilitate cooling, ventilating, or heating for racks or cabinets of standardised dimensions, e.g. electronic racks for aircraft or telecommunication equipment
    • H05K7/20554Forced ventilation of a gaseous coolant
    • H05K7/2059Forced ventilation of a gaseous coolant within rooms for removing heat from cabinets, e.g. by air conditioning device
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F2110/00Control inputs relating to air properties
    • F24F2110/10Temperature

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

本发明的一种分布式机房温度的智能调控***及方法涉及一种通过调整降温策略对机房温度进行调控的***及方法,目的是为了克服现有机房温控管理粗糙导致能源浪费的问题,其中智能调控***包括分析装置和至少一个机房控制装置;每个机房控制装置包括环境检测模块、温度调节模块、子策略分析模块和温控临时指令模块;环境检测模块,同时与子策略分析模块和温控临时指令模块连接;子策略分析模块,同时与温度调节模块和分析装置连接;温控临时指令模块,同时与温度调节模块和子策略分析模块连接;温度调节模块,与机房温控设备连接。

Description

一种分布式机房温度的智能调控***及方法
技术领域
本发明涉及一种温度调控***及方法,具体涉及一种通过调整降温策略对机房温度进行调控的***及方法。
背景技术
很多机房对温度的管理还仅限于直接设定空调温度或固定泵流速等固化的温度管理方式。但往往机房并非每时每刻都需要设定的降温措施。而全世界数据中心的耗电量已经占到了全世界耗电规模的1%左右。其中,相当数量的一部分都由于机房温控管理的粗粒度而浪费掉。
发明内容
本发明的目的是为了克服现有机房温控管理粗糙导致能源浪费的问题,提供了一种分布式机房温度的智能调控***及方法。
本发明的一种分布式机房温度的智能调控***,包括分析装置和至少一个机房控制装置;
每个机房控制装置包括环境检测模块、温度调节模块、子策略分析模块和温控临时指令模块;
环境检测模块,同时与子策略分析模块和温控临时指令模块连接,用于检测和记录机房环境信息并生成环境信息日志,并同时将机房环境信息和环境信息日志发送至子策略分析模块,将机房环境信息发送至温控临时指令模块;
子策略分析模块,同时与温度调节模块和分析装置连接,用于接收机房环境信息和环境信息日志,根据机房环境信息预测机房负载高峰,并根据当前的温控策略和机房负载高峰生成温度预调控指令发送至温度调节模块;并且当接收到温控临时指令模块发送的策略优化指令时,将策略优化指令和环境信息日志发送至分析装置;以及接收分析装置返回的优化的温控策略以替代当前的温控策略;
温控临时指令模块,同时与温度调节模块和子策略分析模块连接,用于接收机房环境信息,在机房环境信息中的机房温度大于等于温度阈值时生成温度临时调节指令发送至温度调节模块,并记录一段时间内机房温度大于等于温度阈值的次数,当机房温度大于等于温度阈值的次数大于等于设定次数时,向子策略分析模块发送策略优化指令,且在温控策略更新后将次数归零;或检测到同一段时间内环境信息日志中的机房PUE或机房能耗大于等于PUE阈值或能耗阈值时,向子策略分析模块发送策略优化指令;机房环境信息包括机房温度、机房PUE和机房能耗;
温度调节模块,与机房温控设备连接,用于接收温度预调控指令,并根据温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;或在两个机房负载高峰之间,接收温度临时调控指令,根据温度临时调控指令,通过控制机房温控设备调节机房温度至所需温度;
分析装置,用于接收环境信息日志和策略优化指令;以及将环境信息日志作为机器学习模型的输入得到优化的温控策略,并分别将优化的温控策略存储和返回至子策略分析模块以替代当前的温控策略。
本发明的一种分布式机房温度的智能调控方法,方法包括:
S1、检测和记录机房环境信息并生成环境信息日志;
S2、根据机房环境信息预测机房负载高峰,并根据各机房当前的温控策略和机房负载高峰生成温度预调控指令,根据温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;
S3、在上一个机房负载高峰与下一个机房负载高峰之间,以第一设定周期检测机房温度,判断机房温度是否大于等于温度阈值;
如果机房温度小于温度阈值,则执行步骤S5;
如果机房温度大于等于温度阈值,则执行步骤S4;
S4、生成温度临时调节指令,并根据温度临时调节指令控制机房温控设备调节机房温度至所需温度,并执行步骤S5;
S5、检测机房PUE和/或机房能耗是否超过机房PUE阈值和/或机房能耗阈值,若是则执行步骤S7,否则执行步骤S6;
S6、累加第二设定周期内机房温度大于等于温度阈值的次数,判断该次数是否大于等于设定次数,执行步骤S7,否则,转入步骤S3;第二设定周期包括多个第一设定周期;
S7、发送策略优化指令,并根据环境信息日志得到优化的温控策略,用优化的温控策略替代当前的温控策略,返回步骤S1。
本发明的有益效果是:本发明能对多个机房的温度调控进行管理,并在温度控制不利时,通过机器学习优化温控策略,再利用优化的温控策略对进行机房的温度调控管理,能根据实际设备运行情况进行温度调控,有效减少机房能耗。
附图说明
图1为本发明中子策略分析模块与学习平衡组合器模块连接的分布式机房温度的智能调控***的模块结构示意图;
图2为本发明中子策略分析模块同时与学习平衡组合器模块和知识库模块连接的分布式机房温度的智能调控***的模块结构示意图;
图3为本发明的一种分布式机房温度的智能调控方法的机房控制端工作流程示意图;
图4为本发明的一种分布式机房温度的智能调控方法的分析端工作流程示意图。
具体实施方式
具体实施方式一,本实施方式的一种分布式机房温度的智能调控***,包括分析装置2和至少一个机房控制装置1;
每个机房控制装置1包括环境检测模块1-1、温度调节模块1-2、子策略分析模块1-3和温控临时指令模块1-4;
环境检测模块1-1,同时与子策略分析模块1-3和温控临时指令模块1-4连接,用于检测和记录机房环境信息并生成环境信息日志,并同时将机房环境信息和环境信息日志发送至子策略分析模块1-3,将机房环境信息发送至温控临时指令模块1-4;
子策略分析模块1-3,同时与温度调节模块1-2和分析装置2连接,用于接收机房环境信息和环境信息日志,根据机房环境信息预测机房负载高峰,并根据当前的温控策略和机房负载高峰生成温度预调控指令发送至温度调节模块1-2;并且当接收到温控临时指令模块1-4发送的策略优化指令时,将策略优化指令和环境信息日志发送至分析装置2;以及接收分析装置2返回的优化的温控策略以替代当前的温控策略;
温控临时指令模块1-4,同时与温度调节模块1-2和子策略分析模块1-3连接,用于接收机房环境信息,在机房环境信息中的机房温度大于等于温度阈值时生成温度临时调节指令发送至温度调节模块1-2,并记录一段时间内机房温度大于等于温度阈值的次数,当机房温度大于等于温度阈值的次数大于等于设定次数时,向子策略分析模块1-3发送策略优化指令,且在温控策略更新后将次数归零;或检测到同一段时间内环境信息日志中的机房PUE或机房能耗大于等于PUE阈值或能耗阈值时,向子策略分析模块1-3发送策略优化指令;机房环境信息包括机房温度、机房PUE和机房能耗;
温度调节模块1-2,与机房温控设备连接,用于接收温度预调控指令,并根据温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;或在两个机房负载高峰之间,接收温度临时调控指令,根据温度临时调控指令,通过控制机房温控设备调节机房温度至所需温度;
分析装置2,用于接收环境信息日志和策略优化指令;以及将环境信息日志作为机器学习模型的输入得到优化的温控策略,并分别将优化的温控策略存储和返回至子策略分析模块1-3以替代当前的温控策略。
具体地,如图1所示,本发明的智能调控***包括:机房控制装置1和分析装置2,机房控制装置1又细化为环境检测模块1-1、温度调节模块1-2、子策略分析模块1-3和温控临时指令模块1-4;
其中,环境监测模块1-1,用于统一管理机房所有的机房环境信息,如温度、湿度以及各监测设备(用于监测能耗、负载等),并将机房环境信息实时(或以一定周期)共享给子策略分析模块1-3和温控临时指令模块1-4。并且,还将上一次温控策略更新和本次温控策略更新之间的机房环境信息进行储存和处理,生成环境信息日志。
环境监测模块1-1具体可以包括红外线测温装置,湿度探测装置,以及网络连接装置来获取当地的气温、风速等环境信息(用于记录当地气候环境的差异,并根据这种气候差异进行机房温度的调节)。这些装置都安装在机房室内服务器旁边,按照机房服务器组的划分来布置。这些装置与环境监测模块1-1的处理机通过数据线直连或通过无线网络信号连接,用以实时传输监测数据。
温度调节模块1-2,对机房内所有的机房温控设备进行实时控制,并在负载高峰来临前进行降温,基于子策略分析模块1-3和温控临时指令模块1-4所发出的指令进行温度控制。
温度调节模块1-2具体可以包括冷却机(空调等),冷却水泵,按照需求均匀安装在室内,通过数据线直连或无线网络与温度调节模块1-2的处理机相连。每个机房温控设备都有3~8个温控档位,用以实现不同程度的温控(降温)强度。
上述的温度调节模块1-2通常按照当前的温控策略和机房环境信息,对预测可能来到的负载高峰进行提前降温操作,如果在某段时间内,若机房的少数服务器温度几次超过温度阈值,温度调节模块1-2可以通过临时增加冷却水泵的运转或降低冷却机温度来进行临时降温。但若因为增加冷却水泵的运转或降低冷却机温度而临时增加了降温功耗,使得机房PUE(总能耗/IT所用能耗)多次波动(超过PUE阈值),则将环境信息日志发送给分析装置2进行分析。
子策略分析模块1-3,用于具体承担机房负载高峰预测任务的模块。并会在机房温度调节不利时,进行初步分析与调整。若仍然不能达到最优程度,其会对现有的策略进行上报,让分析装置2进行深入地分析处理。
子策略分析模块1-3具体可以包括较强性能的计算设备,该计算设备通过数据线或无线网络与机房控制装置1的总处理机连接。
温控临时指令模块1-4,用于在满足条件时,向温度调节模块1-2发出温控临时指令或向子策略分析模块1-3发送策略优化指令。
本智能调控***的工作过程为,机房控制装置1实时通过环境监测模块1-1监测并记录机房环境信息;在环境温度达到温度阈值、机房能耗或机房PUE异常(超过阈值或其他设定值——如前一个温控策略工作时,机房能耗或机房PUE的最大值),或接收到策略信息更新后,开始调用子策略分析模块(发送策略优化指令或进行温控策略的更新和调用其他模块在当前的温控策略下进行工作)。
分析装置2可以是一台具有较强运算能力、较大内存空间和良好网络带宽的服务器,其上部署用于对温控策略进行分析的软件,在收到机房控制装置1上传的环境信息日志和策略优化指令以及其他机房相关信息后,采用机器学习算法对当前的温控策略进行分析得到优化的温控策略,从而令机房控制装置1重新基于优化的温控策略进行温度调控。
温控策略由操作人员手动添加(最初或其他任意阶段)或***自动添加,若某时间段内机房PUE超过以往(超过PUE阈值或前一个温控策略工作时,机房PUE的最大值)、机房能耗大于未修改温控策略前(超过能耗阈值或前一个温控策略工作时,机房能耗的最大值)或机房温度多次超过阈值,温度调节模块1-2开始调用子策略分析模块1-3,令子策略分析模块1-3开始进入分析模式,具体行为为更加频繁地向环境检测模块1-1请求机房服务器周边的机房环境信息,并对预先设定的机房区域或整个机房进行临时温度调节。
若进行临时调节后,仍然多次或一次检测到一段时间内机房PUE超过阈值或者机房平均能耗高于过往,机房控制装置1则会将环境信息日志和从环境监测模块1-1得到的其他信息发送给分析装置2。分析装置2在接收到上述数据后,对当前的温控策略进行优化或纠正,并将优化的温控策略返回机房控制装置1,重复上述过程,直至机房能耗回复至温控策略修改前或优于以往。
上述的温控策略是一种机房温度管理的控制协议,该温控策略可以有若干指令构成,指令可以由4元组构成:
例如,<’location_id’,’average_temperature’,‘average_load’,‘action’>,元素location_id代表唯一识别某机房的标识符,average_temperature代表机房达到的机房平均温度,average_load代表机房的机房平均负载,action代表当机房平均温度和机房平均负载在达到相应的值时,对温度调节模块1-2进行的操作。此处温控策略是用于对未来可能达到的机房负载高峰进行***,并进行及时的降温。
而发送给分析装置2的信息可以由如下元素构成:
例如,环境信息日志中的机器信息:<‘device_position’,’log_time’,‘load’,‘temperature’>,其中‘device_position’代表定位机器所处机房位置,‘log_time’代表信息记录时间,‘load’代表负载,‘temperature’代表机器在记录时的温度。
上述的机器指机房中工作的服务器和机房温控设备等耗能设备。
而其他信息,包括机房信息:<’location_id’,‘local_weather’,‘local_humidity’,‘server_density’,‘temperature_control_density’,‘city’,‘altitude’,‘wind_info’>,location_id代表唯一识别一机房,’server_density’代表机房服务器密度,’temperature_control_density’代表机房中机房温控设备平均密度(机房温控设备数量/服务器数量),’city’代表机房所在城市,’altitude’代表海拔信息,’wind_info’代表当地风速、风向等当地气象信息。
进一步地,环境检测模块1-1包括服务器温度获取子模块、服务器负载和能耗监测子模块、机房区域温度监测子模块、机房区域负载和能耗信息监测子模块、机房温控设备能耗监测模块、机房PUE监测模块和环境信息日志生成模块;
服务器温度获取子模块用于实时获取单个服务器的温度信息;
服务器负载和能耗监测子模块用于实时获取单个服务器的负载和能耗信息;
机房区域温度信息监测子模块用于根据预先划分的机房区域,接收机房区域内单个服务器的温度信息,并计算得到机房区域内的平均温度信息;
机房区域负载和能耗信息监测子模块用于根据预先划分的机房区域,接收机房区域内单个服务器的负载信息,并计算得到机房区域内的平均能耗信息;
机房温控设备能耗监测模块用于实时获取机房温控设备能耗信息;
机房PUE监测模块用于根据单个服务器的能耗信息和机房温控设备能耗信息计算得到机房PUE;
环境信息日志生成模块用于将单个服务器的温度信息、机房区域内的平均温度信息、单个服务器的负载信息、单个服务器的能耗信息、机房区域内的平均能耗信息、机房温控设备能耗信息和机房PUE汇总生成日志。
具体地,在实施方式一中的机房温度可以根据实际需要细分为单个服务器的温度信息、机房区域内的平均温度信息或整个机房的平均温度信息(即将机房区域设定为整个机房)。
机房能耗可以根据实际需要细分为单个服务器的能耗信息、机房区域内的平均能耗信息、机房温控设备能耗信息和机房平均能耗(总能耗/耗能设备数量)。
机房PUE可以根据公式计算,将相应的值代入即可。
机房环境信息是实时或以一定周期进行数据传输的,而环境信息日志可以看做是将一段时间(上一次温控策略更新和本次温控策略更新之间)的机房环境信息进行储存和处理得到的数据表。
服务器温度获取子模块,用于监测单个服务器的温度信息;
服务器负载和能耗监测子模块,用于检测单个服务器的负载信息、并计算能耗信息;
机房区域温度监测子模块,用于收集区域内单服务器温度信息,实时计算区域内机房的平均温度;
机房区域负载和能耗监测子模块,用于收集区域内单个服务器的负载信息,并计算机房区域的平均能耗;
机房温控设备(泵、空调等降温设备)能耗监测模块,用来收集机房温控设备的能耗信息;
环境检测模块1-1会实时记录各子模块生成的信息,并记录生成日志以待温度调节模块1-2和子策略分析模块1-3调用。
可以对各个机房中的服务器进行划分,如8台服务器一组。在进行峰值预测时,将这一组服务器看作一台服务器。以这些服务器的平均温度和平均负载做这一组服务器的数据。
并且,机房能耗还应当包括机房灯光、报警器等耗电设备的能耗,但是这些装置的数量一般固定且能耗固定,所以只需要提前统计,并在每次进行平均能耗时作为总能耗的一部分加入即可,如果数值较小也可以忽略不计。
其中,还配置有本地气象环境监测子模块,用于收集当地实时气温、湿度、风力、风向等信息。并存储机房所在地海拔等特异性信息。
进一步地,分析装置2包括学习平衡组合器模块、策略优化器模块2-2和知识库模块2-1;
学习平衡组合器模块包括至少一个学习器模块2-3,同时与子策略分析模块1-3、策略优化器模块2-2和知识库模块2-1连接,用于接收子策略分析模块1-3所发送的环境信息日志和策略优化指令后,将环境信息日志输入到学习器模块2-3中的机器学习模型中,得到优化的温控策略;并将优化的温控策略发送至策略优化器模块2-2,将环境信息日志发送至知识库模块2-1;
策略优化器模块2-2,同时与子策略分析模块1-3和知识库模块2-1连接,用于接收优化的温控策略并进行处理,处理包括去重处理和去冲突处理;以及分别将优化的温控策略发送至子策略分析模块1-3以替代当前的温控策略,将优化的温控策略发送至知识库模块2-1,对知识库模块2-1进行更新,并将优化的温控策略记为当前的温控策略;知识库模块2-1,用于接收学***衡组合器模块;
学习平衡组合器模块,还用于根据更新信号,将知识库模块2-1中已存储的所有的环境信息日志和所有的温控策略作为训练集对学习器模块2-3中的机器学习模型进行训练,得到优化的机器学习模型。
具体地,如图1所示,当子策略分析模块1-3发送的环境信息日志和策略优化指令到学习平衡组合器模块,将环境信息日志传入不同学习器模块2-3,得到至少一个优化的温控策略,并将新学习到的优化的温控策略进行组合,再传入策略优化器模块2-2进行去重、去冲突等操作,最后将优化的温控策略返回知识库模块2-1对知识库模块2-1进行更新,以及将优化的温控策略返回机房控制装置1以替代当前的温控策略。
知识库模块2-1充分运用各个机房产生的差异性数据,进行整合。而由于策略在不断进行优化,故而知识库模块2-1也是实时动态更新的。学***衡组合器模块将从知识库模块2-1中取出从各个机房收集到的环境信息日志和对应的温控策略,通过调用学习器模块2-3对每个学习器模块2-3中的机器学习模型进行训练。
学习器模块2-3的中机器学习模型的训练过程为:在分析装置2接收到机房控制装置1的分析请求后,分析装置2首先对环境日志信息规格化处理成模式(pattern),其格式类似策略中的规则,但缺少action字段。之后,分析端开始调用不同学习器模块2-3,并将转换后的环境信息日志和温控策略输入学习器模块。
下面简单阐述三类学习器模块2-3的训练过程:
1、近邻学习器
将模式集合和知识库中的策略映射进相同的高维空间中。对每一条模式,获取和其相似的若干(设定的阈值)指令(策略中的每一条规则称为指令)。这些相似的向量进行投票,最终模式的被标记为数量最多的action。
2、模式规则距离学习器
对知识库中的策略进行建树,每一层对应策略中的一个字段。对每一个模式,按照字段进行逐层比对。当匹配到某字段且匹配深度超过阈值,而无法匹配时。对该字段下所有的子树的决断字段进行统计。按照大多数情况进行标记。
3、共同出现学习器
在一定时间段内,某两条模式接连出现,称为共同出现。
共同出现概率用cij表示,其计算公式为:模式i与模式j共同出现的次数/模式i出现的总次数
在日志中出现的,所有n条不同的访问模式的共同出现概率能用一个n*n矩阵进行表示
Figure BDA0002579141440000091
在学习器计算出该矩阵后,学习器对那先代表新模式的行从大到小进行排序。之后,根据阈值进行截断,并根据其中已知的在策略中出现过的模式进行投票。最终大多数的action为当前模式的最终action。
策略优化器模块2-2接收学习平衡组合器模块发送来的组合的更新的策略,并进行策略的优化(包括去重、去冲突操作),最后更新知识库模块2-1并返回机房控制装置1。
其中,基于本机房温度调控和分析***的温控方法,利用机器学习技术,用以提高机房能源的使用效率。
进一步地,学习平衡组合器模块中的每个学习器模块2-3采用不同的机器学习模型实现。
具体实施方式二,如图3所示,本实施方式的一种分布式机房温度的智能调控方法,方法包括:
S1、检测和记录机房环境信息并生成环境信息日志;
S2、根据机房环境信息预测机房负载高峰,并根据各机房当前的温控策略和机房负载高峰生成温度预调控指令,根据温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;
S3、在上一个机房负载高峰与下一个机房负载高峰之间,以第一设定周期检测机房温度,判断机房温度是否大于等于温度阈值;
如果机房温度小于温度阈值,则执行步骤S5;
如果机房温度大于等于温度阈值,则执行步骤S4;
S4、生成温度临时调节指令,并根据温度临时调节指令控制机房温控设备调节机房温度至所需温度,并执行步骤S5;
S5、检测机房PUE和/或机房能耗是否超过机房PUE阈值和/或机房能耗阈值,若是则执行步骤S7,否则执行步骤S6;
S6、累加第二设定周期内机房温度大于等于温度阈值的次数,判断该次数是否大于等于设定次数,执行步骤S7,否则,转入步骤S3;第二设定周期包括多个第一设定周期;
S7、发送策略优化指令,并根据环境信息日志得到优化的温控策略,用优化的温控策略替代当前的温控策略,返回步骤S1。
具体地,本发明的方法总体实现三个功能:
1、机房温度超过机房阈值,进行临时温度调控;
2、依据当前的温控策略,预测机房负载高峰,提前进行温控调控(降温);
3、定时查看机房PUE、机房的平均能耗、临时温度调控的次数等指标,并在满足条件是,进行温控策略的优化,目标是降低总能耗。
整体步骤可以分成两大定时任务:
第一个定时任务,时间间隔较短(第一设定周期),即实时监测温度信息,机房温度高了则马上进行临时温度调控,这个临时温度调控的次数会被记录。
第二个定时任务,时间间隔较长(第二设定周期),包括了数个第一定时任务。倘若机房温度超过温度阈值的次数大于设定次数,上传至分析装置2进行分析,即上述功能2执行不力情况下;
第二个定时任务还包括,当其他指标,如机房PUE超过机房PUE阈值等,同样上传至分析装置2进行分析,即上述功能3执行不力的情况下。

Claims (4)

1.一种分布式机房温度的智能调控***,其特征在于,包括分析装置(2)和至少一个机房控制装置(1);
所述每个机房控制装置(1)包括环境检测模块(1-1)、温度调节模块(1-2)、子策略分析模块(1-3)和温控临时指令模块(1-4);
所述环境检测模块(1-1),同时与所述子策略分析模块(1-3)和所述温控临时指令模块(1-4)连接,用于检测和记录机房环境信息并生成环境信息日志,并同时将机房环境信息和环境信息日志发送至子策略分析模块(1-3),将机房环境信息发送至温控临时指令模块(1-4);
所述子策略分析模块(1-3),同时与温度调节模块(1-2)和分析装置(2)连接,用于接收所述机房环境信息和环境信息日志,根据所述机房环境信息预测机房负载高峰,并根据当前的温控策略和所述机房负载高峰生成温度预调控指令发送至温度调节模块(1-2);并且当接收到温控临时指令模块(1-4)发送的策略优化指令时,将策略优化指令和环境信息日志发送至分析装置(2);以及接收分析装置(2)返回的优化的温控策略以替代当前的温控策略;
所述温控临时指令模块(1-4),同时与温度调节模块(1-2)和子策略分析模块(1-3)连接,用于接收所述机房环境信息,在机房环境信息中的机房温度大于等于温度阈值时生成温度临时调节指令发送至温度调节模块(1-2),并记录一段时间内机房温度大于等于温度阈值的次数,当机房温度大于等于温度阈值的次数大于等于设定次数时,向子策略分析模块(1-3)发送策略优化指令,且在温控策略更新后将次数归零;或检测到同一段时间内环境信息日志中的机房PUE大于等于PUE阈值或机房能耗大于等于能耗阈值时,向子策略分析模块(1-3)发送策略优化指令;所述机房环境信息包括机房温度、机房PUE和机房能耗;
所述温度调节模块(1-2),与机房温控设备连接,用于接收所述温度预调控指令,并根据所述温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;或在两个机房负载高峰之间,接收所述温度临时调控指令,根据所述温度临时调控指令,通过控制机房温控设备调节机房温度至所需温度;
所述分析装置(2),用于接收环境信息日志和策略优化指令;以及将环境信息日志作为机器学习模型的输入得到优化的温控策略,并分别将优化的温控策略存储和返回至子策略分析模块(1-3)以替代当前的温控策略;
所述环境检测模块(1-1)包括服务器温度获取子模块、服务器负载和能耗监测子模块、机房区域温度监测子模块、机房区域负载和能耗信息监测子模块、机房温控设备能耗监测模块、机房PUE监测模块和环境信息日志生成模块;
所述服务器温度获取子模块用于实时获取单个服务器的温度信息;
所述服务器负载和能耗监测子模块用于实时获取单个服务器的负载和能耗信息;
所述机房区域温度监测子模块用于根据预先划分的机房区域,接收机房区域内单个服务器的温度信息,并计算得到机房区域内的平均温度信息;
所述机房区域负载和能耗信息监测子模块用于根据预先划分的机房区域,接收机房区域内单个服务器的负载信息,并计算得到机房区域内的平均能耗信息;
所述机房温控设备能耗监测模块用于实时获取机房温控设备能耗信息;
所述机房PUE监测模块用于根据单个服务器的能耗信息和机房温控设备能耗信息计算得到机房PUE;
所述环境信息日志生成模块用于将单个服务器的温度信息、机房区域内的平均温度信息、单个服务器的负载信息、单个服务器的能耗信息、机房区域内的平均能耗信息、机房温控设备能耗信息和机房PUE汇总生成日志。
2.根据权利要求1所述的一种分布式机房温度的智能调控***,其特征在于,所述分析装置(2)包括学习平衡组合器模块、策略优化器模块(2-2)和知识库模块(2-1);
所述学习平衡组合器模块包括至少一个学习器模块(2-3),同时与子策略分析模块(1-3)、策略优化器模块(2-2)和知识库模块(2-1)连接,用于接收子策略分析模块(1-3)所发送的环境信息日志和策略优化指令后,将所述环境信息日志输入到学习器模块(2-3)中的机器学习模型中,得到优化的温控策略;并将优化的温控策略发送至策略优化器模块(2-2),将环境信息日志发送至知识库模块(2-1);
所述策略优化器模块(2-2),同时与子策略分析模块(1-3)和知识库模块(2-1)连接,用于接收优化的温控策略并进行处理,所述处理包括去重处理和去冲突处理;以及分别将优化的温控策略发送至子策略分析模块(1-3)以替代当前的温控策略,将优化的温控策略发送至知识库模块(2-1),对知识库模块(2-1)进行更新,并将优化的温控策略记为当前的温控策略;所述知识库模块(2-1),用于接收学***衡组合器模块;
所述学习平衡组合器模块,还用于根据更新信号,将知识库模块(2-1)中已存储的所有的环境信息日志和所有的温控策略作为训练集对学习器模块(2-3)中的机器学习模型进行训练,得到优化的机器学习模型。
3.根据权利要求2所述的一种分布式机房温度的智能调控***,其特征在于,所述学习平衡组合器模块中的每个学习器模块(2-3)采用不同的机器学习模型实现。
4.一种分布式机房温度的智能调控方法,其特征在于,所述方法基于权利要求3的一种分布式机房温度的智能调控***,包括:
S1、检测和记录机房环境信息并生成环境信息日志;
S2、根据所述机房环境信息预测机房负载高峰,并根据各机房当前的温控策略和所述机房负载高峰生成温度预调控指令,根据所述温度预调控指令在机房负载高峰来临前,控制机房温控设备调节机房温度至所需温度;
S3、在上一个机房负载高峰与下一个机房负载高峰之间,以第一设定周期检测机房温度,判断机房温度是否大于等于温度阈值;
如果机房温度小于温度阈值,则执行步骤S5;
如果机房温度大于等于温度阈值,则执行步骤S4;
S4、生成温度临时调节指令,并根据温度临时调节指令控制机房温控设备调节机房温度至所需温度,并执行步骤S5;
S5、检测机房PUE是否超过机房PUE阈值和/或机房能耗是否超过机房能耗阈值,若是则执行步骤S7,否则执行步骤S6;
S6、累加第二设定周期内机房温度大于等于温度阈值的次数,判断该次数是否大于等于设定次数,执行步骤S7,否则,转入步骤S3;所述第二设定周期包括多个第一设定周期;
S7、发送策略优化指令,并根据环境信息日志得到优化的温控策略,用优化的温控策略替代当前的温控策略,返回步骤S1。
CN202010662510.0A 2020-07-10 2020-07-10 一种分布式机房温度的智能调控***及方法 Active CN111795488B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010662510.0A CN111795488B (zh) 2020-07-10 2020-07-10 一种分布式机房温度的智能调控***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010662510.0A CN111795488B (zh) 2020-07-10 2020-07-10 一种分布式机房温度的智能调控***及方法

Publications (2)

Publication Number Publication Date
CN111795488A CN111795488A (zh) 2020-10-20
CN111795488B true CN111795488B (zh) 2021-11-02

Family

ID=72806773

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010662510.0A Active CN111795488B (zh) 2020-07-10 2020-07-10 一种分布式机房温度的智能调控***及方法

Country Status (1)

Country Link
CN (1) CN111795488B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112229045B (zh) * 2020-10-23 2021-12-31 深圳市华创智能工程技术有限公司 一种矩阵切换***的智能温度控制方法、装置和***
CN112987895B (zh) * 2021-05-20 2021-08-10 凌渡(南京)科技有限公司 一种基于冷却液的智能化服务器芯片制冷方法、装置及***
CN113726732B (zh) * 2021-07-14 2023-05-19 华迪计算机集团有限公司 一种用于数据机房的监测与辅助决策***及方法
CN113934241A (zh) * 2021-10-15 2022-01-14 浪潮思科网络科技有限公司 一种基于sdn的机房温度调节方法及设备
CN114007400B (zh) * 2022-01-05 2022-04-01 浙江德塔森特数据技术有限公司 一种分布式架构的机房节能控制方法
CN114838485B (zh) * 2022-02-28 2024-04-26 青岛海尔空调器有限总公司 用于控制空调器的方法及装置、空调器、存储介质
CN114901057B (zh) * 2022-07-12 2022-09-27 联通(广东)产业互联网有限公司 一种数据中心机房内部多点能耗检测与动态调节***
CN116027829A (zh) * 2022-07-18 2023-04-28 中国电信股份有限公司 机房温度控制方法、装置、设备及存储介质
CN115686108B (zh) * 2023-01-03 2023-04-07 浙江德塔森特数据技术有限公司 一种边缘数据机房多层级云管控方法及***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014236605A (ja) * 2013-06-03 2014-12-15 三菱電機株式会社 空気調和装置の管理システム
CN105183032A (zh) * 2015-07-21 2015-12-23 浪潮(北京)电子信息产业有限公司 一种云平台中机房温控管理方法和***
CN109556236A (zh) * 2018-10-22 2019-04-02 珠海格力电器股份有限公司 能效控制方法和装置
JP6534038B2 (ja) * 2015-07-16 2019-06-26 清水建設株式会社 需要電力制御装置および需要電力制御方法
CN110691491A (zh) * 2018-07-05 2020-01-14 百度(美国)有限责任公司 控制和优化用于数据中心冷却的间接蒸发冷却单元

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014236605A (ja) * 2013-06-03 2014-12-15 三菱電機株式会社 空気調和装置の管理システム
JP6534038B2 (ja) * 2015-07-16 2019-06-26 清水建設株式会社 需要電力制御装置および需要電力制御方法
CN105183032A (zh) * 2015-07-21 2015-12-23 浪潮(北京)电子信息产业有限公司 一种云平台中机房温控管理方法和***
CN110691491A (zh) * 2018-07-05 2020-01-14 百度(美国)有限责任公司 控制和优化用于数据中心冷却的间接蒸发冷却单元
CN109556236A (zh) * 2018-10-22 2019-04-02 珠海格力电器股份有限公司 能效控制方法和装置

Also Published As

Publication number Publication date
CN111795488A (zh) 2020-10-20

Similar Documents

Publication Publication Date Title
CN111795488B (zh) 一种分布式机房温度的智能调控***及方法
CN109800066B (zh) 一种数据中心节能调度方法及***
US7356548B1 (en) System and method for remote monitoring and controlling of facility energy consumption
CN112650580B (zh) 一种基于边缘计算的工业大数据监测***
CN116320831B (zh) 基于边缘计算的园区智能安防***
CN116365717B (zh) 一种高压电路安全监测***及方法
CN116545954A (zh) 基于物联网的通信网关数据传输方法及***
CN111507520A (zh) 一种换热机组负荷的动态预测方法及***
CN111045363A (zh) 信息通信网络智能化运维管控云平台
CN117171590B (zh) 一种电机智能驱动优化方法及***
CN117650628B (zh) 一种基于自适应预调节场景的能效管理***
CN111914000B (zh) 一种基于功耗预测模型的服务器功率封顶方法、***
CN116070795B (zh) 一种基于物联网的智慧能源管控方法及***
CN116365713A (zh) 一种光伏电站集群监控方法及***
CN111290354B (zh) 一种基于云计算的模块化数据中心余热高效利用控制管理***
CN113625639A (zh) 农业智能监控***及其监控方法
CN116320833B (zh) 一种基于物联网技术的供热管网监测方法
CN117346417B (zh) 一种基于物联网技术的冷水机温度控制***和方法
CN117478017B (zh) 一种伺服电机的控制方法
CN117096955B (zh) 一种分布式光伏集群运行控制***
CN103853107A (zh) 基于电源功耗监控的数据中心管控***
CN117391591B (zh) 一种基于数字孪生的智能仓储优化***
CN118069316A (zh) 一种基于温度预测技术的数据中心智能化节能管理***
CN111400284A (zh) 一种基于性能数据建立动态异常探测模型的方法
CN118012711A (zh) 一种基于互联网的集成芯片运行状态监管***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant