CN104899127A - 一种服务器监控方法及装置 - Google Patents

一种服务器监控方法及装置 Download PDF

Info

Publication number
CN104899127A
CN104899127A CN201410075533.6A CN201410075533A CN104899127A CN 104899127 A CN104899127 A CN 104899127A CN 201410075533 A CN201410075533 A CN 201410075533A CN 104899127 A CN104899127 A CN 104899127A
Authority
CN
China
Prior art keywords
server
environment temperature
temperature
threshold value
fluctuating range
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410075533.6A
Other languages
English (en)
Inventor
江桂理
栗权
徐伟权
何鹏飞
李晓慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Cyber Tianjin Co Ltd
Original Assignee
Tencent Cyber Tianjin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Cyber Tianjin Co Ltd filed Critical Tencent Cyber Tianjin Co Ltd
Priority to CN201410075533.6A priority Critical patent/CN104899127A/zh
Publication of CN104899127A publication Critical patent/CN104899127A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种服务器监控方法,包括以下步骤:采集步骤:采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度;计算步骤:根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;告警步骤:若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。本发明还提供一种服务器监控装置。利用本发明可以准确地监控服务器的环境温度是否发生异常,避免误报。

Description

一种服务器监控方法及装置
技术领域
本发明具体实施例涉及计算机技术领域,特别涉及一种服务器监控方法及装置。
背景技术
由于通常服务器需要长时间不断电工作,且用于一些重要数据的处理,因此对于服务器,尤其是数据中心的服务器集群中各台服务器而言,其运行状态的稳定性至关重要。目前,业界通常采用IPMI(IntelligentPlatform Management Interface,智能平台管理接口)协议对服务器集群中各台服务器的物理健康特征,例如环境温度、电压、风扇工作状态、电源状态等进行集中监控,从而判断各台服务器的运行状态是否稳定。
其中,监控各台服务器的环境温度是否异常的方法通常为:通过IPMI协议采集各台服务器的环境温度,并依次判断各台服务器的环境温度是否超过预设阈值。每当判定一台服务器的环境温度超过该预设阈值,则发送一条该服务器的环境温度异常的告警信息给监控人员。若服务器的环境温度异常,则通常认为数据中心的环境温度发生异常。
为了便于集中管理,服务器集群中的每一台服务器通常都采用同一个预设阈值来衡量其环境温度是否异常。然而由于服务器设计的原因,例如不同服务器的主板、CPU、内存位置的不同,或者用于采集服务器环境温度的温度传感器的原因,例如温度传感器的位置离服务器入风口的远近不同等,即使对位于同一环境中的不同服务器,所采集到的环境温度也会有差异。若所采集的某一台服务器的环境温度相较于该预设阈值过高,并不一定代表该服务器的环境温度异常。因此,这种服务器环境温度的监控方法容易发生一定的误报。
发明内容
有鉴于此,有必要提供一种服务器监控方法及装置,可以准确地监控服务器的环境温度是否发生异常,避免误报。
一种服务器监控方法,包括以下步骤:采集步骤:采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度;计算步骤:根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;告警步骤:若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
一种服务器监控装置,包括:采集模块,用于采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度;计算模块,用于根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;告警模块,用于若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
相较于现有技术,本发明服务器监控方法及装置,通过服务器的环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值,若是则发送服务器的环境温度异常的告警信息,从而可以准确地监控服务器的环境温度是否发生异常,避免误报。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1为一种监控计算机的结构框图。
图2为本发明实施例提供的服务器监控方法应用时的环境示意图。
图3为本发明第一实施例提供的服务器监控方法的流程图。
图4为图2中一台服务器在预设时间段内的环境温度波动曲线示例图。
图5为本发明第二实施例提供的服务器监控方法的流程图。
图6为本发明第三实施例提供的服务器监控方法的流程图。
图7为本发明第四实施例提供的服务器监控装置的框图。
图8为本发明第五实施例提供的服务器监控装置的框图。
图9为本发明第六实施例提供的服务器监控装置的框图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。
图1示出了一种监控计算机的结构框图。如图1所示,监控计算机1包括一个或多个(图中仅示出一个)存储器11、处理器12、存储控制器13、外设接口14、通信模块15、输入单元16及显示单元17。这些组件通过一条或多条通讯总线/信号线相互通讯。
本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对监控计算机1的结构造成限定。例如,监控计算机1还可包括比图1所示更多或者更少的组件,或者具有与图1所示不同的配置。图1所示的各组件可以采用硬件、软件或其组合实现。
存储器11可用于存储软件程序以及模块,如本发明实施例中的服务器监控方法及装置对应的程序指令/模块,处理器12通过运行存储在存储器11内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的服务器监控方法。
存储器11可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器11可进一步包括相对于处理器12远程设置的存储器,这些远程设置的存储器可以通过网络连接至监控计算机1。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。处理器12以及其他可能的组件对存储器11的访问可在存储控制器13的控制下进行。
外设接口14将各种输入/输出装置耦合至处理器12以及存储器11。处理器12运行存储器11内的各种软件、指令以及执行监控计算机1的各种功能以及进行数据处理。
通信模块15用于与通信网络或者其他设备进行通信。具体地,通信模块15例如可以是网卡。网卡作为局域网中连接计算机和传输介质的接口,用于实现与局域网传输介质之间的物理连接与电信号匹配,从而建立局域网并连接到因特网(Internet),与各种网络如局域网、城域网、广域网进行通信。网卡可包括各种现有的用于执行上述功能的电路元件,例如处理器和存储器(包括ROM和RAM)等。
输入单元16可用于接收输入的字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元16可包括按键161以及触控表面162。按键161例如可包括用于输入字符的字符按键,以及用于触发控制功能的控制按键。控制按键的实例包括“返回主屏”按键、开机/关机按键、拍照键等等。触控表面162可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控表面162上或在触控表面162附近的操作),并根据预先设定的程序驱动相应的连接装置。可选的,触控表面162可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器12,并能接收处理器12发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控表面162。除了触控表面162,输入单元16还可以包括其他输入设备。上述的其他输入设备包括但不限于物理键盘、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元17用于显示由用户输入的信息、提供给用户的信息以及监控计算机1的各种图形接口。这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。在一个实例中,显示单元17包括一个显示面板171。该显示面板171例如可为一个液晶显示面板(Liquid CrystalDisplay,LCD)、有机发光二极管(Organic Light-Emitting Diode Display,OLED)显示面板、电泳显示面板(Electro-Phoretic Display,EPD)等。进一步地,触控表面162可设置于显示面板171上从而与显示面板171构成一个整体。
参阅图2所示,为本发明实施例提供的服务器监控方法应用时的环境示意图。在本实施例中,该服务器监控方法应用于上述监控计算机1中,该监控计算机1通过网络2与服务器集群3中的多台服务器,例如图2所示的服务器30、服务器31、……、服务器N分别进行网络通信。所述服务器集群3包括在数据中心4中。该数据中心4可以被大型企业用于运行应用来处理商业和运作的组织的数据。该网络2可为任意的网络连接方式,例如互联网(Internet)、移动互联网(如电信运营商提供的2G、3G网络)、局域网(有线或者无线)等。
该监控计算机1用于监控服务器集群3中各台服务器的运行状况,例如包括各台服务器的环境温度、电压、风扇工作状态、电源状态等,以及当发现服务器的异常情况时,向监控人员发出告警信息。监控人员可以根据监控计算机1所监控的各台服务器的运行状况判断数据中心4的工作状态,例如数据中心4的环境温度等。在本实施例中,监控计算机1可以通过IPMI(Intelligent Platform Management Interface,智能平台管理接口)协议采集各台服务器的运行数据,例如入风口及出风口温度、风扇转速、CPU和内存的利用率、硬盘I/O(input/output,输入输出端口)等。
参阅图3所示,本发明第一实施例提供一种服务器监控方法。对所述服务器集群3中每一台服务器执行该服务器监控方法,可以监控服务器集群3中每一台服务器的环境温度是否发生异常,从而反映数据中心4的环境温度是否发生异常。在本实施例中,以对服务器集群3中所述服务器30执行该服务器监控方法为例,说明该服务器监控方法的工作流程。该服务器监控方法包括以下步骤:
步骤S1,采集服务器30的环境温度数据,该环境温度数据包括该服务器30的当前环境温度及在预设时间段内的历史环境温度;
步骤S2,根据该环境温度数据计算服务器30的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;
步骤S3,若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
按照上述的服务器监控方法,通过服务器30的环境温度数据计算服务器30的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值,若是则发送环境温度异常的告警信息,从而可以准确地监控服务器30的环境温度是否发生异常,避免误报。
在一些实例中,上述方法的各步骤的实现细节如下:
步骤S1所述的服务器30的环境温度可以由服务器30的入风口温度表征。具体而言,服务器30的入风口设置有温度传感器,该温度传感器用于测量服务器30的入风口温度。由于服务器30入风口的环境比较单纯,不像服务器30的出风口的温度可能会受到服务器30的CPU发热、内存等部件工作的影响。因此,服务器30的入风口温度可用于表征服务器30的环境温度。服务器30的环境温度是指服务器30所处环境的温度,例如服务器30所处室内的室温。
监控计算机1可以通过所述IPMI协议采集服务器30的环境温度数据,该环境温度数据包括服务器30的当前环境温度及在预设时间段内的历史环境温度。具体而言,监控计算机1可以通过IPMI协议从服务器30入风口设置的温度传感器采集服务器30的入风口的温度数据。所述服务器30的当前环境温度即为服务器30的入风口的当前温度,该历史环境温度即为服务器30的入风口在所述预设时间段内的历史温度。该预设时间段例如可以为当天0:00起至当前时间点之间的时间段。
具体而言,监控计算机1可以自该预设时间段的起始时间开始,以一定的频率,例如每隔10秒采集一次服务器30的入风口温度,并将采集该入风口温度的时间点与所采集的入风口温度关联起来,保存在所述存储器11中。因此,存储器11中早于当前时间点所采集的入风口温度被称为服务器30的所述历史环境温度,在当前时间点采集的入风口温度被称为服务器30的所述当前环境温度。
因此,步骤S1可以控制监控计算机1采集服务器30的当前环境温度,并从存储器11中读取服务器30在所述预设时间段内的历史环境温度,从而得到所述服务器30的环境温度数据。
步骤S2根据该环境温度数据计算服务器30的环境温度的当前波动幅度,具体而言,步骤S2可以先获取服务器30的所述历史环境温度中的最低环境温度,然后计算服务器30的当前环境温度与该最低环境温度的差值,并计算该差值与该最低环境温度的商值,从而得到所述服务器30的环境温度的当前波动幅度,即该当前波动幅度=(当前环境温度-最低环境温度)/最低环境温度。
步骤S2还需要进一步判断该当前波动幅度是否超过预设幅度阈值,例如2%。通常对于同一台服务器而言,在预设时间段内其环境温度的波动幅度是比较固定的。例如图4所示,为根据存储器11中保存的各时间点及对应的服务器30的历史环境温度及当前环境温度绘制的在预设时间段内服务器30的环境温度波动曲线图。因此,若步骤S2判定该当前波动幅度超过该预设幅度阈值,则可以认为服务器30的环境温度过高而发生异常。
步骤S3中,若步骤S2判定该当前波动幅度超过该预设幅度阈值,则发送一条环境温度异常的告警信息给监控人员,从而通知监控人员服务器30的环境温度发生异常。具体而言,步骤S3可以通过消息框、邮件、告警音、短信等方式发送该告警信息给监控人员。监控人员接收到该告警信息后,可以了解数据中心4的环境温度是否发生异常,并针对该告警信息进行处理,例如调节数据中心4的环境温度等。
为了监控数据中心4的环境温度是否发生异常,需要对服务器集群3中的每一台服务器分别执行本实施例的服务器监控方法,即采集服务器集群3中每一台服务器的环境温度数据,根据该环境温度数据分别计算每一台服务器的环境温度的当前波动幅度,并判断每一台服务器的环境温度的该当前波动幅度是否超过所述预设幅度阈值。每判定服务器集群3中的一台服务器的环境温度的当前波动幅度超过该预设幅度阈值,则需要发送一条该服务器的环境温度异常的告警信息给监控人员。因此,监控人员可以根据所接收到的一条或多条告警信息判断数据中心4的环境温度是否发生异常。
综上所述,本实施例的服务器监控方法,根据服务器集群3中每一台服务器的环境温度数据计算每一台服务器的环境温度的当前波动幅度,并通过判断每一台服务器的该当前波动幅度是否超过预设幅度阈值来判断每一台服务器的环境温度是否发生异常,从而可以准确地监控服务器集群3中各台服务器以及数据中心4的环境温度是否发生异常,避免误报。
第二实施例
由于计算服务器的环境温度的当前波动幅度的过程较复杂,需要从服务器的所述历史环境温度中筛选出最低环境温度,并使用上述服务器的环境温度的当前波动幅度的计算公式,若针对服务器集群3中每一台服务器都计算其环境温度的当前波动幅度,则需要耗费监控计算机1大量的资源,降低监控计算机1的处理效率。
为了进一步解决上述问题,本发明第二实施例提供一种服务器监控方法,其可以结合现有的预设温度阈值对服务器的环境温度是否发生异常的判断方式作进一步的限定。
具体而言,如图5所示,本实施例的服务器监控方法,相较于第一实施例的服务器监控方法,在执行所述步骤S2之前,还可以先执行下述步骤S1.1。
步骤S1.1,判断服务器30的当前环境温度是否超过该预设温度阈值,例如30度,若是,则执行所述步骤S2。
换言之,相较于现有的服务器环境温度是否异常的监控方法,本实施例的服务器监控方法,在服务器30的当前环境温度超过该预设温度阈值时,并不一定会发送所述环境温度异常的告警信息,而是需要进一步判断服务器30的环境温度的当前波动幅度是否超过所述预设幅度阈值。只有当服务器30的当前环境温度超过该预设温度阈值,并且服务器30的环境温度的当前波动幅度超过该预设幅度阈值时,才给监控人员发送该环境温度异常的告警信息。
当然,为了监控数据中心4的环境温度是否发生异常,也需要对服务器集群3中的每一台服务器分别执行本实施例的服务器监控方法,从而可以准确地监控服务器集群3中各台服务器以及数据中心4的环境温度是否发生异常,避免误报,同时提高监控计算机1的处理效率。
第三实施例
通过第一实施例提供的服务器监控方法,为了监控数据中心4的环境温度是否发生异常,需要采集服务器集群3中每一台服务器的环境温度数据,根据该环境温度数据分别计算每一台服务器的环境温度的当前波动幅度,并判断每一台服务器的环境温度的该当前波动幅度是否超过所述预设幅度阈值。每判定服务器集群3中的一台服务器的环境温度的当前波动幅度超过该预设幅度阈值,则需要发送一条该服务器的环境温度异常的告警信息给监控人员。
因此,若服务器集群3中有多台服务器的环境温度异常,则会发送相应的多条告警信息给监控人员,监控人员需要逐一查看这些告警信息,从而影响对数据中心4的环境温度异常故障的处理效率。此外,若只检测到服务器集群3中只有非常少数的几台服务器的环境温度异常,也可以认为存在一定的偶然性而无法判定数据中心4的环境温度发生异常。
为了进一步解决上述问题,本发明第三实施例提供一种服务器监控方法,参阅图6所示,其相较于第一实施例的服务器监控方法,进一步包括以下步骤:
步骤S11,对服务器集群3中每一台服务器执行所述步骤S1和步骤S2;
步骤S12,判断服务器集群3中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量是否超过预设数量阈值,若是,则发送环境温度异常的告警信息。
按照本实施例的服务器监控方法,只有在服务器集群3中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量超过该预设数量阈值时,才发送一条环境温度异常的告警信息给监控人员,监控人员只需查看一条告警信息即可了解数据中心4的环境温度是否发生异常并进行处理,从而提高对环境温度故障的处理效率,并进一步提高监控服务器集群3中各台服务器以及数据中心4的环境温度是否发生异常的准确性。
第四实施例
参阅图7所示,本发明第四实施例提供一种服务器监控装置100,该服务器监控装置100包括采集模块101、计算模块102和告警模块103。可以理解,上述的各模块是指计算机程序或者程序段,用于执行某一项或多项特定的功能。此外,上述各模块的区分并不代表实际的程序代码也必须是分开的。
采集模块101,用于采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度。采集模块101可以通过IPMI智慧平台管理接口协议采集服务器的环境温度数据。所述服务器的环境温度由服务器的入风口温度表征。
计算模块102,用于根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值。具体而言,计算模块102可以获取服务器的所述历史环境温度中的最低环境温度,计算服务器的当前环境温度与该最低环境温度的差值,并计算该差值与该最低环境温度的商值,从而得到所述服务器的环境温度的当前波动幅度。
告警模块103,用于若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
值得注意的是,为了监控数据中心4的环境温度是否发生异常,需要对服务器集群3中的每一台服务器分别运行本实施例的服务器监控装置100。
对于以上各模块的具体工作过程,可进一步参考本发明第一实施例提供的服务器监控方法,在此不再赘述。
综上所述,本实施例的服务器监控装置100,通过服务器的环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值,若是则发送环境温度异常的告警信息,从而可以准确地监控服务器的环境温度是否发生异常,避免误报。
第五实施例
参阅图8所示,本发明第五实施例提供一种服务器监控装置200,其相较于第四实施例的服务器监控装置100,进一步包括判断模块201。该判断模块201在执行所述计算模块102之前执行。
所述判断模块201,用于判断该服务器的当前环境温度是否超过预设温度阈值,若是,则执行所述计算模块102。
综上所述,本实施例的服务器监控装置200,仅仅在服务器的当前环境温度超过该预设温度阈值,并且服务器的环境温度的当前波动幅度超过该预设幅度阈值时,才给监控人员发送该环境温度异常的告警信息,因此可以准确地监控服务器的环境温度是否发生异常,避免误报,同时提高监控计算机1的处理效率。
第六实施例
参阅图9所示,本发明第六实施例提供一种服务器监控装置300,其相较于第四实施例的服务器监控装置100,进一步包括遍历模块301。该遍历模块301用于对服务器集群3中每一台服务器执行所述采集模块101和计算模块102。
此外,本实施例的服务器监控装置300相较于第四实施例的服务器监控装置100,所述的告警模块103用于判断服务器集群3中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量是否超过预设数量阈值,若是,则发送环境温度异常的告警信息。
综上所述,本实施例的服务器监控装置300,只有在服务器集群3中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量超过该预设数量阈值时,才发送一条环境温度异常的告警信息给监控人员,监控人员只需查看一条告警信息即可了解数据中心4的环境温度是否发生异常并进行处理,从而提高对环境温度故障的处理效率,并进一步提高监控服务器集群3中各台服务器以及数据中心4的环境温度是否发生异常的准确性。
此外,本发明实施例还提供一种计算机可读存储介质,其内存储有计算机可执行指令,上述的计算机可读存储介质例如为非易失性存储器例如光盘、硬盘、或者闪存。上述的计算机可执行指令用于让计算机或者类似的运算装置完成上述的服务器监控方法中的各种操作。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (10)

1.一种服务器监控方法,其特征在于,该方法包括以下步骤:
采集步骤:采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度;
计算步骤:根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;
告警步骤:若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
2.如权利要求1所述的服务器监控方法,其特征在于,在所述计算步骤前还包括:
判断步骤:判断该服务器的当前环境温度是否超过预设温度阈值,若是,则执行所述计算步骤。
3.如权利要求1-2任一所述的服务器监控方法,其特征在于,所述根据该环境温度数据计算服务器的环境温度的当前波动幅度的步骤包括:
获取服务器的所述历史环境温度中的最低环境温度;
计算服务器的当前环境温度与该最低环境温度的差值,并计算该差值与该最低环境温度的商值,从而得到所述服务器的环境温度的当前波动幅度。
4.如权利要求1-3任一所述的服务器监控方法,其特征在于,所述服务器的环境温度由服务器的入风口温度表征。
5.如权利要求1-4任一所述的服务器监控方法,其特征在于,还包括:
遍历步骤:对服务器集群中每一台服务器执行所述采集步骤和计算步骤;
所述告警步骤包括:
判断服务器集群中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量是否超过预设数量阈值,若是,则发送环境温度异常的告警信息。
6.一种服务器监控装置,其特征在于,该装置包括:
采集模块,用于采集服务器的环境温度数据,该环境温度数据包括该服务器的当前环境温度及在预设时间段内的历史环境温度;
计算模块,用于根据该环境温度数据计算服务器的环境温度的当前波动幅度,并判断该当前波动幅度是否超过预设幅度阈值;
告警模块,用于若该当前波动幅度超过该预设幅度阈值,则发送环境温度异常的告警信息。
7.如权利要求6所述的服务器监控装置,其特征在于,还包括:
判断模块,用于在执行所述计算模块之前,判断该服务器的当前环境温度是否超过预设温度阈值,若是,则执行所述计算模块。
8.如权利要求6-7任一所述的服务器监控装置,其特征在于,所述根据该环境温度数据计算服务器的环境温度的当前波动幅度包括:
获取服务器的所述历史环境温度中的最低环境温度;
计算服务器的当前环境温度与该最低环境温度的差值,并计算该差值与该最低环境温度的商值,从而得到所述服务器的环境温度的当前波动幅度。
9.如权利要求6-8任一所述的服务器监控装置,其特征在于,所述服务器的环境温度由服务器的入风口温度表征。
10.如权利要求6-9任一所述的服务器监控装置,其特征在于,还包括:
遍历模块,用于对服务器集群中每一台服务器执行所述采集模块和计算模块;
所述告警模块用于:
判断服务器集群中环境温度的当前波动幅度超过所述预设幅度阈值的服务器数量是否超过预设数量阈值,若是,则发送环境温度异常的告警信息。
CN201410075533.6A 2014-03-04 2014-03-04 一种服务器监控方法及装置 Pending CN104899127A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410075533.6A CN104899127A (zh) 2014-03-04 2014-03-04 一种服务器监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410075533.6A CN104899127A (zh) 2014-03-04 2014-03-04 一种服务器监控方法及装置

Publications (1)

Publication Number Publication Date
CN104899127A true CN104899127A (zh) 2015-09-09

Family

ID=54031803

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410075533.6A Pending CN104899127A (zh) 2014-03-04 2014-03-04 一种服务器监控方法及装置

Country Status (1)

Country Link
CN (1) CN104899127A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446861A (zh) * 2015-11-11 2016-03-30 浪潮电子信息产业股份有限公司 一种基于linux的IPMI接口负载稳定性监测方法
CN106802602A (zh) * 2017-02-24 2017-06-06 郑州云海信息技术有限公司 一种数据中心湿度自动监控***及方法
CN106840423A (zh) * 2017-01-24 2017-06-13 深圳企管加企业服务有限公司 一种基于物联网的多点测温仪上报方法及***
CN106874135A (zh) * 2017-02-20 2017-06-20 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备
CN107193352A (zh) * 2017-05-17 2017-09-22 郑州云海信息技术有限公司 一种温度数据处理方法、设备及***
CN107797897A (zh) * 2016-08-30 2018-03-13 爱思开海力士有限公司 包括主设备和从设备的***以及该***的操作方法
WO2018137100A1 (zh) * 2017-01-24 2018-08-02 深圳企管加企业服务有限公司 一种基于物联网的多点测温仪上报方法及***
CN108801467A (zh) * 2017-04-27 2018-11-13 赵文飞 一种红外全景成像巡检控制方法和装置
CN108959022A (zh) * 2018-06-14 2018-12-07 郑州云海信息技术有限公司 一种Linux***下自动监控存储扩展器温度的方法与***
CN108959027A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种非易失性内存的预警方法及相关装置
CN109413095A (zh) * 2018-11-29 2019-03-01 新华三大数据技术有限公司 防御攻击的方法及装置
CN109902973A (zh) * 2019-04-09 2019-06-18 上海应用技术大学 基于大数据的应急响应***及方法
CN109947713A (zh) * 2017-10-31 2019-06-28 北京国双科技有限公司 一种日志的监控方法及装置
CN116860563A (zh) * 2023-09-05 2023-10-10 山东捷瑞数字科技股份有限公司 一种基于云平台的数据库服务器监测方法和***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229693A1 (en) * 2002-06-06 2003-12-11 International Business Machines Corporation Self-correcting monitor
CN101281486A (zh) * 2007-04-04 2008-10-08 英业达股份有限公司 ***环境的监控方法
US7463950B1 (en) * 2007-05-31 2008-12-09 International Business Machines Corporation Identification and characterization of recirculation in electronic systems
CN101893305A (zh) * 2009-05-21 2010-11-24 富士通株式会社 空气调节异常检测设备和方法
CN102063167A (zh) * 2010-12-10 2011-05-18 曙光信息产业(北京)有限公司 刀片服务器的散热管理方法以及***
CN102568148A (zh) * 2010-12-31 2012-07-11 淮南矿业(集团)有限责任公司 预警方法及预警***
CN103048054A (zh) * 2012-12-27 2013-04-17 德讯科技股份有限公司 一种基于高密度温度采集的数据中心温度处理方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229693A1 (en) * 2002-06-06 2003-12-11 International Business Machines Corporation Self-correcting monitor
CN101281486A (zh) * 2007-04-04 2008-10-08 英业达股份有限公司 ***环境的监控方法
US7463950B1 (en) * 2007-05-31 2008-12-09 International Business Machines Corporation Identification and characterization of recirculation in electronic systems
CN101893305A (zh) * 2009-05-21 2010-11-24 富士通株式会社 空气调节异常检测设备和方法
CN102063167A (zh) * 2010-12-10 2011-05-18 曙光信息产业(北京)有限公司 刀片服务器的散热管理方法以及***
CN102568148A (zh) * 2010-12-31 2012-07-11 淮南矿业(集团)有限责任公司 预警方法及预警***
CN103048054A (zh) * 2012-12-27 2013-04-17 德讯科技股份有限公司 一种基于高密度温度采集的数据中心温度处理方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446861A (zh) * 2015-11-11 2016-03-30 浪潮电子信息产业股份有限公司 一种基于linux的IPMI接口负载稳定性监测方法
CN107797897A (zh) * 2016-08-30 2018-03-13 爱思开海力士有限公司 包括主设备和从设备的***以及该***的操作方法
CN106840423A (zh) * 2017-01-24 2017-06-13 深圳企管加企业服务有限公司 一种基于物联网的多点测温仪上报方法及***
WO2018137100A1 (zh) * 2017-01-24 2018-08-02 深圳企管加企业服务有限公司 一种基于物联网的多点测温仪上报方法及***
CN106874135A (zh) * 2017-02-20 2017-06-20 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备
CN106874135B (zh) * 2017-02-20 2020-09-04 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备
CN106802602A (zh) * 2017-02-24 2017-06-06 郑州云海信息技术有限公司 一种数据中心湿度自动监控***及方法
CN108801467A (zh) * 2017-04-27 2018-11-13 赵文飞 一种红外全景成像巡检控制方法和装置
CN108801467B (zh) * 2017-04-27 2020-10-13 赵文飞 一种红外全景成像巡检控制方法和装置
CN107193352A (zh) * 2017-05-17 2017-09-22 郑州云海信息技术有限公司 一种温度数据处理方法、设备及***
CN109947713A (zh) * 2017-10-31 2019-06-28 北京国双科技有限公司 一种日志的监控方法及装置
CN109947713B (zh) * 2017-10-31 2021-08-10 北京国双科技有限公司 一种日志的监控方法及装置
CN108959022A (zh) * 2018-06-14 2018-12-07 郑州云海信息技术有限公司 一种Linux***下自动监控存储扩展器温度的方法与***
CN108959027A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种非易失性内存的预警方法及相关装置
CN109413095A (zh) * 2018-11-29 2019-03-01 新华三大数据技术有限公司 防御攻击的方法及装置
CN109413095B (zh) * 2018-11-29 2021-11-12 新华三大数据技术有限公司 防御攻击的方法及装置
CN109902973A (zh) * 2019-04-09 2019-06-18 上海应用技术大学 基于大数据的应急响应***及方法
CN116860563A (zh) * 2023-09-05 2023-10-10 山东捷瑞数字科技股份有限公司 一种基于云平台的数据库服务器监测方法和***
CN116860563B (zh) * 2023-09-05 2023-12-15 山东捷瑞数字科技股份有限公司 一种基于云平台的数据库服务器监测方法和***

Similar Documents

Publication Publication Date Title
CN104899127A (zh) 一种服务器监控方法及装置
CN107766299A (zh) 数据指标异常的监控方法及其***、存储介质、电子设备
CN107850891B (zh) 管理***及非易失性的计算机可读记录介质
CN102449567B (zh) 作为用于装备健康状况监视服务的基础的云计算
US8677191B2 (en) Early detection of failing computers
US20200081054A1 (en) Power line issue diagnostic methods and apparatus using distributed analytics
CN106557407B (zh) 一种设备负载的监控方法和装置
KR101094195B1 (ko) 2차원 코드 및 관리서버를 이용한 전력설비 관리방법과 그 시스템
CN105610647A (zh) 一种探测业务异常的方法和服务器
CN104007806A (zh) 一种安卓***中的cpu频率的控制方法、装置和设备
JP2017102669A (ja) 管理システムおよび管理プログラム
CN104932963A (zh) 管理终端的方法及装置
CN106776243A (zh) 一种针对监控软件的监控方法及装置
CN105872061A (zh) 一种服务器集群管理方法、装置及***
US10282464B2 (en) Data processing method and device for internet entity analysis
CN110410353A (zh) 风扇控制方法、装置及终端设备
CN112234707B (zh) 一种高能同步辐射光源磁铁电源故障识别***
CN107121943B (zh) 一种用于获得智能仪表的健康预测信息的方法和装置
CN111158806B (zh) 界面显示方法、装置、计算机设备及存储介质
KR20200039970A (ko) 전력 시계열 데이터의 전송처리 시스템 및 방법
CN108920337A (zh) 一种设备异常信息展示方法和计算机设备
WO2013128468A2 (en) Method and system for efficient real time thermal management of a data center
Santhanam et al. The role of data centres in advancing green IT: A literature review
CN116227676A (zh) 生产设备能耗分析方法、装置、电子设备及存储介质
CN108964283A (zh) 一种配电箱预警***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20150909