CN109408312A - 一种服务器运行温度测试***及设备 - Google Patents

一种服务器运行温度测试***及设备 Download PDF

Info

Publication number
CN109408312A
CN109408312A CN201811293038.7A CN201811293038A CN109408312A CN 109408312 A CN109408312 A CN 109408312A CN 201811293038 A CN201811293038 A CN 201811293038A CN 109408312 A CN109408312 A CN 109408312A
Authority
CN
China
Prior art keywords
test
server
temperature
cpu
measured
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811293038.7A
Other languages
English (en)
Other versions
CN109408312B (zh
Inventor
徐伟超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811293038.7A priority Critical patent/CN109408312B/zh
Publication of CN109408312A publication Critical patent/CN109408312A/zh
Application granted granted Critical
Publication of CN109408312B publication Critical patent/CN109408312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2268Logging of test results

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供一种服务器运行温度测试***及设备,根据温度测试预设条件基于安装到待测服务器上的测试客户端执行温度测试程序,并通过显示模块显示温度测试过程数据,待测服务器的温度测试数据以及温度测试单元运行数据。***应用于服务器项目开发阶段整机***测试,实时监控服务器处理器工作状态下的温度散热状况,在出现处理器温度异常或者报警的同时,及时的对服务器异常状况进行时时记录状态数据,以便于研发进行相应解析并对整机服务器的散热策略进行优化调控。大大减少了人工操作及干预的时间,实用性强。测试人员能够基于服务器的不同配置来测试处理器温度状态,并调节服务器的配置,满足用户对服务器性能的需求。

Description

一种服务器运行温度测试***及设备
技术领域
本发明涉及服务器温度测试领域,尤其涉及一种服务器运行温度测试***及设备。
背景技术
随着IT领域技术的不断发展和大数据时代的到来,传统信息化服务以及日趋强大的云计算服务对服务器的稳定性需求越来越高。目前高性能服务器在追求性能的同时,相应的服务器工作状态下的功耗及散热会大大的增加。在服务器项目开发阶段针对功耗散热部分,研发会投入相当多的时间和精力,目的在于改善优化服务器的散热状况,降低服务器功耗,既能保证服务器散热的情况下将整机的服务器功耗降到最低。如何才能实现测试服务器数据处理过程中满足处理器的温度状态在预设范围内,并基于散热状态和处理器温度状态调节服务器的配置,满足用户对服务器性能的需求,是当前丞待解决的技术问题。
发明内容
为了克服上述现有技术中的不足,本发明提供一种服务器运行温度测试***,包括:温度测试单元和测试客户端;测试客户端用于安装到待测服务器上;
温度测试单元包括:多个通信接口,数据接收模块,显示模块以及测试控制模块;
通信接口通过网线与待测服务器的网口连接;
数据接收模块和显示模块分别与测试控制模块连接,测试控制模块通过数据接收模块接收测试人员输入的温度测试控制指令以及温度测试预设测试条件;
测试控制模块用于根据测试人员输入的温度测试控制指令以及温度测试预设条件基于安装到待测服务器上的测试客户端执行温度测试程序,并通过显示模块显示温度测试过程数据,待测服务器的温度测试数据以及温度测试单元运行数据。
优选地,温度测试单元还包括:温度测试程序配置模块;
温度测试程序配置模块用于配置服务器温度测试用温度告警测试程序;
测试控制模块将温度告警测试程序配置到待测服务器中,并执行温度告警测试程序,测试客户端通过服务器BMC日志记录CPU运行的温度信息;
测试控制模块通过服务器BMC日志记录的CPU运行温度信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出CPU温度过高的形成告警日志,并记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
优选地,温度测试程序配置模块还用于配置待测服务器的CPU出现温度超阈值时,对CPU进行降频处理,并实时获取CPU状态的程序以及对待测服务器的CPU进行降频处理;
测试控制模块将温度测试程序配置模块配置的测试程序配置到待测服务器中,当待测服务器的CPU出现温度超阈值时,对CPU进行降频处理,获取CPU的运行状态及温度信息;
测试控制模块还用于对待测服务器的CPU进行降频处理,并实时获取CPU状态的信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出降频处理CPU温度过高的形成告警日志,并记录当前降频处理CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
优选地,测试控制模块还用于在测试过程中,待测服务器日志及服务器BMC日志均未出现处理器温度告警时,记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况;
在测试过程中,服务器BMC日志记录CPU温度过高的告警日志,而待测服务器日志未出现告警日志时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况;
保存并清除bmc log中的异常日志以便于下次的循环。
优选地,测试控制模块还用于在测试过程中,服务器BMC日志记录处理器温度过高的告警日志,同时待测服务器日志出现CPU降频的告警日志记录时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
优选地,数据接收模块还用于提供***中所有待测服务器的温度测试任务信息的操作端口,用户通过操作端口提供的查改删增操作方式对待测服务器温度测试任务信息进行操作;
还用于提供***中每个测试人员所对应的待测服务器测试任务信息的操作端口,每个测试人员通过所述操作端口提供的查改删增的操作方式对测试人员名下的待测服务器温度测试任务信息进行操作;
还用于提供***中每个测试脚本的操作端口,用户通过所述操作端口提供的查改删增操作方式对每个测试脚本进行操作;
还用于设置任务列表,使所有待测服务器测试任务信息配置到任务列表中,用户通过任务列表获取每个任务下的测试执行进度;
还用于设置测试人员列表,使所有测试人员信息配置到测试人员列表中,测试人员通过测试人员列表获取测试执行进度;
还用于设置测试脚本列表,使所有测试脚本信息配置到测试脚本任务列表中,用户通过测试脚本任务列表获取每个测试脚本的状态信息。
优选地,测试控制模块还用于在测试***配置测试项目界面,测试项目界面以树装形式展示每个测试项目;
在测试项目界面中设置测试项目添加端口,测试人员调取测试项目添加端口在测试项目界面上添加测试项目;添加测试项目包括:测试项目编码信息输入端口,测试项目名称信息输入端口,测试项目开始时间输入端口,测试项目结束时间输入端口,测试项目备注信息输入端口,测试项目提交操作输入按键,测试项目重置信息按键以及测试项目延时端口;
还用于在测试项目界面上配置对已添加的测试项目进行编辑端口;使用户通过编辑端口对已添加的测试项目进行编辑;
还用于在测试项目界面配置每个测试项目的任务项信息输入端口,测试人员信息查改删增操作端口,测试脚本查改删增操作端口,测试脚本执行顺序操作端口,测试脚本执行关联度操作端口,测试人员架构操作端口。
优选地,温度测试单元还包括:报警提示模块和测试结果推送模块;
报警提示模块用于测试项目所涉及的测试脚本出现死循环,或者所涉及的测试脚本出现运行超时长,或所涉及当前测试脚本运行结束后未执行下一接续测试脚本,或所涉及当前测试脚本运行结束后未执行预设的下一接续测试脚本时,向测试人员,服务器维护人员以及***管理员通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式发出报警提示;
测试结果推送模块用于通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式推送测试过程日志和测试结果报告。
一种具有服务器运行温度测试***的设备,包括:
存储器,用于存储计算机程序及服务器运行温度测试***;
处理器,用于执行所述计算机程序及服务器运行温度测试***,以实现服务器运行温度测试***。
从以上技术方案可以看出,本发明具有以下优点:
在本发明中,***应用于服务器项目开发阶段整机***测试,实时监控服务器处理器工作状态下的温度散热状况,在出现处理器温度异常或者报警的同时,及时的对服务器异常状况进行时时记录状态数据,以便于研发进行相应解析并对整机服务器的散热策略进行优化调控。大大减少了人工操作及干预的时间,实用性强。测试人员能够基于服务器的不同配置来测试处理器温度状态,并调节服务器的配置,满足用户对服务器性能的需求。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为服务器运行温度测试***示意图;
图2为服务器运行温度测试***实施例示意图。
具体实施方式
本发明提供一种服务器运行温度测试***,如图1所示,包括:温度测试单元8和测试客户端6;测试客户端6用于安装到待测服务器7上;
温度测试单元8包括:多个通信接口1,数据接收模块3,显示模块4以及测试控制模块5;通信接口1通过网线与待测服务器7的网口连接;数据接收模块3和显示模块4分别与测试控制模块5连接,测试控制模块5通过数据接收模块3接收测试人员输入的温度测试控制指令以及温度测试预设测试条件;测试控制模块5用于根据测试人员输入的温度测试控制指令以及温度测试预设条件基于安装到待测服务器7上的测试客户端6执行温度测试程序,并通过显示模块4显示温度测试过程数据,待测服务器7的温度测试数据以及温度测试单元8运行数据。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将运用具体的实施例及附图,对本发明保护的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本专利中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利保护的范围。
本发明提供的实施例中,如图2所示,温度测试单元8还包括:温度测试程序配置模块2;
温度测试程序配置模块2用于配置服务器温度测试用温度告警测试程序;测试控制模块5将温度告警测试程序配置到待测服务器7中,并执行温度告警测试程序,测试客户端6通过服务器BMC日志记录CPU运行的温度信息;测试控制模块5通过服务器BMC日志记录的CPU运行温度信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出CPU温度过高的形成告警日志,并记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
当然在本发明中不局限于记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况还可以包括如内存,主板,硬盘等信息,进行综合测试满足配置要求。
这里所描述的技术可以实现在硬件,软件,固件或它们的任何组合。所述的各种特征为模块,单元或组件可以一起实现在集成逻辑装置或分开作为离散的但可互操作的逻辑器件或其他硬件设备。在一些情况下,电子电路的各种特征可以被实现为一个或多个集成电路器件,诸如集成电路芯片或芯片组。
在本发明提供的实施例中,温度测试程序配置模块2还用于配置待测服务器7的CPU出现温度超阈值时,对CPU进行降频处理,并实时获取CPU状态的程序以及对待测服务器7的CPU进行降频处理;
测试控制模块5将温度测试程序配置模块2配置的测试程序配置到待测服务器7中,当待测服务器7的CPU出现温度超阈值时,对CPU进行降频处理,获取CPU的运行状态及温度信息;
测试控制模块5还用于对待测服务器7的CPU进行降频处理,并实时获取CPU状态的信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出降频处理CPU温度过高的形成告警日志,并记录当前降频处理CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
可以理解的是处理器温度异常的情况中,待测服务器7日志出现处理器降频throttled告警日志、服务器BMC日志中出现CPU温度过高的严重告警日志,而两者的告警日志的触发条件有不同。待测服务器7日志的降频告警日志的触发温度要高于后者,因此针对此部分需要作出不同的异常判断
#!/bin/bash
Cur_Dir=$(cd "$(dirname "$0")";pwd)
process=$1
function get_status()
{
flag_os=`cat /var/log/messages |grep throttled |grep temperature` #变量flag_os获取***日志中关于CPU温度及降频的异常日志
flag_bmc=`ipmitool sel elist |grep -i CPU|grep -i hot` #变量flag_bmc 获取服务器bmc中关于cpu的温度报警信息
}
在本发明提供的实施例中,测试控制模块5还用于在测试过程中,待测服务器7日志及服务器BMC日志均未出现处理器温度告警时,记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况;
在测试过程中,服务器BMC日志记录CPU温度过高的告警日志,而待测服务器7日志未出现告警日志时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
测试控制模块5还用于在测试过程中,服务器BMC日志记录处理器温度过高的告警日志,同时待测服务器7日志出现CPU降频的告警日志记录时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
具体的,针对获取的温度情况,分别进行相对应的异常日志数据抓取记录,获取异常告警出现的实时的服务器状态,包括处理器温度情况,整机服务器风扇转速状况,整机功耗状况及服务器BMC监控值的信息状况
此部分又分为三种情况:
1>待测服务器7日志及服务器BMC日志均未出现处理器温度告警
2>服务器BMC日志存在处理器温度过高的严重告警日志,而待测服务器7日志未出现
3>服务器BMC日志存在处理器温度过高的严重告警日志,同时待测服务器7日志出现了处理器降频的告警日志记录。
function mon ()
{
get_status
Time= 'date +%D_%T'
if [ -z "$flag_os" ] && [ -z $flag_bmc ];then #待测服务器7日志及服务器BMC日志均未出现处理器温度告警,不做任何处理动作
get_status
fi
if [ -n "$flag_os" ] && [ -z $flag_bmc ];then #服务器BMC日志存在处理器温度过高的严重告警日志,而待测服务器7日志未出现
Time_os=`cat /var/log/messages |grep throttled |grep temperature | head -1 |awk '{print $1,$2,$3}'`
echo "CPU Core temperature clock throttled(bmc not logged) Time in OSmessages is ======"$Time_os"======" >> $Cur_Dir/fail_monitor.log
echo "The local time is ==========="$Time"============"
for i in {1..10} #记录接下来10s的bmc sdr信息监控FAN及温度状况
do
ipmitool sdr elist >> $Cur_Dir/fail_monitor.log
sleep 1
done
fi
if [ -n "$flag_os" ] && [ -n $flag_bmc ];then #服务器BMC日志存在处理器温度过高的严重告警日志,同时待测服务器7日志出现了处理器降频的告警日志记录
Time_bmc=`ipmitool sel elist |grep -i CPU|grep -i hot|head -1 |awk '{print $3,$5}'`
echo "CPU Core temperature clock throttled(bmc logged) Time is ======"$Time_bmc"======" >> $Cur_Dir/fail_monitor.log
echo "The local time is ==========="$Time"============"
for i in {1..10} #记录接下来10s的bmc sdr信息监控FAN及温度状况
do
ipmitool sdr elist >> $Cur_Dir/fail_monitor.log
sleep 1
done
fi
ipmitool sel elist >> $Cur_Dir/bmc.log
ipmitool sel clear #保存并清除bmc log中的异常日志以便于下次的循环check
cat /var/log/messages >> $Cur_Dir/messages
cat /dev/null >/var/log/messages #保存并清楚os messages log中的异常日志以便于下次的循环check
}
function get_process () #函数get_process获取服务器整机测试进程
{
flag=`ps -A |grep $process`
}
get_process
while [ -n "flag" ]
do
mon
get_process
done #主程序,在服务器整机测试进程测试未完成的过程中循环进行监控
在本发明提供的实施例中,数据接收模块3还用于提供***中所有待测服务器7的温度测试任务信息的操作端口,用户通过操作端口提供的查改删增操作方式对待测服务器7温度测试任务信息进行操作;
还用于提供***中每个测试人员所对应的待测服务器7测试任务信息的操作端口,每个测试人员通过所述操作端口提供的查改删增的操作方式对测试人员名下的待测服务器7温度测试任务信息进行操作;
还用于提供***中每个测试脚本的操作端口,用户通过所述操作端口提供的查改删增操作方式对每个测试脚本进行操作;
还用于设置任务列表,使所有待测服务器7测试任务信息配置到任务列表中,用户通过任务列表获取每个任务下的测试执行进度;
还用于设置测试人员列表,使所有测试人员信息配置到测试人员列表中,测试人员通过测试人员列表获取测试执行进度;
还用于设置测试脚本列表,使所有测试脚本信息配置到测试脚本任务列表中,用户通过测试脚本任务列表获取每个测试脚本的状态信息。
如果在硬件中实现,本发明涉及一种装置,例如可以作为处理器或者集成电路装置,诸如集成电路芯片或芯片组。可替换地或附加地,如果软件或固件中实现,所述技术可实现至少部分地由计算机可读的数据存储介质,包括指令,当执行时,使处理器执行一个或更多的上述方法。例如,计算机可读的数据存储介质可以存储诸如由处理器执行的指令。
在本发明提供的实施例中,测试控制模块5还用于在测试***配置测试项目界面,测试项目界面以树装形式展示每个测试项目;
在测试项目界面中设置测试项目添加端口,测试人员调取测试项目添加端口在测试项目界面上添加测试项目;添加测试项目包括:测试项目编码信息输入端口,测试项目名称信息输入端口,测试项目开始时间输入端口,测试项目结束时间输入端口,测试项目备注信息输入端口,测试项目提交操作输入按键,测试项目重置信息按键以及测试项目延时端口;
还用于在测试项目界面上配置对已添加的测试项目进行编辑端口;使用户通过编辑端口对已添加的测试项目进行编辑;
还用于在测试项目界面配置每个测试项目的任务项信息输入端口,测试人员信息查改删增操作端口,测试脚本查改删增操作端口,测试脚本执行顺序操作端口,测试脚本执行关联度操作端口,测试人员架构操作端口。
温度测试单元8还包括:报警提示模块11和测试结果推送模块12;报警提示模块11用于测试项目所涉及的测试脚本出现死循环,或者所涉及的测试脚本出现运行超时长,或所涉及当前测试脚本运行结束后未执行下一接续测试脚本,或所涉及当前测试脚本运行结束后未执行预设的下一接续测试脚本时,向测试人员,服务器维护人员以及***管理员通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式发出报警提示;测试结果推送模块12用于通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式推送测试过程日志和测试结果报告。
服务器运行温度测试***可以使测试者快速高效的批量测试服务器的温度状态,提高测试效率及减少人为因素带来的不确定性,节省成本。
本发明还提供一种具有服务器运行温度测试***的设备,包括:
存储器,用于存储计算机程序及服务器运行温度测试***;
处理器,用于执行所述计算机程序及服务器运行温度测试***,以实现服务器运行温度测试***。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (9)

1.一种服务器运行温度测试***,其特征在于,包括:温度测试单元和测试客户端;测试客户端用于安装到待测服务器上;
温度测试单元包括:多个通信接口,数据接收模块,显示模块以及测试控制模块;
通信接口通过网线与待测服务器的网口连接;
数据接收模块和显示模块分别与测试控制模块连接,测试控制模块通过数据接收模块接收测试人员输入的温度测试控制指令以及温度测试预设测试条件;
测试控制模块用于根据测试人员输入的温度测试控制指令以及温度测试预设条件基于安装到待测服务器上的测试客户端执行温度测试程序,并通过显示模块显示温度测试过程数据,待测服务器的温度测试数据以及温度测试单元运行数据。
2.根据权利要求1所述的服务器运行温度测试***,其特征在于,
温度测试单元还包括:温度测试程序配置模块;
温度测试程序配置模块用于配置服务器温度测试用温度告警测试程序;
测试控制模块将温度告警测试程序配置到待测服务器中,并执行温度告警测试程序,测试客户端通过服务器BMC日志记录CPU运行的温度信息;
测试控制模块通过服务器BMC日志记录的CPU运行温度信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出CPU温度过高的形成告警日志,并记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
3.根据权利要求2所述的服务器运行温度测试***,其特征在于,
温度测试程序配置模块还用于配置待测服务器的CPU出现温度超阈值时,对CPU进行降频处理,并实时获取CPU状态的程序以及对待测服务器的CPU进行降频处理;
测试控制模块将温度测试程序配置模块配置的测试程序配置到待测服务器中,当待测服务器的CPU出现温度超阈值时,对CPU进行降频处理,获取CPU的运行状态及温度信息;
测试控制模块还用于对待测服务器的CPU进行降频处理,并实时获取CPU状态的信息,判断CPU温度是否超阈值,当出现CPU温度超阈值时,发出降频处理CPU温度过高的形成告警日志,并记录当前降频处理CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
4.根据权利要求1或2所述的服务器运行温度测试***,其特征在于,
测试控制模块还用于在测试过程中,待测服务器日志及服务器BMC日志均未出现处理器温度告警时,记录当前CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况;
在测试过程中,服务器BMC日志记录CPU温度过高的告警日志,而待测服务器日志未出现告警日志时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况;
保存并清除bmc log中的异常日志以便于下次的循环。
5.根据权利要求4所述的服务器运行温度测试***,其特征在于,
测试控制模块还用于在测试过程中,服务器BMC日志记录处理器温度过高的告警日志,同时待测服务器日志出现CPU降频的告警日志记录时,持续预设时长,记录CPU的主频,外频,前端总线频率,倍频系数,风扇转速,整机功耗以及服务器BMC监控值的信息状况。
6.根据权利要求1所述的服务器运行温度测试***,其特征在于,
数据接收模块还用于提供***中所有待测服务器的温度测试任务信息的操作端口,用户通过操作端口提供的查改删增操作方式对待测服务器温度测试任务信息进行操作;
还用于提供***中每个测试人员所对应的待测服务器测试任务信息的操作端口,每个测试人员通过所述操作端口提供的查改删增的操作方式对测试人员名下的待测服务器温度测试任务信息进行操作;
还用于提供***中每个测试脚本的操作端口,用户通过所述操作端口提供的查改删增操作方式对每个测试脚本进行操作;
还用于设置任务列表,使所有待测服务器测试任务信息配置到任务列表中,用户通过任务列表获取每个任务下的测试执行进度;
还用于设置测试人员列表,使所有测试人员信息配置到测试人员列表中,测试人员通过测试人员列表获取测试执行进度;
还用于设置测试脚本列表,使所有测试脚本信息配置到测试脚本任务列表中,用户通过测试脚本任务列表获取每个测试脚本的状态信息。
7.根据权利要求1所述的服务器运行温度测试***,其特征在于,
测试控制模块还用于在测试***配置测试项目界面,测试项目界面以树装形式展示每个测试项目;
在测试项目界面中设置测试项目添加端口,测试人员调取测试项目添加端口在测试项目界面上添加测试项目;添加测试项目包括:测试项目编码信息输入端口,测试项目名称信息输入端口,测试项目开始时间输入端口,测试项目结束时间输入端口,测试项目备注信息输入端口,测试项目提交操作输入按键,测试项目重置信息按键以及测试项目延时端口;
还用于在测试项目界面上配置对已添加的测试项目进行编辑端口;使用户通过编辑端口对已添加的测试项目进行编辑;
还用于在测试项目界面配置每个测试项目的任务项信息输入端口,测试人员信息查改删增操作端口,测试脚本查改删增操作端口,测试脚本执行顺序操作端口,测试脚本执行关联度操作端口,测试人员架构操作端口。
8.根据权利要求1所述的服务器运行温度测试***,其特征在于,
温度测试单元还包括:报警提示模块和测试结果推送模块;
报警提示模块用于测试项目所涉及的测试脚本出现死循环,或者所涉及的测试脚本出现运行超时长,或所涉及当前测试脚本运行结束后未执行下一接续测试脚本,或所涉及当前测试脚本运行结束后未执行预设的下一接续测试脚本时,向测试人员,服务器维护人员以及***管理员通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式发出报警提示;
测试结果推送模块用于通过短信的方式,或通过客户端浏览器界面、或通过电子邮件方式推送测试过程日志和测试结果报告。
9.一种具有服务器运行温度测试***的设备,其特征在于,包括:
存储器,用于存储计算机程序及服务器运行温度测试***;
处理器,用于执行所述计算机程序及服务器运行温度测试***,以实现如权利要求1至8任意一项所述的服务器运行温度测试***。
CN201811293038.7A 2018-11-01 2018-11-01 一种服务器运行温度测试***及设备 Active CN109408312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811293038.7A CN109408312B (zh) 2018-11-01 2018-11-01 一种服务器运行温度测试***及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811293038.7A CN109408312B (zh) 2018-11-01 2018-11-01 一种服务器运行温度测试***及设备

Publications (2)

Publication Number Publication Date
CN109408312A true CN109408312A (zh) 2019-03-01
CN109408312B CN109408312B (zh) 2021-10-29

Family

ID=65470851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811293038.7A Active CN109408312B (zh) 2018-11-01 2018-11-01 一种服务器运行温度测试***及设备

Country Status (1)

Country Link
CN (1) CN109408312B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124784A (zh) * 2019-12-20 2020-05-08 浪潮商用机器有限公司 一种服务器的温度告警功能的测试方法、装置及设备
CN114356057A (zh) * 2021-12-30 2022-04-15 浙江大华技术股份有限公司 控制PCIe卡散热的方法、装置、设备及存储介质
CN114490200A (zh) * 2021-12-17 2022-05-13 宁畅信息产业(北京)有限公司 内存测试方法、装置、计算机设备和存储介质
CN116820197A (zh) * 2023-06-27 2023-09-29 深圳小非牛科技有限公司 一种基于大数据互联的软件测试技术平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815115A (zh) * 2017-01-13 2017-06-09 郑州云海信息技术有限公司 一种服务器运行状态监控***
US20170201433A1 (en) * 2016-01-13 2017-07-13 Ricoh Company, Ltd. System And Method For Monitoring, Sensing And Analytics Of Collaboration Devices
US20170353363A1 (en) * 2016-06-03 2017-12-07 Benjamin James Parker Systems and methods for managing network operations
CN107590037A (zh) * 2017-08-29 2018-01-16 郑州云海信息技术有限公司 一种对服务器gpu进行edpp测试的方法
CN108574600A (zh) * 2018-03-20 2018-09-25 北京航空航天大学 云计算服务器的功耗和资源竞争协同控制的服务质量保障方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170201433A1 (en) * 2016-01-13 2017-07-13 Ricoh Company, Ltd. System And Method For Monitoring, Sensing And Analytics Of Collaboration Devices
US20170353363A1 (en) * 2016-06-03 2017-12-07 Benjamin James Parker Systems and methods for managing network operations
CN106815115A (zh) * 2017-01-13 2017-06-09 郑州云海信息技术有限公司 一种服务器运行状态监控***
CN107590037A (zh) * 2017-08-29 2018-01-16 郑州云海信息技术有限公司 一种对服务器gpu进行edpp测试的方法
CN108574600A (zh) * 2018-03-20 2018-09-25 北京航空航天大学 云计算服务器的功耗和资源竞争协同控制的服务质量保障方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MARINA ZAPATER 等: "Leakage and Temperature Aware Server Control for Improving Energy Efficiency in Data Centers", 《ACM》 *
任延昭 等: "基于微信平台的温室环境监测与温度预测***", 《农业机械学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124784A (zh) * 2019-12-20 2020-05-08 浪潮商用机器有限公司 一种服务器的温度告警功能的测试方法、装置及设备
CN114490200A (zh) * 2021-12-17 2022-05-13 宁畅信息产业(北京)有限公司 内存测试方法、装置、计算机设备和存储介质
CN114356057A (zh) * 2021-12-30 2022-04-15 浙江大华技术股份有限公司 控制PCIe卡散热的方法、装置、设备及存储介质
CN116820197A (zh) * 2023-06-27 2023-09-29 深圳小非牛科技有限公司 一种基于大数据互联的软件测试技术平台
CN116820197B (zh) * 2023-06-27 2024-04-12 深圳小非牛科技有限公司 一种基于大数据互联的软件测试技术平台

Also Published As

Publication number Publication date
CN109408312B (zh) 2021-10-29

Similar Documents

Publication Publication Date Title
US20210160307A1 (en) Probability-distribution-based log-file analysis
TWI768296B (zh) 用於組態漂移偵測及補救之系統及方法
US7707443B2 (en) Rack-level power management of computer systems
US9652281B2 (en) System and method for virtualization aware server maintenance mode
US5991806A (en) Dynamic system control via messaging in a network management system
CN109408312A (zh) 一种服务器运行温度测试***及设备
US10454801B2 (en) Methods and systems that diagnose and manage undesirable operational states of computing facilities
US20060149985A1 (en) Power management of multi-processor servers
US20090210735A1 (en) Apparatus, system, and method for controlling power sequence in a blade center environment
US10936375B2 (en) Hyper-converged infrastructure (HCI) distributed monitoring system
CN104601673B (zh) 可扩展的高可用服务器分层监控***
EP2457153A1 (en) Techniques for power analysis
CN108259270A (zh) 一种数据中心统一管理***设计方法
WO2022057464A1 (zh) 一种灵活配置的多计算节点服务器主板结构和程序
CN112596568B (zh) 一种读取电压调节器报错信息的方法、***、设备及介质
CN102457578B (zh) 一种基于事件机制的分布式网络监控方法
CN102929769A (zh) 一种基于代理服务的虚拟机内部数据采集方法
CN111694707A (zh) 一种小型服务器集群管理***及方法
CN116723198A (zh) 一种多节点服务器主机控制方法、装置、设备、存储介质
CN104834584A (zh) 一种监测主机硬件负载的方法和***
CN112486776A (zh) 一种集群成员节点可用性监测设备及方法
Simili et al. A hybrid system for monitoring and automated recovery at the Glasgow Tier-2 cluster
US11755100B2 (en) Power/workload management system
US10817397B2 (en) Dynamic device detection and enhanced device management
US10402357B1 (en) Systems and methods for group manager based peer communication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant