CN103905264A - 监测***及监测方法 - Google Patents

监测***及监测方法 Download PDF

Info

Publication number
CN103905264A
CN103905264A CN201210580260.1A CN201210580260A CN103905264A CN 103905264 A CN103905264 A CN 103905264A CN 201210580260 A CN201210580260 A CN 201210580260A CN 103905264 A CN103905264 A CN 103905264A
Authority
CN
China
Prior art keywords
server
exception reporting
testing apparatus
module
unique identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201210580260.1A
Other languages
English (en)
Inventor
宋灿辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN201210580260.1A priority Critical patent/CN103905264A/zh
Priority to TW102100804A priority patent/TW201428487A/zh
Priority to US14/083,459 priority patent/US20140189103A1/en
Publication of CN103905264A publication Critical patent/CN103905264A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Small-Scale Networks (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)

Abstract

一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符。该监测***包括:侦测模块,用于侦测服务器是否出现异常;异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;通信模块;以及事件处理模块,该通信模块用于将该异常报告生成模块生成的异常报告主动发送至该事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。本发明还提供一种监测方法。本发明中的监测***和监测方法可以及时高效的对服务器出现的异常进行监测。

Description

监测***及监测方法
技术领域
本发明涉及监测***及监测方法。
背景技术
随着云计算技术的发展,包含大量服务器的数据中心变的不可或缺,而这些服务器的稳定性更是成为被关注的焦点。为了监控数据中心每个机柜中服务器的运转状况,现在一般是将放置于一个机柜中的所有服务器通过IPMB(Intelligent Platform Management BUS,智能平台管理总线)和复用器(Multiplexer)连接至一个监测装置中,该监测装置采用轮询的方式向每台服务器中获取关于服务器异常的异常报告。在这种方式下,由于IPMB处理数据能力有限,当服务器返回的信息量比较大时,会导致监测装置获取数据的时间很长,另外服务器只能在监测装置为获得异常情况而轮询到它时才能向监测装置报告异常,采取这种轮询方式效率低。此外,当服务器的连接出现问题时,该监测装置仍然按照原来的轮询方式去与该服务器进行连接,这样也会导致监测效率降低。
发明内容
有鉴于此,有必要提供一种能够提高监测效率的监测***。
一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符。该监测***包括:侦测模块,用于侦测服务器是否出现异常;异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;通信模块;以及事件处理模块,该通信模块用于将该异常报告生成模块生成的异常报告主动发送至该事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。
本发明中的监测***在侦测到服务器异常时可以主动通过有线或无线直接将异常发送至测试装置中,该测试装置只需要获取发生了异常的服务器主动发出的异常信息,而不需要通过复用器切换轮询的方式去查询所有服务器是否异常并获取异常信息,因此可以及时高效的对服务器出现的异常进行监测。
附图说明
图1为本发明一实施方式中监测***的架构示意图。
图2为图1所示的监测***所在的测试装置和服务器物理连接示意图。
图3为本发明一实施方式中监测方法流程图。
主要元件符号说明
监测*** 100
测试装置 10
服务器 20
IPMB总线 201
复用器 202
侦测模块 101
异常报告生成模块 102
通信模块 103
事件处理模块 104
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
下面结合附图,对本发明中的监测***及监测方法作进一步的详细描述。
请参阅图1,本发明一较佳实施方式中,该监测***100应用于一由测试装置10和设置于云端数据中心的多台服务器20组成的***中,该测试装置10与该些服务器20通过有线或无线网络进行通信,其中,每台服务器20均对应一唯一的标识符。在本实施方式中,每台服务器20对应的唯一标识符可以是本机的固定IP地址,也可以是由DHPC(Dynamic Host Configuration Protocol,动态主机配置协议)服务器(图未示)为该些服务器20派送的IP地址,该每台服务器20对应的唯一识别码还可以是CPU序列号、内存条序列号等硬件识别码。其中该服务器中包括一BMC(Baseboard Management Controller,主板管理控制器)。
如图2所示,在本实施方式中,该测试装置10与该些服务器20除了通过有线或无线的方式进行网络通信外,还通过IPMB(IntelligentPlatform Management BUS,智能平台管理总线)201和复用器(Multiplexer)202与该些服务器20中的BMC进行物理上的连接,该测试装置10每次只能与一台服务器20通过该物理连接进行通信,该复用器用于切换该测试装置10与该些服务器20中的一台通过该进行通信。
该监测***100包括侦测模块101、异常报告生成模块102、通信模块103以及事件处理模块104。在本实施方式中,该侦测模块101、异常报告生成模块102、通信模块103设置于该服务器20中,该事件处理模块104设置于该测试装置10中。在其他实施方式中,侦测模块101、异常报告生成模块102以及通信模块103存储于一移动存储装置中,如移动硬盘、U盘中,当该移动存储设备连接至服务器20时,该些模块运行于该服务器中对服务器进行监测。
该侦测模块101用于侦测该服务器20的运行是否出现异常。在本实施方式中,该侦测模块101响应用户在设置于测试装置10或服务器20上的输入单元(图未示)上的操作而执行该侦测操作。在其他实施方式中,该侦测模块101还可以响应用户在设置于测试装置10或服务器20上的输入单元上的操作而生成一测试指令,该些服务器20中的BMC能够根据该测试指令对服务器20进行测试。
该异常报告生成模块102用于根据该侦测模块101侦测到的服务器20异常情况生成一异常报告,其中,该异常报告中包括该服务器20对应的唯一标识符和该服务器20的具体异常信息,例如,该具体异常信息可以是风扇转速过快或过慢等信息。在本实施方式中,该侦测模块101用于侦测该服务器20的温度、电压、风扇转速等参数是否异常。
该通信模块103用于将该异常报告生成模块102生成的异常报告主动发送至该测试装置10中的事件处理模块104。在本实施方式中,该通信模块103通过SNMP Trap(Simple Network Management ProtocolTrap,简单网络管理协议陷阱)方式将该异常报告发送至该事件处理模块104,即该通信模块103主动将该异常报告发送至该事件处理模块104,而不是通过等待该事件处理模块104轮询的方式将异常报告发送至该事件处理模块104。
该事件处理模块104接收该通信模块103发送的异常报告后,将该接收到的异常报告加入该事件处理模块104待处理的事件处理列表中,该事件处理模块104在每处理一异常报告时,控制该测试装置10将该异常报告显示在该测试装置10的显示装置(图未示)上而提供给用户,使得用户可以根据该异常报告对出现异常的服务器20进行调试。
在本实施方式中,该事件处理模块104还获取该异常报告中该服务器20的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置10与该异常报告中唯一标识符对应的服务器20进行物理连接方式的通信,从而,该事件处理模块104可以接收用户通过在该测试装置10输入的调试命令,并通过该物理连接将该调试命令发送至该服务器20从而对该服务器20进行调试,例如,当侦测模块101侦测到一台服务器20的风扇转速过慢时,用户可以在该测试装置10中输入加快风扇转速的调试命令,该事件处理模块104将该调试命令通过IPMB发送至该服务器20的BMC中,该BMC根据该调试命令对该风扇的转速进行调整。
本发明中的监测***在侦测到服务器异常时可以主动通过有线或无线直接将异常发送至测试装置中,该测试装置只需要获取发生了异常的服务器主动发出的异常信息,而不需要通过复用器切换轮询的方式去查询所有服务器是否异常并获取异常信息,因此可以及时高效的对服务器出现的异常进行监测。
图3为本发明一实施方式中监测方法流程图,该监测方法包括如下步骤:
步骤S301:该侦测模块101侦测该服务器20的运行是否出现异常。
步骤S302:该异常报告生成模块102在该侦测模块101侦测到服务器20异常时根据该侦测模块101侦测到的服务器20异常情况生成一异常报告,其中,该异常报告中包括该服务器20对应的唯一标识符和该服务器20的具体异常信息。
步骤S303:该通信模块103将该异常报告生成模块102生成的异常报告发送至该测试装置10中的事件处理模块104。
步骤S304:该事件处理模块104接收该通信模块103发送的异常报告后,将该接收到的异常报告加入该事件处理模块104待处理的事件处理队列中,该事件处理模块104每处理一异常报告时控制该测试装置10中的显示装置将该异常报告显示给用户。
步骤S305:该事件处理模块104还获取该异常报告中该服务器20的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置10与该异常报告中唯一标识符对应的服务器20进行物理连接方式的通信,从而,该事件处理模块104可以接收用户通过在该测试装置10输入的调试命令,并通过该物理连接将该调试命令发送至该服务器20从而对该服务器20进行调试。
尽管对本发明的优选实施方式进行了说明和描述,但是本领域的技术人员将领悟到,可以作出各种不同的变化和改进,这些都不超出本发明的真正范围。因此期望,本发明并不局限于所公开的作为实现本发明所设想的最佳模式的具体实施方式,本发明包括的所有实施方式都有所附权利要求书的保护范围内。

Claims (7)

1.一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符,其特征在于,该监测***包括:
侦测模块,用于侦测服务器是否出现异常;
异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;
通信模块,用于将该异常报告生成模块生成的异常报告主动发送至测试装置;以及
事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。
2.如权利要求1所述的监测***,其特征在于,该测试装置与该服务器除了通过有线或无线网络通信外,还通过智能平台管理总线和复用器与该些服务器进行物理上的连接,当该事件处理模块接收到异常报告后,该事件处理模块还获取该异常报告中该服务器的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置与该异常报告中唯一标识符对应的服务器进行物理连接方式的通信,该事件处理模块还用于接收用户通过在该测试装置输入的调试命令,并通过该物理连接将该调试命令发送至该服务器从而对该服务器进行调试。
3.如权利要求1所述的监测***,其特征在于,该通信模块通过SNMP Trap方式将该异常报告发送至该事件处理模块。
4.如权利要求1所述的监测***,其特征在于,该事件处理模块接收到该异常报告后,首先将该接收到的异常报告加入该事件处理模块待处理的事件处理队列中,该事件处理模块每处理一异常报告时控制该测试装置中的显示装置将该异常报告显示给用户。
5.一种监测方法,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符,其特征在于,该方法包括步骤:
侦测服务器的运行是否出现异常;
当侦测出服务器异常时生成一异常报告,其中,该异常报告中包括该服务器的唯一标识符和该服务器的具体异常信息;
主动发送该异常报告;
将该异常报告显示给用户。
6.如权利要求5所述的监测方法,其特征在于,该测试装置与该服务器除了通过有线或无线网络通信外,还通过智能平台管理总线和复用器与该些服务器进行物理上的连接,当接收到异常报告后,该方法还包括步骤:
获取该异常报告中该服务器的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置与该异常报告中唯一标识符对应的服务器进行物理连接方式的通信;
接收用户通过在该测试装置输入的调试命令,并通过该物理连接将该调试命令发送至该服务器从而对该服务器进行调试。
7.如权利要求5所述的监测方法,其特征在于,该异常报告通过简单网络管理协议陷阱方式进行发送。
CN201210580260.1A 2012-12-27 2012-12-27 监测***及监测方法 Pending CN103905264A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210580260.1A CN103905264A (zh) 2012-12-27 2012-12-27 监测***及监测方法
TW102100804A TW201428487A (zh) 2012-12-27 2013-01-09 監測系統及監測方法
US14/083,459 US20140189103A1 (en) 2012-12-27 2013-11-19 System for monitoring servers and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210580260.1A CN103905264A (zh) 2012-12-27 2012-12-27 监测***及监测方法

Publications (1)

Publication Number Publication Date
CN103905264A true CN103905264A (zh) 2014-07-02

Family

ID=50996421

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210580260.1A Pending CN103905264A (zh) 2012-12-27 2012-12-27 监测***及监测方法

Country Status (3)

Country Link
US (1) US20140189103A1 (zh)
CN (1) CN103905264A (zh)
TW (1) TW201428487A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108809702A (zh) * 2018-05-25 2018-11-13 联想(北京)有限公司 一种设备管理方法及设备管理平台
CN109327324A (zh) * 2017-08-01 2019-02-12 国基电子(上海)有限公司 验证方法、电子装置、管理服务器及计算机可读存储介质
CN109358998A (zh) * 2018-10-10 2019-02-19 郑州云海信息技术有限公司 一种服务器检测方法、装置及***
CN113076210A (zh) * 2021-03-26 2021-07-06 山东英信计算机技术有限公司 服务器故障诊断结果通知方法、***、终端及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105790885A (zh) * 2014-12-23 2016-07-20 中兴通讯股份有限公司 处理异常报文的方法及装置
CN112965891A (zh) * 2021-03-10 2021-06-15 山东英信计算机技术有限公司 一种基于服务器测试风扇性能监控的测试方法及装置
TWI807826B (zh) * 2022-05-13 2023-07-01 神雲科技股份有限公司 自動化資料收集方法與伺服系統

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2355481A1 (en) * 2010-02-08 2011-08-10 Canon Kabushiki Kaisha Management system, monitoring apparatus and method thereof
CN102394918A (zh) * 2011-10-24 2012-03-28 天泽信息产业股份有限公司 一种车辆信息远程管理、服务***及其实现方法
CN102404540A (zh) * 2011-12-26 2012-04-04 深圳市融创天下科技股份有限公司 一种无线网络监控数据的采集播放方法、***和终端设备
US20120221885A1 (en) * 2011-02-24 2012-08-30 Fujitsu Limited Monitoring device, monitoring system and monitoring method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206833B1 (en) * 1999-09-30 2007-04-17 Intel Corporation Platform independent alert detection and management
JP3922375B2 (ja) * 2004-01-30 2007-05-30 インターナショナル・ビジネス・マシーンズ・コーポレーション 異常検出システム及びその方法
JP4442410B2 (ja) * 2004-12-15 2010-03-31 セイコーエプソン株式会社 異常診断システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2355481A1 (en) * 2010-02-08 2011-08-10 Canon Kabushiki Kaisha Management system, monitoring apparatus and method thereof
US20120221885A1 (en) * 2011-02-24 2012-08-30 Fujitsu Limited Monitoring device, monitoring system and monitoring method
CN102394918A (zh) * 2011-10-24 2012-03-28 天泽信息产业股份有限公司 一种车辆信息远程管理、服务***及其实现方法
CN102404540A (zh) * 2011-12-26 2012-04-04 深圳市融创天下科技股份有限公司 一种无线网络监控数据的采集播放方法、***和终端设备

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109327324A (zh) * 2017-08-01 2019-02-12 国基电子(上海)有限公司 验证方法、电子装置、管理服务器及计算机可读存储介质
CN108809702A (zh) * 2018-05-25 2018-11-13 联想(北京)有限公司 一种设备管理方法及设备管理平台
CN108809702B (zh) * 2018-05-25 2021-09-14 联想(北京)有限公司 一种设备管理方法及设备管理平台
CN109358998A (zh) * 2018-10-10 2019-02-19 郑州云海信息技术有限公司 一种服务器检测方法、装置及***
CN113076210A (zh) * 2021-03-26 2021-07-06 山东英信计算机技术有限公司 服务器故障诊断结果通知方法、***、终端及存储介质

Also Published As

Publication number Publication date
US20140189103A1 (en) 2014-07-03
TW201428487A (zh) 2014-07-16

Similar Documents

Publication Publication Date Title
CN103905264A (zh) 监测***及监测方法
CN106603265B (zh) 管理方法、网络装置以及非暂态计算机可读介质
US9916270B2 (en) Virtual intelligent platform management interface (IPMI) satellite controller and method
WO2021027481A1 (zh) 故障处理方法、装置、计算机设备、存储介质及存储***
JP5932146B2 (ja) ピーシーアイエクスプレスのエンドポイントデバイスにアクセスするための方法、コンピューターシステム、および、装置
EP3193475B1 (en) Device managing method, device and device managing controller
CN102870377A (zh) 虚拟端口监控方法和设备
EP3142011A1 (en) Anomaly recovery method for virtual machine in distributed environment
CN103135732B (zh) 服务器机柜***
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
US20140201356A1 (en) Monitoring system of managing cloud-based hosts and monitoring method using for the same
TW201719436A (zh) 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器
CN104699589B (zh) 风扇错误侦测***及方法
CN103136083A (zh) 通用串行总线的测试设备及方法
CN108282355B (zh) 云桌面***中设备巡检装置
CN110691398B (zh) 智能设备的网络交互方法、***、设备及存储介质
CN103136081A (zh) 数据中心服务器稳定性测试装置及测试方法
US20160259384A1 (en) Method of performing power management in rack-mount system
CN103559124A (zh) 故障快速检测方法及装置
CN115858221A (zh) 存储设备的管理方法、装置、存储介质及电子设备
US10422812B2 (en) Diagnostic method, information processing device, and storage medium
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
WO2024113962A1 (zh) 漏液检测线检测方法、***、装置、服务器及电子设备
CN115599617B (zh) 总线检测方法、装置、服务器及电子设备
CN110377450A (zh) 一种硬件异常处理方法、***及相关组件

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140702