CN103905264A - 监测***及监测方法 - Google Patents
监测***及监测方法 Download PDFInfo
- Publication number
- CN103905264A CN103905264A CN201210580260.1A CN201210580260A CN103905264A CN 103905264 A CN103905264 A CN 103905264A CN 201210580260 A CN201210580260 A CN 201210580260A CN 103905264 A CN103905264 A CN 103905264A
- Authority
- CN
- China
- Prior art keywords
- server
- exception reporting
- testing apparatus
- module
- unique identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/065—Generation of reports related to network devices
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/50—Testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Debugging And Monitoring (AREA)
- Small-Scale Networks (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
Abstract
一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符。该监测***包括:侦测模块,用于侦测服务器是否出现异常;异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;通信模块;以及事件处理模块,该通信模块用于将该异常报告生成模块生成的异常报告主动发送至该事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。本发明还提供一种监测方法。本发明中的监测***和监测方法可以及时高效的对服务器出现的异常进行监测。
Description
技术领域
本发明涉及监测***及监测方法。
背景技术
随着云计算技术的发展,包含大量服务器的数据中心变的不可或缺,而这些服务器的稳定性更是成为被关注的焦点。为了监控数据中心每个机柜中服务器的运转状况,现在一般是将放置于一个机柜中的所有服务器通过IPMB(Intelligent Platform Management BUS,智能平台管理总线)和复用器(Multiplexer)连接至一个监测装置中,该监测装置采用轮询的方式向每台服务器中获取关于服务器异常的异常报告。在这种方式下,由于IPMB处理数据能力有限,当服务器返回的信息量比较大时,会导致监测装置获取数据的时间很长,另外服务器只能在监测装置为获得异常情况而轮询到它时才能向监测装置报告异常,采取这种轮询方式效率低。此外,当服务器的连接出现问题时,该监测装置仍然按照原来的轮询方式去与该服务器进行连接,这样也会导致监测效率降低。
发明内容
有鉴于此,有必要提供一种能够提高监测效率的监测***。
一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符。该监测***包括:侦测模块,用于侦测服务器是否出现异常;异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;通信模块;以及事件处理模块,该通信模块用于将该异常报告生成模块生成的异常报告主动发送至该事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。
本发明中的监测***在侦测到服务器异常时可以主动通过有线或无线直接将异常发送至测试装置中,该测试装置只需要获取发生了异常的服务器主动发出的异常信息,而不需要通过复用器切换轮询的方式去查询所有服务器是否异常并获取异常信息,因此可以及时高效的对服务器出现的异常进行监测。
附图说明
图1为本发明一实施方式中监测***的架构示意图。
图2为图1所示的监测***所在的测试装置和服务器物理连接示意图。
图3为本发明一实施方式中监测方法流程图。
主要元件符号说明
监测*** | 100 |
测试装置 | 10 |
服务器 | 20 |
IPMB总线 | 201 |
复用器 | 202 |
侦测模块 | 101 |
异常报告生成模块 | 102 |
通信模块 | 103 |
事件处理模块 | 104 |
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
下面结合附图,对本发明中的监测***及监测方法作进一步的详细描述。
请参阅图1,本发明一较佳实施方式中,该监测***100应用于一由测试装置10和设置于云端数据中心的多台服务器20组成的***中,该测试装置10与该些服务器20通过有线或无线网络进行通信,其中,每台服务器20均对应一唯一的标识符。在本实施方式中,每台服务器20对应的唯一标识符可以是本机的固定IP地址,也可以是由DHPC(Dynamic Host Configuration Protocol,动态主机配置协议)服务器(图未示)为该些服务器20派送的IP地址,该每台服务器20对应的唯一识别码还可以是CPU序列号、内存条序列号等硬件识别码。其中该服务器中包括一BMC(Baseboard Management Controller,主板管理控制器)。
如图2所示,在本实施方式中,该测试装置10与该些服务器20除了通过有线或无线的方式进行网络通信外,还通过IPMB(IntelligentPlatform Management BUS,智能平台管理总线)201和复用器(Multiplexer)202与该些服务器20中的BMC进行物理上的连接,该测试装置10每次只能与一台服务器20通过该物理连接进行通信,该复用器用于切换该测试装置10与该些服务器20中的一台通过该进行通信。
该监测***100包括侦测模块101、异常报告生成模块102、通信模块103以及事件处理模块104。在本实施方式中,该侦测模块101、异常报告生成模块102、通信模块103设置于该服务器20中,该事件处理模块104设置于该测试装置10中。在其他实施方式中,侦测模块101、异常报告生成模块102以及通信模块103存储于一移动存储装置中,如移动硬盘、U盘中,当该移动存储设备连接至服务器20时,该些模块运行于该服务器中对服务器进行监测。
该侦测模块101用于侦测该服务器20的运行是否出现异常。在本实施方式中,该侦测模块101响应用户在设置于测试装置10或服务器20上的输入单元(图未示)上的操作而执行该侦测操作。在其他实施方式中,该侦测模块101还可以响应用户在设置于测试装置10或服务器20上的输入单元上的操作而生成一测试指令,该些服务器20中的BMC能够根据该测试指令对服务器20进行测试。
该异常报告生成模块102用于根据该侦测模块101侦测到的服务器20异常情况生成一异常报告,其中,该异常报告中包括该服务器20对应的唯一标识符和该服务器20的具体异常信息,例如,该具体异常信息可以是风扇转速过快或过慢等信息。在本实施方式中,该侦测模块101用于侦测该服务器20的温度、电压、风扇转速等参数是否异常。
该通信模块103用于将该异常报告生成模块102生成的异常报告主动发送至该测试装置10中的事件处理模块104。在本实施方式中,该通信模块103通过SNMP Trap(Simple Network Management ProtocolTrap,简单网络管理协议陷阱)方式将该异常报告发送至该事件处理模块104,即该通信模块103主动将该异常报告发送至该事件处理模块104,而不是通过等待该事件处理模块104轮询的方式将异常报告发送至该事件处理模块104。
该事件处理模块104接收该通信模块103发送的异常报告后,将该接收到的异常报告加入该事件处理模块104待处理的事件处理列表中,该事件处理模块104在每处理一异常报告时,控制该测试装置10将该异常报告显示在该测试装置10的显示装置(图未示)上而提供给用户,使得用户可以根据该异常报告对出现异常的服务器20进行调试。
在本实施方式中,该事件处理模块104还获取该异常报告中该服务器20的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置10与该异常报告中唯一标识符对应的服务器20进行物理连接方式的通信,从而,该事件处理模块104可以接收用户通过在该测试装置10输入的调试命令,并通过该物理连接将该调试命令发送至该服务器20从而对该服务器20进行调试,例如,当侦测模块101侦测到一台服务器20的风扇转速过慢时,用户可以在该测试装置10中输入加快风扇转速的调试命令,该事件处理模块104将该调试命令通过IPMB发送至该服务器20的BMC中,该BMC根据该调试命令对该风扇的转速进行调整。
本发明中的监测***在侦测到服务器异常时可以主动通过有线或无线直接将异常发送至测试装置中,该测试装置只需要获取发生了异常的服务器主动发出的异常信息,而不需要通过复用器切换轮询的方式去查询所有服务器是否异常并获取异常信息,因此可以及时高效的对服务器出现的异常进行监测。
图3为本发明一实施方式中监测方法流程图,该监测方法包括如下步骤:
步骤S301:该侦测模块101侦测该服务器20的运行是否出现异常。
步骤S302:该异常报告生成模块102在该侦测模块101侦测到服务器20异常时根据该侦测模块101侦测到的服务器20异常情况生成一异常报告,其中,该异常报告中包括该服务器20对应的唯一标识符和该服务器20的具体异常信息。
步骤S303:该通信模块103将该异常报告生成模块102生成的异常报告发送至该测试装置10中的事件处理模块104。
步骤S304:该事件处理模块104接收该通信模块103发送的异常报告后,将该接收到的异常报告加入该事件处理模块104待处理的事件处理队列中,该事件处理模块104每处理一异常报告时控制该测试装置10中的显示装置将该异常报告显示给用户。
步骤S305:该事件处理模块104还获取该异常报告中该服务器20的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置10与该异常报告中唯一标识符对应的服务器20进行物理连接方式的通信,从而,该事件处理模块104可以接收用户通过在该测试装置10输入的调试命令,并通过该物理连接将该调试命令发送至该服务器20从而对该服务器20进行调试。
尽管对本发明的优选实施方式进行了说明和描述,但是本领域的技术人员将领悟到,可以作出各种不同的变化和改进,这些都不超出本发明的真正范围。因此期望,本发明并不局限于所公开的作为实现本发明所设想的最佳模式的具体实施方式,本发明包括的所有实施方式都有所附权利要求书的保护范围内。
Claims (7)
1.一种监测***,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符,其特征在于,该监测***包括:
侦测模块,用于侦测服务器是否出现异常;
异常报告生成模块,用于根据该侦测模块侦测到的服务器的异常生成一异常报告,其中该异常报告中包括该服务器对应的唯一标识符和具体异常信息;
通信模块,用于将该异常报告生成模块生成的异常报告主动发送至测试装置;以及
事件处理模块,该事件处理模块接收该通信模块发送的异常报告后将该异常报告显示给用户。
2.如权利要求1所述的监测***,其特征在于,该测试装置与该服务器除了通过有线或无线网络通信外,还通过智能平台管理总线和复用器与该些服务器进行物理上的连接,当该事件处理模块接收到异常报告后,该事件处理模块还获取该异常报告中该服务器的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置与该异常报告中唯一标识符对应的服务器进行物理连接方式的通信,该事件处理模块还用于接收用户通过在该测试装置输入的调试命令,并通过该物理连接将该调试命令发送至该服务器从而对该服务器进行调试。
3.如权利要求1所述的监测***,其特征在于,该通信模块通过SNMP Trap方式将该异常报告发送至该事件处理模块。
4.如权利要求1所述的监测***,其特征在于,该事件处理模块接收到该异常报告后,首先将该接收到的异常报告加入该事件处理模块待处理的事件处理队列中,该事件处理模块每处理一异常报告时控制该测试装置中的显示装置将该异常报告显示给用户。
5.一种监测方法,应用于由一测试装置及多台服务器组成的***中,该些服务器通过有线或无线网络与该测试装置进行通信,其中,每台服务器均对应一唯一的标识符,其特征在于,该方法包括步骤:
侦测服务器的运行是否出现异常;
当侦测出服务器异常时生成一异常报告,其中,该异常报告中包括该服务器的唯一标识符和该服务器的具体异常信息;
主动发送该异常报告;
将该异常报告显示给用户。
6.如权利要求5所述的监测方法,其特征在于,该测试装置与该服务器除了通过有线或无线网络通信外,还通过智能平台管理总线和复用器与该些服务器进行物理上的连接,当接收到异常报告后,该方法还包括步骤:
获取该异常报告中该服务器的唯一标识符,并根据该唯一标识符控制该复用器切换到将该测试装置与该异常报告中唯一标识符对应的服务器进行物理连接方式的通信;
接收用户通过在该测试装置输入的调试命令,并通过该物理连接将该调试命令发送至该服务器从而对该服务器进行调试。
7.如权利要求5所述的监测方法,其特征在于,该异常报告通过简单网络管理协议陷阱方式进行发送。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210580260.1A CN103905264A (zh) | 2012-12-27 | 2012-12-27 | 监测***及监测方法 |
TW102100804A TW201428487A (zh) | 2012-12-27 | 2013-01-09 | 監測系統及監測方法 |
US14/083,459 US20140189103A1 (en) | 2012-12-27 | 2013-11-19 | System for monitoring servers and method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210580260.1A CN103905264A (zh) | 2012-12-27 | 2012-12-27 | 监测***及监测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103905264A true CN103905264A (zh) | 2014-07-02 |
Family
ID=50996421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210580260.1A Pending CN103905264A (zh) | 2012-12-27 | 2012-12-27 | 监测***及监测方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140189103A1 (zh) |
CN (1) | CN103905264A (zh) |
TW (1) | TW201428487A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108809702A (zh) * | 2018-05-25 | 2018-11-13 | 联想(北京)有限公司 | 一种设备管理方法及设备管理平台 |
CN109327324A (zh) * | 2017-08-01 | 2019-02-12 | 国基电子(上海)有限公司 | 验证方法、电子装置、管理服务器及计算机可读存储介质 |
CN109358998A (zh) * | 2018-10-10 | 2019-02-19 | 郑州云海信息技术有限公司 | 一种服务器检测方法、装置及*** |
CN113076210A (zh) * | 2021-03-26 | 2021-07-06 | 山东英信计算机技术有限公司 | 服务器故障诊断结果通知方法、***、终端及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105790885A (zh) * | 2014-12-23 | 2016-07-20 | 中兴通讯股份有限公司 | 处理异常报文的方法及装置 |
CN112965891A (zh) * | 2021-03-10 | 2021-06-15 | 山东英信计算机技术有限公司 | 一种基于服务器测试风扇性能监控的测试方法及装置 |
TWI807826B (zh) * | 2022-05-13 | 2023-07-01 | 神雲科技股份有限公司 | 自動化資料收集方法與伺服系統 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2355481A1 (en) * | 2010-02-08 | 2011-08-10 | Canon Kabushiki Kaisha | Management system, monitoring apparatus and method thereof |
CN102394918A (zh) * | 2011-10-24 | 2012-03-28 | 天泽信息产业股份有限公司 | 一种车辆信息远程管理、服务***及其实现方法 |
CN102404540A (zh) * | 2011-12-26 | 2012-04-04 | 深圳市融创天下科技股份有限公司 | 一种无线网络监控数据的采集播放方法、***和终端设备 |
US20120221885A1 (en) * | 2011-02-24 | 2012-08-30 | Fujitsu Limited | Monitoring device, monitoring system and monitoring method |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7206833B1 (en) * | 1999-09-30 | 2007-04-17 | Intel Corporation | Platform independent alert detection and management |
JP3922375B2 (ja) * | 2004-01-30 | 2007-05-30 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 異常検出システム及びその方法 |
JP4442410B2 (ja) * | 2004-12-15 | 2010-03-31 | セイコーエプソン株式会社 | 異常診断システム |
-
2012
- 2012-12-27 CN CN201210580260.1A patent/CN103905264A/zh active Pending
-
2013
- 2013-01-09 TW TW102100804A patent/TW201428487A/zh unknown
- 2013-11-19 US US14/083,459 patent/US20140189103A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2355481A1 (en) * | 2010-02-08 | 2011-08-10 | Canon Kabushiki Kaisha | Management system, monitoring apparatus and method thereof |
US20120221885A1 (en) * | 2011-02-24 | 2012-08-30 | Fujitsu Limited | Monitoring device, monitoring system and monitoring method |
CN102394918A (zh) * | 2011-10-24 | 2012-03-28 | 天泽信息产业股份有限公司 | 一种车辆信息远程管理、服务***及其实现方法 |
CN102404540A (zh) * | 2011-12-26 | 2012-04-04 | 深圳市融创天下科技股份有限公司 | 一种无线网络监控数据的采集播放方法、***和终端设备 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109327324A (zh) * | 2017-08-01 | 2019-02-12 | 国基电子(上海)有限公司 | 验证方法、电子装置、管理服务器及计算机可读存储介质 |
CN108809702A (zh) * | 2018-05-25 | 2018-11-13 | 联想(北京)有限公司 | 一种设备管理方法及设备管理平台 |
CN108809702B (zh) * | 2018-05-25 | 2021-09-14 | 联想(北京)有限公司 | 一种设备管理方法及设备管理平台 |
CN109358998A (zh) * | 2018-10-10 | 2019-02-19 | 郑州云海信息技术有限公司 | 一种服务器检测方法、装置及*** |
CN113076210A (zh) * | 2021-03-26 | 2021-07-06 | 山东英信计算机技术有限公司 | 服务器故障诊断结果通知方法、***、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20140189103A1 (en) | 2014-07-03 |
TW201428487A (zh) | 2014-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103905264A (zh) | 监测***及监测方法 | |
CN106603265B (zh) | 管理方法、网络装置以及非暂态计算机可读介质 | |
US9916270B2 (en) | Virtual intelligent platform management interface (IPMI) satellite controller and method | |
WO2021027481A1 (zh) | 故障处理方法、装置、计算机设备、存储介质及存储*** | |
JP5932146B2 (ja) | ピーシーアイエクスプレスのエンドポイントデバイスにアクセスするための方法、コンピューターシステム、および、装置 | |
EP3193475B1 (en) | Device managing method, device and device managing controller | |
CN102870377A (zh) | 虚拟端口监控方法和设备 | |
EP3142011A1 (en) | Anomaly recovery method for virtual machine in distributed environment | |
CN103135732B (zh) | 服务器机柜*** | |
CN106502814B (zh) | 一种记录pcie设备错误信息的方法及装置 | |
US20140201356A1 (en) | Monitoring system of managing cloud-based hosts and monitoring method using for the same | |
TW201719436A (zh) | 使用基板管理控制器偵測通訊匯流排上錯誤的方法以及用於網路系統的偵錯器 | |
CN104699589B (zh) | 风扇错误侦测***及方法 | |
CN103136083A (zh) | 通用串行总线的测试设备及方法 | |
CN108282355B (zh) | 云桌面***中设备巡检装置 | |
CN110691398B (zh) | 智能设备的网络交互方法、***、设备及存储介质 | |
CN103136081A (zh) | 数据中心服务器稳定性测试装置及测试方法 | |
US20160259384A1 (en) | Method of performing power management in rack-mount system | |
CN103559124A (zh) | 故障快速检测方法及装置 | |
CN115858221A (zh) | 存储设备的管理方法、装置、存储介质及电子设备 | |
US10422812B2 (en) | Diagnostic method, information processing device, and storage medium | |
CN113868058A (zh) | 一种外设组件高速互联设备故障检测方法、装置及服务器 | |
WO2024113962A1 (zh) | 漏液检测线检测方法、***、装置、服务器及电子设备 | |
CN115599617B (zh) | 总线检测方法、装置、服务器及电子设备 | |
CN110377450A (zh) | 一种硬件异常处理方法、***及相关组件 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140702 |