TWI637611B - 使用wol的系統復原 - Google Patents

使用wol的系統復原 Download PDF

Info

Publication number
TWI637611B
TWI637611B TW106113193A TW106113193A TWI637611B TW I637611 B TWI637611 B TW I637611B TW 106113193 A TW106113193 A TW 106113193A TW 106113193 A TW106113193 A TW 106113193A TW I637611 B TWI637611 B TW I637611B
Authority
TW
Taiwan
Prior art keywords
network
management device
wol
nic
computer
Prior art date
Application number
TW106113193A
Other languages
English (en)
Other versions
TW201828651A (zh
Inventor
黃志嘉
蘇錦龍
顏載益
Original Assignee
廣達電腦股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 廣達電腦股份有限公司 filed Critical 廣達電腦股份有限公司
Publication of TW201828651A publication Critical patent/TW201828651A/zh
Application granted granted Critical
Publication of TWI637611B publication Critical patent/TWI637611B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/24Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using dedicated network management hardware
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4416Network booting; Remote initial program loading [RIPL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • H04L41/0661Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/26Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using dedicated tools for LAN [Local Area Network] management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/86Event-based monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)
  • Small-Scale Networks (AREA)

Abstract

根據網路喚醒(Wake-on-Lan,WoL)訊息及停擺裝置(hang device)的狀態,本發明技術提供用以智能地重置伺服器系統的停擺裝置的系統跟方法。此系統包括一管理裝置、一交換器、耦接一網路的一實體層(physical layer,PHY)、一網路介面(network interface,NIC)、一監測裝置以及一延遲裝置。此實體層耦接網路以接收包含WoL訊息的網路封包。監測裝置被配置以接收來自管理裝置的狀態資訊及WoL訊息,以及根據接收的資訊重置管理裝置。

Description

使用WOL的系統復原
本發明技術是有關於在計算系統中的系統復原。
現今的伺服器群(server farm)或資料中心(datacenter)通常使用(employ)大量伺服器來處理各式應用服務的處理及儲存需求。隨著伺服器數量的增加,這些伺服器上的處理器或控制器有很高的可能性會發生停擺(get a hang)。
然而,當伺服器系統的控制器沒有回應(frozen),對伺服器系統的管理者而言,只有少數選擇以回復(resume)或重置(reset)控制器。管理者必須等待控制器是否可從停擺復原,或者派遣人員去實體地重置(physically reset)控制器或伺服器系統。如此,需要提供解決辦法以智能地重置遠端伺服器系統。
依照本技術的各種示例的系統及方法透過根據網路喚醒(Wake-on-Lan,WoL)訊息及停擺裝置的狀態智能地重置伺服器的停擺裝置(例如管理裝置)提供上述問題的解決辦法。此系統包括一管理裝置(management device)、一交換器(switch)、耦接一網路的一實體層硬體(physical layer hardware,PHY)、一網路介面(network interface,NIC)、一監測裝置(monitoring device)及一延遲電路(delay circuit)。PHY耦接於網路及被配置以接收包含WoL訊息的網路封包。監測裝置被配置以接收管理裝置的狀態資訊及WoL訊息,以及根據接受的資訊重置管理裝置。
在一些實施例中,監測裝置具有一第一輸入接腳以接收管理裝置的狀態資訊,以及一第二輸入接腳以接收一命令訊息(例如WoL訊息)。管理裝置的狀態資訊可直接由管理裝置或由連接管理裝置的一單獨裝置(separate device)被接收。
監測裝置可根據管理裝置的狀態資訊判斷(determine)管理裝置是否沒有回應。在管理裝置沒有回應及WoL訊息被接收的情況下,監測裝置可傳送一重置訊號(reset signal)至管理裝置。在管理裝置不是沒有回應及WoL訊息被接收的情況下,監測裝置屏蔽(shield)管理裝置接受WoL訊息及防止管理裝置被重置。
在一些實施例中,監測裝置經由監測裝置的一輸出接腳及管理裝置的一電源啟動重置(power-on reset)接腳耦接管理裝置。監測裝置可傳送一重置訊號以重置管理裝置。回應於判斷管理裝置在被重置後復原,交換器可從PHY直接傳遞(pass on)網路封包至管理裝置。
在一些實施例中,NIC經由系統的交換器耦接PHY。回應於從交換器接收WoL訊息,NIC可傳遞WoL訊息至延遲電路及監測裝置。延遲電路可以是一LC電路、一RC電路及一 適當的時間延遲電路。延遲電路被配置以在一臨界時間區間內保留WoL訊息,然後傳遞WoL訊息回NIC以重置NIC。
在一些實施例中,監測電路是一單階看門狗電路(single-stage watchdog circuit)或一多階看門狗電路(multistage watchdog circuit)。在一些實施例中,交換器可經由一第一串列十億位元媒體獨立介面(serial gigabit media independent interface,SGMII)與系統的PHY溝通,以及可經由一第二SGMII與系統的NIC溝通。再者,交換器可經由一簡化十億位元媒體獨立介面(reduced gigabit media independent interface,RGMII)與管理裝置溝通。
為了對本發明之上述及其他方面有更佳的瞭解,下文特舉實施例,並配合所附圖式詳細說明如下:
100A、100B‧‧‧系統
101‧‧‧網路
102‧‧‧實體層
104‧‧‧管理裝置
105‧‧‧處理器
106‧‧‧快取記憶體
107‧‧‧交換器
108‧‧‧電源供應單元
109‧‧‧電源供應
110‧‧‧北橋邏輯單元
111‧‧‧匯流排
112‧‧‧南橋邏輯單元
113‧‧‧儲存裝置
114‧‧‧記憶體
115‧‧‧冷卻元件
117‧‧‧NIC
118‧‧‧延遲電路
119‧‧‧監測裝置
120‧‧‧EEPROM
121、122、123、126‧‧‧接腳
124‧‧‧狀態資訊
125‧‧‧重置訊號
150、151‧‧‧ISA插槽
160‧‧‧PCI插槽
161‧‧‧PCI插槽
170‧‧‧PCI插槽
171‧‧‧PCI插槽
200‧‧‧方法
202、204、206、208、210、212、214、216‧‧‧流程步驟
300‧‧‧裝置
315‧‧‧匯流排
361‧‧‧記憶體
362‧‧‧中央處理器
363‧‧‧處理器
368‧‧‧介面
400‧‧‧架構
402‧‧‧匯流排
404‧‧‧記憶體
406‧‧‧唯讀記憶體
408‧‧‧隨機存取記憶體
410‧‧‧控制器
412‧‧‧儲存裝置
414、416、418‧‧‧模組
420‧‧‧輸入裝置
422‧‧‧輸出裝置
424‧‧‧通信介面
426‧‧‧感測器
428‧‧‧快取記憶體
430‧‧‧處理器
432‧‧‧快閃記憶體
434‧‧‧韌體
436‧‧‧顯示器
500‧‧‧系統
502‧‧‧晶片組
504‧‧‧電橋
506‧‧‧使用者介面元件
508‧‧‧通信介面
510‧‧‧處理器
514‧‧‧輸出裝置
516‧‧‧儲存裝置
518‧‧‧RAM
為了描述可以獲得本揭露的上述和其他優點及特徵的方式,將通過參考在附圖中繪示的具體實施例對上述簡要描述的原理進行更具體的描述。應當理解,此處所示的附圖僅描繪了本揭露的示例,因此不應被認為是對其範圍的限制,本揭露的原理通過附圖的使用以進行具有附加特徵和細節的描述和解釋,其中:第1A圖繪示根據本技術的一實施例的示例性服務器系統之示意性方塊圖。
第1B圖繪示依照本技術的一實施例的被配置為智能地重置示例性服務器系統的停擺裝置的示例性系統的示意性方塊圖。
第2圖繪示依照本技術的一實施例的智能地重置系統的管理裝置的示例性方法。
第3圖繪示依照本技術的各種實施例的示例性計算裝置。
第4圖及第5圖繪示依照本技術的各種實施例的示例性系統。
本技術的各種實施例提供根據WoL訊息及停擺裝置的狀態,用以重置伺服器系統的停擺裝置(hang device)(例如管理裝置)的系統及方法。系統包括一管理裝置、一交換器、耦接一網路的一PHY、一NIC、一監測裝置及一延遲電路。PHY耦接網路及被配置以接收包含WoL訊息的網路封包。監測裝置被配置以接收管理裝置的狀態訊息及WoL訊息,以及根據接收到的訊息重置管理裝置。
第1A圖繪示根據本技術的一實施的示例性伺服器系統100A之示意性方塊圖。在本實施例中,伺服器系統100A包含至少一微處理器(microprocessor)或連接快取記憶體106的處理器105、將系統100A耦接到網路101的一實體層硬體(physical layer hardware,PHY)、一個或多個冷卻元件115、一主記憶體(main memory,MEM)114、從電源供應(power supply)109接收AC電源及供應電源至伺服器系統100A的各種元 件的至少一電源供應單元(power supply unit,PSU)108,該些元件例如為處理器105、快取記憶體106、北橋(north bridge,NB)邏輯單元110、PCIe插槽160、記憶體114、南橋(south bridge,SB)邏輯單元112、儲存裝置113、ISA插槽150、PCI插槽170、管理裝置104及使PHY 102耦接至管理裝置104的交換器107。在電源啟動後,伺服器系統100A被配置從記憶體、電腦儲存裝置或一外部儲存裝置載入軟體應用程式(software application)以執行各種操作。儲存裝置113被構造為(is structured into)對於伺服器系統100A的作業系統和應用程式可用的邏輯區塊,且被配置為即使當伺服器系統100A斷電時也保留伺服器資料。
在一些實施例中,一個或多個冷卻元件115可以是空氣冷卻(air-cooled)元件、液體冷卻(liquid-cooled)元件或空氣冷卻及液體冷卻元件的組合。在一些實施例中,一個或多個冷卻元件115包括位於伺服器系統100A前側及/或後側的複數個風扇。
主記憶體114可經由NB邏輯單元110耦接於處理器105。記憶體控制模組(未繪示)可用以在記憶體操作期間透過維持所需的訊號控制記憶體114的操作。主記憶體114可包括但不限於動態隨機存取記憶體(dynamic random access memory,DRAM)、雙資料速率動態隨機存取記憶體(double data rate DRAM,DDR DRAM)、靜態隨機存取記憶體(static RAM,SRAM))或其他類型的合適的記憶體。
在一些實施例中,處理器105可以是複數個多核心處理器(multi-core processor),每一多核心處理器經由連接至NB邏輯單元110的CPU匯流排耦接在一起。在一些實施例中,NB邏輯單元110可以被整合到處理器105中。NB邏輯單元110亦可連接至複數個快捷外部連結標準(peripheral component interconnect express,PCIe)插槽160及SB邏輯單元112(可選的)。該些PCIe插槽160可用做連接及匯流排,例如PCI Express x1、USB 2.0、SMBus、SIM卡、用於另一個PCIe通道的未來擴展、1.5V及3.3V電源,以及伺服器機箱上的診斷LED的導線。
在一些實施例中,NB邏輯單元110及SB邏輯單元112透過外部連結標準(peripheral component interconnect,PCI)匯流排111連接。PCI匯流排111可支持CPU 110上但在獨立於任何CPU原生匯流排的標準化格式中的功能。PCI匯流排111更可連接至複數個PCI插槽160(例如一PCI插槽161)。連接至PCI匯流排111的裝置,可能出現匯流排控制器(未繪示)被直接連接到一CPU匯流排、被分配處理器105位址空間中的位址,以及被同步至一單一匯流排時脈(bus clock)。PCI卡可被用在該些PCI插槽170中,包括但不限於網路介面卡(network interface card,NIC)、音效卡、數據機、電視調解卡(TV tuner card)、磁碟控制器、顯示卡(video card)、小型電腦系統介面(small computer system interface,SCSI)轉接器(adapter)以及個人電腦記憶卡國際協會(personal computer memory card international association,PCMCIA)卡。
SB邏輯單元112可經由擴充匯流排耦接PCI匯流排111至複數個擴充卡(expansion card)或插槽150(例如一ISA插槽151)。擴充匯流排可以是用於SB邏輯單元112及周邊設備之間傳輸的匯流排,並且可以包括但不限於工業標準結構(industry standard architecture,ISA)匯流排、PC/104匯流排、低針腳數(low pin count)匯流排或任何其他可用於周邊設備的資料傳輸的合適的匯流排。
在此實施例中,SB邏輯單元112更耦接連接至少一PSU108的管理裝置104。在一些實施例中,管理裝置104可以是基板管理控制器(baseboard management controller,BMC)、機櫃管理控制器(rack management controller,RMC)或任何其他合適類型的系統控制器。管理裝置104被配置以控制該至少一PSU 108的操作及/或其他適用的操作。在一些實施例中,管理裝置104被配置以監測處理要求以及伺服器系統100A的元件及/或連接狀態。
第1B圖繪示依照本技術的一實施的被配置為智能地重置示例性服務器系統的停擺裝置的示例性系統100B的示意性方塊圖。在此實施例中,系統100B包括PHY 102、交換器107、管理裝置104、NIC 117、EEPROM 120、監測裝置119以及延遲 電路118。PHY 102連接網路101及被配置以從網路101接收網路封包並傳送網路封包至網路101。經由交換器107,PHY 102耦接管理裝置104及NIC 117。
NIC 117可被配置以提供管理通訊的各種介面。舉例而言,NIC 117可提供兩種不同且互斥的匯流排介面,例如系統管理匯流排(system management bus,SMBus)及網路控制器-邊帶介面(network controller-sideband interface,NC-SI)。EEPROM 120可被配置以儲存NIC 117的介面的管理韌體。
監測裝置119經由監測裝置119的一輸出接腳121及管理裝置104的一輸入接腳122耦接管理裝置104。監測裝置119被配置以經由一第一輸入接腳126接收管理裝置104的狀態資訊124,以及經由一第二輸入接腳123由NIC 117接收命命訊息(例如WoL訊息)。回應於判斷管理裝置104沒有回應及WoL訊息被接收,監測裝置119可傳送一重置訊號125重置(reset)或回復(resume)管理裝置104。在判斷管理裝置104在被重置後復原,交換器107可直接由PHY 102傳遞(pass on)網路封包至管理裝置104。
回應於判斷管理裝置104不是沒有回應及WoL訊息被接收,監測裝置119可以屏蔽(shield)管理裝置104接收WoL訊息及防止管理裝置104被重置。在一些實施例中,監測裝置119 可以是一單階看門狗電路(single-stage watchdog circuit)或一多階看門狗電路(multistage watchdog circuit)。
在本實施例中,NIC 117連接延遲電路118。延遲電路118被配置以在一臨界時間區間內保留(withhold)一訊息(例如WoL訊息),然後傳遞此訊息回NIC 117。舉例而言,若此訊息是WoL訊息,延遲電路118可以在此臨界時間區間之後傳遞WoL訊息回NIC 117,以重置NIC 117。
雖然僅部份元件被分別繪示在第1A、1B圖中的示例性系統100A、100B,能處理或儲存資料、接收或傳輸訊號或提供新鮮空氣給下游元件(downstream component)的各種類型的電子或計算元件亦可被包括在示例性系統100A、100B之中。此外,在示例性系統100A、100B中的電子或計算元件可被配置以執行各種類型的應用程式及/或可使用各種類型的作業系統。作業系統可以包括但不限於安卓作業系統(Android)、柏克萊軟體套件(Berkeley Software Distribution,BSD)、iPhone作業系統(iPhone OS,iOS)、Linux、OS X、類Unix即時作業系統(Unix-like Real-time Operating System)(例如QNX)、微軟視窗環境(Microsoft Windows)、Window Phone以及IBM z/OS。
根據示例性系統100A、100B所需的實施方式,可以使用各種網路及訊息協定(protocol),包括但不限於TCP/IP、開放式系統互連(open systems interconnection,OSI)、檔案 傳送協定(file transfer protocol,FTP)、通用型隨插即用協定(universal plug and play,UpnP)、網路檔案系統(network file system,NFS)、網路檔案共享系統(common internet file system,CIFS)、AppleTalk等。如本領域具有通常知識者理解的,繪示於第1A、1B圖中的示例性系統100A、100B是用於解釋的目的。所以,一網路系統可適當地透過各種變化來實施,但仍然根據本技術的各種實施例提供網路平台的配置。
在第1A、1B圖的示例性配置中,示例性系統100A、100B亦可包含一個或多個無線元件,其可操作以與特定無線頻道的計算範圍內的一個或多個電子裝置進行通信(communicate)。此無線頻道可以是用於使裝置能夠無線通信的任何適當的頻道,例如藍芽(Bluetooth)、蜂巢式系統(cellular)、NFC或Wi-Fi頻道。應當理解,如本領域中已知的,此裝置可以具有一個或多個一般的有線通信連接。在各種實施例的範圍內,各種其他元件和/或組合也是可能的。
上述討論意在說明本技術的原理和各種實施例。一旦完全理解上述揭露內容,許多變化和修改將變得顯而易見。
第2圖繪示依照本技術的一實施例的智能地重置系統的管理裝置的一示例性方法200。應當理解,示例性方法200的呈現僅用於說明的目的,以及根據本技術的其他方法,可以包括附加、更少或替代的步驟,這些步驟得以類似或替代的順序執行,或平行執行。在步驟202,示例性方法200以經由網路接收一WoL 訊息開始。如第1A、1B圖所示,WoL訊息可在系統的一PHY被接收。PHY可被配置以傳送網路封包至網路或從網路接收網路封包。舉例而言,PHY可經由系統的交換器傳遞網路封包至NIC及管理裝置。
在步驟204,NIC經由交換器從PHY接收WoL訊息,如第1B圖所示。NIC可被配置以提供資料傳輸的各種介面。在一些實施例中,NIC連接至一監測裝置及一延遲電路。
在步驟206,監測裝置接收管理裝置的狀態資訊,如第1B圖所示。狀態資訊可直接從管理裝置被接收或從監測管理裝置的狀態的一獨立裝置被接收。在步驟208,監測裝置可判斷管理裝置是否沒有回應(frozen)。
在步驟210,回應於判斷管理裝置沒有回應,監測裝置可致使(cause)管理裝置被重置,如第1B圖所示。舉例而言,監測裝置可傳送一重置訊號至管理裝置的一電源啟動重置接腳以重置管理裝置。
在步驟212,延遲電路可在一臨界時間區段(threshold period of time)內保留(withhold)WoL訊息,隨後傳遞WoL訊息回NIC以重置NIC,如第1B圖所示。
在步驟214,PHY經由網路接收網路封包以及傳遞接收的網路封包至交換器。在步驟216,在判斷管理裝置由被重置之後復原,交換器可直接傳遞接收到的網路封包至管理裝置,如第1B圖所示。
術語
電腦網路是多個節點的地理分佈集合,這些節點透過通訊線路(communication link)和區段(segment)互連以在端點之間傳輸資料,例如個人電腦與工作站。許多類型的網路是可以用的,所述類型的範圍從區域網路(local area network,LAN)及廣域網路(wide area network,WAN)到覆蓋與軟體定義的網路(overlay and software-defined networks),例如虛擬可擴張區域網路(virtual extensible local area networks,VXLANs)。
LAN通常透過位於同一普通實體位置(如大樓或校園)的專用私有通訊線路來連接多個節點。另一方面,WAN通常通過長距離通訊線路來連接多個地理上分散的節點(dispersed node),所述通訊線路例如共用載體電話線路(common carrier telephone line)、光纖路徑(optical lightpath)、同步光纖網路(synchronous optical network,SONET)或同步數位體系(synchronous digital hierarchy,SDH)線路。LAN及WAN可以包括第2層(layer 2,L2)及/或第3層(layer 3,L3)網路及裝置。
網際網路(Internet)是連接遍佈世界的分散網路的WAN的一個例子,提供各種網路上的節點之間的全球性通信。節點通常透過根據預定的協定交換離散訊框(frame)或資料封包以經由網路通信,所述協定如傳輸控制協定/網際網路協定 (Transmission Control Protocol/Internet Protocol,TCP/IP)。在這樣的情況下,協定由定義節點如何彼此互動的一組規則組成。電腦網路更可以通過諸如路由器之類的中間網路節點來互連,以擴大每個網路的有效「尺寸(size)」。
覆蓋網路(overlay network)通常允許在一實體網路基礎設施之下創建且進行分層出虛擬網路。覆蓋網路協定,例如虛擬可擴張區域網路(Virtual Extensible LAN,VXLAN)、使用通用路由封裝的網路虛擬化(Network Virtualizat1n using Generic Routing Encapsulat1n,NVGRE)、網路虛擬化覆蓋網路(Network Virtualizat1n Overlays,NVO3)及無狀態式傳輸層隧道(Stateless Transport Tunneling,STT),提供允許網路流量(network traffic)於邏輯隧道(logical tunnel)跨過第2層與第3層網路進行承載的一流量封裝方案(traffic encapsulation scheme)。這樣的邏輯隧道可透過虛擬隧道端點(virtual tunnel end points,VETPs)發起與結束。
此外,覆蓋網路可包括虛擬區段(virtual segment),例如在VXLAN覆蓋網路(VXLAN overlay network)中的VXLAN區段,這些虛擬區段可包括通過虛擬機器(VM)通信的虛擬第2層及/或第3層覆蓋網路。虛擬區段可通過一虛擬網路辨識碼(virtual network identifier,VNI)被辨識,例如VXLAN網路辨識碼,該虛擬網路辨識碼可明確地辨識相關聯的(associated)虛擬區段與網域(domain)。
網路虛擬化允許硬體和軟體資源於一虛擬網路中結合。舉例而言,網路虛擬化可允許多個VM經由各自的虛擬區域網路(virtual LANs,VLAN)連接至實體網路(physical network)。VM可根據各自的VLAN被分組,且可以與在內部或外部網路的其他VM及其他裝置進行通信。
網路區段(network segment),例如實體或虛擬區段、網路、裝置、連接埠(port)、實體或邏輯連接及/或流量,通常可分為一電橋或洪水網域(bridge or flood domain)。電橋網域或洪水網域可代表一廣播網域(broadcast domain),例如一第2層廣播網域。電橋網域或洪水網域可包括一單一子網路,但也可包括多個子網路。更甚的是,電橋網域可與一網路裝置(例如交換器)上的一電橋網域介面有關聯。電橋網域介面可為一支援第2層橋式網路(L2 bridged network)與第3層路由網路(L3 routed network)間通信的邏輯介面。除此之外,電橋網域介面可支援網際網路通訊協定終止(internet protocol(IP)termination)、VPN終止、位址解析處理(address resolution handling)、MAC定址(MAC addressing)等。電橋網域和電橋網域介面都可由一相同的索引(index)或辨識碼(identifier)來辨識。
再者,端點群組(endpoint group,EPG)可用於網路中以映射(mapping)應用程式至網路上。特別的是,EPG可使用網路上一組應用程式端點,將連接及政策(policy)應用 於這組應用程式。EPG可運作為如儲存區(bucket)的容器(container)或應用程式的匯集(collection),或應用程式元件,以及排列(tier)以實現轉發及政策邏輯(policy logic)。EPG亦允許網路政策、安全性及透過替代地使用邏輯應用邊界的定址轉發(forwarding from addressing)的分離(separation)。
雲端計算亦可由一個或多個網路所提供以供應使用共享資源的運算服務。雲端計算通常可包括以網際網路為基礎的計算,在該計算中,源於網路(例如雲端)的可用資源的集合的計算資源動態地被提供且分配至客戶、使用者電腦或其他應需裝置(devices on-demand)。舉例而言,雲端計算資源可包括任何類型的資源,例如計算裝置、儲存裝置、網路裝置與虛擬機器(virtual machines,VM)等。舉例而言,資源可以包括服務裝置(防火牆、深層封包檢測器(deep packet inspector)、流量監測器(traffic monitor)、負載平衡器(load balancer)等)、計算/處理裝置(伺服器、CPU、記憶體、蠻力處理能力(brute force processing capability))、儲存裝置(例如網路連接儲存裝置(network attached storage)、儲存區域網路裝置(storage area network device))等。此外,這些資源可被用以支援區擬網路、虛擬機器(virtual machines,VM)、資料庫、應用程式(applications,Apps)等。
雲端運算資源可包含「私有雲端」、「公共雲端」及/或「混和雲端」。「混和雲端」可為由通過技術互相運作或聯 合的兩個或多個雲端組成的雲端基礎設施。在本質上,混和雲端為私有雲端與公共雲端之間的互動,其中私有雲端加入公共雲端並以安全且可擴展的方法利用公共雲端資源。雲端計算資源亦可通過覆蓋網路,例如VXLAN,中的虛擬網路來供應。
在一網路交換系統中,一查找資料庫可被保留以持續追蹤連接到交換系統的端點之間的通路。然而,端點可具有各種配置且與眾多租戶(tenant)有關。這些端點可具有各種類型的識別碼,例如IPv4、IPv6或Layer-2。查找資料庫必須以不同模式配置以處理不同類型的端點識別碼。查找資料庫的某些容量會分割出來以處理不同位址類型的輸入封包。進一步而言,位於網路交換系統的查找資料庫通常受限於1K虛擬路由與轉發(virtual routing and forwarding)。所以,需要一種改良的查找運算法以處理各種類型的端點識別碼。本揭露技術滿足本領域對電信網路的位址查找的需求。本發明揭露了將端點識別碼映射至一均勻空間並且允許不同形式的查找可被一致的處理以統一各種類型的端點識別碼的系統、方法及電腦可讀取儲存媒體。在此對示例性系統與網路做簡要介紹說明,如第3圖及第4圖所示。如同所闡述的不同實施例,各種變化將被描述於此。以下以第3圖描述本發明技術。
第3圖繪示適合實施本技術的一示例性計算裝置300。計算裝置300包括一主要中央處理器(central processing unit,CPU)362、介面368與一匯流排315(例如PCI匯流排)。 在適當的軟體或韌體的控制下運作時,中央處理器362可回應執行封包管理、錯誤檢測及/或路由功能,舉例來說,例如佈線錯誤檢測功能(miscabling detection function)。CPU 362在軟體的控制下更好地實現這些所有功能,該軟體包括作業系統及任何適當的應用軟體。CPU 362可包括一個或多個處理器363,例如一來自Motorola系列的微處理器或MIPS系列的微處理器的處理器。在另一實施例中,處理器363是用以控制計算裝置300的操作而特別設計的硬體。在一特定實施例中,一記憶體361(例如非揮發性(non-volatile)RAM及/或ROM)亦形成CPU 362的一部分。然而,記憶體可通過許多不同的方法與系統耦接。
介面368通常被提供如介面卡(有時被稱為線卡(line card))。一般而言,它們控制網路上資料封包的傳送與接收,且有時支援與計算裝置300一起使用的其他周邊設備。可提供的介面中有乙太網路介面(Ethernet interface)、訊框中繼介面(frame relay interface)、電纜介面(cable interface)、DSL介面、符記環介面(token ring interface)及相似介面。此外,各種非常高速介面可由例如為快速符記環介面(fast token ring interface)、無線介面、乙太網路介面、十億位元乙太網路介面(Gigabit Ethernet interface)、ATM介面、HSSI介面、POS介面、FDDI介面及相似介面提供。一般而言,這些介面可包含適合與適當媒體通信的連接埠。在某些情況下,它們亦可包含一獨立處理器以及,舉例而言,揮發性RAM。獨立處理器可控制 如封包交換、媒體控制與管理這樣的通信密集任務。藉由為通信密集任務提供個別的處理器,這些介面允許主要微處理器362有效率地執行路由計算、網路診斷與安全功能等。
雖然圖3所示的系統是本技術的一特定計算裝置,惟該裝置並非可實現本發明的唯一網路裝置架構。舉例而言,具有單一處理器以處理通信以及路由計算等的一架構亦常被使用。進一步而言,其他類型的介面與媒體亦可與路由器一起被使用。
無論網路裝置的配置如何,其可採用一個或多個記憶體或記憶體模組(包括記憶體361),該一個或多個記憶體或記憶體模組可被配置以儲存漫遊、路由最佳化與路由功能的通用(general-purpose)網路操作與機制的程式指令。舉例而言,程式指令可控制一作業系統及/或一個或多個應用的操作。該一個或多個記憶體亦可被配置以儲存移動綁定(mobility binding)、註冊與關聯表等表格。
第4圖及第5圖繪示示例系統實施例。本領域具有通常知識者可顯而易見地通過實行本技術而實行更加適當的實施例。本領域具有通常知識者亦可理解其他系統實施例亦可能實現。
第4圖繪示一系統匯流排計算系統架構400,其中該系統的元件藉由匯流排402彼此進行電性溝通。示例系統400包含一處理單元(CPU或處理器)430及一系統匯流排402,匯流排402耦接包括系統記憶體404的各種系統元件至處理器430,系統記憶體404例如為唯讀記憶體(read only memory,ROM)406 及隨機存取記憶體(random access memory,RAM)408。系統400可包含一高速記憶體的快取記憶體(cache),該高速記憶體與處理器430直接連接、靠近或整合為一部分。系統400可由記憶體404及/或儲存裝置412複製資料至快取記憶體428以使處理器430可快速存取。通過此方法,快取記憶體可提供一效能提升以避免處理器430於等待資料時發生延遲。這些與其他模組可控制或被配置以控制處理器430執行各種動作。其他系統記憶體404亦可被使用。記憶體404可包含多種不同類型且具有不同效能特徵的記憶體。處理器430可包含任何通用處理器以及被配置以控制處理器430及一特殊目的處理器的硬體模組或軟體模組,例如儲存於儲存裝置412的模組1 414、模組2 416與模組3 418,其中軟體指令被併入於實際處理器設計中。處理器430可實質上為一完全自足式計算系統(self-contained computing system),其包含多個核心或處理器、一匯流排、記憶體控制器、快取記憶體等。一多核處理器可為對稱或非對稱。
為啟動使用者與計算裝置400的互動,一輸入裝置420可表現任何數量的輸入機制,例如一用於語音的麥克風、一使用於手勢或圖形輸入的觸控螢幕、鍵盤、滑鼠、動態輸入、語音等等。一輸出裝置422亦可為如本領域具有通常知識者所知的一個或多個一數量的輸出機制。在一些實施例中,多模態系統(multimodal system)可致使一使用者以提供多種類型的輸入以與系統400溝通。通信介面424通常可治理與管理使用者輸入與 系統輸出。本發明並未限制操作在任何特定硬體設定中,因此本發明的基本特徵可被輕易的置換於所開發的改善的硬體或韌體配置中。
儲存裝置412是一非揮發性記憶體且可為一硬碟或可儲存由電腦存取的資料的其他類型的電腦可讀取媒體,例如磁式卡帶(magnetic cassette)、快閃記憶卡(flash memory card)、固態記憶體裝置(solid state memory device)、數位多功能影音光碟(digital versatile disk)、盒式磁帶(cartridge)、隨機存取記憶體(random access memories,RAMs)408、唯讀記憶體(read only memory,ROM)406與這些媒體的混和。
儲存裝置412可包含軟體模組414、416、418以控制處理器430。其他硬體或軟體模組皆已考慮在內。儲存裝置412可連接至系統匯流排402。在一方面,執行一特定功能的一硬體模組可包含儲存於一電腦可讀取媒體的軟體元件,該軟體元件與必要硬體元件相連接以發揮功能,該必要硬體元件例如為處理器430、匯流排402、顯示器(display)436等。
控制器410可以是在系統400上的一專門的微控制器或處理器,例如一基板控制器(baseboard management controller,BMC)。在某些情況中,控制器410可以是智慧平台管理介面(Intelligent Platform Management Interface,IPMI)的一部分。此外,在某些情況中,控制器410可以嵌入(embed) 在系統400的主機板或主電路板上。控制器410可管理系統管理軟體及平台硬體之間的介面。控制器410亦可與如下詳述的各式系統裝置及元件(內部及/或外部)溝通,例如控制器或周邊元件。
控制器410可產生對通知、警告及/或事件的特定回應,且與遠端裝置或元件溝通(例如電子郵件訊息、網路訊息等),產生用於自動硬體復原程序的指令或命令等。管理者亦可遠端地與控制器410溝通以初始化或執行特定硬體復原程序或操作,如下進一步敘述。
在系統400上的不同類型的感測器(例如感測器426)可向控制器410報告參數,例如冷卻風扇速度、電源狀態、操作系統(operating system,OS)狀態、硬體狀態等。控制器410亦可包括用於管理及保持由控制器410接收的事件、警告及通知的一系統事件日誌控制器(system event log controller)及/或儲存裝置。舉例而言,控制器410或系統事件日誌管理器可接收來自一個或多個裝置及元件的警告或通知,且保持這些警告或通知在一系統事件日誌儲存元件。
快閃記憶體432可以是一電子非揮發性電腦儲存媒體或晶片,其可被系統400使用作為儲存及/或資料傳輸(data transfer)。快閃記憶體432可被電子抹除及/或重新編程(reprogram)。舉例來說,快閃記憶體432可包括電子抹除式可複寫唯讀記憶體(electrically erasable programmable read-only memory,EEPROM)、ROM、NVRAM或互補式金 屬氧化物半導體(complementary metal-oxide semiconductor,CMOS)。快閃記憶體432可儲存韌體434跟說明韌體434的一組配置,當系統400被初次啟動時,韌體434由系統400執行。快閃記憶體432亦可儲存韌體434使用的配置。
韌體434可包括一基本輸入/輸出系統(Basic Input/Output System)或其接替物(successor)或等效物(equivalent),例如可延伸韌體介面(Extensible Firmware Interface,EFI)或統一可延伸韌體介面(Unified Extensible Firmware Interface,UEFI)。韌體434可以在每次啟動系統400時作為一順序程式(sequence program)被載入和執行。韌體434可基於該組配置識別、初始化、及測試存在系統400中的硬體。韌體434可在系統400上執行自我測試(self-test),例如開機自我檢測(Power-on-Self-Test,POST)。此自我測試可測試各種硬體元件的功能性,硬體元件例如為硬碟驅動裝置(hard disk drive)、光學讀取裝置(optical reading device)、冷卻裝置、記憶體模組、擴充卡(expansion card)等。韌體434可定址且分配在記憶體404、ROM 406、RAM 408及/或儲存裝置412中的區域,以儲存一作業系統(operating system,OS)。韌體434可載入一啟動載入器(boot loader)及/或OS,且向OS提供系統400的控制。
系統400的韌體434可包括一韌體配置,該韌體配置定義韌體434如何控制系統400中的各種硬體元件。韌體配置可 決定系統400中各種硬體元件被啟動的順序。韌體434可提供一介面,例如UEFI,其允許各種不同的參數被設置,這些參數可以不同於韌體預設配置中的參數。舉例而言,使用者(例如管理者)可使用韌體434指定時脈及匯流排速度、定義什麼周邊設備附接至系統400、設置健康監測(例如風扇速度及CPU溫度限制),及/或提供影響系統400整體效能及電力使用的各種其他參數。
儘管韌體434被繪示為儲存在快閃記憶體432中,但是本領域具有通常知識者將容易地理解,韌體434可以儲存在其他記憶體元件中,舉例而言,例如記憶體404或ROM 406。然而,韌體434被繪示為儲存在快閃記憶體432中是作為為了解釋的目的的非限制性實施例。
系統400可包括一個或多個感測器426。舉例而言,一個或多個感測器426可包括一個或多個溫度感測器(temperature sensor)、熱感測器(thermal sensor)、氧氣感測器(oxygen sensor)、化學感測器(chemical sensor)、噪音感測器(noise sensor)、熱傳感器(heat sensor)、電流感測器(current sensor)、電壓檢測器(voltage detector)、氣流感測器(air flow sensor)、紅外線溫度計(infrared thermometer)、熱通量感測器(heat flux sensor)、溫度計(thermometer)、高溫計(pyrometer)等。一個或多個感測器426可經由匯流排402與處理器、快取記憶體428、快閃記憶體432、通訊介面424、記憶體404、ROM 406、RAM 408、控制 器410及儲存裝置412溝通。一個或多個感測器426亦可經由一個或多個不同裝置(mean)與其系統中的元件溝通,上述一個或多個不同裝置例如為內部整合電路(inter-integrated circuit,I2C)、通用型輸出(general purpose output,GPO)等。
第5圖繪示具有用以執行上述方法或操作及產生與顯示圖形化使用者介面(graphical user interface,GUI)的晶片組架構的示例電腦系統500。電腦系統500可包括可用以實現本技術的電腦硬體、軟體與韌體。系統500可包含一處理器510,且代表任何數量的實體的及/或邏輯的不同資源,這些資源可執行軟體、韌體與硬體設定以執行已識別的計算。處理器510可與一晶片組502溝通,該晶片組502可控制處理器510的輸入與輸出。在此實施例中,晶片組502輸出資訊至輸出裝置514,例如一顯示器,並且可讀取與寫入資訊至儲存裝置516,舉例來說,儲存裝置516可包含磁性媒體與固態媒體。晶片組502亦可從RAM 518讀取資料與寫入資料至RAM 518。與各種使用者介面元件506銜接(interfacing with)的一電橋(bridge)504可用以與晶片組502銜接。該使用者介面元件506可包括一鍵盤、一麥克風、觸碰檢測與處理電路、一指標裝置(例如滑鼠)等。一般而言,系統500的輸入可來自任何由機器產生及/或人為產生的各種來源。
晶片組502亦可與一個或多個通信介面508銜接,通信介面508可具有不同的實體介面。這樣的通信介面可包括有線與無線的區域網路、寬頻無線網路以及個人區域網路的介面。本 發明對於產生、顯示與使用GUI方法的某些應用可包含從實體介面接收有序資料集(ordered dataset),或由處理器510分析儲存於儲存裝置516或518的資料而由機器自我產生。進一步而言,該機器可從使用者通過使用者介面元件506接收輸入並且執行適當的功能,例如使用處理器510解譯這些輸入以執行瀏覽功能。
此外,晶片組502亦可與韌體512溝通,韌體512在電腦系統500啟動時可被電腦系統500執行。韌體512可基於一組韌體配置識別、初始化及測試存在電腦系統500中的硬體。韌體512可執行系統500上的一自我測試,例如POST。自我測試可測試各種硬體元件502-518的功能性。韌體512可定址及分配記憶體518中的一個區域以儲存一OS。韌體512可載入一啟動載入器及/或OS,且向OS提供系統400的控制。在某些情況中,韌體512可與硬體元件502-510及514-518溝通。在此,韌體512可經由晶片組502及/或經由一個或多個其他元件與硬體元件502-510及514-518溝通。在某些情況中,韌體512可直接與硬體元件502-510及514-518溝通。
應當理解,示例系統300、400、及500可具有一個以上的處理器(例如363、430、510),或成為通過網路連結在一起的計算裝置群體或叢集的一部分以提供更好的處理能力。
為了能清楚的解釋,在一些實施例中,本技術可以表示為包含獨立功能區塊,這些獨立功能區塊包含具有裝置、裝 置元件、步驟或例行程序於一方法的功能區塊,而該方法可體現於軟體或硬體與軟體的組合。
在一些實施例中,計算機可讀取儲存裝置、媒體及記憶體可包括一電纜或無線訊號,該電纜或無線訊號包含一位元串流(bit stream)等。然而,當提到非暫態電腦可讀取儲存媒體時,非暫態電腦可讀取儲存媒體明確地排除如能量、載波訊號(carrier signal)、電磁波及訊號本身的媒體。
依據上述實施例所提的方法,這些方法可使用儲存於或以其他方式可從電腦可讀取媒體獲得的電腦可執行指令來實現。舉例來說,這些指令可包括導致或以其他方式配置一通用電腦、特殊目的電腦或特殊目的處理器裝置以執行某個功能或一組功能的指令與資料。部分電腦資源的使用可由網路存取。電腦可執行指令可以是,舉例而言,二位元、中間格式指令如組合語言、韌體或原始碼(source code)。在根據所述實施例的方法期間可被用以存取指令、使用資訊及/或創造指令的電腦可讀取媒體的實施例,包含磁片或光碟、快閃記憶體、具有非揮發性記憶體的USB裝置、網路儲存裝置等。
實施根據這些揭露的方法的裝置可包括硬體、韌體及/或軟體,且可採取任何各種形式的形狀因數(form factor)。該形狀因數的一般實施例包括膝上型電腦(laptop)、智慧型手機(smart phones)、小形狀因數個人電腦(small form factor personal computer)、個人數位助理(personal digital assistant)、機架式裝置(rackmount device)、獨立操作裝置(standalone device)等。此處所述的功能亦可體現於周邊設備或附加(add-in)卡。作為另一實施例,該功能亦可實現於執行在一單一裝置中的不同晶片或不同處理間的一電路板上。
指令、用於傳送這樣的指令的媒體、用於執行它們的計算資源,以及用於支持這樣的計算資源的其他結構是用於提供此處描述的功能的手段。
本技術的各方面提供基於一WoL訊息及停擺裝置的狀態智能地重置伺服器系統的停擺裝置的系統跟方法。前述具體實施例已示出選擇性操作如何於不同指令中被採用,而其他實施例可與選擇性操作合併於不同指令中。為了能清楚的解釋,在一些實施例中,本技術可以表示為包含獨立功能區塊,這些獨立功能區塊包含具有裝置、裝置元件、步驟或例行程序於一方法的功能區塊,而該方法可體現於軟體或硬體與軟體的組合。
不同的實施例更可實現於廣泛的操作環境中,其在某些狀況下可包含一個或多個伺服器電腦、使用者電腦或可用於操作任何數量的應用程式的計算裝置。使用者或客戶裝置可包含任何數量的通用個人電腦,例如運行一標準作業系統的桌上型電腦或膝上型電腦,以及運行行動軟體(mobile software)與可支援一數量的網路連結功能與通信協定的蜂巢式系統、無線與手持裝置(cellular,wireless and handheld device)。這樣的系統亦可包括一數量的運行任何各種市售(commercially-available) 作業系統的工作站,以及其他用於如開發與資料庫管理的目的的已知應用。這些裝置亦可包括其他電子裝置,例如簡易型終端機(dummy terminal)、精簡型電腦(thin client)、遊戲系統與其他可通過網路溝通的裝置。
上述實施例的範圍,或部分的內容以硬體實現,而本發明可以下任何技術或技術的組合以實現:一具有邏輯閘以在資料訊號上實現邏輯功能的離散邏輯電路(discrete logic circuit)、一具備適當的組合邏輯閘的特定應用積體電路(application specific integrated circuit,ASIC)、可編成硬體(programmable hardware)如一可編成邏輯閘陣列(programmable gate array,PGA)、一現場可程式邏輯閘陣列(Field Programmable Gate Array,FPGA)等。
大多數的實施例利用至少一本領域具有通常知識者熟悉的網路以支援任何使用各種市售協定的通信,協定例如為TCP/IP、OS1、FTP、UPnP、NFS、CIFS、AppleTalk等。舉例而言,該網路可以是一區域網路、一廣域網路、一虛擬專用網路(virtual private network)、網際網路、一內部網路(intranet)、一外部網路(extranet)、一公用交換電話網路(public switched telephone network)、一紅外線網路(infrared network)、一無線網路與任何上述網路的組合。
根據上述實施例的方法可利用儲存於或以其他方式可從電腦可讀取媒體獲得的電腦可執行指令來實現。舉例而 言,這些指令可包括導致或以其他方式配置一通用電腦、特殊目的電腦或特殊目的處理器裝置以執行某個功能或一組功能的指令與資料。部分電腦資源的使用可由網路存取。電腦可執行指令可以是,舉例而言,二位元、中間格式指令如組合語言、韌體或原始碼(source code)。在根據所述實施例的方法期間可被用以存取指令、使用資訊及/或創造指令的電腦可讀取媒體的實施例,可包括磁片或光碟、快閃記憶體、具有非揮發性記憶體的USB裝置、網路儲存裝置等。
實施根據這些技術的方法的裝置可包括硬體、韌體及/或軟體,且可採取任何各種形式的形狀因數(form factor)。該形狀因數的一般實施例包括伺服器電腦、膝上型電腦、智慧型手機、小形狀因數個人電腦、個人數位助理等。此處所述的功能亦可體現於周邊設備或附加卡。作為另一實施例,該功能亦可實現於執行在一單一裝置中的不同晶片或不同處理間的一電路板上。
在使用網頁伺服器(Web server)的實施例中,網頁伺服器可運行任何各種的伺服器或中間層應用(mid-tier application),包含HTTP伺服器、FTP伺服器、CGI伺服器、資料伺服器、Java伺服器及商用伺服器(business application server)。這些伺服器亦可有能力執行程式或指令碼(script)以回應使用者裝置的要求,例如藉由執行一個或多個網頁應用程式(Web application),該網頁應用程式以一個或多個指令碼或以 任何程式語言所撰寫的程式實現,程式語言例如為Java®、C、C#或C++或任何指令碼語言(scripting language),例如Perl、Python或TCL與其組合。這些伺服器亦可包括資料庫伺服器,包括但不限於可從開放市場購買的那些伺服器。
伺服器系統可包括如上所述的各種資料儲存及其他記憶體與儲存媒體。這些可常駐於各種地點,例如處於一個/多個電腦內部或網路上的任何遠端電腦的儲存媒體上。在一特定實施例的設置中,資訊可常駐在本領域具有通常知識者熟悉的儲存區域網路(storage-area network,SAN)中。相似地,執行屬於電腦、伺服器或其他網路裝置功能的任何必要檔案可適當的儲存在本地或遠端儲存。其中,系統包括電腦化裝置,每一這些裝置可包括由匯流排電性耦接的硬體元件,舉例而言,這些元件包含如至少一中央處理器(central processing unit,CPU)、至少一輸入裝置(例如一滑鼠、鍵盤、控制器、觸控顯示元件或小鍵盤(keypad))與至少一輸出裝置(例如一顯示裝置、印表機或喇叭)。該系統亦可包括一個或多個儲存裝置,例如磁碟機(disk drive)、光學儲存裝置、固態儲存裝置,例如隨機存取記憶體(random access memory,RAM)或唯讀記憶體(read-only memory,ROM),以及可移除媒體裝置(removable media devices)、記憶卡(memory card)、快閃記憶體卡(flash card)等。
上述裝置亦可包括一電腦可讀儲存媒體讀取器(computer-readable storage media reader)、一通信裝置(例如一數據機、一網路卡(無線或有線)、一紅外線計算裝置)以及如前述的工作記憶體(working memory)。電腦可讀儲存媒體讀取器可被連接或配置以接收一電腦可讀取儲存媒體,該電腦可讀取儲存媒體可為遠端、本地、固定及/或可移除儲存裝置以及儲存媒體,而該儲存媒體可用以暫時地及/或更持久地包含、儲存、傳送與取回電腦可讀取資訊。該系統與各種裝置通常亦包含一數量之軟體應用、模組、服務或其他位於至少一工作記憶體裝置中的元件,並包含一作業系統與應用程式,例如用戶端應用程式或網頁瀏覽器。應當理解,上述的各種實施例可以有許多的變化。舉例而言,客制化硬體亦可能被使用及/或特定元件可能以硬體、軟體(包括可攜式軟體(portable software)如小型應用程式(applet))或兩者兼具實現。再者,連接至如網路輸入/輸出裝置的其他計算裝置可被採用(employ)。
用以包含程式碼(code)、部分程式碼的儲存媒體與電腦可讀取媒體可包括任何適合的本領域中已知或使用的媒體,包含儲存媒體與計算媒體,例如但不限於揮發性與非揮發性、可移除與不可移除媒體,這些媒體可由任何方法或技術實現以儲存及/或發送資料,而這些資料例如為電腦可讀取指令、資料結構、程式模組或其他資料,儲存媒體與電腦可讀媒體包括RAM、ROM、EPROM、EEPR0M、快閃記憶體或其他記憶體技術、 CD-ROM、數位多功能影音光碟(digital versatile disk,DVD)或其他光學儲存、磁式卡帶(magnetic cassette)、磁帶、磁碟儲存(magnetic disk storage)、其他磁性儲存裝置或其他任何可儲存所需資料且可被系統裝置存取的媒體。基於本文所提供的技術與教示,本領域具有通常知識者將理解實現本技術的各個方面的其他方式及/或方法。
因此,本發明的說明書與圖式用以說明而並非用以限制本發明的技術。然而,明顯的是,如申請專利範圍所闡述的內容,在不脫離本發明的精神和範圍內,當可針對本發明進行各種更動與潤飾。
綜上所述,雖然本發明已以實施例揭露如上,然其並非用以限定本發明。本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作各種之更動與潤飾。因此,本發明之保護範圍當視後附之申請專利範圍所界定者為準。

Claims (9)

  1. 一種用以重置一系統的一管理裝置的電腦實施方法,包括:在該系統的一網路介面(network interface,NIC)經由該系統的一交換器(switch)接收一網路喚醒(wake-on-lan,WoL)訊息;在該系統的一監測裝置接收該系統的一管理裝置的一狀態資訊;根據該狀態資訊,判斷該管理裝置沒有回應(frozen);以及經由該監測裝置致使該管理裝置被重置;其中在一延遲電路從該NIC接收該WoL訊息且由該延遲電路致使該NIC被重置。
  2. 如申請專利範圍第1項所述之電腦實施方法,更包括:根據該狀態資訊,判斷該管理裝置不是沒有回應;以及屏蔽(shield)該管理裝備接收該WoL訊息,以防止該管理裝置被重置。
  3. 如申請專利範圍第1項所述之電腦實施方法,其中在該系統的該網路介面接收該WoL訊息包括:在該系統的一實體層硬體(physical layer hardware,PHY)經由一網路接收該WoL訊息;以及在該交換器從該PHY接收該WoL訊息。
  4. 如申請專利範圍第3項所述之電腦實施方法,更包括:在該交換器經由該PHY接收一網路封包(network packet);判斷該管理裝置有沒有回應重置後復原;以及致使該網路封包直接由該交換器轉發(forward)至該管理裝置。
  5. 如申請專利範圍第3項所述之電腦實施方法,其中該交換器經由一第一串列十億位元媒體獨立介面(serial gigabit media independent interface,SGMII)與該PHY溝通(communicate)以及經由一第二SGMII與該NIC溝通。
  6. 如申請專利範圍第3項所述之電腦實施方法,其中該交換器經由一簡化十億位元媒體獨立介面(reduced gigabit media independent interface,RGMII)與該管理裝置溝通(communicate)。
  7. 如申請專利範圍第1項所述之電腦實施方法,其中由該延遲電路使該NIC被重置包括:在一臨界時間期間(threshold time period)內,在該延遲電路保留(withhold)該WoL訊息;以及使該WoL訊息在該臨界時間期間結束時被傳遞(pass on)至該NIC。
  8. 如申請專利範圍第1項所述之電腦實施方法,其中該監測裝置包含一單階看門狗電路(single-stage watchdog circuit)或一多階看門狗電路(multistage watchdog circuit)。
  9. 如申請專利範圍第1項所述之電腦實施方法,其中該監測裝置包含一第一輸入接腳以接收該管理裝置的該狀態資訊及一第二輸入接腳以接收該WoL訊息。
TW106113193A 2017-01-19 2017-04-20 使用wol的系統復原 TWI637611B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15/410,177 US10324800B2 (en) 2017-01-19 2017-01-19 System recovery using WoL
US15/410,177 2017-01-19

Publications (2)

Publication Number Publication Date
TW201828651A TW201828651A (zh) 2018-08-01
TWI637611B true TWI637611B (zh) 2018-10-01

Family

ID=59053929

Family Applications (1)

Application Number Title Priority Date Filing Date
TW106113193A TWI637611B (zh) 2017-01-19 2017-04-20 使用wol的系統復原

Country Status (5)

Country Link
US (1) US10324800B2 (zh)
EP (1) EP3352417B1 (zh)
JP (1) JP2018116677A (zh)
CN (1) CN108334421A (zh)
TW (1) TWI637611B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10921870B2 (en) * 2018-09-25 2021-02-16 Quanta Computer Inc. System and method for hybrid power supply
US11394693B2 (en) * 2019-03-04 2022-07-19 Cyxtera Cybersecurity, Inc. Establishing network tunnel in response to access request
US11645104B2 (en) * 2020-12-22 2023-05-09 Reliance Jio Infocomm Usa, Inc. Intelligent data plane acceleration by offloading to distributed smart network interfaces
US20230216607A1 (en) * 2021-12-30 2023-07-06 Microsoft Technology Licensing, Llc Systems and methods to initiate device recovery

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701442B1 (en) * 2000-05-09 2004-03-02 3Com Corporation Power management circuit for selectively applying power to network monitoring circuitry which monitors the receipt of network wake-up messages
US6795450B1 (en) * 2000-09-28 2004-09-21 Tdk Semiconductor Corporation Method and apparatus for supporting physical layer link-suspend operation between network nodes
US20050215274A1 (en) * 2004-03-26 2005-09-29 Broadcom Corporation MAC controlled sleep mode/wake-up mode with staged wake-up for power management
US20150149815A1 (en) * 2013-11-27 2015-05-28 American Megatrends, Inc. Bios failover update with service processor having direct serial peripheral interface (spi) access
TW201612748A (en) * 2014-09-19 2016-04-01 Acer Inc Electronic device and method for operating system waking up thereof

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276260A (ja) 1999-03-24 2000-10-06 Victor Co Of Japan Ltd リモートリセット方式
US20040141461A1 (en) 2003-01-22 2004-07-22 Zimmer Vincent J. Remote reset using a one-time pad
CN1267835C (zh) * 2003-08-15 2006-08-02 英业达股份有限公司 网络计算机平台远程重启方法及***
CN100378617C (zh) * 2003-09-09 2008-04-02 华宇电脑股份有限公司 网络唤醒装置与方法
WO2006047583A2 (en) 2004-10-26 2006-05-04 Wicom Technologies A system for rapid remote management of equipment
US20080104424A1 (en) * 2006-10-31 2008-05-01 International Business Machines Corporation Systems and Methods to Reduce Deployment Security Exposure Using WOL
JP2009253748A (ja) 2008-04-08 2009-10-29 Kyocera Mita Corp 通信端末装置
JP5120664B2 (ja) 2009-07-06 2013-01-16 日本電気株式会社 サーバシステム及びクラッシュダンプ採取方法
JP2011109529A (ja) 2009-11-19 2011-06-02 Hitachi Ltd 監視システム、監視装置及び監視システムの制御方法
EP2337271B1 (en) * 2009-12-21 2013-09-18 Nxp B.V. Network mode switching method and serial data communication network
TW201249046A (en) * 2011-05-31 2012-12-01 Hon Hai Prec Ind Co Ltd Power reset circuit
CN104205755B (zh) * 2012-03-31 2018-07-03 英特尔公司 用于在计算设备的网络触发的唤醒期间延迟分组的方法、设备和***
US8861664B2 (en) * 2012-06-15 2014-10-14 Smsc Holdings S.A.R.L. Communication system and method for synchronizing a plurality of network nodes after a network lock condition occurs
JP2014164507A (ja) 2013-02-25 2014-09-08 Nec Corp 情報処理装置、電源制御装置、電源制御方法及び管理システム
WO2015105480A1 (en) 2014-01-08 2015-07-16 Hewlett Packard Development Company, L.P. Packet inspection to determine destination node
TWI577162B (zh) * 2015-02-11 2017-04-01 宏碁股份有限公司 維持傳輸控制協定連線的方法及電腦系統
US9886568B2 (en) * 2015-03-13 2018-02-06 Dell Products L.P. Systems and methods for secure remote management controller reset
US9883411B2 (en) * 2015-11-24 2018-01-30 Cisco Technology, Inc. External cellular recovery device
JP6279033B2 (ja) 2016-08-24 2018-02-14 キヤノン株式会社 画像形成装置及び画像形成装置の復帰方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701442B1 (en) * 2000-05-09 2004-03-02 3Com Corporation Power management circuit for selectively applying power to network monitoring circuitry which monitors the receipt of network wake-up messages
US6795450B1 (en) * 2000-09-28 2004-09-21 Tdk Semiconductor Corporation Method and apparatus for supporting physical layer link-suspend operation between network nodes
US20050215274A1 (en) * 2004-03-26 2005-09-29 Broadcom Corporation MAC controlled sleep mode/wake-up mode with staged wake-up for power management
US20150149815A1 (en) * 2013-11-27 2015-05-28 American Megatrends, Inc. Bios failover update with service processor having direct serial peripheral interface (spi) access
TW201612748A (en) * 2014-09-19 2016-04-01 Acer Inc Electronic device and method for operating system waking up thereof

Also Published As

Publication number Publication date
TW201828651A (zh) 2018-08-01
EP3352417A1 (en) 2018-07-25
EP3352417B1 (en) 2019-01-30
US20180203768A1 (en) 2018-07-19
US10324800B2 (en) 2019-06-18
JP2018116677A (ja) 2018-07-26
CN108334421A (zh) 2018-07-27

Similar Documents

Publication Publication Date Title
EP3367636B1 (en) System and method for automatically updating bios setup options
TWI612474B (zh) 用於自動更新數據中心中之伺服器系統之元件之韌體的電腦實施方法、系統以及非暫態電腦可讀取媒體
EP3442319B1 (en) Multi-node system-fan-control switch
JP6805116B2 (ja) Psuの待機電源が機能しない場合に動作可能なサーバシステム
EP3242297B1 (en) System with fresh air flow toward downstream components for cooling
EP3410133B1 (en) System and method for voltage regulator self-burn-in test
US10402205B2 (en) System and method for dynamically optimizing hardware frequency for booting
TWI637611B (zh) 使用wol的系統復原