JP2016518654A - サーバ制御方法及びサーバ制御装置 - Google Patents

サーバ制御方法及びサーバ制御装置 Download PDF

Info

Publication number
JP2016518654A
JP2016518654A JP2016504451A JP2016504451A JP2016518654A JP 2016518654 A JP2016518654 A JP 2016518654A JP 2016504451 A JP2016504451 A JP 2016504451A JP 2016504451 A JP2016504451 A JP 2016504451A JP 2016518654 A JP2016518654 A JP 2016518654A
Authority
JP
Japan
Prior art keywords
server
cpu
pch
master cpu
normal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016504451A
Other languages
English (en)
Other versions
JP6034990B2 (ja
Inventor
根▲強▼ ▲鄭▼
根▲強▼ ▲鄭▼
▲廸▼▲シュアン▼ ▲張▼
▲廸▼▲シュアン▼ ▲張▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2016518654A publication Critical patent/JP2016518654A/ja
Application granted granted Critical
Publication of JP6034990B2 publication Critical patent/JP6034990B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1417Boot up procedures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4406Loading of operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1441Resetting or repowering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)
  • Stored Programmes (AREA)
  • Multi Processors (AREA)

Abstract

本発明の実施例は、従来技術におけるサーバスタートアップ例外により引き起こされるサービスの中断の問題を解決するため、サーバ及びサーバ制御装置を利用することによって実現される制御方法を提供する。本発明の実施例による制御方法及びサーバ制御装置では、サーバがマスタCPU、マスタCPUに接続されるPCH又はマスタCPUに接続されるPCHに接続されるFlashの例外により異常にスタートすると、マスタCPUが再配置される。ハードパーティショニングをサポートするサーバ上でスタートアップ例外が発生すると、サーバが正常にスタート及び実行し、これにより、サーバの信頼性及び安定性を向上させることが依然として保証できる。従って、サーバ全体のRASが向上する。さらに、システムがFLASHの例外により実行失敗する問題が解決され、元のデュアルBIOS設計方式はもはや利用されなくてもよく、これにより、サーバのFLASHチップコストを低減する。

Description

本発明は、情報技術の分野に関し、特にサーバ制御方法及びサーバ制御装置に関する。
サーバは、ネットワーク環境におけるハイパフォーマンスコンピュータであり、ネットワーク上の他のコンピュータ(クライアント)により送信されたサービスリクエストをリッスンし、対応するサービスを提供可能である。システムアーキテクチャによると、サーバは主として2つのカテゴリ、非x86サーバ及びX86サーバに分けられる。X86サーバはまた、コンプレクス・インストラクションセット・アーキテクチャサーバと呼ばれ、すなわち、一般にはPCサーバと呼ばれる。X86サーバは、PCシステムアーキテクチャに基づくサーバであり、x86インストラクションセットに互換的なIntelプロセッサチップ又は他のプロセッサチップを利用する。
情報技術の更なる進展によって、サーバは、日常のIT(Information Technical、情報技術)アプリケーションにおいてますます重要になっており、サーバが担うサービスの数もまた増加している。サーバの例外又は故障は、通常はカスタマにとって極めて大きな損失をもたらす。従って、それが通常のサーバ又はキーアプリケーションサーバのためのものであるかを問わず、サーバのRAS(Reliability,Availability and Serviceability;信頼性、可用性及び保守性)機能がますます重要になる。
いわゆるRAS、すなわち、いわゆる信頼性、可用性及び保守性は、サーバの重要なインジケータである。サーバが高いRAS機能だけでなく、比較的高いコストパフォーマンス比もまた有することをどのように達成するかは、サーバ開発における主要な焦点である。特にミッドレンジ又はハイエンドサーバについて、完全なRAS機能は、サーバがハイエンドサーバであるか測定するための主要なインジケータである
通常のミッドレンジ若しくはハイエンドX86サーバ又はよりハイエンドミッドレンジコンピュータについて、サーバは通常はハードパーティショニングをサポートすることが必要とされる。いわゆるハードパーティショニングは、1つのサーバを複数の完全に独立したサブサーバに分離することである。これらのサブサーバのそれぞれは、1つの完全なサーバシステムである。これらのサブサーバは、それら自身のBIOS(Basic Input Output System、ベーシック・インプット/アウトプット・システム)及びオペレーティングシステムを有し、それは一般に呼ばれる単一のサーバと同様である。例えば、1つの8ソケットX86サーバは、2つの4ソケットサーバ又は4つの2ソケットサーバにハードパーティショニングされ、ハードパーティショニングによる分離により取得されるサーバは、独立に動作し、独立に電源オンされ、独立に電源オフされ、独立に管理できる。
一般に、X86サーバは、CPU(Central Processing Unit、中央処理ユニット)、PCH(Platform Controller Hub、プラットフォーム・コントローラ・ハブ)、メモリ、ハードディスク及びカードなどの複数のコンポーネントを主として有する。ハードパーティショニング機能をサポートするX86サーバについて、複数のPCHチップが配置される必要がある。一般に、配置される必要があるPCHチップの数は、システムによりサポートされるハードパーティションの数に依存して変わる。図1(a)は1つの8ソケットサーバのシステムフレームワークであり、図1(b)は2つの4ソケットサーバにハードパーティショニングされる1つの8ソケットサーバのシステムフレームワークである。
図1(a)は独立した8Pモードを示す。CPU1に接続されるPCHはマスタPCHであり、他のプロセッサに接続されるPCHはスレーブPCHである。スレーブPCHは2つのワーキングモードを有し、(1)PCHは無効とされ、何れの機能も外部的に提供できない。(2)PCHは、一部の機能が利用可能な状態にあり、例えば、PCH上のUSB又はSATA機能は依然として利用可能であるが、PCHはサーバ全体の管理機能に参加できない。
図1(b)は、パーティションされた8Pモードを示す。上方にある4つのCPU及びPCHが1つの独立したシステムを構成し、下方にある4つのCPU及びPCHが1つの独立したシステムを構成する。2つのシステムの間のQPI(Quick Path Interconnect、クイック・パス・インターコネクト)接続が切断され、2つのシステムの間にはタスクインタラクションはない。
従来技術では、システムのRASは比較的大きな短所を有する。パーティショニングがサーバ上で実行されないとき、CPU1に接続されるマスタPCHが異常である場合(例えば、チップが損傷している)、又はマスタPCHに接続されたFLASHに例外(例えば、チップが損傷しているか、又はFlashが配置されているBIOSが異常に消去されたなど)が発生した場合、サーバ全体は故障状態になる。この場合、サーバ上で実行されるサービスは中断される。
本発明の実施例は、サーバが異常にスタートしたとき、サービスの正常な処理が保証されることを実現するサーバ制御方法及びサーバ制御装置を提供する。
本発明の実施例は、サーバにおける制御装置であって、前記サーバは少なくとも2つの中央処理ユニットCPU及び少なくとも2つのプラットフォーム・コントローラ・ハブPCHを有し、前記PCHのそれぞれは前記CPUの少なくとも1つに接続され、当該制御装置は、
前記CPUのラベルを配置し、前記CPUの1つをマスタCPUとしてマーク付けし、前記サーバが異常にスタートすると、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう構成される配置ユニットであって、前記サーバが異常にスタートすることは、前記マスタCPU、前記マスタCPUに接続されるPCH又は前記マスタCPUに接続される前記PCHに接続されるFlashの例外により生じるベーシック・インプット/アウトプット・システムBIOSのスタートアップ例外を含む、配置ユニットと、
前記サーバが異常にスタートすると、前記サーバが再スタートすることをトリガし、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成される再スタートユニットと、
を有する制御装置を提供する。
任意的な実現方式として、前記配置ユニットは、
前記少なくとも2つのCPUのピンを配置し、前記ピンの値を配置することによって前記マスタCPUとして前記CPUの1つを配置するよう構成されるピン配置ユニットと、
前記サーバのスタートアップ例外に関し、前記再スタートユニットにより送信された情報を受信し、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記ピン配置ユニットをトリガするよう構成される情報受信ユニットと、
を有する。
任意的な実現方式として、前記再スタートユニットは、
前記サーバが所定の時間内に異常にスタートしたか判断するよう構成される判断ユニットと、
前記サーバが異常にスタートしたと前記判断ユニットが判断すると、再スタートするよう前記サーバをトリガし、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成されるトリガユニットと、
を有する。
任意的な実現方式として、前記トリガユニットは、
前記サーバが異常にスタートすると、前記BIOSに予め設定されるレジスタを利用することによって、再スタートするよう前記サーバをトリガするよう構成される第1トリガユニットと、
前記サーバの再スタート処理において、前記サーバを異常にスタートさせる例外情報が存在するか判断し、前記例外情報が存在するとき、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成される第2トリガユニットであって、前記例外情報は、前記BIOSによって前記サーバが再スタートする前に記録されることがトリガされる情報である、第2トリガユニットと、
を有する。
任意的な実現方式として、前記サーバは、ハードパーティショニング機能をサポートするサーバであり、前記サーバにおける前記CPUのピンは、当該制御装置に接続される。
任意的な実現方式として、当該制御装置は、前記サーバのコンプレクス・プログラマブル・ロジカル・デバイスCPLD又はフィールド・プログラマブル・ゲート・アレイFPGAにおいて実現される。
本発明の実施例は更に、サーバ制御方法であって、当該方法はサーバに適用され、前記サーバは、少なくとも2つの中央処理ユニットCPU及び少なくとも2つのプラットフォーム・コントローラ・ハブPCHを有し、前記PCHのそれぞれは前記CPUの少なくとも1つに接続され、当該方法は、
前記CPUのラベルを配置し、前記CPUの1つをマスタCPUとしてマーク付けするステップと、
前記サーバが異常にスタートしたか判断し、前記サーバが異常にスタートした場合、例外情報を記録し、再スタートするよう前記サーバをトリガするステップであって、前記例外情報は、前記マスタCPU、前記マスタCPUに接続されるPCH又は前記マスタCPUに接続される前記PCHに接続されるFlashの例外により生じるベーシック・インプット/アウトプット・システムBIOSのスタートアップ例外を含む、トリガするステップと、
前記サーバの再スタート処理において、前記記録された例外情報に従って正常なCPU又は前記マスタCPUとして正常なPCHに接続されるCPUを配置するステップと、
を有するサーバ制御方法を提供する。
任意的な実現方式として、前記CPUのラベルを配置するステップは、具体的には、前記CPUのピンを配置し、前記マスタCPUとして前記CPUの1つをマーク付けするステップは、前記ピンの値を配置することによって前記マスタCPUとして前記CPUの1つを配置する。
任意的な実現方式として、前記サーバが異常にスタートするか判断するステップは、
タイマを設定するステップであって、前記タイマの時間は前記サーバの監視のタイマ時間未満である、設定するステップと、
前記サーバのスタートアップ処理において、前記監視が前記タイマについて設定された時間内に無効にされない場合、前記サーバが異常にスタートしたと判断するステップと、
を有する。
任意的な実現方式として、当該方法は、コンプレクス・プログラマブル・ロジカル・デバイスCPLD又はフィールド・プログラマブル・ゲート・アレイFPGAによって実現される。
任意的な実現方式として、前記再スタートするよう前記サーバをトリガするステップは、前記CPLD又は前記FPGAに配置された再スタートレジスタを利用することによって、再スタートするよう前記サーバをトリガする。
任意的な実現方式として、前記サーバは、ハードパーティショニング機能をサポートするサーバであり、前記サーバにおける前記CPUのピンは、前記CPLD又は前記FPGAに接続される。
本発明の実施例における制御方法及びサーバ制御装置によると、マスタCPU、マスタCPUに接続されるPCH又はマスタCPUに接続されるPCHに接続されるFlashの例外のため、サーバが異常にスタートすると、CPUのピンが再配置され、サーバのマスタCPUが変更され、BIOSは、新たなマスタPCHに接続されるFlashから命令を取得し、スタートアップ時に当該命令を実行する。スタートアップ例外がハードパーティショニングをサポートするサーバ上で発生すると、サーバは正常にスタート及び実行することが依然として保証でき、これにより、サーバの信頼性及び安定性を向上させることが実現される。従って、サーバ全体のRASが向上する。さらに、Flashの例外のためシステムが実行失敗するという問題が解決され、元のデュアルBIOS設計方式がもはや利用されなくてもよく、これにより、サーバのFlashチップコストを低減する。
本発明の実施例又は従来技術における技術的手段をより明確に説明するため、以下において、実施例又は従来技術を説明するのに必要な添付図面が簡単に紹介される。明らかに、以下の説明における添付図面は本発明の単なるいくつかの実施例を示し、当業者は、創作的な努力なく、これらの添付図面から他の図面を依然として導出してもよい。
図1(a)は、従来技術におけるサーバシステムの概略的な構成図である。 図2(b)は、従来技術における他のサーバシステムの概略的な構成図である。 図2は、本発明の実施例によるサーバ制御装置の概略的な構成図である。 図3は、本発明の実施例による他の特定の実現方式におけるサーバ制御装置の概略的な構成図である。 図4は、本発明の実施例による8ソケットサーバの基本的なハードウェアの概略的な構成図である。 図5は、本発明の実施例によるサーバ制御方法の概略的なフローチャートである。
以下は、本発明の実施例における添付図面を参照して本発明の実施例における技術的方策を明確且つ完全に説明する。明らかに、説明される実施例は、本発明の実施例の全てでなく単に一部である。創作的な努力なく本発明の実施例に基づき当業者により取得される他の全ての実施例は、本発明の保護範囲内に属する。
図2を参照して、図2は、本発明の実施例によるサーバにおける制御装置200の概略的な構成図であり、ここで、サーバは少なくとも2つのCPU及び少なくとも2つのPCHを有し、PCHのそれぞれはCPUの少なくとも1つに接続され、制御装置200は、
CPUのラベルを配置し、CPUの1つをマスタCPUとしてマーク付けし、サーバが異常にスタートすると、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう構成される配置ユニット201であって、サーバが異常にスタートすることは、マスタCPU、マスタCPUに接続されるPCH又はマスタCPUに接続されるPCHに接続されるFlashの例外により生じるBIOSのスタートアップ例外を含む、配置ユニット201と、
サーバが異常にスタートすると、サーバが再スタートすることをトリガし、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう配置ユニット201をトリガするよう構成される再スタートユニット202と、
を有する。
任意的な実現方式として、図3に示されるように、配置ユニット201は、
少なくとも2つのCPUのピンを配置し、ピンの値を配置することによってマスタCPUとしてCPUの1つを配置するよう構成されるピン配置ユニット2011と、
サーバのスタートアップ例外に関し、再スタートユニット202により送信された情報を受信し、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するようピン配置ユニット2011をトリガするよう構成される情報受信ユニット2012と、
を有する。
任意的な実現方式として、再スタートユニット202は、
サーバが所定の時間内に異常にスタートしたか判断するよう構成される判断ユニット2021と、
サーバが異常にスタートしたと判断ユニット2021が判断すると、再スタートするようサーバをトリガし、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう配置ユニット201をトリガするよう構成されるトリガユニット2022と、
を有する。
任意的な実現方式として、トリガユニット2022は、
サーバが異常にスタートすると、BIOSに予め設定されるレジスタを利用することによって、再スタートするようサーバをトリガするよう構成される第1トリガユニット20221と、
サーバの再スタート処理において、サーバを異常にスタートさせる例外情報が存在するか判断し、例外情報が存在するとき、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう配置ユニット201をトリガするよう構成される第2トリガユニット20222であって、例外情報は、BIOSによってサーバが再スタートする前に記録されることがトリガされる情報である、第2トリガユニット20222と、
を有する。
任意的な実現方式として、本発明の本実施例における制御装置は、サーバのCPLD(complex programmable logical device、コンプレクス・プログラマブル・ロジカル・デバイス)又はFPGA(field programmable gate array、フィールド・プログラマブル・ゲート・アレイ)において実現される。
任意的な実現方式として、本発明の本実施例におけるサーバは、ハードパーティショニング機能をサポートするサーバであり、サーバにおけるCPUのピンは、当該制御装置に接続される。サーバにおける制御装置は、SMBUS(System Manage bus、システム・マネージメント・バス)、LPC(Low Pin Count、ロー・ピン・カウント)バスなどを利用することによって、サーバにおいてCPUに接続されてもよい。制御装置は、SMBUSバス又はLPCバスを利用することによって、CPUのピンの配置を実現する。
本発明の本実施例におけるハードパーティショニング機能をサポートするサーバは、1つのサーバの複数の完全に独立したサブサーバへの分離をサポートするサーバを表す。サブサーバは、独立したBIOS、PCH、CPU、オペレーティングシステムなどを有する1つの独立したサーバシステムとしてみなされてもよい。例えば、1つの8ソケットX86サーバは、2つの4ソケットサブサーバ又は4つの2ソケットサブサーバにハードパーティショニングされ、ハードパーティショニングを利用して分離により取得されるサーバは独立に動作し、独立に電源オンされ、独立に電源オフされ、及び独立に管理されることが可能である。8ソケットサーバは8つのCPUを有するサーバを表し、4ソケットサブサーバは4つのCPUを有するサブサーバを表し、2ソケットサブサーバは2つのCPUを有するサブサーバを表す。
1つの8ソケットサーバが2つの4ソケットサブサーバにハードパーティショニングされることは、本発明の実施例によるサーバにおける制御装置の実現方式を更に説明するため、以下において具体例として利用される。本実施例では、制御装置がCPLDにおいて実現されることが、説明のための具体例として利用される。
図4を参照して、図4は、8ソケットサーバの基本的なハードウェアの概略的な構成図である。8ソケットサーバは、ハードパーティショニングをサポートするX86サーバであり、8つのCPU、2つのPCH及びPCHに接続されるFlashを有する。8つのCPUのピンはCPLDに接続され、CPLDは、例えば、マスタCPUとしてCPUを配置するなど、CPUのピンを配置することによってCPUの管理を実現する。8ソケットサーバは複数のPCHを有してもよい。通常の実現方式として、サーバが2つの4ソケットサブサーバにハードパーティショニングされる場合、8ソケットサーバは2つのPCHしか有さず、各PCHは1つのサブサーバの1つのCPUに接続される。図4におけるCPU5はマスタCPUであり、このとき、CPU5に接続されるPCHがマスタPCHであり、CPU1に接続されるPCHがスレーブPCHであると仮定する。スレーブPCHは、一般に2つのワーキングモードを有し、(1)PCHは無効にされ、何れの機能も外部的に提供できない。(2)PCHは、USBなどの一部の機能が利用可能であり、例えば、PCH上のUSB又はSATA機能が利用可能であるが、PCHはサーバ全体の管理機能に参加できない状態にある。
上記の図4に示されるサーバでは、上方にある4つのCPU(CPU5,CPU3,CPU2,CPU4)及びPCHが1つの独立したサブサーバを構成し、下方にある4つのCPU(CPU1,CPU7,CPU6,CPU8)及びPCHが1つの独立したサブサーバを構成する。2つのサブサーバの間のQPI接続は切断され(すなわち、QPIポートが内部レジスタを利用することによって無効にされる)、2つのサブサーバの間のタスクインタラクションはない。
サーバにおけるCPUは、それらのSOCKET_IDピンを利用することによって特定される。各CPUのSOCKET_IDピンは、CPLDの配置ユニット201に接続される必要がある。配置ユニット201は、実際の要求に従って各CPUのSOCKET_IDピン値を配置する。任意的な実現方式として、図4に示されるCPUのピン配置は、SOCKET_ID=0がCPUがプロセッサ1であることを示し、SOCKET_ID=1がプロセッサ2を示し、同様に、SOCKET_ID=7がプロセッサ8を示すことであってもよい。さらに、ピンEX_LEGACY_SKTは、CPUがマスタプロセッサ又は通常のプロセッサであるか区別するのに利用される。CPUが接続されるピンのSOCKET_IDが0である場合、それは、CPUがマスタCPUであることを示し、EX_LEGACY_SKTは1に設定される必要があり、そうでない場合、ピンEX_LEGACY_SKTは0に設定され、CPUが通常のCPUであることを示す。CPLDによりCPUピンの配置を実現するため、CPLDは、SMBUSバス又はLPCバスを利用することによってCPUに接続されてもよい。
図4の上方の並びの最左のCPU5がマスタCPUであり、マスタCPUに接続されるPCHが正常に機能しうるということが、以下の説明のための具体例として利用される。CPLDにおける配置ユニット201は、CPU5のピンを配置し、CPU5のSOCKET_IDを0に設定し、CPU5のEX_LEGACY_SKTを1に設定する。下方の並びの最左のCPU1は通常のプロセッサとして配置され、すなわち、CPU1のSOCKET_IDが4に設定され、CPU1のEX_LEGACY_SKTが0に設定される。マスタCPUに接続されるPCHはマスタPCHである。
図4に示されるサーバが電源オンされた後、サーバにおけるBIOSは、マスタPCHに接続されるFLASHから命令を自動的に取得し、当該命令を実行する。CPLDにおける再スタートユニット202は、マスタCPU、マスタPCH及びマスタPCHに接続されるFLASHが正常であるかモニタリングする。マスタCPU、マスタPCH及びマスタPCHに接続されるFLASHの全てが正常である場合、BIOSプログラムは、実行をスムーズに継続し、システムをOSオペレーティングシステムにガイドする。マスタCPU、マスタPCH又はマスタPCHに接続されるFLASHがBIOSガイダンスの処理において例外に遭遇した場合、再スタートユニット202は、再スタートするようサーバをトリガし、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう配置ユニット201をトリガする。
再スタートユニット202が、マスタCPU、マスタPCH又はマスタPCHに接続されるFLASHが異常であるか判断することは、タイマを設定し、タイマの時間を監視のタイマ時間未満になるよう設定する方式により実現されてもよい。設定されたタイマがタイムアウトになる前に監視が無効にならない場合、サーバが異常にスタートしたと判断される。具体的には、再スタートユニット202における判断ユニット2021は、監視が設定された時間内に無効にされるか判断する。監視が無効又はリセットされない場合、サーバが異常にスタートしたと判断される。従って、サーバが異常であると判断ユニット2021が判断したことに基づき、制御装置におけるトリガユニット2022は、再スタートするようサーバをトリガし、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう配置ユニット201をトリガする。具体的には、CPU1はマスタCPUとして配置され、CPU1のSOCKET_IDは0に設定され、CPU1のEX_LEGACY_SKTは1に設定され、CPU5は通常のプロセッサとして配置され、すなわち、CPU5のSOCKET_IDは4に設定され、CPU5のEX_LEGACY_SKTは0に設定される。
任意的な実現方式として、サーバが異常にスタートしたと判断ユニット2021が判断すると、トリガユニット2022における第1トリガユニット2022は、BIOSによりCPLDに予め設定された再スタートレジスタに基づき、再スタートするようサーバをトリガする。サーバが再スタートする前に、サーバのBIOSは、例えば、E2PROM(Electrically Erasable and Programmable Read−Only Memory、電気的に消去可能なプログラマブル読み出し専用メモリ)のレジスタなどのレジスタに例外情報を書き込む。サーバが再スタートした後、第2トリガユニット2022は、例外情報がE2PROMのレジスタに記録されているか判断し、例外情報が存在する場合、各CPUのSOCKET_ID及びEX_LEGACY_SKTピンを再配置するよう配置ユニット201をトリガする。
サーバの制御装置の上記の実現方式では、CPUのピンが再配置された後、サーバのマスタCPUは変更され、BIOSは、新たなマスタPCHに接続されるFLASHから命令を取得し、スタートアップ時に当該命令を実行する。スタートアップ例外がハードパーティショニングをサポートするサーバ上で実行されると、サーバは正常にスタート及び実行することが依然として保証でき、これにより、サーバの信頼性及び安定性を向上させることが実現される。従って、サーバ全体のRASが向上する。さらに、システムがFLASHの例外により実行失敗するという問題が解決され、元のデュアルBIOS設計方式はもはや利用されなくてもよく、これにより、サーバのFLASHチップコストを低減する。
図5を参照して、図5は、本発明の実施例によるサーバ制御方法の概略的なフローチャートである。当該方法はサーバに適用され、サーバは、少なくとも2つのCPU及び少なくとも2つのPCHを有し、PCHのそれぞれはCPUの少なくとも1つに接続され、当該方法は以下を有する。
ステップ500:CPUのラベルを配置し、CPUの1つをマスタCPUとしてマーク付けする。
ステップ502:サーバが異常にスタートしたか判断し、サーバが異常にスタートした場合、例外情報を記録し、再スタートするようサーバをトリガし、ここで、例外情報は、マスタCPU、マスタCPUに接続されるPCH又はマスタCPUに接続されるPCHに接続されるFlashの例外により生じるBIOSのスタートアップ例外を含む。
ステップ504:サーバの再スタート処理において、記録された例外情報に従って正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置する。
本発明の本実施例によるサーバ制御方法は、サーバにおけるCPLD又はFPGAなどの論理チップにより実現される。本発明の本実施例では、サーバ制御方法がCPLDにより実現されることが、説明のための具体例として利用される。
ステップ500において、CPUのラベルを配置することは、具体的には、CPUのピンを配置し、マスタCPUとしてCPUの1つをマーク付けすることは、ピンの値を配置することによってマスタCPUとしてCPUの1つを配置する。
CPUのピンを配置することは、具体的には、SOCKET_IDの値及びEX_LEGACY_SKTの値を設定することによって実現されてもよく、SOCKET_IDは異なるCPUを特定するのに利用され、EX_LEGACY_SKTは、CPUがマスタCPU又は通常のCPUであるか特定するのに利用される。例えば、図4のサーバにおいて、SOCKET_ID=0は、CPUがプロセッサ1であることを示し、SOCKET_ID=1はプロセッサ2を示し、同様に、SOCKET_ID=7はプロセッサ8を示す。SOCKET_ID 0のCPUがマスタCPUである場合、当該CPUのEX_LEGACY_SKTは1に設定され、他のCPUのEX_LEGACY_SKTの値は0に設定される。
任意的な実現方式として、ステップ502において、サーバが異常にスタートするか判断することは、
タイマを設定し、タイマの時間はサーバの監視のタイマ時間未満であり、
サーバのスタートアップ処理において、監視がタイマについて設定された時間内に無効にされない場合、サーバが異常にスタートしたと判断する、
ことを有する。
ステップ502において、再スタートするようサーバをトリガすることは、CPLDチップに配置された再スタートレジスタを利用することによって、再スタートするようサーバをトリガしてもよい。任意的な実現方式として、再スタートレジスタは、BIOSによりCPLDチップ又はFPGAに配置されてもよい。
ステップ502において、例外情報を記録することは、E2PROMのレジスタなどのレジスタに例外情報を記録することによって実現されてもよい。確かに、例外情報はまた、サーバ上の他の場所に記録されてもよく、例外情報が記録される位置は、本発明の本実施例により限定されない。任意的な実現方式として、例外情報はBIOSにより記録され、例えば、BIOSはE2PROMのレジスタに例外情報を記録する。
従って、ステップ504において、CPLDは、例外情報がE2PROMのレジスタに記録されるか判断し、例外情報が存在する場合、各CPUのSOCKET_IDピン値及びEX_LEGACY_SKTピン値が再配置される。例えば、図4のCPU1はマスタCPUとして配置され、CPU1のSOCKET_IDは0に設定され、CPU1のEX_LEGACY_SKTは1に設定され、CPU5は通常のプロセッサとして配置され、すなわち、CPU5のSOCKET_IDは4に設定され、CPU5のEX_LEGACY_SKTは0に設定される。
任意的な実現方式として、本発明の本実施例のサーバ制御方法におけるサーバは、ハードパーティショニング機能をサポートするサーバであり、サーバにおけるCPUのピンは制御装置に接続される。サーバにおける制御装置は、SMBUSバス、LPCバスなどを利用することによって、サーバにおいてCPUに接続されてもよい。制御装置は、SMBUSバス又はLPCバスを利用することによってCPUのピンの配置を実現する。
上記のサーバ制御方法を利用することによって、ハードパーティショニングをサポートするサーバ上でスタートアップ例外が発生すると、サーバは正常にスタート及び実行することが依然として保証でき、これにより、サーバの信頼性及び安定性を向上させることが実現される。従って、サーバ全体のRASが向上する。さらに、システムがFLASHの例外のため実行失敗する問題が解決され、元のデュアルBIOS設計方式はもはや利用されなくてもよく、これにより、サーバのFLASHチップコストを低減する。
当業者は、本明細書に開示される実施例において説明された具体例に関連して、ユニット及びアルゴリズムステップが電子的なハードウェア、コンピュータソフトウェア又はこれらの組み合わせにより実現されてもよいことを気付くかもしれない。ハードウェアとソフトウェアとの間の互換性を明確に説明するため、上記は機能による各具体例の構成及びステップを全体的に説明した。当該機能がハードウェア又はソフトウェアにより実行されるかどうかは、技術的方策の特定のアプリケーション及び設計制約条件に依存する。当業者は、異なる方法を利用して特定の各アプリケーションについて説明された機能を実現してもよいが、その実現は本発明の範囲を超えるとみなされるべきでない。
便宜上及び簡潔な説明のため、上記のシステム、装置及びユニットの詳細なワーキングプロセスについて、上記の方法の実施例における対応するプロセスが参照されてもよく、詳細はここでは再説明されないことが、当業者により明確に理解されてもよい。
本出願において提供される複数の実施例において、開示されたシステム、装置及び方法は他の方式により実現されてもよいことが理解されるべきである。例えば、説明された装置の実施例は単なる一例である。例えば、ユニットの分割は単なる論理的機能の分割であり、実際の実現形態では他の分割であってもよい。例えば、複数のユニット又はコンポーネントが他のシステムに合成又は統合されてもよいし、又は、いくつかの特徴は無視又は実行されなくてもよい。さらに、表示又は説明された相互結合又は直接的結合又は通信接続は、あるインタフェースを介し実現されてもよい。装置又はユニットの間の間接的な結合又は通信接続は、電子、機械又は他の形式により実現されてもよい。
別々のパーツとして説明されたユニットは物理的に別々のものであってもよいし、又はそうでなくてもよく、ユニットとして表示されたパーツは物理的ユニットであってもよいし、又はそうでなくもよく、1つのポジションに配置されてもよいし、又は複数のネットワークユニット上に分散されてもよい。ユニットの一部又は全ては本発明の実施例の方策の課題を実現するため、実際のニーズに従って選択されてもよい。
さらに、本発明の実施例における機能ユニットは1つの処理ユニットに統合されてもよいし、又はユニットのそれぞれは物理的に単独で存在してもよく、又は2以上のユニットが1つのユニットに統合される。統合されたユニットは、ハードウェアの形式により実現されてもよいし、又はソフトウェア機能ユニットの形式により実現されてもよい。
統合されたユニットがソフトウェア機能ユニットの形式により実現され、独立した製品として販売又は利用されるとき、統合されたユニットはコンピュータ可読記憶媒体に格納されてもよい。このような理解に基づき、実質的に本発明の技術的方策、従来技術に貢献する部分又は技術的方策の全て若しくは一部はソフトウェア製品の形式により実現されてもよい。ソフトウェア製品は、記憶媒体に格納され、本発明の実施例において説明された方法のステップの全て又は一部を実行するようコンピュータ装置(パーソナルコンピュータ、サーバ又はネットワーク装置であってもよい)に指示するための複数の命令を含む。上記の記憶媒体は、USBフラッシュデバイス、着脱可能なハードディスク、読み出し専用メモリ(ROM,Read−Only Memory)、ランダム・アクセス・メモリ(RAM、Random Access Memory)、磁気ディスク又は光ディスクなど、プログラムコードを記憶可能な何れかの媒体を含む。
上記の説明は本発明の単なる特定の実施例であるが、本発明の保護範囲を限定することを意図するものでない。本発明において開示される技術的範囲内で当業者により容易に想到する何れかの修正又は置換は、本発明の保護範囲内に属する。従って、本発明の保護範囲は、請求項の保護範囲に従う。
本発明の実施例又は従来技術における技術的手段をより明確に説明するため、以下において、実施例又は従来技術を説明するのに必要な添付図面が簡単に紹介される。明らかに、以下の説明における添付図面は本発明の単なるいくつかの実施例を示し、当業者は、創作的な努力なく、これらの添付図面から他の図面を依然として導出してもよい。
図1(a)は、従来技術におけるサーバシステムの概略的な構成図である。 (b)は、従来技術における他のサーバシステムの概略的な構成図である。 図2は、本発明の実施例によるサーバ制御装置の概略的な構成図である。 図3は、本発明の実施例による他の特定の実現方式におけるサーバ制御装置の概略的な構成図である。 図4は、本発明の実施例による8ソケットサーバの基本的なハードウェアの概略的な構成図である。 図5は、本発明の実施例によるサーバ制御方法の概略的なフローチャートである。
任意的な実現方式として、サーバが異常にスタートしたと判断ユニット2021が判断すると、トリガユニット2022における第1トリガユニット2022は、BIOSによりCPLDに予め設定された再スタートレジスタに基づき、再スタートするようサーバをトリガする。サーバが再スタートする前に、サーバのBIOSは、例えば、E2PROM(Electrically Erasable and Programmable Read−Only Memory、電気的に消去可能なプログラマブル読み出し専用メモリ)のレジスタなどのレジスタに例外情報を書き込む。サーバが再スタートした後、第2トリガユニット2022は、例外情報がE2PROMのレジスタに記録されているか判断し、例外情報が存在する場合、各CPUのSOCKET_ID及びEX_LEGACY_SKTピンを再配置するよう配置ユニット201をトリガする。

Claims (12)

  1. サーバにおける制御装置であって、前記サーバは少なくとも2つの中央処理ユニットCPU及び少なくとも2つのプラットフォーム・コントローラ・ハブPCHを有し、前記PCHのそれぞれは前記CPUの少なくとも1つに接続され、当該制御装置は、
    前記CPUのラベルを配置し、前記CPUの1つをマスタCPUとしてマーク付けし、前記サーバが異常にスタートすると、正常なCPU又はマスタCPUとして正常なPCHに接続されるCPUを配置するよう構成される配置ユニットであって、前記サーバが異常にスタートすることは、前記マスタCPU、前記マスタCPUに接続されるPCH又は前記マスタCPUに接続される前記PCHに接続されるFlashの例外により生じるベーシック・インプット/アウトプット・システムBIOSのスタートアップ例外を含む、配置ユニットと、
    前記サーバが異常にスタートすると、前記サーバが再スタートすることをトリガし、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成される再スタートユニットと、
    を有する制御装置。
  2. 前記配置ユニットは、
    前記少なくとも2つのCPUのピンを配置し、前記ピンの値を配置することによって前記マスタCPUとして前記CPUの1つを配置するよう構成されるピン配置ユニットと、
    前記サーバのスタートアップ例外に関し、前記再スタートユニットにより送信された情報を受信し、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記ピン配置ユニットをトリガするよう構成される情報受信ユニットと、
    を有する、請求項1記載のサーバにおける制御装置。
  3. 前記再スタートユニットは、
    前記サーバが所定の時間内に異常にスタートしたか判断するよう構成される判断ユニットと、
    前記サーバが異常にスタートしたと前記判断ユニットが判断すると、再スタートするよう前記サーバをトリガし、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成されるトリガユニットと、
    を有する、請求項1又は2記載のサーバにおける制御装置。
  4. 前記トリガユニットは、
    前記サーバが異常にスタートすると、前記BIOSに予め設定されるレジスタを利用することによって、再スタートするよう前記サーバをトリガするよう構成される第1トリガユニットと、
    前記サーバの再スタート処理において、前記サーバを異常にスタートさせる例外情報が存在するか判断し、前記例外情報が存在するとき、前記正常なCPU又は前記マスタCPUとして前記正常なPCHに接続される前記CPUを配置するよう前記配置ユニットをトリガするよう構成される第2トリガユニットであって、前記例外情報は、前記BIOSによって前記サーバが再スタートする前に記録されることがトリガされる情報である、第2トリガユニットと、
    を有する、請求項3記載のサーバにおける制御装置。
  5. 前記サーバは、ハードパーティショニング機能をサポートするサーバであり、
    前記サーバにおける前記CPUのピンは、当該制御装置に接続される、請求項1乃至4何れか一項記載のサーバにおける制御装置。
  6. 当該制御装置は、前記サーバのコンプレクス・プログラマブル・ロジカル・デバイスCPLD又はフィールド・プログラマブル・ゲート・アレイFPGAにおいて実現される、請求項1乃至5何れか一項記載のサーバにおける制御装置。
  7. サーバ制御方法であって、当該方法はサーバに適用され、前記サーバは、少なくとも2つの中央処理ユニットCPU及び少なくとも2つのプラットフォーム・コントローラ・ハブPCHを有し、前記PCHのそれぞれは前記CPUの少なくとも1つに接続され、当該方法は、
    前記CPUのラベルを配置し、前記CPUの1つをマスタCPUとしてマーク付けするステップと、
    前記サーバが異常にスタートしたか判断し、前記サーバが異常にスタートした場合、例外情報を記録し、再スタートするよう前記サーバをトリガするステップであって、前記例外情報は、前記マスタCPU、前記マスタCPUに接続されるPCH又は前記マスタCPUに接続される前記PCHに接続されるFlashの例外により生じるベーシック・インプット/アウトプット・システムBIOSのスタートアップ例外を含む、トリガするステップと、
    前記サーバの再スタート処理において、前記記録された例外情報に従って正常なCPU又は前記マスタCPUとして正常なPCHに接続されるCPUを配置するステップと、
    を有するサーバ制御方法。
  8. 前記CPUのラベルを配置するステップは、具体的には、前記CPUのピンを配置し、
    前記マスタCPUとして前記CPUの1つをマーク付けするステップは、前記ピンの値を配置することによって前記マスタCPUとして前記CPUの1つを配置する、請求項7記載のサーバ制御方法。
  9. 前記サーバが異常にスタートするか判断するステップは、
    タイマを設定するステップであって、前記タイマの時間は前記サーバの監視のタイマ時間未満である、設定するステップと、
    前記サーバのスタートアップ処理において、前記監視が前記タイマについて設定された時間内に無効にされない場合、前記サーバが異常にスタートしたと判断するステップと、
    を有する、請求項7又は8記載のサーバ制御方法。
  10. 当該方法は、コンプレクス・プログラマブル・ロジカル・デバイスCPLD又はフィールド・プログラマブル・ゲート・アレイFPGAによって実現される、請求項7乃至9何れか一項記載のサーバ制御方法。
  11. 前記再スタートするよう前記サーバをトリガするステップは、前記CPLD又は前記FPGAに配置された再スタートレジスタを利用することによって、再スタートするよう前記サーバをトリガする、請求項10記載のサーバ制御方法。
  12. 前記サーバは、ハードパーティショニング機能をサポートするサーバであり、前記サーバにおける前記CPUのピンは、前記CPLD又は前記FPGAに接続される、請求項7乃至11何れか一項記載のサーバ制御方法。
JP2016504451A 2013-09-29 2013-09-29 サーバ制御方法及びサーバ制御装置 Active JP6034990B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2013/084638 WO2015042925A1 (zh) 2013-09-29 2013-09-29 服务器的控制方法和服务器的控制设备

Publications (2)

Publication Number Publication Date
JP2016518654A true JP2016518654A (ja) 2016-06-23
JP6034990B2 JP6034990B2 (ja) 2016-11-30

Family

ID=50455935

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016504451A Active JP6034990B2 (ja) 2013-09-29 2013-09-29 サーバ制御方法及びサーバ制御装置

Country Status (5)

Country Link
US (1) US10241868B2 (ja)
EP (1) EP2942712B1 (ja)
JP (1) JP6034990B2 (ja)
CN (1) CN103733180A (ja)
WO (1) WO2015042925A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106446311B (zh) * 2015-08-10 2019-09-13 杭州华为数字技术有限公司 Cpu告警电路及告警方法
CN105549706B (zh) * 2015-12-11 2018-12-07 华为技术有限公司 一种热重启服务器的方法、装置及***
CN105425918A (zh) * 2015-12-16 2016-03-23 英业达科技有限公司 微型服务器***
CN111488048B (zh) 2016-02-14 2023-05-16 华为技术有限公司 一种电源管理方法以及***
CN105843712B (zh) * 2016-03-31 2020-02-21 联想(北京)有限公司 一种数据传输方法及电子设备
CN107003914B (zh) * 2016-10-31 2020-11-13 华为技术有限公司 启动物理设备的方法和使能装置
CN107273121B (zh) * 2017-06-07 2021-07-16 联想(北京)有限公司 一种智能设备重启的管理方法及装置
CN107578515B (zh) * 2017-09-22 2020-10-27 联想(北京)有限公司 一种电子设备及电子锁的控制方法
US10846160B2 (en) * 2018-01-12 2020-11-24 Quanta Computer Inc. System and method for remote system recovery
CN109600236A (zh) * 2019-01-30 2019-04-09 郑州云海信息技术有限公司 一种服务器按键控制方法、服务器及服务器***
CN110399277B (zh) * 2019-07-19 2023-08-22 广东浪潮大数据研究有限公司 一种基于数码管的主板上电状态显示***及方法
CN113672528B (zh) * 2020-05-15 2024-05-28 佛山市顺德区顺达电脑厂有限公司 可选择开机bios之控制电路
CN111709032A (zh) * 2020-05-28 2020-09-25 苏州浪潮智能科技有限公司 一种在多种分区上实现pfr功能的方法、***、设备及介质
CN112905252A (zh) * 2021-02-20 2021-06-04 山东英信计算机技术有限公司 一种服务器bios启动项顺序的排序方法及介质
CN113468191A (zh) * 2021-06-04 2021-10-01 合肥联宝信息技术有限公司 一种数据更新的方法、装置、电子设备及计算机可读介质
US11334452B1 (en) * 2021-06-08 2022-05-17 International Business Machines Corporation Performing remote part reseat actions

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076216A (ja) * 1998-09-02 2000-03-14 Nec Corp マルチプロセッサシステム及びそのプロセッサ二重化方法並びにその制御プログラムを記録した記録媒体
US20110154106A1 (en) * 2009-12-22 2011-06-23 Brian Kelly Dmi redundancy in multiple processor computer systems
US20120079118A1 (en) * 2010-09-24 2012-03-29 Bailey Abdul M System and method for facilitating wireless communication during a pre-boot phase of a computing device
US20120173922A1 (en) * 2010-12-30 2012-07-05 International Business Machiness Corporation Apparatus and method for handling failed processor of multiprocessor information handling system
JP2013054434A (ja) * 2011-09-01 2013-03-21 Fujitsu Ltd I/o制御装置およびi/o制御方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0616617B2 (ja) * 1987-12-07 1994-03-02 富士通株式会社 初期条件設定方法
US5408647A (en) * 1992-10-02 1995-04-18 Compaq Computer Corporation Automatic logical CPU assignment of physical CPUs
US5748877A (en) * 1995-03-08 1998-05-05 Dell Usa, L.P. Method for executing embedded diagnostics from operating system-based applications
US5790850A (en) * 1996-09-30 1998-08-04 Intel Corporation Fault resilient booting for multiprocessor computer systems
US6601165B2 (en) 1999-03-26 2003-07-29 Hewlett-Packard Company Apparatus and method for implementing fault resilient booting in a multi-processor system by using a flush command to control resetting of the processors and isolating failed processors
US6920581B2 (en) * 2002-01-02 2005-07-19 Intel Corporation Method and apparatus for functional redundancy check mode recovery
US20040221198A1 (en) * 2003-04-17 2004-11-04 Vecoven Frederic Louis Ghislain Gabriel Automatic error diagnosis
JP4715311B2 (ja) * 2005-06-01 2011-07-06 株式会社日立製作所 Smpライセンス情報を有する情報処理装置
JP4665846B2 (ja) * 2006-06-21 2011-04-06 株式会社デンソー マイクロコンピュータ及び電子制御装置
US7886190B2 (en) * 2006-09-29 2011-02-08 Intel Corporation System and method for enabling seamless boot recovery
US8041227B2 (en) * 2006-11-16 2011-10-18 Silicon Laboratories Inc. Apparatus and method for near-field communication
JP5326269B2 (ja) * 2006-12-18 2013-10-30 大日本印刷株式会社 電子部品内蔵配線板、及び電子部品内蔵配線板の放熱方法
US7802042B2 (en) * 2007-12-28 2010-09-21 Intel Corporation Method and system for handling a management interrupt event in a multi-processor computing device
CN101216793A (zh) * 2008-01-18 2008-07-09 华为技术有限公司 一种多处理器***故障恢复的方法及装置
TWI474260B (zh) * 2009-02-16 2015-02-21 Asustek Comp Inc 電腦系統與其主機板上之記憶體電路和開機方法
US20100250822A1 (en) * 2009-03-28 2010-09-30 Hou-Yuan Lin Motherboard with Backup Chipset
US8473717B2 (en) * 2010-02-03 2013-06-25 Arm Limited Coprocessor reset controller with queue for storing configuration information of subsequent sessions prior to completion of current session
US8499141B2 (en) * 2010-08-02 2013-07-30 Intel Corporation Multi-socket server management with RFID
CN102446149A (zh) 2010-10-14 2012-05-09 上海研祥智能科技有限公司 一种能够实现紧凑型pci产品热插拔的处理方法以及***
CN102521209B (zh) 2011-12-12 2015-03-11 浪潮电子信息产业股份有限公司 一种并行多处理器计算机的设计方法
CN102768561B (zh) 2012-05-30 2015-02-04 曙光信息产业股份有限公司 一种双桥片主板冗余的设计方法
CN202838091U (zh) 2012-05-30 2013-03-27 曙光信息产业股份有限公司 一种支持sr5690冗余设计的双桥片主板
CN103019323A (zh) * 2012-12-21 2013-04-03 浪潮电子信息产业股份有限公司 一种基于龙芯处理器的双子星计算机服务器
CN103077060A (zh) * 2013-01-10 2013-05-01 中兴通讯股份有限公司 主备用bios的切换方法及装置、***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076216A (ja) * 1998-09-02 2000-03-14 Nec Corp マルチプロセッサシステム及びそのプロセッサ二重化方法並びにその制御プログラムを記録した記録媒体
US20110154106A1 (en) * 2009-12-22 2011-06-23 Brian Kelly Dmi redundancy in multiple processor computer systems
JP2011134314A (ja) * 2009-12-22 2011-07-07 Intel Corp マルチプロセッサコンピュータシステムでのdmi冗長
US20120079118A1 (en) * 2010-09-24 2012-03-29 Bailey Abdul M System and method for facilitating wireless communication during a pre-boot phase of a computing device
US20120173922A1 (en) * 2010-12-30 2012-07-05 International Business Machiness Corporation Apparatus and method for handling failed processor of multiprocessor information handling system
JP2013054434A (ja) * 2011-09-01 2013-03-21 Fujitsu Ltd I/o制御装置およびi/o制御方法

Also Published As

Publication number Publication date
WO2015042925A1 (zh) 2015-04-02
EP2942712B1 (en) 2018-04-04
EP2942712A1 (en) 2015-11-11
JP6034990B2 (ja) 2016-11-30
EP2942712A4 (en) 2016-10-19
US10241868B2 (en) 2019-03-26
CN103733180A (zh) 2014-04-16
US20150205676A1 (en) 2015-07-23

Similar Documents

Publication Publication Date Title
JP6034990B2 (ja) サーバ制御方法及びサーバ制御装置
TWI584196B (zh) 基本輸入輸出系統回復管理系統、電腦程式產品 以及基本輸入輸出系統回復方法
US9158628B2 (en) Bios failover update with service processor having direct serial peripheral interface (SPI) access
JP6530774B2 (ja) ハードウェア障害回復システム
US9182998B2 (en) Remote bios update in system having multiple computers
US9489274B2 (en) System and method for performing efficient failover and virtual machine (VM) migration in virtual desktop infrastructure (VDI)
US9912535B2 (en) System and method of performing high availability configuration and validation of virtual desktop infrastructure (VDI)
TWI446161B (zh) 處理一多處理器資訊處理系統之一故障處理器的裝置及方法
US9910664B2 (en) System and method of online firmware update for baseboard management controller (BMC) devices
US9448889B2 (en) BIOS failover update with service processor
US20150331694A1 (en) Installation of operating system on host computer using virtual storage of bmc
US9448808B2 (en) BIOS update with service processor without serial peripheral interface (SPI) access
US9529410B2 (en) Service processor (SP) initiated data transaction with BIOS utilizing power off commands
US9529750B2 (en) Service processor (SP) initiated data transaction with bios utilizing interrupt
US10789141B2 (en) Information processing device and information processing method
US11188407B1 (en) Obtaining computer crash analysis data
WO2018120200A1 (zh) 一种服务器管理方法和服务器
JP2018181305A (ja) プールされた物理リソースのローカルディスク消去メカニズム
CN105446833B (zh) 服务器的控制方法和服务器的控制设备
TWI840849B (zh) 計算系統、電腦實施方法及電腦程式產品
TWI715005B (zh) 用於監控基板管理控制器之常駐程序的方法
KR101564144B1 (ko) 펌웨어 관리 장치 및 방법
JP4853620B2 (ja) マルチプロセッサシステムと初期立ち上げ方法およびプログラム
CN116795437A (zh) 计算***、计算机实施方法及计算机程序产品
CN116701280A (zh) 一种服务器内存的管理方法、装置、***、设备及介质

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160928

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161028

R150 Certificate of patent or registration of utility model

Ref document number: 6034990

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250