JP5282569B2 - 管理装置、管理システム、管理方法及び管理プログラム - Google Patents

管理装置、管理システム、管理方法及び管理プログラム Download PDF

Info

Publication number
JP5282569B2
JP5282569B2 JP2008500358A JP2008500358A JP5282569B2 JP 5282569 B2 JP5282569 B2 JP 5282569B2 JP 2008500358 A JP2008500358 A JP 2008500358A JP 2008500358 A JP2008500358 A JP 2008500358A JP 5282569 B2 JP5282569 B2 JP 5282569B2
Authority
JP
Japan
Prior art keywords
server
computer
management
power
period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008500358A
Other languages
English (en)
Other versions
JPWO2007094041A1 (ja
Inventor
大輔 佛田
沢男 岩谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2007094041A1 publication Critical patent/JPWO2007094041A1/ja
Application granted granted Critical
Publication of JP5282569B2 publication Critical patent/JP5282569B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)
  • Hardware Redundancy (AREA)

Description

本発明は、複数のサーバを管理するサーバ管理装置及びサーバ管理プログラムに関し、特に、複数のサーバの内、待機中のサーバに対して動作確認を行うためのサーバ管理装置及びサーバ管理プログラムに関する。
サーバを用いたサービスの提供においては、実際にサービスを提供するために稼働しているサーバ(以下稼働サーバという。)に種々の要因による異常が発生した場合、そのサービスが停止してしまうおそれがある。そのような異常発生時に、稼働サーバは異常信号を発信することで待機中のサーバ(以下待機サーバという。)を稼働サーバと置換し、サービスの停止を避ける運用が一般的である
(発明が解決しようとする課題)
従来技術では、予備サーバは常に起動している必要があった。異常発生時に素早いサーバの置換を可能とすることでサービスの停止時間を短縮するためである。
しかし、近年のサーバシステムの大規模化に伴い、稼動サーバ数は増加し、それに伴い待機サーバの数も増加している。すなわち、複数のサービスが存在するシステムにおいては、複数の稼動サーバが存在し、当該稼動サーバに対応する待機サーバが存在することとなる。
したがって、複数の待機サーバは、サービスの提供等を行っていないにも関わらずサーバ自身で電力を消費し、また、サーバを冷却するため電力も消費しており、無駄であった。
一方、消費電力の低減のために待機サーバの電源をオフにしている場合では、稼動サーバに異常が発生した場合に、サーバ置換に多大な時間を要することとなり、サービスの低下となっていた。また、待機サーバの電源をオフにした状態では、待機サーバに異常が発生していても不明であり、稼動サーバの異常発生時にサーバ置換をなしえない問題もあった。
(課題を解決するための手段)
本発明は、サーバが電源断か否かの状態を管理するテーブル、前記テーブルに電源断状態のサーバがある場合に該サーバに対して電源Onを指示する指示手段、前記サーバから電源Onステータス信号を確認した場合に、電源Offを指示する指示手段、として機能させる。
また、電源Offの指示は前記サーバに対して行う。
また、前記テーブルは更に、稼動中のサーバか否かの状態を管理し、電源Offの指示は他のサーバで、稼動中状態ではなく、かつ、電源断状態でもないサーバに対して行う。
また、前記サーバから異常状態のステータス信号を受信した場合は、異常状態の旨を出力する出力手段を更に有する。
また、電源Onの指示は一定時間毎に行う。
(発明の効果)
以上により、電源断状態のサーバに対して電源投入が可能であり、かつ、待機中のサーバの数も保つことが出来るため、消費電力の低減、かつ、システムの安全性の確保をすることが可能となる。
図1は、システム構成図である。 図2は、実施例1におけるサーバ管理DB30のデータ構成図である。 図3は、実施例1における待機サーバ特定のフローチャートである。 図4は、実施例1における待機サーバの移行指示のフローチャートである。 図5は、実施例1におけるサーバの待機サーバ移行処理のフローチャートである。 図6は、実施例1における電源断サーバ特定のフローチャートである。 図7は、実施例1における電源断サーバの移行指示のフローチャートである。 図8は、実施例1におけるサーバの電源断サーバ移行処理のフローチャートである。 図9は、実施例2におけるサーバ管理DB30のデータ構成を示した図である。 図10は、実施例2における確認フラグ36を用いた場合の電源断サーバの確認方式のフローチャートである。 図11は、実施例3におけるサーバ管理DB30のデータ構成を示した図である。 図12は、実施例3による各サーバの電源確認方式のフローチャートである。 図13は、実施例4における時間管理DB40のデータ構成図である。 図14は、実施例4における時間によるサーバ状態遷移のフローチャートである。 図15は、ハードウェア構成図である。
以下、本発明の実施の形態を図面を参照しながら説明する。
図1は、本発明のサーバ管理システムのシステム構成図を示した図である。
サーバ01乃至サーバxxは、サーバ管理システムで管理する対象となるサーバであり、それぞれ、リカバリ機能、故障検知機能を有する。また、各サーバは、電源が落ちている状態であるサーバ(以下、電源断サーバという)、待機中の状態である待機サーバ、稼動中の状態である稼動サーバとする状態を有する。
サーバ01乃至サーバxxは、管理サーバ10からの指示により、電源断サーバ、待機サーバ、稼動サーバとして機能が遷移する。
電源断サーバは、電源Onの受信、ハードウェア確認、ネットワーク接続確認を経て待機サーバの状態となる。
待機サーバは、サービスを実行するためのプログラム、データをコピーされることにより稼動サーバの状態となる。
電源断サーバは、電源Onの受信、ハードウェア確認、ネットワーク接続確認、サービスのためのプログラム、データをコピーという作業を行い稼動サーバの状態となる。
稼動サーバは、待機サーバとして機能するプログラム、データをコピーされることにより待機サーバの状態となる。
稼動サーバおよび待機サーバは、電源断の指示を受信すると電源をOffにし、電源断サーバの状態となる。
待機サーバは、サービスを実行するする情報を有する必要はないが、稼動サーバとしての動作が可能である保証をする必要がある。
電源断サーバは動作保証を得るため、ホコリ混入による故障回避のためなどを理由に定期的に動かすことも必要である。
管理サーバ10は、サーバ01乃至サーバxxを管理するサーバである。
管理クライアント20は、管理者が管理サーバ10を操作したい場合に使用するクライアント端末である。
サーバ管理DB(データベース)30は、サーバ01乃至サーバxxの状態を管理するデータベースである。
時間管理DB40は、稼動させるサーバ台数を予め設定する時間に応じて変化させる場合に使用するデータベースである。
管理サーバ10は、管理クライアント20、サーバ01乃至サーバxx、サーバ管理DB30および時間管理DB(データベース)40とネットワークを介して接続している。
管理サーバ10が各サーバの状態を確認する方法は、管理サーバ10が各サーバに対しステータス取得依頼を指示する方法で可能である。また、各サーバがサーバが有する状態情報を管理サーバ10に出力する方法によっても可能である。状態の確認は、例えば一定時間毎に行う。
ここで、待機サーバと稼動サーバとの切替について簡単に説明する。
管理サーバ10は、管理対象の各サーバ01乃至xxの状態を取得する。稼動サーバの異常状態を検知すると、稼動サーバを待機サーバに変更すると共に待機サーバを稼動サーバとする指示を出力する。この場合、システムを構成する他の機器が、ネットワーク情報に基づき判別した場合に、異常を検出した稼動サーバと稼動サーバに変更する待機サーバとが同じサーバとなるように設定を切り替える。以上の処理を行うことで、サービスの停止期間を最小限にとどめることが出来る。
また、稼動サーバの故障を修正後、稼動サーバとして元に戻すことも可能であるし、稼動サーバと待機サーバは代わったままでも可能である。
(実施例1)
次に、実施例1におけるサーバ管理DB30のデータ構成について説明する。
図2は、実施例1におけるサーバ管理DB30のデータ構成を示した図である。
実施例1におけるサーバ管理DB30は、サーバID31、ステータス32、サービス33、電源断時刻34、動作開始時刻35から構成される。サーバID31は、サーバ01乃至サーバxxに付された識別子である。本実施例におけるシステムでは、サーバの識別子を01から順にxxまで設定してあるものとしている。ステータス32はサーバの状態を記憶したものである。管理サーバ10は定期的、あるいは特定のイベント毎にサーバのステータスを取得しステータス32に記憶する。サービス33は、稼動サーバが行っているサービスの種類を記憶したものである。本実施例は、サービスAとサービスBの2種類のサービスが存在するシステムである。電源断時刻34は、電源断サーバが電源断の状態となった時刻を記憶したものである。動作開始時刻35は、待機サーバとなった時刻を記憶したものである。
以降、管理サーバ10が電源断サーバを待機サーバに状態遷移させる処理、待機サーバを電源断サーバに状態遷移させる処理について説明する。
図3は、待機サーバ特定のフローチャートである。
管理サーバ10は、サーバ管理DB30を参照し、ステータス32が「電源断」であるサーバ31のリストを抽出する(S301)。 次に、S301で抽出したサーバ31のリストに対応する電源断時刻34が最古のデータレコードを選択し、選択したサーバを待機サーバに変更するサーバとして特定する(S302)。
管理サーバ10は、電源断サーバ群の中から待機サーバにする電源断サーバを特定すると、当該電源断サーバを待機サーバにする処理を行う。
図4は、管理サーバ10が、電源断サーバから待機サーバへの移行指示を行った際の処理についてのフローチャートである。
管理サーバ10は、S302で特定したサーバ(特定サーバ)に対して電源Onの指示を送信する(S401)。
管理サーバ10は、特定サーバから起動完了の情報を受信したか否かを判断する(S402)。
特定サーバから起動完了の情報を受信していない場合(S402:No)、予め設定した一定時間経過したか否かを判断する(S403)。一定時間を経過していない場合(S403:No)、引き続き特定サーバからの起動完了情報を待つ。一方、一定時間経過した場合(S403:Yes)、特定サーバのハードの故障、管理サーバ10と特定サーバまでのネットワークの故障の可能性があるため、エラー情報を出力する(S406)。
特定サーバから起動完了の情報を受信した場合(S402:Yes)、管理サーバ10は、特定サーバに対し現在の状態を取得するための情報取得指示を送信する(S404)。
サーバの状態には、正常、警告、エラーおよび無反応の種類があるものとする。正常とは、異常なく起動していることを示す。警告とは、特定サーバ内において何れかのポートが壊れている等、特定サーバの故障箇所を特定サーバ自身で検知できる場合である。エラーとは、ハード的な故障が発生している状態であり、特定サーバの故障箇所を特定サーバ自身で検知できない状態である。また、無反応とは、起動完了を受信したが、ステータスの取得依頼に対しては応答が無い状態であり、ネットワークを介しての通信が確立していない状態である。
管理サーバ10は、特定サーバからの状態を取得(S405)し、状態が「正常」であった場合(S405:Yes)は、電源断サーバから待機サーバへの以降が正常に完了したこととなり、サーバ管理DB30の情報を更新する(S407)。具体的には、サーバ管理DB30の特定サーバに該当するサーバID31のデータレコードを検索し、ステータス32を「電源断」から「待機」に更新し、電源断時刻34の情報を削除し、動作開始時刻35に現在の時刻を記憶する。
一方、状態が「正常」以外の状態であった場合(S405:No)、特定サーバに何らかの問題があるとして、エラー情報の出力を行う(S406)。
次に、特定サーバが行う、電源断サーバから待機サーバへの移行処理について説明する。
図5は、特定サーバの待機サーバ移行処理のフローチャートである。管理サーバ10から起動指示を受信する(S501)と、特定サーバは起動処理を開始する。特定サーバは起動処理を行い(S502)、起動した場合は(S502:Yes)、起動完了情報を管理サーバ10に送信する(S503)。
次に、特定サーバは、管理サーバ10からステータス取得依頼を受信する(S504)と、ステータス情報を返信する(S505)。
なお、この特定サーバが正常に動作したか否かを確認するためには、予め定めた所定時間待つこととしてもよい。例えば、起動直後は動作したが、しばらくすると異常が発生する場合が考えられる。したがって、例えば15分間程度待機させ、当該特定サーバが正常に動作している場合にのみ、正常に動作していると判定することも可能である。この判断は、S405において、管理サーバ10が行うことで可能である。
特定サーバが正常に動作したことを確認すると、管理サーバ10は、現在の待機サーバの内の何れかについて電源を落とす処理を行う。
図6は、電源断サーバ特定のフローチャートである。
管理サーバ10は、サーバ管理DB30を参照し、ステータス32が「待機」であるサーバ31のリストを抽出する(S601)。 次に、S601で抽出したサーバ31のリストに対応する動作開始時刻35が最古のデータレコードを選択し、選択したサーバを待機サーバに変更するサーバとして特定する(S602)。なお、ここで特定されたサーバを第二特定サーバとする。
図7は、管理サーバ10が、第二特定サーバに対し、待機サーバから電源断サーバへの移行指示の処理についてのフローチャートである。
管理サーバ10は、S602で第二特定サーバに対して電源断の指示を送信する(S701)。
管理サーバ10は、第二特定サーバから電源断完了の情報を受信したか否かを判断する(S702)。
第二特定サーバから電源断完了の情報を受信していない場合(S702:No)、予め設定した一定時間経過したか否かを判断する(S703)。一定時間を経過していない場合(S703:No)、引き続き第二特定サーバからの電源断完了情報を待つ。一方、一定時間経過した場合(S703:Yes)、第二特定サーバのハードの故障、管理サーバ10と特定サーバまでのネットワークの故障の可能性があるため、エラー情報を出力する(S704)。
第二特定サーバから電源断完了の情報を受信した場合(S702:Yes)、サーバ管理DB30の情報を更新する(S705)。具体的には、サーバ管理DB30の第二特定サーバに該当するサーバID31のデータレコードを検索し、ステータス32を「待機」から「電源断」に更新し、電源断時刻34に現在の時刻を記憶し、動作開始時刻35の情報を削除する。
次に、第二特定サーバが行う、待機サーバから電源断サーバへの移行処理について説明する。
図8は、第二特定サーバの電源断サーバ移行処理のフローチャートである。管理サーバ10から電源断指示を受信する(S901)と、第二特定サーバは電源断処理を開始する。第二特定サーバは電源断処理を行い(S902)、電源断が完了した場合は(S902:Yes)、電源断完了情報を管理サーバ10に送信する(S903)。
(実施例2)
次に、電源断サーバの動作確認をする別の実施例について説明する。
本実施例は、テーブルを用いて、特定時刻になった場合に、電源断サーバを順次電源Onと電源Offの処理を行うことで、電源断サーバの動作確認を行う方式である。
図9は、実施例2におけるサーバ管理DB30のデータ構成を示した図である。
実施例2のサーバ管理DB30は、サーバID31、ステータス32、確認フラグ36からなる構成となっている。
サーバID31とステータス32は、実施例1と同内容であるので、説明を省略する。
確認フラグ36は、ステータス32が電源断の状態であるサーバに対して付される情報である。電源断サーバに対して、初期値として「0」が付されており、電源Onの確認が行われた場合には「1」が付さる。
図10は、確認フラグ36を用いた場合の電源断サーバの確認方式のフローチャートである。
管理サーバ10は、予め設定した時間に毎に本フローチャートを実行する。
管理サーバ10はサーバ管理DB30の確認フラグ36を初期化する(s1001)。この初期化は、サーバID31に対応するステータス32に基づき、ステータス32が「稼動」又は「待機」の状態である場合には、動作チェック対象から外すべく確認フラグ36には値を入力せず、一方、ステータス32が「電源断」の状態である場合は、フラグの初期値として「0」を設定する。
管理サーバ10は、確認フラグ36で設定された全てのフラグが「0」以外になるまで、(s1002:Yes)、S1003以降の処理を行う(S1002:No)。
管理サーバ10は、確認フラグ36が「0」であるサーバID31に対して以下の処理を行う。
管理サーバ10は、サーバID31に対応する電源断サーバに電源Onの指示を発行する(s1003)。
電源Onの処理は実施例1の図4と同様の処理を行う。なお、図4の特定サーバは、本実施例では、s1003の電源断サーバを意味する。ただし、S407におけるサーバDBの更新にあっては、確認フラグ36を「1」に設定する処理を行い、S406におけるエラー情報の送信にあっては、確認フラグ36を「0」、「1」以外の値に設定する処理を行う。
エラーが発生した場合(s1004:Yes)管理サーバ10は、対象となる次のサーバを抽出する。
一方、エラーが発生しなかった合(s1004:No)、すなわち電源Onの確認が出来たサーバに対しては、電源断の処理を行う(s1005)。電源断の処理は実施例1における図7と同様の処理によって可能である。なお、図7における特定したサーバは、電源Onを確認したサーバとなる。
電源断を確認した場合には、確認フラグ36が「0」である次のサーバについて同様の処理を行う。
上記処理により、全ての確認フラグ36が「0」以外になった場合に今回の動作確認は終了となる。
上記処理により、一定期間毎の動作チェック時にサーバの電源を同時に起動させることなく、また、各サーバの動作状況を正確に把握可能となる。
(実施例3)
次に、電源断サーバの動作確認をする別の実施例について説明する。
例えば、管理サーバ10によるサーバの動作確認処理が独立した処理として動作するシステムにおいては、管理サーバ10のアクセスがあってから対象のサーバについて電源Onの指示がなされたとしても、当該サーバは起動のための時間を必要とする。その結果、管理サーバ10の動作確認の待ち時間に間に合わない不具合が生じる。このようなシステムの場合には、各電源断サーバの電源を管理サーバ10による動作確認処理の直前に電源をOnとし、管理サーバ10による動作確認後に電源をOffとすれば上記の問題を解決することができる。
本実施例においても、サーバ管理DB30の構成を変更する。
図11は、実施例3におけるサーバ管理DB30のデータ構成を示した図である。
実施例3のサーバ管理DB30は、サーバID31、ステータス32、起動フラグ37、起動時間38からなる構成となっている。
サーバID31とステータス32は、実施例1と同内容であるので、説明を省略する。
起動フラグ37は、電源断の状態のサーバに対して、電源Onの指示を行うか否かを示す情報であり、「0」の場合は、サーバ管理DB30のステータス32が電源断の状態で、かつ、管理サーバ10が電源Onの指示も与えていない状態を示し、「1」の場合は、サーバ管理DB30のステータス32が電源断の状態で、かつ管理サーバ10が電源Onの指示を与えている状態、すなわちサーバが起動中である状態を示す。起動が完了した場合には「2」とする。また、その他の値は、故障中、あるいは、稼動中、待機中等の状態を示す。
起動時間38は、サーバID31に対応する各サーバのそれぞれについて、電源断から正常に起動が完了するまでに要する時間を予め記憶した値である。
管理サーバ10は、動作確認を行う時刻を予め入手する。
また、管理サーバ10は、起動フラグ37の値について、ステータス32が「電源断」のサーバについて「0」と設定し、他の状態のサーバについては「0」以外の値を設定する。
以降の処理は管理サーバ10が行う処理であり、管理サーバ10による各サーバに対しての動作確認処理前に繰り返し行われる処理である。
図12は、実施例3による各サーバの電源確認方式のフローチャートである。
管理サーバ10は、現在時刻を取得する(s1201)。
管理サーバ10は、動作確認時刻と現在時刻との差分から、動作確認時間までの残時間を算出する(s1202)。
管理サーバ10は起動フラグ37を確認し、起動フラグ37が「0」であるレコードを抽出する(s1203)。
ここで、データレコードが存在しない場合(s1204:no)、すなわち、全てのサーバが電源断サーバではない場合は以降の処理は不要であるため、処理を終了する。
一方、抽出したデータレコードが存在する場合(s1204:yes)は、以下の処理を行う。
管理サーバ10は、データレコードが抽出できた場合は、管理サーバ10は、残時間と抽出したレコードに対応する起動時間38とを比較する(s1205)。
ここで、全てのデータレコードの起動時間38が残時間よりも短い場合(s1206:Yes)には、以降の処理は不要であるため、処理は終了する。
一方、起動時間38が残時間以上の場合(s1206:No)には、電源Onの指示と共に起動フラグ37を起動中である「1」にする(s1207)。これにより、次回の起動前確認においては、フラグ値が「0」ではないため、チェック対象から排除されることとなる。
そして、当該起動時間38に対応するサーバに対して電源Onの処理(s1208)を実行する。
サーバの電源Onについての処理は、実施例1における図4の処理と同様である。なお、図4の特定サーバは、本実施例では、s1208の電源断サーバを意味する。
ただし、S407のサーバ管理DB30の更新時には、起動フラグ37を起動中を示す「1」から起動完了を示す「2」の値にする。
上記、起動時間38の方が、残時間よりも短いデータレコードを有する全てのサーバについて電源Onの指示が完了した場合(s1209:Yes)には、本処理は終了する。
上記図12に係る処理を動作確認開始直前まで行う。
管理サーバ10は、動作確認を行う時刻が経過すると、管理対象のサーバについて動作確認を行う。その後、起動フラグ37が「2」である全てのサーバに対して、電源断の処理を行う。
以上の処理により、本来、電源を継続して入れておく必要がないサーバについては、短い時間の電源Onで動作確認が可能となる。
また、上記例では特定の時間にまとめてサーバの動作確認を行う方式について記載したが、各サーバ個別に動作確認の時刻を定めておいた場合にも応用は可能である。この場合には、各サーバについて動作確認の時刻を設定しておき、当該時刻と現在時刻との差分から残時間を算出し、各データレコードの起動時間38との比較を行うことにより実現可能である。
(実施例4)
図13は、時間管理DB40のデータ構成を示した図である。
時間管理DB40は、時間41、待機サーバ数42、稼動サーバ数サービスA43、稼動サーバ数サービスB44とから構成される。時間41は、24時間を3時間毎に区切り表示したものである。3時間毎に区切るのは、単なる例示であり、日単位、週単位、分単位、等、適宜設定可能である。待機サーバ数42は、時間41に対応して設定する待機サーバの数である。待機サーバ数についても管理者が予め任意に設定可能である。稼動サーバ数サービスA43および稼動サーバ数サービスB44は、サービスAとサービスBについて時間41に対応して稼動させる稼動サーバの数である。
なお、稼動サーバ数サービスA43及び稼動サーバ数サービスB44は2つの項目となっているが、本実施例がサービスAとサービスBの2種類のサービスが存在するシステムであるためであり、サービス数が増加すれば項目数も増加する。
図14は、時間によるサーバ状態遷移のフローチャートである。
まず、管理サーバ10は、現在時刻に対応する時間管理DB40の時間41を抽出する(S1401)。
管理サーバ10は、時間41に対応する待機サーバ数42、サービスAに対応する稼動サーバ数43、サービスBに対応する稼動サーバ数44を読込む(S1402)。
管理サーバ10は、システム上で現在稼動中の各サービスA,Bに対応するサービスをするサーバ数をサーバ管理DB20のサービス33、およびステータス32から読込む(S1403)。
S1402で読み込んだ台数とS1403で読み込んだの台数が異なるか否かを判定する(S1404)。
異なる場合は(S1404:Yes)、サーバ台数の調整を行う(S1405)。サーバ台数の調整は、例えば稼働時間の長い稼動サーバを電源断とする方法、あるいは、サーバ処理能力が低いサーバを電源断とする方法などがある。電源断サーバを待機サーバ、稼動サーバに設定する。待機サーバを優先して稼動サーバに切り替える。などの種々の判断が可能である。これらの判断定義については、予め定義しておく。
管理サーバ10は、サービス毎の混雑度を監視し、上記のような稼動サーバ、待機サーバ、電源断サーバの状態遷移を動的に行うことも可能である。
次に時間に応じて、稼動サーバの数、及び待機サーバの数を動的に変化させるシステムの場合について説明する。
一般にサーバシステムは、処理するサーバ台数が多ければ処理速度が早くなる。したがって、負荷の状況に応じて待機サーバを稼動サーバに変更することが可能である。また、複数のサービスが並行して行われるサーバシステムでは、サービスAの負荷は軽く、サービスBの負荷が重い場合、処理が流れているサービスAについては、稼動サーバの台数を減らし、待機サーバとなったサーバをサービスBを処理する稼動サーバとして切り替えて処理することで、効率的なサーバの運用が可能となる。
上記の状態に対応するため、管理者は時間管理DB40を予め設定し、時間毎の稼動サーバの数、待機サーバの数を定義する。当該時間に対応して稼動サーバ及び待機サーバを起動することも可能である。
図15は、ハードウェア構成図である。
図15は、上記のサーバ管理システム、管理サーバ10、管理クライアント20、サーバ01乃至サーバxxのハードウェア構成の一例を示す図である。
同図に示すサーバ及びクライアントは、CPU11、メモリ12、入力手段13、出力手段14、記憶手段15、ネットワーク接続手段16等を有し、これらがバス17に接続された構成となっている。なお、同図に示した構成は一例であり、これに限るものではない。
CPU11は、当該サーバ及びクライアントコンピュータ全体を制御する中央処理装置である。
メモリ12は、プログラム実行、データ更新等の際に、記憶手段15に記憶されているプログラムやデータを一時的に格納するRAM等のメモリである。CPU11は、メモリ12に読み出したプログラムやデータを用いて、上述の図3乃至図12等を用いて説明したサーバ管理動作に係る処理を含む各種処理を実行する。
入力手段13は、例えばキーボード、マウス、タッチパネル等である。
出力手段14は、例えばディスプレイ(表示装置)等である。
記憶手段15は、例えばハードディスク装置等であり、プログラム(上述のサーバ管理動作に係る処理をコンピュータに実行させるプログラムを含む)やデータ(上述のサーバ管理DB30、時間管理DB40を含む)が格納される。
ネットワーク接続装置17は、ネットワーク(インターネット等)に接続して、外部の情報処理装置とプログラムやデータの送受信を可能にする構成である。
また、上記プログラムを記録した記録媒体又はプログラムのダウンロードのも可能である。
上記の各種処理を実行させるプログラムやデータ読み出してメモリ12に格納し実行するものであってもよいし、また、上記プログラムやデータは、ネットワーク接続装置17により接続されているネットワーク(インターネット等)を介して、外部のプログラムやサーバに記憶されているプログラムやデータをダウンロードするものであってもよい。
なお、本サーバ管理システムで管理するサーバは、ネットワーク経由での電源投入、及び電源断が可能であるサーバである。さらに、当該サーバに節電機能がある場合には待機サーバから電源断サーバへの状態遷移については、節電機能による電源断によっても実現可能である。ここで節電機能とは、メモリの状態等、運用状態を保持したまま電源を停止できる機能であり、電源を投入すると、サーバが節電機能により電源断となった時の状態を即時に再現可能となる機能である。
以上、本発明について詳細に説明したが、本発明は上記実施形態に限定されず、本発明の要旨を逸脱しない範囲において、各種の改良及び変更を行っても良いのはもちろんである。
発明は、消費電力の低減、かつ、システムの安全性の確保が出来るサーバ管理を提供できる。
符号の説明
10 管理サーバ10
20 管理クライアント
30 サーバ管理DB30
40 時間管理DB

Claims (6)

  1. 第1の期間に第1のコンピュータの状態情報を返信させる指示を前記第1のコンピュータに行ない、前記第1の期間と重複しない第2の期間に第2のコンピュータの状態情報を返信させる指示を前記第2のコンピュータに対して行なう指示手段と、
    前記第1の期間を除く期間すべてにおいて前記第1のコンピュータを電源断にさせる制御と、前記第2の期間を除く期間すべてにおいて前記第2のコンピュータを電源断にさせる制御と、を行なう制御手段と、
    を含むことを特徴とする管理装置。
  2. 前記制御手段が、さらに、
    前記第1のコンピュータ及び前記第2のコンピュータを含むコンピュータ群に含まれる各コンピュータについて、前記各コンピュータを電源断にさせる制御を行なうとともに、前記コンピュータ群に含まれるコンピュータのうち、同時に電源断にされない状態のコンピュータを所定数以下に制限する、
    ことを特徴とする請求項1に記載の管理装置。
  3. 前記第1のコンピュータの状態情報に基づいて、前記第1のコンピュータの状態を監視し、前記第2のコンピュータの状態情報に基づいて、前記第2のコンピュータの状態を監視する監視手段、
    をさらに含むことを特徴とする請求項1または請求項2に記載の管理装置。
  4. 第1のコンピュータと、
    第2のコンピュータと、
    管理装置と、を含む管理システムであって、
    前記管理装置は、
    第1の期間に第1のコンピュータの状態情報を返信させる指示を前記第1のコンピュータに行ない、前記第1の期間と重複しない第2の期間に第2のコンピュータの状態情報を返信させる指示を前記第2のコンピュータに対して行なう指示手段と、
    前記第1の期間を除く期間すべてにおいて前記第1のコンピュータを電源断にさせる制御と、前記第2の期間を除く期間すべてにおいて前記第2のコンピュータを電源断にさせる制御と、を行なう制御手段と、
    を含むことを特徴とする管理システム。
  5. 少なくとも第1のコンピュータおよび第2のコンピュータを管理するコンピュータに、
    第1の期間に前記第1のコンピュータの状態情報を返信させる指示を前記第1のコンピュータに行ない、前記第1の期間と重複しない第2の期間に前記第2のコンピュータの状態情報を返信させる指示を前記第2のコンピュータに対して行ない、
    前記第1の期間を除く期間すべてにおいて前記第1のコンピュータを電源断にさせる制御と、前記第2の期間を除く期間すべてにおいて前記第2のコンピュータを電源断にさせる制御と、を行なう、
    ことを実行させることを特徴とする管理方法。
  6. 少なくとも第1のコンピュータおよび第2のコンピュータを管理するコンピュータに、
    第1の期間に第1のコンピュータの状態情報を返信させる指示を前記第1のコンピュータに行ない、前記第1の期間と重複しない第2の期間に第2のコンピュータの状態情報を返信させる指示を前記第2のコンピュータに対して行ない、
    前記第1の期間を除く期間すべてにおいて前記第1のコンピュータを電源断にさせる制御と、前記第2の期間を除く期間すべてにおいて前記第2のコンピュータを電源断にさせる制御と、を行なう、
    ことを実行させることを特徴とする管理プログラム。
JP2008500358A 2006-02-14 2006-02-14 管理装置、管理システム、管理方法及び管理プログラム Expired - Fee Related JP5282569B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/302498 WO2007094041A1 (ja) 2006-02-14 2006-02-14 サーバ管理装置及びサーバ管理プログラム

Publications (2)

Publication Number Publication Date
JPWO2007094041A1 JPWO2007094041A1 (ja) 2009-07-02
JP5282569B2 true JP5282569B2 (ja) 2013-09-04

Family

ID=38371237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008500358A Expired - Fee Related JP5282569B2 (ja) 2006-02-14 2006-02-14 管理装置、管理システム、管理方法及び管理プログラム

Country Status (2)

Country Link
JP (1) JP5282569B2 (ja)
WO (1) WO2007094041A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4834628B2 (ja) * 2007-06-25 2011-12-14 アラクサラネットワークス株式会社 ネットワーク装置の消費電力低減制御装置及び制御方法
JP4547440B2 (ja) * 2008-03-31 2010-09-22 富士通株式会社 仮想テープシステム
JP2010009293A (ja) * 2008-06-26 2010-01-14 Hitachi Ltd コンピュータシステム及び系切替方法
JP5572074B2 (ja) * 2010-11-30 2014-08-13 富士通コンポーネント株式会社 Kvm装置
JP2013005388A (ja) * 2011-06-21 2013-01-07 Nec Corp 光ノード装置及び光ノード装置の制御方法
JP6179101B2 (ja) * 2013-01-16 2017-08-16 日本電気株式会社 管理装置、管理方法、および管理プログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01293037A (ja) * 1988-05-20 1989-11-27 Nec Corp 監視装置
JPH01318323A (ja) * 1988-06-17 1989-12-22 Nippon Signal Co Ltd:The 待機式多重化システムにおける系切換え方法
JPH03139736A (ja) * 1989-10-26 1991-06-13 Oki Electric Ind Co Ltd 情報処理システムにおける系切替方式
JPH04268643A (ja) * 1991-02-22 1992-09-24 Nec Corp 情報処理システム
JPH07295689A (ja) * 1994-04-27 1995-11-10 Hitachi Ltd 遠隔制御方式
JPH09305270A (ja) * 1996-05-14 1997-11-28 Fuji Xerox Co Ltd ネットワーク制御方法及び制御サーバー装置
JPH11231977A (ja) * 1998-02-13 1999-08-27 Fujitsu Ltd 省電力機能の遠隔制御方法、情報処理装置及び記憶媒体
JP2004013203A (ja) * 2002-06-03 2004-01-15 Canon Inc ネットワークシステム
JP2005135409A (ja) * 2003-10-31 2005-05-26 Hewlett-Packard Development Co Lp セルをテストするシステムおよび方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01293037A (ja) * 1988-05-20 1989-11-27 Nec Corp 監視装置
JPH01318323A (ja) * 1988-06-17 1989-12-22 Nippon Signal Co Ltd:The 待機式多重化システムにおける系切換え方法
JPH03139736A (ja) * 1989-10-26 1991-06-13 Oki Electric Ind Co Ltd 情報処理システムにおける系切替方式
JPH04268643A (ja) * 1991-02-22 1992-09-24 Nec Corp 情報処理システム
JPH07295689A (ja) * 1994-04-27 1995-11-10 Hitachi Ltd 遠隔制御方式
JPH09305270A (ja) * 1996-05-14 1997-11-28 Fuji Xerox Co Ltd ネットワーク制御方法及び制御サーバー装置
JPH11231977A (ja) * 1998-02-13 1999-08-27 Fujitsu Ltd 省電力機能の遠隔制御方法、情報処理装置及び記憶媒体
JP2004013203A (ja) * 2002-06-03 2004-01-15 Canon Inc ネットワークシステム
JP2005135409A (ja) * 2003-10-31 2005-05-26 Hewlett-Packard Development Co Lp セルをテストするシステムおよび方法

Also Published As

Publication number Publication date
WO2007094041A1 (ja) 2007-08-23
JPWO2007094041A1 (ja) 2009-07-02

Similar Documents

Publication Publication Date Title
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP5282569B2 (ja) 管理装置、管理システム、管理方法及び管理プログラム
JP2008108145A (ja) 計算機システム及びこれを用いたデータの管理方法
US20120005609A1 (en) Management system and management system control method
JP4497953B2 (ja) 情報処理システム、および情報処理方法
US9432244B2 (en) Management device, information processing device and control method that use updated flags to configure network switches
US7734769B2 (en) Monitoring system of apparatuses connected in a network, monitoring apparatus, monitoring method and program
US20050154829A1 (en) Storage system and storage system management method
JP2009282834A (ja) ディスクアレイ装置,制御ファーム適用方法,及び制御ファーム適用制御部
WO2013171865A1 (ja) 管理方法及び管理システム
US8499080B2 (en) Cluster control apparatus, control system, control method, and control program
US20140129865A1 (en) System controller, power control method, and electronic system
JP2009151677A (ja) ストレージ制御装置、ストレージ制御プログラムおよびストレージ制御方法
US8819481B2 (en) Managing storage providers in a clustered appliance environment
JP4893731B2 (ja) 通信制御装置
US8499130B2 (en) Information processing apparatus, information processing method, and recording medium that records history information control program
KR20070010156A (ko) 데이터 저장 시스템, 컬러 및 컬러 경계 유지 방법 및 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체
JP4357433B2 (ja) ストレージシステム
JP6788188B2 (ja) 制御装置および制御プログラム
JP5947974B2 (ja) 情報処理装置及び情報処理装置の交換支援システム並びに交換支援方法
US11853175B2 (en) Cluster system and restoration method that performs failover control
US8443235B2 (en) Storage system and known problem information management method
JP5262492B2 (ja) クラスタシステム及びコマンド競合制御方法
WO2024084776A1 (ja) 監視装置、管理装置、通信システム、および復旧方法
JP4464872B2 (ja) 計算機システムおよび計算機制御方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120203

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121204

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121211

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130513

R150 Certificate of patent or registration of utility model

Ref document number: 5282569

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees