JP2018195265A

JP2018195265A - 情報処理装置、情報処理装置の制御方法およびプログラム

Info

Publication number: JP2018195265A
Application number: JP2017101098A
Authority: JP
Inventors: 裕太郎岩切; Yutaro Iwakiri; 洋志片山; Hiroshi Katayama; 大輔佛田; Daisuke Butta; 哲夫辻井; Tetsuo Tsujii
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-05-22
Filing date: 2017-05-22
Publication date: 2018-12-06
Also published as: US20180336110A1

Abstract

【課題】災害復旧において復旧対象の情報処理システムが復旧先でも機能が使用できるように情報処理システムの復旧先を決定することができる情報処理装置を提供する。【解決手段】情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置であって、各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得する取得部と、複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、取得した第１の情報と第２の情報とに基づいて、障害が発生した情報処理システムが使用する機能を使用可能なサイトを、障害が発生した情報処理システムの復旧先として決定する決定部とを有する情報処理装置を提供する。【選択図】図１

Description

本発明は、情報処理装置、情報処理装置の制御方法およびプログラムに関する。

サーバなどの情報処理装置を含む情報処理システムを用いて提供されるサービスにおいて、ディザスタリカバリ（災害復旧；Disaster Recovery（ＤＲ））と呼ばれる対策が採
られることがある。ＤＲでは、地震などの災害に備えて、サービスで実際に運用しているサイトと同等のサイトが、バックアップサイトとして地理的に離れた場所に用意されている。災害発生時にサービスの運用に使用されているサイトに障害が発生した場合に、バックアップサイトとして用意されたサイトが代わりに使用される。これにより、災害発生時の迅速なサービスの復旧が図られている。

また、バックアップサイトを複数用意しておき、障害が発生したサイトで動作している複数の情報処理システムを複数のバックアップサイトを用いて分散して復旧する技術も提案されている。また、各情報処理システムに復旧の優先順位を設定しておき、優先順位の高いものから復旧する技術も提案されている（特許文献１〜３）。

特表２０１０−５３０１０８号公報特表２０１５−５１０２０１号公報特開２０１０−１０２４６８号公報

しかし、サイトで固有の機能が使用されてサービスが提供される場合もある。ここで固有の機能の一例としていわゆるパブリッククラウドによって提供される機能が挙げられる。パブリッククラウドが使用される場合、あるパブリッククラウドの提供地域が限定されていたり、パブリッククラウドと接続する専用線を使用するなどの仕様が決められていたりすることがある。このため、上記の技術では、情報処理システムがパブリッククラウドの提供地域外にあるサイトや専用線を使用できないなど上記仕様を満たさないサイトに復旧される可能性がある。この結果、復旧先のサイトでは情報処理システムがパブリッククラウドによって提供されるサービスを使用できない可能性がある。なお、このような問題は、パブリッククラウドによって提供されるサービスに限定されるものではない。すなわち、復旧されるサイトとバックアップサイトで提供される機能が異なる場合にも、同様の問題が生じうる。

上記の事情に鑑みて、１つの側面では、災害復旧において復旧対象の情報処理システムが復旧先でも機能が使用できるように情報処理システムの復旧先を決定することができる情報処理装置を提供することを目的とする。

本件開示の技術の一側面によれば、情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置であって、各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得する取得部と、複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、取得した第１の情報と第２の情報とに基づいて、
障害が発生した情報処理システムが使用する機能を使用可能なサイトを、障害が発生した情報処理システムの復旧先として決定する決定部とを有する。

本件開示の技術によれば、災害復旧において復旧対象の情報処理システムが復旧先でも機能が使用できるように情報処理システムの復旧先を決定することができる情報処理装置を提供することができる。

図１は、一実施形態に係るサイトおよび使用サービスの関係の一例を示す模式図である。図２は、一実施形態に係る管理サーバの構成の一例を示す図である。図３は、一実施形態に係る管理サーバが実行する処理のフローチャートである。図４は、一実施形態に係る管理サーバが実行するサブルーチンの処理のフローチャートである。図５は、一実施形態に係るサイト管理表の一例を示す図である。図６は、一実施形態に係る情報処理システム管理表の一例を示す図である。図７は、一実施形態に係る情報処理システムの障害発生時におけるサイト管理表の一例を示す図である。図８は、一実施形態に係る復旧処理表の一例を示す図である。図９は、一実施形態に係る復旧先および復旧処理の内容が決定された後の復旧処理表の一例を示す図である。

以下、本件開示の技術に係る実施形態について図面を参照しながら説明する。なお、以下の詳細な説明は例示的なものであり、実施形態の構成を限定するものではない。

図１に示すように、本実施形態では、サイトＡ１、サイトＢ２、サイトＣ３は、地理的に離れた場所にそれぞれ構築されている。なお、サイトＡ１、サイトＢ２、サイトＣ３は、地理的に同じ場所に構築されていてもよい。また、構築されるサイトの数は、図１に示す数に限られない。一例として、各サイトはデータセンタとして機能し、各サイトには複数の情報処理システムが配備されている。サイトに配備される情報処理システムでは、仮想マシンやストレージ、ネットワークなどが組み合わされている。

サイトＡ１は、情報処理システムＡ４、情報処理システムＢ５および管理サーバ１０を有する。また、サイトＢ２は、情報処理システムＣ６および管理サーバ１１を有する。また、サイトＣ３は、情報処理システムＤ７、情報処理システムＥ８および管理サーバ１２を有する。なお、サイトＢ２には、情報処理システムを配備できる空きリソース９が１つ残っている。ここで、管理サーバ１０が、情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置の一例である。

サイトＡ１、サイトＢ２、サイトＣ３は、それぞれ管理ネットワーク１５に接続されている。これにより、管理サーバ１０〜１２は、管理ネットワーク１５を経由して相互に通信を行う。また、サイトＡ１、Ｂ２は、サービスＡを提供するパブリッククラウド１３に接続されている。また、サイトＢ２、Ｃ３は、サービスＢを提供するパブリッククラウド１４に接続されている。これにより、サイトＡ１内の情報処理システムＡ４、情報処理システムＢ５は、パブリッククラウド１３が提供するサービスＡを使用することができる。また、サイトＢ２内の情報処理システムＣ６は、パブリッククラウド１３が提供するサービスＡおよびパブリッククラウド１４が提供するサービスＢを使用することができる。ま
た、サイトＣ３内の情報処理システムＤ７、情報処理システムＥ８は、パブリッククラウド１４が提供するサービスＢを使用することができる。さらに、本実施形態では、サイトＡ１では、パブリッククラウド１４が提供するサービスＢを使用できず、サイトＣ３では、パブリッククラウド１３が提供するサービスＡを使用できないと想定する。

図２に、一実施形態における管理サーバ１０の構成の一例を示す。なお、管理サーバ１１、１２も管理サーバ１０と同様の構成を有する。管理サーバ１０は、Central Processing Unit（ＣＰＵ）１０１、Random Access Memory（ＲＡＭ）１０２、Hard Disk Drive（ＨＤＤ）１０３、Graphics Processing Unit（ＧＰＵ）１０４、入力インタフェース１０５、通信インタフェース１０６を有する。また、ＧＰＵ１０４、入力インタフェース１０５、通信インタフェース１０６は、モニタ２０、入力装置３０、管理ネットワーク１５にそれぞれ接続されている。ＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、ＧＰＵ１０４、入力インタフェース１０５、通信インタフェース１０６は、バス１０７を介して互いに接続されている。

管理サーバ１０のユーザは、入力装置３０を用いて管理サーバ１０に種々の指示を行い、管理サーバ１０の処理結果をモニタ２０で確認する。本実施形態において、ＣＰＵ１０１は、ＨＤＤ１０３に記憶されている各種プログラムをＲＡＭ１０２に展開して実行することで、以下に説明する種々の処理を実行する。

また、本実施形態においては、管理サーバ１０のＨＤＤ１０３には、各サイトにおいて使用可能なサービスの種類、各サイトにおいて情報処理システムを配備できる数（キャパシティ）に関する情報があらかじめ格納されている。なお、キャパシティが、各サイトにおいて配備可能な情報処理システムのリソース量の一例である。さらに、ＨＤＤ１０３には、各情報処理システムが使用するサービス、情報処理システムを復旧する際の優先順位に関する情報もあらかじめ格納されている。なお、以下の説明において、各サイトにおいて情報処理システムが使用可能なサービスの種類およびキャパシティに関する情報をテーブルとしてまとめたデータをサイト管理表と称する。また、以下の説明において、各情報処理システムが使用するサービスおよび情報処理システムを復旧する際の優先順位に関する情報をテーブルとしてまとめたデータを情報処理システム管理表と称する。

図５、６に、ＨＤＤ１０３に格納されるサイト管理表と情報処理システム管理表の一例をそれぞれ示す。図５に示すように、サイト管理表では、一例として、「サイト」欄に各サイトの名称が、「使用可能サービス」欄に各サイトで使用できるサービスが、「キャパシティ」欄に各サイトのキャパシティを示す値がそれぞれ格納される。なお、「使用可能サービス」欄に格納されるサービスが、各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報の一例である。また、「キャパシティ」欄に格納されるキャパシティを示す値が、各サイトにおいて配備可能な情報処理システムのリソース量の合計量に関する第３の情報の一例である。サイト管理表により、各サイトで使用できるサービスおよび各サイトで配備できる情報処理システムの数が特定される。

また、図６に示すように、情報処理システム管理表では、一例として、「情報処理システム」欄に各情報処理システムの名称が、「使用サービス」欄に各情報処理システムが使用するサービスがそれぞれ格納される。なお、「使用サービス」欄に格納されるサービスが、各情報処理システムが使用する機能に関する第１の情報の一例である。さらに、情報処理システム管理表では、一例として、「復旧優先度」欄に情報処理システムの復旧時における優先順位を示す値がそれぞれ格納される。「復旧優先度」欄の値は自然数であり小さい値ほど優先的に復旧される。なお、「復旧優先度」欄に格納される値が、各情報処理システムの復旧の優先順位に関する第４の情報の一例である。情報処理システム管理表により、情報処理システムの復旧時に、各情報処理システムの復旧先および各情報処理シス
テムの復旧の優先順位が特定される。また、第１の情報によって示される障害が発生した情報処理システムが使用する機能が第２の情報によって示される使用可能な機能に含まれるサイトが特定され、特定されたサイトが復旧先の候補となる。

本実施形態では、一例として、サイトＡ１、サイトＢ２、サイトＣ３の管理サーバ１０〜１２が、管理ネットワーク１５を経由して通信することで、上記のサイト管理表および情報処理システム管理表の情報の同期化が行われている。このため、例えば災害が発生して情報処理システムに障害が発生してサイトのキャパシティが減少した場合に、管理サーバ１０〜１２は、サイト管理表の「キャパシティ」欄の値を変更する。これにより、管理サーバ１０〜１２は、情報処理システムに障害が発生した際に、サイト管理表によって各サイトのキャパシティを特定することができる。なお、本実施形態では、管理サーバ１０〜１２は、各サイトに配備されている各情報処理システムで使用されるリソースなどの情報を共有していると想定する。管理サーバ１０〜１２による各情報処理システムの情報の共有は周知の技術によって実現できるため、ここでは詳細な説明は省略する。

以下に、本実施形態における管理サーバ１０が実行する処理についてフローチャートを参照しながら説明する。なお、以下の処理は、管理サーバ１０の代わりに、管理サーバ１０〜１２が代表サーバを決定し、決定された代表サーバが実行してもよい。代表サーバの決定については周知の技術を用いて実現できるため、ここでは詳細な説明は省略する。図３、４に、管理サーバ１０のＣＰＵ１０１が実行する処理のフローチャートの一例を示す。管理サーバ１０のＣＰＵ１０１は、一例として、管理サーバ１０の電源が投入されたときに、図３に示すフローチャートの処理を開始する。

ＯＰ１０１において、ＣＰＵ１０１は、サイトＡ１、サイトＢ２、サイトＣ３に配備された情報処理システムＡ４〜Ｅ８の少なくとも１つに障害が発生したか否かを判定する。具体的には、管理サーバ１０〜１２が、自サイト（管理サーバ１０はサイトＡ１、管理サーバ１１はサイトＢ２、管理サーバ１２はサイトＣ３）に配備された各情報処理システムの障害発生状況を監視している。そして、管理サーバ１０〜１２は自サイト内の少なくとも１つの情報処理システムに障害が発生したことを検出すると、残りのサイトの管理サーバにその旨を通知する。これにより、管理サーバ１０〜１２は、情報処理システムＡ４〜Ｅ８の障害発生状況に関する情報を共有する。したがって、ＯＰ１０１において、ＣＰＵ１０１は、情報処理システムＡ４〜Ｅ８に障害が発生したか否かを判定することができる。

また、本実施形態では、情報処理システムＡ４〜Ｅ８のいずれかに障害が発生した場合に、サイト管理表のキャパシティに関する情報が更新され、管理サーバ１０〜１２によって更新されたサイト管理表が共有される。一例として、サイトＡ１において災害が発生し、情報処理システムＡ４、Ｂ５に障害が発生したと想定する。このとき、管理サーバ１０は、ＨＤＤ１０３に格納されているサイト管理表の「キャパシティ」欄の値を図５に示す状態から図７に示す状態に更新する。そして、管理サーバ１０は、更新したサイト管理表を管理ネットワーク１５を経由して管理サーバ１１、１２に送信する。これにより、図７に示すサイト管理表が管理サーバ１０〜１２によって共有される。

ＯＰ１０１において、ＣＰＵ１０１は、情報処理システムＡ４〜Ｅ８の少なくとも１つに障害が発生したと判定した場合は（ＯＰ１０１：Ｙｅｓ）、処理をＯＰ１０２に進める。一方、ＣＰＵ１０１は、情報処理システムＡ４〜Ｅ８に障害が発生していないと判定した場合は（ＯＰ１０１：Ｎｏ）、ＯＰ１０１の処理を繰り返し実行する。

ＯＰ１０２において、ＣＰＵ１０２は、取得部として機能し、ＨＤＤ１０３からサイト管理表および情報処理システム管理表をそれぞれ取得する。次いで、ＣＰＵ１０２は、Ｏ
Ｐ１０３において、取得したサイト管理表および情報処理システム管理表を用いて情報処理システムＡ４〜Ｅ８の復旧先を決定する。

例えば、サイトＡ１において災害が発生し、情報処理システムＡ４、Ｂ５に障害が発生した場合、ＯＰ１０２において、ＣＰＵ１０２は、図７に示すサイト管理表と図６に示す情報処理システム管理表をＨＤＤ１０３から取得する。そして、ＯＰ１０３において、ＣＰＵ１０２は、取得したサイト管理表と情報処理システム管理表から図８に例示する復旧処理表を作成する。ここで、復旧処理表とは、各サイトに配備された情報処理システムの復旧先の候補を定義する表である。図８に示すように、復旧処理表において、「情報処理システム」欄には各サイトに配備されている情報処理システムの名称が、「現在のサイト」欄には情報処理システムが現在配備されているサイトの名称がそれぞれ格納される。さらに復旧処理表において、「復旧先の候補」欄には情報処理システムの復旧先の候補となるサイトの名称が、「復旧処理」欄には情報処理システムの復旧処理の内容がそれぞれ格納される。

ここで復旧処理の内容の一例として、復旧、移動、維持、停止が挙げられる。「復旧」は、障害が発生した情報処理システムを復旧することを意味する。「移動」は、障害が発生していない情報処理システムを別のサイトに移動することを意味する。「維持」は、障害が発生していない情報処理システムを現在配備されているサイトに継続して配備することを意味する。「停止」は、サイトに空きリソースが存在しないため情報処理システムを配備しないことを意味する。停止処理は、サイトでの使用可能なサービスやキャパシティ、情報処理システムが使用するサービス、情報処理システムの復旧の優先順位などから、情報処理システムの復旧先が存在しない場合に実行される処理である。また、停止処理は、いわゆる縮退処理、すなわち情報処理システムのリソースの一部を停止させる処理や情報処理システムの性能を低下させる処理で代用することもできる。

図７に示すように、サイトＡ１のキャパシティは０、サイトＢ２、Ｃ３のキャパシティはそれぞれ２である。すなわち、サイトＡ１には情報処理システムを復旧できる空きリソースが存在せず、サイトＢ２、Ｃ３の各サイトには、情報処理システムを復旧できる空きリソースが存在する。また、サイトＢ２ではサービスＡおよびサービスＢを使用することができ、サイトＣ３ではサービスＢのみを使用することができる。さらに、図６に示すように、情報処理システムＡ４、Ｂ５がサービスＡを使用し、情報処理システムＣ６、Ｄ７、Ｅ８がサービスＢを使用する。

上記のサイト管理表と情報処理システム管理表によれば、情報処理システムＡ４はサイトＢ２またはサイトＣ３に復旧することができる。ただし、情報処理システムＡ４は、サービスＡを使用するため、サイトＢ２に復旧されるとサービスＡを使用できるがサイトＣ３に復旧されるとサービスＡを使用できなくなる。したがって、ＣＰＵ１０２は、情報処理システムＡ４の復旧先の候補はサイトＢ２であると決定する。同様に、ＣＰＵ１０２は、情報処理システムＢ５の復旧先の候補はサイトＢ２であると決定し、情報処理システムＣ６〜Ｅ８の復旧先の候補はサイトＢ２またはサイトＣ３であると決定する。そして、ＣＰＵ１０２は、判定結果に基づいて図８に示すように復旧処理表の「復旧先の候補」欄に各情報処理システムの復旧先の候補を格納する。ＣＰＵ１０２は、情報処理システムの復旧先の候補を決定すると、処理をＯＰ１０４に進める。

ＯＰ１０４では、ＣＰＵ１０２は、復旧の優先順位の高い順に、各情報処理システムの復旧先を決定する。具体的には、ＣＰＵ１０２は、ＯＰ１０３において作成した復旧処理表の各情報処理システムの復旧先の候補と、情報処理システム管理表の復旧の優先順位と、サイト管理表の各サイトのキャパシティとから、情報処理システムの復旧先を決定する。

ＯＰ１０４において実行されるサブルーチンの詳細処理の一例を図４に示す。ＯＰ２０１において、ＣＰＵ１０２は、各サイトに配備されている情報処理システムのうち復旧先を決定していない情報処理システムが存在するか否かを判定する。例えば、ＣＰＵ１０２は、以下に説明するＯＰ２０２において、各情報処理システムに対して復旧先の決定処理を実行したか否かを示すフラグをオンにする。そして、ＯＰ２０１において当該フラグを参照することで、復旧先の決定処理を実行していない情報処理システムが存在するか否かを判定する。復旧先の決定処理を実行していない情報処理システムが存在する場合は（ＯＰ２０１：Ｙｅｓ）、ＣＰＵ１０２は、処理をＯＰ２０２に進める。一方、復旧先の決定処理を実行していない情報処理システムが存在しない場合は（ＯＰ２０１：Ｎｏ）、ＣＰＵ１０２は、本サブルーチン処理をＯＰ２０２に進める。ＯＰ２０２において、ＣＰＵ１０２は、決定部として機能し、復旧先の決定処理を実行していない情報処理システムの復旧先を決定する。

以下に、ＯＰ２０１、ＯＰ２０２の処理の具体例について説明する。図６の情報処理システム管理表と、図７のサイト管理表と、図８の復旧処理表とが使用される場合、情報処理システム管理表の「復旧優先度」欄の値が示すように、復旧の優先順位は、高い順に並べると情報処理システムＡ４、Ｂ５、Ｃ６、Ｄ７、Ｅ８の順となる。したがって、ＯＰ２０２では、ＣＰＵ１０２は、情報処理システムＡ４の復旧先を他の情報処理システムよりも優先して決定する。ここで、復旧処理表の「復旧先の候補」欄が示すように、情報処理システムＡ４の復旧先の候補はサイトＢ２である。サイト管理表の「キャパシティ」欄が示すように、サイトＢ２のキャパシティは２である。したがって、ＣＰＵ１０２は、情報処理システムＡ４の復旧先をサイトＢ２に決定する。

このように、本実施形態では、各情報処理システムの復旧の優先順位に従って各情報処理システムの復旧先が決定される。これにより、災害の発生時に各サイトにおいて情報処理システムを配備できるリソース量が減少しても、復旧の優先順位の高い順に情報処理システムのリソースを割り当てることができる。

また、本実施形態では、各サイトに配備される情報処理システムに割り当てられるリソース量が各サイトのキャパシティを超えないように各情報処理システムの復旧先が決定される。これにより、復旧先でもサービスが使用できるように情報処理システムの復旧先が決定されたときに、サイトのキャパシティが不足して情報処理システムを配備できない現象の発生を抑えることができる。ＣＰＵ１０２は、情報処理システムＡ４に対して復旧先の決定処理を実行したか否かを示すフラグをオンにして処理をＯＰ２０１に戻す。

情報処理システムＢ５〜Ｅ８の復旧先の決定処理はまだ実行されていない。したがって、ＣＰＵ１０２は、処理をＯＰ２０１からＯＰ２０２に進める。そして、ＯＰ２０２において、ＣＰＵ１０２は、情報処理システムＡ４の場合と同様に、情報処理システムＢ５の復旧先をサイトＢ２に決定する。さらに、ＣＰＵ１０２は、情報処理システムＢ５に対して復旧先の決定処理を実行したか否かを示すフラグをオンにして処理をＯＰ２０１に戻す。

情報処理システムＣ６〜Ｅ８の復旧先の決定処理はまだ実行されていない。したがって、ＣＰＵ１０２は、処理をＯＰ２０１からＯＰ２０２に進める。そして、ＯＰ２０２において、ＣＰＵ１０２は、情報処理システムＣ６の復旧先を決定する。ここで、復旧処理表の「復旧先の候補」欄が示すように、情報処理システムＣ６の復旧先の候補はサイトＢ２、サイトＣ３である。すなわち、情報処理システムＣ６は、サイトＢ２またはサイトＣ３に復旧することができる。サイトＢ２のキャパシティは２であり、既に情報処理システムＡ４、Ｂ５の復旧先がサイトＢ２に決定されている。したがって、情報処理システムＣ６
を復旧するための空きリソースはサイトＢ２には存在しない。そこで、ＣＰＵ１０２は、情報処理システムＣ６の復旧先をサイトＣ３に決定する。ＣＰＵ１０２は、情報処理システムＣ６に対して復旧先の決定処理を実行したか否かを示すフラグをオンにして処理をＯＰ２０１に戻す。

情報処理システムＤ７、Ｅ８の復旧先の決定処理はまだ実行されていない。したがって、ＣＰＵ１０２は、処理をＯＰ２０１からＯＰ２０２に進める。そして、ＯＰ２０２において、ＣＰＵ１０２は、情報処理システムＣ６の場合と同様に、情報処理システムＤ７の復旧先をサイトＣ３に決定する。さらに、ＣＰＵ１０２は、情報処理システムＤ７に対する復旧先の決定処理を実行したか否かを示すフラグをオンにして処理をＯＰ２０１に戻す。

情報処理システムＥ８の復旧先の決定処理はまだ実行されていない。したがって、ＣＰＵ１０２は、処理をＯＰ２０１からＯＰ２０２に進める。そして、ＯＰ２０２において、ＣＰＵ１０２は、情報処理システムＥ８の復旧先を決定する。ここで、情報処理システムＥ８の復旧先の候補はサイトＢ２、サイトＣ３である。情報処理システムＣ６、Ｄ７の場合と同様、情報処理システムＥ８を復旧するための空きリソースはサイトＢ２には存在しない。さらに、サイトＣ３のキャパシティは２であり、既に情報処理システムＣ６、Ｄ７の復旧先がサイトＣ３に決定されている。したがって、情報処理システムＥ８を復旧するための空きリソースはサイトＣ３にも存在しない。そこで、ＣＰＵ１０２は、情報処理システムＥ８をサイトＡ１、サイトＢ２、サイトＣ３のいずれのサイトにも復旧できないため、情報処理システムＥ８の復旧先はないと決定する。

そして、ＣＰＵ１０２は、情報処理システムＥ８に対して復旧先の決定処理を実行したか否かを示すフラグをオンにして処理をＯＰ２０１に戻す。ここで、復旧先の決定処理が実行されていない情報処理システムは存在しない。したがって、ＣＰＵ１０２は、本サブルーチンの処理を終了して、処理をＯＰ１０５に進める。

ＯＰ２０２の処理によって、各情報処理システムが復旧先でもサービスを使用できる、すなわちサービスが使用できなくなるサイトには情報処理システムが復旧されないように各情報処理システムの復旧先を決定することができる。

ＯＰ１０５では、ＣＰＵ１０２は、ＯＰ１０４で復旧先を決定した各情報処理システムＡ４〜Ｅ８の復旧処理の内容を決定し、決定した復旧処理の内容を復旧処理表の「復旧処理」欄に格納する。図８の復旧処理表が使用される場合、情報処理システムＡ４、Ｂ５は障害が発生している情報処理システムであり、復旧先のサイト（サイトＢ２）も決定されている。したがって、ＣＰＵ１０２は、情報処理システムＡ４、Ｂ５の復旧処理の内容は「復旧」であると決定する。また、情報処理システムＣ６は障害が発生していない情報処理システムであり、現在配備されているサイトＢ２とは異なるサイトＣ３に復旧される。したがって、ＣＰＵ１０２は、情報処理システムＣ６の復旧処理の内容は「移動」であると決定する。

本実施形態では、復旧の優先順位の低い情報処理システム（上記の例では、情報処理システムＣ６）がサイトＢ２に配備されると、復旧の優先順位がより高い情報処理システム（上記の例では、情報処理システムＡ４、Ｂ５）をサイトＢ２に復旧できない。そこで、復旧の優先順位の低い情報処理システムが、現在配備されているサイト（上記の例では、サイトＢ２）から復旧の優先順位の低い情報処理システムが使用する機能を使用可能なサイト（上記の例では、サイトＣ３）に移動されるように復旧先が決定される。これによって、復旧の優先順位のより高い情報処理システムが復旧先でもサービスを使用でき、復旧の優先順位の低い情報処理システムも復旧先でサービスを使用できるように、各情報処理
システムの復旧先が決定される。

また、情報処理システムＤ７は障害が発生していない情報処理システムであり、現在配備されているサイトＣ３に継続して配備される。したがって、ＣＰＵ１０２は、情報処理システムＤ７の復旧処理の内容は「維持」であると決定する。また、情報処理システムＥ８は、復旧先が存在しない情報処理システムである。したがって、ＣＰＵ１０２は、情報処理システムＥ８の復旧処理の内容は「停止」であると決定する。このようにＯＰ１０５においてＣＰＵ１０２によって各情報処理システムの復旧処理の内容が決定された後の復旧処理表の一例を図９に示す。

ＣＰＵ１０２は、各情報処理システムの復旧処理の内容を決定し、決定した復旧処理の内容を復旧処理表の「復旧処理」欄に格納すると、復旧処理表を管理ネットワーク１５を経由して他の管理サーバ１１、１２に送信する。これにより、復旧処理表が管理サーバ１０〜１２によって共有される。そして、ＣＰＵ１０２は、処理をＯＰ１０６に進める。なお、以下のＯＰ１０６、ＯＰ１０７では、処理の主体が各管理サーバ１０〜１２の各ＣＰＵとなる。管理サーバ１０〜１２が管理ネットワーク１５を経由して互いに通信することにより、各サイトに配備された情報処理システムが上記で決定された復旧先に復旧される。

ＯＰ１０６において、管理サーバ１０〜１２のＣＰＵは、復旧処理表および情報処理システム管理表に従って情報処理システムＡ４〜Ｅ８の復旧処理を実行する。具体的には、管理サーバ１０〜１２のＣＰＵは、最初に復旧処理表において復旧処理の内容が「停止」である情報処理システムに対して、停止処理を実行する。次に、管理サーバ１０〜１２のＣＰＵは、復旧処理表において復旧処理の内容が「移動」である情報処理システムに対して、移動処理を実行する。次に、管理サーバ１０〜１２のＣＰＵは、復旧処理表において復旧処理の内容が「復旧」である情報処理システムに対して、復旧処理を実行する。

一例として、図９に示す復旧処理表と図６に示す情報処理システム管理表が使用される場合について説明する。復旧処理表では、復旧処理の内容が「停止」である情報処理システムは、情報処理システムＥ８である。したがって、情報処理システムＥ８が配備されているサイトＣ３の管理サーバ１２のＣＰＵが、情報処理システムＥ８の停止処理を実行する。この結果、情報処理システムＥ８が配備されていたリソースが空きリソースとなる。

次に、復旧処理の内容が「移動」である情報処理システムは、情報処理システムＣ６であり、情報処理システムＣ６の移動先は、復旧処理表の「復旧先の候補」欄が示すようにサイトＣ３である。したがって、情報処理システムＣ６が配備されているサイトＢ２の管理サーバ１１のＣＰＵが、情報処理システムＣ６が配備されているリソースを空きリソースとする。さらに、本実施形態では、管理サーバ１０〜１２は各情報処理システムの情報を共有している。このため、サイトＣ３の管理サーバ１２のＣＰＵが、情報処理システムＣ６の情報に従って、情報処理システムＥ８の停止処理によって空きとなったリソースに情報処理システムＣ６を配備する。この結果、サイトＢ２に配備されていた情報処理システムＣ６がサイトＣ３に移動される。

次に、復旧処理の内容が「復旧」である情報処理システムは、情報処理システムＡ４、Ｂ５である。また、情報処理システムＡ４、Ｂ５の復旧先はサイトＢ２である。管理サーバ１０〜１２のＣＰＵは、情報処理システム管理表に格納されている復旧の優先順位の高い順に情報処理システムの復旧処理を実行する。したがって、まず、サイトＢ２の管理サーバ１１のＣＰＵが、空きリソースに情報処理システムＡ４を配備する。次に、サイトＢ２の管理サーバ１１のＣＰＵが、空きリソースに情報処理システムＢ５を配備する。この結果、サービスＡを使用している情報処理システムＡ４、Ｂ５は、サービスＡを使用でき
ないサイトＣ３に復旧されることなく、サービスＡを使用できるサイトＢ２に復旧される。

ＯＰ１０６において各情報処理システムの復旧処理が完了すると、管理サーバ１０〜１２のＣＰＵは処理をＯＰ１０７に進める。ＯＰ１０７において、管理サーバ１０〜１２のＣＰＵは、上記の各情報処理システムの復旧処理の結果をモニタ（管理サーバ１０の場合はモニタ２０）に表示する。復旧処理の結果には、各情報処理システムの復旧処理の内容、復旧処理によって各情報処理システムが配備されているサイト、復旧処理の成功または失敗を示す情報などが含まれる。管理サーバ１０〜１２のユーザは、モニタに表示される復旧処理の結果から、各情報処理システムがサービスを継続して使用できるサイトにそれぞれ復旧されていることを確認することができる。

以上が本実施形態に関する説明であるが、上記のサーバなどの構成や処理は、上記の実施形態に限定されるものではなく、本発明の技術的思想と同一性を失わない範囲内において種々の変更が可能である。例えば、上記の実施形態では、各サイトがパブリッククラウドのサービスを使用する場合を想定しているが、上記の各表と同様に、ハードウェアおよびソフトウェアを問わず各サイトに固有で使用できる機能に関する情報を各管理サーバが共有してもよい。これにより、各情報処理システムが使用する機能が復旧先でも使用できるように、情報処理システムの復旧先を決定することができる。

また、上記の実施形態では、復旧処理が停止である場合は、情報処理システムの全体のリソースが空きリソースとされる。ただし、停止の代わりに、例えば、一部のリソースを停止する縮退を復旧処理として採用してもよい。この場合、縮退によって停止された一部のリソースが情報処理システムを復旧させるためのリソースとして使用される。

また、上記の実施形態において、上記の少なくとも一部の処理は、ＣＰＵ以外のプロセッサ、例えば、Digital Signal Processor（ＤＳＰ）、Graphics Processing Unit（ＧＰＵ）、数値演算プロセッサ、ベクトルプロセッサ、画像処理プロセッサ等の専用プロセッサで行われてもよい。また、上記の少なくとも一部の処理は、集積回路（ＩＣ）、その他のディジタル回路であってもよい。また、上記各部の少なくとも一部にアナログ回路が含まれてもよい。集積回路は、Large-scale Integration（ＬＳＩ）、Application Specific Integrated Circuit（ＡＳＩＣ）、プログラマブルロジックデバイス（ＰＬＤ）を含む。ＰＬＤは、例えば、Field-Programmable Gate Array(ＦＰＧＡ)を含む。上記各部は、
プロセッサと集積回路との組み合わせであってもよい。組み合わせは、例えば、マイクロコントローラ（ＭＣＵ）、System-on-a-Chip（ＳｏＣ）、システムＬＳＩ、チップセットなどと呼ばれる。

＜コンピュータが読み取り可能な記録媒体＞
コンピュータその他の機械、装置（以下、コンピュータ等）に上記サーバの設定を行うための管理ツール、ＯＳその他を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。

ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ／Ｗ、ＤＶＤ、ブルーレイディスク、ＤＡＴ、８ｍｍテープ、フラッシュメモリ等のメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスクやＲＯＭ等がある。

以上の実施形態に関し、さらに以下の付記を開示する。

（付記１）
情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置であって、
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得する取得部と、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得された前記第１の情報と前記第２の情報とに基づいて、前記障害が発生した情報処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定する決定部と
を有することを特徴とする情報処理装置。

（付記２）
前記決定部は、前記取得した前記第１の情報によって示される前記障害が発生した情報処理システムが使用する機能が前記取得した前記第２の情報によって示される前記使用可能な機能に含まれるサイトを特定し、前記特定したサイトを前記障害が発生した情報処理システムの復旧先として決定する、ことを特徴とする付記１に記載の情報処理装置。

（付記３）
前記取得部は、各サイトにおいて配備可能な情報処理システムのリソース量の合計量に関する第３の情報を取得し、
前記決定部は、各サイトにおいて配備される情報処理システムに割り当てられるリソース量が前記取得された前記第３の情報が示すリソース量の合計量を超えないように、前記障害が発生した情報処理システムの復旧先を決定する
ことを特徴とする付記１または２に記載の情報処理装置。

（付記４）
前記取得部は、各情報処理システムの復旧の優先順位に関する第４の情報を取得し、
前記決定部は、前記取得した前記第４の情報に基づいて、前記優先順位の高い情報処理システムを前記優先順位の低い情報処理システムよりも優先して、前記障害が発生した情報処理システムの復旧先を決定する
ことを特徴とする付記１から３のいずれかに記載の情報処理装置。

（付記５）
前記決定部は、前記優先順位の高い情報処理システムの復旧先のサイトに前記優先順位の低い情報処理システムが配備されている場合に、前記優先順位の低い情報処理システムを、現在配備されているサイトから前記優先順位の低い情報処理システムが使用する機能を使用可能なサイトに移動するよう決定することで、前記優先順位の高い情報処理システムの復旧先を前記優先順位の低い情報処理システムが現在配備されているサイトに決定する、ことを特徴とする付記４に記載の情報処理装置。

（付記６）
情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置に、
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得させ、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得された前記第１の情報と前記第２の情報とに基づいて、前記障害が発生した情報
処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定させる
ことを特徴とする情報処理装置の制御方法。

（付記７）
前記情報処理装置にさらに、
前記取得した前記第１の情報によって示される前記障害が発生した情報処理システムが使用する機能が前記取得した前記第２の情報によって示される前記使用可能な機能に含まれるサイトを特定させ、前記特定したサイトを前記障害が発生した情報処理システムの復旧先として決定させる
ことを特徴とする付記６に記載の情報処理装置の制御方法。

（付記８）
前記情報処理装置にさらに、
各サイトにおいて配備可能な情報処理システムのリソース量の合計量に関する第３の情報を取得させ、
各サイトにおいて配備される情報処理システムに割り当てられるリソース量が前記取得された前記第３の情報が示すリソース量の合計量を超えないように、前記障害が発生した情報処理システムの復旧先を決定させる
ことを特徴とする付記６または７に記載の情報処理装置の制御方法。

（付記９）
前記情報処理装置にさらに、
各情報処理システムの復旧の優先順位に関する第４の情報を取得させ、
前記取得された前記第４の情報に基づいて、前記優先順位の高い情報処理システムを前記優先順位の低い情報処理システムよりも優先して、前記障害が発生した情報処理システムの復旧先を決定させる
ことを特徴とする付記６から８のいずれかに記載の情報処理装置の制御方法。

（付記１０）
前記情報処理装置にさらに、前記優先順位の高い情報処理システムの復旧先のサイトに前記優先順位の低い情報処理システムが配備されている場合に、前記優先順位の低い情報処理システムを、現在配備されているサイトから前記優先順位の低い情報処理システムが使用する機能を使用可能なサイトに移動するよう決定することで、前記優先順位の高い情報処理システムの復旧先を前記優先順位の低い情報処理システムが現在配備されているサイトに決定させる、ことを特徴とする付記９に記載の情報処理装置の制御方法。

（付記１１）
情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置に
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得させ（図３：ＯＰ１０２、図５）、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得された前記第１の情報と前記第２の情報とに基づいて、前記障害が発生した情報処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定させる
ためのプログラム。

（付記１２）
前記情報処理装置にさらに、
前記取得した前記第１の情報によって示される前記障害が発生した情報処理システムが使用する機能が前記取得した前記第２の情報によって示される前記使用可能な機能に含まれるサイトを特定させ、前記特定したサイトを前記障害が発生した情報処理システムの復旧先として決定させる
ための付記１１に記載のプログラム

（付記１３）
前記情報処理装置にさらに、
各サイトにおいて配備可能な情報処理システムのリソース量の合計量に関する第３の情報を取得させ、
各サイトにおいて配備される情報処理システムに割り当てられるリソース量が前記取得された前記第３の情報が示すリソース量の合計量を超えないように、前記障害が発生した情報処理システムの復旧先を決定させる
ための付記１１または１２に記載のプログラム。

（付記１４）
前記情報処理装置にさらに、
各情報処理システムの復旧の優先順位に関する第４の情報を取得させ、
前記取得された前記第４の情報に基づいて、前記優先順位の高い情報処理システムを前記優先順位の低い情報処理システムよりも優先して、前記障害が発生した情報処理システムの復旧先を決定させる
ための付記１１から１３に記載のプログラム。

（付記１５）
前記情報処理装置にさらに、前記優先順位の高い情報処理システムの復旧先のサイトに前記優先順位の低い情報処理システムが配備されている場合に、前記優先順位の低い情報処理システムを、現在配備されているサイトから前記優先順位の低い情報処理システムが使用する機能を使用可能なサイトに移動するよう決定することで、前記優先順位の高い情報処理システムの復旧先を前記優先順位の低い情報処理システムが現在配備されているサイトに決定させる、ための付記１４に記載のプログラム。

１、２、３サイト
４、５、６、７、８情報処理システム
１０、１１、１２管理サーバ
１３、１４パブリッククラウド
１０１ＣＰＵ
１０２ＲＡＭ
１０３ＨＤＤ

Claims

情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置であって、
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得する取得部と、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得した前記第１の情報と前記第２の情報とに基づいて、前記障害が発生した情報処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定する決定部と
を有することを特徴とする情報処理装置。
前記決定部は、前記取得した前記第１の情報によって示される前記障害が発生した情報処理システムが使用する機能が前記取得した前記第２の情報によって示される前記使用可能な機能に含まれるサイトを特定し、前記特定したサイトを前記障害が発生した情報処理システムの復旧先として決定する、ことを特徴とする請求項１に記載の情報処理装置。
前記取得部は、各サイトにおいて配備可能な情報処理システムのリソース量の合計量に関する第３の情報を取得し、
前記決定部は、各サイトにおいて配備される情報処理システムに割り当てられるリソース量が、前記取得した前記第３の情報が示すリソース量の合計量を超えないように、前記障害が発生した情報処理システムの復旧先を決定する
ことを特徴とする請求項１または２に記載の情報処理装置。
前記取得部は、各情報処理システムの復旧の優先順位に関する第４の情報を取得し、
前記決定部は、前記第４の情報に基づいて、前記優先順位の高い情報処理システムを前記優先順位の低い情報処理システムよりも優先して、前記障害が発生した情報処理システムの復旧先を決定する
ことを特徴とする請求項１から３のいずれか一項に記載の情報処理装置。
前記決定部は、前記優先順位の高い情報処理システムの復旧先のサイトに前記優先順位の低い情報処理システムが配備されている場合に、前記優先順位の低い情報処理システムを、現在配備されているサイトから前記優先順位の低い情報処理システムが使用する機能を使用可能なサイトに移動するよう決定することで、前記優先順位の高い情報処理システムの復旧先を前記優先順位の低い情報処理システムが現在配備されているサイトに決定する、ことを特徴とする請求項４に記載の情報処理装置。
情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置に、
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理システムが使用可能な機能に関する第２の情報を取得させ、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得された前記第１の情報および前記第２の情報に基づいて、前記障害が発生した情報処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定させる
ことを特徴とする情報処理装置の制御方法。
情報処理システムを稼働する複数のサイトから情報処理システムの復旧先となるサイトを決定する情報処理装置に
各情報処理システムが使用する機能に関する第１の情報と各サイトにおいて情報処理シ
ステムが使用可能な機能に関する第２の情報を取得させ、
前記複数のサイトの第１のサイトにおいて情報処理システムに障害が発生した場合に、前記取得された前記第１の情報および前記第２の情報に基づいて、前記障害が発生した情報処理システムが使用する機能を使用可能なサイトを、前記障害が発生した情報処理システムの復旧先として決定させる
ためのプログラム。