JP2010140106A - ジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラム - Google Patents

ジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラム Download PDF

Info

Publication number
JP2010140106A
JP2010140106A JP2008313665A JP2008313665A JP2010140106A JP 2010140106 A JP2010140106 A JP 2010140106A JP 2008313665 A JP2008313665 A JP 2008313665A JP 2008313665 A JP2008313665 A JP 2008313665A JP 2010140106 A JP2010140106 A JP 2010140106A
Authority
JP
Japan
Prior art keywords
job
execution
server
job execution
flow
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008313665A
Other languages
English (en)
Other versions
JP5359234B2 (ja
Inventor
Kosuke Hideshima
功介 秀島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008313665A priority Critical patent/JP5359234B2/ja
Publication of JP2010140106A publication Critical patent/JP2010140106A/ja
Application granted granted Critical
Publication of JP5359234B2 publication Critical patent/JP5359234B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】稼働系サーバによるジョブフローの制御を待機系サーバに円滑に引き継ぐことが可能なジョブ実行システムを提供する。
【解決手段】通常状態のとき、稼働系サーバ70からジョブ実行サーバ100,110に対してジョブが投入されて実行される。ジョブ実行サーバ100,110にて、ジョブの開始、実行中又は終了を示すジョブ実行状況情報が記録される。ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、待機系サーバ80により、同ジョブ実行サーバ100,110からジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開箇所(再開ポイント)が決定されると共に、同ジョブ実行サーバ100,110に対して再開箇所(再開ポイント)からジョブの実行の継続が指示される。
【選択図】図1

Description

この発明は、ジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラムに係り、たとえば自然災害が発生した場合などのような緊急時、稼働系サーバによるジョブフローの制御を待機系サーバに引き継ぐ場合に用いて好適なジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラムに関する。
コンピュータの仕事の単位であるジョブが投入されて順次実行するジョブ実行サーバを有するジョブ実行システムでは、通常状態のとき、同ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、同稼働系サーバに対して通常状態で予備となる待機系サーバとが設けられ、たとえば大規模災害などが発生した場合のシステムダウンに対応するために、2重化された構成となっているものがある。
この種のジョブ実行システムは、たとえば図7に示すように、稼動系サーバ10と、待機系サーバ20と、スケジュール情報記憶部31と、ジョブフロー情報記憶部32と、系切替え部41,42と、ジョブ実行サーバ50,60とから構成されている。稼動系サーバ10は、スケジュール判断部11と、ジョブフロー制御部12とを有している。待機系サーバ20は、スケジュール判断部21と、ジョブフロー制御部22とを有している。ジョブ実行サーバ50は、ジョブ実行部51と、ジョブ実行状況情報記録部52とを有している。ジョブ実行サーバ60は、ジョブ実行部61と、ジョブ実行状況情報記録部62とを有している。
このジョブ実行システムでは、スケジュール情報記憶部31に、各ジョブ実行サーバ50,60がジョブを実行するための日時情報がスケジュール情報としてあらかじめ記憶され、また、ジョブフロー情報記憶部32に、ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている。稼働系サーバ10では、スケジュール判断部11により、スケジュール情報記憶部31に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かが判断され、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。ジョブフロー制御部12では、スケジュール判断部11からジョブフローの投入要求が行われたとき、ジョブフロー情報記憶部32に記憶されているジョブフロー情報に基づいて、ジョブの実行順序及び実行サーバを特定し、該当するジョブを系切替え部41,42を経て各ジョブ実行サーバ50,60へ投入すると共に、各ジョブ実行サーバ50,60からのジョブの終了通知を待ち合わせ、上記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する。
各ジョブ実行サーバ50,60では、ジョブ実行部51,61により、ジョブフロー制御部12から投入されたジョブの実行が開始されると共に、同ジョブの終了時に同ジョブの終了がジョブフロー制御部12に通知される。また、ジョブ実行状況情報記録部52,62では、ジョブ実行部51,61で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)が記録される。系切替え部41は、系切替え信号scにより制御され、通常状態のとき、各ジョブ実行サーバ50と稼働系サーバ10のジョブフロー制御部12とを接続する一方、系切替え状態となったとき、同各ジョブ実行サーバ50,60と待機系サーバ20のジョブフロー制御部22とを接続する。また、系切替え部42では、通常状態のとき、各ジョブ実行サーバ60と稼働系サーバ10のジョブフロー制御部12とを接続する一方、系切替え状態となったとき、各ジョブ実行サーバ60と待機系サーバ20のジョブフロー制御部22とを接続する。稼働系サーバ10でシステムダウンとなり、系切替え状態となったとき、待機系サーバ20では、スケジュール判断部21により、稼働系サーバ10のスケジュール判断部11と同様の動作が行われ、また、ジョブフロー制御部22により、稼働系サーバ10のジョブフロー制御部12と同様の動作が行われる。
上記のジョブ実行システムの他、この種の関連する技術としては、たとえば、特許文献1に記載されたジョブシステムにおける遅延要因解析方法がある。
この解析方法では、管理マネージャ計算機により、各ジョブ実行計算機からジョブの実行履歴が収集され、後に実行されるジョブから前に実行されるジョブに向けて、順次、ジョブの遅延が検出されなくなるまで、各ジョブの履歴が参照され、各ジョブに遅延が生じた要因が判断される。
また、特許文献2に記載された障害ホストジョブの継続制御方式では、スケジュール実行手段により、スケジュール定義にしたがってジョブが実行されると共に、ジョブ再起動指示を受けて指定されたジョブ以降が、ジョブスケジュールにしたがって実行される。ジョブ動作履歴書き込み手段により、ジョブ起動/停止認識手段を介して得たスケジュール実行手段によるジョブの起動及び停止に関する情報が、共有ファイルであるジョブ動作履歴記録ファイルに記録される。ジョブ動作履歴読み出し手段により、ジョブ動作履歴記録ファイルより他ホスト障害認識手段を介して得られるシステム中断ホストのジョブの起動及び停止動作に関する情報が読み出される。ジョブ動作状態判定手段により、システム中断ホストのジョブの起動及び停止動作に関する情報からシステム中断発生時のジョブの再起動指示が出力される。
また、特許文献3に記載されたコンピュータアプリケーションにおけるデータ損失を最小限にするシステムでは、システムに障害が起こったとき、それに応答して、プログラムの保存及び/又は終了を表す既知のコード経路上にプログラムの実行がリダイレクトされ、プログラムが一時中止され、障害が修復された後にリストアされ、アプリケーションの障害の後のリストアに備えてアプリケーションのステートのスナップショットをとることにより、障害が許容される。
特開2000−231502号公報(要約書、図1) 特開平06−124214号公報(要約書、図1) 特表2008−507767号公報(要約書、図1)
しかしながら、上記文献に記載の技術を含む上記技術では、次のような問題点があった。
すなわち、図7のジョブ実行システムでは、稼動系サーバ10及び待機系サーバ20は、互いに遠隔地に配置されることがあるが、スケジュール情報記憶部31及びジョブフロー情報記憶部32が共有され、ネットワークを介して接続されているので、系切替え状態となったとき、稼動系サーバ10から待機系サーバ20へジョブ実行状況情報を引継ぐことは、ネットワークにかかる負荷が大きくなるため、困難になる。また、実行状況情報の引継ぎができない場合、オペレータがジョブフロー中の個々のジョブ実行状況を確認し、ジョブフロー中の実行再開ポイントを決定する必要があり、操作に手間がかかるという問題点がある。
また、特許文献1に記載された遅延要因解析方法では、ジョブシステムにより遅延が検出されるが、ジョブフローの実行を引き継ぐものではないため、上記問題点は改善されず、また、情報収集する契機も、稼働系、待機系の切り替え時のみであり、動作が異なっている。
特許文献2に記載された継続制御方式では、共有ファイルが用いられているので、ファイルを共有できないような遠隔地での系切り替えには対応できないため、上記問題点は改善されない。
特許文献3に記載されたデータ損失を最小限にするシステムは、データ損失を最小限にする機能を有するものであり、ジョブの切り替えを行うものではない。また、アプリケーションを再開させるか否かが判定されるが、ジョブフローの再開を判定するものではなく、上記問題点は改善されない。
この発明は、上述の事情に鑑みてなされたもので、稼働系サーバによるジョブフローの制御を待機系サーバに円滑に引き継ぐジョブ実行システム、該システムに用いられるジョブフロー引継ぎ方法及びジョブフロー引継ぎ制御プログラムを提供することを目的としている。
上記課題を解決するために、この発明の第1の構成は、ジョブ実行システムに係り、投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有し、前記待機系サーバは、前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、ジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示するジョブ実行引継ぎ指示手段が設けられていることを特徴としている。
この発明の第2の構成は、ジョブフロー引継ぎ方法に係り、投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有するジョブ実行システムに用いられ、前記待機系サーバが、前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、ジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示するジョブ実行引継ぎ指示処理を行うことを特徴としている。
この発明の構成によれば、各ジョブ実行サーバに対するジョブの投入を、稼動系サーバから待機系サーバに円滑に引き継ぐことができる。
各ジョブ実行サーバは、少なくともジョブの開始、実行中又は終了を示すジョブ実行状況情報を記録する構成とされ、待機系サーバは、各ジョブ実行サーバが上記ジョブの実行中に、上記系切替え状態となったとき、上記各ジョブ実行サーバから上記ジョブ実行状況情報を収集し、同ジョブ実行状況情報に基づいてジョブフローの再開箇所を決定すると共に、上記各ジョブ実行サーバに対して同再開箇所から上記ジョブの実行の継続を指示するジョブ実行引継ぎ指示手段が設けられているジョブ実行システムを提供する。この発明の構成によれば、各ジョブ実行サーバでジョブ実行状況情報が記録され、同各ジョブ実行サーバがジョブの実行中に、系切替え状態となったとき、待機系サーバにより、同各ジョブ実行サーバからジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開箇所が決定されると共に、同各ジョブ実行サーバに対して再開箇所からジョブの実行の継続が指示されるので、共有ディスク装置などを用いることなく、各ジョブ実行サーバに対するジョブの投入を、稼動系サーバから待機系サーバに円滑に引き継ぐことができる。
また、この発明の好適な形態では、上記稼働系サーバは、上記各ジョブ実行サーバがジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている第1のスケジュール情報記憶部と、該第1のスケジュール情報記憶部に記憶されている上記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第1のスケジュール判断部と、ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている第1のジョブフロー情報記憶部と、上記スケジュール判断部から上記ジョブフローの投入要求が行われたとき、上記ジョブフロー情報記憶部に記憶されている上記ジョブフロー情報に基づいて、上記ジョブの実行順序及び実行サーバを特定し、該当するジョブを上記各ジョブ実行サーバへ投入すると共に、上記各ジョブ実行サーバからのジョブの終了通知を待ち合わせ、上記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する第1のジョブフロー制御部とを備え、上記各ジョブ実行サーバは、上記ジョブフロー制御部から投入されたジョブの実行を開始すると共に、該ジョブの終了時に該ジョブの終了を上記ジョブフロー制御部に通知するジョブ実行部と、上記ジョブ実行部で実行されたジョブの上記ジョブ実行状況情報を記録するジョブ実行状況情報記録部とを備え、上記待機系サーバは、上記稼働系サーバの上記第1のスケジュール情報記憶部と同一のスケジュール情報があらかじめ記憶されている第2のスケジュール情報記憶部と、該第2のスケジュール情報記憶部に記憶されている上記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第2のスケジュール判断部と、上記稼働系サーバの上記第1のジョブフロー情報記憶部と同一のジョブフロー情報があらかじめ記憶されている第2のジョブフロー情報記憶部とを有し、上記ジョブ実行引継ぎ指示手段は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報を収集してジョブフロー中の実行中のジョブを決定するジョブフロー引継ぎ部と、該ジョブフロー引継ぎ部で決定された上記実行中のジョブの通知を受け、該ジョブを該当する上記各ジョブ実行サーバへ投入して上記ジョブの実行の継続を指示する第2のジョブフロー制御部とを備えている。
また、この発明の好適な形態では、上記ジョブフロー引継ぎ部は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報を収集するジョブ実行状況情報収集部と、該ジョブ実行状況情報収集部で収集された上記ジョブ実行状況情報に基づいて、実行中のジョブの再開箇所を決定する実行再開箇所判断部とから構成され、上記第2のジョブフロー制御部は、上記実行再開箇所判断部で決定された上記実行中のジョブの再開箇所から上記各ジョブ実行サーバに上記ジョブの実行を継続させる構成とされている。
また、この発明の好適な形態では、上記ジョブ実行状況情報収集部は、上記系切替え状態となったとき、上記各ジョブ実行サーバの上記ジョブ実行状況情報記録部から上記ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する構成とされている。
また、この発明の好適な形態では、上記実行再開箇所判断部で決定された上記実行中のジョブの再開箇所を上記ジョブ実行システムの管理者に提示して確認させるための実行再開箇所確認部が設けられている。
実施形態1
図1は、この発明の第1の実施形態であるジョブ実行システムの要部の電気的構成を示すブロック図である。
この形態のジョブ実行システムは、同図に示すように、稼動系サーバ70と、待機系サーバ80と、系切替え部91,92と、ジョブ実行サーバ100,110とから構成されている。ジョブ実行サーバ100,110は、投入されたジョブを実行する。稼動系サーバ70は、通常状態のとき、各ジョブ実行サーバ100,110に対して該当するジョブを投入して実行させる。待機系サーバ80は、稼働系サーバ70に対して通常状態で予備となる。系切替え部91,92は、系切替え信号scにより制御され、通常状態のとき、各ジョブ実行サーバ100,110と稼働系サーバ70とを接続する一方、系切替え状態となったとき、各ジョブ実行サーバ100,110と待機系サーバ80とを接続する。上記系切替え信号scは、たとえば、このジョブ実行システムの管理者により入力される。
特に、この実施形態では、稼働系サーバ70は、スケジュール情報記憶部71と、ジョブフロー情報記憶部72と、スケジュール判断部73と、ジョブフロー制御部74とを備えている。スケジュール情報記憶部71は、たとえばRAM(Random Access Memory)などで構成され、ジョブ実行サーバ100,110がジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている。ジョブフロー情報記憶部72は、たとえばRAMなどで構成され、ジョブの実行順序及び実行サーバ100,110がジョブフロー情報としてあらかじめ記憶されている。
スケジュール判断部73は、スケジュール情報記憶部71に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。ジョブフロー制御部74は、スケジュール判断部73からジョブフローの投入要求が行われたとき、ジョブフロー情報記憶部72に記憶されているジョブフロー情報に基づいて、ジョブの実行順序及び実行サーバ100,110を特定する。そして、ジョブフロー制御部74は、該当するジョブを各ジョブ実行サーバ100,110へ投入すると共に、各ジョブ実行サーバ100,110からのジョブの終了通知を待ち合わせ、同ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するジョブを決定して投入する。
ジョブ実行サーバ100は、ジョブ実行部101と、ジョブ実行状況情報記録部102とを備えている。ジョブ実行部101は、ジョブフロー制御部74から投入されたジョブの実行を開始すると共に、同ジョブの終了時に同ジョブの終了を同ジョブフロー制御部74に通知する。ジョブ実行状況情報記録部102は、ジョブ実行部101で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)を記録する。ジョブ実行サーバ110は、ジョブ実行部111と、ジョブ実行状況情報記録部112とを備えている。ジョブ実行部111は、ジョブフロー制御部74から投入されたジョブの実行を開始すると共に、同ジョブの終了時に同ジョブの終了をジョブフロー制御部74に通知する。ジョブ実行状況情報記録部112は、ジョブ実行部111で実行されたジョブのジョブ実行状況情報(開始、実行中、終了)を記録する。
待機系サーバ80は、スケジュール情報記憶部81と、ジョブフロー情報記憶部82と、スケジュール判断部83と、ジョブフロー制御部84と、ジョブフロー引継ぎ部85とを備えている。スケジュール情報記憶部81は、稼働系サーバ70のスケジュール情報記憶部71と同一のスケジュール情報があらかじめ記憶されている。ジョブフロー情報記憶部82は、稼働系サーバ70のジョブフロー情報記憶部72と同一のジョブフロー情報があらかじめ記憶されている。スケジュール判断部83は、スケジュール情報記憶部81に記憶されているスケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合(すなわち、ジョブを実行する日時になったとき)は、ジョブフローの投入要求を行う。
ジョブフロー引継ぎ部85は、系切替え信号scにより制御され、ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、同ジョブ実行サーバ100,110からジョブ実行状況情報を収集し、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントを決定する。特に、この実施形態では、ジョブフロー引継ぎ部85は、ジョブ実行状況情報収集部85aと、実行再開ポイント判断部85bと、CPU(中央処理装置)85cと、ROM(Read Only Memory)85dとから構成されている。ジョブ実行状況情報収集部85aは、系切替え状態となったとき、各ジョブ実行サーバ100,110のジョブ実行状況情報記録部102,112から上記ジョブ実行状況情報を収集し、特に、この実施形態では、同ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する。実行再開ポイント判断部85bは、ジョブ実行状況情報収集部85aで収集された上記ジョブ実行状況情報に基づいて、実行中のジョブの再開ポイント(再開箇所)を決定する。CPU85cは、同ジョブフロー引継ぎ部85全体を制御するコンピュータであり、ROM85dは、同CPU85cを動作させるためのジョブフロー引継ぎ制御プログラムが記録されている。ジョブフロー制御部84は、ジョブフロー引継ぎ部85の実行再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントから各ジョブ実行サーバ100,110に上記ジョブの実行を継続させる。上記ジョブフロー引継ぎ部85及びジョブフロー制御部84により、ジョブ実行引継ぎ指示手段が構成されている。
図2は、スケジュール判断部73の動作を説明するフローチャート、図3は、ジョブフロー制御部74の動作を説明するフローチャート及び動作説明図、図4は、ジョブ実行部101,111の動作を説明するフローチャート及び動作説明図、及び図5が、ジョブフロー引継ぎ部85の動作を説明するフローチャート及び動作説明図である。
これらの図を参照して、この形態のジョブ実行システムに用いられるジョブフロー引継ぎ方法の処理内容について説明する。
このジョブ実行システムでは、通常状態のとき、稼働系サーバ70により、ジョブ実行サーバ100,110に対して該当するジョブが投入される。ジョブ実行サーバ100,110では、投入されたジョブが実行される。待機系サーバ80は、稼働系サーバ70に対して通常状態で予備となっている。通常状態のとき、系切替え部91,92により、ジョブ実行サーバ100,110と稼働系サーバ70とが接続される一方、系切替え状態となったとき、ジョブ実行サーバ100,110と待機系サーバ80とが接続される。ジョブ実行サーバ100,110にて、ジョブの開始、実行中又は終了を示すジョブ実行状況情報が記録される。ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、待機系サーバ80により、同ジョブ実行サーバ100,110からジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントが決定されると共に、同ジョブ実行サーバ100,110に対して再開ポイントからジョブの実行の継続が指示される(ジョブ実行引継ぎ指示処理)。
すなわち、スケジュール判断部73では、図2に示すように、スケジュール情報記憶部71からスケジュール情報が読み込まれ(ステップA1)、定義されている日時情報から起動するためのジョブフローがあるか否かが判断され(ステップA2)、起動するためのジョブフローがある場合は、ジョブフロー制御部74に対してジョブフロー投入を要求する(ステップA3)。このとき、ジョブフロー投入の要求には、日時情報(すなわち、何時実行のジョブフローであるかを示す情報)が付与される。
ジョブフロー制御部74では、図3(a)に示すように、ジョブフロー情報記憶部72からジョブフロー情報が読み込まれ(ステップB1)、ジョブフローの中で実行するジョブが決定される(ステップB2)。ジョブの投入先のジョブ実行サーバが特定され、そのサーバにジョブの投入が行われ(ステップB3)、この後、投入したジョブの終了を待ち合わせる(ステップB4)。終了を待ちあせた後、そのジョブがジョブフロー中の最後のジョブであるか否かが判断され(ステップB5)、後続のジョブが存在すれば、次に実行するジョブが決定されて投入される。この場合、図3(b)に示すように、ジョブフロー1では、スケジュール時刻“12:00”にて、ジョブ実行サーバ100により、先頭のJOB(ジョブ)1から実行され、JOB1が終了した後、ジョブ実行サーバ110により、JOB2が「実行中」の状態である。また、ジョブ実行サーバ100では、JOB3が未実行の状態である。
ジョブ実行サーバ100,110では、ジョブ実行部101,111により、図4(a)に示すように、ジョブの投入が受け付けられ(ステップC1)、同ジョブの実行が開始され(ステップC2)、この実行を開始したことがジョブ実行状況情報記録部102,112に記録される(ステップC3)。この後、ジョブ終了の待ち合わせが行われ、終了したら、ジョブフロー制御部74に終了したことが通知され(ステップC4)、また、終了したことがジョブ実行状況情報記録部102,112に記録される(ステップC5)。この場合、図4(b)に示すように、ジョブ実行サーバ100によるJOB1が終了した後、ジョブ実行サーバ110によるJOB2が「実行中」の状態であり、ジョブ実行サーバ100では、JOB3が未実行の状態であるので、図4(c)に示すように、ジョブフロー1では、ジョブ実行サーバ100のジョブ実行状況情報記録部102に、終了したJOB1の情報が記録され、また、図4(d)に示すように、ジョブ実行サーバ110のジョブ実行状況情報記録部112に、実行中のJOB2の情報が記録される。
ジョブフロー引継ぎ部85では、図5(a)に示すように、ジョブ実行状況情報収集部85aにより、ジョブ実行サーバ100,110から実行中のジョブの情報のみが収集される(ステップD1)。実行再開ポイント判断部85bにより、ジョブ実行状況情報収集部85aで収集された上記ジョブ実行状況情報に基づいて、ジョブフロー中の実行中のジョブの再開ポイントが決定される(ステップD2)。この決定されたジョブの再開ポイントは、ジョブフロー制御部84に通知される。そして、ジョブフロー制御部84により、実行再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントから各ジョブ実行サーバ100,110に上記ジョブの実行を継続させる。この後、実行中ジョブ以外の情報についても、ジョブ実行状況情報収集部85aで情報が収集され(ステップD3)、ジョブフローの各ジョブの状態に反映されて決定される(ステップD4)。ジョブフロー引継ぎ部85では、収集したジョブ実行状況情報に基づいて、各ジョブの状態が決定され、実行中のジョブから実行が継続される。この形態では、図5(b)に示すように、JOB2が実行中であるため、同JOB2から実行が引き継がれる。
以上のように、この第1の実施形態では、ジョブ実行サーバ100,110でジョブ実行状況情報が記録され、同ジョブ実行サーバ100,110がジョブの実行中に、系切替え状態となったとき、待機系サーバ80により、同ジョブ実行サーバ100,110からジョブ実行状況情報が収集され、同ジョブ実行状況情報に基づいてジョブフローの再開ポイントが決定されると共に、同ジョブ実行サーバ100,110に対して再開ポイントからジョブの実行の継続が指示されるので、共有ディスク装置などを用いることなく、ジョブ実行サーバ100,110に対するジョブの投入が、稼動系サーバ70から待機系サーバ80に円滑に引き継がれる。また、系切替え状態となったとき、ジョブ実行状況情報収集部85aにより、ジョブ実行状況情報のうちの実行中のジョブの情報が優先して収集されるので、系切替え状態で必要となるジョブ実行状況情報が短時間で引き継がれる。
実施形態2
図6は、この発明の第2の実施形態であるジョブ実行システムの電気的構成を示すブロック図であり、第1の実施形態を示す図1中の要素と共通の要素には共通の符号が付されている。
この形態のジョブ実行システムでは、同図6に示すように、図1中の待機系サーバ80に代えて、新たな機能が付加された待機系サーバ80Aが設けられている。待機系サーバ80Aでは、待機系サーバ80の構成に加え、実行再開ポイント確認部86が設けられている。実行再開ポイント確認部86は、たとえば液晶表示装置などで構成され、再開ポイント判断部85bで決定された上記実行中のジョブの再開ポイントを、このジョブ実行システムの管理者に提示して確認させるためのものである。
このジョブ実行システムでは、再開ポイント判断部85bで決定された実行中のジョブの再開ポイントが、実行再開ポイント確認部86により、システムの管理者に提示されるので、同管理者は、容易に再開ポイントを確認することができ、系切り替え時に実際にジョブフローやジョブの実行状況によって引継ぎを行うか否かを選択できるようになり、柔軟に対応することができる。
以上、この発明の実施形態を図面により詳述してきたが、具体的な構成は同実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更などがあっても、この発明に含まれる。
たとえば、系切替え信号scは、上記各実施形態では、管理者により入力されるが、たとえば自然災害が発生した場合に気象庁などから通信回線を介して供給されるものでも良く、また、自然災害を検出する装置(たとえば、地震計など)から供給されるものでも良い。
この発明は、通常状態で各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、同該稼働系サーバに対して通常状態で予備となる待機系サーバとを有する2重化された構成のジョブ実行システム全般に適用できる。
この発明の第1の実施例であるジョブ実行システムの要部の電気的構成を示すブロック図である。 スケジュール判断部73の動作を説明するフローチャートである。 ジョブフロー制御部74の動作を説明するフローチャート及び動作説明図である。 ジョブ実行部101,111の動作を説明するフローチャート及び動作説明図である。 ジョブフロー引継ぎ部85の動作を説明するフローチャート及び動作説明図である。 この発明の第2の実施形態であるジョブ実行システムの電気的構成を示すブロック図である。 ジョブ実行システムの電気的構成例を示すブロック図である。
符号の説明
70 稼動系サーバ(ジョブ実行システムの一部)
71,81 スケジュール情報記憶部
72,82 ジョブフロー情報記憶部
73,83 スケジュール判断部
74 ジョブフロー制御部
80,80A 待機系サーバ(ジョブ実行システムの一部)
84 ジョブフロー制御部(ジョブ実行引継ぎ指示手段の一部)
85 ジョブフロー引継ぎ部(ジョブ実行引継ぎ指示手段の一部)
85a ジョブ実行状況情報収集部
85b 実行再開ポイント判断部
85c CPU(中央処理装置)
85d ROM(Read Only Memory)
86 実行再開ポイント確認部(実行再開箇所判断部)
91,92 系切替え部(ジョブ実行システムの一部)
100,110 ジョブ実行サーバ(ジョブ実行システムの一部)
101,111 ジョブ実行部
102,112 ジョブ実行状況情報記録部

Claims (9)

  1. 投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、
    通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、
    該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、
    前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有し、
    前記待機系サーバは、
    前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、ジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示するジョブ実行引継ぎ指示手段が設けられていることを特徴とするジョブ実行システム。
  2. 前記各ジョブ実行サーバは、
    少なくとも前記ジョブの開始、実行中又は終了を示すジョブ実行状況情報を記録する構成とされ、
    前記待機系サーバの前記ジョブ実行引継ぎ指示手段は、
    前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、前記各ジョブ実行サーバから前記ジョブ実行状況情報を収集し、該ジョブ実行状況情報に基づいてジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示する構成とされていることを特徴とする請求項1記載のジョブ実行システム。
  3. 前記稼働系サーバは、
    前記各ジョブ実行サーバがジョブを実行するための日時がスケジュール情報としてあらかじめ記憶されている第1のスケジュール情報記憶部と、
    該第1のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第1のスケジュール判断部と、
    ジョブの実行順序及び実行サーバがジョブフロー情報としてあらかじめ記憶されている第1のジョブフロー情報記憶部と、
    前記スケジュール判断部から前記ジョブフローの投入要求が行われたとき、前記ジョブフロー情報記憶部に記憶されている前記ジョブフロー情報に基づいて、前記ジョブの実行順序及び実行サーバを特定し、該当するジョブを前記各ジョブ実行サーバへ投入すると共に、前記各ジョブ実行サーバからのジョブの終了通知を待ち合わせ、前記ジョブがジョブフロー中の最後のジョブであるか否かを判断し、後続のジョブが存在するとき、次に実行するためのジョブを決定して投入する第1のジョブフロー制御部とを備え、
    前記各ジョブ実行サーバは、
    前記ジョブフロー制御部から投入されたジョブの実行を開始すると共に、該ジョブの終了時に該ジョブの終了を前記ジョブフロー制御部に通知するジョブ実行部と、
    前記ジョブ実行部で実行されたジョブの前記ジョブ実行状況情報を記録するジョブ実行状況情報記録部とを備え、
    前記待機系サーバは、
    前記稼働系サーバの前記第1のスケジュール情報記憶部と同一のスケジュール情報があらかじめ記憶されている第2のスケジュール情報記憶部と、
    該第2のスケジュール情報記憶部に記憶されている前記スケジュール情報に基づいて、起動するためのジョブフローがあるか否かを判断し、起動するためのジョブフローがある場合は、ジョブフローの投入要求を行う第2のスケジュール判断部と、
    前記稼働系サーバの前記第1のジョブフロー情報記憶部と同一のジョブフロー情報があらかじめ記憶されている第2のジョブフロー情報記憶部とを有し、
    前記ジョブ実行引継ぎ指示手段は、
    前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報を収集してジョブフロー中の実行中のジョブを決定するジョブフロー引継ぎ部と、
    該ジョブフロー引継ぎ部で決定された前記実行中のジョブの通知を受け、該ジョブを該当する前記各ジョブ実行サーバへ投入して前記ジョブの実行の継続を指示する第2のジョブフロー制御部とを備えてなることを特徴とする請求項2記載のジョブ実行システム。
  4. 前記ジョブフロー引継ぎ部は、
    前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報を収集するジョブ実行状況情報収集部と、
    該ジョブ実行状況情報収集部で収集された前記ジョブ実行状況情報に基づいて、実行中のジョブの再開箇所を決定する実行再開箇所判断部とから構成され、
    前記第2のジョブフロー制御部は、
    前記実行再開箇所判断部で決定された前記実行中のジョブの再開箇所から前記各ジョブ実行サーバに前記ジョブの実行を継続させる構成とされていることを特徴とする請求項3記載のジョブ実行システム。
  5. 前記ジョブ実行状況情報収集部は、
    前記系切替え状態となったとき、前記各ジョブ実行サーバの前記ジョブ実行状況情報記録部から前記ジョブ実行状況情報のうちの実行中のジョブの情報を優先して収集する構成とされていることを特徴とする請求項4記載のジョブ実行システム。
  6. 前記実行再開箇所判断部で決定された前記実行中のジョブの再開箇所を前記ジョブ実行システムの管理者に提示して確認させるための実行再開箇所確認部が設けられていることを特徴とする請求項4又は5記載のジョブ実行システム。
  7. 投入されたジョブを実行する1つ又は複数のジョブ実行サーバと、
    通常状態のとき、前記各ジョブ実行サーバに対して該当するジョブを投入して実行させる稼働系サーバと、
    該稼働系サーバに対して前記通常状態で予備となる待機系サーバと、
    前記通常状態のとき、前記各ジョブ実行サーバと前記稼働系サーバとを接続する一方、系切替え状態となったとき、前記各ジョブ実行サーバと前記待機系サーバとを接続する系切替え部とを有するジョブ実行システムに用いられ、
    前記待機系サーバが、前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、ジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示するジョブ実行引継ぎ指示処理を行うことを特徴とするジョブフロー引継ぎ方法。
  8. 前記各ジョブ実行サーバが、少なくとも前記ジョブの開始、実行中又は終了を示すジョブ実行状況情報を記録する構成とされ、
    前記ジョブ実行引継ぎ指示処理では、
    前記各ジョブ実行サーバが前記ジョブの実行中に、前記系切替え状態となったとき、
    前記待機系サーバが、前記各ジョブ実行サーバから前記ジョブ実行状況情報を収集し、該ジョブ実行状況情報に基づいてジョブフローの再開箇所を決定すると共に、前記各ジョブ実行サーバに対して該再開箇所から前記ジョブの実行の継続を指示することを特徴とする請求項7記載のジョブフロー引継ぎ方法。
  9. コンピュータを請求項1乃至6のいずれか一に記載のジョブ実行引継ぎ指示手段として機能させるためのコンピュータ読み取り可能なジョブフロー引継ぎ制御プログラム。
JP2008313665A 2008-12-09 2008-12-09 ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム Expired - Fee Related JP5359234B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008313665A JP5359234B2 (ja) 2008-12-09 2008-12-09 ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008313665A JP5359234B2 (ja) 2008-12-09 2008-12-09 ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム

Publications (2)

Publication Number Publication Date
JP2010140106A true JP2010140106A (ja) 2010-06-24
JP5359234B2 JP5359234B2 (ja) 2013-12-04

Family

ID=42350221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008313665A Expired - Fee Related JP5359234B2 (ja) 2008-12-09 2008-12-09 ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム

Country Status (1)

Country Link
JP (1) JP5359234B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138454A (ja) * 2010-01-04 2011-07-14 Nomura Research Institute Ltd 運用管理装置、運用システムおよび定義データ同期方法
JP2014066664A (ja) * 2012-09-27 2014-04-17 Hitachi Solutions Ltd 地震発生時の自動運用切り替えシステムおよび方法
JP7508974B2 (ja) 2020-09-28 2024-07-02 日本電気株式会社 ジョブ管理装置、ジョブ管理システム、ジョブ管理方法およびジョブ管理プログラム

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02109154A (ja) * 1988-10-18 1990-04-20 Nippon Telegr & Teleph Corp <Ntt> ジョブ制御方法
JPH06124214A (ja) * 1992-10-09 1994-05-06 Nec Corp 障害ホストジョブの継続制御方式
JPH08227368A (ja) * 1995-02-20 1996-09-03 Nec Corp ジョブ再実行方式
JPH10326201A (ja) * 1997-05-26 1998-12-08 Nec Corp 分散バッチジョブ処理システムおよびその障害時におけるジョブの自動再起動方法
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体
JP2000231502A (ja) * 1998-12-09 2000-08-22 Hitachi Ltd ジョブシステムにおける遅延要因解析方法
JP2001290666A (ja) * 2000-04-05 2001-10-19 Nec Software Chubu Ltd ジョブ投入制御装置、ジョブ投入制御方法、記録媒体
JP2005242848A (ja) * 2004-02-27 2005-09-08 Nec Corp バッチジョブ実行制御システム、そのプログラム及び該プログラムを記録した記録媒体
JP2008507767A (ja) * 2004-07-20 2008-03-13 ソフトリシティ インコーポレイテッド コンピュータアプリケーションにおけるデータ損失を最小限にする方法およびシステム

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02109154A (ja) * 1988-10-18 1990-04-20 Nippon Telegr & Teleph Corp <Ntt> ジョブ制御方法
JPH06124214A (ja) * 1992-10-09 1994-05-06 Nec Corp 障害ホストジョブの継続制御方式
JPH08227368A (ja) * 1995-02-20 1996-09-03 Nec Corp ジョブ再実行方式
JPH10326201A (ja) * 1997-05-26 1998-12-08 Nec Corp 分散バッチジョブ処理システムおよびその障害時におけるジョブの自動再起動方法
JPH11259326A (ja) * 1998-03-13 1999-09-24 Ntt Communication Ware Kk ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体
JP2000231502A (ja) * 1998-12-09 2000-08-22 Hitachi Ltd ジョブシステムにおける遅延要因解析方法
JP2001290666A (ja) * 2000-04-05 2001-10-19 Nec Software Chubu Ltd ジョブ投入制御装置、ジョブ投入制御方法、記録媒体
JP2005242848A (ja) * 2004-02-27 2005-09-08 Nec Corp バッチジョブ実行制御システム、そのプログラム及び該プログラムを記録した記録媒体
JP2008507767A (ja) * 2004-07-20 2008-03-13 ソフトリシティ インコーポレイテッド コンピュータアプリケーションにおけるデータ損失を最小限にする方法およびシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011138454A (ja) * 2010-01-04 2011-07-14 Nomura Research Institute Ltd 運用管理装置、運用システムおよび定義データ同期方法
JP2014066664A (ja) * 2012-09-27 2014-04-17 Hitachi Solutions Ltd 地震発生時の自動運用切り替えシステムおよび方法
JP7508974B2 (ja) 2020-09-28 2024-07-02 日本電気株式会社 ジョブ管理装置、ジョブ管理システム、ジョブ管理方法およびジョブ管理プログラム

Also Published As

Publication number Publication date
JP5359234B2 (ja) 2013-12-04

Similar Documents

Publication Publication Date Title
US8046632B2 (en) Backup management method based on mode of failure
JP4940967B2 (ja) ストレージシステム、ストレージ装置、ファームウェアの活***換方法、ファームウェアの活***換プログラム
JP4497953B2 (ja) 情報処理システム、および情報処理方法
JP5948933B2 (ja) ジョブ継続管理装置、ジョブ継続管理方法、及び、ジョブ継続管理プログラム
JP4315016B2 (ja) コンピュータシステムの系切替方法
JP5998577B2 (ja) クラスタ監視装置、クラスタ監視方法、及びプログラム
JPH0950424A (ja) ダンプ採取装置およびダンプ採取方法
US8880552B2 (en) Database system and database control method
JP3972801B2 (ja) 階層型バックアップシステムにおけるバックアップ方法
JP5359234B2 (ja) ジョブ実行システム、及びジョブフロー引継ぎ制御プログラム
JPH11259326A (ja) ホットスタンバイシステムおよびホットスタンバイシステムにおける自動再実行方法およびその記録媒体
JPH1031562A (ja) 情報処理システム
JP3551079B2 (ja) 修正ロードモジュール置換後の復旧方法ならびに装置
JP3139536B2 (ja) 分散バッチジョブ処理システムおよびその障害時におけるジョブの自動再起動方法
JP2011053780A (ja) 復旧システム、復旧方法及びバックアップ制御システム
JPH05314075A (ja) オンラインコンピュータ装置
JP2002049509A (ja) データ処理システム
JP2004046658A (ja) データ転送方法
US20030225898A1 (en) Method of controlling storage control apparatus, storage control apparatus, and computer readable program for controlling the same
JP7000797B2 (ja) 起動管理装置、起動管理システム、起動管理方法、および、起動管理プログラム
JP2003006018A (ja) 処理要求復旧方式及び処理要求復旧方法及びクライアント装置及びサーバ装置
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP2008117268A (ja) 情報管理システム
JP2017004444A (ja) 情報システム、コンピュータ、方法、およびプログラム
WO2014155654A1 (ja) 情報処理装置及び情報処理装置の交換支援システム並びに交換支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130806

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130819

R150 Certificate of patent or registration of utility model

Ref document number: 5359234

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees