JPH1040123A - ジョブ管理方式と方法 - Google Patents

ジョブ管理方式と方法

Info

Publication number
JPH1040123A
JPH1040123A JP8189377A JP18937796A JPH1040123A JP H1040123 A JPH1040123 A JP H1040123A JP 8189377 A JP8189377 A JP 8189377A JP 18937796 A JP18937796 A JP 18937796A JP H1040123 A JPH1040123 A JP H1040123A
Authority
JP
Japan
Prior art keywords
job
job management
monitor
management table
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8189377A
Other languages
English (en)
Inventor
Kazue Sanbe
和重 三部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Office Systems Ltd
Original Assignee
NEC Office Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Office Systems Ltd filed Critical NEC Office Systems Ltd
Priority to JP8189377A priority Critical patent/JPH1040123A/ja
Publication of JPH1040123A publication Critical patent/JPH1040123A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

(57)【要約】 【課題】 データベースシステムにおいて、障害発生
後にデータベースの更新状態を調査することなく、中断
したジョブを再起動できるジョブ管理方式を提供する。 【解決手段】 ジョブn(010)の起動中、ジョブ
管理モニタ(100)はジョブnの進捗状況やデータベ
ースモニタ(020)からのデータベース使用状況を管
理テーブルデータ入出力手段(120)を通してジョブ
管理テーブル(140)へジョブステップごとにステッ
プ管理テーブル(141)を記録する。障害発生時、ジ
ョブ再起動手段(130)はジョブ管理モニタを通して
障害発生前の状況を再現して、中断したジョブを再起動
する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はジョブ管理方式、特
に、汎用コンピュータにおいて、データベースを利用し
ているときのシステム障害発生時に、障害原因の究明及
び復旧作業が完了した後に迅速かつ平易で高い信頼性の
もとで、ジョブの再起動が行なえるジョブ管理方式と方
法に関する。
【0002】
【従来の技術】ジョブ管理とは、コンピュータシステム
上でどのジョブが稼働中であり、メモリやハードディス
ク等のコンピュータ資源をどの程度使用(占有)してい
るか等を管理し、コンピュータシステムを効率良く稼働
・運用するためのものである。
【0003】ハードディスク等の物理的な損傷による障
害が発生し、コンピュータシステムとして現在実行して
いるジョブの稼働を継続することができなくなったと
き、稼働中であったジョブに対して、運用者がジョブを
再起動する場合、稼働中であったジョブやプログラムの
進捗状況を調査し、ジョブで使用していたマスタデータ
とトランザクションデータの更新状況などにより、再起
動をかけるためのマスタデータやトランザクションデー
タを再準備する必要がある。これらの調査及びデータの
準備作業は非常に煩雑であった。
【0004】このような問題の対策として、特開平5−
233342号公報、平4−175830号公報等が提
案されている。上記特開平5−233342号公報はコ
ンピュータシステムにおいて、ジョブの実行中に障害が
発生して処理が中断されたとき、障害の復旧後、そのジ
ョブを再起動させるときのジョブ再スタート制御方式に
関するもので、データベースを更新するジョブを実行す
るとき、自己のジョブに対応する再スタートファイルに
定期的に再スタートアドレスを書き込んでおき、コンピ
ュータシステムに何らかの障害が発生し、障害を復旧後
にジョブの再起動をかけるとき、前記再スタートファイ
ルを参照して自己のジョブに対応する前記再スタートア
ドレスから直ちに更新処理を再開することにより、中断
したジョブを最初から実行し直す必要がないため、時間
の消費削減することができるとしている。
【0005】また、前記平4−175830号公報にお
いては、コンピュータシステムの処理中に異常が発生し
たときに、その原因を取り除いた後のジョブの再実行を
効率的に制御する再実行制御方式に関するもので、コン
ピュータシステムの処理中に障害が発生して処理を中断
したとき、その原因を取り除いた後に中断したジョブの
再実行を行なわせる再実行制御方式において、実行中の
ジョブ内の各ステップの実行状況を記録したジョブ情報
と実行中のステップ内の各処理単位の実行状況及び必要
な処理結果を記録したステップ情報とを有し、ジョブの
実行状況を管理するジョブ管理レコードを不揮発性のメ
モリに設け、中断したジョブを再開する際に前記ジョブ
管理レコードを参照して正常に終了したステップ及び処
理単位を重複して再実行することなく中断したステップ
中の中断した処理単位から効率的に再実行を行なうこと
ができるとしている。
【0006】
【発明が解決しようとする課題】前述の従来技術である
特開平5−233342号公報においては、つぎのよう
な問題点がある。
【0007】第一の問題点は、データベースシステムに
おいて、複数のプログラムより検索要求や更新要求が出
される場合が多く、一つのプログラムから更新命令が発
行されたときに、他のプログラムから更新対象データへ
の検索要求が発行された場合、検索結果を保証するため
に、更新対象データを他のプログラムから使用できなく
させるロック処理を行なったうえで、ハードディスク内
に存在するデータベースの更新処理を実施する(これ
を、物理更新という)。また、更新処理を含むプログラ
ム内で更新命令発行のたびに、ハードディスクをアクセ
スすることによって処理速度が著しく低下するため、更
新対象データをロック状態にして、メモリ上のデータの
みを更新し、ディスクへの更新は未処理で待機させる論
理更新がある。通常このようなデータベースシステムに
はデータベースモニタが存在し、メモリ上で論理更新さ
れたデータをハードディスク上へ物理的に更新する最適
な時期を監視しており、このデータベースモニタの指示
により物理更新処理が行われる。従って、論理更新と物
理更新のタイミングがn:1のようなデータベースシス
テムにおいては、再スタート情報の保存時期により、論
理更新された再スタートアドレスと物理更新された再ス
タートアドレスにズレが生じる可能性があり、再スター
ト処理の後、データベースシステムに矛盾が生じてジョ
ブ処理を続行できなくなってしまう。
【0008】また、第二の問題点は、再起動をするとき
の再起動データとして、ジョブ名、ファイル名、データ
ベースの再スタートアドレスを書き込むようになってい
るが、プログラム内におけるワーク領域のデータ記録が
無いため、ジョブ再スタート制御方式ではワーク領域を
使用したプログラムでの運用はできなくなる。
【0009】また、平4−175830号公報において
も、つぎのような問題点がある。
【0010】第一の問題点として、特開平5−2333
42号公報の第一の問題点と同様で、論理更新と物理更
新が1:1のデータベースシステムでしか使用できない
点である。つまり一つのプログラムが更新処理の命令を
発行すると即座にディスク内のデータベースを書き換え
るデータベースのみを対象にしていることである。
【0011】第二の問題点は、再実行制御方式を実行す
るための再実行データとして、ジョブ情報とステップ情
報が必要になる。ジョブ情報はジョブ名、ステップ名、
処理の結果を通知するステータスの3項目を、ステップ
情報としてファイルの実行すべきポイントを示すカレン
ト情報とプログラム内のワーク情報である。更新データ
の入出力ごとに、前記ジョブ情報とステップ情報をジョ
ブ管理レコードとして書き換えている。つまり、発生ケ
ースとしては稀なシステム障害の予防手段として、通常
の処理中に前記処理がなされるとコンピュータ上の資源
を浪費するとともに処理時間の増加を招くことになる。
【0012】[発明の目的]本発明の目的は、システム
障害発生後、障害原因を取り除いた後に、障害時のジョ
ブ実行状況、各ジョブ内のステップ処理進捗状況、ま
た、再処理可能なファイルデータの調査及び作成を行な
う必要のない簡易なジョブ管理方式を提供することであ
る。
【0013】また、本発明の目的は、使用可能環境とし
ても通常ファイル、物理更新と論理更新が1:1または
1:nのデータベースシステムで使用可能となるジョブ
管理方式を提供することである。
【0014】
【課題を解決するための手段】本発明のジョブ管理方式
は、コンピュータシステムにおける起動中のジョブが使
用する入力ファイル、マスタファイル、及び出力ファイ
ルと、データベースの状況を管理するデータベースモニ
タとを備えているジョブ管理方式において、実行中のジ
ョブ実行状況を監視するジョブ管理モニタと、ジョブ管
理情報を格納しておくジョブ管理テーブルと、前記デー
タベースモニタからのジョブステップ検出の情報を受け
る前記ジョブ管理モニタの指示により前記ジョブ管理テ
ーブルの情報を受け渡しする管理用テーブルデータ入出
力手段と、障害発生後に処理が中断されたジョブを起動
するジョブ再起動手段とで構成されることを特徴とす
る。また、本発明のジョブ管理方法は、コンピュータシ
ステムにおける起動中のジョブを複数のファイルとして
管理するジョブ管理モニタと、データベースの状況を管
理するデータベースモニタとを備えているジョブ管理方
法において、前記コンピュータシステムで前記データベ
ースとデータのやり取りを行う所定回数を前記データベ
ースモニタがカウントし、所定カウント毎に前記ジョブ
管理モニタに通知し、前記ジョブ管理モニタがその通知
毎にジョブ管理テーブル内の少なくともジョブ実行中の
ファイル状況を示すファイルポインタとジョブ作業の領
域を示す作業領域データとを更新し、前記コンピュータ
システムで障害が発生したときに、前記ジョブ管理モニ
タは前記ファイルポインタ及び前記作業領域データとを
前記ファイルに収納して再起動を行うことを特徴とす
る。さらに、該ジョブ管理方法において、前記ジョブ管
理テーブルはジョブIDとジョブステップを示すステッ
プIDと作業の開始・終了を示す処理フラグを備えたこ
とを特徴とする。
【0015】[作用]管理用テーブルデータ入出力手段
によって作成、更新されるジョブ管理テーブルは起動中
のジョブごとにジョブ管理用テーブルが作成され、さら
にジョブのステップごとに処理の進捗状況が格納され
る。また、ジョブの各ステップで使用されているデータ
ファイルごとに処理ポインタを管理し、ジョブの各ステ
ップが実行中であるか、処理が終了したかを判定する処
理フラグも格納している。
【0016】
【発明の実施の形態】
[第1実施形態] 〔構成の説明〕図1を参照すると、本実施形態のジョブ
管理方式は、コンピュータ上で起動している個々のジョ
ブ1〜n(010)と、データベースの動作を監視する
データベースモニタ(020)と、起動中のジョブ1〜
nが処理で使用する入力ファイルA(011)、マスタ
ファイルB(012)、出力ファイルC(013)等の
ファイル群(030)と、オペレーティングシステムや
データベースモニタからの通知を受け、動作するジョブ
管理モニタ(100)と、ジョブ管理モニタ(100)
からの制御により動作する管理用テーブルデータ入出力
手段(120)と、管理用テーブルデータ入出力手段
(120)によって管理されるジョブ単位のジョブ管理
テーブル(140)とを含んでいる。
【0017】上記ジョブ管理テーブル(140)は、ジ
ョブのステップごとにプログラムの進捗状況を管理する
ステップ管理テーブル(141〜14n)を備えてい
る。
【0018】図2のフローチャートを参照して、構成内
容をさらに説明する。任意のジョブnが起動する(A0
1)と、ジョブ管理モニタ(100)がジョブnの起動
を認識して、ジョブnの実行状態の監視処理を開始する
(A02)。
【0019】管理用テーブルデータ入出力手段(12
0)は前記ジョブ管理モニタ(100)を介してジョブ
n用のジョブn管理テーブルの作成指示を出す(A0
3)。
【0020】前記ジョブnの監視処理によりオペレーテ
ィングシステムからのステップ開始や終了通知、または
データベースモニタからの通知情報を待つ(A04)。
【0021】前記ジョブnの監視処理によりオペレーテ
ィングシステムやデータベースモニタからの通知の内容
により、ステップ開始通知やステップ終了通知、データ
ベースモニタよりの静止点確立情報通知、ジョブ終了通
知等があったかどうかの条件ブロックの判定を行なう
(B01,B02,B03)。
【0022】前記条件ブロックの判定により管理用テー
ブルデータ入出力手段はジョブn用管理テーブル14n
に必要な情報を出力する(A05)。
【0023】前記条件ブロックの判定によりジョブの終
了通知を受けたとき、前記ジョブn管理テーブルの削除
処理を実施する(A06)。
【0024】前記ジョブn管理テーブルの削除処理の完
了を待って、ジョブnに対する監視処理を終了する(A
07)。
【0025】〔動作の説明〕つぎに本発明の実施の形態
について図面を参照して説明する。図1は本発明の実施
の一形態としてのジョブ管理方式の構成図である。ま
た、図2は本発明の実施の一形態としてのジョブ管理方
式の流れを示す要素のジョブフローチャートである。
【0026】まず、任意のジョブnが起動する(図1の
010及び図2のA01)と、ジョブ管理方式の要素で
あるジョブ管理モニタ(図1の100)が認知してジョ
ブnのモニタを開始する。
【0027】前記ジョブ管理モニタ100は管理用テー
ブルデータ出力手段(図1の120及び図2のA03)
にジョブn用管理テーブル(図1の14n及び図2のA
04)の作成指示を出す。前記ジョブ管理モニタ100
が前記ジョブnを監視している際に、オペレーティング
システムからのステップ開始と終了の通知(図2のB0
1)を待つとともに、データベースモニタ(図1の02
0)からの静止点の確立情報があるかどうかの通知を待
つ。
【0028】前記ジョブ管理モニタ100は前記オペレ
ーティングシステムや前記データベースモニタからの通
知により、条件ブロック(図2のB01,B02,B0
3)の判定を行なう。
【0029】前記ジョブ管理モニタ100が前記オペレ
ーティングシステムからステップ開始の通知を受けた場
合(図2のB01)、前記管理用テーブルデータ入出力
手段120により、ジョブ管理テーブル14n内にジョ
ブn用のステップnテーブルを作成し、ジョブID、ス
テップID、ファイルレコードポインタ、処理データ、
処理フラグ(図1の14n)を出力する(図2のA0
5)。また、前記オペレーティングシステムからステッ
プ終了の通知を受けた場合(図2のB01)、前記管理
用テーブルデータ入出力手段120により、前記ジョブ
管理テーブル14n内のジョブn用のステップnテーブ
ルの処理フラグに終了フラグを出力する(図2のA0
5)。
【0030】前記ジョブ管理モニタ100が前記データ
ベースモニタ020から静止点の確立情報を受けた場合
(図2のB02)、つまり物理更新の実施の通知を受け
た場合には、前記管理用テーブルデータ入出力手段12
0により、前記ジョブ管理テーブル14n内のファイル
レコードポインタ及び作業領域データ(図1の14n)
を書き換える(図2のA05)。
【0031】前記ジョブ管理モニタ100が前記オペレ
ーティングシステムよりジョブnの終了通知を受けた場
合(図2のB03)、前記管理用テーブルデータ入出力
手段120にジョブn用管理テーブル14nの削除要求
を出す。
【0032】削除要求を受けた前記管理用テーブルデー
タ入出力手段120はジョブ管理テーブル140内のジ
ョブn用管理テーブル14nを削除する(図2のA0
6)。
【0033】前記ジョブn用管理テーブル14nの削除
が終了したら、前記ジョブ管理モニタ100に終了通知
を出し、前記終了通知を受けたジョブ管理モニタ100
はジョブnの監視処理を終了する(図2のA07)。
【0034】ジョブ再起動手段(図1の130)は、前
記管理用テーブルデータ入出力手段120によりジョブ
管理テーブル140内の情報を検索し、処理フラグの終
了していないジョブを検出し、終了していないジョブが
存在していた場合、ジョブ管理テーブル140内の情報
を元に障害が発生する直前の環境を再現して再起動を実
施する。
【0035】〔実施例〕次に、本実施形態の一実施例の
動作を詳細に説明する。図1を参照すると、ジョブ1
(010)は入力ファイルA(011)、マスタファイ
ルB(012)、出力ファイルC(013)をアサイン
し、前記入力ファイルA011のデータを元に、前記マ
スタファイルB012を更新し、前記出力ファイルC0
13にデータを出力する処理である。
【0036】例えば、前記マスタファイルB012は前
記入力ファイルA011のデータを20件処理するごと
に、静止点を確立するよう設定されている。静止点の設
定はオペレータが任意に設定できる。
【0037】オペレータにより前記ジョブ1が起動され
ると、ジョブ管理モニタ100は前記ジョブ1の起動を
認識し、管理用テーブルデータ入出力手段120へジョ
ブ1用の管理テーブル140の作成を指示する。更に、
オペレーティングシステムから前記ジョブ1のステップ
1の開始通知を受けると、前記管理用テーブルデータ入
出力手段120へステップ管理テーブル141としてス
テップ1テーブルの作成を指示するとともにステップ情
報として、ジョブの種別を管理するジョブID(141
1)と、ジョブ内のステップの種別を管理するステップ
ID(1412)と、前記入力ファイルA011、前記
マスタファイルB012、前記出力ファイルC013の
進捗状況を管理するファイルレコードポインタ(141
3)と、ジョブ1の処理を行なう上で計算結果等のデー
タを格納する作業領域データ(1414)と、ステップ
ごとの処理状況を管理する処理フラグ(1415)とを
設定する。
【0038】データベースモニタ(020)は前記オペ
レータの設定した静止点確立のための件数(この場合2
0件)を処理すると、静止点確立の通知(f)を前記ジ
ョブ管理モニタ100へ発行する。
【0039】前記静止点確立の通知を受けたジョブ管理
モニタ100は、前記管理用テーブルデータ入出力手段
120へ前記入力ファイルA011、前記マスタファイ
ルB012、前記出力ファイルC013のファイルレコ
ードポインタ1413と、前記作業領域データ1414
の書き換え指示を出す。
【0040】前記管理用テーブルデータ入出力手段12
0は、前記ジョブ管理テーブル140内の現在管理して
いるステップ1テーブル内のファイルレコードポインタ
1413と作業領域データ1414を前記書き換え指示
された値で更新する。
【0041】ジョブ管理モニタ100はデータベースモ
ニタ020からの静止点確立の通知を受けるたびに、前
記ファイルレコードポインタ1413と、前記作業領域
データ1414の更新処理を継続する。
【0042】ジョブ管理モニタ100がオペレーティン
グシステムからステップ1の終了通知を受けると、前記
管理用テーブルデータ入出力手段120へ前記処理フラ
グ1415の更新指示を出す。
【0043】前記更新指示を受けた管理用テーブルデー
タ入出力手段120は、ジョブ管理テーブル140のス
テップ1テーブルの処理フラグ1415に処理終了を示
す値を設定する。
【0044】ジョブ管理モニタ100はオペレーティン
グシステムからステップ2の開始通知を受けると、前記
ステップ1で開始通知を受けた時と同様に、管理用テー
ブルデータ入出力手段120に、ジョブ管理テーブル1
40のステップ2テーブルの作成指示を出す。
【0045】以下、ステップnの終了通知まで前記処理
を繰り返す。
【0046】ジョブ管理モニタ100がオペレーティン
グシステムからジョブ1の終了通知を受けると管理用テ
ーブルデータ入出力手段120へジョブ1のジョブ管理
テーブルの削除指示を出す。
【0047】前記ジョブ1のジョブ管理テーブルの削除
指示を受けた管理用テーブルデータ入出力手段120
は、ジョブ管理テーブル140からジョブ1のジョブ管
理テーブルを全て削除する。
【0048】前記ジョブ1のジョブ管理テーブル140
の削除が完了すると、ジョブ管理モニタ100はジョブ
1の監視処理を終了する。
【0049】前記説明したように、ジョブnがジョブ1
と並行して起動している場合には、ジョブ管理モニタ1
00からジョブの種別が通知されジョブn用のジョブ管
理テーブル14nを作成、管理することになり、複数の
起動ジョブを管理することができる。
【0050】次に、コンピュータシステムのハードディ
スク等に何らかの障害が発生し、ジョブnの継続ができ
ない場合の処理について説明する。
【0051】前述に説明したように、前記ジョブ管理テ
ーブル140はジョブnのステップごとにデータベース
モニタの静止点が確立された時点の情報が格納されてい
る。ジョブnのステップnの処理中でも同様にデータベ
ースモニタ020からの静止点確立の通知によって情報
が格納されていることがわかる。よってジョブnのステ
ップnの時点で何らかの障害がシステムに発生した場
合、障害の発生前に確立した静止点の情報をジョブnの
ジョブ管理テーブル14nに格納していることになる。
【0052】コンピュータシステムに生じた何らかの障
害の原因を取り除いた後、前記ジョブ管理テーブル14
nを参照することによって、ジョブnの障害発生前の情
報を得ることができる。
【0053】オペレータによって、ジョブ再起動手段1
30を起動すると、前記ジョブ再起動手段は管理テーブ
ルデータ入出力手段120にジョブの再起動を行なう通
知を出す。
【0054】前記ジョブの再起動通知を受けた管理用テ
ーブルデータ入出力手段120はジョブ管理テーブル1
40の検索処理を開始する。
【0055】ジョブ管理テーブル140内のステップ管
理テーブル内の処理フラグ1415を確認し、処理フラ
グ1415が処理終了を示す値であれば次のステップ管
理テーブル142〜14nを確認する。ステップnのス
テップ管理テーブル14nの処理フラグ1415が処理
実行中を示す値であれば、ステップnで処理が中断した
ことをジョブ再起動手段130に送信する。また、ステ
ップnのステップ管理テーブル14n内のファイルレコ
ードポイント1413を参照し、入力ファイルA01
1、マスタファイルB012、出力ファイルC013の
各レコードポインタ030をジョブ再起動手段130に
送信する。また、ステップ管理テーブル内の作業領域デ
ータ1414も同様にジョブ再起動手段130に送信す
る。
【0056】前記レコードポインタ030と作業領域デ
ータ1414を受けたジョブ再起動手段130はジョブ
nの起動を行い、入力ファイルA011とマスタファイ
ルB012と出力ファイルC013の各レコードポイン
タ030を前記管理用テーブルデータ入出力手段120
から得た、レコードポインタ030に更新し、さらに作
業領域のデータ1414を前記管理用テーブルデータ入
出力手段120から得た作業領域データに更新する。
【0057】ジョブ再起動手段は前記各種ファイルのレ
コードポインタ030と作業領域データ1414の更新
が済んだ後、ジョブnのステップnからジョブnを再起
動することによって、障害が発生した直後から処理を継
続することができる。
【0058】[第2実施形態]従来、情報システムの中
心を成すデータベースの管理基準ではユーザアプリケー
ション(AP)とデータベースとのトランザクションに
おける保証に止まり、障害時に処理中であったジョブへ
の保証は従来オペレータに委ねられていた。データベー
スに対してアクセスするバッチジョブAPにおいて処理
中に静止点を確立するロジックがある場合等、二重更新
しないよう更新済のデータを削除した入力トランザクシ
ョンを用意しなければならなかった。オペレータとして
は単純にジョブ又はステップに対する再起動(リラン)
ができないため、システム障害発生直前の状態に戻した
後も、リスタートへの作業がオペレータにとって繁雑と
なっている。
【0059】従って、システム障害時、復旧処理の迅速
化・システムリスタートの簡便化による、安定た運用が
図れるシステムが望まれていることに鑑み、本実施形態
では、ジョブ管理ツールは処理中のデータベース又はフ
ァイルに対するレコードのポインタ情報及びジョブのワ
ークエリアのデータ情報をテーブル化し、ステップ毎に
動的に保持することとした。そうして、各ジョブはデー
タベースの静止点確立時に当テーブルに出力し、ステッ
プ処理終了後テーブルに終了フラグを出力する。当ジョ
ブ管理ツールは処理中である全ジョブに対してモニター
する。
【0060】かかる運用によって、システム障害発生
時、オペレータは障害原因を究明した後、データベース
等を障害直前に復旧し、当ジョブ管理ツールによるリラ
ンを指示することのみによりシステムのリスタートが実
行可能となる。
【0061】以下、図面を参照しつつ説明する。図3に
示すように、本ジョブ管理ツールは、ジョブ管理モニタ
140と、管理用テーブル200と、データベース情報
取得手段150と、管理用テーブルデータ出力手段16
0と、ジョブ再起動手段170より構成する。ジョブ管
理モニタ140はシステム稼働中のジョブの進行状況を
管理し、各ジョブはジョブステップの進捗状況により各
管理用テーブル200を生成する。管理用テーブル20
0には該当ステップのAPの作業領域データ及び各アサ
インファイルのレコードポインタ情報、ジョブID、ス
テップID情報をもち、データベース情報取得手段15
0によりデータベースが静止点確立した時点を受けと
り、管理用テーブル200に管理用テーブルデータ出力
手段160により出力する。この際、図4に示すよう
に、データベースモニタからデータベースの静止点確立
時の通知を受け、データベース情報取得手段150によ
り静止点情報を取得し、ジョブ管理モニタ140に通知
し、管理用テーブルデータ出力手段160により管理用
テーブル200内のステップテーブルのファイルレコー
ドポインタや作業領域データの内容を更新する。
【0062】また、処理中の当データ群はジョブ終了時
にクリアされる。つまり本ジョブ管理ツールは、処理が
実行中のジョブについて、モニターし、システム障害時
オペレータは、障害原因の調査、その後障害発生直前の
状態に復旧し、ジョブ再起動手段170の実行により、
各ジョブを再起動させる。当ツールの管理方法により瞬
時に障害発生直前の状態を作成することが可能になり、
従来二重更新のない入力トランザクションを生成し、実
行していた作業、又は、障害時処理中であったAPの再
起動作業の作業フェーズがなくなり、大幅にオペレータ
に対してシステムのリラン作業を軽減可能となる。この
障害発生時点から再起動に至る流れを要約すれば、図5
に示す手順を踏むことになる。図5において、まずシス
テム中で障害が発生したとき(C1)、オペレータは障
害の内容を調査し(C2)、データベースやその他の周
辺機器を復旧し(C3)、次に、データベースの静止点
確立時点ごとに更新しているジョブ管理テーブルから実
行ジョブ群を更新し、ジョブ管理ツールの再起動手段に
よりシステムを起動し(C4)、システムの再スタート
(リスタート)を行う。従来例と比較すれば、C4のス
テップ前にシステムの実行環境を調査して再起動の環境
設定を行うステップが不要となる。
【0063】本実施形態では、第1実施形態で説明した
内容と比べて必要な機能について集中的に説明してい
る。また、本実施形態では、データベースモニタにより
データベースの静止点確立時点を検出して静止点確立時
点ごとにジョブ管理テーブルの起動に必要な情報を更新
する例を示したが、データベースはシステム外のLUN
等から入手する場合でも適用できるし、またデータベー
スを用いないジョブの場合であれば、他の指標を用いて
ジョブ管理テーブル内の情報を更新してもよい。
【0064】
【発明の効果】第一の効果は、システム障害時、障害原
因を取り除いた後に、障害時のジョブ実行状況、各ジョ
ブ内のステップ処理進捗状況、また、再処理可能なファ
イルデータの調査及び作成を行なう必要が無いことであ
る。すなわち、ジョブ管理テーブルによって起動中であ
った各ジョブのステップごとの進捗状況が管理されてい
るからである。
【0065】また、第二の効果は、使用可能環境として
通常ファイル、物理更新と論理更新が1:1または1:
nのデータベースシステムで使用可能である。その理由
は、ジョブ管理テーブルで複数のファイルレコードポイ
ンタの情報を格納でき、各ファイルの進捗状況に応じて
情報を管理できるからである。
【図面の簡単な説明】
【図1】本発明による実施形態の一例を示す構成図であ
る。
【図2】本発明による実施形態の一例の流れ図である。
【図3】本発明による実施形態の一例を示す構成図であ
る。
【図4】本発明による実施形態の一例の流れ図である。
【図5】本発明による実施形態の一例の流れ図である。
【符号の説明】
010 起動中の各ジョブ 011 入力ファイルA 012 マスタファイルB 013 出力ファイルC 020,180 データベースモニタ 100,140 ジョブ管理モニタ 120 管理用テーブルデータ入出力手段 130,170 ジョブ再起動手段 140,200 ジョブ管理テーブル 141 ステップ管理テーブル 1411 ジョブID 1412 ステップID 1413 ファイルレコードポインタ 1414 作業領域データ 1415 処理フラグ a 起動中のジョブ情報 b ジョブ管理モニタと管理用テーブルデータ入
出力手段間の通知 c 管理用テーブルデータ入出力手段とジョブ管
理テーブル間の通知 d 起動中のジョブのデータベース使用情報 f 静止点確立の通知

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 コンピュータシステムにおける起動中の
    ジョブが使用する入力ファイル、マスタファイル、及び
    出力ファイルと、データベースの状況を管理するデータ
    ベースモニタとを備えているジョブ管理方式において、 実行中のジョブ実行状況を監視するジョブ管理モニタ
    と、ジョブ管理情報を格納しておくジョブ管理テーブル
    と、前記データベースモニタからのジョブステップ検出
    の情報を受ける前記ジョブ管理モニタの指示により前記
    ジョブ管理テーブルの情報を受け渡しする管理用テーブ
    ルデータ入出力手段と、障害発生後に処理が中断された
    ジョブを起動するジョブ再起動手段とで構成されること
    を特徴とするジョブ管理方式。
  2. 【請求項2】 コンピュータシステムにおける起動中の
    ジョブを複数のファイルとして管理するジョブ管理モニ
    タと、データベースの状況を管理するデータベースモニ
    タとを備えているジョブ管理方法において、 前記コンピュータシステムで前記データベースとデータ
    のやり取りを行う所定回数を前記データベースモニタが
    カウントし、前記所定回数のカウント毎に前記ジョブ管
    理モニタに通知し、前記ジョブ管理モニタがその通知毎
    にジョブ管理用のジョブ管理テーブル内のジョブ実行中
    のファイル状況を示すファイルポインタとジョブ作業の
    領域を示す作業領域データとを更新し、 前記コンピュータシステムで障害が発生したときに、前
    記ジョブ管理モニタは前記ファイルポインタ及び前記作
    業領域データとを前記複数のファイルに収納して再起動
    を行うことを特徴とするジョブ管理方法。
  3. 【請求項3】 請求項1又は2に記載のジョブ管理方法
    において、前記ジョブ管理テーブルはジョブIDとジョ
    ブステップを示すステップIDと作業の開始・終了を示
    す処理フラグを備えたことを特徴とするジョブ管理方
    法。
JP8189377A 1996-07-18 1996-07-18 ジョブ管理方式と方法 Pending JPH1040123A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8189377A JPH1040123A (ja) 1996-07-18 1996-07-18 ジョブ管理方式と方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8189377A JPH1040123A (ja) 1996-07-18 1996-07-18 ジョブ管理方式と方法

Publications (1)

Publication Number Publication Date
JPH1040123A true JPH1040123A (ja) 1998-02-13

Family

ID=16240308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8189377A Pending JPH1040123A (ja) 1996-07-18 1996-07-18 ジョブ管理方式と方法

Country Status (1)

Country Link
JP (1) JPH1040123A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660832B2 (en) 2004-02-27 2010-02-09 Hitachi, Ltd. System recovery method and computer system using the same
JP2010231682A (ja) * 2009-03-30 2010-10-14 Hitachi Ltd バッチ処理実行システム及びその方法
JP2016207121A (ja) * 2015-04-28 2016-12-08 京セラドキュメントソリューションズ株式会社 電子機器およびリブートプログラム
US9971651B2 (en) 2015-04-28 2018-05-15 Kyocera Document Solutions Inc. Electronic device that ensures recovery without entire reboot, and recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7660832B2 (en) 2004-02-27 2010-02-09 Hitachi, Ltd. System recovery method and computer system using the same
JP2010231682A (ja) * 2009-03-30 2010-10-14 Hitachi Ltd バッチ処理実行システム及びその方法
JP2016207121A (ja) * 2015-04-28 2016-12-08 京セラドキュメントソリューションズ株式会社 電子機器およびリブートプログラム
US9971651B2 (en) 2015-04-28 2018-05-15 Kyocera Document Solutions Inc. Electronic device that ensures recovery without entire reboot, and recording medium

Similar Documents

Publication Publication Date Title
JP4321705B2 (ja) スナップショットの取得を制御するための装置及び記憶システム
US7152080B2 (en) Method, apparatus, and computer readable medium for managing replication of back-up object
JP4483342B2 (ja) システム復旧方法
US7409414B2 (en) Computer system, management computer, storage system, and backup management method
US20080276239A1 (en) Recovery and restart of a batch application
US7228544B2 (en) Job processing method, job processing unit, and storage managing system
JP4883986B2 (ja) 計算機システム、管理計算機及びデータリカバリ方法
JPH08221433A (ja) 情報検索システム
JP2001014175A (ja) ジョブ運用管理システム、ジョブ運用管理方法及び記憶媒体
JPH1040123A (ja) ジョブ管理方式と方法
US7065539B2 (en) Data transfer method
JPH08212142A (ja) データベースのデータバックアップシステム
JPH033046A (ja) ログ記録管理方式
JPS58223857A (ja) 計算装置の動作方法
JP6788188B2 (ja) 制御装置および制御プログラム
JP2518390B2 (ja) システム性能監視方式
JPH08272655A (ja) オペレーティングシステム及びファイル削除方法
JPH0713943A (ja) 並列計算機
JP2933011B2 (ja) ファイルの排他制御システム
JPS6191730A (ja) ソフトウエア障害に対する自動復旧処理システム
JPH07160651A (ja) システムデータのバックアップ方式
JP2959467B2 (ja) 疎結合多重計算機システムにおける障害復旧システム、障害復旧方法、および障害復旧プログラムを記憶する媒体
JPH08221287A (ja) 系切り替え制御方法
JPH08263350A (ja) 情報管理システム及び方法
JPH10260852A (ja) 計算機端末における表示画面の保持・再現方法、ならびに同方法を実現する計算機システム