JP2009181496A - ジョブ処理システムおよびジョブ管理方法 - Google Patents
ジョブ処理システムおよびジョブ管理方法 Download PDFInfo
- Publication number
- JP2009181496A JP2009181496A JP2008021965A JP2008021965A JP2009181496A JP 2009181496 A JP2009181496 A JP 2009181496A JP 2008021965 A JP2008021965 A JP 2008021965A JP 2008021965 A JP2008021965 A JP 2008021965A JP 2009181496 A JP2009181496 A JP 2009181496A
- Authority
- JP
- Japan
- Prior art keywords
- job
- failure
- cause
- resource
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 162
- 238000007726 management method Methods 0.000 title claims description 8
- 230000002159 abnormal effect Effects 0.000 claims abstract description 40
- 238000001514 detection method Methods 0.000 claims abstract description 40
- 238000003860 storage Methods 0.000 claims abstract description 40
- 230000008859 change Effects 0.000 claims description 4
- 238000010923 batch production Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 20
- 239000000284 extract Substances 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 29
- 238000012546 transfer Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 15
- 238000011084 recovery Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000003111 delayed effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000033772 system development Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【解決手段】ジョブ処理を行うシステムに含まれる各サーバにおいて、利用リソース情報取得部34は、ユーザが登録したジョブフローに基づき、各ジョブが利用するリソースなどを抽出して、利用リソース情報のテーブルを作成する。実行状況記憶部44は過去に処理されたジョブの実行状況を蓄積して記憶する。ジョブ処理時に障害が発生した際、障害原因検出部38は、過去の実行状況からジョブ同士の相対的な関係における「通常状態」を定義し、今回の状況と比較することにより「異常状態」を検出する。さらに利用リソース情報のテーブル、エラーログ、過去の発生頻度といった観点から多角的に評価を行い、障害原因となり得る確率を取得する。
【選択図】図3
Description
Z’=Z+(1−Z)×|Y−X|/(1−X)
Claims (9)
- ジョブをバッチ処理するジョブ処理システムであって、
ジョブを処理する都度、ジョブの実行状況の情報を蓄積して記憶する実行状況記憶部と、
処理中のジョブのいずれかに異常が発生した際、前記実行状況の情報を参照して、異常が発生したジョブと、同バッチ処理において処理されていたその他のジョブの処理時間の相対的な関係が、過去の実績において所定のしきい値を超えた確率で発生している通常状態からはずれた異常状態となっている事象を原因候補として検出する障害原因検出部と、
前記障害原因検出部が検出した、原因候補に係る情報を出力する出力部と、を備えたことを特徴とするジョブ処理システム。 - 異常状態として抽出されると予想される事象と、その事象が障害原因となり得る確率の設定値とを対応づけた実行状況別原因確率テーブルを記憶する原因確率記憶部をさらに備え、
前記障害原因検出部は、前記実行状況別原因確率テーブルを参照して前記原因候補として検出した事象が障害原因となり得る確率を取得し、
前記出力部は、前記原因候補として検出した事象とそれが障害原因となり得る確率とを対応づけて出力することを特徴とする請求項1に記載のジョブ処理システム。 - 前記ジョブ処理システムにおいて処理されるジョブと、当該ジョブが利用するリソースとを対応づけた利用リソース情報を記憶するジョブ情報記憶部さらに備え、
前記障害原因検出部は、前記利用リソース情報を参照して特定した、障害が発生したジョブが利用するリソースのログにエラーが記録されていた場合、前記原因候補として検出した事象のうち、エラーが記録されていたリソースが関連する事象が障害原因となり得る確率を高くするように重み付けを行うことを特徴とする請求項2に記載のジョブ処理システム。 - 前記ジョブ処理システムにおいて処理されるジョブと、当該ジョブが利用するリソースおよび当該リソースを前記ジョブが利用する際の利用率とを対応づけた利用リソース情報を記憶するジョブ情報記憶部さらに備え、
前記障害原因検出部は、前記利用リソース情報を参照して、障害が発生したジョブと同一のリソースを利用している他のジョブの当該リソースの利用率を特定し、障害が発生した際のバッチ処理における、前記他のジョブの、リソースの空きスペースに対する利用率の大きさに応じて、前記原因候補として検出した事象のうち、前記他のジョブが関連する事象が障害原因となり得る確率に重み付けを行うことを特徴とする請求項2に記載のジョブ処理システム。 - 前記実行状況記憶部は、過去に障害が発生したジョブとその障害原因とを対応づけてさらに記憶し、
前記障害原因検出部は、障害が発生したジョブに対し過去に障害原因となった頻度に応じて、前記原因候補として検出した事象が障害原因となり得る確率に重み付けを行うことを特徴とする請求項2に記載のジョブ処理システム。 - 前記障害原因検出部は、過去の実績における通常状態が発生する確率と前記しきい値との差に応じて、前記原因候補として検出した事象が障害原因となり得る確率を補正することを特徴とする請求項2に記載のジョブ処理システム。
- 前記障害原因検出部は、障害が発生したジョブと同一のリソースを利用しているジョブに障害が発生していた際、前記原因候補として検出した事象のうち、当該リソースが関連する事象が障害原因となり得る確率を高くするように重み付けを行うことを特徴とする請求項4に記載のジョブ処理システム。
- 前記障害原因検出部は、障害が発生したジョブと同一のリソースを利用しているジョブのうち所定数以上のジョブに障害が発生していた場合、当該リソースを障害原因と推定し、当該リソースを利用する処理中および未処理のジョブを停止するよう制御を行うことを特徴とする請求項4または7に記載のジョブ処理システム。
- ジョブ処理システムにおいてバッチ処理されるジョブと各ジョブが利用するリソースに係る情報とを対応づけた利用リソース情報を取得するステップと、
ジョブを処理する都度、ジョブの実行状況の情報を蓄積して記憶するステップと、
処理中のジョブのいずれかに異常が発生した際、前記利用リソース情報および前記実行状況の情報を参照して、当該ジョブが利用するリソースのエラーの有無と、当該ジョブと同一のリソースを利用する他のジョブの実行状況と、障害が発生したジョブと当該ジョブと同一のリソースを利用する他のジョブの処理時間の相対的な関係の通常状態からの変化の有無と、障害が発生したジョブに対し過去に障害原因となった頻度と、の少なくともいずれかを確認して、障害原因の候補を検出するステップと、
前記障害原因の候補に係る情報を出力するステップと、
を含むことを特徴とするジョブ管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021965A JP5007247B2 (ja) | 2008-01-31 | 2008-01-31 | ジョブ処理システムおよびジョブ管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008021965A JP5007247B2 (ja) | 2008-01-31 | 2008-01-31 | ジョブ処理システムおよびジョブ管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009181496A true JP2009181496A (ja) | 2009-08-13 |
JP5007247B2 JP5007247B2 (ja) | 2012-08-22 |
Family
ID=41035398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008021965A Expired - Fee Related JP5007247B2 (ja) | 2008-01-31 | 2008-01-31 | ジョブ処理システムおよびジョブ管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5007247B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011090419A (ja) * | 2009-10-21 | 2011-05-06 | Panasonic Corp | プロジェクターを用いたネットワーク接続時における問題点抽出システム |
JP2011128828A (ja) * | 2009-12-17 | 2011-06-30 | Fujitsu Ltd | ジョブ分析プログラム及び方法、並びにジョブ分析装置 |
JP2012100038A (ja) * | 2010-11-01 | 2012-05-24 | Ricoh Co Ltd | 情報処理装置 |
JP2014120138A (ja) * | 2012-12-19 | 2014-06-30 | Fujitsu Ltd | 異常原因推定プログラム、異常原因推定装置及び異常原因推定方法 |
JP2015141601A (ja) * | 2014-01-29 | 2015-08-03 | 日本電気株式会社 | ジョブ性能分析システム、ジョブ性能分析方法及びプログラム |
CN112579662A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种井下作业处理方法、***及电子设备 |
CN112801441A (zh) * | 2019-11-14 | 2021-05-14 | 株式会社日立制作所 | 分析***和分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120007A (ja) * | 1997-10-17 | 1999-04-30 | Nec Corp | システム管理におけるプロセス制御方法と装置 |
JP2002278804A (ja) * | 2001-03-15 | 2002-09-27 | Nec Software Chubu Ltd | ジョブ実行監視方法およびプログラム |
JP2004362495A (ja) * | 2003-06-09 | 2004-12-24 | Hitachi Ltd | エラーログ情報解析支援方法及び実施装置並びに処理プログラム |
-
2008
- 2008-01-31 JP JP2008021965A patent/JP5007247B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120007A (ja) * | 1997-10-17 | 1999-04-30 | Nec Corp | システム管理におけるプロセス制御方法と装置 |
JP2002278804A (ja) * | 2001-03-15 | 2002-09-27 | Nec Software Chubu Ltd | ジョブ実行監視方法およびプログラム |
JP2004362495A (ja) * | 2003-06-09 | 2004-12-24 | Hitachi Ltd | エラーログ情報解析支援方法及び実施装置並びに処理プログラム |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011090419A (ja) * | 2009-10-21 | 2011-05-06 | Panasonic Corp | プロジェクターを用いたネットワーク接続時における問題点抽出システム |
JP2011128828A (ja) * | 2009-12-17 | 2011-06-30 | Fujitsu Ltd | ジョブ分析プログラム及び方法、並びにジョブ分析装置 |
JP2012100038A (ja) * | 2010-11-01 | 2012-05-24 | Ricoh Co Ltd | 情報処理装置 |
JP2014120138A (ja) * | 2012-12-19 | 2014-06-30 | Fujitsu Ltd | 異常原因推定プログラム、異常原因推定装置及び異常原因推定方法 |
JP2015141601A (ja) * | 2014-01-29 | 2015-08-03 | 日本電気株式会社 | ジョブ性能分析システム、ジョブ性能分析方法及びプログラム |
CN112579662A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种井下作业处理方法、***及电子设备 |
CN112801441A (zh) * | 2019-11-14 | 2021-05-14 | 株式会社日立制作所 | 分析***和分析方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5007247B2 (ja) | 2012-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11657309B2 (en) | Behavior analysis and visualization for a computer infrastructure | |
CN110399293B (zh) | ***测试方法、装置、计算机设备和存储介质 | |
US20190378073A1 (en) | Business-Aware Intelligent Incident and Change Management | |
US8352867B2 (en) | Predictive monitoring dashboard | |
US20160019131A1 (en) | Methods and Arrangements to Collect Data | |
JP6160064B2 (ja) | 適用判定プログラム、障害検出装置および適用判定方法 | |
JP5007247B2 (ja) | ジョブ処理システムおよびジョブ管理方法 | |
US20160055044A1 (en) | Fault analysis method, fault analysis system, and storage medium | |
EP2354948A1 (en) | Device for supporting detection of failure event, method for supporting detection of failure event, and computer program | |
US8631280B2 (en) | Method of measuring and diagnosing misbehaviors of software components and resources | |
CN106383760A (zh) | 一种计算机故障管理方法及装置 | |
JP2007323193A (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
US9021078B2 (en) | Management method and management system | |
CN110471912B (zh) | 一种员工属性信息校验方法、装置及终端设备 | |
JP4928480B2 (ja) | ジョブ処理システムおよびジョブ管理方法 | |
JP2019049802A (ja) | 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム | |
JP5231035B2 (ja) | ジョブ処理システムおよびジョブ処理方法 | |
JP2009181494A (ja) | ジョブ処理システムおよびジョブ情報取得方法 | |
CN114629786A (zh) | 日志实时分析方法、装置、存储介质及*** | |
CN110347741B (zh) | 大数据处理过程中有效提升输出成果数据质量的***及其控制方法 | |
Lingrand et al. | Analyzing the EGEE production grid workload: application to jobs submission optimization | |
JP2012181699A (ja) | 障害調査情報資料採取システム、管理サーバ、障害調査情報資料採取方法およびそのプログラム | |
US20140337671A1 (en) | System and Methods for Monitoring a Geographic Information System | |
CN114428704A (zh) | 全链路分布式监控的方法、装置、计算机设备和存储介质 | |
JP7073766B2 (ja) | 情報処理プログラム、情報処理方法及び情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120322 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120522 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120528 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5007247 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |