JP6070040B2 - データベースシステム、データベース装置、データベースの障害回復方法およびプログラム - Google Patents
データベースシステム、データベース装置、データベースの障害回復方法およびプログラム Download PDFInfo
- Publication number
- JP6070040B2 JP6070040B2 JP2012224147A JP2012224147A JP6070040B2 JP 6070040 B2 JP6070040 B2 JP 6070040B2 JP 2012224147 A JP2012224147 A JP 2012224147A JP 2012224147 A JP2012224147 A JP 2012224147A JP 6070040 B2 JP6070040 B2 JP 6070040B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- database
- failure
- command
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Hardware Redundancy (AREA)
Description
以下、本発明の実施形態の構成について添付図1〜3に基づいて説明する。
最初に、本実施形態の基本的な内容について説明し、その後でより具体的な内容について説明する。
本実施形態に係るデータベースシステム1は、現用系アプリケーションサーバ11および現用系データベースサーバ12を含むプライマリサイト2と、待機系アプリケーションサーバ21および待機系データベースサーバ22を含むセカンダリサイト3とがネットワーク4を介して接続されて構成されるデータベースシステムである。現用系アプリケーションサーバ11、現用系データベースサーバ12、待機系アプリケーションサーバ21および待機系データベースサーバ22がいずれも、相互に他装置と監視し合うサーバ状態監視部102,112,202,212を各々備え、各サーバ状態監視部が、データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドをログとして記録し、このログの中から特定のパターンを抽出した学習データを発生した障害の症状を示すエラーコードと対応づけて予め備えられた記憶手段に記憶させ、かつ他の各サーバにもこの学習データを送付して記憶させるコマンド学習機能102aと、いずれかのサーバに障害が発生したことを検出する障害検出機能102bと、検出された障害と同一のエラーコードが学習データに記憶されているか否かを検索するエラーパターン検索機能102cと、検出された障害と同一のエラーコードが学習データに記憶されている場合に、そのエラーコードに対応するパターンのコマンドを現用系アプリケーションサーバに実行させる学習済コマンド実行機能102dとを有する。
以下、これをより詳細に説明する。
次に、上記の実施形態の全体的な動作について説明する。
本実施形態に係る障害回復方法は、現用系アプリケーションサーバ11および現用系データベースサーバ12を含むプライマリサイト2と、待機系アプリケーションサーバ21および待機系データベースサーバ22を含むセカンダリサイト3とがネットワーク4を介して接続されて構成されるデータベースシステム4にあって、データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドをデータベースシステムを構成する各サーバのコマンド学習機能がログとして記録し(図4・ステップS101〜109)、記録されたログの中から特定のパターンを抽出した学習データを発生した障害の症状を示すエラーコードと対応づけて各サーバのコマンド学習機能が予め備えられた記憶手段に記憶させると共に、他の各サーバにもこの学習データを送付して記憶させ(図4・ステップS110〜114)、いずれかのサーバに障害が発生したことを各サーバの障害検出機能が検出し(図6・ステップS201)、検出された障害と同一のエラーコードが学習データに記憶されているか否かを各サーバのエラーパターン検索機能が検索し(図6・ステップS202)、検出された障害と同一のエラーコードが学習データに記憶されている場合に、そのエラーコードに対応するパターンのコマンドを各サーバの学習済コマンド実行機能が現用系アプリケーションサーバに実行させる(図6・ステップS204〜205)。
この動作により、本実施形態は以下のような効果を奏する。
上記実施形態は、以上で説明した本発明の趣旨を改変しない範囲で、様々な拡張が可能である。以下、これについて説明する。
まず、上記実施形態ではプライマリサイト(現用系)とセカンダリサイト(待機系)が各々アプリケーションサーバおよびデータベースサーバを含むという構成について説明したが、実際の装置の区分は必ずしもこの例の通りである必要はない。たとえばアプリケーションサーバとデータベースサーバとが同一のコンピュータによって構成されてもよいし、逆に複数の物理的コンピュータによって仮想的に構成されるものであってもよい。さらに、セカンダリサイトが複数備えられていてもよい。
2 プライマリサイト
3 セカンダリサイト
4 ネットワーク
11、21 アプリケーションサーバ
11a、12a、21a、22a プロセッサ
11b、12b、21b、22b 記憶手段
11c、12c、21c、22c 通信手段
12、22 データベースサーバ
13、23 ストレージ装置
13a、23a 主ストレージ部
13b、23b バックアップストレージ部
14a、24a クライアント装置
15a、25a 周辺装置
101、201 アプリケーション動作部
102、112、202、212 サーバ状態監視部
102a、112a、202a、212a コマンド学習機能
102b、112b、202b、212b 障害検出機能
102c、112c、202c、212c エラーパターン検索機能
102d、112d、202d、212d 学習済コマンド実行機能
111、211 データベース動作部
103、113、203、213 学習データ
120a 対象装置
120b エラーコード
120c コマンド
120d 学習パターン
Claims (6)
- 現用系アプリケーションサーバおよび現用系データベースサーバを含むプライマリサイトと、待機系アプリケーションサーバおよび待機系データベースサーバを含むセカンダリサイトとがネットワークを介して接続されて構成されるデータベースシステムであって、
前記現用系アプリケーションサーバ、前記現用系データベースサーバ、前記待機系アプリケーションサーバおよび前記待機系データベースサーバがいずれも、相互に他装置と監視し合うサーバ状態監視部を各々備え、
前記各サーバ状態監視部が、
前記データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドをログとして記録し、このログの中から特定のパターンを抽出して前記保守者に提示し、該保守者が選択した前記パターンを学習データとして、発生した前記障害の症状を示すエラーコードと対応づけて予め備えられた記憶手段に記憶させ、かつ他の各サーバにもこの学習データを送付して記憶させるコマンド学習機能と、
前記いずれかのサーバに障害が発生したことを検出する障害検出機能と、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されているか否かを検索するエラーパターン検索機能と、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されている場合に、そのエラーコードに対応する前記パターンのコマンドを前記現用系アプリケーションサーバに実行させる学習済コマンド実行機能と
を有することを特徴とするデータベースシステム。 - 前記障害検出機能が前記各サーバのうちのいずれかに障害が発生したことを検出した場合に、その障害が発生したサーバが復旧したことを検出してから前記コマンド学習機能に前記学習データを送付させることを特徴とする、請求項1に記載のデータベースシステム。
- 前記学習済コマンド実行機能が、
前記現用系アプリケーションサーバが前記コマンドを実行できない場合に、前記待機系アプリケーションサーバに前記コマンドを実行させることを特徴とする、請求項1に記載のデータベースシステム。 - 現用系アプリケーションサーバおよび現用系データベースサーバを含むプライマリサイトと、待機系アプリケーションサーバおよび待機系データベースサーバを含むセカンダリサイトとがネットワークを介して接続されて構成されるデータベースシステムで、前記現用系データベースサーバもしくは前記待機系データベースサーバとして機能しうるデータベース装置であって、
相互に他装置と監視し合うサーバ状態監視部を備えると共に、
このサーバ状態監視部が、
前記データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドをログとして記録し、このログの中から特定のパターンを抽出して前記保守者に提示し、該保守者が選択した前記パターンを学習データとして、発生した前記障害の症状を示すエラーコードと対応づけて予め備えられた記憶手段に記憶させ、かつ他の各サーバにもこの学習データを送付して記憶させるコマンド学習機能と、
前記いずれかのサーバに障害が発生したことを検出する障害検出機能と、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されているか否かを検索するエラーパターン検索機能と、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されている場合に、そのエラーコードに対応する前記パターンのコマンドを前記現用系アプリケーションサーバに実行させる学習済コマンド実行機能とを有することを特徴とするデータベース装置。 - 現用系アプリケーションサーバおよび現用系データベースサーバを含むプライマリサイトと、待機系アプリケーションサーバおよび待機系データベースサーバを含むセカンダリサイトとがネットワークを介して接続されて構成されるデータベースシステムにあって、
前記データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドを前記データベースシステムを構成する各サーバのコマンド学習機能がログとして記録し、
記録された前記ログの中から特定のパターンを抽出して前記保守者に提示し、該保守者が選択した前記パターンを学習データとして、発生した前記障害の症状を示すエラーコードと対応づけて前記各サーバのコマンド学習機能が予め備えられた記憶手段に記憶させると共に、他の各サーバにもこの学習データを送付して記憶させ、
前記いずれかのサーバに障害が発生したことを前記各サーバの障害検出機能が検出し、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されているか否かを各サーバのエラーパターン検索機能が検索し、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されている場合に、そのエラーコードに対応する前記パターンのコマンドを前記各サーバの学習済コマンド実行機能が前記現用系アプリケーションサーバに実行させる
ことを特徴とする障害回復方法。 - 現用系アプリケーションサーバおよび現用系データベースサーバを含むプライマリサイトと、待機系アプリケーションサーバおよび待機系データベースサーバを含むセカンダリサイトとがネットワークを介して接続されて構成されるデータベースシステムにあって、
前記データベースシステムを構成する各サーバが備えるプロセッサに、
前記データベースシステムを構成するいずれかのサーバに障害が発生した時に保守者が入力したコマンドをログとして記録する手順、
記録された前記ログの中から特定のパターンを抽出して前記保守者に提示し、該保守者が選択した前記パターンを学習データとして、発生した前記障害の症状を示すエラーコードと対応づけて予め備えられた記憶手段に記憶させると共に、他の各サーバにもこの学習データを送付して記憶させる手順、
前記いずれかのサーバに障害が発生したことを検出する手順、
検出された前記障害と同一の前記エラーコードが前記学習データに記憶されているか否かを検索する手順、
および検出された前記障害と同一の前記エラーコードが前記学習データに記憶されている場合に、そのエラーコードに対応する前記パターンのコマンドを前記現用系アプリケーションサーバに実行させる手順
を実行させることを特徴とする障害回復プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012224147A JP6070040B2 (ja) | 2012-10-09 | 2012-10-09 | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012224147A JP6070040B2 (ja) | 2012-10-09 | 2012-10-09 | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014078067A JP2014078067A (ja) | 2014-05-01 |
JP6070040B2 true JP6070040B2 (ja) | 2017-02-01 |
Family
ID=50783343
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012224147A Active JP6070040B2 (ja) | 2012-10-09 | 2012-10-09 | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6070040B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10909115B2 (en) * | 2017-12-04 | 2021-02-02 | Nec Corporation | System event search based on heterogeneous logs |
JP7031527B2 (ja) * | 2018-08-07 | 2022-03-08 | 日本電信電話株式会社 | 操作列生成装置、操作列生成方法及びプログラム |
JP7472628B2 (ja) | 2020-04-28 | 2024-04-23 | 日本電信電話株式会社 | 障害復旧装置、障害復旧方法及びプログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6742141B1 (en) * | 1999-05-10 | 2004-05-25 | Handsfree Networks, Inc. | System for automated problem detection, diagnosis, and resolution in a software driven system |
JP4689963B2 (ja) * | 2004-02-12 | 2011-06-01 | Necフィールディング株式会社 | コンピュータ遠隔診断修復システム、サーバ、プログラム、及び方法 |
JP2007272328A (ja) * | 2006-03-30 | 2007-10-18 | Bank Of Tokyo-Mitsubishi Ufj Ltd | コンピュータ・システム |
JP2012168907A (ja) * | 2011-02-17 | 2012-09-06 | Nec Corp | 相互監視システム |
-
2012
- 2012-10-09 JP JP2012224147A patent/JP6070040B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014078067A (ja) | 2014-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8910172B2 (en) | Application resource switchover systems and methods | |
Lou et al. | Software analytics for incident management of online services: An experience report | |
US10489232B1 (en) | Data center diagnostic information | |
US9189348B2 (en) | High availability database management system and database management method using same | |
JP4598065B2 (ja) | 監視シミュレーション装置,方法およびそのプログラム | |
WO2013140608A1 (ja) | イベントの根本原因の解析を支援する方法及びシステム | |
JP6095140B2 (ja) | 遠隔監視システム、遠隔監視方法、及びプログラム | |
JP2008186296A (ja) | ストレージシステム、ストレージ装置、ファームウェアの活***換方法、ファームウェアの活***換プログラム | |
TWI691852B (zh) | 用於偵測階層式系統故障之偵錯裝置及偵錯方法、電腦可讀取之記錄媒體及電腦程式產品 | |
US9256489B2 (en) | Synchronized debug information generation | |
Veeraraghavan et al. | Maelstrom: Mitigating datacenter-level disasters by draining interdependent traffic safely and efficiently | |
JP5058582B2 (ja) | ストレージデバイスのマルチパスシステム、その障害箇所特定方法及びプログラム | |
JP5425720B2 (ja) | 仮想化環境監視装置とその監視方法およびプログラム | |
JP6070040B2 (ja) | データベースシステム、データベース装置、データベースの障害回復方法およびプログラム | |
JP6558037B2 (ja) | 運用管理プログラム、運用管理方法、および運用管理装置 | |
JP2007299213A (ja) | Raid制御装置および障害監視方法 | |
WO2011051999A1 (ja) | 情報処理装置及び情報処理装置の制御方法 | |
JP2005258501A (ja) | 障害影響範囲解析システム及び障害影響範囲解析方法及びプログラム | |
US7437445B1 (en) | System and methods for host naming in a managed information environment | |
JP2011076344A (ja) | 情報処理装置,情報処理装置の制御方法および制御プログラム | |
JP2006053728A (ja) | 障害対処ルール伝播方法、障害復旧装置およびプログラム | |
EP3852424B1 (en) | Application resilience for applications deployed on a cloud platform | |
US10645163B2 (en) | Site-aware cluster management | |
Chan et al. | Debugging incidents in Google's distributed systems | |
JP2018169920A (ja) | 管理装置、管理方法及び管理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150909 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160902 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6070040 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |