JP2008186173A - 障害監視システム - Google Patents

障害監視システム Download PDF

Info

Publication number
JP2008186173A
JP2008186173A JP2007018151A JP2007018151A JP2008186173A JP 2008186173 A JP2008186173 A JP 2008186173A JP 2007018151 A JP2007018151 A JP 2007018151A JP 2007018151 A JP2007018151 A JP 2007018151A JP 2008186173 A JP2008186173 A JP 2008186173A
Authority
JP
Japan
Prior art keywords
state
failure
monitoring
status
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007018151A
Other languages
English (en)
Inventor
Takashi Inoue
貴司 井上
Kazunari Otogawa
一成 乙川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2007018151A priority Critical patent/JP2008186173A/ja
Publication of JP2008186173A publication Critical patent/JP2008186173A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】複数のOSによって各OSの状態を相互に監視させ合い、障害の発生状況を詳細に記録できる障害監視システムを提供すること。
【解決手段】複数のOS50、51を動作させるプロセッサ1を有するコンピュータシステム100において各OSの状態を相互に監視させる障害監視システムを構成するOS50、51のそれぞれは、共有メモリ2の自OS対応領域20、21にOS50、51の状態を記録する自状態記録手段500、510と、共有メモリ2の他OS対応領域21、20の記録内容を参照し、その記録内容が他OS51、50の所定状態を示す場合に、他OS対応領域21、20に所定内容を記録する他状態記録手段501、511と、自OS対応領域20、21の記録内容に基づいて他OS51、50の状態を監視する他状態監視手段502、512とを備える。
【選択図】図1

Description

本発明は、複数のオペレーティングシステムによって各オペレーティングシステムの状態を相互に監視させ合い、障害の発生状況を詳細に記録できる障害監視システムに関する。
従来、ウォッチドッグ等の専用のハードウェアを追加することなくオペレーティングシステム(以下、OS(Operating System)とする。)の状態を監視する計算機が知られている(例えば、特許文献1参照。)。
この計算機は、プロセッサ上で二つの独立したOS(第一及び第二OS)を動作させ、第一OSの状態を監視するソフトウェアプログラムである障害監視モニタを第二OS上で実行させ、さらに、第一OSと第二OSとの間の通信を可能とするOS間通信手段を介して第一OSから第二OSに送信される所定の信号に基づいて障害監視モニタに第一OSにおける障害の有無を判定させる。すなわち、この計算機は、ソフトウェアである第二OSにハードウェアであるウォッチドッグの機能を代用させることにより、第一OSから独立した機能により、第一OSの障害を監視できるようにする。
特開2001−101033号公報
しかしながら、特許文献1に記載の計算機は、第二OSの状態を監視することができず、第二OSに障害が発生した場合には、計算機全体の信頼性が損なわれることになる。障害が発生した第二OS上で動作する障害監視モニタによって第一OSの状態を監視することとなるからである。
上述の点に鑑み、本発明は、複数のオペレーティングシステムによって各オペレーティングシステムの状態を相互に監視させ合い、障害の発生状況を詳細に記録できる障害監視システムを提供することを目的とする。
上述の目的を達成するために、第一の発明に係る障害監視システムは、複数のオペレーティングシステムを動作させるプロセッサを有するコンピュータシステムにおいて各オペレーティングシステムの状態を相互に監視させる障害監視システムであって、前記オペレーティングシステムは、共有メモリにおける自オペレーティングシステム対応領域に自オペレーティングシステムの状態を記録する自状態記録手段と、前記共有メモリにおける他オペレーティングシステム対応領域の記録内容を参照し、該記録内容が前記他オペレーティングシステムの所定状態を示す場合に、前記他オペレーティングシステム対応領域に所定内容を記録する他状態記録手段と、前記自オペレーティングシステム対応領域の記録内容に基づいて前記他オペレーティングシステムの状態を監視する他状態監視手段と、を備える、ことを特徴とする。
また、第二の発明は、第一の発明に係る障害監視システムであって、前記他状態記録手段は、前記自状態記録手段が前記自オペレーティングシステムの状態を記録する度に、前記他オペレーティングシステム対応領域の記録内容を参照することを特徴とする。
また、第三の発明は、第一又は第二の発明に係る障害監視システムであって、前記プロセッサは、マルチコアプロセッサであり、前記複数のオペレーティングシステムは、それぞれ異なるコアで実行されることを特徴とする。
上述の手段により、本発明は、複数のオペレーティングシステムによって各オペレーティングシステムの状態を相互に監視させ合い、障害の発生状況を詳細に記録できる障害監視システムを提供することができる。
以下、図面を参照しつつ、本発明を実施するための最良の形態の説明を行う。
図1は、本発明に係る障害監視システムを備えたコンピュータシステムの構成例を示す図である。
コンピュータシステム100は、マルチコアプロセッサ1、揮発性メモリ2、不揮発性メモリ3の構成要素を有し、システムバス4を介して各構成要素間を接続する。
マルチコアプロセッサ1は、二以上のプロセッサコアを一個のパッケージに集積したプロセッサであり、コンピュータシステム100は、一個のマルチコアプロセッサ1からなるマルチコアシングルプロセッサ構成を採用するが、複数個のマルチコアプロセッサからなるマルチコアマルチプロセッサ構成を採用してもよい。
なお、コンピュータシステム100は、複数の機能を分散処理させてリアルタイム処理性能を向上させるため、部品点数の削減によりコストを低減させるため、或いは、省電力化を図るためにマルチコアプロセッサ1を採用するが、本発明に係る障害監視システムは、一個のシングルコアプロセッサからなるシングルコアシングルプロセッサ構成、又は、複数個のシングルコアプロセッサからなるシングルコアマルチプロセッサ構成にも適用可能である。
また、コンピュータシステム100は、共有メモリを有する密結合マルチプロセッサ構成を採用するが、全てのプロセッサが対等となる対称型マルチプロセッサ構成であってもよく、プロセッサ毎に異なる処理内容が予め決定される非対称型マルチプロセッサ構成であってもよい。
マルチコアプロセッサ1は、第一CPU(Central Processing Unit)10、第二CPU11、第三CPU12及び第四CPU13の四つのCPUコアを有し、第一CPU10に第一OS50を実行させ、第二CPU11、第三CPU12及び第四CPU13の三つのCPUコアに第二OS51を実行させるマルチOS構成を採用する。
「マルチOS構成」とは、複数のOSをプロセッサ上で独立に動作させる構成をいい、例えば、組み込みシステム向けのOSとして利用されるリアルタイム処理に長けたμITRON(Micro Industrial TRON(The Real-time Operating System Nucleus))等のリアルタイムOSと、Windows(登録商標)やLinux(登録商標)といった機能が豊富な汎用OSとを兼ね備えたハイブリッドOSがある。
第一OS50及び第二OS51は、それぞれ、リアルタイムOS又は汎用OSの何れであってもよく、自状態記録手段500、510、他状態記録手段501、511、及び、他状態監視手段502、512をそれぞれ有する。
揮発性メモリ2は、高速アクセスが要求される主記憶装置として使用される半導体メモリであり、例えば、DRAM(Dynamic Random Access Memory)やSRAM(Static RAM)等であって、第一OS50及び第二OS51によって共有される。
不揮発性メモリ3は、電源を切った後も記憶内容を保持できるメモリであり、例えば、フラッシュメモリ、FRAM(Ferroelectric RAM)、MRAM(Magneto-resistive RAM)等であって、揮発性メモリ2と同様に、第一OS50及び第二OS51によって共有される。なお、不揮発性メモリ3は、ハードディスク等の補助記憶装置であってもよい。
図2は、各種メモリの構成例を示す図であり、図2(A)が揮発性メモリ2の構成例を示し、図2(B)が不揮発性メモリ3の構成例を示す。
揮発性メモリ2は、第一OS50の起動状態を記憶する第一OS起動情報領域20と、第二OS51の起動状態を記憶する第二OS起動情報領域21とを有する(図2(A)参照。)。
また、不揮発性メモリ3は、第一OS50の障害情報を記憶する第一OS障害情報領域30と、第二OS51の障害情報を記憶する第二OS障害情報領域31とを有し、各障害情報領域30、31は、障害の発生回数を記憶する障害発生回数領域300、310と、障害の内容を記憶する障害内容領域301、311と、をそれぞれ有する(図2(B)参照。)。
システムバス4は、CPUとメモリとを結ぶバスであり、例えば、ノースブリッジ等のチップセットとCPUとを結ぶフロントサイドバス、及び、チップセットとメモリとを結ぶメモリバスで構成されてもよい。
次に、第一OS50及び第二OS51のそれぞれが有する自状態記録手段500、510、他状態記録手段501、511及び他状態監視手段502、512について説明する。
自状態記録手段500、510は、自OSの状態を記録するための手段であり、例えば、第一OS50の自状態記録手段500は、第一OS50の起動状態を揮発性メモリ2の第一OS起動情報領域20に記録し、第二OS51の自状態記録手段510は、第二OS51の起動状態を揮発性メモリ2の第二OS起動情報領域21に記録する。
他状態記録手段501、511は、他OSの状態を記録するための手段であり、例えば、第一OS50の他状態記録手段501は、揮発性メモリ2の第二OS起動情報領域21に記録された第二OS51の起動状態を示す値(以下、「状態値」という。)を所定の状態値に書き換え、第二OS51の他状態記録手段511は、揮発性メモリ2の第一OS起動情報領域20に記録された第一OS50の状態値を所定の状態値に書き換える。
他状態監視手段502、512は、他OSの状態を監視するための手段であり、例えば、第一OS50の他状態監視手段502は、第二OS51の他状態記録手段511によって書き換えられる第一OS起動情報領域20の内容を監視することで、第二OS51の起動処理における異常(以下、単に「障害」という。)を検知する。第二OS51で障害が発生すると、第二OS51の他状態記録手段511は、第一OS起動情報領域20の内容を書き換えることができなくなり、第一OS50は、第二OS51による書き換えが発生しないことによって間接的に第二OS51の障害を検知できるからである。
反対に、第二OS51の他状態監視手段512は、第一OS50の他状態記録手段501によって書き換えられる第二OS起動情報領域21の内容を監視することで、第一OS50の障害を検知する。
次に、図3を参照しながら、コンピュータシステム100上で動作する第一OS50及び第二OS51が相互に相手OSの起動状態を監視する処理(以下、「起動状態監視処理」とする。)について説明する。なお、図3は、起動状態監視処理の流れを示すフローチャートである。
最初に、コンピュータシステム100は、第一CPU10を初期化した後、第一CPU10上で第一OS50を起動させる。
第一OS50は、起動処理を開始すると、自状態記録手段500により揮発性メモリ2の第一OS起動情報領域20に「起動開始」を示す状態値を記録する(ステップS1)。
このとき、第一OS50は、監視対象である相手OS(第二OS51)に関する情報を書き換える処理(以下、「他状態記録処理(後述)」という。)を実行させ、他状態記録手段501により揮発性メモリ2の第二OS起動情報領域21に記録された、第二OS51の状態を表す状態値を参照し、その状態値が第二OS51の「起動開始」を示す状態値である場合、第二OS起動情報領域21に記録された状態値を「起動開始確認」を示す状態値に書き換えるようにする。
なお、第一OS50は、自状態記録手段500により自身の状態値を第一OS起動情報領域20に記録する度に、他状態記録処理(後述)を実行する。
その後、第一OS50は、第一OS起動情報領域20に記録された状態値を周期的に参照し、第二OS51における他状態記録処理(後述)によって第一OS起動情報領域20に記録された「起動開始」を示す状態値が「起動開始確認」を示す状態値に書き換えられるまで待機する(ステップS2)。
第一OS起動情報領域20に記録された状態値が「起動開始確認」を示す状態値に書き換えられたことを検出すると(ステップS2のYES)、第一OS50は、自状態記録手段500により第一OS起動情報領域20に「チェックポイント1」を示す状態値を記録し(ステップS3)、第一OS50における各種設定値を初期化する処理(以下、「OS初期化処理」とする。)を開始させる(ステップS4)。
一方、第一OS起動情報領域20に記録された状態値が「起動開始確認」を示す状態値に書き換えられないまま(ステップS2のNO)、第一OS起動情報領域20の参照回数が所定回数を上回ると(ステップS5のYES)、第一OS50は、他状態記録手段501により不揮発性メモリ3の第二OS障害情報領域31における障害発生回数領域310に記録された障害発生回数の値をインクリメントし(ステップS6)、かつ、不揮発性メモリ3の第二OS障害情報領域31における障害内容領域311に障害の内容として「起動確認障害」を表す値を記録(ステップS7)した後、OS初期化処理を開始させる(ステップS4)。
なお、第一OS50は、第二OS障害情報領域31における障害内容領域311に障害発生時刻、第一OS50の状態値、その他の各種設定値等を記録するようにしてもよい。後のデバッグに利用するためである。
また、第一OS50は、第二OS51に制御信号を送信し、第一OS50が記録した第二OS51の障害内容に対処するよう第二OS51に障害対応処理を実行させるようにしてもよい。
ここで、「障害対応処理」とは、相手OSで発生した障害を相手OSに除去させるための処理であり、例えば、発生した障害の回数やその障害の内容に応じて相手OSをリセットさせたり、再起動させたり、相手OSを縮退させたり(OSの一部の機能を制限し、他の一部の機能を動作させることをいい、例えば、相手OSを動作させる複数のプロセッサコアのうちの一部のコアを停止させたりする。)する処理がある。
その後、第一OS50は、自状態記録手段500により第一OS起動情報領域20に「チェックポイント2」を示す状態値を記録し(ステップS8)、OS初期化処理が完了したことを確認(ステップS9)した後、自状態記録手段500により第一OS起動情報領域20に「起動完了」を示す状態値を記録して(ステップS10)、起動状態監視処理を終了させる。
また、第二OS51による第一OS50の起動状態監視処理は、上述した第一OS50による第二OS51の起動状態監視処理と同様に、上述した第一OS50による第二OS51の起動状態監視処理に平行かつ独立して第二OS51上で実行される。
次に、図4を参照しながら、他状態記録処理について説明する。なお、図4は、他状態記録処理の流れを示すフローチャートであり、第一OS50は、自状態記録手段500により第一OS起動情報領域20に第一OS50自身の状態値を記録する度に、他状態記録処理を実行するものとする。
最初に、第一OS50は、他状態記録手段501により揮発性メモリ2における第二OS起動情報領域21を参照し、第二OS51の状態値が「起動開始」を示す状態値となっているか否かを判定する(ステップS20)。
第二OS51の状態値が「起動開始」となっている場合(ステップS20のYES)、第一OS50は、第二OS起動情報領域21の状態値を「起動開始確認」を示す状態値に書き換える(ステップS21)。
なお、第二OS51の状態値が「起動開始」となっていない場合(ステップS20のNO)、第一OS50は、第二OS起動情報領域21の状態値をそのまま維持させるようにして他状態記録処理を終了させる。
また、第二OS51による第一OS50の他状態記録処理は、上述した第一OS50による第二OS51の他状態記録処理と同様に、上述した第一OS50による第二OS51の他状態記録処理に平行かつ独立して第二OS51上で実行される。
次に、図5を参照しながら、コンピュータシステム100上で動作する第一OS50及び第二OS51が相互に相手OSの障害状態を監視する処理(以下、「他状態監視処理」とする。)について説明する。なお、図5は、他状態監視処理の流れを示すフローチャートであり、各OSは、自身の起動処理を完了させた後、この他状態監視処理を繰り返し実行するものとする。
最初に、第一OS50は、他状態監視手段502により揮発性メモリ2における第二OS起動情報領域21を参照し、第二OS51の状態値が「起動完了」を示す状態値となっているか否かを判定する(ステップS30)。
第二OS51の状態値が「起動完了」となっている場合(ステップS30のYES)、第一OS50は、不揮発性メモリ3における第二OS障害情報領域31に記録された第二OS51の障害に関する情報(障害発生回数及び障害内容)を消去して(ステップS31)、他状態監視処理を終了させる。
第一OS50は、第二OS51の起動途中に第二OS51において障害が発生したことを検知していた場合であっても、第二OS51が最終的に起動処理を完了させたことを検知できたからである。
なお、第一OS50は、第二OS51の状態値が「起動完了」となった場合であっても、他状態記録手段501により第二OS障害情報領域31に記録された内容を消去することなく、第二OS障害情報領域31にその内容を保持させるようにしてもよい。後のデバッグ等に利用できるようにするためである。
なお、第二OS51の状態値が「起動完了」となっていない場合(ステップS30のNO)、第一OS50は、ステップS30の判定回数をインクリメントした後、その判定回数が所定回数未満であるとき(ステップS32のNO)には、一旦、他状態監視処理を終了させる。
一方、その判定回数が所定回数を上回るときには(ステップS32のYES)、第一OS50は、他状態監視手段502により不揮発性メモリ3の第二OS障害情報領域31における障害発生回数領域310に記録された障害発生回数の値をインクリメントし(ステップS33)、かつ、不揮発性メモリ3の第二OS障害情報領域31における障害内容領域311に、第二OS起動情報領域21に記録された状態値を障害内容として記録する(ステップS34)。
その後、第一OS50は、第二OS51に制御信号を送信し、第一OS50が記録した第二OS51の障害内容に対処するよう第二OS51に障害対応処理を実行させるようにして、他状態監視処理を終了させる。
次に、図6を参照しながら、各OS起動情報領域に記録される状態値の遷移例について説明する。なお、図6は、第一OS起動情報領域20に記録される状態値の遷移の一例を示す図である。また、この場合、「監視側」は、監視側OSである第二OS51を意味し、「被監視側」は、被監視側OSである第一OS50を意味する。
第一OS起動情報領域20の状態は、状態値が不定値となっている初期状態P1、「起動開始」が設定された状態P2、「起動開始確認」が設定された状態P3、「チェックポイント1」が設定された状態P4、「チェックポイント2」が設定された状態P5、「起動完了」が設定された状態P6、及び、各種障害状態を示す値が設定された状態P7を有する。
状態P1は、コンピュータシステム100の電源がオンされた後、又は、状態P4〜P7において監視側により被監視側の再起動が実行された後の状態であり、例えば、第一CPU10が初期化された後、又は、第二OS51が第一OS50を再起動させた後の状態である。
なお、監視側は、コンピュータシステム100全体を再起動させる必要がある場合にのみ、状態P6にある被監視側(第一OS50)の再起動を実行させる。被監視側(第一OS50)は、正常に起動処理を完了させているからである。
状態P2は、状態P1において被監視側が自身の起動処理を開始させた後の状態であり、例えば、第一OS50が自身の起動処理を開始させた状態であって、被監視側である第一OS50により状態値の書き換えが実行される。
状態P3は、被監視側が状態P2にあることを監視側が確認した後の状態であり、例えば、第一OS50が第一OS50自身の起動処理を開始させたことを第二OS51が確認した後の状態であって、監視側である第二OS51により状態値の書き換えが実行される。
状態P4は、被監視側が状態P3にあることを被監視側自身が確認した後の状態であり、例えば、第一OS50が第一OS50自身の起動処理を開始させたことを第二OS51が確認し、第一OS50がその第二OS51による確認をさらに確認した後の状態であって、被監視側である第一OS50により状態値の書き換えが実行される。
なお、被監視側は、自身が状態P2から状態P3に移行せず所定期間にわたって状態P2に留まった場合、強制的に状態P2を状態P4に移行させ、被監視側のOS初期化処理を開始するようにする。監視側の障害によって被監視側が状態P3に停滞してしまうのを防止するためである。この場合、被監視側は、監視側に障害が発生した旨を監視側OSの障害情報領域に記録する。
これにより、コンピュータシステム100は、起動速度が異なる複数のOSを同時期に起動させる場合、起動速度の遅いOSが起動するまで起動速度の速いOSの起動を待機させることなく、複数のOSに各OSの起動状態を相互監視させながら、起動速度の速いOSから順番に複数のOSを迅速に起動させることができる。
状態P5は、被監視側が被監視側自身のOS初期化処理を開始した状態であり、例えば、第一OS50が第一OS50自身のOS初期化処理を開始した状態であって、被監視側である第一OS50により状態値の書き換えが実行される。
状態P6は、被監視側が被監視側自身のOS初期化処理を完了した後の状態であり、例えば、第一OS50が第一OS50自身のOS初期化処理を完了した後の状態であって、被監視側である第一OS50により状態値の書き換えが実行される。
状態P7は、状態P4又は状態P5において被監視側が自身の障害を検知した後の状態であり、例えば、第一OS50が第一OS50自身の障害を検知した場合であって、被監視側である第一OS50により状態値の書き換えが実行される。
以上の構成により、コンピュータシステム100は、プロセッサ障害、ハードウェア障害、又は、ソフトウェア障害等により搭載するOSに障害が発生した場合であっても、その障害を早期に検知して障害対応処理を実行させることができるので、その障害によってシステム全体の信頼性が損なわれるのを防止することができる。
また、コンピュータシステム100は、各OSの起動状態を詳細に記録するので、各OSで発生した障害の障害発生段階を特定することができる。
また、コンピュータシステム100は、各OSの障害情報を不揮発性メモリ3に記録するので、コンピュータシステム100に対する電力供給が途切れた場合であっても各OSの障害情報を確実に保持することができる。
また、コンピュータシステム100は、マルチコアを採用することにより、一部のコアで異常が発生した場合であっても他の正常なコアで処理を継続させることができ、各OSを正常動作させる確率を高めることで障害情報の記録がより確実に行われ、障害発生原因の早期発見を実現させることができる。
以上、本発明の好ましい実施例について詳説したが、本発明は、上述した実施例に制限されることはなく、本発明の範囲を逸脱することなしに上述した実施例に種々の変形及び置換を加えることができる。
例えば、上述の実施例において、コンピュータシステム100は、各OSの起動状態を相互に監視させるが、省電力モード移行状態や通常モード移行状態等、各OSにおける起動状態以外の稼働状態を相互に監視させるようにしてもよい。
また、上述の実施例において、コンピュータシステム100は、第一OS50が自状態記録手段500により自身の状態値を第一OS起動情報領域20に記録する度に、他状態記録処理を実行するが、第一OS50が所定の状態値を記録した場合に限り、他状態記録処理を実行するようにしてもよく、所定周期で他状態記録処理を実行するようにしてもよい。他状態記録処理の実行タイミングに柔軟性を持たせるためである。
また、上述の実施例において、コンピュータシステム100は、二つのOSで相互に起動状態を監視させるが、例えば、三つのOSを独立して起動させるコンピュータシステムにおいて、第一のOSに第二及び第三のOSの起動状態を監視させ、第二及び第三のOSの双方又は何れか一方に第一のOSの起動状態を監視させるようにしてもよい。
また、本発明に係る障害監視システムは、四つ以上のOSを起動させるコンピュータシステムにおいても同様に、監視側OSと被監視側OSの組み合わせを柔軟に設定することができる。
障害監視システムを備えたコンピュータシステムの構成例を示す図である。 各種メモリの構成例を示す図である。 起動状態監視処理の流れを示すフローチャートである。 他状態記録処理の流れを示すフローチャートである。 他状態監視処理の流れを示すフローチャートである。 OS起動情報領域に記録される状態値の遷移の一例を示す図である。
符号の説明
1 マルチコアプロセッサ
2 揮発性メモリ
3 不揮発性メモリ
4 システムバス
10〜13 CPU
20、21 OS起動情報領域
30、31 OS障害情報領域
50、51 オペレーティングシステム
300、310 障害発生回数領域
301、311 障害内容領域
500、510 自状態記録手段
501、511 他状態記録手段
502、512 他状態監視手段
P1〜P7 OS起動情報の状態

Claims (3)

  1. 複数のオペレーティングシステムを動作させるプロセッサを有するコンピュータシステムにおいて各オペレーティングシステムの状態を相互に監視させる障害監視システムであって、
    前記オペレーティングシステムは、共有メモリにおける自オペレーティングシステム対応領域に自オペレーティングシステムの状態を記録する自状態記録手段と、前記共有メモリにおける他オペレーティングシステム対応領域の記録内容を参照し、該記録内容が前記他オペレーティングシステムの所定状態を示す場合に、前記他オペレーティングシステム対応領域に所定内容を記録する他状態記録手段と、前記自オペレーティングシステム対応領域の記録内容に基づいて前記他オペレーティングシステムの状態を監視する他状態監視手段と、を備える、
    ことを特徴とする障害監視システム。
  2. 前記他状態記録手段は、前記自状態記録手段が前記自オペレーティングシステムの状態を記録する度に、前記他オペレーティングシステム対応領域の記録内容を参照する、
    ことを特徴とする請求項1に記載の障害監視システム。
  3. 前記プロセッサは、マルチコアプロセッサであり、
    前記複数のオペレーティングシステムは、それぞれ異なるコアで実行される、
    ことを特徴とする請求項1又は2に記載の障害監視システム。
JP2007018151A 2007-01-29 2007-01-29 障害監視システム Pending JP2008186173A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007018151A JP2008186173A (ja) 2007-01-29 2007-01-29 障害監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007018151A JP2008186173A (ja) 2007-01-29 2007-01-29 障害監視システム

Publications (1)

Publication Number Publication Date
JP2008186173A true JP2008186173A (ja) 2008-08-14

Family

ID=39729188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007018151A Pending JP2008186173A (ja) 2007-01-29 2007-01-29 障害監視システム

Country Status (1)

Country Link
JP (1) JP2008186173A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134557A (ja) * 2008-12-02 2010-06-17 Nec Corp 仮想マシン運用管理システム、その運用管理方法、及びプログラム
WO2010097925A1 (ja) * 2009-02-26 2010-09-02 株式会社日立製作所 情報処理装置
WO2010109743A1 (ja) * 2009-03-27 2010-09-30 日本電気株式会社 ログ採取装置、ログ採取方法、プログラム
WO2011021318A1 (ja) * 2009-08-19 2011-02-24 日本電気株式会社 マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ
JP5163807B2 (ja) * 2010-03-18 2013-03-13 トヨタ自動車株式会社 マイコン相互監視システム及びマイコン相互監視方法
JP2015092407A (ja) * 2015-01-21 2015-05-14 株式会社小松製作所 建設機械用コントローラ
US9292981B2 (en) 2013-08-20 2016-03-22 Komatsu Ltd. Construction machine controller
JP2019057267A (ja) * 2017-09-19 2019-04-11 株式会社明電舎 情報処理装置
JP2019087177A (ja) * 2017-11-10 2019-06-06 トヨタ自動車株式会社 監視システム
WO2020235088A1 (ja) * 2019-05-23 2020-11-26 三菱電機株式会社 制御装置および分散処理方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010134557A (ja) * 2008-12-02 2010-06-17 Nec Corp 仮想マシン運用管理システム、その運用管理方法、及びプログラム
WO2010097925A1 (ja) * 2009-02-26 2010-09-02 株式会社日立製作所 情報処理装置
JPWO2010097925A1 (ja) * 2009-02-26 2012-08-30 株式会社日立製作所 情報処理装置
WO2010109743A1 (ja) * 2009-03-27 2010-09-30 日本電気株式会社 ログ採取装置、ログ採取方法、プログラム
JP2010231646A (ja) * 2009-03-27 2010-10-14 Nec Corp ログ採取装置、ログ採取方法、プログラム
WO2011021318A1 (ja) * 2009-08-19 2011-02-24 日本電気株式会社 マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ
JP2011043892A (ja) * 2009-08-19 2011-03-03 Nec Corp マルチコアシステム、マルチコアシステムの制御方法、及びマルチプロセッサ
JP5163807B2 (ja) * 2010-03-18 2013-03-13 トヨタ自動車株式会社 マイコン相互監視システム及びマイコン相互監視方法
US9292981B2 (en) 2013-08-20 2016-03-22 Komatsu Ltd. Construction machine controller
JP2015092407A (ja) * 2015-01-21 2015-05-14 株式会社小松製作所 建設機械用コントローラ
JP2019057267A (ja) * 2017-09-19 2019-04-11 株式会社明電舎 情報処理装置
JP2019087177A (ja) * 2017-11-10 2019-06-06 トヨタ自動車株式会社 監視システム
WO2020235088A1 (ja) * 2019-05-23 2020-11-26 三菱電機株式会社 制御装置および分散処理方法
JP6808090B1 (ja) * 2019-05-23 2021-01-06 三菱電機株式会社 制御装置および分散処理方法
CN113841119A (zh) * 2019-05-23 2021-12-24 三菱电机株式会社 控制装置及分散处理方法
US11340954B2 (en) 2019-05-23 2022-05-24 Mitsubishi Electric Corporation Control device and distributed processing method
CN113841119B (zh) * 2019-05-23 2022-12-27 三菱电机株式会社 控制装置及分散处理方法

Similar Documents

Publication Publication Date Title
JP2008186173A (ja) 障害監視システム
JP6438353B2 (ja) 半導体装置及び診断テスト方法
US8219851B2 (en) System RAS protection for UMA style memory
JP5418597B2 (ja) リセット方法及び監視装置
US10387261B2 (en) System and method to capture stored data following system crash
US11526411B2 (en) System and method for improving detection and capture of a host system catastrophic failure
KR20070108060A (ko) 빠른 부팅 웨이크-업을 실행하는 시스템
JP2012069032A (ja) 情報処理装置
KR20150111936A (ko) 메모리 모듈에서의 데이터의 런타임 백업
JP5726340B2 (ja) プロセッサシステム
JP2013084089A (ja) 車両用装置
US20180039553A1 (en) Storage control device and storage control method
JP2010224847A (ja) 計算機システム及び設定管理方法
CN115904793B (zh) 一种基于多核异构***的内存转存方法、***及芯片
CN115576734B (zh) 一种多核异构日志存储方法和***
JP2001101032A (ja) 異種os間制御によるos監視方式
JP2014099097A (ja) 情報処理装置、情報処理方法、およびコンピュータプログラム
JP4867896B2 (ja) 情報処理システム
JP6627366B2 (ja) 情報処理システム、情報処理方法およびプログラム
JP6385322B2 (ja) 情報処理装置
JP2013210767A (ja) メモリ診断装置、メモリ診断プログラム及び機器
JP2011175366A (ja) 電子機器
US10983879B1 (en) System and method for managing recovery of multi-controller NVMe drives
WO2023141832A1 (zh) 程序更新方法和程序更新装置
JP2001051854A (ja) 情報管理システム