JPH08314875A - 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置 - Google Patents

協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置

Info

Publication number
JPH08314875A
JPH08314875A JP7156082A JP15608295A JPH08314875A JP H08314875 A JPH08314875 A JP H08314875A JP 7156082 A JP7156082 A JP 7156082A JP 15608295 A JP15608295 A JP 15608295A JP H08314875 A JPH08314875 A JP H08314875A
Authority
JP
Japan
Prior art keywords
distributed
shared memory
node
distributed shared
memory network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7156082A
Other languages
English (en)
Inventor
Hiroo Kamiyo
浩夫 神余
Shinya Narumi
信也 成實
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP7156082A priority Critical patent/JPH08314875A/ja
Publication of JPH08314875A publication Critical patent/JPH08314875A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】 【目的】 分散処理システムにて分散ノードに故障が検
出された場合、健全な分散ノードで故障した分散ノード
の喪失機能をバックアップするための協調分散処理方
法、およびシステム構築ための支援装置を得る。 【構成】 分散共有メモリ13上に、分散システム管理
データが記録された状態監視テーブル15と各分散ノー
ド10a〜10dで共有利用される共有データ14を置
き、各分散ノードがその分散システム管理データによる
相互監視を行いながら通常処理を行い、他の分散ノード
の障害を検出すると、その障害によって喪失されるアプ
リケーションタスク16の実行権の優先度に従って、正
常な分散ノード間で喪失機能代替を行うようにしたも
の。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、リアルタイム性と耐
故障性が要求される分散共有メモリ方式を用いた分散処
理システムに適用して有効な協調分散処理方法、および
分散共有メモリ監視装置、分散共有メモリネットワーク
追跡装置、分散共有メモリネットワーク設定支援装置に
関するものである。
【0002】
【従来の技術】図25は例えば、特開平3−19460
1号公報に示された従来の協調分散処理システムを示す
ブロック図である。図において、1a〜1eは分散ノー
ドとしての制御装置であり、2はこれら制御装置1a〜
1eの制御対象となるプラントである。3は当該プラン
ト2のプロセス情報を取得する検出器、および制御情報
により当該プラント2を操作する操作部からなる入出力
部である。4はこの入出力部3が任意のプロセス情報を
授受するための伝送路であり、5は各制御装置1a〜1
e間で局所的通信を行うための伝送路である。
【0003】次に動作について説明する。制御装置1a
〜1eはそれぞれに複数のプラント制御タスクを周期的
に実行し、入出力部3を介してプラント2を制御してい
る。また、各制御装置1a〜1eは伝送路5を用いて周
期的に通信し、隣接する制御装置相互で状態監視を行っ
ている。この状態監視通信においてタイムアウトが検出
されれば、タイムアウトとなった通信元の制御装置(例
えば制御装置1c)を故障と判定し、隣接する健全な制
御装置1b、1dは故障した制御装置1cの実行タスク
を負荷分散方式に従って分散バックアップする。これに
よって、故障した制御装置1cに隣接している制御装置
1b、1dは負荷が増大するので、次の周期ではさらに
それらに隣接した制御装置1a、1eにおいて負荷分散
方式に従ったタスクの分散バックアップを行う。すなわ
ち、故障に対してその隣接ノードでまずタスク分担する
が、次第にさらに遠くのノードにタスク分担が波及し、
最終的にはシステム全体が負荷分散的な状態で故障ノー
ドのタスクを実行維持している。このようなシステムを
協調分散処理システムと称している。
【0004】また、図26は例えば、特開平6−680
47号公報に示されたそのような従来の分散処理システ
ムにおける分散共有メモリの記憶方法を説明するための
ブロック図である。図において、6a〜6dはコンピュ
ータや端末機器等のノードであり、7はこれらのノード
6a〜6dがそれぞれ接続されて分散処理システムを構
成しているネットワーク、8a〜8eはこのネットワー
ク7内を循環するデータ単位である。
【0005】次に動作について説明する。アドレス付け
されたデータの集合よりなるメモリ情報を、各アドレス
対応のデータ単位8a〜8eとして、所望の順序で各ノ
ード6a〜6d間を巡回せしめる。この図26では、ノ
ード6aからノード6bに送られるデータ単位を8a、
ノード6bより送出されるデータ単位を8b、ノード6
cで受けられるデータ単位を8c、ノード6cからノー
ド6dに送られるデータ単位を8d、ノード6dからノ
ード6aに送られるデータ単位を8eとしている。各ノ
ード6a〜6d側では、当該ノード6a内からのメモリ
アクセス要求に基づき、ネットワーク7を巡回するデー
タ単位8a〜8eの中から要求に合致したデータ単位を
識別して、読み出し要求では該当データ単位をアクセス
要求元のノードへ転送し、書き込み要求では該当データ
単位の内容を書き換えて中継する。こうして、各ノード
6a〜6dからの分散共有メモリへのアクセス時間を短
縮することが可能となるネットワークを利用した分散共
有メモリ型システムの記憶方法を提供する。
【0006】ここで、この分散共有メモリ型システムと
は、各ノードの拡張メモリをネットワーク接続する方式
のもので、各ノードは、分散共有メモリネットワークの
情報を複製保持している。そのため、分散透過性および
耐故障性にすぐれた分散処理システムを構築することが
可能である。また、分散共有メモリの値更新はほとんど
瞬時に他ノードに転送されるため、分散処理の高速化、
リアルタイム応答性を確保しやすい利点がある。
【0007】なお、この種の共有分散メモリに関して
は、米国SYSTRAN社のSCRAMNet、米国V
MIC社のリフレクティブメモリなどが既に製品として
発売されている。このような分散共有メモリカードまた
はボードは、分散共有メモリネットワークの設定やCP
Uに対する物理アドレス設定などの設定機能を、スイッ
チ、ジャンパ線やレジスタ設定により行えるようになっ
ており、例えば、上記SCRAMNetは、CPUから
アクセス可能なコントロールレジスタにより、ネットワ
ークアービテーション設定や割り込み通知設定が行え
る。
【0008】
【発明が解決しようとする課題】従来の協調分散処理シ
ステムは以上のように構成されているので、相互監視を
局所的にしか行っておらず、各ノードがシステム全体の
状況を見渡すことができなかった。また、共有処理デー
タや引き継ぎデータを周期的に逐一通信しているため、
その処理が重いなどの問題点があった。これらの問題点
を解決するために、分散共有メモリネットワークによる
データ共有方式を導入し、共有データや監視データの効
果的なアクセスと管理を行えるようにすることが考えら
れる。しかしながら、従来の分散共有メモリによる分散
システムには、協調分散処理システムを構築するのに必
要なシステム管理やデータ管理の機能が欠如していた。
【0009】また、従来の分散共有メモリ型システム
は、データ管理などの分散共有メモリとしての基本機能
の提供のみにとどまっていたため、実際にアプリケーシ
ョンシステムを構築しようとすると、システムデバッグ
やトラブル解析、あるいは故障検出のための手段に欠
け、システム構築に多大の手間と時間が必要であるなど
の問題点があった。
【0010】この発明は上記のような問題点を解消する
ためになされたもので、分散共有メモリを利用して分散
システムの各分散ノード間で、処理データとシステム管
理データを共有し、各分散ノードが運転状態を相互監視
しながら通常処理を行い、異常発生時には健全な分散ノ
ード間で異常ノードの機能代替を果たす分散処理システ
ムの協調分散処理方法を実現し、さらにそのような分散
処理システム構築に必要な諸機能を提供することを目的
とする。
【0011】また、この発明は、分散共有メモリを用い
た分散処理システムにおいて、アプリケーションシステ
ムを構築する際の、アプリケーションシステムのデバッ
グ、トラブル解析などを効率的に支援するための分散共
有メモリ監視装置、分散共有メモリネットワーク追跡装
置、および分散共有メモリネットワーク設定支援装置を
提供することを目的とする。
【0012】
【課題を解決するための手段】請求項1に記載の発明に
係る協調分散処理方法は、各分散ノードが共有利用する
処理データが置かれた分散共有メモリ上に、状態管理テ
ーブルを置いて分散システム管理データを記録し、各分
散ノードは分散システム管理データによる相互監視を行
いながら通常処理を行って、他の分散ノードの障害を検
出すると、その障害によって喪失されるアプリケーショ
ンタスクの実行権の優先度に従って、正常な分散ノード
間で喪失機能代替を行うものである。
【0013】請求項2に記載の発明に係る協調分散処理
方法は、分散共有メモリ上に分散共有メモリ管理テーブ
ルを置いてキーワード管理を行い、分散ノード間でこの
キーワードを介して共有データのアクセス管理を行うも
のである。
【0014】請求項3に記載の発明に係る協調分散処理
方法は、分散共有メモリ上にレコード管理テーブルを置
き、レコードのアクセスに際してそのレコード管理テー
ブルのセマフォの状態に基づいて分散ノード間での共有
データのレコードアクセスの排他制御を行うものであ
る。
【0015】請求項4に記載の発明に係る協調分散処理
方法は、分散共有メモリ上にノード状態監視テーブルを
置き、各分散ノードがこのノード状態監視テーブルに自
ノードの運転状態シンボルを書き込み、各分散ノードで
そのノード状態監視テーブルを参照して相互の状態監視
および異常検出を行うものである。
【0016】請求項5に記載の発明に係る協調分散処理
方法は、分散共有メモリ上にタスク実行管理テーブルを
置いて各分散ノード全体のアプリケーションタスクを集
中管理し、ある分散ノードが故障したときに、故障ノー
ドの機能代替可能であり、かつ優先度の高い分散ノード
が当該機能をアプリケーションタスクとして起動するも
のである。
【0017】請求項6に記載の発明に係る協調分散処理
方法は、分散共有メモリ上にノード状態監視テーブルを
置き、当該ノード状態監視テーブルとあらかじめ定義さ
れた状態遷移シーケンスに従って、自ノードがモード遷
移可能かどうかの判定を行い、その判定結果をアプリケ
ーションタスクに通知するものである。
【0018】請求項7に記載の発明に係る協調分散処理
方法は、故障した分散ノードが復旧した時、またはシス
テムに新たな分散ノードが参入してきた時に、その分散
ノードに健全な分散ノードから分散共有メモリの内容を
転送して、全ての分散ノードの分散共有メモリを等化す
るようにしたものである。
【0019】請求項8に記載の発明に係る分散共有メモ
リ監視装置は、周期的に分散共有メモリの所定の領域の
値を読み出すメモリ読み出し部、およびそのメモリ読み
出し部によって読み出された値を表示装置に周期的に表
示する表示制御部を設けたものである。
【0020】請求項9に記載の発明に係る分散共有メモ
リ監視装置は、前周期においてメモリ読み出し部によっ
て読み出された値と、今周期に読み出された値の差分を
算出して表示制御部に渡す差分表示制御部も備えたもの
である。
【0021】請求項10に記載の発明に係る分散共有メ
モリネットワーク追跡装置は、パケット受信検出部が受
信毎に検出した分散共有メモリネットワーク上のパケッ
ト内容を取得するパケット取得部、およびそのパケット
内容を受信の順に表示装置に表示する表示制御部を設け
たものである。
【0022】請求項11に記載の発明に係る分散共有メ
モリネットワーク追跡装置は、メモリ更新に関連するパ
ケットには含まれていない情報を表示制御部に渡すパケ
ット関連情報読み出し部も備えたものである。
【0023】請求項12に記載の発明に係る分散共有メ
モリネットワーク追跡装置は、ユーザの指定するパケッ
ト条件を取得してパケット取得部と表示制御部に渡すパ
ラメータ設定部も備えたものである。
【0024】請求項13に記載の発明に係る分散共有メ
モリネットワーク設定支援装置は、ユーザによって指定
されるパラメータが分散共有メモリネットワーク設定レ
ジスタの制御機能設定であれば設定情報を作成して設定
レジスタに設定し、設定参照であれば分散共有メモリネ
ットワーク設定レジスタより設定情報を読み出して、表
示装置の表示を制御する表示制御部に渡す分散共有メモ
リネットワーク設定レジスタ参照設定部を設けたもので
ある。
【0025】請求項14に記載の発明に係る分散共有メ
モリネットワーク設定支援装置は、タイマーを設けて、
表示制御部を一定時間周期で起動するようにしたもので
ある。
【0026】請求項15に記載の発明に係る分散共有メ
モリネットワーク設定支援装置は、前周期において分散
共有メモリネットワーク設定レジスタ参照設定部によっ
て読み出された値と、今周期で読み出された値との差分
を算出し、それに基づいて表示装置の表示を制御する差
分表示制御部も備えたものである。
【0027】
【作用】請求項1に記載の発明における協調分散処理方
法は、複雑なプロトコルや通信遅延がほとんどない簡
単、かつ高速なデータ共有機能である分散共有メモリネ
ットワークを用いることで、分散システムに必要な処理
データと管理データの効率的な共有化と複製管理を可能
とする。また、各分散ノードは通常処理、すなわちアプ
リケーションタスクを実行しながら、分散共有メモリ上
の状態管理テーブルの自エントリに自ノードの状態を書
き込むとともに、他の分散ノードの状態をチェックす
る。そして、このテーブル監視により他の分散ノードの
異常が検出されれば、異常ノードが実行していたアプリ
ケーションタスクを実行可能な健全な分散ノード間で分
担し、分散処理システム全体でバックアップを行う。各
分散ノードのタスク実行状況も分散共有メモリ上の状態
管理テーブルに置かれていて、喪失タスクの実行形式プ
ログラムとデータを有し、かつ優先度が高い健全な分散
ノードが喪失タスクの引継実行を行う。この分担結果は
タスク実行状況テーブルに書き込まれる。こうして、分
散共有メモリ上に共有データと分散システム管理データ
を置くことにより、故障した分散ノードを検出してその
喪失機能を健全な分散ノード群でバックアップすること
が可能な分散処理システムを実現する。
【0028】請求項2に記載の発明における協調分散処
理方法は、分散共有メモリのアドレスとサイズとキーワ
ードを管理する分散共有メモリ管理テーブルを設け、各
アプリケーションタスクは、分散共有メモリを領域確保
する際にキーワードを指定して上記テーブルの検索機能
を呼び出すことにより、キーワード登録されたメモリ領
域のアドレスを得てメモリアクセスを行う。分散共有メ
モリ管理テーブルは分散共有メモリ上にあるため、テー
ブル操作すると直ちに他の分散ノードの分散共有メモリ
管理テーブルにも反映される。これにより、各分散ノー
ド間で共有データをキーワードによって管理することを
可能とする。
【0029】請求項3に記載の発明における協調分散処
理方法は、分散共有メモリ上の共有データをレコードと
してアクセス排他制御を行うことを目的とするもので、
各タスクは、分散共有メモリ上にセマフォ付きレコード
を確保すると、同レコードに対する読み書きアクセスを
セマフォチェックして行う。他の分散ノードからのアク
セス排他をしたい場合には、一旦セマフォロックして、
操作後にセマフォフリーにする。セマフォがロックされ
ていれば、アクセスは拒否される。このセマフォ付きレ
コードは分散共有メモリ上にあるため、テーブル操作を
すると直ちに他の分散ノードのテーブルにも反映され
る。これにより、分散ノード間でのレコード操作の排他
制御を可能とする。
【0030】請求項4に記載の発明における協調分散処
理方法は、分散共有メモリ上に分散システムの各分散ノ
ードの状態監視テーブルを置き、各ホストで周期的また
は事象駆動で同テーブルの自エントリに自ノードの状態
を書き込むタスクを動かすことにより、状態監視テーブ
ルの参照によって各分散ノードの状態チェックを可能と
する。また、同タスクが同テーブルの更新をタイムアウ
ト監視することにより、突然の分散ノードの故障等を検
出可能とし、タスクが検出した他の分散ノードの異常
を、割り込み通信により他の任意のタスク、一般的には
分散故障対処タスクに通知することにより、分散共有メ
モリ上での各分散ノードの状態監視と異常検出を可能と
する。
【0031】請求項5に記載の発明における協調分散処
理方法は、各分散ノードでどのアプリケーションタスク
が実行されているかを示したタスク管理テーブルを分散
共有メモリ上に置き、他の分散ノードの故障が検出通知
されたときに、故障対処部がタスク管理テーブルから、
当該故障分散ノードが実行していたアプリケーションタ
スクを得る。故障対処部は、この故障によって喪失した
アプリケーションタスクの中で自ノードが実行可能な、
すなわちプログラムとデータを持ち、かつ自ノードの優
先度が高いアプリケーションタスクを分担する。このタ
スク分担結果はタスク管理テーブルに反映され、各分散
ノードのタスク実行管理部が分担されたアプリケーショ
ンタスクを起動する。これら一連の動作は各分散ノード
において実行され、故障した分散ノードの処理を分散処
理システム全体で協調的に相補するように動作する。
【0032】請求項6に記載の発明における協調分散処
理方法は、システム全体の立上げおよび立下げ時におい
て、分散ノードは起動停止またはモード遷移の順序制御
が必要であるときに有効なもので、各分散ノードが分散
共有メモリ上の状態監視テーブルの自エントリのモード
遷移をする度にモード状態を変更し、各分散ノードでは
自分の起動停止またはモード遷移において遷移可能な分
散ノードの順序系列にあるかどうかをノード状態監視テ
ーブルを参照して決定し、モード遷移可能な場合、状態
遷移タスクに判定結果をシグナルやメッセージなどのタ
スク間通信機能によって通知し、状態遷移タスクにより
分散ノードの起動停止またはモード遷移を制御する。
【0033】請求項7に記載の発明における協調分散処
理方法は、故障した分散ノードが復旧した時、またはシ
ステムに分散ノードの新規参入があった時に、健全な分
散ノードより分散共有メモリ内容をリフレッシュするこ
とにより、同内容を分散共有メモリネットワークを介し
て、復旧または新規参入した分散ノードの分散共有メモ
リに反映させる。これにより、復旧または新規参入した
分散ノードの分散共有メモリ上にある共有データが健全
な分散ノードの共有データと等化され、復旧または新規
参入した分散ノードが通常処理を実行開始する。
【0034】請求項8に記載の発明におけるメモリ読み
出し部は、分散ノードの各分散共有メモリを分散共有メ
モリネットワークで接続した分散処理システムにおける
分散共有メモリの、指定されたアドレスまたは領域の値
を周期的に読み出し、刻々変化する分散共有メモリの内
容(アドレスまたは領域の値)を所定の周期で表示させ
ることにより、自ノードあるいは他ノードのアプリケー
ションによる分散共有メモリの値の変更を(ユーザ)が
動的に監視可能とする。
【0035】請求項9に記載の発明における差分表示制
御部は、メモリ読み出し部が前周期において読み出した
値と今周期で読み出した値の差分を算出して、それを表
示制御部に渡すことにより、前周期と値に変化があった
ものについてのみ表示装置の表示を変更する。
【0036】請求項10に記載の発明におけるパケット
取得部は、分散ノードの各分散共有メモリを分散共有メ
モリネットワークで接続した分散処理システムにおい
て、パケット受信検出部がその受信の度に検出した分散
共有メモリネットワーク上のパケットの内容を取得して
表示制御装置に渡し、それを受信の順番に表示させるこ
とにより、分散共有メモリネットワーク上での分散共有
メモリの更新順序の追跡を可能とし、分散共有メモリの
並行アクセス動作の正当性を確認できるようにする。
【0037】請求項11に記載の発明におけるパケット
関連情報読み出し部は、パケットには含まれてはいない
メモリ更新に関連する情報を取得して、それを表示制御
部に渡すことにより、パケット取得部の読み出したパケ
ット内容とともにその関連情報も表示可能とする。
【0038】請求項12に記載の発明におけるパラメー
タ設定部は、ユーザが指定するパケット条件を取得して
パケット取得部と表示制御部に渡すことにより、パケッ
ト条件に応じたパケットの読み出し、表示制御を可能と
する。
【0039】請求項13に記載の発明における分散共有
メモリネットワーク設定レジスタ参照設定部は、分散ノ
ードの各分散共有メモリを分散共有メモリネットワーク
で接続した分散処理システムに設けられ、分散共有メモ
リネットワークの制御機能の設定情報が設定される分散
共有メモリネットワーク設定レジスタに対して、ユーザ
の指定するパラメータが制御機能設定であれば設定情報
を作成してそれに設定し、設定参照であればそれより設
定情報を読み出して表示装置に表示させることにより、
分散共有メモリネットワークの各種設定、およびその設
定情報の参照を容易にする。
【0040】請求項14に記載の発明におけるタイマー
は、設定された時間周期で参照設定部の設定参照機能を
起動することにより、設定レジスタの設定情報を周期的
に表示する。
【0041】請求項15に記載の発明における差分表示
制御部は、分散共有メモリネットワーク設定レジスタ参
照設定部が、前周期において読み出した値と今周期で読
み出した値との差分を算出して、それを表示制御部に渡
すことにより、前周期と値に変化があったものについて
のみ表示装置の表示を変更する。
【0042】
【実施例】
実施例1.以下、この発明の一実施例を図について説明
する。図1はこの発明の実施例1による協調分散処理方
法を用いた分散処理システムを示すブロック図である。
図において、10a〜10dは当該システムを形成する
コントローラまたは計算機などによる分散ノードで、1
1はCPU、12は主メモリ、13は分散共有メモリで
ある。各分散ノード10a〜10dはこれらCPU1
1、主メモリ12、および分散共有メモリ13にて構成
されている。また、14は各分散ノード10a〜10d
で共有利用される分散共有メモリ13上の共有データで
あり、15は分散システム管理データが格納された分散
共有メモリ13上の状態監視テーブルである。さらに、
CPU11内において、16は当該CPU11の複数の
アプリケーションタスク、17はこれら各アプリケーシ
ョンタスク16の実行を制御するタスク実行制御部であ
り、18は自ノードの状態を状態監視テーブル15に記
録するとともに、状態監視テーブル15を参照して他の
分散ノードの異常を検出する状態監視部、19は他の分
散ノードに故障が検出された場合に、必要なアプリケー
ションタスク16の処理をタスク実行制御部17に依頼
する故障対処部である。
【0043】また、20はこれら各分散ノード10a〜
10dの分散共有メモリ13を直接接続している分散共
有メモリネットワークであり、各分散ノード10a〜1
0dの分散共有メモリ13の内容変更は、この分散共有
メモリネットワーク20を介して各分散ノード10a〜
10dの動作とは独立に、各分散ノード10a〜10d
の分散共有メモリ13に通信されてそのメモリ内容が反
映される。なお、この分散共有メモリネットワーク20
のメディアは光、電気、電波のいずれであってもよく、
さらに、そのトポロジーもバス型、リング型、スター
型、無線型のいずれであってもよい。
【0044】次に動作について説明する。ここで、各分
散ノード10a〜10dは互いに対等であり、符号を読
み替えるだけで全く同様に動作するものであるため、以
下分散ノード10aにおける動作について説明し、他の
分散ノード10b〜10dについてはその説明を省略す
る。今、分散ノード10aのCPU11が分散共有メモ
リ13に書き込みを行うと、そのアドレスおよび内容が
分散共有メモリネットワーク20を介して、他の分散ノ
ード10b〜10dの分散共有メモリ13に転送され、
同じアドレスに同じ内容が書き込まれる。すなわち、各
分散ノード10a〜10dの分散共有メモリ13は通信
遅延を除いて等価である。CPU11は複数のアプリケ
ーションタスク16を実行し、各アプリケーションタス
ク16の実行処理は主メモリ12上にある局所データお
よび分散共有メモリ13上の共有データ14をアクセス
して進める。なお、どのアプリケーションタスク16を
実行するかは、タスク実行制御部17が制御する。
【0045】ここで、図2はCPU11の状態監視部1
8、故障対処部19、およびタスク実行制御部17によ
る処理の流れを示すフローチャートである。状態監視部
18はステップST1においてまず、タスク終了時また
は周期的に分散共有メモリ13の状態監視テーブル15
に分散ノード10a自身の状態を記録する。次にステッ
プST2において、上記ステップST1を実行した時、
あるいは指定されたタイミングで状態監視テーブル15
を参照し、ステップST3で他の分散ノード10b〜1
0dの異常状態あるいはタイムアウト発生などの障害発
生をチェックする。その結果、他の分散ノード10b〜
10dの1つ、例えば分散ノード10bに異常が検出さ
れると、ステップST4において、故障対処部19に分
散ノード10bが故障した旨を通知する。一方、他の分
散ノード10b〜10dに異常が検出されなかった場合
には、そのままステップST8に分岐してタスク実行制
御部17に処理を渡す。
【0046】状態監視部18より故障通知を受け取った
故障対処部19は、ステップST5でその故障通知に従
って、故障した分散ノード10bのバックアップの是非
を計算する。次にステップST6において、状態監視テ
ーブル15を参照して故障した分散ノード10bのタス
ク実行状態を調べ、故障した分散ノード10bが実行し
ていたアプリケーションタスク16、すなわちこの故障
による喪失タスクの実行権の次点優先度を当該分散ノー
ド10aが持っているか否かをチェックする。チェック
の結果、そのアプリケーションタスク16の実行権の次
点優先度を持っていれば、ステップST7でタスク実行
制御部17にそのアプリケーションタスク16の名称ま
たは識別子を通知する。一方、実行権の次点優先度を持
っていなければ、そのままステップST8に分岐してタ
スク実行制御部17に処理を渡す。なお、そのような場
合には、分散ノード10bの故障によって喪失したアプ
リケーションタスク16の実行権の次点優先度を持って
いる分散ノード10cもしくは10dによって以下の処
理が実行される。
【0047】故障対処部19より喪失したアプリケーシ
ョンタスク16の名称または識別子の通知を受けたタス
ク実行制御部17は、ステップST8においてそのアプ
リケーションタスク16を現在実行中のアプリケーショ
ンタスク16に加えて、担当アプリケーションタスク1
6の再編成を行い、ステップST9でその再編成された
アプリケーションタスク16を分散共有メモリ13の状
態監視テーブル15に記録する。次にステップST10
において、CPU11はその状態監視テーブル15を参
照して実行すべきアプリケーションタスク16を決定
し、主メモリ12上にある局所データおよび分散共有メ
モリ13上の共有データ14をアクセスして、そのアプ
リケーションタスク16の処理を進める。これによっ
て、故障対処部19から依頼された喪失タスクの処理が
CPU11において実行される。以下ステップST1に
戻ってこの一連の処理を繰り返すことにより、分散ノー
ド10bの故障で喪失されるアプリケーションタスク1
6を、健全な分散ノード10a(10c、10d)が協
調分散的にバックアップし、共有データ14も欠損する
ことなく、分散処理システム全体のアプリケーションタ
スク16の実行継続を行うことができる。
【0048】実施例2.図3はこの発明の実施例2によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図である。図において、11はCPU、1
3は分散共有メモリ、14は共有データ、15は状態監
視テーブル、16はアプリケーションタスク、20は分
散共有メモリネットワークで、図1に同一符号を付した
実施例1におけるそれらに相当する部分であり、10は
図1に符号10a〜10dを付した分散ノードを代表的
に1つだけ示したものであるため、それらの詳細な説明
は省略する。また、21は分散共有メモリ13上の任意
サイズのメモリ領域に設定され、共有データ14をアク
セス管理するためのキーワードの管理に用いられる分散
共有メモリ管理テーブルであり、22はこの分散共有メ
モリ管理テーブル21へのアクセスを制御する分散共有
メモリ管理テーブルアクセス制御部である。
【0049】次に動作について説明する。アプリケーシ
ョンタスク16が分散共有メモリ管理テーブルアクセス
制御部22に対して、共有データ14をキーワードとし
て分散共有メモリ13上に設けた分散共有メモリ管理テ
ーブル21へのアクセスを要求すると、分散共有メモリ
管理テーブルアクセス制御部22は分散共有メモリ管理
テーブル21を参照して、共有データ14の登録されて
いる特定データのアドレスとサイズをアプリケーション
タスク16に返す。これによって、アプリケーションタ
スク16は特定データをアドレス参照できるようにな
る。分散共有メモリ管理テーブル21にキーワードを登
録するときにも、サイズとキーワードを指定して分散共
有メモリ管理テーブルアクセス制御部22を呼び出す。
分散共有メモリ管理テーブルアクセス制御部22は指定
されたサイズを確保できれば、それを分散共有メモリ管
理テーブル21に登録する。一方、指定されたサイズが
確保できなければ、登録が失敗したことをアプリケーシ
ョンタスク16に通知する。なお、登録抹消の場合も同
様である。分散共有メモリ管理テーブル21を変更する
と、分散共有メモリネットワーク20により直ちに他の
分散ノードの分散共有メモリ管理テーブルにもそれが反
映されるため、分散ノード間でアドレスではなく、この
キーワードを介した共有データ14のアクセス管理を行
うことが可能となる。
【0050】実施例3.図4はこの発明の実施例3によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図であり、相当部分には図3と同一符号を
付してその説明を省略する。図において、23は分散共
有メモリ13内の共有データ14にあるレコード、24
はこの共有データ14の各レコード23の排他制御をレ
コード単位で管理するためのレコード管理テーブル24
であり、25はCPU11内に設けられ、アプリケーシ
ョンタスク16がレコード23をアクセスする際に用い
るレコード管理テーブルアクセス制御部である。
【0051】次に動作について説明する。分散共有メモ
リ13内には、共有データ14にあるレコード23を単
位に排他制御を管理するレコード管理テーブル24が用
意されており、このレコード管理テーブル24は、レコ
ード23のアドレス、サイズおよびセマフォからなるエ
ントリの配列となっている。アプリケーションタスク1
6は共有データ14のレコード23をアクセスする際に
そのレコード管理テーブルアクセス制御部25を呼び出
し、レコード管理テーブルアクセス制御部25はレコー
ド管理テーブル24を参照して、まずアクセスするレコ
ード23のセマフォをチェックする。その結果、セマフ
ォフリー状態であればそのセマフォをロックした後、レ
コード23の読み書きを行い、セマフォロック状態であ
ればセマフォがフリーになるまで待つ。ここで、レコー
ド管理テーブル24は分散共有メモリ13上にあるか
ら、セマフォは各分散ノードで共有されている。従っ
て、セマフォロックまたはフリーの操作は他の分散ノー
ドに直ちに反映され、同一レコード情報の分散ノード間
でのアクセス排他制御が管理される。
【0052】実施例4.図5はこの発明の実施例4によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図であり、相当部分には図3と同一符号を
付してその説明を省略する。図において、26は分散共
有メモリ13上に用意され、各分散ノードの運転状態が
記録されるノード状態監視テーブルであり、27はこの
ノード状態監視テーブル26に当該分散ノード10自身
の運転状態を書き込むとともに、このノード状態監視テ
ーブル26を参照して他の分散ノードの運転状態をチェ
ックして異常な分散ノードの検出を行うノード状態監視
テーブルアクセス制御部である。
【0053】次に動作について説明する。分散共有メモ
リ13内には、各分散ノードの運転状態が記録されるノ
ード状態監視テーブル26が用意されており、このノー
ド状態監視テーブル26は、各分散ノードのノード番号
とそれぞれの運転状態シンボルをエントリとする配列と
なっている。ノード状態監視テーブルアクセス制御部2
7はアプリケーションタスク16によって、タスク終了
時あるいは周期的などの所定のタイミングで呼び出され
ると、当該分散ノード10自身の運転状態をノード状態
監視テーブル26に書き込む。また、アプリケーション
タスク16によって呼び出されたノード状態監視テーブ
ルアクセス制御部27は、ノード状態監視テーブル26
を参照して各分散ノードの運転状態をチェックし、異常
が発生した分散ノードの検出を行い、その異常検出結果
をアプリケーションタスク16に返送する。さらに、ア
プリケーションタスク16がノード状態監視テーブルア
クセス制御部27に割り込み通知登録を行っておくと、
シグナルやイベントといった割り込み通知機構によりそ
れがアプリケーションタスク16に通知される。ノード
状態監視テーブル26を用いた異常検出は、異常状態シ
ンボルが書き込まれているか、または、一定時間その分
散ノードの運転状態シンボルの更新がなかった場合に行
われる。このように、ノード状態監視テーブル26を分
散共有メモリ13上に置くことにより、ネットワーク2
0に接続されている各分散ノードのノード状態がひとつ
のテーブルで集中管理できる。
【0054】実施例5.この実施例5は図5に示した実
施例4による協調分散処理方法を用いた分散処理システ
ムにおいて、CPU11のノード状態監視テーブルアク
セス制御部27を、分散ノード10の運転状態シンボル
をノード状態監視テーブル26に周期的に書き込むノー
ド状態監視テーブル更新部28と、他の分散ノードの状
態監視および異常検出を行って、その結果をあらかじめ
指定されたアプリケーションタスク16に通知するノー
ド異常検出部29とに分離したものである。図6はその
ようなこの発明の実施例5による協調分散処理方法の要
部を示すブロック図であり、他の部分には図5の相当部
分と同一符号を付してその説明を省略する。
【0055】このように、この実施例5はノード状態監
視テーブルアクセス制御部27をノード状態監視テーブ
ル更新部28とノード異常検出部29に分離した構成を
とっており、ノード状態監視テーブル更新部28は一定
の周期でノード状態監視テーブル26に分散ノード10
の運転状態シンボルの書き込みを行っており、ノード異
常検出部29はノード状態監視テーブル26の運転状態
シンボルの異常と、ノード状態監視テーブル更新部28
の書き込み周期のタイムアウトのチェックを行ってい
る。
【0056】実施例6.図7はこの発明の実施例6によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図であり、相当部分には図6と同一符号を
付してその説明を省略する。図において、30はアプリ
ケーションタスク16のロード、実行、待機、終了等の
実行制御を管理するタスク実行制御部であり、31はこ
のタスク実行制御部30によるアプリケーションタスク
16の実行制御に際して参照されるタスク実行管理テー
ブルである。32はノード異常検出部29からの異常通
知を受けると、必要に応じてタスク実行管理テーブル3
1を更新して、必要なアプリケーションタスク16の処
理をタスク実行制御部30に依頼する故障対処部であ
る。
【0057】次に動作について説明する。タスク実行制
御部30は、タイマやイベントやI/O等のタスク制御
タイミングに基づいて、各アプリケーションタスク16
のロード、実行、待機、終了等の実行制御を管理してい
る。このタスク実行制御部30によるタスク実行制御の
状況は、各アプリケーションタスク16の識別名または
識別番号と、上記アプリケーションタスク16のタスク
実行モードを示すシンボルと、どの分散ノードがそのア
プリケーションタスク16を実行可能であるかを示す実
行優先度からなるエントリを持ったタスク実行管理テー
ブル31を用いて集中管理されている。このタスク実行
管理テーブル31は分散ノード10自身のアプリケーシ
ョンタスク16だけでなく、他の分散ノード全体のアプ
リケーションタスクを管理する。
【0058】分散ノード10のタスク実行制御部30は
タスク制御タイミングにおいて、制御されるアプリケー
ションタスク16の実行権の優先度が最も高い分散ノー
ドが自ノードであれば、そのアプリケーションタスク1
6の制御を実行する。また、故障対処部32はノード異
常検出部29からの異常通知を受けて、故障した分散ノ
ードが実行担当していた喪失アプリケーションタスクの
うち、被制御アプリケーションタスクの実行優先度が次
に高い分散ノードが自ノードであれば、そのアプリケー
ションタスクを実行担当するようにタスク実行管理テー
ブル31を更新する。タスク実行制御部30はこのタス
ク実行管理テーブル31を参照してアプリケーションタ
スクの制御を実行することにより、その分担されたアプ
リケーションタスクの制御をバックアップする。
【0059】実施例7.図8はこの発明の実施例7によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図であり、相当部分には図6と同一符号を
付してその説明を省略する。図において、33は分散ノ
ード10におけるあらかじめ定義された自ノードの状態
遷移シーケンスであり、34は他の分散ノードの運転状
態シンボルが、前記状態遷移シーケンス33に沿って自
ノードの状態遷移を発生させる条件に一致すれば、当該
分散ノード10自身の状態を遷移させる状態遷移タスク
である。
【0060】次に動作について説明する。分散ノード1
0の状態遷移タスク34は、分散状態、すなわちノード
状態監視テーブル26における他の分散ノードの運転状
態シンボルが、あらかじめ定義された当該分散ノード1
0自身の状態遷移シーケンス33に沿って自ノードの状
態遷移を発生させる条件に一致すれば、分散ノード10
自身の状態を遷移させる。この状態遷移はアプリケーシ
ョンタスク16に独立に行っても、アプリケーションタ
スク16からシーケンスとタイミングを制御するように
してもかまわない。この状態遷移に際しては、ノード状
態監視テーブル26の自ノードの運転状態シンボルの更
新も行う。なお、この処理は実施例4におけるノード状
態監視テーブルアクセス制御部27が行うようにしても
かまわない。このように、ノード状態監視テーブル26
に各分散ノードのモード状態を書き込み、自ノードがモ
ード遷移可能かどうかを判定して、その判定結果をアプ
リケーションタスク16に通知することにより、各分散
ノードの状態遷移を分散状態と連携して管理制御するこ
とができ、システム全体の立上げおよび立下げ時のノー
ド起動停止順序を管理することが可能となる。
【0061】実施例8.図9はこの発明の実施例8によ
る協調分散処理方法を用いた分散処理システムの要部を
示すブロック図であり、相当部分には図3と同一符号を
付してその説明を省略する。図において、10nは当該
分散処理システムに新規参入したり故障より復旧した分
散ノードである。35はこの新たな分散ノード10nお
よび稼働中の分散ノード10の分散共有メモリ13上
の、共有データおよび状態管理テーブルを含んだデータ
であり、36はこの新たな分散ノード10nと稼働中の
分散タスク10のデータ35の内容を等化するための分
散共有メモリ等化タスクである。
【0062】次に動作について説明する。当該システム
に分散ノード10nが新規参入すると、当該分散ノード
10nの分散共有メモリ13上の共有データおよび状態
管理データを含むデータ35は、他の分散ノード10の
データ35とは一致していない。そこで、分散ノード1
0中のいずれかにおいて分散共有メモリ等化タスク36
を起動し、当該分散ノード10の分散共有メモリ13上
のデータ35の内容をアドレス順に読み取り、それを新
規参入した分散ノード10nに転送してその分散共有メ
モリ13上にデータ35の再書き込みを行っていく。こ
れにより、新規参入した分散ノード10nのデータ35
がリフレッシュされて、その内容が他の分散ノード10
のデータ35の内容と等化される。なお、故障中の分散
ノードが復旧した場合も全く同様である。また、分散共
有メモリ等化タスク36の起動は、該当する分散ノード
10において手動で行っても、タイマやイベントやI/
Oをトリガにして行ってもよく、さらには、実施例7の
状態遷移タスク34からの通知に基づいて行うようにし
てもかまわない。
【0063】実施例9.図10はこの発明の実施例9に
よる分散共有メモリ監視装置を示すブロック図である。
図において、10は分散ノード、11はCPU、12は
主メモリ、13は分散共有メモリ、20は分散共有メモ
リネットワークであり、これらは図3などに同一符号を
付して示した部分と同等のものである。また、40は分
散ノード10のCPU11に接続されたディスプレイや
プリンタなどの表示装置であり、41はこの表示装置4
0に表示される値が格納されている分散共有メモリ13
の部分領域(指定されたアドレスまたは領域)である。
また、CPU11内において、42はユーザパラメータ
の処理を行うパラメータ処理部、43は表示装置40へ
の表示周期が設定されるタイマーであり、44はこのタ
イマー43によって周期的に起動され、分散共有メモリ
13の指定されたアドレスまたは領域、すなわち前記部
分領域41の値を読み出すメモリ読み出し部としてのデ
ータ処理部、45はデータ処理部44が分散共有メモリ
13の部分領域41から読み出した値を表示装置40に
表示する表示制御部である。
【0064】次に動作について説明する。この場合も、
分散共有メモリネットワーク20には複数の分散ノード
10の分散共有メモリ13は直接接続されており、それ
ぞれの分散ノード10は独立に動作する。なお、図10
ではそれら複数の分散ノード10を1つの分散ノード1
0で代表させて示している。ここで、分散共有メモリ1
3の内容は他ノードの書き込みによって、自ノードのC
PU11の動作とは独立にその値が変化する。従って自
ノードのアプリケーションとは独立な手段で、分散共有
メモリ13の状態を動的に監視する必要がある。この実
施例9では、システム構築者(ユーザ)が分散共有メモ
リ13の内容を動的に監視するために、指定した分散共
有メモリ13のアドレスまたは領域の値を表示装置40
に指定の周期で表示している。以下、図11に示すフロ
ーチャートを参照しながら、分散共有メモリ13の部分
領域41の内容表示の処理手順を説明する。
【0065】処理が開始されると、パラメータ処理部4
2はステップST11において、ユーザが指定した動作
パラメータの、分散共有メモリ13の表示すべき部分領
域41のアドレスとその表示周期を取得する。この取得
されたアドレスはデータ処理部44に与えられ、表示周
期はタイマー43に設定される。次に、ステップST1
2でデータ処理部44が起動されて、指定されたアドレ
スに基づいて分散共有メモリ13の部分領域41をアク
セスし、格納されている値を読み出してそのアドレスと
ともに表示制御部45に渡す。次にステップST13に
おいて、表示制御部45は受け取った部分領域41のア
ドレスとその値を、ディスプレイやプリンタなどの表示
装置40に表示する。
【0066】次にステップST14で当該内容表示の処
理がすべて終わったか否かの判定を行う。その結果、処
理が終わっていなければステップST15に進んでタイ
マー43をセットし、ステップST16でタイマー待ち
の状態に入る。タイマー43がタイムアップすると、ス
テップST12に戻って再度データ処理部44を起動
し、上記一連の処理をステップST14で当該内容表示
の処理がすべて終わったことが検出されるまで繰り返
す。これによって、分散共有メモリ13の所定の部分領
域41の値が、ユーザの指定した表示周期に従って周期
的に表示装置40に表示される。
【0067】図12はこのようにして表示が行われた表
示装置40の表示例を示す説明図である。各行には分散
共有メモリ13の部分領域41の16バイトの内容が1
6進表示され、各行の先頭には16バイトの最初のアド
レスが表示されている。このような行が1行以上一度に
表示される。なお、一行に表示されるバイト数はいくつ
でもよく、その表示方法もビット列、4進、8進、アス
キー表示などが選択できる。また、先頭アドレスは必ず
しも表示してもしなくてもよい。
【0068】このように、指定された分散共有メモリ1
3のアドレスまたは領域(部分領域41)の値が指定の
周期で表示装置40に表示されるため、ユーザは自ノー
ドあるいは他ノードのアプリケーションによる分散共有
メモリ13の値変更を動的に監視することが可能とな
る。
【0069】実施例10.図13はこの発明の実施例1
0による分散共有メモリ監視装置を示すブロック図であ
り、相当部分には図10と同一符号を付してその説明を
省略する。図において、46は表示制御部45における
差分表示を支援するための差分表示制御部であり、47
は前周期の部分領域41の値を保存するためのバッファ
である。この実施例10はこれら差分表示制御部46お
よびバッファ47を備えている点で前記実施例9とは異
なっている。
【0070】次に動作について説明する。データ処理部
44は分散共有メモリ13の部分領域41をアクセスし
て読み出した値を表示制御部45に送り、表示制御部4
5はそれを差分表示制御部46に転送する。ここで、バ
ッファ47には前の周期に読み出された部分領域41の
値が保存されており、差分表示制御部46は表示制御部
45より送られてきた値を、バッファ47に保存されて
いる前周期の値と比較し、その差分を表示制御部45に
返送する。表示制御部45はこの差分のみを表示変更す
るように表示装置40を制御する。従って、表示変更さ
れるのは分散共有メモリ13の部分領域41で前周期と
値に変化があったものだけである。このように、変更部
分だけを印字あるいは表示変更することにより、画面更
新が高速、かつちらつきがなくなってユーザが読み易く
なり、また反転表示や強調表示を行うことにより、変更
部分だけを判り易くすることもできる。
【0071】実施例11.図14はこの発明の実施例1
1による分散共有メモリネットワーク追跡装置を示すブ
ロック図であり、相当部分には図10と同一符号を付し
てその説明を省略する。図において、48は分散共有メ
モリネットワーク20を流れる分散共有メモリ更新パケ
ット(パケット)であり、49はこの分散共有メモリ更
新パケット48が格納される分散共有メモリ13上の特
定エリアである。50はこの分散共有メモリ更新パケッ
ト48の受信を検出するパケット受信検出部、51は分
散共有メモリ13上の特定エリア49から分散共有メモ
リ更新パケット48を読み出してそのパケット内容を取
得するパケット取得部であり、52は読み出された分散
共有メモリ更新パケット48の内容を表示装置40に表
示する表示制御部である。
【0072】次に動作について説明する。この場合も、
分散共有メモリネットワーク20には複数の分散ノード
10の分散共有メモリ13は直接接続されており、それ
ぞれの分散ノードは独立に動作する。ここで、分散共有
メモリ13を用いた分散処理システムでは、各分散ノー
ド10が設計通りに動作しても、並行動作する各分散ノ
ード10のメモリ書き込み順序によっては、全体システ
ムとして設計通りの動作をしない場合がある。このよう
なトラブル解析のために、この実施例11では、分散共
有メモリネットワーク20の分散共有メモリ更新パケッ
ト48を受信毎に検出し、受信パケットの内容を受信順
に表示装置40に表示している。以下、図15に示すフ
ローチャートを参照しながら、受信した分散共有メモリ
更新パケット48の内容表示の処理手順を説明する。
【0073】まず、分散共有メモリネットワーク20を
流れる分散共有メモリ更新パケット48は分散ノード1
0の分散共有メモリ13に読み出され、当該分散共有メ
モリ13上の特定エリア49に格納される。これによっ
て分散共有メモリ13のメモリ値変更処理が行われる。
パケット受信検出部50はステップST21において、
この分散共有メモリ更新パケット48の受信の有無を監
視している。パケット受信検出部50にて分散共有メモ
リ更新パケット48の受信が検出されると、パケット取
得部51はステップST22において、分散共有メモリ
13上の特定エリア49に格納されている分散共有メモ
リ更新パケット48を読み出し、そのパケット情報を表
示制御部52に渡して次のパケット受信を待つ。なお、
このパケット情報は分散共有メモリ13の値とアドレス
を含んでいる。次に、表示制御部52はステップST2
3において、ディスプレイやプリンタなどの表示装置4
0にその分散共有メモリ更新パケット48の内容を表示
する。この一連の処理は、ステップST24にて処理の
終了が検出されるまで繰り返される。
【0074】図16はこのようにして表示が行われた表
示装置40の表示例を示す説明図である。各行にはメモ
リ更新アドレスと更新値が一行で表示される。なお、パ
ケット制御情報に依存するが、パケット送信元ノード番
号、パケットチェックサムなどを付帯情報として表示す
ることもでき、ユーザの指定により表示しないようにす
ることもできる。図示の例では、この付帯情報としてパ
ケット送信元ノード番号も表示されている。また、表示
方法はビット列、4進、8進、16進などが選択でき
る。なお、前記パケット制御情報とは、優先度や割り込
み情報などを示す情報である。
【0075】このように、分散共有メモリネットワーク
20の分散共有メモリ更新パケット48が受信毎に検出
されて、その内容が表示装置40に受信の順番に表示さ
れるので、分散共有メモリネットワーク20上での分散
共有メモリ更新順序を追跡することが可能となり、分散
共有メモリ13の並行アクセス動作の正当性をユーザが
確認できるようになる。
【0076】実施例12.図17はこの発明の実施例1
2による分散共有メモリネットワーク追跡装置を示すブ
ロック図であり、相当部分には図14と同一符号を付し
てその説明を省略する。図において、53は主メモリ1
2内の更新時刻、54はメモリ更新前の値が保存されて
いる分散共有メモリ13内の領域であり、55はこの更
新時刻53および領域54に保存されていたメモリ更新
前の値などのパケットには含まれないがメモリ更新に関
連のあるパケット関連情報を読み出し、それをパケット
取得部51が読み出した情報に付加して表示制御部52
に渡すパケット関連情報読み出し部である。
【0077】次に動作について説明する。パケット関連
情報読み出し部55は分散共有メモリ更新パケット48
には含まれないがメモリ更新に関連する情報、例えば分
散共有メモリ13の領域54に保存されているメモリ更
新前の値や、更新時刻53を取得し、それらをパケット
取得部51が分散共有メモリ13上の特定エリア49よ
り読み出した分散共有メモリ更新パケット48の情報と
ともに表示制御部52に渡す。表示制御部52はこの分
散共有メモリ更新パケット48の情報に加えて、前記メ
モリ更新に関連する情報を表示装置40に表示する。こ
のように、分散共有メモリ更新パケット48の情報に加
えてメモリ更新に関連する情報も表示することにより、
分散共有メモリネットワーク20において、複数の分散
ノード10が分散共有メモリ13上の特定の領域にデー
タを書き込んでいる場合に、メモリ更新時刻がずっと変
わらないところがあるならば、当該分散ノード10が故
障していると判定するなどの故障検出が可能となる。
【0078】実施例13.図18はこの発明の実施例1
3による分散共有メモリネットワーク追跡装置を示すブ
ロック図であり、相当部分には図14と同一符号を付し
てその説明を省略する。図において、56はユーザが指
示するパケット条件を取得して、パケット取得部51お
よび表示制御部52に渡すパラメータ設定部であり、パ
ケット取得部51および表示制御部52はこのパラメー
タ設定部56の取得した条件に従って動作する点で、図
14に示したそれらとは異なっている。
【0079】次に動作について説明する。ユーザが指示
するパケット条件、例えば特定アドレスの更新パケット
であることや特定ノードからのパケットであることなど
をパラメータ設定部56が取得し、そのパラメータ値を
パケット取得部51と表示制御部52に渡す。パケット
取得部51は受け取ったパラメータ値に基づくパケット
条件に従って分散共有メモリ更新パケット48を読み出
し、そのパケット情報を表示制御部52に送る。表示制
御部52は受け取ったパラメータ値に基づくパケット条
件に従ってパケット取得部51からのパケット情報の表
示装置40への表示を制御する。このように、パケット
条件に従って、分散共有メモリ更新パケット48の読み
出しや表示装置40の表示制御を行うことにより、分散
共有メモリネットワーク20において、複数の分散ノー
ド10が分散共有メモリ13上の特定の領域にデータを
書き込んでいる場合に、特定の分散ノードのメモリ更新
順序を知ることが可能となる。
【0080】実施例14.図19はこの発明の実施例1
4による分散共有メモリネットワーク設定支援装置を示
すブロック図であり、相当部分には図10と同一符号を
付してその説明を省略する。図において、57はCPU
11内に配置され、分散共有メモリネットワーク20の
制御機能の設定情報が設定される分散共有メモリネット
ワーク設定レジスタであり、58は同じくCPU11内
に配置され、この分散共有メモリネットワーク設定レジ
スタ57の各ビットの意味やビット相互の関係が記述さ
れた分散共有メモリネットワーク設定レジスタプロファ
イラである。59はこれら分散共有メモリネットワーク
設定レジスタ57と分散共有メモリネットワーク設定レ
ジスタプロファイラ58よりなる分散共有メモリネット
ワークハードウェアコントロール部である。また、60
はユーザが指示する制御機能設定、設定参照のパラメー
タを取得して、分散共有メモリネットワーク設定レジス
タプロファイラ58を参照しながら、取得したパラメー
タに従って分散共有メモリネットワーク設定レジスタ5
7の制御機能設定および設定参照の処理を行う分散共有
メモリネットワーク設定レジスタ参照設定部である。6
1は設定参照時にこの分散共有メモリネットワーク設定
レジスタ参照設定部60から送られてきた情報を表示装
置40に表示する表示制御部である。
【0081】次に動作について説明する。この場合も、
分散共有メモリネットワーク20には複数の分散ノード
10の分散共有メモリ13は直接接続されており、それ
ぞれの分散ノードは独立に動作する。ここで、分散共有
メモリカードまたは分散共有メモリボードは、分散共有
メモリネットワーク20の設定やCPU11に対する物
理アドレス設定などの設定機能を、スイッチやジャンパ
線、あるいはレジスタ設定により行えるようになってい
る。例えば、SCRAMNetはCPUからアクセス可
能なコントロールテータスレジスタ(以下CSRとい
う)により、ネットワークアービテーション設定や割り
込み通知設定を行うことができる。この実施例14は、
当該設定機能のうちのCPU11から設定可能な機能、
すなわちソフトウェア的に設定可能な機能について、ユ
ーザが簡単に設定状態の参照や設定ができるような機能
を提供するものである。
【0082】CPU11内には分散共有メモリネットワ
ーク20の制御機能の設定情報が設定された分散共有メ
モリネットワーク設定レジスタ57があり、この分散共
有メモリネットワーク設定レジスタ57の参照・設定に
より分散共有メモリ13および分散共有メモリネットワ
ーク20の制御機能設定が可能となっている。例えば、
SCRAMNetでは分散共有メモリ13や分散共有メ
モリネットワーク20はCSRで行われている。より具
体的には、プロトコルの選択やデータフィルタ機能があ
る。なお、このこデータフィルタ機能とは、あるデータ
が分散共有メモリ13上の特定の領域に書き込まれた場
合に、そのデータがそれ以前に書き込まれているデータ
と同一であれば、他の分散ノード10にパケットが送信
されない機能である。
【0083】以下、図20に示すフローチャートを参照
しながら、分散共有メモリネットワーク20の制御機能
の設定情報の参照や設定の処理手順を説明する。まず、
分散共有メモリネットワーク設定レジスタ参照設定部6
0はユーザによって指定される設定参照、制御機能設定
のパラメータを取得して表示制御部61に渡し、ステッ
プST31においてその取得したパラメータが設定参照
であるのか制御機能設定であるのかを識別する。その結
果、このユーザが指示するパラメータが設定参照であっ
た場合にはステップST32に進み、分散共有メモリネ
ットワーク設定レジスタ参照設定部60はユーザ指定パ
ラメータ(例えば、レジスタ番号など)に従って、分散
共有メモリネットワーク設定レジスタ57よりレジスタ
値を読み出す。その際、分散共有メモリネットワーク設
定レジスタ57の各ビットの意味やビット相互の関係を
記述した分散共有メモリネットワーク設定レジスタプロ
ファイラ58を参照し、設定状態のコメントや定義を取
得して、それを分散共有メモリネットワーク設定レジス
タ参照設定部60から得た値とともに表示制御部61に
渡す。次にステップST33において、表示制御部61
は分散共有メモリネットワーク設定レジスタ参照設定部
60から受けたレジスタ値を、その設定状態のコメント
や定義とともに、ディスプレイやプリンタなどによる表
示装置40に表示する。
【0084】一方、ステップST31における識別結果
が設定であった場合にはステップST34に進み、分散
共有メモリネットワーク設定レジスタ参照設定部60が
分散共有メモリネットワーク設定レジスタプロファイラ
58を参照して、分散共有メモリネットワーク設定レジ
スタ57のどこにどのような値を設定するかを調べ、ユ
ーザパラメータを設定レジスタとその値に変換して設定
情報を作成する。次にステップST35において、分散
共有メモリネットワーク設定レジスタ参照設定部60は
その作成した設定情報を基に分散共有メモリネットワー
ク設定レジスタ57に制御機能設定を行う。なお、ユー
ザからの指示があれば、この分散共有メモリネットワー
ク設定レジスタ57に設定した結果を分散共有メモリネ
ットワーク設定レジスタ参照設定部60が読み出し、表
示制御部61の制御により分散共有メモリネットワーク
設定レジスタプロファイラ58を参照して表示装置40
に表示する。
【0085】図21はこのようにして表示が行われた表
示装置40の表示の一例を示す説明図である。各行に設
定機能項目と現在の設定が表示される。なお、表示項目
はユーザの指示により選択できる。また、別の表示例を
図22に示す。このこ場合には設定機能項目とは関係な
く全レジスタ情報が表示されている。なお、表示形式
は、ビット列、4進、8進、16進などユーザが指定で
きる。
【0086】このように、ユーザの指示に従って分散共
有メモリネットワーク設定レジスタ57に設定されてい
る分散共有メモリネットワーク20の制御機能の設定情
報を読み出し、ユーザが理解しやすい形式に変換表示す
るとともに、ユーザ指示に従って分散共有メモリネット
ワーク設定レジスタ57に制御機能設定を行うことによ
り、分散共有メモリネットワーク20の制御機能のう
ち、ソフトウェア的に設定可能な機能について、ユーザ
が簡単にその設定状態の確認や設定を行える分散共有メ
モリネットワーク設定支援装置が実現できる。
【0087】実施例15.図23はこの発明の実施例1
5による分散共有メモリネットワーク設定支援装置を示
すブロック図であり、相当部分には図19と同一符号を
付してその説明を省略する。図において、62は表示制
御部61によって制御装置40の表示を周期的に行う際
の表示周期が設定されるタイマーである。なお、この実
施例15は上記実施例14のレジスタ設定機能を除き、
参照機能のみを残したものにこのタイマー62を追加し
たものである。
【0088】次に動作について説明する。分散共有メモ
リネットワーク設定レジスタ参照設定部60はタイマー
62に、表示制御部61を周期的に起動するための起動
周期を設定する。表示制御部61はこのタイマー62に
設定された周期に従って起動され、その都度、分散共有
メモリネットワーク設定レジスタ参照設定部60から渡
されたレジスタ値などの情報を表示装置40に表示す
る。このように、タイマー62は周期的に表示制御部6
1を起動するため、レジスタ設定状態が周期的に表示さ
れる。なお、ユーザ指示パラメータに従って情報が変更
された場合、その情報は変更の都度表示制御部61に渡
される。
【0089】実施例16.図24はこの発明の実施例1
6による分散共有メモリネットワーク設定支援装置を示
すブロック図であり、相当部分には図23と同一符号を
付してその説明を省略する。図において、63は表示装
置40における差分表示を制御する差分表示制御部であ
り、64は前周期の値を保存しておくためのバッファで
ある。この実施例16は実施例15の表示制御部61
を、この差分表示制御部63とバッファ64で代替した
ものである。
【0090】次に動作について説明する。実施例15で
説明した周期表示において、差分表示制御部63は前回
の周期における値をバッファ64に保存しておき、表示
に際しては、このバッファ64に保存されている前回の
周期の値と今回の周期の値との変更分を計算し、その変
更分のみを表示制御装置61に渡して表示装置40に表
示させる。このように、差分表示制御部63で算出した
前周期の値との変更分により、変更のあったレジスタ設
定状態のみを表示できるほか、高速、かつ、ちらつきの
ない画面表示ができる。また差分表示制御部63からの
変更分によって変更情報のみを反転表示、強調表示する
ことにより、さらに読み取りやすい表示を行うことがで
きる。
【0091】
【発明の効果】請求項1に記載の発明によれば、各分散
ノードが分散共有メモリ上に置かれた状態管理テーブル
を参照して、その分散システム管理データによる相互監
視を行いながら通常処理を行い、他の分散ノードの障害
を検出すると、その障害によって喪失されるアプリケー
ションタスクの実行権の優先度に従って、正常な分散ノ
ード間で喪失機能代替を行うように構成したので、分散
処理システム、特にリアルタイム性と耐故障性が要求さ
れるシステムにおいて、複雑な通信管理や分散制御を行
うことなく、通常の分散処理および故障時の協調動作を
効率よく実施することが可能になる効果がある。
【0092】請求項2に記載の発明によれば、分散共有
メモリ上の任意サイズのメモリ領域をキーワード管理を
行うための分散共有メモリ管理テーブルとし、この分散
共有メモリ管理テーブルを参照して共有データのアクセ
ス管理を行うように構成したので、分散ノード間でアド
レスによらず、そのキーワードを介して共有データのア
クセス管理を行うことができる効果がある。
【0093】請求項3に記載の発明によれば、共有デー
タのレコードのセマフォを含むエントリを配列したレコ
ード管理テーブルを分散共有メモリ上に置き、このレコ
ード管理テーブルのセマフォの状態に基づいて共有デー
タのレコードをアクセスするように構成したので、分散
ノード間での共有データのレコードアクセスの排他制御
が可能になる効果がある。
【0094】請求項4に記載の発明によれば、各分散ノ
ードが分散共有メモリ上に置かれたノード状態監視テー
ブルに自ノードの運転状態シンボルを書き込み、各分散
ノードでそのノード状態監視テーブルを参照するように
構成したので、ノード状態監視テーブル上で各分散ノー
ド相互の状態監視および異常検出が可能になる効果があ
る。
【0095】請求項5に記載の発明によれば、分散共有
メモリ上に置いたタスク実行管理テーブルによって各分
散ノードのアプリケーションタスクを管理し、ある分散
ノードが故障したときに、故障ノードの機能代替可能で
あり、かつ実行優先度の高い分散ノードが当該機能をア
プリケーションタスクとして起動するように構成したの
で、故障した分散ノードの処理をシステム全体で協調的
に相補するように動作する分散処理システムが得られる
効果がある。
【0096】請求項6に記載の発明によれば、分散共有
メモリ上に置いたノード状態監視テーブルと、あらかじ
め定義された状態遷移シーケンスに従って自ノードがモ
ード遷移可能かどうかの判定を行い、その判定結果をア
プリケーションタスクに通知するように構成したので、
各分散ノードの状態遷移を分散状態と連携して管理制御
することができ、システム全体の立上げおよび立下げ時
のノード起動停止順序を管理することが可能になる効果
がある。
【0097】請求項7に記載の発明によれば、分散ノー
ドが故障より復旧した時、またはシステムに新規参入し
た時に、その分散ノードに健全な分散ノードから分散共
有メモリの内容を転送するように構成したので、全ての
分散ノードの分散共有メモリの内容を容易に等化できる
効果がある。
【0098】請求項8に記載の発明によれば、分散共有
メモリのアドレスまたは領域を指定して、そのアドレス
または領域の値を周期的に読み出して表示装置に表示す
るように構成したので、刻々変化する分散共有メモリの
内容を所定の周期で表示することが可能となり、システ
ム構築者(ユーザ)が、自ノードあるいは他ノードのア
プリケーションによる分散共有メモリの値の変更を動的
に監視することが可能な分散共有メモリ監視装置が得ら
れる効果がある。
【0099】請求項9に記載の発明によれば、メモリ読
み出し部が前回の周期で読み出した値と今回の周期で読
み出した値の差分を表示制御部に渡して、表示装置の表
示制御を行わせるように構成したので、前周期と値に変
化があったものだけを表示変更をすることが可能となる
ため、印字や画面更新などを高速に行うことができる効
果がある。
【0100】請求項10に記載の発明によれば、分散共
有メモリネットワーク上のパケットの受信を検出して、
受信したパケット内容を受信の順番に表示装置に表示す
るように構成したので、分散共有メモリネットワーク上
での分散共有メモリの更新順序を追跡することが可能と
なり、分散共有メモリの並行アクセス動作の正当性を容
易に確認することができる分散共有メモリネットワーク
追跡装置が得られる効果がある。
【0101】請求項11に記載の発明によれば、パケッ
トには含まれないがメモリ更新に関連する情報も、パケ
ット取得部の読み出したパケット内容とともに表示装置
に表示するように構成したの、分散共有メモリネットワ
ークにおいて複数の分散ノードが分散共有メモリ上の特
定領域にデータを書き込んでいる場合に、メモリ更新時
刻に変化のない所があれば、それによって該当する分散
ノードに障害が発生したことを検出できる効果がある。
【0102】請求項12に記載の発明によれば、ユーザ
が指定するパケット条件を取得して、そのパケット条件
に応じてパケットの読み出しおよび表示制御を行うよう
に構成したので、分散共有メモリネットワークで複数の
分散ノードが分散共有メモリ上の特定領域の書き込みを
行っている場合に、ユーザが特定の分散ノードのメモリ
更新順序を知ることができる効果がある。
【0103】請求項13に記載の発明によれば、ユーザ
の指定するパラメータが制御機能設定であれば設定情報
を作成して分散共有メモリネットワーク設定レジスタに
設定し、設定参照であれば分散共有メモリネットワーク
設定レジスタより読み出した設定情報を表示装置に表示
するように構成したので、ユーザが簡単に分散共有メモ
リネットワークの各種設定、およびその設定情報の参照
を行うことができる分散共有メモリネットワーク設定支
援装置が得られる効果がある。
【0104】請求項14に記載の発明によれば、表示制
御部をタイマーによって所定の周期で起動するように構
成したので、分散共有メモリネットワーク設定レジスタ
に設定されている設定情報を周期的に表示することが可
能となり、より使いやすい分散共有メモリネットワーク
設定支援装置が得られる効果がある。
【0105】請求項15に記載の発明によれば、分散共
有メモリネットワーク設定レジスタ参照設定部が前周期
において読み出した値と、今周期で読み出した値の差分
に従って表示装置の表示を制御するように構成したの
で、前周期と値に変化があったものだけを表示変更をす
ることが可能となり、印字や画面更新などを高速に行う
ことができる効果がある。
【図面の簡単な説明】
【図1】 この発明の実施例1による協調分散処理方法
を用いた分散処理システムを示すブロック図である。
【図2】 上記実施例における処理の流れを示すフロー
チャートである。
【図3】 この発明の実施例2による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図4】 この発明の実施例3による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図5】 この発明の実施例4による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図6】 この発明の実施例5による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図7】 この発明の実施例6による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図8】 この発明の実施例7による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図9】 この発明の実施例8による協調分散処理方法
を用いた分散処理システムの要部を示すブロック図であ
る。
【図10】 この発明の実施例9による分散共有メモリ
監視装置を示すブロック図である。
【図11】 上記実施例における処理の流れを示すフロ
ーチャートである。
【図12】 上記実施例における表示例を示す説明図で
ある。
【図13】 この発明の実施例10による分散共有メモ
リ監視装置を示すブロック図である。
【図14】 この発明の実施例11による分散共有メモ
リネットワーク追跡装置を示すブロック図である。
【図15】 上記実施例における処理の流れを示すフロ
ーチャートである。
【図16】 上記実施例における表示例を示す説明図で
ある。
【図17】 この発明の実施例12による分散共有メモ
リネットワーク追跡装置を示すブロック図である。
【図18】 この発明の実施例13による分散共有メモ
リネットワーク追跡装置を示すブロック図である。
【図19】 この発明の実施例14による分散共有メモ
リネットワーク設定支援装置を示すブロック図である。
【図20】 上記実施例における処理の流れを示すフロ
ーチャートである。
【図21】 上記実施例における表示例を示す説明図で
ある。
【図22】 上記実施例における他の表示例を示す説明
図である。
【図23】 この発明の実施例15による分散共有メモ
リネットワーク設定支援装置を示すブロック図である。
【図24】 この発明の実施例16による分散共有メモ
リネットワーク設定支援装置を示すブロック図である。
【図25】 従来の協調分散処理システムを示すブロッ
ク図である。
【図26】 従来の分散処理システムにおける共有分散
メモリの記憶方法を示すブロック図である。
【符号の説明】
10,10a〜10d,10n 分散ノード、13 分
散共有メモリ、14共有データ、16 アプリケーショ
ンタスク、20 分散共有メモリネットワーク、21
分散共有メモリ管理テーブル、23 レコード、24
レコード管理テーブル、26 ノード状態監視テーブ
ル、31 タスク実行管理テーブル、33 状態遷移シ
ーケンス、40 表示装置、41 部分領域(指定され
たアドレスまたは領域)、44 データ処理部(メモリ
読み出し部)、45、52、61表示制御部、46、6
3 差分表示制御部、48 分散共有メモリ更新パケッ
ト(パケット)、50 パケット受信検出部、51 パ
ケット取得部、55 パケット関連情報読み出し部、5
6 パラメータ設定部、57 分散共有メモリネットワ
ーク設定レジスタ、60 分散共有メモリネットワーク
設定レジスタ参照設定部、62 タイマー。

Claims (15)

    【特許請求の範囲】
  1. 【請求項1】 複数の分散ノードの分散共有メモリを分
    散共有メモリネットワークで接続し、前記各分散共有メ
    モリの内容変更が分散ノードの動作とは独立に他の分散
    ノードの分散共有メモリに通信されてメモリ内容が反映
    される分散処理システムの協調分散処理方法において、
    前記分散共有メモリ上に、前記各分散ノードが共有利用
    する共有データと、分散システム管理データが記録され
    た状態管理テーブルを置き、前記各分散ノードは前記状
    態管理テーブルの分散システム管理データによる相互監
    視を行いながら通常処理を行い、他の分散ノードの故障
    を検出すると、故障した前記分散ノードが実行していた
    アプリケーションタスクの実行権の優先度に従い、正常
    な分散ノード間で故障した分散ノードの喪失機能を代替
    することを特徴とする協調分散処理方法。
  2. 【請求項2】 キーワードを管理する分散共有メモリ管
    理テーブルを分散共有メモリ上に置き、アプリケーショ
    ンタスクからの前記キーワードによるアクセス要求に基
    づいて上記分散共有メモリ管理テーブルを参照し、各分
    散ノード間で前記キーワードを介して共有データのアク
    セス管理を行うことを特徴とする請求項1に記載の協調
    分散処理方法。
  3. 【請求項3】 共有データにあるレコードのアドレス、
    サイズおよびセマフォからなるエントリの配列であるレ
    コード管理テーブルを共有分散メモリ上に置き、前記レ
    コードのアクセスに際して前記レコード管理テーブルを
    参照し、当該レコードのセマフォの状態に基づいて、同
    一のレコード情報の分散ノード間でのアクセス排他制御
    を管理することを特徴とする請求項1に記載の協調分散
    処理方法。
  4. 【請求項4】 各分散ノードのノード番号とそれら各分
    散ノードの運転状態シンボルをエントリとする配列であ
    るノード状態監視テーブルを共有分散メモリ上に置き、
    前記ノード状態監視テーブルに自ノードの運転状態シン
    ボルを所定のタイミングで書き込むとともに、前記ノー
    ド状態監視テーブルを参照して各分散ノードの状態監視
    および異常検出を行い、それを指定のアプリケーション
    タスクに通知することを特徴とする請求項1に記載の協
    調分散処理方法。
  5. 【請求項5】 アプリケーションタスクの識別名または
    識別番号と、上記アプリケーションタスクのタスク実行
    モードを示すシンボルと、どの分散ノードがそのアプリ
    ケーションタスクを実行可能であるかを示す実行優先度
    からなるエントリを持ち、各分散ノード全体のアプリケ
    ーションタスクを集中管理するためのタスク実行管理テ
    ーブルを共有分散メモリ上に置き、他の分散ノードの故
    障が検出されると、当該故障にて喪失されるアプリケー
    ションタスクの実行権の次点優先度を持った分散ノード
    においてそのタスク実行管理テーブルを更新し、当該ア
    プリケーションタスクを実行担当することを特徴とする
    請求項1に記載の協調分散処理方法。
  6. 【請求項6】 各分散ノードのノード番号とそれら各分
    散ノードの運転状態シンボルをエントリとする配列であ
    るノード状態監視テーブルを共有分散メモリ上に置き、
    前記ノード状態監視テーブルにおける他の分散ノードの
    運転状態シンボルが、あらかじめ定義された自ノードの
    状態遷移シーケンスに沿って自ノードの状態遷移を発生
    させる条件に一致すれば、自ノードの状態を遷移させる
    ことを特徴とする請求項1に記載の協調分散処理方法。
  7. 【請求項7】 故障していた分散ノードを復旧した時、
    または分散ノードがシステムに新規参入した時に、前記
    分散ノードに、当該システムに既に参入している健全な
    分散ノードから分散共有メモリの内容を転送して、各分
    散ノードの分散共有メモリの内容を等化することを特徴
    とする請求項1に記載の協調分散処理方法。
  8. 【請求項8】 複数の分散ノードの分散共有メモリを分
    散共有メモリネットワークで接続し、前記各分散共有メ
    モリの内容変更が分散ノードの動作とは独立に他の分散
    ノードの分散共有メモリに通信されてメモリ内容が反映
    される分散処理システムの分散共有メモリ監視装置にお
    いて、前記各分散ノードにて前記分散共有メモリの指定
    されたアドレスまたは領域の値を所定の周期で読み出す
    メモリ読み出し部と、前記メモリ読み出し部によって読
    み出された値を前記所定の周期で表示装置に表示する表
    示制御部とを有することを特徴とする分散共有メモリ監
    視装置。
  9. 【請求項9】 前記メモリ読み出し部によって前周期に
    読み出された値と今周期に読み出された値の差分を算出
    し、それを前記表示制御部に渡す差分表示制御部を設け
    たことを特徴とする請求項8に記載の分散共有メモリ監
    視装置。
  10. 【請求項10】 複数の分散ノードの分散共有メモリを
    分散共有メモリネットワークで接続し、前記各分散共有
    メモリの内容変更が分散ノードの動作とは独立に他の分
    散ノードの分散共有メモリに通信されてメモリ内容が反
    映される分散処理システムの分散共有メモリネットワー
    ク追跡装置において、前記各分散ノードにて前記分散共
    有メモリネットワーク上のパケットを受信毎に検出する
    パケット受信検出部と、前記パケット受信検出部で受信
    ・検出したパケット内容を取得するパケット取得部と、
    前記パケット取得部で取得された情報を表示装置に受信
    の順に表示する表示制御部とを有すること特徴とする分
    散共有メモリネットワーク追跡装置。
  11. 【請求項11】 前記パケット受信検出部で受信毎に検
    出されたパケットには含まれないメモリ更新に関連する
    情報を取得して前記表示制御部に渡すパケット関連情報
    読み出し部を設けたことを特徴とする請求項10に記載
    の分散共有メモリネットワーク追跡装置。
  12. 【請求項12】 ユーザによって指定されるパケット条
    件を取得し、それを前記パケット取得部および表示制御
    部に渡すパラメータ設定部を設けたことを特徴とする請
    求項10に記載の分散共有メモリネットワーク追跡装
    置。
  13. 【請求項13】 複数の分散ノードの分散共有メモリを
    分散共有メモリネットワークで接続し、前記各分散共有
    メモリの内容変更が分散ノードの動作とは独立に他の分
    散ノードの分散共有メモリに通信されてメモリ内容が反
    映される分散処理システムの分散共有メモリネットワー
    ク設定支援装置において、前記分散共有メモリネットワ
    ークの制御機能の設定情報が設定される分散共有メモリ
    ネットワーク設定レジスタと、ユーザによって指示され
    る、前記分散共有メモリネットワーク設定レジスタの制
    御機能設定、設定参照のパラメータを取得し、取得した
    パラメータが制御機能設定であれば設定情報を作成して
    前記分散共有メモリネットワーク設定レジスタに設定
    し、設定参照であれば前記分散共有メモリネットワーク
    設定レジスタより設定情報を読み出す分散共有メモリネ
    ットワーク設定レジスタ参照設定部と、前記分散共有メ
    モリネットワーク設定レジスタ参照設定部によって前記
    分散共有メモリネットワーク設定レジスタより読み出さ
    れた設定情報を表示装置に表示する表示制御部とを有す
    ること特徴とする分散共有メモリネットワーク設定支援
    装置。
  14. 【請求項14】 前記表示制御部を一定時間周期で起動
    するためのタイマーを設けたことを特徴とする請求項1
    3に記載の分散共有メモリネットワーク設定支援装置。
  15. 【請求項15】 前記分散共有メモリネットワーク設定
    レジスタ参照設定部によって前周期に読み出された値と
    今周期に読み出された値の差分を算出し、それに従って
    前記表示装置の表示を制御する差分表示制御部を設けた
    ことを特徴とする請求項14に記載の分散共有メモリネ
    ットワーク設定支援装置。
JP7156082A 1995-03-14 1995-06-22 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置 Pending JPH08314875A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7156082A JPH08314875A (ja) 1995-03-14 1995-06-22 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP5476095 1995-03-14
JP7-54760 1995-03-14
JP7156082A JPH08314875A (ja) 1995-03-14 1995-06-22 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2002130037A Division JP2003006177A (ja) 1995-03-14 2002-05-01 分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置および分散共有メモリネットワーク設定支援装置。

Publications (1)

Publication Number Publication Date
JPH08314875A true JPH08314875A (ja) 1996-11-29

Family

ID=26395577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7156082A Pending JPH08314875A (ja) 1995-03-14 1995-06-22 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置

Country Status (1)

Country Link
JP (1) JPH08314875A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6928585B2 (en) 2001-05-24 2005-08-09 International Business Machines Corporation Method for mutual computer process monitoring and restart
JP2006209490A (ja) * 2005-01-28 2006-08-10 Fujitsu Ltd 設定情報同期プログラム
JP2010182141A (ja) * 2009-02-06 2010-08-19 Nec Corp データ処理装置及びデータ処理方法
JP2011008614A (ja) * 2009-06-26 2011-01-13 Nec Corp 複合イベント配信システム、複合イベント処理装置、複合イベント処理方法、及び複合イベント処理プログラム
WO2011080910A2 (en) 2010-01-04 2011-07-07 Nec Corporation Method, distributed system and computer program for failure recovery
JP2014142945A (ja) * 2007-12-26 2014-08-07 Symantec Corp 分散リソース管理のためのバランスしたコンシステント・ハッシュ
US9152491B2 (en) 2012-02-17 2015-10-06 Nec Corporation Job continuation management apparatus, job continuation management method and job continuation management program
WO2015162754A1 (ja) * 2014-04-24 2015-10-29 三菱電機株式会社 制御システム、マスタ局、およびリモート局
US9342451B2 (en) 2011-02-21 2016-05-17 Fujitsu Limited Processor management method
US9858159B2 (en) 2015-02-20 2018-01-02 International Business Machines Corporation Fault tolerant distributed computation
CN111539546A (zh) * 2019-02-01 2020-08-14 帆宣***科技股份有限公司 智能型预诊断与健康管理***的建模方法及其电脑程序产品

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6928585B2 (en) 2001-05-24 2005-08-09 International Business Machines Corporation Method for mutual computer process monitoring and restart
JP2006209490A (ja) * 2005-01-28 2006-08-10 Fujitsu Ltd 設定情報同期プログラム
JP4550604B2 (ja) * 2005-01-28 2010-09-22 富士通株式会社 設定情報同期プログラム
JP2014142945A (ja) * 2007-12-26 2014-08-07 Symantec Corp 分散リソース管理のためのバランスしたコンシステント・ハッシュ
JP2010182141A (ja) * 2009-02-06 2010-08-19 Nec Corp データ処理装置及びデータ処理方法
US8812530B2 (en) 2009-02-06 2014-08-19 Nec Corporation Data processing device and data processing method
JP2011008614A (ja) * 2009-06-26 2011-01-13 Nec Corp 複合イベント配信システム、複合イベント処理装置、複合イベント処理方法、及び複合イベント処理プログラム
JP2013516665A (ja) * 2010-01-04 2013-05-13 日本電気株式会社 障害リカバリのための方法、分散システム、およびコンピュータプログラム
WO2011080910A2 (en) 2010-01-04 2011-07-07 Nec Corporation Method, distributed system and computer program for failure recovery
US9342451B2 (en) 2011-02-21 2016-05-17 Fujitsu Limited Processor management method
JP5967073B2 (ja) * 2011-02-21 2016-08-10 富士通株式会社 プロセッサ管理方法
US9152491B2 (en) 2012-02-17 2015-10-06 Nec Corporation Job continuation management apparatus, job continuation management method and job continuation management program
WO2015162754A1 (ja) * 2014-04-24 2015-10-29 三菱電機株式会社 制御システム、マスタ局、およびリモート局
CN105393241A (zh) * 2014-04-24 2016-03-09 三菱电机株式会社 控制***、主控站点以及远程站点
JP5908175B2 (ja) * 2014-04-24 2016-04-26 三菱電機株式会社 制御システム、マスタ局、およびリモート局
US9577882B2 (en) 2014-04-24 2017-02-21 Mitsubishi Electric Corporation Control system, master station, and remote station
US9858159B2 (en) 2015-02-20 2018-01-02 International Business Machines Corporation Fault tolerant distributed computation
CN111539546A (zh) * 2019-02-01 2020-08-14 帆宣***科技股份有限公司 智能型预诊断与健康管理***的建模方法及其电脑程序产品

Similar Documents

Publication Publication Date Title
EP1179770B1 (en) File system
US6782492B1 (en) Memory error recovery method in a cluster computer and a cluster computer
JP3645281B2 (ja) 共用メモリを有するマルチプロセッサ・システム
EP1190320B1 (en) System and method of monitoring a distributed fault tolerant computer system
CN108628717A (zh) 一种数据库***及监控方法
JPH08314875A (ja) 協調分散処理方法、および分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置、分散共有メモリネットワーク設定支援装置
KR100991251B1 (ko) 멀티프로세서 시스템에서 하이퍼 트랜스포트 라우팅 테이블을 프로그래밍하기 위한 시스템 및 방법
JPH086910A (ja) クラスタ型計算機システム
CN106294031B (zh) 一种业务管理方法和存储控制器
JP3490002B2 (ja) マルチクラスタシステムを構成する計算機
TW200304297A (en) Clustered/fail-over remote hardware management system
CN113157796B (zh) 一种基于微服务的数采展示***
CN101072088A (zh) 数据备份***、主控板和数据备份方法
CN111752758B (zh) 一种双主架构的InfluxDB高可用***
JPH09305558A (ja) 二重化システムのデータベースサーバ
JP2013161266A (ja) 呼処理情報の冗長化制御システムおよびこれに利用する予備保守サーバ
JP3108042B2 (ja) マルチノード情報処理システムにおけるチケット分配方法
CN112799835A (zh) 一种分布式数据库***元数据的处理方法及***
JP2002215473A (ja) 情報処理装置及び多重化方式
JP2000215074A (ja) システムの運用方式及び障害自動復旧方式
JPH09305494A (ja) 拡張記憶装置のデータ転送制御回路
JP2003006177A (ja) 分散共有メモリ監視装置、分散共有メモリネットワーク追跡装置および分散共有メモリネットワーク設定支援装置。
JP2000089994A (ja) データベース管理方法およびその装置
JPH0427239A (ja) Lan接続装置の制御方法
JP2713528B2 (ja) 記憶装置容量の無中断拡張方法