JP3084383B2 - リング通信路障害処理方式 - Google Patents

リング通信路障害処理方式

Info

Publication number
JP3084383B2
JP3084383B2 JP02324106A JP32410690A JP3084383B2 JP 3084383 B2 JP3084383 B2 JP 3084383B2 JP 02324106 A JP02324106 A JP 02324106A JP 32410690 A JP32410690 A JP 32410690A JP 3084383 B2 JP3084383 B2 JP 3084383B2
Authority
JP
Japan
Prior art keywords
failure
transmission
ring
processor
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP02324106A
Other languages
English (en)
Other versions
JPH04192836A (ja
Inventor
順治 宮川
正博 倉田
勉 相沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Original Assignee
Fujitsu Ltd
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd, Nippon Telegraph and Telephone Corp filed Critical Fujitsu Ltd
Priority to JP02324106A priority Critical patent/JP3084383B2/ja
Publication of JPH04192836A publication Critical patent/JPH04192836A/ja
Application granted granted Critical
Publication of JP3084383B2 publication Critical patent/JP3084383B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Small-Scale Networks (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はリング通信路障害処理方式に係り、特にロー
カルエリアネットワークにおける複数のプロセッサ間を
光ループ等の1本のリング形状の通信路を用いて結合し
た複数のプロセッサから構成される複合計算機システム
において、送信異常時の障害箇所が送信先のプロセッサ
側にあるのか、リング通信路にあるのかを識別し、障害
箇所に応じた最適な障害処理を選択可能なリング通信路
障害処理方式に関する。
〔従来の技術〕
光ループ等のリング形状の通信路を用いた通信では送
信プロセッサは送信データに送信先アドレス情報を付与
してリング通信路(以下リングという)上にデータを出
力する。この出力されたデータはリング上を一定方向に
伝わる。
送信先となった受信側のプロセッサでは通信アダプタ
部がリングに各プロセッサを接続しており、データのア
ドレス情報と送信先アドレスが一致しているかチェック
を行ない、一致している場合にプロセッサ内に送信デー
タが取り込まれ、かつ、送信元に対して受信側からの受
信応答データ通知が返される。この受信応答データは前
記の送信データと同一方向に伝達され、リングを一周し
て送信元に戻る。
また、物理リングを二重化しておき、各通信アダプタ
部で信号のレベル監視手段等を用いてリング断の監視を
行う。また、リング断を検出したアダプタ部でリングを
ループバックすることによって正常な閉リングを再構成
して通信路を確保する高信頼対策が採られている。
従来方式では、一定時間内に送信先より受信応答が戻
ってこない場合、送信元のアダプタ部からのデータ送信
は正常であったため、他系が応答しないものとして一意
に他系障害としてプロセッサ内の送信要求元プログラム
に送信失敗を通知する。
〔発明が解決しようとする課題〕
しかるに、従来方式ではデータ送信後、一定時間内に
受信応答が戻ってこない場合、アダプタからの送信は正
常であったとし、他系がダウン中で、応答を返さない等
の他系側に原因がある場合以外に、送信側元アダプタの
リング接続部の不良によってアダプタ自身がリングの両
端の他のアダプタによってループバックされた通信路に
異常がある場合等の自系側に原因がある場合もあるた
め、他系および自系のどちらに真の障害原因があるのか
即断することができず、障害処理が遅れるという問題が
ある。
〔課題を解決するための手段〕
第1図は、本発明の原理説明図である。リング形状の
閉じられた通信路に複数のプロセッサを接続して相互に
データの送受信を行い、かつリング通信路障害時はプロ
セッサをリング伝送路に接続する通信アダプタ部におい
て障害部位をループバックし、正常な閉リング通信路を
再編成して通信の継続を図るプロセッサ間通信方式にお
いて、データ送信後送信先のプロセッサからの応答を監
視する応答監視手段1と、該応答監視手段1により一定
時間内に応答が戻らないと判定された場合にデータ送信
先アドレスを送信対象プロセッサのPCIアドレスから自
プロセッサのPCIアドレスに変更して、自プロセッサ宛
にデータの再送信を行う再送信手段3と、再送信手段3
により自プロセッサ宛データを正常に受信した場合は障
害原因を他系障害とし、自プロセッサ宛の送信も失敗し
た場合は障害原因を自系障害として送信したプロセッサ
内の送信要求元プログラムに送信失敗を通知する送信異
常通知手段5と、データ送信失敗時に自プロセッサ宛の
リング折り返し再送試験を行う再送試験手段7と、再送
試験手段7で得られた結果に基づいて障害原因を識別す
る障害識別手段9と、障害識別手段9で自系障害と識別
された場合は送信側通信アダプタ部を障害として切離
し、予備の通信アダプタ部を用いて送信を継続し、他系
障害と識別された場合は他系障害通信アダプタ部からの
再開通知を受信するまで新たな送信要求に対して他系障
害中を通知する障害対策手段11とを有する。
〔作用〕
本発明はデータ送信後一定時間内に受信応答が戻って
こない場合の原因が送信元アダプタによってループバッ
クされた通信路に異常があるとする時に、送信元アダプ
タ自身を送信元に指定し、リングを一周したリング折り
返しデータ送信を行うことにより、通信先プロセッサ側
に異常原因(他系障害)があるか、通信路を含む送信元
アダプタ部に異常原因(自系障害)があるかを識別す
る。
このため、現用リングと予備リングの切り分け可能で
あるリング通信路を用い、送信先からの応答データが一
定時間内に戻らない場合、送信先を送信元アダプタに変
更して再送信を行い、その結果に基づいて自系障害か他
系障害かを識別後、通信異常を送信要求プログラムに通
知する。
また、自系障害時は、自系プロセッサに対応する別の
通信アダプタの有無をチェックし、別の通信アダプタが
存在している場合に、その通信アダプタを用いて、通信
を継続する。一方、他系障害時は他系の回復を自動監視
することによって自系または他系のそれぞれの障害箇所
に応じた最適な障害処理を行う。
〔実施例〕
第2図は本発明の一実施例のシステム構成図を示す。
同図中、高速リング通信路(以下リングという)21は現
用リング41、予備リング43がある。プロセッサ23、25、
27、29はリング21に接続されている。通信アダプタ(PC
I:Processer Communication Interface)31、33、35、3
7、39は各プロセッサをリング21に接続する。
第3図は本発明の一実施例の各プロセッサ内の機能の
ブロック図を示す。同図は、第2図の送信側プロセッサ
23を例として示しているため同一部分には同一符号を付
す。通信対象プログラム301は各プロセッサ間のデータ
の送受信の主体となる。リング送受信制御部302は通信
対象プログラム301からのデータ送受信要求に従い通信
対象プログラムとの送受信データを授受する。送信制御
部303はリング送受信制御部302からの送信データをPCI3
1を介してリングに送出する。受信制御部304はPCI31を
介してリング21から自プロセッサ宛のデータを受信す
る。
また、再送信制御部305、障害識別制御部306、PCI管
理部307により送受信異常時の処理を制御する異常処理
手段を構成している。再送信制御部305は、送信異常時
に再度、リング21にデータを送出する制御を行う。障害
識別制御部306は再送信制御部305により送信され、その
結果に基づいて障害識別を行う。PCI管理部307は現用の
PCIまたは、予備のPCIの切り換え制御機能を有する。
リング21は現用リング41と予備リング43の2つの物理
リングから構成される。また、リング21に接続されてい
る各PCIはリング21の正常性を信号レベルで監視して、
リング21断検出時は自動的に現用リングから予備リング
43への切り換えを行い、通信の継続を保障する機能(リ
ング切り換え機能)を有する。
前述の請求項における各手段と、上記の第3図に示す
各構成要素を以下のように定義する。応答監視手段1は
受信制御部304、再送信手段3は再送信制御部305、送信
異常通知手段5はリンク送受信制御部302、再送試験手
段7は送信制御部303、障害識別手段9は障害識別制御
部306、障害対策手段11はPCI管理部307にそれぞれ対応
する。
第4図は送信元アダプタ障害によるリング断の例を示
す。PCIが現用リング41から予備リング43に切り換えて
も再度リング21断を検出する場合は、第4図に示すよう
にリング断を最初に検出する断箇所の両端のPCIにてリ
ング21をループバックし、正常な閉リングを再構成する
機能を有する。
次に第2図に示すように、プロセッサ23からプロセッ
サ25にデータ送信を行う場合を例として説明する。この
場合プロセッサ23は送信プロセッサとなり、プロセッサ
25は受信プロセッサとなる。
送信プロセッサ23は送信データに送信先アドレスであ
るPCI33のリングアドレスを送信データに付与して、現
用PCI31よりリング21にデータを出力する。
出力された送信データは現用リング41を一定方向に伝
わり、各PCIは自リングアドレスと送信先アドレスが一
致するかチェックし、自PCI宛のデータを取り込み自PCI
の接続するプロセッサ25に受信を通知する。
データを受信したプロセッサ25は逆に受信応答通知デ
ータをプロセッサ23に対して送信する。受信通知データ
は現用リング41上を前記送信データと同一方向に伝わ
り、PCI31にて受信される。
次に送受信異常時の処理について説明する。データの
送受信処理が失敗となる異常としては、リング21の障害
は各PCIのループバック機能によって救済可能であるの
で、送信PCIの異常(自系PCI障害)と受信PCI障害を含
む受信プロセッサ異常(他系障害)に大別できる。
自系PCI障害はPCI管理部307の制御により現用PCI31か
ら予備PCI39に切り換えることによりデータ送信を継続
できる。
他系PCI障害時は予備PCIに切り換えても効果がなく、
他系の回復を待つ必要がある。しかし、自系PCI障害で
も第4図に示すように、PCI31のリング21との接続部
(同図中、×で示す)に故障があると、他系障害との切
り分けが難しく、いずれも受信応答データが一定時間内
に送信側に戻らない異常として検出される。自系PCIを
他系障害と誤認した場合、本来は予備PCI39へ切り換え
た場合に送信は継続可能となるにもかかわらず、永久に
復旧契機を得ることができない。
次に上記の状況を回避するための方法を説明する。第
5図は本発明の一実施例の処理のフローチャートを示
す。
同図では第4図に示したようにPCI31のリング接続部
に故障がある場合を仮定して説明する。リング21上のデ
ータのキャリー信号はPCI31で断となるため、PCI31の両
端のPCI33とPCI39でループバックが行われ、PCI33,PCI3
5,PCI37,PCI39の閉ループが再構成される。従ってこの
時、PCI31のみがリング21外にに切り離された状態にな
っている。
いま、第3図に示すプロセッサ23上の通信対象プログ
ラム301より、プロセッサ25に送信要求が生じたとする
(ステップ50)。
通信対象プログラム301は、リング送受信制御部302に
送信データとプロセッサ25の通信対象プログラム301と
の通信先パスアドレスを指定して送信を依頼する(ステ
ップ51)。
リング送受信制御部302はプロセッサ23のデータを受
信するプロセッサ25との通信先パスアドレスよりプロセ
ッサ25のPCI33のリングアドレスを判断する(ステップ5
2)。
リング送受信制御部302は通信先パスアドレスとPCIの
リングアドレスとのマッピング情報を管理しており、PC
I33のリングアドレスを送信先アドレスとして送信制御
部303に送信指示すると共に、受信制御部304にPCI33か
らの受信応答監視を指示する(ステップ53)。
送信制御部303はプロセッサ23の現用PCIを管理してお
り、送信データに送信先アドレス(DA)として指定され
たPCI33のリングアドレスを付与し、現用PCI31に受信応
答の送信データを出力する。PCI31は送信元アドレス(S
A)として、PCI31のリングアドレスを送信データに追加
し、リング21上にデータを出力する(ステップ54)。
今、PCI31はリング接続部の故障により、リング21か
ら切り離されているため、ステップ54で出力されたデー
タはPCI33に伝わることはない。そのため、受信制御部3
04は、一定時間内に応答データを受信できないために応
答待ちタイムアウトとなる(ステップ55)。
従来の方式ではこの時点で他系無応答とし、リング送
受信制御部302に通知していたが本発明では受信制御304
から異常処理手段として設けた再送信制御部305に通知
する。
以下に自PCI障害と他系障害とを正確に切り分ける処
理であるリング折り返し再送信試験とその試験結果に対
応する復旧の方法について説明する。
再送信制御部305は受信制御部304から受け取ったデー
タより送信先アドレスを自PCI31のアドレスに変更し、
再度同一データの送信を送信制御部303に再指示する
(ステップ56)。
ステップ56の処理と共に受信制御部304に自PCIからの
受信応答監視を指示する。PCI31は1回目の送信と同様
に自PCI31にデータを送信する。リング21が正常で他系
に異常がある場合は、リング21を一周後、正常にデータ
を受信するが、第4図の場合、リング21が異常のため、
自PCI31宛のデータ送信も応答待ちタイムアウトとな
る。
受信制御部304は1回目の送信時と同様に再送信制御
部305に受信応答監視結果として他系無応答を通知する
(ステップ57)。
再送信制御部306は2回目の結果を障害識別制御部306
に通知する。障害識別制御部306は2回目の結果が正常
時は他系障害とし(ステップ58)、2回目の異常の場合
は自系障害(ステップ59)として、原因コードを作成
し、PCI管理部307に自系PCI障害を通知する。PCI管理部
307は予備PCIの有無をチェックして、予備PCIが存在す
る場合、現用PCIの切り換えを指示する。新たに現用PCI
とすべきPCI39のデバイスアドレスを送信制御部303と受
信制御部304に通知する(ステップ60)。
また、障害識別制御部306は原因コードを自系障害と
してリング送受信制御部302に通知する(ステップ6
1)。
リング送受信制御部302は送信要求プログラムに送信
異常を返却指示し、その原因コードを通知する(ステッ
プ62)。
また、自PCIのプロセッサ接続部等の故障でPCI31への
出力時に自系PCI障害と判断した場合は、PCI管理部307
へ自系PCI障害として通知される。一方、2回目のリン
グ折り返し再送が成功した場合は他系障害をPCI管理部3
07に通知し、リング送受信制御部302にてPCI33に対応す
る通信パスを障害中とし、以後の送信要求を他系障害中
として受け付けず、不要な送信処理を抑止する(ステッ
プ63)。
また、障害中に、通信パスに対応する他系PCIよりデ
ータを受信した場合は他系障害が復旧したものとし、対
応する通信パスを使用中のプログラムに対して障害パス
の復旧を通知する。
このようにデータ送信時から一定時間内に応答が戻ら
ない場合は送信先を送信元のPCIに変更して、リング折
り返し再送信を行うことにより他系障害か自系PCIがリ
ング21から切り離されているリング通信路障害(自系障
害)かを正確に識別し、自系障害の場合は別に設けてあ
る予備PCIに切り換える。他系障害の場合は他系の回復
を自動監視することによって障害箇所に応じた処理を行
う。
〔発明の効果〕
以上のように本発明によれば、データ送信後一定時間
に送信元に送信先からの受信応答が戻らない場合に、異
常原因がリング通信路を含む、自系側の通信アダプタ
(PCI)にあるのか、送信先のプロセッサ側にあるのか
を正確に判断できるため、障害の原因別に最適な障害処
理を行うことにより、通信処理の高信頼化において有用
である。
【図面の簡単な説明】
第1図は本発明の原理説明図、 第2図は本発明の一実施例のシステム構成図、 第3図は本発明の一実施例のプロセッサ内の機能のブロ
ック図、 第4図は送信元通信アダプタ障害によるリング断の例を
示す図、 第5図は本発明の一実施例のフローチャートである。 1……応答監視手段、3……再送信手段、5……送信異
常通知手段、7……再送試験手段、9……障害識別手
段、11……障害復旧手段、21……リング、23,25,27,29
……プロセッサ、31,33,35,37,39……通信アダプタ(PC
I)、41……現用リング、43……予備リング、301……通
信対象プログラム、302……リング送受信制御部、303…
…送信制御部、304……受信制御部、305……再送信制御
部、306……障害識別制御部、307……PCI管理部。
フロントページの続き (72)発明者 相沢 勉 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 昭58−124350(JP,A) 特開 昭62−25534(JP,A) 特開 平2−76337(JP,A) (58)調査した分野(Int.Cl.7,DB名) H04L 12/437

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】リング形状の閉じられた通信路に複数のプ
    ロセッサを接続して相互にデータの送受信を行い、かつ
    リング通信路障害時はプロセッサをリング伝送路に接続
    する通信アダプタ部において障害部位をループバック
    し、正常な閉リング通信路を再編成して通信の継続を図
    るプロセッサ間通信方式において、 データ送信後送信先のプロセッサからの応答を監視する
    応答監視手段と、 該応答監視手段により一定時間内に応答が戻らないと判
    定された場合にデータ送信先アドレスを送信対象プロセ
    ッサのPCIアドレスから自プロセッサのPCIアドレスに変
    更して、自プロセッサ宛にデータの再送信を行う再送信
    手段と、 該再送信手段により自プロセッサ宛データを正常に受信
    した場合は障害原因を他系障害とし、自プロセッサ宛の
    送信も失敗した場合は障害原因を自系障害として送信し
    たプロセッサ内の送信要求元プログラムに送信失敗を通
    知する送信異常通知手段と、 データ送信失敗時に自プロセッサ宛のリング折り返し再
    送試験を行う再送試験手段と、 該再送試験手段で得られた結果に基づいて障害原因を識
    別する障害識別手段と、 該障害識別手段で自系障害と識別された場合は送信側通
    信アダプタ部を障害として切離し、予備の通信アダプタ
    部を用いて送信を継続し、他系障害と識別された場合は
    他系障害通信アダプタ部からの再開通知を受信するまで
    新たな送信要求に対して他系障害中を通知する障害対策
    手段と、 を有することを特徴とするリング通信路障害処理方式。
JP02324106A 1990-11-27 1990-11-27 リング通信路障害処理方式 Expired - Fee Related JP3084383B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02324106A JP3084383B2 (ja) 1990-11-27 1990-11-27 リング通信路障害処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02324106A JP3084383B2 (ja) 1990-11-27 1990-11-27 リング通信路障害処理方式

Publications (2)

Publication Number Publication Date
JPH04192836A JPH04192836A (ja) 1992-07-13
JP3084383B2 true JP3084383B2 (ja) 2000-09-04

Family

ID=18162230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02324106A Expired - Fee Related JP3084383B2 (ja) 1990-11-27 1990-11-27 リング通信路障害処理方式

Country Status (1)

Country Link
JP (1) JP3084383B2 (ja)

Also Published As

Publication number Publication date
JPH04192836A (ja) 1992-07-13

Similar Documents

Publication Publication Date Title
EP0416943B1 (en) Method for controlling failover between redundant network interface modules
US20040001449A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
JP3084383B2 (ja) リング通信路障害処理方式
JP2504366B2 (ja) 耐故障性システム
JPH01217666A (ja) マルチプロセッサシステムの障害検出方式
KR960003784B1 (ko) 프로세서간 단위 통신망간의 상호 연결장치 및 그 운용방법
JP3149047B2 (ja) 二重化データ処理装置
JPH05304528A (ja) 多重化通信ノード
JP2000349900A (ja) 交換装置の障害処理方式
JPS62190536A (ja) 冗長構成制御方式
JPS63279646A (ja) 網管理装置の自動再開処理方式
JPH09160875A (ja) マルチエージェント相互バックアップ方式
JPS62159241A (ja) デ−タ処理装置バツクアツプ方法
KR930007469B1 (ko) 프로세서 정합 운용시 장애진단 및 복구방법
JPH08227407A (ja) マルチコンピュータシステムにおけるデータ共有装置
JPS6314542B2 (ja)
JPH02310755A (ja) ヘルスチェック方式
JPS63228849A (ja) 分散型伝送装置
JPH06188917A (ja) 故障情報収集方式
JPH02163854A (ja) メツセージ転送チエツク方式
JPH07295945A (ja) 情報処理装置及び通信処理方法
JPS62220031A (ja) 系間通信システム
JPH02285752A (ja) Hdlc手順を用いた通信制御装置
JPH06338896A (ja) ループ伝送システムの障害処理方法
JPH04150238A (ja) データ伝送装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080707

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080707

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090707

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees