DE68918837T2 - Verfahren zur unterbrechungsfreien Rückgewinnungsversorgung in einem Übertragungssystem. - Google Patents

Verfahren zur unterbrechungsfreien Rückgewinnungsversorgung in einem Übertragungssystem.

Info

Publication number
DE68918837T2
DE68918837T2 DE68918837T DE68918837T DE68918837T2 DE 68918837 T2 DE68918837 T2 DE 68918837T2 DE 68918837 T DE68918837 T DE 68918837T DE 68918837 T DE68918837 T DE 68918837T DE 68918837 T2 DE68918837 T2 DE 68918837T2
Authority
DE
Germany
Prior art keywords
host
connection
time period
block
sessions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68918837T
Other languages
English (en)
Other versions
DE68918837D1 (de
Inventor
James Lynn Ashton
Robert Thomas Gibbs
Michael Francis Gierlach
James P Gray
Jeffrey Gale Knauth
Guy Platel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE68918837D1 publication Critical patent/DE68918837D1/de
Publication of DE68918837T2 publication Critical patent/DE68918837T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2035Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant without idle spare hardware
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/40Network security protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/26Special purpose or proprietary protocols or architectures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/30Definitions, standards or architectural aspects of layered protocol stacks
    • H04L69/32Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
    • H04L69/322Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions
    • H04L69/327Intralayer communication protocols among peer entities or protocol data unit [PDU] definitions in the session layer [OSI layer 5]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer And Data Communications (AREA)
  • Hardware Redundancy (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)
  • Multi Processors (AREA)
  • Communication Control (AREA)

Description

  • Diese Erfindung bezieht sich auf Datenübertragung und insbesondere auf ein Verfahren, das eine unterbrechungsfreie Wiederherstellung ermöglicht, wenn ein zentraler Rechner (Host) vollständig oder teilweise ausfällt, während Anwendungen mit einem oder mehreren fernen Knoten in Betrieb sind und die gerade von dem aus fallenden Host ausgeführte Funktion auf einem anderen Host wiederhergestellt wird.
  • In gegenwärtig verfügbaren Systemen werden Sitzungen zwischen einer Anwendung, die auf einem Host ausgeführt wird, und einem oder mehreren fernen Knoten (die auch Anwendungen auf einem anderen Host sein können) allgemein unterbrochen, wenn irgendein Element in der Verbindung ausfällt, wie z.B. eine Anwendung, ein Host, auf dem die Anwendung ausgeführt wird, oder dazwischenliegende Übertragungswege. Als ein Ergebnis des Ausfalls werden die Sitzungen unterbrochen und müssen wiederhergestellt werden. Der ferne Knoten erkennt im allgemeinen den Fehler und wird oftmals in den Wiederherstellungsprozeß einbezogen.
  • In WO-A-8 401 868 wird ein System zur Paketvermittlung offenbart, das duplizierte Netzbereiche und Einrichtungen zur Steuerung enthält. Dieses Dokument verwendet ein Übertragungsverfahren und ein Paketvermittlungssystem, in dem Pakete, die logische Adressen und Sprach/Daten-Informationen enthalten, durch das System mittels Paketvermittlungsnetzen übertragen werden, die durch Digitalverbindungsleitungen (Kanäle) hoher Geschwindigkeit miteinander verbunden sind, wobei von letzteren jeder direkt an beiden Enden durch Kanal-Steuereinheiten abgeschlossen ist. Jedes Netz enthält duplizierte Bereiche, wobei jeder Bereich Schaltknotenstufen aufweist, die auf die physische Adresse ansprechen, die durch eine Steuereinheit einem Paket zugeordnet wird, um dieses Paket zu einem gekennzeichneten nachfolgenden Knoten zu übertragen. Jede Kanal-Steuereinheit überträgt abwechselnd Pakete zu den duplizierten Netzbereichen, die verfügbar sind, so wie die Pakete von dem zugeordneten Kanal empfangen werden. Falls ein Bereich innerhalb eines Zeitintervalls, das zur Initialisierungszeit durch den zugeordneten Prozessor festgelegt wurde, nicht zur Verfügung steht, stellt eine betroffene Kanal-Steuereinheit diese Tatsache fest und überträgt sie mittels einer Wartungsnachricht an den zugeordneten Prozessor. Jede Kanal-Steuereinheit stellt variable Paketpuffer- und Signal-Protokolle für jeden der Bereiche bereit, um die Übertragung von Paketen von den Bereichen zu dem zugeordneten Kanal zu erleichtern.
  • Die vorliegende Erfindung offenbart ein Verfahren zur unterbrechungsfreien Wiederherstellung von Übertragungssitzungen in einem Computer-Übertragungssystem einschließlich einer Vielzahl von Host-Systemen, die durch ein Host-Übertragungssystem miteinander verbunden sind, um Informationen über den Status der Verbindungen auszutauschen, die an den jeweiligen Host-Systemen aufrechterhalten werden und jede selektiv an eine Vielzahl von Datenfernverarbeitungs-Steuereinheiten (DFV-Steuereinheiten) durch ein Vermittlungsnetz angeschlossen ist, gesteuert durch Schaltsignale, die von den individuellen Host-Systemen geliefert werden, sowie ein Verfahren zur Ermöglichung einer unterbrechungsfreien Wiederherstellung von Übertragungssitzungen, die zwischen den jeweiligen Host-Systemen und fernen Einrichtungen erstellt werden, die mit den jeweiligen DFV-Steuereinheiten verbunden sind, gekennzeichnet die durch die folgenden Schritte:
  • Erstellen einer ersten und einer zweiten Zeitperiode an jeder Steuereinheit für jede aktive Verbindung zwischen einem Host-System und einer fernen Einheit, über die eine oder mehrere Übertragungssitzungen geleitet werden,
  • Einschalten der ersten Zeitperiode, wenn Service über die Verbindung erforderlich ist, Überwachen der Verbindung hinsichtlich eines gültigen Status und Zurücksetzen der ersten Zeitperiode, falls die Verbindung vor dem Verfall der ersten Zeitperiode einen gültigen Status annimmt,
  • Starten der zweiten Zeitperiode nach dem Verfall von mindestens einem Zyklus der ersten Zeitperiode und danach Deaktivieren der ausgesetzten Sitzungen, die der Verbindung nach dem Verfall der zweiten Zeitperiode zugeordnet sind,
  • an jedem Host-System Überwachen des Status vorher ausgewählter Verbindungen an vorher ausgewählten Host-Systemen und nach Feststellung von mindestens einem vorher bestimmten Status Erstellen einer alternativen Verbindung über das Vermittlungsnetz zu der zugeordneten DFV-Steuereinheit,
  • Erzeugen und Senden eines eindeutigen Befehls über die alternative Verbindung an die angeschlossene DFV-Steuereinheit, die das Erstellen der alternativen Verbindung anzeigt, und
  • Empfangen des eindeutigen Befehls an einer DFV-Steuereinheit, erneutes Zuweisen der der vorherigen Verbindung zugewiesenen Sitzung über die erstellte alternative Verbindung und Zurücksetzen der ersten und zweiten Zeitperiode, vorausgesetzt, der eindeutige Befehl wird vor dem Verfall der zweiten Zeitperiode empfangen.
  • Einzelheiten einer bevorzugten Ausführungsform der Erfindung sind anhand der folgenden Beschreibung besser zu verstehen, wobei:
  • Figur 1 ein Blockdiagramm einer Vielzahl von Host-Prozessoren in einem Komplex ist, die durch eine Steuerung miteinander verbunden sind. Diese Host-Prozessoren sind durch ein Vermittlungsnetz ineinandergreifend mit einer oder mehreren Vermittlungseinheiten und am Ende mit einem oder mehreren Anzeigegeräten oder anderen fernen Knoten verbunden.
  • Figur 2 ein Flußdiagramm ist, in dem eine Steuereinheit einen Ausfall eines Hosts feststellt und auf einen anderen Host wartet, die Wiederherstellung zu beginnen.
  • Figur 3 ein Flußdiagramm ist, das die Feststellung eines Ausfalls für einen Host und das Vermitteln der Sitzungen, deren Anwendungen sich in dem ausgefallenen Host befinden, zu einem wiederherstellenden Host zeigt. Der wiederherstellende Host kann wählen, einige der Parameter, die für die vorherige Verbindung zwischen dem ausgefallenen Host und den Steuereinheiten verwendet wurden, zu vereinbaren.
  • Figur 1 ist ein Blockdiagramm eines typischen Datenübertragungsnetzes, das die hier offenbarte Erfindung einsetzen kann. Das Netz kann in Übereinstimmung mit der IBM Systemnetzwerkarchitektur (SNA, Systems Network Architecture) und insbesondere mit IBM Low Entry Networking aufgebaut und konfiguriert sein. Aus ökonomischen Erwägungen werden sich die folgenden Beschreibungen auf bestimmte Strukturen (sowohl physische als auch logische), Funktionen und Befehle beziehen, die mit dieser Architektur in Verbindung stehen.
  • In Figur 1 sind eine Vielzahl von Host-Prozessoren 101, 102, ..., 10N durch ein herkömmliches Vermittlungsnetz 100 miteinander verbunden, das eine Programmierte Steuereinheit 131 umfaßt. Jeder Host ist durch eine Verbindung 141, 142, ..., 14N physisch an das Netz 100 angeschlossen. Jede derartige Verbindung hat eine eindeutige Identität und jeder Host muß einer Steuereinheit 130 für jede Verbindung, die der Host aufrechterhält, periodisch den Status (gültig/ungültig) anzeigen. Die Funktion der Steuereinheit 130 wird später beschrieben. Der spezielle Verbindungstyp, der zwischen den Host-Prozessoren 101-10N und dem Vermittlungsnetz 100 verwendet wird, ist für diese Erfindung nicht von Bedeutung und kann aus einer Vielzahl verfügbarer Typen ausgewählt werden.
  • Eine Vielzahl von Steuereinheiten 120, 121, . .., 12M werden durch das Vermittlungsnetz 100 mit den Host-Prozessoren 101-10N verbunden. Jede Steuereinheit 120-12M hat einen oder mehrere ferne Knoten T, die ihr zugeordnet sind. Die fernen Knoten T können Einheiten wie z.B. Terminals, Personalcomputer, Clustersteuereinheiten, DFV-Steuereinheiten oder Host-Prozessoren sein. Die Zusammenstellung und die Eigenschaften derartiger ferner Knoten sind für diese Erfindung nicht von Bedeutung und werden von einer Installation zur anderen voneinander abweichen. Das Vermittlungsnetz 100 beinhaltet eine Steuereinheit 131 und einen Matrix-Schalter, die in der Technik allgemein bekannt sind, und die Arbeitsweise des Vermittlungsnetzes 100 wird durch den ausgewählten Schaltertyp festgelegt.
  • Die Host-Prozessoren 101-10N können entweder Knoten des Typs T5 oder T2.1 sein, wie in der SNA-Architektur definiert, und jeder umfaßt ein oder mehrere Endbenutzer-Anwendungsprogramme (LUs) und ein Steuerprogramm. Jeder Knoten, der alles von einem kleinen Personalcomputer bis zu einem Großrechner sein kann, beinhaltet typischerweise auch einen Kontrollpunkt für Systemservice (SSCP, system services control point) oder einen Kontrollpunkt (CP, control point) anderen Typs und kann auch eine physische Einheit (PU, physical unit) beinhalten. Jeder Host kann eine Anzahl von Funktionen für Terminals oder andere ferne Knoten ausführen, die mit dem Netz 100 direkt oder durch Steuereinheiten 120-12M verbunden sind.
  • Die Host-Prozessoren 101-10N sind ebenfalls mit einer allgemeinen Steuerfunktion 130 verbunden, die zur Überwachung der Aktivität der Host-Prozessoren und zur Benachrichtigung der anderen Host-Prozessoren verwendet wird, wenn einer von ihnen ausfällt. Diese "Zentral"-Steuerfunktion 130 kann physisch in einem oder mehreren der Host-Prozessoren 101-10N oder in einer getrennten Einheit enthalten sein. Beispiele dafür, wie die Steuerfunktion implementiert sein könnte, sind:
  • 1. Kanalverbindung (CTC, channel-to-channel) von jedem Host zu allen anderen Host-Prozessoren, die zum Ausführen der Zentral-Steuerfunktion 130 in der Lage sind
  • 2. geteilter Direktzugriffsspeicher (DASD, direct access storage device), auf den von jedem Host direkt zuzugreifen ist und der von der Zentral-Steuerfunktion 130 überwacht wird, die einem von ihnen übertragen wurde
  • 3. Sitzungen von jedem Host zu allen anderen Host-Prozessoren, entweder durch das Netz 100 oder über einen separaten Pfad 130
  • 4. Speicher, der von allen Host-Prozessoren gemeinsam benutzt wird und ähnlich dem DASD verwendet wird, wo eine Zentral- Steuerfunktion die Aktivität jedes Hosts überwacht
  • 5. ein separater Rahmen, der an alle Host-Prozessoren angeschlossen ist und ein Signal an jeden Prozessor sendet, der wiederum ein Signal zurück zu der Steuerfunktion sendet, um anzuzeigen, daß er nicht ausgefallen ist.
  • Die obigen Beispiele 1-5 sollen eine Anzahl allgemein bekannter Techniken darstellen, wie diese Funktion implementiert werden könnte, und sollen keine vollständige Liste sein.
  • Jede Steuereinheit 120-12M kann typischerweise eine DFV-Steuereinheit sein, wie z.B. IBM 3745, eine Steuereinheit wie z.B. IBM 3174, oder andere ähnliche Einheiten sein. Die Steuereinheiten können Knoten der Typen T5, T4, T2.0 oder T2.1 sein, wie in der SNA definiert. Jeder derartigen Steuereinheit können ein oder mehrere ferne Knoten T angeschlossen sein, oder sie können selbst ferne Knoten mit an ihnen angeschlossenen Terminals sein.
  • Ein Beispiel eines Vermittlungssystems 100 ist das IBM 3814 Schaltverwaltungssystem, das den Mehrsystem-Konfigurationsmanager (MSCM, Multi-System Configuration Manager) verwendet, ein lizenziertes Programm, das sich in einem Host befindet.
  • Die gesamte in Figur 1 dargestellte Ausrüstung ist gegenwärtig verfügbar und erfordert zusätzlich zu bestehenden Programmen eine zusätzliche Programmierung, die in den Flußdiagrammen dargestellt ist, die in den Figuren 2 und 3 gezeigt werden. Diese Flußdiagramme beinhalten zusammen mit der Beschreibung die Informationen, die es einem kundigen Programmierer gestatten würden, Programme zu schreiben, die für den Gebrauch in einer den verschiedenen Architekturen gemäß gestalteten Einrichtung passend sind.
  • Figur 2 zeigt den logischen Ablauf, in dem eine Steuereinheit 120-12M (Figur 1) versucht, mit einem Host 101-10N (Figur 1) aus einem von mehreren Gründen zu kommunizieren, und annimmt, daß Sitzungen zwischen allen Teilen gemäß den IBM SNA-Verfahren aufgebaut wurden. Die folgenden vier Beispiele sollen nicht umfassend sein und nur illustrieren.
  • 1. Die Steuereinheit hat eine Arbeitseinheit beendet, die von dem Host angefordert wurde; oder
  • 2. sie hat eine Anforderung von einem fernen Knoten empfangen und fordert den Service des Hosts; oder
  • 3. sie ist selbst ein Host und will mit einem anderen Host in Verbindung treten; oder
  • 4. sie hat intern eine Periode einer vorher bestimmten Länge festgestellt, bekannt als "Leerlaufüberschreitung", wenn zwischen ihr und dem Host keine Aktivität aufgetreten ist.
  • Block 211 in Figur 2 zeigt den logischen Anfang der Funktion, in der eine Steuereinheit (CU 120-12M in Figur 1) ein Unterbrechungssignal oder einen Abruf an einen Host sendet und auf eine Nachricht von dem Prozessor wartet. Die CU sendet im Block 212 ein Unterbrechungssignal an einen Host und startet im Block 213 einen Zeitgeber "erster Versuch". Die CU tritt dann in eine Schleife, die aus den Blöcken 214 und 215 zusammengesetzt ist.
  • Die CU prüft im Block 214, ob eine Nachricht von dem Host vorliegt. Falls eine Nachricht vorliegt, prüft die CU im Block 224, ob sie eine Vermittlungsidentifikation (XID, eXchange IDentification) ist. Eine XID übermittelt Parameter zwischen zwei Knoten, wenn sie versuchen, eine Verbindung aufzubauen. XID3 wird mit DLCs verwendet, die SNA Typ 2.1-Knoten nutzen. Um die Systemdefinition zu minimieren, transportieren die XIDs die DLC- spezifischen Parameter für die Verbindung ebenso wie Informationen über die höheren SNA-Schichten. Diese Parameter umfassen solche Dinge wie den eindeutigen Stations(Knoten)-Bezeichner und Daten, wie z.B. Puffergröße, maximale Pufferanzahl, Zeitüberschreitungen und Verzögerungen. Als Teil dieser Erfindung wurde die Nichtaktivierungs-XID erweitert, so daß Knoten das Andern der Parameter, nachdem die Verbindung aufgebaut wurde, optional vereinbaren können, ohne die Verbindung zu unterbrechen. Die erweiterte Nichtaktivierungs-XID ist einmalig und zur Zeit in der SNA nicht zu finden. Vor dieser Erfindung wurden diese Parameter vereinbart, wenn die Verbindung erstmalig aufgebaut wurde, und konnten nicht verändert werden, ohne die Verbindung zu unterbrechen und dann neu aufzubauen.
  • Falls die Nachricht keine XID ist, dann verarbeitet die CU im Block 224 die Nachricht als normale Daten von dem Host und setzt im Block 225 den Zeitgeber für den ersten oder zweiten Versuch zurück. Die Funktion verläßt dann im Block 226 das System und erwartet weitere Arbeit. Dies ist der normale Pfad, der von der Steuereinheit bei der Verarbeitung einer Nachricht genommen wird.
  • Falls keine Nachricht von dem Host vorliegt, prüft die Steuereinheit im Block 214, ob im Block 215 der Zeitgeber für den ersten Versuch abgelaufen ist. Falls der Zeitgeber nicht abgelaufen ist, springt die Funktion zum Block 214 zurück und prüft wieder, ob eine Nachricht vorliegt.
  • Falls der Zeitgeber im Block 215 verfällt, sendet die Steuereinheit im Block 216 ein anderes Unterbrechungssignal an den Host, falls dem Host des Vermittlungsnetzes das erste Unterbrechungssignal verlorengegangen ist, das im Block 212 gesetzt wurde. Die tatsächlich verwendete Zahl kann variieren; jedoch würden die zwei in Figur 2 dargestellten Signale in den meisten Fällen ausreichen. Falls mehr als zwei erforderlich sind, kann die dargestellte Folge erweitert werden. Die CU startet dann im Block 217 den Zeitgeber "zweiter Versuch" und beginnt eine Schleife zwischen den Blöcken 218 und 219.
  • Im Block 218 prüft die CU, ob eine Nachricht von dem Host vorliegt. Falls sie eine findet, geht die CU zu Block 224 und prüft wie oben besprochen, ob eine XID vorliegt. Im Block 218 prüft die CU, falls keine Nachricht vorliegt, ob im Block 219 der Zeitgeber für den zweiten Versuch abgelaufen ist. Falls der Zeitgeber nicht abgelaufen ist, springt sie zurück zu Block 218, um wieder zu prüfen, ob eine Nachricht von dem Host vorliegt.
  • Falls im Block 219 der Zeitgeber für den zweiten Versuch verfällt, wird im Block 229 die Verbindung (141, 142, ... oder 14N) zu diesem Host (101, 102, ... oder 10N) als "nicht länger gültig" gekennzeichnet. Alle Sitzungen von diesem Host werden im Block 239 beendet, und die CU-Funktion wird im Block 249 beendet. Der Host muß neu aktiviert werden, ehe er Anwendungen ausführen und wieder Sitzungen mit fernen Knoten aufbauen kann.
  • Zu beachten ist, daß eine Beschränkung auf nur zwei Unterbrechungsversuche von der CU nicht in allen Fällen als obere Grenze zu betrachten ist. In einigen Umgebungen können mehr Versuche notwendig sein. Diese Erfindung gestattet CUs, bei Fehlern eine Wiederherstellung auf einem Niveau zu versuchen, das vorher nicht existierte, und die Zahl zusätzlicher Versuche kann gewählt werden, um in die besondere Umgebung zu passen, in der das System gerade arbeitet.
  • Falls die Nachricht im Block 224 eine XID von dem Host ist, dann wird sie im Block 234 geprüft, um zu bestimmen, ob sie eine "Nichtaktivierungs-XID" ist. Falls nicht, wird die XID-Nachricht dann als ein Versuch eines Hosts verarbeitet, eine neue Verbindung aufzubauen. Die bestehende Verbindung wird im Block 235 als "ausgefallen" gekennzeichnet und alle Sitzungen, die sie verwenden, werden im Block 236 beendet. Die XID-Nachricht wird dann im Block 237 als ein Versuch verarbeitet, eine neue Verbindung aufzubauen, und die Funktion endet im Block 248.
  • Falls die im Block 234 verarbeitete Nachricht eine Nichtaktivierungs-XID ist, dann wird im Block 244 geprüft, ob es eine "erweiterte Nichtaktivierungs-XID" ist. Falls nicht, vergleicht Block 245 den Host-Bezeichner und den Parametergruppen-Behälter in dieser XID mit dem Host-Bezeichner und der Parametergruppe, die vereinbart wurde, als die Verbindung ursprünglich aufgebaut wurde. Falls sie identisch sind, stellt die CU den Zeitgeber zurück, verläßt im Block 247 die Verbindung aktiv und es werden keine Sitzungen unterbrochen. Die Verarbeitung wird im Block 248 beendet.
  • Falls der Host-Bezeichner oder die Parameter in der XID im Block 245 verschieden sind, dann wird im Block 229 die Verbindung vorgemerkt, alle Sitzungen von diesem Host werden im Block 239 beendet und die CU-Funktion wird im Block 249 beendet. Wie oben besprochen, muß der Host neu aktiviert werden, ehe er Anwendungen ausführen und wieder Sitzungen mit fernen Knoten aufbauen kann.
  • Falls die XID im Block 244 die erweiterte Nichtaktivierungs-XID ist, akzeptiert die Steuereinheit die Identität des neuen Sitzungseigners im Block 254. Der Eigner könnte derselbe Host oder ein neuer Host sein. Die Steuereinheit beendet zu dieser Zeit keine Sitzungen.
  • Im Block 246 prüft die Steuereinheit, ob die der erweiterten Nichtaktivierungs-XID zugeordneten Parameter mit denen identisch sind, die vereinbart wurden, als die Verbindung erstmalig aufgebaut wurde. Falls die Parameter identisch sind, kennzeichnet die CU im Block 247 die Verbindung als "aktiv" und beendet im Block 248 die Verarbeitung.
  • Falls die Parameter im Block 246 verschieden sind, dann kann die Steuereinheit sie annehmen oder zusätzliche Veränderungen im Block 256 verhandeln. Falls die Steuereinheit und der Host sich im Block 257 auf einen neuen Parametersatz einigen können, wird die Verbindung im Block 247 als aktiv gekennzeichnet und die Verarbeitung im Block 248 beendet. Falls im Block 257 kein neuer Parametersatz vereinbart werden kann, wird die Verbindung im Block 229 als ausgefallen gekennzeichnet, alle Sitzungen, die sie benutzen, werden im Block 239 abgebrochen und der Prozeß endet im Block 249.
  • Figur 3 zeigt die Feststellung eines ausgefallenen Hosts (101- 10N in Figur 1) durch die Steuerfunktion 130 und die nachfolgende Bewegung der Sitzungen zu Anwendungen auf ihm über einen Wiederherstellungs-Prozessor.
  • Block 311 zeigt den logischen Start der Funktion. Im Block 312 werden Verbindungen zwischen den Host-Prozessoren und dem Vermittlungsnetz aufgebaut. Im Block 312 werden auch Verbindungen zwischen jedem Host und der Steuerfunktion (130 in Figur 1) aufgebaut. Im Block 313 wird eine "Zentral"-Zeitgeberdauer bestimmt und verwendet, um die nachfolgende Gültigkeit aller mit ihm verbundenen Host-Prozessoren festzustellen. An dem oben bestimmten Intervall prüft die Steuerung 130 (in Figur 1), ob noch alle ihre Host-Prozessoren aktiv sind. Falls alle aktiv sind, wie im Block 314 bestimmt, wartet die Steuerfunktion 130 darauf, daß das nächste Zeitintervall verfällt, und sie prüft wieder den Status aller Host-Prozessoren, für die sie verantwortlich ist.
  • Falls die Steuerung 130 bestimmt, daß ein Host einen Verbindungsausfall festgestellt hat oder daß ein Host im Block 314 ausgefallen ist, leitet die Steuerung 130 im Block 324 eine Sitzungsübernahme ein. Die Steuerung 130 kann die Vermittlungsnetz- Steuereinheit 131 benachrichtigen, die Verbindungen zu den Steuereinheiten (121-12M in Figur 1) zu einem oder mehreren anderen Host-Prozessoren zu verändern, und diese Host-Prozessoren benachrichtigen, die Wiederherstellung einzuleiten, oder die Steuerung 130 kann jeden wiederherstellenden Host benachrichtigen, seine Wiederherstellungsfolge zu den betroffenen Steuereinheiten (121-12M) direkt zu beginnen, falls das Vermittlungsnetz 100 ein zum dynamischen Schalten fähiger Typ ist.
  • Im Block 325 sendet jeder wiederherstellende Host eine erweiterte Nichtaktivierungs-XID an jede Steuereinheit (121-12M), die Sitzungen mit einer Anwendung hatte, die sie jetzt ausführt, wie durch die Steuerung 130 angeordnet.
  • Nach dem Empfang der im Block 326 erzeugten erweiterten Nichtaktivierungs-XID wird jede betroffene Steuereinheit (121-12M) den in Figur 2 beschriebenen Prozeß einleiten. Nach dem Abschluß des Prozesses im Block 326 werden alle betroffenen Sitzungen zu einem oder mehreren Wiederherstellungs-Prozessoren übertragen, ohne unterbrochen zu werden, oder die Sitzungen werden beendet, weil sie nicht erfolgreich zu einem anderen Host übertragen werden können (Figur 2, Block 257). Diese Erfindung gestattet die Verarbeitung durch die CU, die so zu entwerfen ist, daß Sitzungen und Datenintegrität in einer Umgebung aufrechterhalten werden, die eine Vielzahl von Host-Prozessoren mit sehr unterschiedlichen Konfigurationen und Fähigkeiten umfaßt, und gleichzeitig der Übertragungsdurchsatz wesentlich erhöht wird, da die Zahl der Sitzungen, die neu erstellt werden müssen, bedeutend verringert wird.
  • Der Prozeß endet, wenn die Funktion zu Block 327 abzweigt.

Claims (2)

1. Verfahren zur unterbrechungsfreien Wiederherstellung von Übertragungssitzungen in einem Computer-Übertragungssystem mit einer Vielzahl von zentralen Systemen (Host-Systemen) (101, ..., 10N), die miteinander durch ein Host-Übertragungssystem (130) zum Austausch von Informationen über den Status der Verbindungen, die an den jeweiligen Host-Systemen aufrechterhalten werden, verbunden sind und jedes durch ein Vermittlungsnetz (100) selektiv mit einer Vielzahl von Datenfernverarbeitungs-Steuereinheiten (DFV-Steuereinheiten) (120-12M) verbunden ist, gesteuert durch Schaltsignale, die von den individuellen Host-Systemen geliefert werden, wobei das Verfahren zur unterbrechungsfreien Wiederherstellung von Übertragungssitzungen, die zwischen den jeweiligen Host-Systemen und fernen Einheiten (T) aufgebaut werden, die mit den jeweiligen DFV-Steuereinheiten (120, ... 12M) verbunden sind, durch die folgenden Schritte gekennzeichnet ist:
Erstellen (312) einer ersten und einer zweiten Zeitperiode an jeder Steuereinheit für jede aktive Verbindung zwischen einem Host-System und einer fernen Einheit, über die eine oder mehrere Übertragungssitzungen geleitet werden,
Einschalten (313, 213) der ersten Zeitperiode, wenn Service über die Verbindung erforderlich ist, Überwachen der Verbindung bezüglich eines gültigen Status und Zurücksetzen (225) der ersten Zeitperiode, falls die Verbindung einen gültigen Status vor dem Verfall der ersten Zeitperiode annimmt,
Starten (216, 217) der zweiten Zeitperiode nach dem Verfall von mindestens einem Zyklus der ersten Zeitperiode und danach Deaktivieren (229) der ausgesetzten Sitzungen, die der Verbindung nach dem Verfall der zweiten Zeitperiode zugeordnet sind,
an jedem Host-System Überwachen des Status vorher ausgewählter Verbindungen an vorher ausgewählten Host-Systemen und nach Feststellung von mindestens einem vorher bestimmten Status Erstellen einer alternativen Verbindung über das Vermittlungsnetz zu der zugeordneten DFV-Steuereinheit,
Erzeugen und Senden (325) eines eindeutigen Befehls über die alternative Verbindung zu der angeschlossenen DFV-Steuereinheit, welche die Erstellung der alternativen Verbindung anzeigt, und
Empfangen des eindeutigen Befehls an einer DFV-Steuereinheit, erneutes Zuweisen (326) der der vorherigen Verbindung zugewiesenen Sitzung über die erstellte alternative Verbindung und Zurücksetzen (247) der ersten und zweiten Zeitperiode, vorausgesetzt, der eindeutige Befehl wird vor dem Verfall der zweiten Zeitperiode empfangen.
2. Verfahren nach Anspruch 1, in dem die Steuereinheit den Ablauf mehr als eines Zyklus der ersten Zeitperiode gestattet, ehe die zweite Zeitperiode gestartet wird.
DE68918837T 1989-01-24 1989-12-19 Verfahren zur unterbrechungsfreien Rückgewinnungsversorgung in einem Übertragungssystem. Expired - Fee Related DE68918837T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/301,193 US4975914A (en) 1989-01-24 1989-01-24 Non-disruptive session recovery

Publications (2)

Publication Number Publication Date
DE68918837D1 DE68918837D1 (de) 1994-11-17
DE68918837T2 true DE68918837T2 (de) 1995-04-27

Family

ID=23162346

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68918837T Expired - Fee Related DE68918837T2 (de) 1989-01-24 1989-12-19 Verfahren zur unterbrechungsfreien Rückgewinnungsversorgung in einem Übertragungssystem.

Country Status (4)

Country Link
US (1) US4975914A (de)
EP (1) EP0379829B1 (de)
JP (1) JPH0616276B2 (de)
DE (1) DE68918837T2 (de)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5121486A (en) * 1987-11-20 1992-06-09 Hitachi, Ltd Network control system for dynamically switching a logical connection between an identified terminal device and an indicated processing unit
US5557798A (en) * 1989-07-27 1996-09-17 Tibco, Inc. Apparatus and method for providing decoupling of data exchange details for providing high performance communication between software processes
US5077730A (en) * 1990-08-02 1991-12-31 Arrowood Andrew H Method of auditing primary and secondary node communication sessions
EP0509068A4 (en) * 1990-11-05 1993-05-12 Motorola, Inc. Dynamic association of rf radio data communication system in a pre-existing computer controlled network
EP0520117A1 (de) * 1991-06-28 1992-12-30 International Business Machines Corporation Übertragungssteuerung für X25 und SNA-Netz
US5283888A (en) * 1991-08-27 1994-02-01 International Business Machines Corporation Voice processing interface unit employing virtual screen communications for accessing a plurality of primed applications
US5394554A (en) * 1992-03-30 1995-02-28 International Business Machines Corporation Interdicting I/O and messaging operations from sending central processing complex to other central processing complexes and to I/O device in multi-system complex
US5353259A (en) * 1992-06-19 1994-10-04 Dictaphone Corporation Voice message recovery system and method
US5329619A (en) * 1992-10-30 1994-07-12 Software Ag Cooperative processing interface and communication broker for heterogeneous computing environments
US5495582A (en) * 1992-11-18 1996-02-27 International Business Machines Corporation System and method for interprocessor routing through an established communication session in a loosely coupled computer complex
JP2576762B2 (ja) * 1993-06-30 1997-01-29 日本電気株式会社 リング網のノード間情報収集方式
US5881239A (en) * 1995-01-23 1999-03-09 Tandem Computers Incorporated Network system with resilient virtual fault tolerant sessions
JPH08297645A (ja) * 1995-04-26 1996-11-12 Nec Corp 疎結合システム
US5754752A (en) * 1996-03-28 1998-05-19 Tandem Computers Incorporated End-to-end session recovery
US5802258A (en) * 1996-05-03 1998-09-01 International Business Machines Corporation Loosely coupled system environment designed to handle a non-disruptive host connection switch after detection of an error condition or during a host outage or failure
US5835698A (en) * 1996-09-20 1998-11-10 Novell, Inc. Unilaterally-controlled, time-insensitive, data-link recovery apparatus and method
US6092111A (en) * 1996-11-19 2000-07-18 Motorola, Inc. Data communications system with session control
US6625753B1 (en) * 2000-05-09 2003-09-23 International Business Machines Corporation Recovery facility for an SNA communication network
DE10066152B4 (de) * 2000-07-20 2007-01-11 Adisoft Systems Gmbh & Co. Kg Verfahren, Vorrichtung und Computerprogramm zum Verwalten einer Datenübertragung
US8275889B2 (en) * 2002-06-10 2012-09-25 International Business Machines Corporation Clone-managed session affinity
US6938179B2 (en) * 2002-11-01 2005-08-30 Nokia Corporation Socket extensions for redundancy
US8225234B2 (en) * 2003-02-28 2012-07-17 Oracle International Corporation Method for utilizing look and feel in a graphical user interface
US7287081B1 (en) * 2003-12-17 2007-10-23 Nortel Networks Limited Controlled calls in a transmission network
US20050273520A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Service oriented architecture with file transport protocol
US20060031355A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Programmable service oriented architecture
US20050273521A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Dynamically configurable service oriented architecture
US7310684B2 (en) * 2004-05-21 2007-12-18 Bea Systems, Inc. Message processing in a service oriented architecture
US20050273497A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Service oriented architecture with electronic mail transport protocol
US20050273502A1 (en) * 2004-05-21 2005-12-08 Patrick Paul B Service oriented architecture with message processing stages
US20060007918A1 (en) * 2004-05-21 2006-01-12 Bea Systems, Inc. Scaleable service oriented architecture
US20050273847A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Programmable message processing stage for a service oriented architecture
US20050270970A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Failsafe service oriented architecture
US20060031354A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Service oriented architecture
US20060031433A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Batch updating for a service oriented architecture
US20060031431A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Reliable updating for a service oriented architecture
US7774485B2 (en) * 2004-05-21 2010-08-10 Bea Systems, Inc. Dynamic service composition and orchestration
US20050264581A1 (en) * 2004-05-21 2005-12-01 Bea Systems, Inc. Dynamic program modification
US20050273517A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Service oriented architecture with credential management
US20060005063A1 (en) * 2004-05-21 2006-01-05 Bea Systems, Inc. Error handling for a service oriented architecture
US20060031353A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Dynamic publishing in a service oriented architecture
US20050278374A1 (en) * 2004-05-21 2005-12-15 Bea Systems, Inc. Dynamic program modification
US20060031481A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Service oriented architecture with monitoring
US20050273516A1 (en) * 2004-05-21 2005-12-08 Bea Systems, Inc. Dynamic routing in a service oriented architecture
US20060031930A1 (en) * 2004-05-21 2006-02-09 Bea Systems, Inc. Dynamically configurable service oriented architecture
US20050267947A1 (en) * 2004-05-21 2005-12-01 Bea Systems, Inc. Service oriented architecture with message processing pipelines
US20060031432A1 (en) * 2004-05-21 2006-02-09 Bea Systens, Inc. Service oriented architecture with message processing pipelines
US7427826B2 (en) * 2005-01-25 2008-09-23 Canon Kabushiki Kaisha Electron beam apparatus
US8996394B2 (en) 2007-05-18 2015-03-31 Oracle International Corporation System and method for enabling decision activities in a process management and design environment
US8185916B2 (en) * 2007-06-28 2012-05-22 Oracle International Corporation System and method for integrating a business process management system with an enterprise service bus
US8301687B2 (en) 2009-03-31 2012-10-30 Software Ag Systems and/or methods for standards-based messaging

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4119815A (en) * 1977-05-31 1978-10-10 American District Telegraph Company Central station system including secondary communication path established through commercial telephone network
GB2070302B (en) * 1980-02-19 1985-02-13 Omron Tateisi Electronics Co Data communication system
US4512011A (en) * 1982-11-01 1985-04-16 At&T Bell Laboratories Duplicated network arrays and control facilities for packet switching
US4763329A (en) * 1986-02-10 1988-08-09 Techlan, Inc. Modular data routing system

Also Published As

Publication number Publication date
EP0379829A3 (de) 1991-04-17
US4975914A (en) 1990-12-04
JPH02231664A (ja) 1990-09-13
JPH0616276B2 (ja) 1994-03-02
EP0379829A2 (de) 1990-08-01
EP0379829B1 (de) 1994-10-12
DE68918837D1 (de) 1994-11-17

Similar Documents

Publication Publication Date Title
DE68918837T2 (de) Verfahren zur unterbrechungsfreien Rückgewinnungsversorgung in einem Übertragungssystem.
DE60220263T2 (de) Server-duplexverfahren und geduplextes serversystem
DE3853022T2 (de) Verfahren zur Ausbreitung von Netzwerkzustandsnachrichten.
DE69123663T2 (de) Kanäle in einem Rechnerein-Ausgabesystem
DE69931473T3 (de) Eingang/ausgang- scanner für ein steuersystem mit peer- ermittlung
DE69811148T2 (de) Mitgliedschaft in einem unzuverlässigen verteilten Rechnersystem
EP1309920B1 (de) Adressvergabeverfahren für mindestens einen neu an ein bussystem angeschlossenen busteilnehmer
DE69922690T2 (de) Fehlertolerante netze
DE69932400T2 (de) Steuerungsvorrichtung für einen Portverwalter zur Verbindung von verschiedenen Funktionsmodulen
DE69821050T2 (de) Datenstromdifferenzierungssystem für Endgerätemulator
DE68915246T2 (de) Verfahren zur dynamischen und zentralen Verwaltung eines Fernverarbeitungsnetzwerkes.
DE3851111T2 (de) Netzwerksystem mit Tokenprinzip-Zugriffsverfahren.
DE60303026T2 (de) System, verfahren und produkt zur verwaltung des datenverkehrs in einem netzwerk
DE69127883T2 (de) System zur Datenintegritätsgewährleistung
DE3820544C2 (de) Ortsbereichsnetzsystem mit einem hiermit gekoppelten Mehrcomputersystem und Verfahren zur Steuerung hiervon
DE10197179T5 (de) Fern-Spiegelung in einer geschalteten Umgebung
DE68913230T2 (de) Lokale Netzwerkverbindungsvorrichtung mit einstellbarer Betriebsart.
WO2003054644A2 (de) Datenübertragungsverfahren, serielles bussystem und anschalteinheit für einen passiven busteilnehmer
DE68924535T2 (de) Anordnung zur zusammenarbeitende wiederverteilung der aufgaben in einem mehrprozessoren-system.
DE19737585B4 (de) Verfahren und Vorrichtung zur Verwirklichung einer Abschnittsumschaltungs- und Wiederherstellungsoperation in einer ISDN-PCX
DE602004010111T2 (de) Backup-zellensteuerung
DE3886964T2 (de) Parallelschalten mit kreisförmiger Priorität.
DE60309012T2 (de) Verfahren und system zur sicherstellung eines busses und eines steuerservers
DE69027342T2 (de) Bidirektionales Datenkommunikationssystem
EP0509114B1 (de) Verfahren zum Übertragen von Daten an mehrere Datenstationen

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee