DE4117693A1 - Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems - Google Patents

Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems

Info

Publication number
DE4117693A1
DE4117693A1 DE19914117693 DE4117693A DE4117693A1 DE 4117693 A1 DE4117693 A1 DE 4117693A1 DE 19914117693 DE19914117693 DE 19914117693 DE 4117693 A DE4117693 A DE 4117693A DE 4117693 A1 DE4117693 A1 DE 4117693A1
Authority
DE
Germany
Prior art keywords
communication
units
computing
unit
connections
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19914117693
Other languages
English (en)
Other versions
DE4117693C2 (de
Inventor
Des Erfinders Auf Nennung Verzicht
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Isra Parsytec GmbH
Original Assignee
Parsytec Computer GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Parsytec Computer GmbH filed Critical Parsytec Computer GmbH
Priority to DE19914117693 priority Critical patent/DE4117693A1/de
Publication of DE4117693A1 publication Critical patent/DE4117693A1/de
Application granted granted Critical
Publication of DE4117693C2 publication Critical patent/DE4117693C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2051Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant in regular structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

Die Erfindung betrifft eine für ein fehlertolerantes Rechnersystem bestimmte Funktionseinheit mit N Recheneinheiten, M Kommunikationseinheiten und einem Kommunikationsnetzwerk, eine für ein fehlertolerantes Rechnersystem bestimmte Verbindungsstruktur von Funktionseinheiten mit N Recheneinheiten, M Kommunikationseinheiten und einem Kommunikationsnetzwerk sowie ein Verfahren zum Betrieb eines fehlertoleranten Rechnersystems nach einem der vorhergehenden Ansprüche.
Aus der Forschung und der industriellen Entwicklung wird zunehmend die Forderung nach leistungsfähigeren Rechnersystemen gestellt. Dies führt zwangsläufig zu komplexeren Systemen mit sehr viel mehr Recheneinheiten und Kommunikationseinheiten sowie komplizierteren Kommunikationsnetzwerken. Aufgrund der enorm großen Zahl dieser Bausteine steigt die Wahrscheinlichkeit für den Ausfall eines einzelnen Bausteins stark an. Würde nun ein derartiger Ausfall zu einem Zusammenbruch des gesamten Systems führen, dann wären die Ausfallzeiten des Rechnersystems im Vergleich mit den Betriebszeiten sehr groß, und ein kontinuierlicher Betrieb des Rechnersystems wäre nahezu unmöglich.
Da der Ausfall einzelner Bausteine aus technischen Gründen nicht vollständig vermieden werden kann, ist es für den Betrieb derartig komplexer Rechnersysteme unumgänglich, daß diese Systeme die aufgrund von Ausfällen einzelner Bausteine entstandenen Fehler tolerieren.
Die Aufgabe der vorliegenden Erfindung liegt nun in der bau- sowie verfahrenstechnischen Realisierung dieser Fehlertoleranz.
Diese Aufgabe wird bei einem Rechnersystem der vorgenannten Art dadurch gelöst, daß K interne Verbindungen vorgesehen sind, welche jede Rechen- mit jeder Kommunikationseinheit verbinden, daß die N Recheneinheiten jeweils untereinander gleich und austauschbar sind und daß jeweils nur (N-n) mit nN/4 Recheneinheiten aktiv, also n Recheneinheiten redundant sind, und daß von den K internen Verbindungen des Kommunikationsnetzes zwischen den Rechen- und Kommunikationseinheiten jeweils nur (K-k) mit kK/4 solcher Verbindungen aktiv sind. Damit verkraftet dieses Rechnersystem den Ausfall einzelner Komponenten, z. B. einzelner Recheneinheiten und Verbindungen des internen Kommunikationsnetzes. Diese Fehlertoleranz auf der Ebene der Funktionseinheiten stellt nun sicher, daß die Ausfallwahrscheinlichkeit einer derartigen Funktionseinheit nur etwa der eines einzelnen typischen Chips entspricht, wie sich aus einer statistischen Betrachtung dieser Ausfallwahrscheinlichkeit ergibt.
Eine Recheneinheit in obigem Sinne kann Funktionseinheiten in obigem Sinne enthalten. Durch den Aufbau von Recheneinheiten aus derartigen Funktionseinheiten, also der rekursiven des zuvor Beschriebenen, kann auch die Ausfallwahrscheinlichkeit von Systemen beliebiger Größe klein gehalten werden.
Das erfindungsgemäße Rechnersystem kann ferner so ausgelegt sein, daß N=17, M=4, n=m=1 und K=68, k=4 ist und eine Recheneinheit aus einem Prozessorknoten, eine Kommunikationseinheit aus einem Kommunikationschip und eine interne Verbindung aus einem Kommunikationskanal besteht.
Das erfindungsgemäße Rechnersystem zeichnet sich weiter dadurch aus, daß L externe Verbindungen vorgesehen sind, die jede Kommunikationseinheit einer Funktionseinheit jeweils extern mit J2 Kommunikationseinheiten jeder benachbarten Funktionseinheit verbinden, daß die Kommunikationseinheiten jeder Funktionseinheit untereinander gleich und austauschbar sind und daß jeweils mindestens (M-m) mit mM/4 Kommunikationseinheiten aktiv sind und daß von den L externen Verbindungen des Kommunikationsnetzwerkes zwischen den Funktionseinheiten jeweils mindestens (L-1) mit lL/4 solcher Verbindungen aktiv sind. Das gesamte Kommunikationsnetz stellt sich hier ebenfalls als eine fehlertolerante Einheit dar, da bei Ausfällen einzelner externer Verbindungen stets noch eine ausreichende Kommunikationsbandbreite zur Verfügung steht.
Das erfindungsgemäße Rechnersystem kann ferner so aufgebaut sein, daß L=48, l=12, n=4, m=1 und J=2 ist und eine externe Verbindung einen Kommunikationskanal hat. Diese Verbindungsstruktur stellt ein als besonders vorteilhaft herausgefundenes Ausführungsbeispiel dar.
Schließlich kann das erfindungsgemäße Rechnersystem in der Weise aufgebaut sein, daß von jeder Kommunikationseinheit zu jeder benachbarten Funktionseinheit mindestens eine Verbindung des Kommunikationsnetzes existiert. Ein derartiges Kommunikationsnetz ermöglicht eine räumliche, beliebig skalierbare Gitteranordnung der Funktionseinheiten für den Aufbau eines supermassiv parallelen Rechnersystems.
Das erfindungsgemäße Verfahren zum Betrieb des betroffenen Rechnersystems und der Verbindungsstruktur sieht vor, daß der Betriebszustand der Recheneinheiten, der Kommunikationseinheiten sowie der internen und externen Verbindungen in bestimmten Zeitabständen geprüft wird, daß im Falle eines fehlerhaften Zustandes einer Recheneinheit diese durch eine zu diesem Zeitpunkt nicht aktive Recheneinheit ersetzt wird und daß im Falle eines fehlerhaften Zustandes einer Kommunikationseinheit oder einer internen oder externen Verbindung diese zukünftig umgangen wird. Der Ablauf von sogenannten Prüfprogrammen sowie eine gegebenenfalls notwendige Wiederinstandsetzung des Systems werden automatisch von dem Betriebssystem ausgeführt und beeinflussen nicht den Ablauf von Benutzerprogrammen.
Bei dem erfindungsgemäßen Verfahren kann weiter vorgesehen sein, daß der Zustand des Rechnersystems zu bestimmten Zeitpunkten eingefroren, d. h. abgespeichert wird. Diese Verfahrensweise ist letztlich die Voraussetzung für die Wiederinstandsetzung des Systems nach erfolgtem Ausfall einer Systemkomponente.
Bei dem erfindungsgemäßen Verfahren kann weiter auch vorgesehen sein, daß das Einfrieren des Betriebszustandes der Recheneinheiten, der Kommunikationseinheiten sowie der internen und externen Verbindungen unmittelbar nach einer Prüfung erfolgt, die keinen Fehler ergeben hat. Dadurch ist gewährleistet, daß es sich bei den eingefrorenen Rechnerzuständen ausschließlich um fehlerfreie Zustände handelt, die eine Wiederinstandsetzung des Systems ermöglichen.
Weiter kann das erfindungsgemäße Verfahren vorsehen, daß bei Feststellung eines fehlerhaften Betriebszustandes der zuletzt eingefrorene Zustand wiederhergestellt wird. Das Rechnersystem kann beispielsweise in seiner Gesamtheit oder nur lokal neu angefahren werden, wobei der zuletzt eingefrorene fehlerfreie Zustand der Recheneinheiten als neuer Ausgangspunkt für die weiteren Rechenoperationen herangezogen wird.
Schließlich kann das erfindungsgemäße Verfahren vorsehen, daß der Zustand des Massenspeichersystems Teil des Betriebszustandes ist. Dadurch ist Wiederinstandsetzung des Systems auch dann gewährleistet, wenn Speicherzugriffe auf externe Massenspeicher stattfinden, wobei nach einem Wiederanfahren der zuletzt eingefrorene Zustand des Massenspeichersystems als Ausgangspunkt für den weiteren Programmablauf herangezogen werden kann.
Im folgenden Teil der Beschreibung wird ein Ausführungsbeispiel der Funktionseinheit und der Verbindungsstruktur anhand von drei schematischen Zeichnungen erläutert. Im einzelnen zeigt
Fig. 1 eine schematische Darstellung der Funktionseinheit bestehend aus Rechen- und Kommunikationseinheiten sowie internen und externen Verbindungen,
Fig. 2 eine dreidimensionale Struktur eines Kommunikationsnetzwerkes, aufgebaut aus Funktionseinheiten nach Fig. 1 und
Fig. 3 auf einer Leiterbahnplatte realisierte Funktionseinheit nach Fig. 1.
Bei der in Fig. 1 dargestellten Funktionseinheit 1 sind siebzehn Recheneinheiten 2 vorgesehen, die jeweils untereinander gleich und austauschbar sind und von denen eine redundant ist. An jede Recheneinheit 2 sind vier interne Verbindungen 3 anschließbar. Dadurch ist bei der hier gezeigten Funktionseinheit 1 eine Verbindung jeder Recheneinheit 2 mit maximal vier untereinander gleichen und austauschbaren Kommunikationseinheiten 4 möglich. In diesem Ausführungsbeispiel sind nun vier solcher Einheiten vorgesehen, die im gezeigten Beispiel alle aktiv sein können. Jede der Recheneinheiten 2 ist mit jeder Kommunikationseinheit 4 verbunden, d. h., es existieren insgesamt achtundsechzig Verbindungen 3 zwischen diesen. Durch die beschriebene interne Verbindungsstruktur zwischen Rechen- und Kommunikationseinheiten ergibt sich auch hier die Fehlertoleranz.
Ferner hat die in Fig. 1 dargestellte Funktionseinheit 1 in jeder der sechs Raumrichtungen acht externe austauschbare Verbindungen 6, von denen jede einen Kommunikationskanal 7 besitzt. Die Verbindungen 6 stellen externe Verbindungen zwischen den Kommunikationseinheiten 4 einer Funktionseinheit 1 mit Kommunikationseinheiten 4 von benachbarten Funktionseinheiten 1 dar. Damit ist dieses Kommunikationsnetzwerk 8 auch fehlertolerant gegenüber Ausfällen von einzelnen externen Leitungen 6.
Jede Kommunikationseinheit einer Funktionseinheit ist mit mindestens zwei Kommunikationseinheiten jeder benachbarten Funktionseinheit über mindestens einen Kommunikationskanal verbunden. Dies stellt sicher, daß sich lokale Ausfälle einzelner Kommunikationseinheiten oder Verbindungen in ihrer Wirkung nicht global fortplanzen können.
In Fig. 2 ist nun eine aus einer Vielzahl der in Fig. 1 dargestellten Funktionseinheiten 1 aufgebaute dreidimensionale Struktur eines Kommunikationsnetzwerkes 8 dargestellt. Die Verbindungslinien zwischen den einzelnen Funktionseinheiten 1 stellen die jeweils acht externen Verbindungsleitungen 6 dar. Die Gesamtzahl der Funktionseinheiten 1 ist in dem dargestellten Ausführungsbeispiel 16×16×16=4096.
In Fig. 3 ist nun der Bauplan einer Funktionseinheit 1 dargestellt. Die einzelnen Baugruppen können dabei auf einer oder mehreren Leiterbahnplatten untergebracht sein. Für eine Recheneinheit 2 kommt eine Gruppe von Mikroprozessoren mit Speicher- und Kommunikations-Hardware, z. B. ein IMS-T 9000-Transputerchip mit integrierter Kommunikation, sowie einige zusätzliche Speicherchips in Frage. Für die Kommunikationseinheiten 4 sind IMS-C104-Kommunikationschips vorgesehen, welche Daten paketweise zwischen wahlfreien Absender- und Ziel-Recheneinheiten versenden.
Beim Betrieb eines fehlertoleranten Rechnersystems unter Verwendung der vorgenannten Funktionseinheit 1 zuzüglich dem beschriebenen Kommunikationsnetzwerk 8 wird die Funktion der Recheneinheiten 2 und der Kommunikationseinheiten 4 sowie der internen 3 und externen 6 Verbindungen zu bestimmten Zeitpunkten vom Betriebssystem des Rechners überprüft, welche vom Benutzerprogramm oder dem Betriebssystem selbst vorgegeben sind. Bei einem Prüfergebnis, das keinerlei Fehler dieser Bausteine ergibt, wird der Betriebszustand dieser Bausteine und des Massenspeichersystems eingefroren, d. h. zwischengespeichert. Bei Feststellung einer fehlerhaften Recheneinheit wird der zuletzt eingefrorene Zustand wiederhergestellt, wobei die fehlerhafte Recheneinheit 2 durch eine zu diesem Zeitpunkt nicht aktive Recheneinheit 2 ersetzt wird. Im Falle eines Fehlers einer Kommunikationseinheit 4 oder einer internen 3 oder externen 6 Verbindungsleitung sorgt das Betriebssystem dafür, daß diese zukünftig umgangen werden, das Rechnersystem also fehlertolerant weiterarbeitet.
Bezugszeichen
1 Funktionseinheit
2 Recheneinheit
3 interne Verbindung
4 Kommunikationseinheit
5 externe Verbindungen
6 Kommunikationskanal
7 Kommunikationsnetzwerk

Claims (10)

1. Für ein fehlertolerantes Rechnersystem bestimmte Funktionseinheit mit N Recheneinheiten, M Kommunikationseinheiten und einem Kommunikationsnetzwerk, dadurch gekennzeichnet,
daß K interne Verbindungen (3) vorgesehen sind, welche jede Rechen- (2) mit jeder Kommunikationseinheit (4) verbinden,
daß die N Recheneinheiten (2) jeweils untereinander gleich und austauschbar sind und daß jeweils nur (N-n) mit nN/4 Recheneinheiten (2) aktiv, also n Recheneinheiten (2) redundant sind,
und daß von den K internen Verbindungen (3) des Kommunikationsnetzes (7) zwischen den Rechen- (2) und Kommunikationseinheiten (4) jeweils nur (K-k) mit kK/4 solcher Verbindungen (3) aktiv sind.
2. Funktionseinheit nach Anspruch 1, dadurch gekennzeichnet, daß N=17, M=4, n=m=1 und K=68, k=4 ist und eine Recheneinheit (2) aus einem Prozessorknoten, eine Kommunikationseinheit (4) aus einem Kommunikationschip und eine interne Verbindung aus einem Kommunikationskanal (6) besteht.
3. Für ein fehlertolerantes Rechnersystem bestimmte Verbindungsstruktur von Funktionseinheiten mit N Recheneinheiten, M Kommunikationseinheiten und einem Kommunikationsnetzwerk, dadurch gekennzeichnet,
daß L externe Verbindungen (5) vorgesehen sind, die jede Kommunikationseinheit (4) einer Funktionseinheit (1) jeweils extern mit J2 Kommunikationseinheiten (4) jeder benachbarten Funktionseinheit (1) verbinden,
daß die Kommunikationseinheiten (4) jeder Funktionseinheit (1) untereinander gleich und austauschbar sind und daß jeweils mindestens (M-m) mit mM/4 Kommunikationseinheiten (4) aktiv sind und
daß von den L externen Verbindungen (5) des Kommunikationsnetzwerkes (7) zwischen den Funktionseinheiten (1) jeweils mindestens (L-l) mit lL/4 solcher Verbindungen (5) aktiv sind.
4. Verbindungsstruktur nach Anspruch 3, dadurch gekennzeichnet, daß L=48, l=12, n=4, m=1 und J=2 ist und eine externe Verbindung (5) einen Kommunikationskanal (6) hat.
5. Verbindungsstruktur nach Anspruch 3 oder 4, dadurch gekennzeichnet, daß von jeder Kommunikationseinheit (4) zu jeder benachbarten Funktionseinheit (1) mindestens eine Verbindung (5) des Kommunikationsnetzes (7) existiert.
6. Verfahren zum Betrieb eines fehlertoleranten Rechnersystems nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet,
daß der Betriebszustand der Recheneinheiten, der Kommunikationseinheiten sowie der internen und externen Verbindungen in bestimmten Zeitabständen geprüft wird,
daß im Falle eines fehlerhaften Zustandes einer Recheneinheit diese durch eine zu diesem Zeitpunkt nicht aktive Recheneinheit ersetzt wird und
daß im Falle eines fehlerhaften Zustandes einer Kommunikationseinheit oder einer internen oder externen Verbindung diese zukünftig umgangen wird.
7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß der Zustand des Rechnersystems zu bestimmten Zeitpunkten eingefroren, d. h. abgespeichert wird.
8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, daß das Einfrieren des Betriebszustandes der Recheneinheiten, der Kommunikationseinheiten sowie der internen und externen Verbindungen unmittelbar nach einer Prüfung erfolgt, die keinen Fehler ergeben hat.
9. Verfahren nach einem der Ansprüche 6 bis 8, dadurch gekennzeichnet, daß bei Feststellung eines fehlerhaften Betriebszustandes der zuletzt eingefrorene Zustand wiederhergestellt wird.
10. Verfahren nach einem der Ansprüche 7 bis 9, dadurch gekennzeichnet, daß der Zustand des Massenspeichersystems Teil des Betriebszustandes ist.
DE19914117693 1991-05-29 1991-05-29 Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems Granted DE4117693A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19914117693 DE4117693A1 (de) 1991-05-29 1991-05-29 Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19914117693 DE4117693A1 (de) 1991-05-29 1991-05-29 Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems

Publications (2)

Publication Number Publication Date
DE4117693A1 true DE4117693A1 (de) 1992-12-03
DE4117693C2 DE4117693C2 (de) 1993-09-02

Family

ID=6432769

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19914117693 Granted DE4117693A1 (de) 1991-05-29 1991-05-29 Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems

Country Status (1)

Country Link
DE (1) DE4117693A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100351829C (zh) * 2003-06-13 2007-11-28 中国科学院计算技术研究所 网格化动态自组织计算机体系结构的构造方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE9201117U1 (de) * 1992-01-30 1992-03-19 Siemens AG, 8000 München Rechnergesteuertes Kommunikationssystem

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4907232A (en) * 1988-04-28 1990-03-06 The Charles Stark Draper Laboratory, Inc. Fault-tolerant parallel processing system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4907232A (en) * 1988-04-28 1990-03-06 The Charles Stark Draper Laboratory, Inc. Fault-tolerant parallel processing system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Maehle Erik, Fehlertolerante Multiprozessor- topologien, in: Informationstechnik it 1/89, S. 39-49 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100351829C (zh) * 2003-06-13 2007-11-28 中国科学院计算技术研究所 网格化动态自组织计算机体系结构的构造方法

Also Published As

Publication number Publication date
DE4117693C2 (de) 1993-09-02

Similar Documents

Publication Publication Date Title
DE2908316C2 (de) Modular aufgebaute Multiprozessor-Datenverarbeitungsanlage
DE2935841C2 (de) Mehrprozessoranlage
DE10258946A1 (de) Speicherprogrammierbare Steuerung für Sicherheitssyteme mit verminderter Querverdrahtung
DE3786381T2 (de) Prüfverfahren und -gerät für ein verteiltes Verarbeitungssystem.
DE2225841C3 (de) Verfahren und Anordnung zur systematischen Fehlerprüfung eines monolithischen Halbleiterspeichers
DE19815263A1 (de) Vorrichtung zur fehlertoleranten Ausführung von Programmen
WO2002065289A1 (de) Automatische inbetriebnahme eines clustersystems nach einem heilbaren fehler
DE2641700C2 (de)
EP0996060A2 (de) Einzelprozessorsystem
EP1820307B1 (de) Verfahren zum nachweis der verf]gbarkeit von systemkomponenten eines redundanten kommunikationssystems
DE4233837A1 (de) Rechenanlage
DE102007045509A1 (de) Fahrzeug-Steuereinheit mit einem Versorgungspannungsüberwachten Mikrocontroller sowie zugehöriges Verfahren
DE4117693A1 (de) Fuer ein fehlertolerantes rechnersystem bestimmte funktionseinheit und verbindungsstruktur sowie verfahren zum betrieb eines solchen rechnersystems
DE3704318A1 (de) Verfahren und anordnung zur ueberwachung der funktion eines mikroprozessors
WO2000007103A1 (de) Bus-steuereinheit zur unterstützung einer programmablauf-überwachung in sternstrukturen, dazugehöriges programmablauf-überwachungssystem sowie verfahren zur programmablauf-überwachung
DE19640346A1 (de) Verfahren zum Überprüfen eines gemäß einem Kommunikationsprotokoll durchgeführten Datenaustausches
DE4005321C2 (de)
DE10062404A1 (de) Vorrichtung und Verfahren zum Reduzieren der Anzahl von Adressen fehlerhafter Speicherzellen
DE3531901C2 (de)
DE10132313A1 (de) Programmgesteuerte Einheit
EP0961973B1 (de) Redundant aufgebautes elektronisches geraet mit zertifizierten und nicht zertifizierten kanaelen und verfahren dafür
DE4007460C2 (de) Verfahren und Schaltungsanordnung zur schnellen Außerbetriebnahme von Baugruppen im Fehlerfall
DE3843564A1 (de) Verfahren zur ueberpruefung von verbindungs- und/oder schalteinrichtungen und/oder -leitungen
DE10084752T5 (de) Verfahren zur Überwachung von parallelen Prozessen
DE19801992C2 (de) Verfahren zur Verbesserung der Systemverfügbarkeit nach dem Ausfall von Prozessoren einer Prozessorplattform

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee