DE10120262A1

DE10120262A1 - Feststellung und Korrektur von Fehlern bei grammatikalischen Fällen im Deutschen

Info

Publication number: DE10120262A1
Application number: DE10120262A
Authority: DE
Inventors: Andrea Jessee; Yvonne Quirmbach-Brundage; Antje Helfrich; Paul Cardon
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2000-10-20
Filing date: 2001-04-25
Publication date: 2002-04-25
Also published as: US7136808B2; US20020128819A1

Abstract

Es werden ein Verfahren und eine Einrichtung zur Grammatiküberprüfung eines Satzes in der deutschen Sprache vorgeschlagen. Die Grammatiküberprüfungseinrichtung führt eine grammatische Analyse des Satzes in einem Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination durch, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung führt einen Zugriff auf eine Morphologietabelle durch, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist. Die Grammatiküberprüfungseinrichtung führt einen Zugriff auf ein Lexikon durch, um eine korrekte Fallkombination zu definieren, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche Fallkombination mit der korrekten grammatischen Fallkombination, und erzeugt eine Fallfehlerkombination. Die Grammatiküberprüfungseinrichtung erzeugt eine Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.

Description

Die vorliegende Anmeldung beansprucht die Priorität der provisorischen US-Anmeldung 60/242,320 mit dem Titel Detection & Correction of Errors in German Grammatical Case, die am 20. Oktober 2000 eingereicht wurde.

Textverarbeitungscomputeranwendungen, beispielsweise Wortprozessor- und E-Mail-Anwendungen, verwenden Grammatiküberprüfungsmodule. Ein Grammatiküberprüfungsmodul untersucht einen Textsatz nach Fehlern oder Abweichungen von einfachen Grammatikregeln für die jeweilige verwendete Sprache.

Es besteht der Wunsch, Grammatiküberprüfungseinrichtungen für die deutsche Sprache zu verbessern, so daß die Grammatiküberprüfungseinrichtung Fehler in den Fallendungen von Subjekten, direkten und indirekten Objekten in Verbalphrasen feststellen kann. Allerdings treten bei der deutschen Sprache erhebliche Probleme bei jedem Versuch auf, Überprüfungen in Hinsicht auf Fallendungen von Subjekten, direkten Objekten und indirekten Objekten durchzuführen.

Das Problem der Feststellung von Fehlern bei den Fallendungen im Deutschen ist erheblich komplizierter als die Aufgabe für den Verfasser eines Textes, die korrekten Fallendungen auszuwählen, daß die Grammatiküberprüfungseinrichtung nicht weiß, was der Verfasser gemeint haben könnte. Wird ihr ein Satz oder Satzteil präsentiert, der einen Fehler bezüglich einer Fallendung aufweist, steht der Grammatiküberprüfungseinrichtung kein Zugriff auf die angestrebte Bedeutung eines Satzes oder Satzteils zur Verfügung, um zu bestimmen, welcher Fall für jede Nominalphrase gedacht war. Die Wortreihenfolge in deutschen Sätzen ist variabel, und stellt wenig Information in Bezug auf wahrscheinliche grammatikalische Fälle von Nominalphrasen zur Verfügung.

Das Grammatiküberprüfungsproblem wird dadurch noch komplizierter, daß deutsche Fallendungen nicht eindeutig für einen bestimmten grammatikalischen Fall (Kasus) sind. Für Artikel, Adjektive oder Substantive kann dieselbe Fallendung in unterschiedlichen Fällen verwendet werden, in Abhängigkeit von einer komplizierten Kombination des grammatikalischen Geschlechts, ob ein Substantiv im Singular oder im Plural vorliegt, oder ob ein Wort des Typs "der" oder ein Bestimmungswort des Typs "ein" dem Adjektiv vorhergeht. Daher bestimmen Fallendungen nicht immer verläßlich oder eindeutig den grammatikalischen Fall einer Nominalphrase. Es ist ein beträchtliches Problem vorhanden, wenn einem Benutzer vorgeschlagene Fallendungskorrekturen bei einer derart erheblichen Vieldeutigkeit der verfügbaren Information präsentiert werden, und bei so vielen möglichen Kombinationen grammatikalisch korrekter vorgeschlagener Korrekturen, wenn die vom Verfasser gewünschte Bedeutung unbekannt ist.

Es ist ein Grammatiküberprüfungsmodul für Textverarbeitungsanwendungen erforderlich, um die gewünschte Überprüfung der Endungen grammatikalischer Fälle von Subjekten, direkten Objekten und indirekten Objekten in Satzteilen der deutschen Sprache zur Verfügung zu stellen.

Es werden ein Verfahren und eine Einrichtung zur Grammatiküberprüfung eines Satzes in der deutschen Sprache vorgeschlagen. Die Grammatiküberprüfungseinrichtung führt eine grammatische Analyse des Satzes in eine Verbalphrase und eine ursprüngliche Nominalphrasenkombination durch, die der Verbalphrase zugeordnet ist. Die Grammatiküberprüfungseinrichtung greift auf eine Morphologietabelle zu, um eine ursprüngliche Fallkombination festzulegen, die der ursprünglichen Nominalphrasenkombination zugeordnet ist. Die Grammatiküberprüfungseinrichtung greift auf ein Lexikon zu, um eine korrekte Fallkombination zu definieren, die der Verbalphrase zugeordnet ist. Die Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche Fallkombination mit der korrekten grammatischen Fallkombination und erzeugt eine Fallfehlerkombination. Die Grammatiküberprüfungseinrichtung erzeugt eine Kombination von Satzänderungen, die eine Änderung des grammatischen Falles auf eine Nominalphrase enthält, welche die Fallfehlerkombination korrigiert.

Die Erfindung wird nachstehend anhand zeichnerisch dargestellter Ausführungsbeispiele näher erläutert, aus welchen weitere Vorteile und Merkmale hervorgehen. Es zeigt:

Fig. 1 eine vereinfachte Tabelle von Beispielen für deutsche Fallendungen in Abhängigkeit vom Fall, der Anzahl und dem grammatischen Geschlecht;

Fig. 2 ein Blockschaltbild einer ersten beispielhaften Grammatiküberprüfungsschaltung;

Fig. 3 ein Flußdiagramm von Verfahrensschritten;

Fig. 4 ein Flußdiagramm der Fehlerfeststellung;

Fig. 5 ein Flußdiagramm der Zielfallberechnung;

Fig. 6 ein Flußdiagramm der Änderungserzeugung; und

Fig. 7 ein Blockschaltbild einer zweiten beispielhaften Grammatiküberprüfungsschaltung.

Gemäß der vorliegenden Erfindung arbeitet eine Grammatiküberprüfungseinrichtung so, daß sie eine Überprüfung nach Fehlern in deutschen Fallendungen von Subjekten, direkten Objekten und indirekten Objekten von Verben in Verbalphrasen durchführt. Dies erfolgt ohne Zugriff auf die vom Verfasser angestrebte Bedeutung der Verbalphrase. Die Grammatiküberprüfungseinrichtung überwindet das Problem, daß Fallendungen nicht für einen bestimmten Fall eindeutig sind. Die Grammatiküberprüfungseinrichtung stellt ein Ausmaß von Verläßlichkeit zur Verfügung, das zum Einsatz mit Textverarbeitungscomputeranwendungen geeignet ist. Die Grammatiküberprüfungseinrichtung stellt eine vernünftig begrenzte Anzahl vorgeschlagener Korrekturen zur Verfügung, die dem Benutzer präsentiert werden, wenn ein Fallfehler festgestellt wird.

Im Deutschen geben Fallendungen den Fall eines Subjekts, eines direkten Objekts oder eines indirekten Objekts einer Verbalphrase an. Wenn Fallendungen exakt sind, können sie einen sehr wesentlichen Teil der Bedeutung einer Verbalphrase mitteilen. Wenn Fehler bei Fallendungen vorhanden sind, kann dem Leser eine fehlerhafte Bedeutung mitgeteilt werden, die sich von jener unterscheidet, die vom Verfasser gedacht war.

Im Deutschen sind Fallendungen bei dem Substantiv und ebenso bei irgendwelchen Artikeln von Adjektiven vorhanden, die in einer Nominalphrase ("NP") vorhanden sein können. Die Fallendungen sind kompliziert und hängen vom grammatischen Geschlecht des Substantivs ab, davon, ob das Substantiv im Singular oder Plural vorliegt, und ob das Substantiv ein Subjekt (Nominalfall) ist, ein direktes Objekt (Akkusativfall) oder ein indirektes Objekt (Dativfall), des Verbes. Die verschiedenen Formen deutscher Substantive sind irregulär und können Änderungen der Endung sowie andere orthographische Änderungen des Substantives umfassen. Man muß sich an mehrere Formen von Substantiven erinnern, oder auf ein Wörterbuch oder Lexikon zurückgreifen.

Deutsche Adjektivendungen sind besonders kompliziert, da sich die Adjektivendungen ebenfalls in Abhängigkeit davon ändern, ob das Adjektiv einem sogenannten Wort des Typs "der" folgt ("schwache Deklination", beispielsweise der, dieser, jener, jeder, welcher, solcher, aller), ob ihm ein sogenanntes Wort "ein" vorangeht ("gemischte Deklination", beispielsweise ein, mein, sein, ihr, kein, unser, euer, dein, Ihr), oder ob ihm weder ein Wort des Typs "der" noch des Typs "ein" vorausgeht. In einigen Fällen, nämlich wenn ein Adjektiv auf ein Substantiv folgt, das es verändert, wird die Fallendung des Adjektivs weggelassen. Darüber hinaus gibt es zulässige Variationen der Dativendungen bei maskulinen und neutralen Substantiven.

Nicht korrekte Fallendungen können einen schlechten Eindruck von den Fähigkeiten des Verfassers vermitteln, oder dem Leser eine ungewünschte Bedeutung übermitteln. Jemand, der in der deutschen Sprache schreibt, kann verläßlich Fallendungen für das Subjekt, direkte Objekt und indirekte Objekt auswählen, durch Rückgriff auf ein Wörterbuch und ein Grammatikbuch, beispielsweise die Duden-Grammatik, oder unter Bezugnahme auf eine vereinfachte Tabelle von Fallendungsbeispielen, ähnlich jener, wie sie in Fig. 1 gezeigt ist. In Fig. 1 bezeichnet die Zahl "1" die erste Form (Nominativsingular) eines Substantivs, die Zahl "3" die dritte Form (Nominativplural) eines Substantivs, wie in einem Wörterbuch aufgeführt. Ein Verfasser kann beispielsweise wünschen, den Satzteil "the blue lake" ("der blaue See") als einzelnes, indirektes Objekt in einem Satz zu verwenden. Der Verfasser kann zuerst ein Wörterbuch heranziehen, in dem er die erste Form "See" findet, was bedeutet, daß der englische Begriff "lake" im deutschen männlich ist. Dann schlägt der Verfasser in einer Tabelle wie in Fig. 1 nach, und findet den Schnittpunkt der maskulinen, Singularspalte 10 mit der Zeile 11 für das indirekte Objekt (Dativ). An diesem Schnittpunkt findet sich ein Beispiel 12 für Endungen von Artikeln, Adjektiven und Substantiven für ein maskulines indirektes Objekt im Singular. Unter Bezugnahme auf dieses Beispiel 12 kann der Verfasser den Begriff "the blue lake" mit der korrekten Anzahl, dem korrekten grammatischen Geschlecht und dem korrekten Fall schreiben, nämlich als "dem blauen See". Fig. 1 ist zum Teil eine Deklinationstabelle, die Beispiele für die Beugung der Endungen von Bestimmungsworten, Adjektiven und Substantiven für die drei Fälle (Nominativ, Dativ, Akkusativ) angibt, die zur Angabe des Subjekts, des indirekten Objekts und des direkten Objekts eines Verbs in einem deutschen Satz verwendet werden.

Die Tätigkeit des Verfassers kann mit wenigen Fehlern fertiggestellt werden, da dem Verfasser die Regeln und Ausnahme von den Regeln zur Verfügung stehen, und der Verfasser die gewünschte Bedeutung des Satzes weiß.

Andererseits ist das Problem für eine Grammatiküberprüfungseinrichtung bei der Überprüfung in Bezug auf Fehler bei deutschen Fallendungen komplizierter und mehrdeutiger. Wenn eine Grammatiküberprüfungseinrichtung für die deutsche Sprache das Substantiv "See" in einem Satz antrifft, ist es unbekannt, ob der Verfasser das männliche Substantiv "See" mit der Bedeutung "lake" im Englischen (stehendes Binnengewässer) oder das weibliche Substantiv "See" mit der englischen Bedeutung "ocean" (Meer) meint. Die Handhabung derartiger Mehrdeutigkeiten in einer Grammatiküberprüfungseinrichtung wird nachstehend im Zusammenhang mit den in den Fig. 3 bis 7 angegebenen Beispielen erläutert.

Ein Satzteil wird der Grammatiküberprüfungsanwendung durch eine Einrichtung zur grammatischen Analyse zur Verfügung gestellt, und der Satzteil kann ein vollständiger Satz sein, oder ein verbaler Satzteil, der ein Teil eines Satzes ist, in welchem eine bestimmte Kombination aus Subjekt, direktem Objekt oder indirektem Objekt vorhanden sein kann. Die Einrichtung zur grammatischen Analyse und die Grammatiküberprüfungseinrichtung sind in einer Computerumgebung implementiert.

Vor einer ins Einzelne gehenden Erläuterung der vorliegenden Erfindung kann eine Übersicht über eine derartige Computerbetriebsumgebung nützlich sein. Fig. 2 und die zugehörige Beschreibung geben eine kurze, allgemeine Erläuterung einer geeigneten Computerumgebung 20, in welcher die Erfindung implementiert werden kann. Die Computersystemumgebung 20 stellt nur ein Beispiel für eine geeignete Schaltungsausbildung dar, und soll nicht dahingehend verstanden werden, daß hiermit eine Einschränkung des Umfangs der Nutzung oder der Funktionen gemäß der Erfindung beabsichtigt ist. Auch sollte die Computerumgebung 20 nicht so verstanden werden, daß sie von einzelnen Bauteilen oder deren Kombinationen oder entsprechenden Anforderungen abhängig ist, die bei der beispielhaften Betriebsumgebung 20 dargestellt sind.

Die Erfindung kann mit zahlreichen anderen allgemeinen oder speziellen Schaltungen oder Konfigurationen arbeiten. Beispiele für wohlbekannte Computersysteme, Umgebungen, und/oder Konfigurationen, die zum Einsatz bei der Erfindung geeignet sein können, umfassen - sind hierauf jedoch nicht beschränkt - Personalcomputer, Servercomputer, tragbare oder Laptopgeräte, Multiprozessorsysteme, Systeme auf Mikroprozessorgrundlage, Settopboxen, programmierbare Verbraucherelektronik, Netzwerk-PCs, Minicomputer, Großcomputer, verteilte Rechnerumgebungen, die irgendeines der voranstehend geschilderten Systeme oder Geräte enthalten, und dergleichen. Darüber hinaus kann die Erfindung in einem Telefonsystem verwendet werden.

Die Erfindung kann im allgemeinen Zusammenhang von durch Computer ausführbaren Befehlen beschrieben werden, beispielsweise Anwendungsmodulen, die von einem Computer ausgeführt werden. Im allgemeinen umfassen Anwendungsmodule Routinen, Programme, Objekte, Komponenten, Datenstrukturen usw., die spezielle Aufgaben ausführen, oder bestimmte abstrakte Datentypen implementieren. Die Erfindung kann auch in einer verteilten Rechnerumgebung ausgeführt werden, bei welcher Aufgaben von entfernten Verarbeitungsgeräten erledigt werden, die über ein Kommunikationsnetzwerk verbunden sind. In einer verteilten Rechnerumgebung können Programmmodule sowohl auf lokalen als auch entfernten Computerspeichermedien liegen, einschließlich Speichergeräten. Aufgabe, die von den Programmen und Modulen durchgeführt werden, werden nachstehend und unter Zuhilfenahme von Figuren beschrieben. Fachleuten auf diesem Gebiet können die Beschreibung und die Figuren als von durch Prozessoren ausführbare Befehle implementieren, die auf jeder Form eines computerlesbaren Mediums geschrieben werden können.

Gemäß Fig. 2 weist das Beispiel für ein System zur Implementierung der Erfindung ein Allzweckrechnergerät in Form eines Computers 30 auf. Die Bauteile des Computers 30 können, wobei sie hierauf nicht beschränkt sind, eine Bearbeitungseinheit 40 umfassen, einen Systemspeicher 50 und einen Systembus 41, der verschiedene Systembauteile einschließlich des Systemspeichers mit der Verarbeitungseinheit 40 verbindet. Der Systembus 41 kann eine von verschiedenen Arten von Busstrukturen sein, einschließlich eines Speicherbus oder einer Speichersteuerung, eines Peripheriebusses, und eines lokalen Busses, unter Verwendung einer unter verschiedenen Busarchitekturen. Zum Beispiel umfassen, wobei dies nicht einschränkend zu verstehen ist, derartige Architekturen Busse des Typs Industry Standard Architecture (ISA), Micro Channel Architecture (MCA), Enhanced ISA (EISA), einen lokalen Bus des Typs Video Electronics Standards Association (VESA), und den Bus des Typs Peripheral Component Interconnect (PCI), der auch als Mezzanine-Bus bekannt ist.

Der Computer 39 enthält typischerweise verschiedene computerlesbare Medien. Computerlesbare Medien können alle verfügbaren Medien sein, auf die durch den Computer 30 zugegriffen werden kann, und umfassen sowohl flüchtige als auch nicht-flüchtige Medien, entfernbare und nicht-entfernbare Medien. Beispiele, wobei dies nicht einschränkend zu verstehen ist, für computerlesbare Medien umfassen Computerspeichermedien und Kommunikationsmedien. Computerspeichermedien umfassen sowohl flüchtige als auch nicht-flüchtige, entfernbare und nicht-entfernbare Medien, die in jedem Verfahren oder jeder Technik zum Speichern von Information verwendet werden, zum Beispiel von computerlesbaren Befehlen, Datenstrukturen, Programmmodulen oder anderen Daten. Computerspeichermedien umfassen, sind jedoch nicht hierauf beschränkt, RAM, ROM, EEPROM, Flash-Speicher oder eine Speichertechnik, CD-ROM, digitale vielseitige Disketten (DVD), oder andere optische Diskettenspeicher, Magnetkassetten, Magnetbänder, Magnetplattenspeicher oder andere magnetische Speichergeräte, oder irgendein anderes Medium, das dazu verwendet werden kann, die gewünschte Information zu speichern, und auf welches durch den Computer 20 zugegriffen werden kann. Kommunikationsmedien verwenden häufig von einem Computer lesbare Befehle, Datenstrukturen, Programmmodule oder andere Daten in einem modulierten Datensignal, beispielsweise in einer Trägerwelle oder einem anderen Transportmechanismus, und umfassen sämtliche Medien zum Liefern von Information. Der Betriff "moduliertes Datensignal" ist als Signal zu verstehen, bei welchem eine oder mehrere seiner Eigenschaften eingestellt oder geändert werden, und zwar auf solche Weise, daß das Signal mit Information kodiert wird. Zum Beispiel, wobei dies nicht einschränkend zu verstehen ist, umfassen Kommunikationsmedien verdrahtete Medien wie beispielsweise ein verdrahtetes Netzwerk oder eine direkt verdrahtete Verbindung, und auch drahtlose Medien wie beispielsweise akustische, Radiofrequenz-, Infrarot- und andere drahtlose Medien. Auch Kombinationen dieser Medien sollen vom Umfang des Begriffs computerlesbare Medien umfaßt sein.

Der Systemspeicher 50 umfaßt Computerspeichermedien in Form eines flüchtigen und/oder nicht-flüchtigen Speichers, etwa einen Nur-Lese-Speicher (ROM) 51 und einen Speicher mit wahlfreiem Zugriff (RAM) 52. Ein Basiseingabe/Ausgabesystem 53 (BIOS), welches die grundlegenden Routinen enthält, welche die Übertragung von Information zwischen Elementen innerhalb des Computers 30 unterstützen, beispielsweise bei dessen Ingangsetzung, ist typischerweise in dem ROM 51 gespeichert. Der RAM 52 enthält typischerweise Daten und/oder Programmmodule, auf die unmittelbar zugegriffen werden kann, und/oder mit denen momentan mit der Verarbeitungseinheit 40 gearbeitet wird. Zum Beispiel, wobei dies nicht als einschränkend zu verstehen ist, erläutert Fig. 2 das Betriebssystem 54, Anwendungsprogramme 55, andere Programmmodule 56, sowie Programmdaten 57.

Der Computer 30 kann weiterhin andere entfernbare oder nicht-entfernbare, flüchtige oder nicht-flüchtige Computerspeichermedien enthalten. Nur beispielhaft zeigt Fig. 2 ein Festplattenlaufwerk 61, das aus nicht-entfernbaren, nicht-flüchtigen magnetischen Medien liest oder in diese schreibt, ein Magnetdiskettenlaufwerk 71, das aus einer entfernbaren, nicht-flüchtigen Magnetdiskette 72 liest oder in diese schreibt, und ein Laufwerk 75 für optische Disketten, das aus einer entfernbaren, nicht-flüchtigen optischen Diskette 76, beispielsweise einer CD-ROM, liest oder in diese einschreibt, oder ein anderes optisches Medium. Andere entfernbare oder nicht-entfernbar, flüchtige oder nicht-flüchtige Computerspeichermedien, die bei dem Beispiel für die Betriebsumgebung verwendet werden können, umfassen, sind jedoch nicht hierauf beschränkt, Magnetbandkassetten, Flash-Speicherkarten, digitale vielseitige Disketten, digitale Videobänder, Festkörper-RAM, Festkörper-ROM und dergleichen. Das Festplattenlaufwerk 61 ist typischerweise mit dem Systembus 41 über eine nicht-entfernbare Speicherschnittstelle verbunden, beispielsweise über die Schnittstelle 60, und das Magnetdiskettenlaufwerk 71 und das Laufwerk 75 für optische Disketten sind typischerweise mit dem Systembus 41 über eine entfernbare Speicherschnittstelle verbunden, beispielsweise die Schnittstelle 70.

Die Laufwerke und ihre zugehörigen Computerspeichermedien, die voranstehend erläutert wurden, und in Fig. 1 gezeigt sind, stellen Speicher für vom Computer lesbare Befehle, Datenstrukturen, Programmmodule und andere Daten für den Computer 30 zur Verfügung. In Fig. 2 ist zum Beispiel das Festplattenlaufwerk 61 so dargestellt, daß es ein Betriebssystem 64 speichert, Anwendungsprogramme 65, andere Programmmodule 66, sowie Programmdaten 67. Es wird darauf hingewiesen, daß diese Komponenten entweder gleich dem Betriebssystem 54, Anwendungsprogrammen 55, anderen Programmmodulen 56 und Programmdaten 57 sein können, oder sich hiervon unterscheiden können. Das Betriebssystem 64, die Anwendungsprogramme 65, die anderen Programmmodule 66 und die Programmdaten 67 werden hier mit unterschiedlichen Bezugszeichen bezeichnet, um zu erläutern, daß sie mindestens unterschiedliche Kopien darstellen.

Ein Benutzer kann Befehle und Information in den Computer 30 über Eingabegeräte eingeben, beispielsweise eine Tastatur 82, ein Mikrofon 83, und ein Zeigergerät 81, beispielsweise eine Maus, einen Trackball, oder ein Berührungsfeld. Andere Eingabegeräte (nicht gezeigt) können einen Joystick, ein Gamepad, eine Satellitenschüssel, einen Scanner oder dergleichen umfassen. Diese und andere Eingabegeräte sind häufig mit der Verarbeitungseinheit 40 über eine Benutzereingabeschnittstelle 80 verbunden, die mit dem Systembus gekoppelt ist, können jedoch auch durch andere Schnittstellen- und Busstrukturen angeschlossen sein, beispielsweise einen Parallelport, einen Port für Spiele oder einen universellen seriellen Bus (USB). Ein Monitor 84 oder eine andere Art von Anzeigegerät ist ebenfalls mit dem Systembus 41 über eine Schnittstelle verbunden, beispielsweise eine Videoschnittstelle 85. Zusätzlich zu dem Monitor können Computer auch andere periphere Ausgabegeräte enthalten, beispielsweise Lautsprecher 87 und einen Drucker 86, die über eine Ausgabeperipherieschnittstelle 88 angeschlossen sein können.

Der Computer 30 kann in einer Netzwerkumgebung arbeiten, unter Verwendung logischer Verbindungen zu einem oder mehreren entfernten Computern, etwa einem entfernten Computer 94. Der entfernte Computer 94 kann ein Personalcomputer sein, ein von Hand gehaltenes Gerät, ein Server, ein Router, ein Netzwerk-PC, ein Peer-Gerät oder ein anderer gemeinsamer Netzwerkknoten, und umfaßt typischerweise viele der Elemente, oder sämtliche Elemente, die voranstehend in Bezug auf den Computer 30 beschrieben wurden. Die Logikverbindungen, die in Fig. 2 gezeigt sind, umfassen ein Lokalbereichsnetzwerk (LAN) 92 und ein Großbereichsnetzwerk (WAN) 93, können jedoch auch andere Netzwerke umfassen. Derartige Netzwerkumgebungen sind üblich in Büros, firmeninternen Computernetzwerken, Intranets und dem Internet.

Bei der Verwendung in einer LAN-Netzwerkumgebung ist der Computer 30 mit dem LAN 91 über eine Netzwerkschnittstelle oder einen Adapter 90 verbunden. Beim Einsatz in einer WAN-Netzwerkumgebung weist der Computer 30 typischerweise ein Modem 92 oder eine andere Vorrichtung dazu auf, Kommunikation über das WAN 93, beispielsweise das Internet, einzurichten. Das Modem 92, das intern oder extern vorgesehen sein kann, kann mit dem Systembus 41 über die Benutzereingabeschnittstelle 80 oder einen anderen geeigneten Mechanismus verbunden sein. Bei einer Netzwerkumgebung können Programmmodule, die in Bezug auf den Computer 30 dargestellt sind, oder Teile von diesem, in dem entfernten Speichergerät gespeichert sein. Als Beispiel, wobei dies nicht als einschränkend zu verstehen ist, zeigt Fig. 2 entfernte Anwendungsprogramme 95 so, daß sie auf einem entfernten Computer 94 liegen. Es wird darauf hingewiesen, daß die dargestellten Netzwerkverbindungen als Beispiel zu verstehen sind, und andere Vorrichtungen zur Einrichtung einer Kommunikationsverbindung zwischen den Computern verwendet werden können.

Fig. 3 zeigt ein verallgemeinertes Flußdiagramm 200 von Verfahrensschritten bei einem Beispiel für eine Grammatiküberprüfungseinrichtung. Eine Textverarbeitungsanwendung, beispielsweise ein Wordprocessor, stellt Sätze in deutscher Sprache einzeln für die Grammatiküberprüfungseinrichtung zur Verfügung. Wie bei 201 gezeigt ist, stellt der Wordprocessor den Satz "Der Mann nennt der Richter einen Lügner" der Grammatiküberprüfungseinrichtung zur Verfügung. Der Satz wird an eine Satzanalysemaschine 210 übergeben.

Die Satzanalysemaschine 210 führt einen Zugriff auf ein Lexikon und Wortmorphologie (einschließlich Beugung und Konjugation) durch, die auf einem computerlesbaren Medium gespeichert sind. Die Satzanalysemaschine 210 identifiziert unverbindlich Teile des Satzes, beispielsweise verbale Satzteile und die grammatischen Bestandteile jedes verbalen Satzteils, beispielsweise Verben, Substantiva, Adjektive, Bestimmungsworte, Präpositionen und dergleichen. Die Satzanalysemaschine 210 analysiert grammatisch den Satz in Bezug auf einzelne verbale Satzteile, wenn der Satz mehr als einen verbalen Satzteil enthält. Für jeden verbalen Satzteil identifiziert darüber hinaus die Satzanalysemaschine 210 unverbindlich eine Kombination eines Hauptverbs, eines Hilfsverbs und jedes Subjekts, direkten Objekts, indirekten Objekts, Adverbs oder eines Satzteils mit einer Präposition, die in dem verbalen Satzteil vorhanden (oder implizit vorhanden) ist. Die Satzanalysemaschine 210 erzeugt, auf der Grundlage dieser Analyse des Satzes, ein vereinfachtes grammatisches Modell oder eine vereinfachte grammatisch Kombination des verbalen Satzteils.

Das vereinfachte grammatische Modell oder die vereinfachte grammatische Kombination umfaßt die Identifizierung irgendwelcher Satzteile (Substantiv-Satzteile) mit einem Subjekt, einem direkten Objekt oder einem indirekten Objekt des verbalen Satzteils, und die mögliche korrekte Kombination oder die möglichen korrekten Kombinationen von Substantiv- Satzteilen auf der Grundlage des Hauptverbs. Das vereinfachte grammatische Modell kann auch andere Kombinationen der Satzstruktur enthalten. Das vereinfachte grammatische Modell wird an den Filter 203 für verdächtige Sätze weitergeleitet.

Der Filter 203 für verdächtige Sätze identifiziert verbale Satzteile mit Kombinationen, die so kompliziert oder so ungewöhnlich sind, daß ein hohes Risiko dafür besteht, daß die Grammatiküberprüfungseinrichtung bei dieser Kombination des verbalen Satzteils nicht korrekt arbeitet. Der Filter 203 für verdächtige Sätze überspringt diese verbalen Satzteile mit hohem Risiko, und leitet sie nicht an nachfolgende Grammatiküberprüfungsroutinen weiter. Wenn der Filter 203 für verdächtige Sätze Satzteile mit Kombinationen feststellt, bei denen eine korrekte Handhabung von nachfolgenden Grammatiküberprüfungsroutinen wahrscheinlich ist, leitet er sie an eine Fehlererfassungsroutine 204 weiter. Die Fehlererfassungsroutine hat Zugriff auf die Funktionen find_args 214 und adj_case 216, und auf eine Gruppe von Hilfefunktionen 218. Die Fehlererfassungsroutine 204 wird mit weiteren Einzelheiten im Zusammenhang mit Fig. 4 erläutert.

Die Fehlererfassungsroutine 204 gibt die Kombination des verbalen Satzteils an eine Zielfallberechnungsfunktion 205 weiter, die mit GET_CASE bezeichnet ist. Wenn Fehler in Bezug auf eine mangelnde Übereinstimmung des Substantiv-Satzteils vorhanden sind, dann versucht die Grammatiküberprüfungseinrichtung keine grammatikalische Korrektur, sondern leitet statt dessen den verbalen Satzteil bei 207 an eine NP-Nichtübereinstimmungsüberprüfungseinrichtung weiter. Die Zielfallberechnung wird mit weiteren Einzelheiten im Zusammenhang mit Fig. 5 erläutert. Die Zielfallberechnungsfunktion 205 leitet die Kombination verbaler Satzteile zur Überschreibungserzeugungsfunktion 206 weiter. Die Überschreibungserzeugungsfunktion 206 wird mit weiteren Einzelheiten im Zusammenhang mit Fig. 6 erläutert.

Die Überschreibungserzeugungsfunktion 206 stellt vorgeschlagene Überschreibungen 202 dem Benutzer des Wordprocessors zur Verfügung, wenn Fehler in der Fallkombination des verbalen Satzteils vorhanden sind. Die vorgeschlagenen Überschreibungen 202 sind Änderungen der Fallendung, welche die Kombination des Substantiv-Satzteils in dem Verbal-Satzteil an eine der korrekten Kombinationen von Substantiv-Satzteilen anpassen, die durch das Verb angegeben werden. Beim vorliegenden Beispiel ist das Verb "nennt". Der Benutzer des Wordprocessors kann dann eine der vorgeschlagenen Überschreibungen 202 akzeptieren, und der verbale Satzteil der Wordprocessoranwendung wird so geändert, daß die Grammatik korrigiert wird. Der Benutzer des Wordprocessors hat Zugriff auf eine gewünschte oder vermutete Bedeutung des verbalen Satzteils, und kann produktiv eine Überschreibung auswählen, die mit der Bedeutung verträglich ist.

Während Überschreibungen in dem Überschreibungsgenerator 206 erzeugt werden, durchläuft das Programm drei verschachtelte Schleifen 211 zurück zur Zielfallberechnung 205, um Korrekturen durchzuführen, wie sie in Fig. 3 angegeben sind. Während Überschreibungen erzeugt werden, geht darüber hinaus das Programm über vier verschachtelte Schleifen 212 zurück, um Korrekturen vorzunehmen, wie dies in Fig. 3 angegeben ist.

Die Grammatiküberprüfungseinrichtung, die bei 200 dargestellt ist, stellt grammatische Fehler fest, und schlägt geeignete Korrekturen für derartige Fehler vor.

Deutsch ist eine Sprache, die in hohem Ausmaß grammatische Fallendungen dazu verwendet, um die unterschiedlichen syntaktischen Rollen (Bedeutungen) von Elementen eines Satzes anzugeben. Diese Fallendungen oder Markierungen gestatten eine sehr flexible Wortreihenfolge, und ihr korrekter Gebrauch ist wesentlich nicht nur für die Grammatik, sondern auch für die semantische Bestimmtheit eines Satzes. Als ein Merkmal der Grammatiküberprüfungseinrichtung für die deutsche Sprache werden nicht korrekte Kombinationen grammatischer Fallformen festgestellt, und werden geeignete Vorschläge berechnet, um den Fehler zu korrigieren.

Die Korrektheit einer grammatischen Fallform kann nur durch die Kombination sämtlicher grammatischer Fälle festgelegt werden, die in einem Satz vorhanden sind. Üblicherweise (es sei denn, ihm geht eine Präposition vor) stellt das Verb eines Satzes bestimmte Anforderungen dahingehend, welche Fälle in einem Satz erwartet werden können. Die Schritte, die vom Computer durchgeführt werden, können entweder allein oder in verschiedenen Kombinationen folgende Schritte umfassen: (a) Feststellung des Verbs, das die erforderlichen Fälle bestimmt, durch Bezugnahme auf ein Lexikon, das auf einem computerlesbaren Medium gespeichert ist, (b) Feststellung aller Formen des Verbs, die einen grammatischen Fall enthalten, (c) Definition korrekter Fallverteilungen für unterschiedliche Szenarien (beispielsweise für Sätze oder Satzteile mit oder ohne ein Subjekt), (d) falls der eingegebene Satz nicht zu einem der verschiedenen Szenarien paßt, Definition der unterschiedlichen Vorschläge, die dem Benutzer dargeboten werden, um den Satz zu korrigieren, (e) Definition der bevorzugten Reihenfolge, in welcher die Korrektur dargestellt werden sollte, (f) Bereitstellung einer Anzeigestrategie für die Darstellung der unterschiedlichen Vorschläge, (d) Handhabung von Mehrdeutigkeiten, oder (h) Handhabung von Ausnahmen.

Ein weiterer, breiter Aspekt der vorliegenden Erfindung umfaßt eine Fallberechnungsfunktion 207, die zur Korrekturerzeugung einer unterschiedlichen Art eines häufigen grammatischen Fehlers verwendet werden kann, der als "NP-Abweichung" bezeichnet wird, nämlich grammatische Abweichungen der Elemente, die zu einer Wortgruppe gehören. Beispielsweise kann ein Substantiv-Satzteil (NP) eine Wortgruppe sein, die einen Artikel, Adjektive und ein Substantiv umfaßt, die miteinander in Bezug auf die grammatische Anzahl, das grammatische Geschlecht und den Fall übereinstimmen müssen. Wenn der Abweichungsfehler bei einer derartigen Wortgruppe dazu führt, daß es schwierig wird, welcher Fall eingesetzt werden sollte, dann hilft die Fallberechnung, die auf dem Niveau des Satzes oder des verbalen Satzteils arbeitet, dabei, vernünftigere Vorschläge zu machen. Jene Lösung, welche die Berechnung des korrekten Zielfalles für einen fehlerhaften Bestandteil betrifft, wird vorgezogen, da sie möglicherweise Information für mehrere mögliche Fälle enthält, die nur so weit korrekt sind, daß sie sich gegenseitig ausschließen.

Zusätzliche Schritte werden während der Berechnung des Zielfalles durchgeführt, um wahrscheinlichere Szenarien dem Benutzer vor weniger wahrscheinlichen Szenarien zu präsentieren.

Die Feststellung und die Korrektur von mit grammatischen Fällen zusammenhängenden Problemen werden nicht sehr gut durch generische Algorithmen mit einfachen, starren Regeln erfaßt. Komplizierte Satzstrukturen oder eine nicht korrekte grammatische Analyse durch die grammatische Analyseeinrichtung (also eine nicht korrekte Satzanalyse durch die grammatische Analyseeinrichtung) bringen die Möglichkeit mit sich, daß fehlerhaft grammatische Fehler angezeigt werden, oder fehlerhaft Vorschläge für eine Ersetzung dem Benutzer präsentiert werden. Um eine annehmbare Genauigkeit für die Behandlung von (nicht nur) Fällen mit grammatischen Fehlern zu erzielen, kann ein Filter 203 für verdächtige Sätze implementiert werden, der Strafwertestrukturen von verdächtigen Sätzen zuordnet, oder Elementen, die einfach entweder falsch interpretiert werden können, oder fehlerhaft von der Einrichtung für die grammatische Analyse bei 210 als nicht mehrdeutig festgestellt wurden. Wenn ein bestimmter Strafwert überschritten wird, wird der Satz nicht in Bezug auf Fehler für grammatische Fälle überprüft. Diese Filterfunktion kann signifikant die Genauigkeit des Fallkorrekturgerätes erhöhen.

Das Fallberechnungsmerkmal der Grammatiküberprüfungseinrichtung für die deutsche Sprache, die hier beschrieben wird, hebt sich im Vergleich zu anderen Grammatiküberprüfungseinrichtungen ab, die keine Überprüfung und Berechnung von Fallendungen in Abhängigkeit von den Erfordernissen des Verbs durchführen. Die Grammatiküberprüfungseinrichtung stellt eine Behandlung einer Klasse von Fehlern zur Verfügung, die zu kompliziert dafür waren, von anderen Grammatiküberprüfungseinrichtungen wirksam in Angriff genommen zu werden. Sie stellt nicht nur die Behandlung einer Fehlerklasse zur Verfügung, die bislang zu kompliziert war, um automatisch behandelt zu werden, sondern stellt auch verbesserte Vorschläge für Überschreibungen der Fehlerklasse zur Verfügung.

Da die korrekte Verwendung von Fallformen im Deutschen eine der wesentlichen Herausforderungen bei der Verwendung der deutschen Sprache darstellt, insbesondere für nicht muttersprachliche Sprecher, stellt dies eine wesentliche Verbesserung der Überprüfung der deutschen Grammatik dar.

Das tatsächliche Problem von Fehlern bezüglich grammatischer Fälle tritt häufig genug auf, so daß es ein Merkmal darstellt, welches die meisten Benutzer gern in einer Grammatiküberprüfungseinrichtung haben würden, jedoch ist es infolge der komplizierten Eigenschaften der Beziehung grammatischer Fälle in einem Satz schwierig, eine zufriedenstellende Genauigkeitsrate zu erzielen. Die Lösung für dieses Problem besteht darin, eine Code zu implementieren, der Benutzereingaben annimmt, und sie in Bezug auf die Korrektheit grammatischer Fälle sämtlicher enthaltener Verbergänzungen untersucht, wobei sichergestellt wird, daß die Reaktionen des Systems auf den Benutzer verläßlich sind.

Wenn beispielsweise ein Satz drei Ergänzungen enthält, wie beispielsweise in "Die Frau gibt dem Mann den Mantel", so sind die Ergänzungen "Die Frau" dem Mann, "den Mantel". Wenn eine der Ergänzungen einen falschen grammatischen Fall aufweist, ist es nicht notwendigerweise klar, welche Ergänzung fehlerhaft ist. Infolge der flexiblen Wortreihenfolge im Deutschen könnten mehrere Lösungen möglich sein. Die Lösung, die in der Grammatiküberprüfungseinrichtung für die deutsche Sprache implementiert wird, präsentiert vorzugsweise jene Lösungen, die den gesamten Satz in Bezug auf die Zuordnung von Fällen durch nur eine Ersetzung richtigstellt. Allerdings könnten mehrere mögliche einzelne Ersetzungen von Fällen vorhanden sein, die den Satz richtig stellen würden. Zur Lösung dieses Problems verwendet die Grammatiküberprüfungseinrichtung Heuristiken, welche eine erste Auswahl für eine Ergänzung festlegen, die zunächst dem Benutzer dargeboten wird. Auf der Grundlage dieser Heuristiken kann die erste Ergänzung hervorgehoben werden, und können mögliche Korrekturauswahlen dem Benutzer in der Reihenfolge ihrer Wahrscheinlichkeit dargeboten werden. Falls der Benutzer entscheidet, daß die hervorgehobene Ersetzung keinen Fehler enthält, kann er die Auswahl treffen, die hervorgehobene Ersetzung zu ignorieren, und zum nächsten hervorgehobenen Fehler überzugehen. Bei einer bevorzugten Ausführungsform kann ein Maximum von drei unterschiedlichen Orten in einem Satz hervorgehoben werden. Sobald der Benutzer einen Vorschlag akzeptiert, kann der Satz korrigiert werden, und kann der Benutzer zum nächsten hervorgehobenen Fehler übergehen.

Unter Einsatz dieser Vorgehensweise kann die Grammatiküberprüfungseinrichtung eine oder mehrere der folgenden Einrichtungen aufweisen: (a) ein Vorbearbeitungssatzfilter bei 203, (b) ein Modul, das nicht korrekte Kombinationen grammatischer Fälle in einem Satz bei 204 identifiziert, (c) Berechnung von Gruppen minimaler Lösungen bei 205, (d) Anordnen dieser Lösungen in einer Reihenfolge bei 206, oder (e) Durchführung einer komfortablen und dynamischen Präsentation für den Benutzer bei 202.

Ein Beispiel für ein Problem, das von der Grammatiküberprüfungseinrichtung behandelt wird, ist in Fig. 3 in Bezug auf ein Beispiel für einen deutschen Verbalsatzteil "Der Mann nennt der Richter einen Lügner" erläutert. Dieser Satz enthält nicht die Fallmarkierungen (Endungen), welche das Verb "nennt" erfordert. Darüber hinaus hat dieses Verb zwei Bedeutungen, nämlich (a) jemanden als etwas bezeichnen, und (b) jemandem den Namen oder die Bezeichnung von jemandem/etwas angeben. Jede dieser Bedeutungen erfordert eine unterschiedliche Kombination von grammatischen Fällen, die durch das Fallkorrekturmodul berücksichtigt wird. Infolge der flexiblen Wortreihenfolge im Deutschen ist es nicht sicher, welche der Ergänzungen eine Korrektur benötigt.

Jene Fälle, die von der Bedeutung (a) des Verbs "nennen" gefordert werden, sind:

- Nominativ (Subjekt)
- Akkusativ (für das Objekt, das mit einem Namen bezeichnet wird)
- Akkusativ (für den Namen, mit welchem das Objekt bezeichnet wird)

Da das Objekt, das mit einem Namen versehen wird, und der entsprechende Namen in einem Satz äquivalent sind, in welchem der Begriff "nennen" mit der Bedeutung (a) verwendet wird, weisen sie denselben Fall auf, da sie äquivalente Rollen teilen.

Jene Fälle, die bei der Bedeutung (b) des Verbs "nennen" erforderlich sind, sind folgende:

- Nominativ (Subjekt)
- Dativ (indirektes Objekt: Name von jemandem oder etwas, der bzw. das auf das nachstehende Objekt übertragen wird)
- Akkusativ (direktes Objekt: Empfänger der Information in Bezug auf das indirekte Objekt).

Im Englischen werden indirekte Objekte normalerweise durch eine Präposition eingeführt, beispielsweise in "The man gives the book to the child", wobei der Satzteil "to the child" ins Deutsche als "dem Kind" übersetzt wird, ohne eine Präposition. Die Fallmarkierung, die sich in dem Artikel "dem" widerspiegelt (im Gegensatz zu beispielsweise "das") stellt die einzige Anzeige dafür dar, welche "das Kind" in dem Satz spielen soll, nämlich daß das Kind den Empfänger des direkten Objekts (des Buches) darstellt.

In dem Beispiel für einen falschen Satz ergeben sich folgende Fälle:
Der Mann (Nominativ)
der Richter (Nominativ)
einen Lügner (Akkusativ)
wie dies bei 201 in Fig. 3 dargestellt ist.

Die Fallkombination in dem falschen Satz bei 201 entspricht nicht einer der beiden möglichen korrekten Fallkombinationen, die von der gewünschten Bedeutung abhängen, also (a) oder (b) dieses Satzes. Da die Grammatiküberprüfungseinrichtung keinen Zugriff auf die gewünschte Bedeutung des Verfassers hat, werden beide Bedeutungen von der Grammatiküberprüfungseinrichtung behandelt.

Die Grammatiküberprüfungseinrichtung erzeugt dann mögliche Fehlerkorrekturen bei der Überschreiberzeugung 206 mit einer minimalen oder einzelnen Korrektur ("→") für den Fall, wie dies bei 202 dargestellt ist:

1. Nominativ: Der Mann → Akkusativ: Den Mann
Nominativ: der Richter
Akkusativ: einen Lügner
2. Nominativ: Der Mann
Nominativ: der Richter → Akkusativ: den Richter
Akkusativ: einen Lügner
3. Nominativ: Der Mann → Dativ: Dem Mann
Nominativ: der Richter
Akkusativ: einen Lügner
4. Nominativ: Der Mann
Nominativ: der Richter → Dativ: dem Richter
Akkusativ: einen Lügner

Kein Versuch, die letzte Ergänzung "einen Lügner" vorzugeben, würde den Satz richtigstellen, da die beiden Nominative der ersten beiden Ergänzungen immer noch jeder möglichen Kombination grammatischer Fälle widersprechen würden. Es gibt vier Vorschläge für Ersetzungen, jedoch betreffen sie nur zwei Ergänzungen, so daß zwei unterschiedliche Vorschläge für jede der Nominativ-Ergänzungen vorhanden sind. Es ist vorzuziehen, sich daran zu erinnern, daß nur eine der Ergänzungen ersetzt werden muß, da der Satz zumindest eine Nominativ-Ergänzung aufweisen muß.

Bei einer bevorzugten Ausführungsform wird eine bevorzugte Reihenfolge zur Verfügung gestellt, in welcher die Ersetzungen dem Benutzer dargeboten werden. Die Entscheidung in Bezug auf die Reihenfolge erfolgt auf zwei Niveaus, nämlich (a) bezüglich der Reihenfolge, in welcher die beiden betroffenen Ergänzungen für den Benutzer hervorgehoben werden (markiert durch einen grünen Grammatikschnörkel) und (b) die Reihenfolge der Ersetzungsvorschläge, die dem Benutzer für jede Ergänzung vorgeschlagen werden können (sichtbar gemacht durch eine Betätigung der rechten Maus bei der hervorgehobenen Ergänzungszeichenkette). Die häufigste Wortreihenfolge im Deutschen ist jene, bei welcher die Nominativ-Ergänzung das erste Element in dem Satz ist. Daher ist die Nominativ-Ergänzung "der Mann" weniger wahrscheinlich, eine Korrektur zu benötigen, da sie das erste Element darstellt. Die andere Nominativ-Ergänzung "der Richter" ist verdächtiger, und wird dem Benutzer zuerst als möglicher Fehler angezeigt. Dies widerspricht der üblichen Grammatiküberprüfungssequenz von links nach rechts, und es wird zusätzliche Logik zur Implementierung verwendet. Dem Benutzer werden allerdings verdächtigere Auswahlen zuerst dargeboten, was dem Benutzer Zeit und Frustrationen ersparen kann. Die Reihenfolge der Präsentation von Fehlern ist daher heuristisch, und beruht auf der Erfahrung, welche Fehler bezüglich grammatischer Fälle am wahrscheinlichsten sind.

Die Präsentation von Vorschlägen für Ergänzungen wird allerdings nicht streng nur auf heuristischer Grundlage vorgenommen, da verschiedene Bedeutungen möglich sind, und die Grammatiküberprüfungseinrichtung keinen Zugriff auf die vom Benutzer angestrebte Bedeutung hat.

Die sich ergebende Reaktion auf die Grammatiküberprüfungseinrichtung auf den Eingangsfehlersatz kann beispielsweise folgendermaßen sein:

1. Ordne einen grünen Schnörkel unter "der Richter" an, mit folgenden beiden Überschreibungsvorschlägen: den Richter und dem Richter. Falls der Benutzer "ignorieren" auswählt, dann:
2. Ordne einen grünen Schnörkel unter "der Mann" an, mit den beiden Überschreibungsvorschlägen: den Mann und dem Mann.

Wenn der Benutzer den Vorschlag 1. akzeptiert, dann wird der Schritt 2. nicht aktiviert, das Akzeptieren des ersten Vorschlages den Satz korrigiert.

Der Fallkorrekturcode kann drei Hauptbestandteile umfassen: (a) den Filter 203 für verdächtige Sätze, (b) die Fehlerfeststellung 204, (c) die Zielfallberechnung und Anordnung in einer Reihenfolge 205, und (d) die Überschreibungserzeugung (Ersetzungserzeugung) 206.

Der Filter 203 für verdächtige Sätze identifiziert korrekte Sätze, die leicht mit Sätzen verwechselt werden können, die einen Fehler in Bezug auf den grammatischen Fall enthalten, und ist in einem Modul implementiert, welches als Funktion bezeichnet wird: susp_parse (segrec seg). Diese Funktion empfängt einen Satz (oder Teile eines Satzes) und berechnet Bestrafungswerte durch Zuordnung von Bestrafungspunkten zu "verdächtigen" Eigenschaften, die sich in dem Satz auffinden lassen. Diese Bestrafungspunkte können zueinander addiert werden, um Rückkehrwerte zur Verfügung zu stellen, die dazu fähig sind, die Grammatiküberprüfungseinrichtung dagegen zu sperren, bestimmte Fehlerklassen zu überprüfen, insbesondere solche, die eine verläßliche Satzstruktur benötigen, um mit ihnen arbeiten zu können. Es kann mit zahlreichen einzelnen bekannten Problemen, Schwierigkeiten, Mehrdeutigkeiten fertig werden, und arbeitet daher wie ein Steuerfeld, mit welchem die Abdeckung eingegebener Sätze individuell geregelt werden kann. Abhängig davon, wie gut die gesamte Grammatiküberprüfungseinrichtung für die deutsche Sprache bestimmte Probleme behandeln kann, können Strafzuordnungen eingestellt werden, wenn eine erhöhte Erfahrung bei anderen Modulen der Grammatiküberprüfungseinrichtung auf heuristischer Grundlage erhalten wird.

Fig. 4 erläutert ein Flußdiagramm der Fehlerfeststellung 300. In Fig. 4 beginnt der Verfahrensablauf mit einer falschen Benutzereingabe 301, die allgemein der falschen Eingabe 200 in Fig. 3 entspricht.

Der Satz oder der Satzteil mit dem Verb wird bei der Analysemaschine 302 analysiert, welche allgemein der Analysemaschine 210 von Fig. 3 entspricht. Der Satzteil mit dem Verb wird dann an den Filter 304 für verdächtige Sätze übertragen, welche allgemein dem Satzfilter 203 in Fig. 3 entspricht. Dann werden Verben enthaltene Satzteile, die nicht verdächtig sind, an die Fehlererfassung 300 übertragen, beginnend bei 306.

Als Teil der Fehlererfassung 300 identifiziert eine Identifizierungsroutine 308 das Element "nennt", welches eine bestimmte Fallkombination erfordert. Eine Identifizierungsroutine 310 identifiziert sämtliche Ergänzungen, welche die Anforderungen dieses Elements erfüllen können. Bei einfachen Beispielen ist das Element, welches die Umgebung des grammatisches Falles erfordert, gewöhnlich das Hauptverb eines Satzes, und stellen die Träger des grammatischen Falles die Gruppen von Substantiven um dieses herum dar. Beispiel: "Der Mann gibt der Frau ein neues Buch".
gibt = ein Verb, das bei 308 identifiziert wird, und Fallergänzungen in Bezug auf den Nominativ, den Dativ und den Akkusativ erfordert
Der Mann = Gruppe von Substantiven im Nominativ (Ergänzung), identifiziert bei 310.
der Frau = Substantivgruppe im Dativ (Ergänzung), identifiziert bei 310.
ein neues Buch = Substantivgruppe im Akkusativ (Ergänzung), identifiziert bei 310.

Da nicht alle Satzstrukturen so einfach sind, ermittelt eine spezielle Funktionsliste {segrec} find_args (segrec seg) bei 310 jene Elemente, die einen Fall benötigen, und sämtliche Ergänzungen (oder Argumente), die zum Umfang dieses Elements gehören. Die Funktion: list {segrec} find_args (segrec seg) nimmt den eingegebenen Satz an, und schickt die Liste von Argumenten (also Ergänzungen) zurück, welche die korrekte Fallkombination benötigen, bei 310. Diese spezielle Funktion bei 310 hilft dabei, das Hauptverb von Hilfsverben zu unterscheiden, identifiziert Unterfälle, welche die Rolle einer Gruppe von Nicht-Substantiven einnehmen können, und fügt sie der Rückkehrliste hinzu, statt der Ergänzung für ein Substantiv. Bei koordinierten Strukturen mit gemeinsam genutzten Subjekten fügt sie den einen Nominativ enthaltenden Satz der Rückkehrliste jedes koordinierten Untersatzes hinzu.

Zum Beispiel: "Der Mann gibt der Frau ein neues Buch und [der Mann] kauft dem Kind ein Eis".

In Sätzen, die normalerweise kein explizites Subjekt enthalten (beispielsweise Befehlssätze wie "Gib mir das Buch!") arbeitet die spezielle Funktion bei 310 so, daß sie zeitweilig ein Scheinsubjekt (virtuell oder impliziert) der Rückkehrliste hinzufügt, so daß dieselben Regeln bei derartigen Sätzen angewendet werden können wie bei Sätzen, die ein Subjekt aufweisen. Hierdurch wird vermiedene, doppelt so viele Codes zu verwenden, um sämtliche Tests für die Fehlerfeststellung und die Zielfallberechnung bei beiden Arten von Sätzen anzuwenden. Diese spezielle Funktion bei 310 befaßt sich auch mit verschiedenen grammatischen Ausnahmen und berücksichtigt Fehler der grammatischen Analyse (also fehlerhaft analysierte Satzstrukturen).

Bei einige Szenarien ist es nicht das Verb, das das wesentliche Element darstellt, das einen grammatischen Fall benötigt, sondern ein Adjektiv. Es ist vorzuziehen, erkennen zu können, wann ein Adjektiv die Fähigkeit hat, den Anforderungen an einen grammatischen Fall eines Hauptverbs vorzugeben, da andererseits die Möglichkeit besteht, daß fehlerhaft ein korrekter Satz als nicht korrekt markiert wird. Zum Beispiel: "Das Pferd ist dem Mann zu teuer". Das Hauptverb dieses Satzes ist "ist", welches normalerweise zwei Nominative benötigt (wie in: "Das Pferd ist (=) ein Sieger". Beim ersten Beispiel, ist es jedoch das vergleichende Adjektiv "zu teuer", welches die Dativergänzung ("dem Mann") gestattet. Würde man schließlich erkennen, müßte man "dem Mann" markieren, und "der Mann" offerieren, wodurch ein korrekter Satz falsch würde.

Adjektive, die einen bestimmten Fall erfordern, können entsprechend im Lexikon markiert werden. Allerdings gibt es mehr Adjektive, die einen unterschiedlichen Fall zulassen, als das Verb erfordern würde, und tritt es manchmal auf, daß ein Adjektiv fehlerhaft als Adverb interpretiert wird. Um mit derartigen Problemen fertig zu werden, ist eine spezielle Funktion adj_case bei 312 vorgesehen, welche Fälle identifiziert, die infolge des Vorhandenseins von Adjektiven und Adverbien unzulässig sind: Function: atom adj_case (segrec seg), welche den eingegebenen Satz empfängt, und ein Atom zurückgibt, welches den Fall bzw. die Fälle angibt, welche die Anforderungen des Hauptverbs an den grammatischen Fall überschreiben können.

Im Deutschen ist es nicht immer klar, ob die Partizipperfektform eines Verbums als Hauptverb oder als Adjektiv analysiert werden sollte. Die Fehlererfassungskomponente identifiziert Partizipperfekte, die als Adjektive analysiert wurden, und verwendet die Anforderungen an den grammatischen Fall ihrer Verbleseform, um die korrekte Falleinstellung zu ermitteln, die zur Verbform paßt.

Eine Eigenschaft der deutschen Sprache stellt eine besondere Herausforderung in Bezug auf die Handhabung ihrer grammatischen Geschlechter dar: die Verwendung des "freien" Dativs. Dies stellt eine Dativergänzung dar, die nicht von irgendeinem Element in dem Satz gefordert wird, sondern häufig grammatisch zulässig ist. Allerdings ist sie nicht immer zulässig, so daß Szenarien festgelegt wurden, in denen das Vorhandensein der Dativergänzung nicht als Fehler markiert wird.

Eine Liste von Ausnahmen kann bei 314 eingeschlossen werden, die dazu beiträgt, Wörter und Umstände zu identifizieren, die eine spezielle Handhabung von Erfordernissen grammatischer Fälle benötigen.

Da eine unendliche Anzahl an möglichen falschen Szenarien vorhanden ist, enthält die Fehlererfassungskomponente 316 eine große Gruppe korrekter Fallkombinationen, mit welchen die Benutzereingabe verglichen wird. Falls keine Anpassung in Bezug auf ein korrektes Szenarium vorhanden ist, wird ein Fehler angenommen, und wird die Zielfallberechnung aufgerufen.

Die Tatsache, daß ein Element, welches ein bestimmtes Fallszenarium erfordert, verschiedene Bedeutungen aufweisen kann, läßt es bevorzugen, die Information aufzuteilen, die zu jeder Bedeutung gehört, und einen Schleifendurchlauf durchzuführen, damit man nur mit der Information in Bezug auf die Anforderungen des einzelnen Falls tätig werden muß. Diese Schleife ist schematisch dargestellt, beginnend bei 320, und ist auch bei 211 in Fig. 3 dargestellt. Entsprechendes gilt für Substantivgruppen, die mehr als einen Fall aufweisen können (beispielsweise "das Kind", entweder Nominativ oder Akkusativ). Derartige Ergänzungen können nur einen der Fälle in der Rolle benutzen, die sie in dem Satz spielen, jedoch ist es unvermeidlich klar, welche Ergänzung geeignet ist. Zur Klarstellung, und insbesondere zur Berechnung einer korrekten Zielfallkombination ist es vorzuziehen, die Permutationen der Zuordnungen gleicher Fälle zu durchlaufen. Diese Schleife ist bei 212 in Fig. 3 dargestellt.

Eine spezielle Herausforderung stellen passive und infinitivische Sätze dar. Letzere sind äußerst unbestimmt in ihrer Struktur. Es ist vorzuziehen, sämtliche Komponenten zu identifizieren, die potentiell zu diesem Satzteil gehören (da sie sich auf einem Niveau befinden können, das von innerhalb des infinitivischen Satzes nicht zugreifbar ist).

Die passiven Sätze weisen normalerweise unterschiedliche Anforderungen an den grammatischen Fall auf als ihre Indikativ-Gegenstücke. Die richtige Übersetzung von Indikativ-Fallszenarien in passive wurde bei 316 nur begrenzt durchgeführt, infolge der Komplexizität des Problems.

Fig. 5 zeigt ein Flußdiagramm 400 eines Zielfallberechnungsvorgangs.

Die Zielfallberechnung wird durch eine Funktion durchgeführt, die bezeichnet ist als: list ({segrec} get_case (segrec seg, segrec verb, list {segrec} arglist). Die Funktion get_case wird bei 402 gestartet. Der Rückkehrwert ist eine Liste von "Segmentdatensätzen", also Datensätzen, welche Satzelemente beschreiben (im vorliegenden Fall: die Gruppen ohne Substantiva oder Ergänzungen). Diese Liste enthält die in Bezug auf den grammatischen Fall eingestellten Datensätze ohne Substantiv, die als Vorschläge für die Ersetzung dem Benutzer dargeboten werden. Segrec seg ist ein Datensatz, der den eingegebenen Satz enthält. Segrec verb ist in der Liste enthalten, und stellt das Verb dar, das die Zielfallanforderungsinformation enthält. List {segrec} arglist ist eine Liste von Argumenten, also von Datensätzen ohne Substantiv, die durch die find_args-function identifiziert wurden.

Diese Zielfallfunktion geht durch eine entsprechende Gruppe von Szenarien hindurch wie die Fehlererfassungskomponente (Fig. 4), um eine korrekte Gruppe von Fällen in der Liste der Ergänzungen bei 416 zu erzeugen. Allerdings sind die Szenarien bei der Zielfallberechnung 400 erheblich stärker eingeschränkt, da ein höchstens zulässiges Szenarium nicht unbedingt jenes ist, das als Ergänzung angeboten werden sollte. Daher konzentriert man sich auf striktere Anforderungen, die durch die Änderungen erfüllt werden, die vorgeschlagen werden.

Ein Teil der Zielfallberechnung 400 stellt die Verifizierung der Übereinstimmung von Subjekt/Verb und Anzahl/Person bei 408 dar. Wenn beispielsweise zwei mögliche Nominativ- Ergänzungen vorhanden sind, jedoch nur eine von diesen dieselbe Anzahl und Person mit dem Subjekt teilt, dann würde man nicht wünschen, den einzigen passenden Nominativ durch irgendeinen anderen grammatischen Fall zu ersetzen. Nominativ-Ergänzungen müssen mit dem Verb übereinstimmen. Falls die Grammatiküberprüfungseinrichtung einen unterschiedlichen Fall für die einzig übereinstimmende Substantivgruppe im Nominativ vorschlägt, oder wenn die Grammatiküberprüfungseinrichtung versucht, eine Nominativ- Überschreibung für eine Pluralergänzung vorzuschlagen, während das Verb im Singular ist, würde die Grammatiküberprüfungseinrichtung in beiden Fällen einen neuen Fehler erzeugen. Die Überprüfung auf eine Übereinstimmung von Subjekt und Verb bei 408 trägt daher zur Zielfallberechnung für neue Vorschläge bei.

Da die Grammatiküberprüfungseinrichtung vorzugsweise nicht einen Satz korrigiert, der mehr als einen Fehler in Bezug auf einen grammatischen Fall enthält, also Sätze, die nicht durch Ersetzung richtig gestellt werden können, wurden behandelbare Fehlerszenarien in der Zielfallfunktion 400 definiert. Diese Definitionen sind nicht so spezifisch wie die Definitionen für korrekte Fälle in dem Fehlererfassungsteil, unterstützen jedoch die Vermeidung des Versuchs, unvollständige oder nicht korrekte Empfehlungen zu geben. Darüber hinaus stellen sie eine Grundlage für die Reihenfolge heuristischer Maßnahmen dar, was es dem Programm gestattet, festzustellen, in welcher Reihenfolge die Ergänzungen durch die Funktion zurückgeschickt werden können. Diese Reihenfolge ist jene, die dann dem Benutzer angezeigt wird.

Eine umfangreiche Behandlung grammatischer Ausnahme ist dazu dienlich, die Möglichkeiten für Ersetzungen auf nur die erforderlichen zu beschränken. Vorzugsweise sollte man sich über die Korrektur sicher sein, die dem Benutzer angeboten wird. Wenn keine bestimmte Empfehlung bei 410 berechnet werden kann, wird die Funktion mit einer leeren Liste bei 412 verlassen, was das Fallkorrekturgerät dazu zwingt, anzuhalten oder weitere Berechnungen bei 414 zu sperren. Dies stellt nicht nur eine Sicherheitsmaßnahme für unbestätigte Korrekturen dar, sondern auch eine zusätzliche Art und Weise, die fehlerhafte Markierung korrekter Eingaben zu vermeiden. Wenn aus irgendeinem Grund ein korrekter Satz nicht zu einer der definierten, korrekten Fallumgebungen paßt (der Satz kann stark elliptisch sein, falsch grammatisch analysiert worden sein, oder einen sehr seltenen Aufbau verwenden), wird immer noch keine Ergänzung in dem Satz hervorgehoben, es sei denn, daß es einem Vorschlag für eine Ersetzung gelingt, die strengen Anforderungen zu erfüllen, die in der Funktion get_case_function definiert wurden.

Die Zielfallberechnung ist sehr kompliziert, da sie nicht einfach die Liste der Ergänzungen durchlaufen kann, und sämtliche (mathematisch) möglichen Kombinationen von Fällen zuordnen kann. Um die beste Rangreihenfolgeheuristik zu bestimmen ist es vorzuziehen, die exakte Positionierung jeder Ergänzung in dem Satz zu kennen (in Bezug aufeinander).

Die Zugänglichkeit der konkreten Ergänzungen macht es einfach, eine weitere Feinabstimmung von Ersetzungsbedingungen vorzunehmen, unter Berücksichtigung semantischer Aspekte (was momentan nur auf einem grundlegenden Niveau erfolgt).

Dieselben Ergebnisse, welche get_case berechnet, werden auch von der Komponente 207 in Fig. 3 verwendet, welche NP-Nichtübereinstimmungsfehler behandelt (also fehlende Übereinstimmung innerhalb einer Substantivgruppe (NP)). Da in derartigen Fällen nicht die Frage ist, welche Ergänzung eine Ersetzung benötigt, sondern nur, welche Fälle dabei hilfreich sind, eine gut gebildete NP in dem Zusammenhang des Umgebungssatzes vorzuschlagen, benötigt die NP-Nichtübereinstimmungskomponente einen unterschiedlichen Rückkehrwert als die Fallkorrekturkomponente. Daher wird eine Einkapselungsfunktion verwendet: Function: list {atom} get_case 2 (segrec seg). Diese Funktion nimmt die nicht übereinstimmende NP als Eingangsgröße, und findet die Umgebung, in welcher die nicht übereinstimmende NP die Zuordnung eines geeigneten Falles erfordert, sowie das den Fall bestimmende Verb. Mit dieser Information werden alle Argumente verfügbar, welche die Funktion get_case benötigt, und kann sie dazu berechnet werden, die möglichen Zielfälle für unsere nicht passende NP zu berechnen (einige zusätzliche Funktionen werden in get_case für die nicht passende Information bei der nicht passenden Ergänzung verwendet, jedoch sind abgesehen davon alle grundlegenden Überprüfungen ebenfalls anwendbar). Die Datensatzliste, die durch get_case zurückgeschickt wird, wird dann in einen geeigneteren Rückkehrwert für die NP-Nichtübereinstimmungskomponente übersetzt: Eine Liste von Atomen (= zeichenkettenartiger Datentyp), welche den Zielfall bzw. die Zielfälle repräsentieren, die für das Überschreiben der nicht übereinstimmenden NP möglich sind.

Obwohl die Abdeckung für die Fallkorrektur selbst niedriger für komplizierte Eingaben ist, die zu Beginn herausgefiltert würden, ist die Abdeckung für NP-Nichtübereinstimmungsfehler recht hoch, was als weiterer Beleg dafür angesehen werden kann, daß die Fallberechnungsergebnisse eine hohe Erfolgsrate aufweisen.

Fig. 6 erläutert ein Flußdiagramm 500 der Überschreibungserzeugung. Das Ergebnis der Funktion get_case (NP-Liste) 502 wird an eine Komponente weitergeleitet, welche die erforderlichen Einstellungen bei jedem Element der Listenelemente (also Substantivgruppen) vornimmt, und welche die Anzeige mehrerer Ersetzungsvorschläge für Listenelemente steuert.

Die Komponente durchläuft die NP-Liste, und durchläuft für jedes Listenelement (Substantivgruppe) durch jedes Element, das die Substantivgruppe enthält.

Beispielsweise ist "das neue Buch" eine Substantivgruppe, die Teil der NP-Liste sein könnte. Sie enthält ein Bestimmungswort (Artikel) "das", ein Adjektiv "neue", und ein Substantiv "Buch".

Jedem dieser Elemente muß ein neuer Zielfall zugeordnet werden, der von get_case als eine der Anmerkungen zu dem Datensatz "das neue Buch" übertragen wurde. In einigen Situationen ist die Anzahl und das grammatische Geschlecht einer Substantivgruppe nicht eindeutig. Beispielsweise könnte "Angestellten" die Pluralform von "Angestellte" (sämtliche Fälle) sein, die Dativ- oder Genitiv-Singularform für eine weibliche "Angestellte", oder die Akkusativ-Singularform für einen männlichen "Angestellten". Wenn ein vorheriger Fallfehler vorhanden ist, muß möglicherweise mehr als ein grammatisches Geschlecht bei der Überschreibung überlegt werden. Daher durchläuft die Fallzuordnungsprozedur folgendes:

- jede Substantivgruppe in der NP-Liste bei 502
- jede Anzahl der Substantivgruppe (das Verb gibt die Zielanzahl vor, es sei denn, der Zielfall ist der Nominativ) bei 504
- jedes grammatische Geschlecht der Substantivgruppe bei 506, und
- jedes Element, das die Substantivgruppe enthält, bei 508.

Der eingestellte Substantivgruppendatensatz erhält dann ein Attribut oder einen Fall bei 510 zugeordnet, der die exakten Ersetzungsbefehle enthält. Die Schritte 508, 506, 504, 510 in Fig. 6 entsprechen allgemein den vier verschachtelten Schleifen 212 in Fig. 3.

Dieses Ersetzungsattribut nimmt eine Liste möglicher Ersetzungen als einen Wert. Die erste berechnete Ersetzung wird bei 512 addiert, und bei 514 ganz oben bei einer Liste möglicher mehrerer Vorschläge angezeigt. Wenn ein Ersetzungsattribut bereits im Datensatz vorhanden ist, dann werden die weiteren Elemente in der Ersetzungsliste als alternative Ersetzung markiert, so daß sie nicht einen neuen Hervorhebungsschnörkel auslösen, sondern unterhalb des ersten Ersetzungsvorschlags in einem Herunterfallmenue auftauchen.

Wie voranstehend geschildert durchläuft das Fehlererfassungsmodul (welches die Funktion get case aufruft) unterschiedliche Verbalfallumfänge und ebenso zweifelhafte Fallzuordnungen zu Substantivgruppen. Daher kann die Funktion get case mehrfach aufgerufen werden, und mehrere Listen zurückschicken, welche Datensätze erhalten, die ersetzt werden sollten. Es ist möglich, daß eine Ergänzung in der Liste mit derselben neuen Fallzuordnung enthalten ist, die sie bereits in einer früheren Liste hatte, die durch die Überschreibungserzeugung geschickt wurde. Daher wird jede eingestellte Ergänzung in einer Speicherliste gespeichert, mit welcher neue Listenelemente verglichen werden. Auf diese Weise bietet das Programm nicht nur einen Schutz gegen die redundante Wiederholung von Überschreibungsvorschlägen, sondern bietet auch bessere Leistungen, nämlich durch Herausfiltern dessen, was nicht die Fallzuordnungsleistung durchlaufen muß. Alternative Ersetzungsvorschläge können immer noch hinzugefügt werden, selbst nach einer Anzahl von Schleifen von get_case. Die Zuordnung des Ersetzungsattributs ist mit der Position des Datensatzes in dem Satz verbunden, und daher werden alternative Ersetzungen vorzugsweise korrekt als solche erkannt, und zur entsprechenden Liste hinzugefügt.

Der Grund dafür, daß Ersetzungen nur für Satzelemente vorgeschlagen werden, obwohl der Fehler in der Fallkombination eines gesamten Satzes auftreten kann, ist folgender: deutsche Sätze sind häufig relativ lang. Es verbessert die Klarheit des grammatischen Problems, wenn man versucht, den minimalen Fehlerort anzugeben und hervorzuheben, selbst wenn mehr als ein sich gegenseitig ausschließender Fehlerort vorhanden ist. Das Szenario, welches den gesamten Satz ersetzen würde, wäre nicht ausreichend anwendbar, da eine Implementierung für die Praxis die Anzahl an Überschreibungen, die dem Benutzer angeboten werden, auf nur drei begrenzt. Bei unserem ursprünglichen Beispiel würde ein Überschreiben des gesamten Satzes die Anzeige von vier Ersetzungsvorschlägen erfordern:

- Der Mann nennt den Richter einen Lügner.
- Der Mann nennt dem Richter einen Lügner.
- Den Mann nennt den Richter einen Lügner.
- Dem Mann nennt den Richter einen Lügner.

Bei einem Szenario, bei welchem man Ersetzungsvorschläge für alle drei Ergänzungen (immer noch eine zur Zeit) und zwei Verbalfallmöglichkeiten hätte, würde die Anzahl auf neun Vorschläge ansteigen. Insbesondere bei langen Sätzen wäre es erheblich unbequemer für den Benutzer, sich durch sämtliche Beispiele hindurchzulesen, wenn alle gleichzeitig angeboten würden. Durch die Begrenzung in der Praxis, dem Benutzer nur drei Vorschläge anzubieten, könnte der korrekte Vorschlag verfehlt werden, wenn nur drei der neun Möglichkeiten angezeigt würden.

Fig. 7 zeigt ein Blockschaltbild eines zweiten Beispiels für eine Grammatiküberprüfungsschaltung.

In Fig. 7 weist eine Grammatiküberprüfungsschaltung eine Stromversorgungs- und Sequenzierschaltung 104 auf, welche die Versorgung und die Sequenzierung des Betriebs anderer Schaltungselemente übernimmt. Die Schaltung in Fig. 7 implementiert einen Vorgang wie jenen, der in den Fig. 3 bis 6 gezeigt ist, in einer Computerumgebung, beispielsweise jener, die in Fig. 2 gezeigt ist. Die Speicherschaltung 110 speichert eine Wordprocessordatei, welche Textsätze und Textformatierung enthält. Die Speicherschaltung 110 stellt die Textsätze über den Datenbus 112 der Speicherschaltung 114 zur Verfügung. Die Speicherschaltung 114 speichert die Sätze als Liste von Sätzen, so daß Sätze bequem einzeln als Eingangsdaten für Grammatikuntersuchungen in anderen Schaltungen ausgewählt werden können. Die Speicherschaltung 114 stellt Sätze hintereinander, und zwar jeweils einen zur Zeit, über den Datenbus 118 der Grammatikanalyseschaltung 120 zur Verfügung. Die Grammatikanalyseschaltung 120 führt eine grammatische Analyse eines Textsatzes in Verbalsatzteile durch. Bei der Durchführung des Grammatikanalysevorgangs greift die Grammatikanalyseschaltung 120 auf grammatische Information zu, die in dem Satz benutzte Wörter betrifft, über den Bus 130, aus einem detaillierten Lexikon, das in der Speicherschaltung 148 gespeichert ist. Die Grammatikanalyseschaltung 120 nimmt auch einen Zugriff auf üblicherweise verwendete idiomatische Information über den Bus 132 in einer Liste von Sprachheuristiken durch, die in der Schaltung 152 gespeichert ist. Die Grammatikanalyseschaltung 120 stellt Verbalsatzteile hintereinander, jeweils einen zur Zeit, über den Datenbus 128 einer Speicherschaltung 134 zur Verfügung, welche die Verbalsatzteile speichert. Die Grammatikanalyseschaltung 120 wird so getriggert oder gesteuert, daß sie Verbalsatzteile zur Verfügung stellt, durch ein Triggersignal, das auf der Leitung 122 von einer Zielfallberechnungsvorrichtung 138 empfangen wird, oder kann durch ein Triggersignal getriggert werden, das auf der Leitung 124 von der Tastatur 164 empfangen wird. Wenn ein Verbalsatzteil grammatisch überprüft wurde, und sich der Satzteil als grammatisch korrekt herausstellte, dann wird der Trigger entlang der Leitung 122 zur Verfügung gestellt. Stellt sich bei dem Satzteil heraus, daß er grammatisch nicht korrekt ist, dann wartet die Grammatikanalyseeinrichtung auf einen Trigger von der Tastatur 164. Wenn die Grammatikanalyseschaltung 120 keine neuen Satzteile hat, die sie auf dem Bus 128 zur Verfügung stellen kann, dann stellt die Grammatikanalyseschaltung 120 einen Trigger über die Leitung 116 der Speicherschaltung 114 zur Verfügung, damit der nächste Satz in der Folge, der grammatisch untersucht werden soll, bereitgestellt wird.

Die Zielfallberechnungsschaltung 138 identifiziert das Verb des Verbalsatzteils, der über den Bus 136 empfangen wurde. Das identifizierte Verb wird über die Leitung 144 dem Lexikon zugeführt, das in der Schaltung 148 gespeichert ist. Das Lexikon stellt Daten über die Leitung 146 zur Verfügung, welche die grammatisch korrekten Kombinationen von Fällen anzeigen, die bei dem identifizierten Verb möglich sind. Die Zielfallberechnungsschaltung 138 vergleicht die grammatisch korrekten Kombinationen von Fällen mit jener Kombination von Fällen in dem Verbalsatzteil, der vom Bus 136 empfangen wurde. Ist der Verbalsatzteil grammatisch korrekt, dann ist keine weitere Maßnahme erforderlich, und dann wird der Verbalsatzteil aus der Zielfallberechnungsschaltung gelöscht, und wird ein Ausgangssignal bei 140 bereitgestellt, um einen Trigger über die Leitung 122 für die Grammatikanalyseschaltung 120 bereitzustellen, damit diese den nächsten Verbalsatzteil bereitstellt. Wenn andererseits der Satzteil grammatisch nicht korrekt ist, dann wird der nicht korrekte Satzteil auf dem Bus 142 zusammen mit den möglichen Kombinationen von Korrekturen der grammatischen Fallendung der Sprachheuristikschaltung 152 zur Verfügung gestellt. Die Sprachheuristikschaltung 152 berücksichtigt die Wortreihenfolge, die in dem Satz verwendet wird, und wählt die beiden wahrscheinlichsten Korrekturen aus. Der nicht korrekte Satzteil und die beiden wahrscheinlichsten Korrekturen werden über den Bus 154 der Anzeige 156 zur Verfügung gestellt. Die Anzeige 156 zeigt einen Abschnitt der ursprünglichen Wordprocessordatei an, die von dem Bus 106 empfangen wurde, hebt den nicht korrekten Satzteil hervor, sowie die beiden wahrscheinlichsten Korrekturen, die vom Bus 154 empfangen wurden. Die Anzeige 156 wird von einem Benutzer 160 entlang einer Betrachtungslinie 158 betrachtet. Der Benutzer 160, der Zugriff auf die angestrebte Bedeutung aus dem Kontext der ursprünglichen Wordprocessordatei hat, nimmt eine Betätigung 162 der Tastatur 164 vor, um entweder eine der Korrekturen auszuwählen, andere Korrekturen vorzunehmen, oder keine Korrekturen vorzunehmen. Die Änderungen werden über die Leitung 108 übertragen, um die Wordprocessordatei zu ändern oder zu korrigieren, die in der Schaltung 110 gespeichert ist.

Der momentan ausgewählte Satz wird auf der Leitung 126 angezeigt, so daß die Anzeige 156 den entsprechenden Abschnitt der Wordprocessordatei anzeigt.

Wie dies in den Fig. 1 bis 7 dargestellt ist, werden ein Verfahren und eine Einrichtung zur Grammatiküberprüfung eines Satzes in der deutschen Sprache beschrieben. Die Grammatiküberprüfungseinrichtung führt eine Grammatikanalyse des Satzes in einen Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination durch, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung nimmt einen Zugriff auf eine Morphologietabelle vor, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist. Die Grammatiküberprüfungseinrichtung nimmt einen Zugriff auf ein Lexikon vor, um eine korrekte Fallkombination zu definieren, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche Fallkombination mit der korrekten grammatischen Fallkombination, und erzeugt eine Fallfehlerkombination. Die Grammatiküberprüfungseinrichtung erzeugt eine Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, welche die Fallfehlerkombination korrigiert.

Zwar wurde die vorliegende Erfindung unter Bezugnahme auf bevorzugte Ausführungsformen beschrieben, jedoch werden Fachleute auf diesem Gebiet erkennen, daß sich Änderungen in Bezug auf die Form und Einzelheiten vornehmen lassen, ohne vom Wesen und Umfang der Erfindung abzuweichen.

Claims

1. Computerisiertes Verfahren der Grammatiküberprüfung eines Satzes in der deutschen Sprache, mit folgenden Schritten:
grammatische Analyse des Satzes in einen Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination, die dem Verbsatzteil zugeordnet ist;
Zugriff auf eine Morphologietabelle, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
Zugriff auf ein Lexikon zur Definition einer korrekten Fallkombination, die dem Verbsatzteil zugeordnet ist;
Vergleichen der ursprünglichen Fallkombination mit der korrekten Fallkombination, und Erzeugung einer Fallfehlerkombination; und
Erzeugung einer Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.

2. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.

3. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Begrenzung der Anzahl an Satzüberschreibungen, die dargeboten werden, auf nicht mehr als drei Überschreibungen pro Substantivsatzteil.

4. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Einschließen eines Subjekts und jedes direkten Objekts und jedes indirekten Objekts, die dem Verbsatzteil zugeordnet sind, in die korrekte Fallkombination.

5. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Erzeugung der Fallfehlerkombination ohne Zugriff auf die Bedeutung des Satzes.

6. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Einschließen von Korrekturen bei den Fallendungen von Bestimmungswörtern, Adjektiven und Substantiven in dem Substantivsatzteil in die Satzüberschreibungen.

7. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, bei welchem der Satz in der deutschen Sprache ein implizites Subjekt aufweist, und weiterhin vorgesehen ist:
Einfügen eines Scheinsubjekts in die ursprüngliche Substantivsatzteilkombination, um den Vergleich zu erleichtern.

8. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Herausfiltern jedes Satzes mit einer verdächtig komplizierten Kombination vor dem Vergleich.

9. Computerisiertes Verfahren der Grammatiküberprüfung nach Anspruch 1, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
Feststellung einer Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich.

10. Computerisierte Grammatiküberprüfungseinrichtung für einen Satz in der deutschen Sprache, wobei vorgesehen sind:
ein Lexikon und eine Morphologietabelle, die auf einen computerlesbaren Medium gespeichert sind;
eine Satzanalysemaschine, welche den Satz empfängt, und eine durch grammatische Analyse erhaltene ursprüngliche Substantivsatzteilkombination und einen Verbsatzteil erzeugt, wobei die Satzanalysemaschine Zugriff auf die Morphologietabelle nimmt, und eine Anfangsfallkombination zur Verfügung stellt, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
eine Fehlerdetektorfunktion, die einen Zugriff auf das Lexikon durchführt, und eine korrekte Fallkombination erzeugt, welche dem Verbsatzteil zugeordnet ist; wobei die Fehlerdetektorfunktion die ursprüngliche Fallkombination mit der korrekten Fallkombination vergleicht, und eine Fallfehlerkombination erzeugt;
eine Zielfallberechnungsfunktion, die eine Kombination von Satzüberschreibungen erzeugt, welche die Änderung des grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.

11. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
eine Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten bis zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.

12. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
eine Anzeige von Satzüberschreibungen, die auf nicht mehr als drei Überschreibungen pro Substantivsatzteil begrenzt ist.

13. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß die korrekte Fallkombination umfaßt:
ein Subjekt und jedes direkte Objekt und jedes indirekte Objekt, die dem Verbsatzteil zugeordnet sind.

14. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß die Fallkombination ohne Zugriff auf die Bedeutung des Satzes erzeugt wird.

15. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß die Satzüberschreibungen Korrekturen zu den Fallendungen von Bestimmungswörtern, Adjektiven und Substantiven in dem Substantivsatzteil enthalten.

16. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß der Satz in der deutschen Sprache ein implizites Subjekt hat, und die durch grammatische Analyse erhaltene ursprüngliche Substantivsatzteilkombination umfaßt:
ein Scheinsubjekt, das in die ursprüngliche Substantivsatzteilkombination eingefügt wird, um den Vergleich zu erleichtern.

17. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
ein Filter, das jeden Satz mit einer verdächtig komplizierten Kombination vor dem Vergleich herausfiltert.

18. Computerisierte Grammatiküberprüfungseinrichtung nach Anspruch 10, dadurch gekennzeichnet, daß weiterhin vorgesehen ist:
ein Detektor für eine Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich, wenn eine Nichtübereinstimmung des Substantivsatzteils vorhanden ist.