DE10120262A1 - Feststellung und Korrektur von Fehlern bei grammatikalischen Fällen im Deutschen - Google Patents
Feststellung und Korrektur von Fehlern bei grammatikalischen Fällen im DeutschenInfo
- Publication number
- DE10120262A1 DE10120262A1 DE10120262A DE10120262A DE10120262A1 DE 10120262 A1 DE10120262 A1 DE 10120262A1 DE 10120262 A DE10120262 A DE 10120262A DE 10120262 A DE10120262 A DE 10120262A DE 10120262 A1 DE10120262 A1 DE 10120262A1
- Authority
- DE
- Germany
- Prior art keywords
- sentence
- combination
- case
- grammar
- grammatical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
Abstract
Es werden ein Verfahren und eine Einrichtung zur Grammatiküberprüfung eines Satzes in der deutschen Sprache vorgeschlagen. Die Grammatiküberprüfungseinrichtung führt eine grammatische Analyse des Satzes in einem Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination durch, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung führt einen Zugriff auf eine Morphologietabelle durch, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist. Die Grammatiküberprüfungseinrichtung führt einen Zugriff auf ein Lexikon durch, um eine korrekte Fallkombination zu definieren, welche dem Verbsatzteil zugeordnet ist. Die Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche Fallkombination mit der korrekten grammatischen Fallkombination, und erzeugt eine Fallfehlerkombination. Die Grammatiküberprüfungseinrichtung erzeugt eine Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.
Description
Die vorliegende Anmeldung beansprucht die Priorität der
provisorischen US-Anmeldung 60/242,320 mit dem Titel
Detection & Correction of Errors in German Grammatical Case,
die am 20. Oktober 2000 eingereicht wurde.
Textverarbeitungscomputeranwendungen, beispielsweise
Wortprozessor- und E-Mail-Anwendungen, verwenden
Grammatiküberprüfungsmodule. Ein Grammatiküberprüfungsmodul
untersucht einen Textsatz nach Fehlern oder Abweichungen von
einfachen Grammatikregeln für die jeweilige verwendete
Sprache.
Es besteht der Wunsch, Grammatiküberprüfungseinrichtungen für
die deutsche Sprache zu verbessern, so daß die
Grammatiküberprüfungseinrichtung Fehler in den Fallendungen
von Subjekten, direkten und indirekten Objekten in
Verbalphrasen feststellen kann. Allerdings treten bei der
deutschen Sprache erhebliche Probleme bei jedem Versuch auf,
Überprüfungen in Hinsicht auf Fallendungen von Subjekten,
direkten Objekten und indirekten Objekten durchzuführen.
Das Problem der Feststellung von Fehlern bei den Fallendungen
im Deutschen ist erheblich komplizierter als die Aufgabe für
den Verfasser eines Textes, die korrekten Fallendungen
auszuwählen, daß die Grammatiküberprüfungseinrichtung nicht
weiß, was der Verfasser gemeint haben könnte. Wird ihr ein
Satz oder Satzteil präsentiert, der einen Fehler bezüglich
einer Fallendung aufweist, steht der
Grammatiküberprüfungseinrichtung kein Zugriff auf die
angestrebte Bedeutung eines Satzes oder Satzteils zur
Verfügung, um zu bestimmen, welcher Fall für jede
Nominalphrase gedacht war. Die Wortreihenfolge in deutschen
Sätzen ist variabel, und stellt wenig Information in Bezug
auf wahrscheinliche grammatikalische Fälle von Nominalphrasen
zur Verfügung.
Das Grammatiküberprüfungsproblem wird dadurch noch
komplizierter, daß deutsche Fallendungen nicht eindeutig für
einen bestimmten grammatikalischen Fall (Kasus) sind. Für
Artikel, Adjektive oder Substantive kann dieselbe Fallendung
in unterschiedlichen Fällen verwendet werden, in Abhängigkeit
von einer komplizierten Kombination des grammatikalischen
Geschlechts, ob ein Substantiv im Singular oder im Plural
vorliegt, oder ob ein Wort des Typs "der" oder ein
Bestimmungswort des Typs "ein" dem Adjektiv vorhergeht. Daher
bestimmen Fallendungen nicht immer verläßlich oder eindeutig
den grammatikalischen Fall einer Nominalphrase. Es ist ein
beträchtliches Problem vorhanden, wenn einem Benutzer
vorgeschlagene Fallendungskorrekturen bei einer derart
erheblichen Vieldeutigkeit der verfügbaren Information
präsentiert werden, und bei so vielen möglichen Kombinationen
grammatikalisch korrekter vorgeschlagener Korrekturen, wenn
die vom Verfasser gewünschte Bedeutung unbekannt ist.
Es ist ein Grammatiküberprüfungsmodul für
Textverarbeitungsanwendungen erforderlich, um die gewünschte
Überprüfung der Endungen grammatikalischer Fälle von
Subjekten, direkten Objekten und indirekten Objekten in
Satzteilen der deutschen Sprache zur Verfügung zu stellen.
Es werden ein Verfahren und eine Einrichtung zur
Grammatiküberprüfung eines Satzes in der deutschen Sprache
vorgeschlagen. Die Grammatiküberprüfungseinrichtung führt
eine grammatische Analyse des Satzes in eine Verbalphrase und
eine ursprüngliche Nominalphrasenkombination durch, die der
Verbalphrase zugeordnet ist. Die
Grammatiküberprüfungseinrichtung greift auf eine
Morphologietabelle zu, um eine ursprüngliche Fallkombination
festzulegen, die der ursprünglichen Nominalphrasenkombination
zugeordnet ist. Die Grammatiküberprüfungseinrichtung greift
auf ein Lexikon zu, um eine korrekte Fallkombination zu
definieren, die der Verbalphrase zugeordnet ist. Die
Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche
Fallkombination mit der korrekten grammatischen
Fallkombination und erzeugt eine Fallfehlerkombination. Die
Grammatiküberprüfungseinrichtung erzeugt eine Kombination von
Satzänderungen, die eine Änderung des grammatischen Falles
auf eine Nominalphrase enthält, welche die
Fallfehlerkombination korrigiert.
Die Erfindung wird nachstehend anhand zeichnerisch
dargestellter Ausführungsbeispiele näher erläutert, aus
welchen weitere Vorteile und Merkmale hervorgehen. Es zeigt:
Fig. 1 eine vereinfachte Tabelle von Beispielen für
deutsche Fallendungen in Abhängigkeit vom Fall, der
Anzahl und dem grammatischen Geschlecht;
Fig. 2 ein Blockschaltbild einer ersten beispielhaften
Grammatiküberprüfungsschaltung;
Fig. 3 ein Flußdiagramm von Verfahrensschritten;
Fig. 4 ein Flußdiagramm der Fehlerfeststellung;
Fig. 5 ein Flußdiagramm der Zielfallberechnung;
Fig. 6 ein Flußdiagramm der Änderungserzeugung; und
Fig. 7 ein Blockschaltbild einer zweiten beispielhaften
Grammatiküberprüfungsschaltung.
Gemäß der vorliegenden Erfindung arbeitet eine
Grammatiküberprüfungseinrichtung so, daß sie eine Überprüfung
nach Fehlern in deutschen Fallendungen von Subjekten,
direkten Objekten und indirekten Objekten von Verben in
Verbalphrasen durchführt. Dies erfolgt ohne Zugriff auf die
vom Verfasser angestrebte Bedeutung der Verbalphrase. Die
Grammatiküberprüfungseinrichtung überwindet das Problem, daß
Fallendungen nicht für einen bestimmten Fall eindeutig sind.
Die Grammatiküberprüfungseinrichtung stellt ein Ausmaß von
Verläßlichkeit zur Verfügung, das zum Einsatz mit
Textverarbeitungscomputeranwendungen geeignet ist. Die
Grammatiküberprüfungseinrichtung stellt eine vernünftig
begrenzte Anzahl vorgeschlagener Korrekturen zur Verfügung,
die dem Benutzer präsentiert werden, wenn ein Fallfehler
festgestellt wird.
Im Deutschen geben Fallendungen den Fall eines Subjekts,
eines direkten Objekts oder eines indirekten Objekts einer
Verbalphrase an. Wenn Fallendungen exakt sind, können sie
einen sehr wesentlichen Teil der Bedeutung einer Verbalphrase
mitteilen. Wenn Fehler bei Fallendungen vorhanden sind, kann
dem Leser eine fehlerhafte Bedeutung mitgeteilt werden, die
sich von jener unterscheidet, die vom Verfasser gedacht war.
Im Deutschen sind Fallendungen bei dem Substantiv und ebenso
bei irgendwelchen Artikeln von Adjektiven vorhanden, die in
einer Nominalphrase ("NP") vorhanden sein können. Die
Fallendungen sind kompliziert und hängen vom grammatischen
Geschlecht des Substantivs ab, davon, ob das Substantiv im
Singular oder Plural vorliegt, und ob das Substantiv ein
Subjekt (Nominalfall) ist, ein direktes Objekt
(Akkusativfall) oder ein indirektes Objekt (Dativfall), des
Verbes. Die verschiedenen Formen deutscher Substantive sind
irregulär und können Änderungen der Endung sowie andere
orthographische Änderungen des Substantives umfassen. Man muß
sich an mehrere Formen von Substantiven erinnern, oder auf
ein Wörterbuch oder Lexikon zurückgreifen.
Deutsche Adjektivendungen sind besonders kompliziert, da sich
die Adjektivendungen ebenfalls in Abhängigkeit davon ändern,
ob das Adjektiv einem sogenannten Wort des Typs "der" folgt
("schwache Deklination", beispielsweise der, dieser, jener,
jeder, welcher, solcher, aller), ob ihm ein sogenanntes Wort
"ein" vorangeht ("gemischte Deklination", beispielsweise ein,
mein, sein, ihr, kein, unser, euer, dein, Ihr), oder ob ihm
weder ein Wort des Typs "der" noch des Typs "ein" vorausgeht.
In einigen Fällen, nämlich wenn ein Adjektiv auf ein
Substantiv folgt, das es verändert, wird die Fallendung des
Adjektivs weggelassen. Darüber hinaus gibt es zulässige
Variationen der Dativendungen bei maskulinen und neutralen
Substantiven.
Nicht korrekte Fallendungen können einen schlechten Eindruck
von den Fähigkeiten des Verfassers vermitteln, oder dem Leser
eine ungewünschte Bedeutung übermitteln. Jemand, der in der
deutschen Sprache schreibt, kann verläßlich Fallendungen für
das Subjekt, direkte Objekt und indirekte Objekt auswählen,
durch Rückgriff auf ein Wörterbuch und ein Grammatikbuch,
beispielsweise die Duden-Grammatik, oder unter Bezugnahme auf
eine vereinfachte Tabelle von Fallendungsbeispielen, ähnlich
jener, wie sie in Fig. 1 gezeigt ist. In Fig. 1 bezeichnet
die Zahl "1" die erste Form (Nominativsingular) eines
Substantivs, die Zahl "3" die dritte Form (Nominativplural)
eines Substantivs, wie in einem Wörterbuch aufgeführt. Ein
Verfasser kann beispielsweise wünschen, den Satzteil "the
blue lake" ("der blaue See") als einzelnes, indirektes Objekt
in einem Satz zu verwenden. Der Verfasser kann zuerst ein
Wörterbuch heranziehen, in dem er die erste Form "See"
findet, was bedeutet, daß der englische Begriff "lake" im
deutschen männlich ist. Dann schlägt der Verfasser in einer
Tabelle wie in Fig. 1 nach, und findet den Schnittpunkt der
maskulinen, Singularspalte 10 mit der Zeile 11 für das
indirekte Objekt (Dativ). An diesem Schnittpunkt findet sich
ein Beispiel 12 für Endungen von Artikeln, Adjektiven und
Substantiven für ein maskulines indirektes Objekt im
Singular. Unter Bezugnahme auf dieses Beispiel 12 kann der
Verfasser den Begriff "the blue lake" mit der korrekten
Anzahl, dem korrekten grammatischen Geschlecht und dem
korrekten Fall schreiben, nämlich als "dem blauen See". Fig.
1 ist zum Teil eine Deklinationstabelle, die Beispiele für
die Beugung der Endungen von Bestimmungsworten, Adjektiven
und Substantiven für die drei Fälle (Nominativ, Dativ,
Akkusativ) angibt, die zur Angabe des Subjekts, des
indirekten Objekts und des direkten Objekts eines Verbs in
einem deutschen Satz verwendet werden.
Die Tätigkeit des Verfassers kann mit wenigen Fehlern
fertiggestellt werden, da dem Verfasser die Regeln und
Ausnahme von den Regeln zur Verfügung stehen, und der
Verfasser die gewünschte Bedeutung des Satzes weiß.
Andererseits ist das Problem für eine
Grammatiküberprüfungseinrichtung bei der Überprüfung in Bezug
auf Fehler bei deutschen Fallendungen komplizierter und
mehrdeutiger. Wenn eine Grammatiküberprüfungseinrichtung für
die deutsche Sprache das Substantiv "See" in einem Satz
antrifft, ist es unbekannt, ob der Verfasser das männliche
Substantiv "See" mit der Bedeutung "lake" im Englischen
(stehendes Binnengewässer) oder das weibliche Substantiv
"See" mit der englischen Bedeutung "ocean" (Meer) meint. Die
Handhabung derartiger Mehrdeutigkeiten in einer
Grammatiküberprüfungseinrichtung wird nachstehend im
Zusammenhang mit den in den Fig. 3 bis 7 angegebenen
Beispielen erläutert.
Ein Satzteil wird der Grammatiküberprüfungsanwendung durch
eine Einrichtung zur grammatischen Analyse zur Verfügung
gestellt, und der Satzteil kann ein vollständiger Satz sein,
oder ein verbaler Satzteil, der ein Teil eines Satzes ist, in
welchem eine bestimmte Kombination aus Subjekt, direktem
Objekt oder indirektem Objekt vorhanden sein kann. Die
Einrichtung zur grammatischen Analyse und die
Grammatiküberprüfungseinrichtung sind in einer
Computerumgebung implementiert.
Vor einer ins Einzelne gehenden Erläuterung der vorliegenden
Erfindung kann eine Übersicht über eine derartige
Computerbetriebsumgebung nützlich sein. Fig. 2 und die
zugehörige Beschreibung geben eine kurze, allgemeine
Erläuterung einer geeigneten Computerumgebung 20, in welcher
die Erfindung implementiert werden kann. Die
Computersystemumgebung 20 stellt nur ein Beispiel für eine
geeignete Schaltungsausbildung dar, und soll nicht
dahingehend verstanden werden, daß hiermit eine Einschränkung
des Umfangs der Nutzung oder der Funktionen gemäß der
Erfindung beabsichtigt ist. Auch sollte die Computerumgebung
20 nicht so verstanden werden, daß sie von einzelnen
Bauteilen oder deren Kombinationen oder entsprechenden
Anforderungen abhängig ist, die bei der beispielhaften
Betriebsumgebung 20 dargestellt sind.
Die Erfindung kann mit zahlreichen anderen allgemeinen oder
speziellen Schaltungen oder Konfigurationen arbeiten.
Beispiele für wohlbekannte Computersysteme, Umgebungen,
und/oder Konfigurationen, die zum Einsatz bei der Erfindung
geeignet sein können, umfassen - sind hierauf jedoch nicht
beschränkt - Personalcomputer, Servercomputer, tragbare oder
Laptopgeräte, Multiprozessorsysteme, Systeme auf
Mikroprozessorgrundlage, Settopboxen, programmierbare
Verbraucherelektronik, Netzwerk-PCs, Minicomputer,
Großcomputer, verteilte Rechnerumgebungen, die irgendeines
der voranstehend geschilderten Systeme oder Geräte enthalten,
und dergleichen. Darüber hinaus kann die Erfindung in einem
Telefonsystem verwendet werden.
Die Erfindung kann im allgemeinen Zusammenhang von durch
Computer ausführbaren Befehlen beschrieben werden,
beispielsweise Anwendungsmodulen, die von einem Computer
ausgeführt werden. Im allgemeinen umfassen Anwendungsmodule
Routinen, Programme, Objekte, Komponenten, Datenstrukturen
usw., die spezielle Aufgaben ausführen, oder bestimmte
abstrakte Datentypen implementieren. Die Erfindung kann auch
in einer verteilten Rechnerumgebung ausgeführt werden, bei
welcher Aufgaben von entfernten Verarbeitungsgeräten erledigt
werden, die über ein Kommunikationsnetzwerk verbunden sind.
In einer verteilten Rechnerumgebung können Programmmodule
sowohl auf lokalen als auch entfernten Computerspeichermedien
liegen, einschließlich Speichergeräten. Aufgabe, die von den
Programmen und Modulen durchgeführt werden, werden
nachstehend und unter Zuhilfenahme von Figuren beschrieben.
Fachleuten auf diesem Gebiet können die Beschreibung und die
Figuren als von durch Prozessoren ausführbare Befehle
implementieren, die auf jeder Form eines computerlesbaren
Mediums geschrieben werden können.
Gemäß Fig. 2 weist das Beispiel für ein System zur
Implementierung der Erfindung ein Allzweckrechnergerät in
Form eines Computers 30 auf. Die Bauteile des Computers 30
können, wobei sie hierauf nicht beschränkt sind, eine
Bearbeitungseinheit 40 umfassen, einen Systemspeicher 50 und
einen Systembus 41, der verschiedene Systembauteile
einschließlich des Systemspeichers mit der
Verarbeitungseinheit 40 verbindet. Der Systembus 41 kann eine
von verschiedenen Arten von Busstrukturen sein,
einschließlich eines Speicherbus oder einer
Speichersteuerung, eines Peripheriebusses, und eines lokalen
Busses, unter Verwendung einer unter verschiedenen
Busarchitekturen. Zum Beispiel umfassen, wobei dies nicht
einschränkend zu verstehen ist, derartige Architekturen Busse
des Typs Industry Standard Architecture (ISA), Micro Channel
Architecture (MCA), Enhanced ISA (EISA), einen lokalen Bus
des Typs Video Electronics Standards Association (VESA), und
den Bus des Typs Peripheral Component Interconnect (PCI), der
auch als Mezzanine-Bus bekannt ist.
Der Computer 39 enthält typischerweise verschiedene
computerlesbare Medien. Computerlesbare Medien können alle
verfügbaren Medien sein, auf die durch den Computer 30
zugegriffen werden kann, und umfassen sowohl flüchtige als
auch nicht-flüchtige Medien, entfernbare und
nicht-entfernbare Medien. Beispiele, wobei dies nicht
einschränkend zu verstehen ist, für computerlesbare Medien
umfassen Computerspeichermedien und Kommunikationsmedien.
Computerspeichermedien umfassen sowohl flüchtige als auch
nicht-flüchtige, entfernbare und nicht-entfernbare Medien,
die in jedem Verfahren oder jeder Technik zum Speichern von
Information verwendet werden, zum Beispiel von
computerlesbaren Befehlen, Datenstrukturen, Programmmodulen
oder anderen Daten. Computerspeichermedien umfassen, sind
jedoch nicht hierauf beschränkt, RAM, ROM, EEPROM,
Flash-Speicher oder eine Speichertechnik, CD-ROM, digitale
vielseitige Disketten (DVD), oder andere optische
Diskettenspeicher, Magnetkassetten, Magnetbänder,
Magnetplattenspeicher oder andere magnetische Speichergeräte,
oder irgendein anderes Medium, das dazu verwendet werden
kann, die gewünschte Information zu speichern, und auf
welches durch den Computer 20 zugegriffen werden kann.
Kommunikationsmedien verwenden häufig von einem Computer
lesbare Befehle, Datenstrukturen, Programmmodule oder andere
Daten in einem modulierten Datensignal, beispielsweise in
einer Trägerwelle oder einem anderen Transportmechanismus,
und umfassen sämtliche Medien zum Liefern von Information.
Der Betriff "moduliertes Datensignal" ist als Signal zu
verstehen, bei welchem eine oder mehrere seiner Eigenschaften
eingestellt oder geändert werden, und zwar auf solche Weise,
daß das Signal mit Information kodiert wird. Zum Beispiel,
wobei dies nicht einschränkend zu verstehen ist, umfassen
Kommunikationsmedien verdrahtete Medien wie beispielsweise
ein verdrahtetes Netzwerk oder eine direkt verdrahtete
Verbindung, und auch drahtlose Medien wie beispielsweise
akustische, Radiofrequenz-, Infrarot- und andere drahtlose
Medien. Auch Kombinationen dieser Medien sollen vom Umfang
des Begriffs computerlesbare Medien umfaßt sein.
Der Systemspeicher 50 umfaßt Computerspeichermedien in Form
eines flüchtigen und/oder nicht-flüchtigen Speichers, etwa
einen Nur-Lese-Speicher (ROM) 51 und einen Speicher mit
wahlfreiem Zugriff (RAM) 52. Ein Basiseingabe/Ausgabesystem
53 (BIOS), welches die grundlegenden Routinen enthält, welche
die Übertragung von Information zwischen Elementen innerhalb
des Computers 30 unterstützen, beispielsweise bei dessen
Ingangsetzung, ist typischerweise in dem ROM 51 gespeichert.
Der RAM 52 enthält typischerweise Daten und/oder
Programmmodule, auf die unmittelbar zugegriffen werden kann,
und/oder mit denen momentan mit der Verarbeitungseinheit 40
gearbeitet wird. Zum Beispiel, wobei dies nicht als
einschränkend zu verstehen ist, erläutert Fig. 2 das
Betriebssystem 54, Anwendungsprogramme 55, andere
Programmmodule 56, sowie Programmdaten 57.
Der Computer 30 kann weiterhin andere entfernbare oder
nicht-entfernbare, flüchtige oder nicht-flüchtige
Computerspeichermedien enthalten. Nur beispielhaft zeigt
Fig. 2 ein Festplattenlaufwerk 61, das aus
nicht-entfernbaren, nicht-flüchtigen magnetischen Medien
liest oder in diese schreibt, ein Magnetdiskettenlaufwerk 71,
das aus einer entfernbaren, nicht-flüchtigen Magnetdiskette
72 liest oder in diese schreibt, und ein Laufwerk 75 für
optische Disketten, das aus einer entfernbaren,
nicht-flüchtigen optischen Diskette 76, beispielsweise einer
CD-ROM, liest oder in diese einschreibt, oder ein anderes
optisches Medium. Andere entfernbare oder nicht-entfernbar,
flüchtige oder nicht-flüchtige Computerspeichermedien, die
bei dem Beispiel für die Betriebsumgebung verwendet werden
können, umfassen, sind jedoch nicht hierauf beschränkt,
Magnetbandkassetten, Flash-Speicherkarten, digitale
vielseitige Disketten, digitale Videobänder, Festkörper-RAM,
Festkörper-ROM und dergleichen. Das Festplattenlaufwerk 61
ist typischerweise mit dem Systembus 41 über eine
nicht-entfernbare Speicherschnittstelle verbunden,
beispielsweise über die Schnittstelle 60, und das
Magnetdiskettenlaufwerk 71 und das Laufwerk 75 für optische
Disketten sind typischerweise mit dem Systembus 41 über eine
entfernbare Speicherschnittstelle verbunden, beispielsweise
die Schnittstelle 70.
Die Laufwerke und ihre zugehörigen Computerspeichermedien,
die voranstehend erläutert wurden, und in Fig. 1 gezeigt
sind, stellen Speicher für vom Computer lesbare Befehle,
Datenstrukturen, Programmmodule und andere Daten für den
Computer 30 zur Verfügung. In Fig. 2 ist zum Beispiel das
Festplattenlaufwerk 61 so dargestellt, daß es ein
Betriebssystem 64 speichert, Anwendungsprogramme 65, andere
Programmmodule 66, sowie Programmdaten 67. Es wird darauf
hingewiesen, daß diese Komponenten entweder gleich dem
Betriebssystem 54, Anwendungsprogrammen 55, anderen
Programmmodulen 56 und Programmdaten 57 sein können, oder
sich hiervon unterscheiden können. Das Betriebssystem 64, die
Anwendungsprogramme 65, die anderen Programmmodule 66 und die
Programmdaten 67 werden hier mit unterschiedlichen
Bezugszeichen bezeichnet, um zu erläutern, daß sie mindestens
unterschiedliche Kopien darstellen.
Ein Benutzer kann Befehle und Information in den Computer 30
über Eingabegeräte eingeben, beispielsweise eine Tastatur 82,
ein Mikrofon 83, und ein Zeigergerät 81, beispielsweise eine
Maus, einen Trackball, oder ein Berührungsfeld. Andere
Eingabegeräte (nicht gezeigt) können einen Joystick, ein
Gamepad, eine Satellitenschüssel, einen Scanner oder
dergleichen umfassen. Diese und andere Eingabegeräte sind
häufig mit der Verarbeitungseinheit 40 über eine
Benutzereingabeschnittstelle 80 verbunden, die mit dem
Systembus gekoppelt ist, können jedoch auch durch andere
Schnittstellen- und Busstrukturen angeschlossen sein,
beispielsweise einen Parallelport, einen Port für Spiele oder
einen universellen seriellen Bus (USB). Ein Monitor 84 oder
eine andere Art von Anzeigegerät ist ebenfalls mit dem
Systembus 41 über eine Schnittstelle verbunden,
beispielsweise eine Videoschnittstelle 85. Zusätzlich zu dem
Monitor können Computer auch andere periphere Ausgabegeräte
enthalten, beispielsweise Lautsprecher 87 und einen Drucker
86, die über eine Ausgabeperipherieschnittstelle 88
angeschlossen sein können.
Der Computer 30 kann in einer Netzwerkumgebung arbeiten,
unter Verwendung logischer Verbindungen zu einem oder
mehreren entfernten Computern, etwa einem entfernten Computer
94. Der entfernte Computer 94 kann ein Personalcomputer sein,
ein von Hand gehaltenes Gerät, ein Server, ein Router, ein
Netzwerk-PC, ein Peer-Gerät oder ein anderer gemeinsamer
Netzwerkknoten, und umfaßt typischerweise viele der Elemente,
oder sämtliche Elemente, die voranstehend in Bezug auf den
Computer 30 beschrieben wurden. Die Logikverbindungen, die in
Fig. 2 gezeigt sind, umfassen ein Lokalbereichsnetzwerk
(LAN) 92 und ein Großbereichsnetzwerk (WAN) 93, können jedoch
auch andere Netzwerke umfassen. Derartige Netzwerkumgebungen
sind üblich in Büros, firmeninternen Computernetzwerken,
Intranets und dem Internet.
Bei der Verwendung in einer LAN-Netzwerkumgebung ist der
Computer 30 mit dem LAN 91 über eine Netzwerkschnittstelle
oder einen Adapter 90 verbunden. Beim Einsatz in einer
WAN-Netzwerkumgebung weist der Computer 30 typischerweise ein
Modem 92 oder eine andere Vorrichtung dazu auf, Kommunikation
über das WAN 93, beispielsweise das Internet, einzurichten.
Das Modem 92, das intern oder extern vorgesehen sein kann,
kann mit dem Systembus 41 über die
Benutzereingabeschnittstelle 80 oder einen anderen geeigneten
Mechanismus verbunden sein. Bei einer Netzwerkumgebung können
Programmmodule, die in Bezug auf den Computer 30 dargestellt
sind, oder Teile von diesem, in dem entfernten Speichergerät
gespeichert sein. Als Beispiel, wobei dies nicht als
einschränkend zu verstehen ist, zeigt Fig. 2 entfernte
Anwendungsprogramme 95 so, daß sie auf einem entfernten
Computer 94 liegen. Es wird darauf hingewiesen, daß die
dargestellten Netzwerkverbindungen als Beispiel zu verstehen
sind, und andere Vorrichtungen zur Einrichtung einer
Kommunikationsverbindung zwischen den Computern verwendet
werden können.
Fig. 3 zeigt ein verallgemeinertes Flußdiagramm 200 von
Verfahrensschritten bei einem Beispiel für eine
Grammatiküberprüfungseinrichtung. Eine
Textverarbeitungsanwendung, beispielsweise ein Wordprocessor,
stellt Sätze in deutscher Sprache einzeln für die
Grammatiküberprüfungseinrichtung zur Verfügung. Wie bei 201
gezeigt ist, stellt der Wordprocessor den Satz "Der Mann
nennt der Richter einen Lügner" der
Grammatiküberprüfungseinrichtung zur Verfügung. Der Satz wird
an eine Satzanalysemaschine 210 übergeben.
Die Satzanalysemaschine 210 führt einen Zugriff auf ein
Lexikon und Wortmorphologie (einschließlich Beugung und
Konjugation) durch, die auf einem computerlesbaren Medium
gespeichert sind. Die Satzanalysemaschine 210 identifiziert
unverbindlich Teile des Satzes, beispielsweise verbale
Satzteile und die grammatischen Bestandteile jedes verbalen
Satzteils, beispielsweise Verben, Substantiva, Adjektive,
Bestimmungsworte, Präpositionen und dergleichen. Die
Satzanalysemaschine 210 analysiert grammatisch den Satz in
Bezug auf einzelne verbale Satzteile, wenn der Satz mehr als
einen verbalen Satzteil enthält. Für jeden verbalen Satzteil
identifiziert darüber hinaus die Satzanalysemaschine 210
unverbindlich eine Kombination eines Hauptverbs, eines
Hilfsverbs und jedes Subjekts, direkten Objekts, indirekten
Objekts, Adverbs oder eines Satzteils mit einer Präposition,
die in dem verbalen Satzteil vorhanden (oder implizit
vorhanden) ist. Die Satzanalysemaschine 210 erzeugt, auf der
Grundlage dieser Analyse des Satzes, ein vereinfachtes
grammatisches Modell oder eine vereinfachte grammatisch
Kombination des verbalen Satzteils.
Das vereinfachte grammatische Modell oder die vereinfachte
grammatische Kombination umfaßt die Identifizierung
irgendwelcher Satzteile (Substantiv-Satzteile) mit einem
Subjekt, einem direkten Objekt oder einem indirekten Objekt
des verbalen Satzteils, und die mögliche korrekte Kombination
oder die möglichen korrekten Kombinationen von Substantiv-
Satzteilen auf der Grundlage des Hauptverbs. Das vereinfachte
grammatische Modell kann auch andere Kombinationen der
Satzstruktur enthalten. Das vereinfachte grammatische Modell
wird an den Filter 203 für verdächtige Sätze weitergeleitet.
Der Filter 203 für verdächtige Sätze identifiziert verbale
Satzteile mit Kombinationen, die so kompliziert oder so
ungewöhnlich sind, daß ein hohes Risiko dafür besteht, daß
die Grammatiküberprüfungseinrichtung bei dieser Kombination
des verbalen Satzteils nicht korrekt arbeitet. Der Filter 203
für verdächtige Sätze überspringt diese verbalen Satzteile
mit hohem Risiko, und leitet sie nicht an nachfolgende
Grammatiküberprüfungsroutinen weiter. Wenn der Filter 203 für
verdächtige Sätze Satzteile mit Kombinationen feststellt, bei
denen eine korrekte Handhabung von nachfolgenden
Grammatiküberprüfungsroutinen wahrscheinlich ist, leitet er
sie an eine Fehlererfassungsroutine 204 weiter. Die
Fehlererfassungsroutine hat Zugriff auf die Funktionen
find_args 214 und adj_case 216, und auf eine Gruppe von
Hilfefunktionen 218. Die Fehlererfassungsroutine 204 wird mit
weiteren Einzelheiten im Zusammenhang mit Fig. 4 erläutert.
Die Fehlererfassungsroutine 204 gibt die Kombination des
verbalen Satzteils an eine Zielfallberechnungsfunktion 205
weiter, die mit GET_CASE bezeichnet ist. Wenn Fehler in Bezug
auf eine mangelnde Übereinstimmung des Substantiv-Satzteils
vorhanden sind, dann versucht die
Grammatiküberprüfungseinrichtung keine grammatikalische
Korrektur, sondern leitet statt dessen den verbalen Satzteil
bei 207 an eine
NP-Nichtübereinstimmungsüberprüfungseinrichtung weiter. Die
Zielfallberechnung wird mit weiteren Einzelheiten im
Zusammenhang mit Fig. 5 erläutert. Die
Zielfallberechnungsfunktion 205 leitet die Kombination
verbaler Satzteile zur Überschreibungserzeugungsfunktion 206
weiter. Die Überschreibungserzeugungsfunktion 206 wird mit
weiteren Einzelheiten im Zusammenhang mit Fig. 6 erläutert.
Die Überschreibungserzeugungsfunktion 206 stellt
vorgeschlagene Überschreibungen 202 dem Benutzer des
Wordprocessors zur Verfügung, wenn Fehler in der
Fallkombination des verbalen Satzteils vorhanden sind. Die
vorgeschlagenen Überschreibungen 202 sind Änderungen der
Fallendung, welche die Kombination des Substantiv-Satzteils
in dem Verbal-Satzteil an eine der korrekten Kombinationen
von Substantiv-Satzteilen anpassen, die durch das Verb
angegeben werden. Beim vorliegenden Beispiel ist das Verb
"nennt". Der Benutzer des Wordprocessors kann dann eine der
vorgeschlagenen Überschreibungen 202 akzeptieren, und der
verbale Satzteil der Wordprocessoranwendung wird so geändert,
daß die Grammatik korrigiert wird. Der Benutzer des
Wordprocessors hat Zugriff auf eine gewünschte oder vermutete
Bedeutung des verbalen Satzteils, und kann produktiv eine
Überschreibung auswählen, die mit der Bedeutung verträglich
ist.
Während Überschreibungen in dem Überschreibungsgenerator 206
erzeugt werden, durchläuft das Programm drei verschachtelte
Schleifen 211 zurück zur Zielfallberechnung 205, um
Korrekturen durchzuführen, wie sie in Fig. 3 angegeben sind.
Während Überschreibungen erzeugt werden, geht darüber hinaus
das Programm über vier verschachtelte Schleifen 212 zurück,
um Korrekturen vorzunehmen, wie dies in Fig. 3 angegeben
ist.
Die Grammatiküberprüfungseinrichtung, die bei 200 dargestellt
ist, stellt grammatische Fehler fest, und schlägt geeignete
Korrekturen für derartige Fehler vor.
Deutsch ist eine Sprache, die in hohem Ausmaß grammatische
Fallendungen dazu verwendet, um die unterschiedlichen
syntaktischen Rollen (Bedeutungen) von Elementen eines Satzes
anzugeben. Diese Fallendungen oder Markierungen gestatten
eine sehr flexible Wortreihenfolge, und ihr korrekter
Gebrauch ist wesentlich nicht nur für die Grammatik, sondern
auch für die semantische Bestimmtheit eines Satzes. Als ein
Merkmal der Grammatiküberprüfungseinrichtung für die deutsche
Sprache werden nicht korrekte Kombinationen grammatischer
Fallformen festgestellt, und werden geeignete Vorschläge
berechnet, um den Fehler zu korrigieren.
Die Korrektheit einer grammatischen Fallform kann nur durch
die Kombination sämtlicher grammatischer Fälle festgelegt
werden, die in einem Satz vorhanden sind. Üblicherweise (es
sei denn, ihm geht eine Präposition vor) stellt das Verb
eines Satzes bestimmte Anforderungen dahingehend, welche
Fälle in einem Satz erwartet werden können. Die Schritte, die
vom Computer durchgeführt werden, können entweder allein oder
in verschiedenen Kombinationen folgende Schritte umfassen:
(a) Feststellung des Verbs, das die erforderlichen Fälle
bestimmt, durch Bezugnahme auf ein Lexikon, das auf einem
computerlesbaren Medium gespeichert ist, (b) Feststellung
aller Formen des Verbs, die einen grammatischen Fall
enthalten, (c) Definition korrekter Fallverteilungen für
unterschiedliche Szenarien (beispielsweise für Sätze oder
Satzteile mit oder ohne ein Subjekt), (d) falls der
eingegebene Satz nicht zu einem der verschiedenen Szenarien
paßt, Definition der unterschiedlichen Vorschläge, die dem
Benutzer dargeboten werden, um den Satz zu korrigieren,
(e) Definition der bevorzugten Reihenfolge, in welcher die
Korrektur dargestellt werden sollte, (f) Bereitstellung einer
Anzeigestrategie für die Darstellung der unterschiedlichen
Vorschläge, (d) Handhabung von Mehrdeutigkeiten, oder
(h) Handhabung von Ausnahmen.
Ein weiterer, breiter Aspekt der vorliegenden Erfindung
umfaßt eine Fallberechnungsfunktion 207, die zur
Korrekturerzeugung einer unterschiedlichen Art eines häufigen
grammatischen Fehlers verwendet werden kann, der als
"NP-Abweichung" bezeichnet wird, nämlich grammatische
Abweichungen der Elemente, die zu einer Wortgruppe gehören.
Beispielsweise kann ein Substantiv-Satzteil (NP) eine
Wortgruppe sein, die einen Artikel, Adjektive und ein
Substantiv umfaßt, die miteinander in Bezug auf die
grammatische Anzahl, das grammatische Geschlecht und den Fall
übereinstimmen müssen. Wenn der Abweichungsfehler bei einer
derartigen Wortgruppe dazu führt, daß es schwierig wird,
welcher Fall eingesetzt werden sollte, dann hilft die
Fallberechnung, die auf dem Niveau des Satzes oder des
verbalen Satzteils arbeitet, dabei, vernünftigere Vorschläge
zu machen. Jene Lösung, welche die Berechnung des korrekten
Zielfalles für einen fehlerhaften Bestandteil betrifft, wird
vorgezogen, da sie möglicherweise Information für mehrere
mögliche Fälle enthält, die nur so weit korrekt sind, daß sie
sich gegenseitig ausschließen.
Zusätzliche Schritte werden während der Berechnung des
Zielfalles durchgeführt, um wahrscheinlichere Szenarien dem
Benutzer vor weniger wahrscheinlichen Szenarien zu
präsentieren.
Die Feststellung und die Korrektur von mit grammatischen
Fällen zusammenhängenden Problemen werden nicht sehr gut
durch generische Algorithmen mit einfachen, starren Regeln
erfaßt. Komplizierte Satzstrukturen oder eine nicht korrekte
grammatische Analyse durch die grammatische
Analyseeinrichtung (also eine nicht korrekte Satzanalyse
durch die grammatische Analyseeinrichtung) bringen die
Möglichkeit mit sich, daß fehlerhaft grammatische Fehler
angezeigt werden, oder fehlerhaft Vorschläge für eine
Ersetzung dem Benutzer präsentiert werden. Um eine annehmbare
Genauigkeit für die Behandlung von (nicht nur) Fällen mit
grammatischen Fehlern zu erzielen, kann ein Filter 203 für
verdächtige Sätze implementiert werden, der
Strafwertestrukturen von verdächtigen Sätzen zuordnet, oder
Elementen, die einfach entweder falsch interpretiert werden
können, oder fehlerhaft von der Einrichtung für die
grammatische Analyse bei 210 als nicht mehrdeutig
festgestellt wurden. Wenn ein bestimmter Strafwert
überschritten wird, wird der Satz nicht in Bezug auf Fehler
für grammatische Fälle überprüft. Diese Filterfunktion kann
signifikant die Genauigkeit des Fallkorrekturgerätes erhöhen.
Das Fallberechnungsmerkmal der
Grammatiküberprüfungseinrichtung für die deutsche Sprache,
die hier beschrieben wird, hebt sich im Vergleich zu anderen
Grammatiküberprüfungseinrichtungen ab, die keine Überprüfung
und Berechnung von Fallendungen in Abhängigkeit von den
Erfordernissen des Verbs durchführen. Die
Grammatiküberprüfungseinrichtung stellt eine Behandlung einer
Klasse von Fehlern zur Verfügung, die zu kompliziert dafür
waren, von anderen Grammatiküberprüfungseinrichtungen wirksam
in Angriff genommen zu werden. Sie stellt nicht nur die
Behandlung einer Fehlerklasse zur Verfügung, die bislang zu
kompliziert war, um automatisch behandelt zu werden, sondern
stellt auch verbesserte Vorschläge für Überschreibungen der
Fehlerklasse zur Verfügung.
Da die korrekte Verwendung von Fallformen im Deutschen eine
der wesentlichen Herausforderungen bei der Verwendung der
deutschen Sprache darstellt, insbesondere für nicht
muttersprachliche Sprecher, stellt dies eine wesentliche
Verbesserung der Überprüfung der deutschen Grammatik dar.
Das tatsächliche Problem von Fehlern bezüglich grammatischer
Fälle tritt häufig genug auf, so daß es ein Merkmal
darstellt, welches die meisten Benutzer gern in einer
Grammatiküberprüfungseinrichtung haben würden, jedoch ist es
infolge der komplizierten Eigenschaften der Beziehung
grammatischer Fälle in einem Satz schwierig, eine
zufriedenstellende Genauigkeitsrate zu erzielen. Die Lösung
für dieses Problem besteht darin, eine Code zu
implementieren, der Benutzereingaben annimmt, und sie in
Bezug auf die Korrektheit grammatischer Fälle sämtlicher
enthaltener Verbergänzungen untersucht, wobei sichergestellt
wird, daß die Reaktionen des Systems auf den Benutzer
verläßlich sind.
Wenn beispielsweise ein Satz drei Ergänzungen enthält, wie
beispielsweise in "Die Frau gibt dem Mann den Mantel", so
sind die Ergänzungen "Die Frau" dem Mann, "den Mantel". Wenn
eine der Ergänzungen einen falschen grammatischen Fall
aufweist, ist es nicht notwendigerweise klar, welche
Ergänzung fehlerhaft ist. Infolge der flexiblen
Wortreihenfolge im Deutschen könnten mehrere Lösungen möglich
sein. Die Lösung, die in der Grammatiküberprüfungseinrichtung
für die deutsche Sprache implementiert wird, präsentiert
vorzugsweise jene Lösungen, die den gesamten Satz in Bezug
auf die Zuordnung von Fällen durch nur eine Ersetzung
richtigstellt. Allerdings könnten mehrere mögliche einzelne
Ersetzungen von Fällen vorhanden sein, die den Satz richtig
stellen würden. Zur Lösung dieses Problems verwendet die
Grammatiküberprüfungseinrichtung Heuristiken, welche eine
erste Auswahl für eine Ergänzung festlegen, die zunächst dem
Benutzer dargeboten wird. Auf der Grundlage dieser
Heuristiken kann die erste Ergänzung hervorgehoben werden,
und können mögliche Korrekturauswahlen dem Benutzer in der
Reihenfolge ihrer Wahrscheinlichkeit dargeboten werden. Falls
der Benutzer entscheidet, daß die hervorgehobene Ersetzung
keinen Fehler enthält, kann er die Auswahl treffen, die
hervorgehobene Ersetzung zu ignorieren, und zum nächsten
hervorgehobenen Fehler überzugehen. Bei einer bevorzugten
Ausführungsform kann ein Maximum von drei unterschiedlichen
Orten in einem Satz hervorgehoben werden. Sobald der Benutzer
einen Vorschlag akzeptiert, kann der Satz korrigiert werden,
und kann der Benutzer zum nächsten hervorgehobenen Fehler
übergehen.
Unter Einsatz dieser Vorgehensweise kann die
Grammatiküberprüfungseinrichtung eine oder mehrere der
folgenden Einrichtungen aufweisen: (a) ein
Vorbearbeitungssatzfilter bei 203, (b) ein Modul, das nicht
korrekte Kombinationen grammatischer Fälle in einem Satz bei
204 identifiziert, (c) Berechnung von Gruppen minimaler
Lösungen bei 205, (d) Anordnen dieser Lösungen in einer
Reihenfolge bei 206, oder (e) Durchführung einer komfortablen
und dynamischen Präsentation für den Benutzer bei 202.
Ein Beispiel für ein Problem, das von der
Grammatiküberprüfungseinrichtung behandelt wird, ist in Fig.
3 in Bezug auf ein Beispiel für einen deutschen
Verbalsatzteil "Der Mann nennt der Richter einen Lügner"
erläutert. Dieser Satz enthält nicht die Fallmarkierungen
(Endungen), welche das Verb "nennt" erfordert. Darüber hinaus
hat dieses Verb zwei Bedeutungen, nämlich (a) jemanden als
etwas bezeichnen, und (b) jemandem den Namen oder die
Bezeichnung von jemandem/etwas angeben. Jede dieser
Bedeutungen erfordert eine unterschiedliche Kombination von
grammatischen Fällen, die durch das Fallkorrekturmodul
berücksichtigt wird. Infolge der flexiblen Wortreihenfolge im
Deutschen ist es nicht sicher, welche der Ergänzungen eine
Korrektur benötigt.
Jene Fälle, die von der Bedeutung (a) des Verbs "nennen"
gefordert werden, sind:
- - Nominativ (Subjekt)
- - Akkusativ (für das Objekt, das mit einem Namen bezeichnet wird)
- - Akkusativ (für den Namen, mit welchem das Objekt bezeichnet wird)
Da das Objekt, das mit einem Namen versehen wird, und der
entsprechende Namen in einem Satz äquivalent sind, in welchem
der Begriff "nennen" mit der Bedeutung (a) verwendet wird,
weisen sie denselben Fall auf, da sie äquivalente Rollen
teilen.
Jene Fälle, die bei der Bedeutung (b) des Verbs "nennen"
erforderlich sind, sind folgende:
- - Nominativ (Subjekt)
- - Dativ (indirektes Objekt: Name von jemandem oder etwas, der bzw. das auf das nachstehende Objekt übertragen wird)
- - Akkusativ (direktes Objekt: Empfänger der Information in Bezug auf das indirekte Objekt).
Im Englischen werden indirekte Objekte normalerweise durch
eine Präposition eingeführt, beispielsweise in "The man gives
the book to the child", wobei der Satzteil "to the child" ins
Deutsche als "dem Kind" übersetzt wird, ohne eine
Präposition. Die Fallmarkierung, die sich in dem Artikel
"dem" widerspiegelt (im Gegensatz zu beispielsweise "das")
stellt die einzige Anzeige dafür dar, welche "das Kind" in
dem Satz spielen soll, nämlich daß das Kind den Empfänger des
direkten Objekts (des Buches) darstellt.
In dem Beispiel für einen falschen Satz ergeben sich folgende
Fälle:
Der Mann (Nominativ)
der Richter (Nominativ)
einen Lügner (Akkusativ)
wie dies bei 201 in Fig. 3 dargestellt ist.
Der Mann (Nominativ)
der Richter (Nominativ)
einen Lügner (Akkusativ)
wie dies bei 201 in Fig. 3 dargestellt ist.
Die Fallkombination in dem falschen Satz bei 201 entspricht
nicht einer der beiden möglichen korrekten Fallkombinationen,
die von der gewünschten Bedeutung abhängen, also (a) oder (b)
dieses Satzes. Da die Grammatiküberprüfungseinrichtung keinen
Zugriff auf die gewünschte Bedeutung des Verfassers hat,
werden beide Bedeutungen von der
Grammatiküberprüfungseinrichtung behandelt.
Die Grammatiküberprüfungseinrichtung erzeugt dann mögliche
Fehlerkorrekturen bei der Überschreiberzeugung 206 mit einer
minimalen oder einzelnen Korrektur ("→") für den Fall, wie
dies bei 202 dargestellt ist:
- 1. Nominativ: Der Mann → Akkusativ: Den Mann
Nominativ: der Richter
Akkusativ: einen Lügner - 2. Nominativ: Der Mann
Nominativ: der Richter → Akkusativ: den Richter
Akkusativ: einen Lügner - 3. Nominativ: Der Mann → Dativ: Dem Mann
Nominativ: der Richter
Akkusativ: einen Lügner - 4. Nominativ: Der Mann
Nominativ: der Richter → Dativ: dem Richter
Akkusativ: einen Lügner
Kein Versuch, die letzte Ergänzung "einen Lügner" vorzugeben,
würde den Satz richtigstellen, da die beiden Nominative der
ersten beiden Ergänzungen immer noch jeder möglichen
Kombination grammatischer Fälle widersprechen würden. Es gibt
vier Vorschläge für Ersetzungen, jedoch betreffen sie nur
zwei Ergänzungen, so daß zwei unterschiedliche Vorschläge für
jede der Nominativ-Ergänzungen vorhanden sind. Es ist
vorzuziehen, sich daran zu erinnern, daß nur eine der
Ergänzungen ersetzt werden muß, da der Satz zumindest eine
Nominativ-Ergänzung aufweisen muß.
Bei einer bevorzugten Ausführungsform wird eine bevorzugte
Reihenfolge zur Verfügung gestellt, in welcher die
Ersetzungen dem Benutzer dargeboten werden. Die Entscheidung
in Bezug auf die Reihenfolge erfolgt auf zwei Niveaus,
nämlich (a) bezüglich der Reihenfolge, in welcher die beiden
betroffenen Ergänzungen für den Benutzer hervorgehoben werden
(markiert durch einen grünen Grammatikschnörkel) und (b) die
Reihenfolge der Ersetzungsvorschläge, die dem Benutzer für
jede Ergänzung vorgeschlagen werden können (sichtbar gemacht
durch eine Betätigung der rechten Maus bei der
hervorgehobenen Ergänzungszeichenkette). Die häufigste
Wortreihenfolge im Deutschen ist jene, bei welcher die
Nominativ-Ergänzung das erste Element in dem Satz ist. Daher
ist die Nominativ-Ergänzung "der Mann" weniger
wahrscheinlich, eine Korrektur zu benötigen, da sie das erste
Element darstellt. Die andere Nominativ-Ergänzung "der
Richter" ist verdächtiger, und wird dem Benutzer zuerst als
möglicher Fehler angezeigt. Dies widerspricht der üblichen
Grammatiküberprüfungssequenz von links nach rechts, und es
wird zusätzliche Logik zur Implementierung verwendet. Dem
Benutzer werden allerdings verdächtigere Auswahlen zuerst
dargeboten, was dem Benutzer Zeit und Frustrationen ersparen
kann. Die Reihenfolge der Präsentation von Fehlern ist daher
heuristisch, und beruht auf der Erfahrung, welche Fehler
bezüglich grammatischer Fälle am wahrscheinlichsten sind.
Die Präsentation von Vorschlägen für Ergänzungen wird
allerdings nicht streng nur auf heuristischer Grundlage
vorgenommen, da verschiedene Bedeutungen möglich sind, und
die Grammatiküberprüfungseinrichtung keinen Zugriff auf die
vom Benutzer angestrebte Bedeutung hat.
Die sich ergebende Reaktion auf die
Grammatiküberprüfungseinrichtung auf den Eingangsfehlersatz
kann beispielsweise folgendermaßen sein:
- 1. Ordne einen grünen Schnörkel unter "der Richter" an, mit folgenden beiden Überschreibungsvorschlägen: den Richter und dem Richter. Falls der Benutzer "ignorieren" auswählt, dann:
- 2. Ordne einen grünen Schnörkel unter "der Mann" an, mit den beiden Überschreibungsvorschlägen: den Mann und dem Mann.
Wenn der Benutzer den Vorschlag 1. akzeptiert, dann wird der
Schritt 2. nicht aktiviert, das Akzeptieren des ersten
Vorschlages den Satz korrigiert.
Der Fallkorrekturcode kann drei Hauptbestandteile umfassen:
(a) den Filter 203 für verdächtige Sätze, (b) die
Fehlerfeststellung 204, (c) die Zielfallberechnung und
Anordnung in einer Reihenfolge 205, und (d) die
Überschreibungserzeugung (Ersetzungserzeugung) 206.
Der Filter 203 für verdächtige Sätze identifiziert korrekte
Sätze, die leicht mit Sätzen verwechselt werden können, die
einen Fehler in Bezug auf den grammatischen Fall enthalten,
und ist in einem Modul implementiert, welches als Funktion
bezeichnet wird: susp_parse (segrec seg). Diese Funktion
empfängt einen Satz (oder Teile eines Satzes) und berechnet
Bestrafungswerte durch Zuordnung von Bestrafungspunkten zu
"verdächtigen" Eigenschaften, die sich in dem Satz auffinden
lassen. Diese Bestrafungspunkte können zueinander addiert
werden, um Rückkehrwerte zur Verfügung zu stellen, die dazu
fähig sind, die Grammatiküberprüfungseinrichtung dagegen zu
sperren, bestimmte Fehlerklassen zu überprüfen, insbesondere
solche, die eine verläßliche Satzstruktur benötigen, um mit
ihnen arbeiten zu können. Es kann mit zahlreichen einzelnen
bekannten Problemen, Schwierigkeiten, Mehrdeutigkeiten fertig
werden, und arbeitet daher wie ein Steuerfeld, mit welchem
die Abdeckung eingegebener Sätze individuell geregelt werden
kann. Abhängig davon, wie gut die gesamte
Grammatiküberprüfungseinrichtung für die deutsche Sprache
bestimmte Probleme behandeln kann, können Strafzuordnungen
eingestellt werden, wenn eine erhöhte Erfahrung bei anderen
Modulen der Grammatiküberprüfungseinrichtung auf
heuristischer Grundlage erhalten wird.
Fig. 4 erläutert ein Flußdiagramm der Fehlerfeststellung
300. In Fig. 4 beginnt der Verfahrensablauf mit einer
falschen Benutzereingabe 301, die allgemein der falschen
Eingabe 200 in Fig. 3 entspricht.
Der Satz oder der Satzteil mit dem Verb wird bei der
Analysemaschine 302 analysiert, welche allgemein der
Analysemaschine 210 von Fig. 3 entspricht. Der Satzteil mit
dem Verb wird dann an den Filter 304 für verdächtige Sätze
übertragen, welche allgemein dem Satzfilter 203 in Fig. 3
entspricht. Dann werden Verben enthaltene Satzteile, die
nicht verdächtig sind, an die Fehlererfassung 300 übertragen,
beginnend bei 306.
Als Teil der Fehlererfassung 300 identifiziert eine
Identifizierungsroutine 308 das Element "nennt", welches eine
bestimmte Fallkombination erfordert. Eine
Identifizierungsroutine 310 identifiziert sämtliche
Ergänzungen, welche die Anforderungen dieses Elements
erfüllen können. Bei einfachen Beispielen ist das Element,
welches die Umgebung des grammatisches Falles erfordert,
gewöhnlich das Hauptverb eines Satzes, und stellen die Träger
des grammatischen Falles die Gruppen von Substantiven um
dieses herum dar. Beispiel: "Der Mann gibt der Frau ein neues
Buch".
gibt = ein Verb, das bei 308 identifiziert wird, und Fallergänzungen in Bezug auf den Nominativ, den Dativ und den Akkusativ erfordert
Der Mann = Gruppe von Substantiven im Nominativ (Ergänzung), identifiziert bei 310.
der Frau = Substantivgruppe im Dativ (Ergänzung), identifiziert bei 310.
ein neues Buch = Substantivgruppe im Akkusativ (Ergänzung), identifiziert bei 310.
gibt = ein Verb, das bei 308 identifiziert wird, und Fallergänzungen in Bezug auf den Nominativ, den Dativ und den Akkusativ erfordert
Der Mann = Gruppe von Substantiven im Nominativ (Ergänzung), identifiziert bei 310.
der Frau = Substantivgruppe im Dativ (Ergänzung), identifiziert bei 310.
ein neues Buch = Substantivgruppe im Akkusativ (Ergänzung), identifiziert bei 310.
Da nicht alle Satzstrukturen so einfach sind, ermittelt eine
spezielle Funktionsliste {segrec} find_args (segrec seg) bei
310 jene Elemente, die einen Fall benötigen, und sämtliche
Ergänzungen (oder Argumente), die zum Umfang dieses Elements
gehören. Die Funktion: list {segrec} find_args (segrec seg)
nimmt den eingegebenen Satz an, und schickt die Liste von
Argumenten (also Ergänzungen) zurück, welche die korrekte
Fallkombination benötigen, bei 310. Diese spezielle Funktion
bei 310 hilft dabei, das Hauptverb von Hilfsverben zu
unterscheiden, identifiziert Unterfälle, welche die Rolle
einer Gruppe von Nicht-Substantiven einnehmen können, und
fügt sie der Rückkehrliste hinzu, statt der Ergänzung für ein
Substantiv. Bei koordinierten Strukturen mit gemeinsam
genutzten Subjekten fügt sie den einen Nominativ enthaltenden
Satz der Rückkehrliste jedes koordinierten Untersatzes hinzu.
Zum Beispiel: "Der Mann gibt der Frau ein neues Buch und [der
Mann] kauft dem Kind ein Eis".
In Sätzen, die normalerweise kein explizites Subjekt
enthalten (beispielsweise Befehlssätze wie "Gib mir das
Buch!") arbeitet die spezielle Funktion bei 310 so, daß sie
zeitweilig ein Scheinsubjekt (virtuell oder impliziert) der
Rückkehrliste hinzufügt, so daß dieselben Regeln bei
derartigen Sätzen angewendet werden können wie bei Sätzen,
die ein Subjekt aufweisen. Hierdurch wird vermiedene, doppelt
so viele Codes zu verwenden, um sämtliche Tests für die
Fehlerfeststellung und die Zielfallberechnung bei beiden
Arten von Sätzen anzuwenden. Diese spezielle Funktion bei 310
befaßt sich auch mit verschiedenen grammatischen Ausnahmen
und berücksichtigt Fehler der grammatischen Analyse (also
fehlerhaft analysierte Satzstrukturen).
Bei einige Szenarien ist es nicht das Verb, das das
wesentliche Element darstellt, das einen grammatischen Fall
benötigt, sondern ein Adjektiv. Es ist vorzuziehen, erkennen
zu können, wann ein Adjektiv die Fähigkeit hat, den
Anforderungen an einen grammatischen Fall eines Hauptverbs
vorzugeben, da andererseits die Möglichkeit besteht, daß
fehlerhaft ein korrekter Satz als nicht korrekt markiert
wird. Zum Beispiel: "Das Pferd ist dem Mann zu teuer". Das
Hauptverb dieses Satzes ist "ist", welches normalerweise zwei
Nominative benötigt (wie in: "Das Pferd ist (=) ein Sieger".
Beim ersten Beispiel, ist es jedoch das vergleichende
Adjektiv "zu teuer", welches die Dativergänzung ("dem Mann")
gestattet. Würde man schließlich erkennen, müßte man "dem
Mann" markieren, und "der Mann" offerieren, wodurch ein
korrekter Satz falsch würde.
Adjektive, die einen bestimmten Fall erfordern, können
entsprechend im Lexikon markiert werden. Allerdings gibt es
mehr Adjektive, die einen unterschiedlichen Fall zulassen,
als das Verb erfordern würde, und tritt es manchmal auf, daß
ein Adjektiv fehlerhaft als Adverb interpretiert wird. Um mit
derartigen Problemen fertig zu werden, ist eine spezielle
Funktion adj_case bei 312 vorgesehen, welche Fälle
identifiziert, die infolge des Vorhandenseins von Adjektiven
und Adverbien unzulässig sind: Function: atom adj_case
(segrec seg), welche den eingegebenen Satz empfängt, und ein
Atom zurückgibt, welches den Fall bzw. die Fälle angibt,
welche die Anforderungen des Hauptverbs an den grammatischen
Fall überschreiben können.
Im Deutschen ist es nicht immer klar, ob die
Partizipperfektform eines Verbums als Hauptverb oder als
Adjektiv analysiert werden sollte. Die
Fehlererfassungskomponente identifiziert Partizipperfekte,
die als Adjektive analysiert wurden, und verwendet die
Anforderungen an den grammatischen Fall ihrer Verbleseform,
um die korrekte Falleinstellung zu ermitteln, die zur
Verbform paßt.
Eine Eigenschaft der deutschen Sprache stellt eine besondere
Herausforderung in Bezug auf die Handhabung ihrer
grammatischen Geschlechter dar: die Verwendung des "freien"
Dativs. Dies stellt eine Dativergänzung dar, die nicht von
irgendeinem Element in dem Satz gefordert wird, sondern
häufig grammatisch zulässig ist. Allerdings ist sie nicht
immer zulässig, so daß Szenarien festgelegt wurden, in denen
das Vorhandensein der Dativergänzung nicht als Fehler
markiert wird.
Eine Liste von Ausnahmen kann bei 314 eingeschlossen werden,
die dazu beiträgt, Wörter und Umstände zu identifizieren, die
eine spezielle Handhabung von Erfordernissen grammatischer
Fälle benötigen.
Da eine unendliche Anzahl an möglichen falschen Szenarien
vorhanden ist, enthält die Fehlererfassungskomponente 316
eine große Gruppe korrekter Fallkombinationen, mit welchen
die Benutzereingabe verglichen wird. Falls keine Anpassung in
Bezug auf ein korrektes Szenarium vorhanden ist, wird ein
Fehler angenommen, und wird die Zielfallberechnung
aufgerufen.
Die Tatsache, daß ein Element, welches ein bestimmtes
Fallszenarium erfordert, verschiedene Bedeutungen aufweisen
kann, läßt es bevorzugen, die Information aufzuteilen, die zu
jeder Bedeutung gehört, und einen Schleifendurchlauf
durchzuführen, damit man nur mit der Information in Bezug auf
die Anforderungen des einzelnen Falls tätig werden muß. Diese
Schleife ist schematisch dargestellt, beginnend bei 320, und
ist auch bei 211 in Fig. 3 dargestellt. Entsprechendes gilt
für Substantivgruppen, die mehr als einen Fall aufweisen
können (beispielsweise "das Kind", entweder Nominativ oder
Akkusativ). Derartige Ergänzungen können nur einen der Fälle
in der Rolle benutzen, die sie in dem Satz spielen, jedoch
ist es unvermeidlich klar, welche Ergänzung geeignet ist. Zur
Klarstellung, und insbesondere zur Berechnung einer korrekten
Zielfallkombination ist es vorzuziehen, die Permutationen der
Zuordnungen gleicher Fälle zu durchlaufen. Diese Schleife ist
bei 212 in Fig. 3 dargestellt.
Eine spezielle Herausforderung stellen passive und
infinitivische Sätze dar. Letzere sind äußerst unbestimmt in
ihrer Struktur. Es ist vorzuziehen, sämtliche Komponenten zu
identifizieren, die potentiell zu diesem Satzteil gehören (da
sie sich auf einem Niveau befinden können, das von innerhalb
des infinitivischen Satzes nicht zugreifbar ist).
Die passiven Sätze weisen normalerweise unterschiedliche
Anforderungen an den grammatischen Fall auf als ihre
Indikativ-Gegenstücke. Die richtige Übersetzung von
Indikativ-Fallszenarien in passive wurde bei 316 nur begrenzt
durchgeführt, infolge der Komplexizität des Problems.
Fig. 5 zeigt ein Flußdiagramm 400 eines
Zielfallberechnungsvorgangs.
Die Zielfallberechnung wird durch eine Funktion durchgeführt,
die bezeichnet ist als: list ({segrec} get_case (segrec seg,
segrec verb, list {segrec} arglist). Die Funktion get_case
wird bei 402 gestartet. Der Rückkehrwert ist eine Liste von
"Segmentdatensätzen", also Datensätzen, welche Satzelemente
beschreiben (im vorliegenden Fall: die Gruppen ohne
Substantiva oder Ergänzungen). Diese Liste enthält die in
Bezug auf den grammatischen Fall eingestellten Datensätze
ohne Substantiv, die als Vorschläge für die Ersetzung dem
Benutzer dargeboten werden. Segrec seg ist ein Datensatz, der
den eingegebenen Satz enthält. Segrec verb ist in der Liste
enthalten, und stellt das Verb dar, das die
Zielfallanforderungsinformation enthält. List {segrec}
arglist ist eine Liste von Argumenten, also von Datensätzen
ohne Substantiv, die durch die find_args-function
identifiziert wurden.
Diese Zielfallfunktion geht durch eine entsprechende Gruppe
von Szenarien hindurch wie die Fehlererfassungskomponente
(Fig. 4), um eine korrekte Gruppe von Fällen in der Liste
der Ergänzungen bei 416 zu erzeugen. Allerdings sind die
Szenarien bei der Zielfallberechnung 400 erheblich stärker
eingeschränkt, da ein höchstens zulässiges Szenarium nicht
unbedingt jenes ist, das als Ergänzung angeboten werden
sollte. Daher konzentriert man sich auf striktere
Anforderungen, die durch die Änderungen erfüllt werden, die
vorgeschlagen werden.
Ein Teil der Zielfallberechnung 400 stellt die Verifizierung
der Übereinstimmung von Subjekt/Verb und Anzahl/Person bei
408 dar. Wenn beispielsweise zwei mögliche Nominativ-
Ergänzungen vorhanden sind, jedoch nur eine von diesen
dieselbe Anzahl und Person mit dem Subjekt teilt, dann würde
man nicht wünschen, den einzigen passenden Nominativ durch
irgendeinen anderen grammatischen Fall zu ersetzen.
Nominativ-Ergänzungen müssen mit dem Verb übereinstimmen.
Falls die Grammatiküberprüfungseinrichtung einen
unterschiedlichen Fall für die einzig übereinstimmende
Substantivgruppe im Nominativ vorschlägt, oder wenn die
Grammatiküberprüfungseinrichtung versucht, eine Nominativ-
Überschreibung für eine Pluralergänzung vorzuschlagen,
während das Verb im Singular ist, würde die
Grammatiküberprüfungseinrichtung in beiden Fällen einen neuen
Fehler erzeugen. Die Überprüfung auf eine Übereinstimmung von
Subjekt und Verb bei 408 trägt daher zur Zielfallberechnung
für neue Vorschläge bei.
Da die Grammatiküberprüfungseinrichtung vorzugsweise nicht
einen Satz korrigiert, der mehr als einen Fehler in Bezug auf
einen grammatischen Fall enthält, also Sätze, die nicht durch
Ersetzung richtig gestellt werden können, wurden behandelbare
Fehlerszenarien in der Zielfallfunktion 400 definiert. Diese
Definitionen sind nicht so spezifisch wie die Definitionen
für korrekte Fälle in dem Fehlererfassungsteil, unterstützen
jedoch die Vermeidung des Versuchs, unvollständige oder nicht
korrekte Empfehlungen zu geben. Darüber hinaus stellen sie
eine Grundlage für die Reihenfolge heuristischer Maßnahmen
dar, was es dem Programm gestattet, festzustellen, in welcher
Reihenfolge die Ergänzungen durch die Funktion
zurückgeschickt werden können. Diese Reihenfolge ist jene,
die dann dem Benutzer angezeigt wird.
Eine umfangreiche Behandlung grammatischer Ausnahme ist dazu
dienlich, die Möglichkeiten für Ersetzungen auf nur die
erforderlichen zu beschränken. Vorzugsweise sollte man sich
über die Korrektur sicher sein, die dem Benutzer angeboten
wird. Wenn keine bestimmte Empfehlung bei 410 berechnet
werden kann, wird die Funktion mit einer leeren Liste bei 412
verlassen, was das Fallkorrekturgerät dazu zwingt, anzuhalten
oder weitere Berechnungen bei 414 zu sperren. Dies stellt
nicht nur eine Sicherheitsmaßnahme für unbestätigte
Korrekturen dar, sondern auch eine zusätzliche Art und Weise,
die fehlerhafte Markierung korrekter Eingaben zu vermeiden.
Wenn aus irgendeinem Grund ein korrekter Satz nicht zu einer
der definierten, korrekten Fallumgebungen paßt (der Satz kann
stark elliptisch sein, falsch grammatisch analysiert worden
sein, oder einen sehr seltenen Aufbau verwenden), wird immer
noch keine Ergänzung in dem Satz hervorgehoben, es sei denn,
daß es einem Vorschlag für eine Ersetzung gelingt, die
strengen Anforderungen zu erfüllen, die in der Funktion
get_case_function definiert wurden.
Die Zielfallberechnung ist sehr kompliziert, da sie nicht
einfach die Liste der Ergänzungen durchlaufen kann, und
sämtliche (mathematisch) möglichen Kombinationen von Fällen
zuordnen kann. Um die beste Rangreihenfolgeheuristik zu
bestimmen ist es vorzuziehen, die exakte Positionierung jeder
Ergänzung in dem Satz zu kennen (in Bezug aufeinander).
Die Zugänglichkeit der konkreten Ergänzungen macht es
einfach, eine weitere Feinabstimmung von
Ersetzungsbedingungen vorzunehmen, unter Berücksichtigung
semantischer Aspekte (was momentan nur auf einem
grundlegenden Niveau erfolgt).
Dieselben Ergebnisse, welche get_case berechnet, werden auch
von der Komponente 207 in Fig. 3 verwendet, welche
NP-Nichtübereinstimmungsfehler behandelt (also fehlende
Übereinstimmung innerhalb einer Substantivgruppe (NP)). Da in
derartigen Fällen nicht die Frage ist, welche Ergänzung eine
Ersetzung benötigt, sondern nur, welche Fälle dabei hilfreich
sind, eine gut gebildete NP in dem Zusammenhang des
Umgebungssatzes vorzuschlagen, benötigt die
NP-Nichtübereinstimmungskomponente einen unterschiedlichen
Rückkehrwert als die Fallkorrekturkomponente. Daher wird eine
Einkapselungsfunktion verwendet: Function: list {atom}
get_case 2 (segrec seg). Diese Funktion nimmt die nicht
übereinstimmende NP als Eingangsgröße, und findet die
Umgebung, in welcher die nicht übereinstimmende NP die
Zuordnung eines geeigneten Falles erfordert, sowie das den
Fall bestimmende Verb. Mit dieser Information werden alle
Argumente verfügbar, welche die Funktion get_case benötigt,
und kann sie dazu berechnet werden, die möglichen Zielfälle
für unsere nicht passende NP zu berechnen (einige zusätzliche
Funktionen werden in get_case für die nicht passende
Information bei der nicht passenden Ergänzung verwendet,
jedoch sind abgesehen davon alle grundlegenden Überprüfungen
ebenfalls anwendbar). Die Datensatzliste, die durch get_case
zurückgeschickt wird, wird dann in einen geeigneteren
Rückkehrwert für die NP-Nichtübereinstimmungskomponente
übersetzt: Eine Liste von Atomen (= zeichenkettenartiger
Datentyp), welche den Zielfall bzw. die Zielfälle
repräsentieren, die für das Überschreiben der nicht
übereinstimmenden NP möglich sind.
Obwohl die Abdeckung für die Fallkorrektur selbst niedriger
für komplizierte Eingaben ist, die zu Beginn herausgefiltert
würden, ist die Abdeckung für NP-Nichtübereinstimmungsfehler
recht hoch, was als weiterer Beleg dafür angesehen werden
kann, daß die Fallberechnungsergebnisse eine hohe Erfolgsrate
aufweisen.
Fig. 6 erläutert ein Flußdiagramm 500 der
Überschreibungserzeugung. Das Ergebnis der Funktion get_case
(NP-Liste) 502 wird an eine Komponente weitergeleitet, welche
die erforderlichen Einstellungen bei jedem Element der
Listenelemente (also Substantivgruppen) vornimmt, und welche
die Anzeige mehrerer Ersetzungsvorschläge für Listenelemente
steuert.
Die Komponente durchläuft die NP-Liste, und durchläuft für
jedes Listenelement (Substantivgruppe) durch jedes Element,
das die Substantivgruppe enthält.
Beispielsweise ist "das neue Buch" eine Substantivgruppe, die
Teil der NP-Liste sein könnte. Sie enthält ein
Bestimmungswort (Artikel) "das", ein Adjektiv "neue", und ein
Substantiv "Buch".
Jedem dieser Elemente muß ein neuer Zielfall zugeordnet
werden, der von get_case als eine der Anmerkungen zu dem
Datensatz "das neue Buch" übertragen wurde. In einigen
Situationen ist die Anzahl und das grammatische Geschlecht
einer Substantivgruppe nicht eindeutig. Beispielsweise könnte
"Angestellten" die Pluralform von "Angestellte" (sämtliche
Fälle) sein, die Dativ- oder Genitiv-Singularform für eine
weibliche "Angestellte", oder die Akkusativ-Singularform für
einen männlichen "Angestellten". Wenn ein vorheriger
Fallfehler vorhanden ist, muß möglicherweise mehr als ein
grammatisches Geschlecht bei der Überschreibung überlegt
werden. Daher durchläuft die Fallzuordnungsprozedur
folgendes:
- - jede Substantivgruppe in der NP-Liste bei 502
- - jede Anzahl der Substantivgruppe (das Verb gibt die Zielanzahl vor, es sei denn, der Zielfall ist der Nominativ) bei 504
- - jedes grammatische Geschlecht der Substantivgruppe bei 506, und
- - jedes Element, das die Substantivgruppe enthält, bei 508.
Der eingestellte Substantivgruppendatensatz erhält dann ein
Attribut oder einen Fall bei 510 zugeordnet, der die exakten
Ersetzungsbefehle enthält. Die Schritte 508, 506, 504, 510 in
Fig. 6 entsprechen allgemein den vier verschachtelten
Schleifen 212 in Fig. 3.
Dieses Ersetzungsattribut nimmt eine Liste möglicher
Ersetzungen als einen Wert. Die erste berechnete Ersetzung
wird bei 512 addiert, und bei 514 ganz oben bei einer Liste
möglicher mehrerer Vorschläge angezeigt. Wenn ein
Ersetzungsattribut bereits im Datensatz vorhanden ist, dann
werden die weiteren Elemente in der Ersetzungsliste als
alternative Ersetzung markiert, so daß sie nicht einen neuen
Hervorhebungsschnörkel auslösen, sondern unterhalb des ersten
Ersetzungsvorschlags in einem Herunterfallmenue auftauchen.
Wie voranstehend geschildert durchläuft das
Fehlererfassungsmodul (welches die Funktion get case aufruft)
unterschiedliche Verbalfallumfänge und ebenso zweifelhafte
Fallzuordnungen zu Substantivgruppen. Daher kann die Funktion
get case mehrfach aufgerufen werden, und mehrere Listen
zurückschicken, welche Datensätze erhalten, die ersetzt
werden sollten. Es ist möglich, daß eine Ergänzung in der
Liste mit derselben neuen Fallzuordnung enthalten ist, die
sie bereits in einer früheren Liste hatte, die durch die
Überschreibungserzeugung geschickt wurde. Daher wird jede
eingestellte Ergänzung in einer Speicherliste gespeichert,
mit welcher neue Listenelemente verglichen werden. Auf diese
Weise bietet das Programm nicht nur einen Schutz gegen die
redundante Wiederholung von Überschreibungsvorschlägen,
sondern bietet auch bessere Leistungen, nämlich durch
Herausfiltern dessen, was nicht die Fallzuordnungsleistung
durchlaufen muß. Alternative Ersetzungsvorschläge können
immer noch hinzugefügt werden, selbst nach einer Anzahl von
Schleifen von get_case. Die Zuordnung des
Ersetzungsattributs ist mit der Position des Datensatzes in
dem Satz verbunden, und daher werden alternative Ersetzungen
vorzugsweise korrekt als solche erkannt, und zur
entsprechenden Liste hinzugefügt.
Der Grund dafür, daß Ersetzungen nur für Satzelemente
vorgeschlagen werden, obwohl der Fehler in der
Fallkombination eines gesamten Satzes auftreten kann, ist
folgender: deutsche Sätze sind häufig relativ lang. Es
verbessert die Klarheit des grammatischen Problems, wenn man
versucht, den minimalen Fehlerort anzugeben und
hervorzuheben, selbst wenn mehr als ein sich gegenseitig
ausschließender Fehlerort vorhanden ist. Das Szenario,
welches den gesamten Satz ersetzen würde, wäre nicht
ausreichend anwendbar, da eine Implementierung für die Praxis
die Anzahl an Überschreibungen, die dem Benutzer angeboten
werden, auf nur drei begrenzt. Bei unserem ursprünglichen
Beispiel würde ein Überschreiben des gesamten Satzes die
Anzeige von vier Ersetzungsvorschlägen erfordern:
- - Der Mann nennt den Richter einen Lügner.
- - Der Mann nennt dem Richter einen Lügner.
- - Den Mann nennt den Richter einen Lügner.
- - Dem Mann nennt den Richter einen Lügner.
Bei einem Szenario, bei welchem man Ersetzungsvorschläge für
alle drei Ergänzungen (immer noch eine zur Zeit) und zwei
Verbalfallmöglichkeiten hätte, würde die Anzahl auf neun
Vorschläge ansteigen. Insbesondere bei langen Sätzen wäre es
erheblich unbequemer für den Benutzer, sich durch sämtliche
Beispiele hindurchzulesen, wenn alle gleichzeitig angeboten
würden. Durch die Begrenzung in der Praxis, dem Benutzer nur
drei Vorschläge anzubieten, könnte der korrekte Vorschlag
verfehlt werden, wenn nur drei der neun Möglichkeiten
angezeigt würden.
Fig. 7 zeigt ein Blockschaltbild eines zweiten Beispiels für
eine Grammatiküberprüfungsschaltung.
In Fig. 7 weist eine Grammatiküberprüfungsschaltung eine
Stromversorgungs- und Sequenzierschaltung 104 auf, welche die
Versorgung und die Sequenzierung des Betriebs anderer
Schaltungselemente übernimmt. Die Schaltung in Fig. 7
implementiert einen Vorgang wie jenen, der in den Fig. 3
bis 6 gezeigt ist, in einer Computerumgebung, beispielsweise
jener, die in Fig. 2 gezeigt ist. Die Speicherschaltung 110
speichert eine Wordprocessordatei, welche Textsätze und
Textformatierung enthält. Die Speicherschaltung 110 stellt
die Textsätze über den Datenbus 112 der Speicherschaltung 114
zur Verfügung. Die Speicherschaltung 114 speichert die Sätze
als Liste von Sätzen, so daß Sätze bequem einzeln als
Eingangsdaten für Grammatikuntersuchungen in anderen
Schaltungen ausgewählt werden können. Die Speicherschaltung
114 stellt Sätze hintereinander, und zwar jeweils einen zur
Zeit, über den Datenbus 118 der Grammatikanalyseschaltung 120
zur Verfügung. Die Grammatikanalyseschaltung 120 führt eine
grammatische Analyse eines Textsatzes in Verbalsatzteile
durch. Bei der Durchführung des Grammatikanalysevorgangs
greift die Grammatikanalyseschaltung 120 auf grammatische
Information zu, die in dem Satz benutzte Wörter betrifft,
über den Bus 130, aus einem detaillierten Lexikon, das in der
Speicherschaltung 148 gespeichert ist. Die
Grammatikanalyseschaltung 120 nimmt auch einen Zugriff auf
üblicherweise verwendete idiomatische Information über den
Bus 132 in einer Liste von Sprachheuristiken durch, die in
der Schaltung 152 gespeichert ist. Die
Grammatikanalyseschaltung 120 stellt Verbalsatzteile
hintereinander, jeweils einen zur Zeit, über den Datenbus 128
einer Speicherschaltung 134 zur Verfügung, welche die
Verbalsatzteile speichert. Die Grammatikanalyseschaltung 120
wird so getriggert oder gesteuert, daß sie Verbalsatzteile
zur Verfügung stellt, durch ein Triggersignal, das auf der
Leitung 122 von einer Zielfallberechnungsvorrichtung 138
empfangen wird, oder kann durch ein Triggersignal getriggert
werden, das auf der Leitung 124 von der Tastatur 164
empfangen wird. Wenn ein Verbalsatzteil grammatisch überprüft
wurde, und sich der Satzteil als grammatisch korrekt
herausstellte, dann wird der Trigger entlang der Leitung 122
zur Verfügung gestellt. Stellt sich bei dem Satzteil heraus,
daß er grammatisch nicht korrekt ist, dann wartet die
Grammatikanalyseeinrichtung auf einen Trigger von der
Tastatur 164. Wenn die Grammatikanalyseschaltung 120 keine
neuen Satzteile hat, die sie auf dem Bus 128 zur Verfügung
stellen kann, dann stellt die Grammatikanalyseschaltung 120
einen Trigger über die Leitung 116 der Speicherschaltung 114
zur Verfügung, damit der nächste Satz in der Folge, der
grammatisch untersucht werden soll, bereitgestellt wird.
Die Zielfallberechnungsschaltung 138 identifiziert das Verb
des Verbalsatzteils, der über den Bus 136 empfangen wurde.
Das identifizierte Verb wird über die Leitung 144 dem Lexikon
zugeführt, das in der Schaltung 148 gespeichert ist. Das
Lexikon stellt Daten über die Leitung 146 zur Verfügung,
welche die grammatisch korrekten Kombinationen von Fällen
anzeigen, die bei dem identifizierten Verb möglich sind. Die
Zielfallberechnungsschaltung 138 vergleicht die grammatisch
korrekten Kombinationen von Fällen mit jener Kombination von
Fällen in dem Verbalsatzteil, der vom Bus 136 empfangen
wurde. Ist der Verbalsatzteil grammatisch korrekt, dann ist
keine weitere Maßnahme erforderlich, und dann wird der
Verbalsatzteil aus der Zielfallberechnungsschaltung gelöscht,
und wird ein Ausgangssignal bei 140 bereitgestellt, um einen
Trigger über die Leitung 122 für die
Grammatikanalyseschaltung 120 bereitzustellen, damit diese
den nächsten Verbalsatzteil bereitstellt. Wenn andererseits
der Satzteil grammatisch nicht korrekt ist, dann wird der
nicht korrekte Satzteil auf dem Bus 142 zusammen mit den
möglichen Kombinationen von Korrekturen der grammatischen
Fallendung der Sprachheuristikschaltung 152 zur Verfügung
gestellt. Die Sprachheuristikschaltung 152 berücksichtigt die
Wortreihenfolge, die in dem Satz verwendet wird, und wählt
die beiden wahrscheinlichsten Korrekturen aus. Der nicht
korrekte Satzteil und die beiden wahrscheinlichsten
Korrekturen werden über den Bus 154 der Anzeige 156 zur
Verfügung gestellt. Die Anzeige 156 zeigt einen Abschnitt der
ursprünglichen Wordprocessordatei an, die von dem Bus 106
empfangen wurde, hebt den nicht korrekten Satzteil hervor,
sowie die beiden wahrscheinlichsten Korrekturen, die vom Bus
154 empfangen wurden. Die Anzeige 156 wird von einem Benutzer
160 entlang einer Betrachtungslinie 158 betrachtet. Der
Benutzer 160, der Zugriff auf die angestrebte Bedeutung aus
dem Kontext der ursprünglichen Wordprocessordatei hat, nimmt
eine Betätigung 162 der Tastatur 164 vor, um entweder eine
der Korrekturen auszuwählen, andere Korrekturen vorzunehmen,
oder keine Korrekturen vorzunehmen. Die Änderungen werden
über die Leitung 108 übertragen, um die Wordprocessordatei zu
ändern oder zu korrigieren, die in der Schaltung 110
gespeichert ist.
Der momentan ausgewählte Satz wird auf der Leitung 126
angezeigt, so daß die Anzeige 156 den entsprechenden
Abschnitt der Wordprocessordatei anzeigt.
Wie dies in den Fig. 1 bis 7 dargestellt ist, werden ein
Verfahren und eine Einrichtung zur Grammatiküberprüfung eines
Satzes in der deutschen Sprache beschrieben. Die
Grammatiküberprüfungseinrichtung führt eine Grammatikanalyse
des Satzes in einen Verbsatzteil und eine ursprüngliche
Substantivsatzteilkombination durch, welche dem Verbsatzteil
zugeordnet ist. Die Grammatiküberprüfungseinrichtung nimmt
einen Zugriff auf eine Morphologietabelle vor, um eine
ursprüngliche Fallkombination zu definieren, welche der
ursprünglichen Substantivsatzteilkombination zugeordnet ist.
Die Grammatiküberprüfungseinrichtung nimmt einen Zugriff auf
ein Lexikon vor, um eine korrekte Fallkombination zu
definieren, welche dem Verbsatzteil zugeordnet ist. Die
Grammatiküberprüfungseinrichtung vergleicht die ursprüngliche
Fallkombination mit der korrekten grammatischen
Fallkombination, und erzeugt eine Fallfehlerkombination. Die
Grammatiküberprüfungseinrichtung erzeugt eine Kombination von
Satzüberschreibungen, welche die Änderung eines grammatischen
Falls auf einen Substantivsatzteil enthält, welche die
Fallfehlerkombination korrigiert.
Zwar wurde die vorliegende Erfindung unter Bezugnahme auf
bevorzugte Ausführungsformen beschrieben, jedoch werden
Fachleute auf diesem Gebiet erkennen, daß sich Änderungen in
Bezug auf die Form und Einzelheiten vornehmen lassen, ohne
vom Wesen und Umfang der Erfindung abzuweichen.
Claims (18)
1. Computerisiertes Verfahren der Grammatiküberprüfung
eines Satzes in der deutschen Sprache, mit folgenden
Schritten:
grammatische Analyse des Satzes in einen Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination, die dem Verbsatzteil zugeordnet ist;
Zugriff auf eine Morphologietabelle, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
Zugriff auf ein Lexikon zur Definition einer korrekten Fallkombination, die dem Verbsatzteil zugeordnet ist;
Vergleichen der ursprünglichen Fallkombination mit der korrekten Fallkombination, und Erzeugung einer Fallfehlerkombination; und
Erzeugung einer Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.
grammatische Analyse des Satzes in einen Verbsatzteil und eine ursprüngliche Substantivsatzteilkombination, die dem Verbsatzteil zugeordnet ist;
Zugriff auf eine Morphologietabelle, um eine ursprüngliche Fallkombination zu definieren, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
Zugriff auf ein Lexikon zur Definition einer korrekten Fallkombination, die dem Verbsatzteil zugeordnet ist;
Vergleichen der ursprünglichen Fallkombination mit der korrekten Fallkombination, und Erzeugung einer Fallfehlerkombination; und
Erzeugung einer Kombination von Satzüberschreibungen, welche die Änderung eines grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.
2. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.
Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.
3. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Begrenzung der Anzahl an Satzüberschreibungen, die dargeboten werden, auf nicht mehr als drei Überschreibungen pro Substantivsatzteil.
Begrenzung der Anzahl an Satzüberschreibungen, die dargeboten werden, auf nicht mehr als drei Überschreibungen pro Substantivsatzteil.
4. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Einschließen eines Subjekts und jedes direkten Objekts und jedes indirekten Objekts, die dem Verbsatzteil zugeordnet sind, in die korrekte Fallkombination.
Einschließen eines Subjekts und jedes direkten Objekts und jedes indirekten Objekts, die dem Verbsatzteil zugeordnet sind, in die korrekte Fallkombination.
5. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Erzeugung der Fallfehlerkombination ohne Zugriff auf die Bedeutung des Satzes.
Erzeugung der Fallfehlerkombination ohne Zugriff auf die Bedeutung des Satzes.
6. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Einschließen von Korrekturen bei den Fallendungen von Bestimmungswörtern, Adjektiven und Substantiven in dem Substantivsatzteil in die Satzüberschreibungen.
Einschließen von Korrekturen bei den Fallendungen von Bestimmungswörtern, Adjektiven und Substantiven in dem Substantivsatzteil in die Satzüberschreibungen.
7. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1, bei welchem der Satz in der deutschen
Sprache ein implizites Subjekt aufweist, und weiterhin
vorgesehen ist:
Einfügen eines Scheinsubjekts in die ursprüngliche Substantivsatzteilkombination, um den Vergleich zu erleichtern.
Einfügen eines Scheinsubjekts in die ursprüngliche Substantivsatzteilkombination, um den Vergleich zu erleichtern.
8. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Herausfiltern jedes Satzes mit einer verdächtig komplizierten Kombination vor dem Vergleich.
Herausfiltern jedes Satzes mit einer verdächtig komplizierten Kombination vor dem Vergleich.
9. Computerisiertes Verfahren der Grammatiküberprüfung
nach Anspruch 1,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
Feststellung einer Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich.
Feststellung einer Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich.
10. Computerisierte Grammatiküberprüfungseinrichtung für
einen Satz in der deutschen Sprache, wobei vorgesehen
sind:
ein Lexikon und eine Morphologietabelle, die auf einen computerlesbaren Medium gespeichert sind;
eine Satzanalysemaschine, welche den Satz empfängt, und eine durch grammatische Analyse erhaltene ursprüngliche Substantivsatzteilkombination und einen Verbsatzteil erzeugt, wobei die Satzanalysemaschine Zugriff auf die Morphologietabelle nimmt, und eine Anfangsfallkombination zur Verfügung stellt, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
eine Fehlerdetektorfunktion, die einen Zugriff auf das Lexikon durchführt, und eine korrekte Fallkombination erzeugt, welche dem Verbsatzteil zugeordnet ist; wobei die Fehlerdetektorfunktion die ursprüngliche Fallkombination mit der korrekten Fallkombination vergleicht, und eine Fallfehlerkombination erzeugt;
eine Zielfallberechnungsfunktion, die eine Kombination von Satzüberschreibungen erzeugt, welche die Änderung des grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.
ein Lexikon und eine Morphologietabelle, die auf einen computerlesbaren Medium gespeichert sind;
eine Satzanalysemaschine, welche den Satz empfängt, und eine durch grammatische Analyse erhaltene ursprüngliche Substantivsatzteilkombination und einen Verbsatzteil erzeugt, wobei die Satzanalysemaschine Zugriff auf die Morphologietabelle nimmt, und eine Anfangsfallkombination zur Verfügung stellt, welche der ursprünglichen Substantivsatzteilkombination zugeordnet ist;
eine Fehlerdetektorfunktion, die einen Zugriff auf das Lexikon durchführt, und eine korrekte Fallkombination erzeugt, welche dem Verbsatzteil zugeordnet ist; wobei die Fehlerdetektorfunktion die ursprüngliche Fallkombination mit der korrekten Fallkombination vergleicht, und eine Fallfehlerkombination erzeugt;
eine Zielfallberechnungsfunktion, die eine Kombination von Satzüberschreibungen erzeugt, welche die Änderung des grammatischen Falls auf einen Substantivsatzteil enthält, der die Fallfehlerkombination korrigiert.
11. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
eine Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten bis zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.
eine Anzeige der Satzüberschreibungen in einer Reihenfolge von der wahrscheinlichsten bis zur unwahrscheinlichsten in Bezug auf die Akzeptanz durch einen Benutzer.
12. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
eine Anzeige von Satzüberschreibungen, die auf nicht mehr als drei Überschreibungen pro Substantivsatzteil begrenzt ist.
eine Anzeige von Satzüberschreibungen, die auf nicht mehr als drei Überschreibungen pro Substantivsatzteil begrenzt ist.
13. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß die korrekte
Fallkombination umfaßt:
ein Subjekt und jedes direkte Objekt und jedes indirekte Objekt, die dem Verbsatzteil zugeordnet sind.
ein Subjekt und jedes direkte Objekt und jedes indirekte Objekt, die dem Verbsatzteil zugeordnet sind.
14. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß die
Fallkombination ohne Zugriff auf die Bedeutung des
Satzes erzeugt wird.
15. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß die
Satzüberschreibungen Korrekturen zu den Fallendungen von
Bestimmungswörtern, Adjektiven und Substantiven in dem
Substantivsatzteil enthalten.
16. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß der Satz in
der deutschen Sprache ein implizites Subjekt hat, und
die durch grammatische Analyse erhaltene ursprüngliche
Substantivsatzteilkombination umfaßt:
ein Scheinsubjekt, das in die ursprüngliche Substantivsatzteilkombination eingefügt wird, um den Vergleich zu erleichtern.
ein Scheinsubjekt, das in die ursprüngliche Substantivsatzteilkombination eingefügt wird, um den Vergleich zu erleichtern.
17. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
ein Filter, das jeden Satz mit einer verdächtig komplizierten Kombination vor dem Vergleich herausfiltert.
ein Filter, das jeden Satz mit einer verdächtig komplizierten Kombination vor dem Vergleich herausfiltert.
18. Computerisierte Grammatiküberprüfungseinrichtung
nach Anspruch 10,
dadurch gekennzeichnet, daß weiterhin
vorgesehen ist:
ein Detektor für eine Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich, wenn eine Nichtübereinstimmung des Substantivsatzteils vorhanden ist.
ein Detektor für eine Nichtübereinstimmung eines Substantivsatzteils (NP) in dem Satz, und Herausfiltern des Satzes vor dem Vergleich, wenn eine Nichtübereinstimmung des Substantivsatzteils vorhanden ist.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24232000P | 2000-10-20 | 2000-10-20 | |
US09/800,064 US7136808B2 (en) | 2000-10-20 | 2001-03-06 | Detection and correction of errors in german grammatical case |
Publications (1)
Publication Number | Publication Date |
---|---|
DE10120262A1 true DE10120262A1 (de) | 2002-04-25 |
Family
ID=26934998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE10120262A Ceased DE10120262A1 (de) | 2000-10-20 | 2001-04-25 | Feststellung und Korrektur von Fehlern bei grammatikalischen Fällen im Deutschen |
Country Status (2)
Country | Link |
---|---|
US (1) | US7136808B2 (de) |
DE (1) | DE10120262A1 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484319A (zh) * | 2010-09-24 | 2015-04-01 | 新加坡国立大学 | 用于自动化文本校正的方法和*** |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7389220B2 (en) * | 2000-10-20 | 2008-06-17 | Microsoft Corporation | Correcting incomplete negation errors in French language text |
JP3690730B2 (ja) * | 2000-10-24 | 2005-08-31 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 構造回復システム、構文解析システム、変換システム、コンピュータ装置、構文解析方法、及び記憶媒体 |
US7862816B2 (en) * | 2003-03-12 | 2011-01-04 | Vasgene Therapeutics, Inc. | Polypeptide compounds for inhibiting angiogenesis and tumor growth |
US7584092B2 (en) | 2004-11-15 | 2009-09-01 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US8190419B1 (en) | 2006-09-11 | 2012-05-29 | WordRake Holdings, LLC | Computer processes for analyzing and improving document readability |
US7552046B2 (en) * | 2004-11-15 | 2009-06-23 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7546235B2 (en) * | 2004-11-15 | 2009-06-09 | Microsoft Corporation | Unsupervised learning of paraphrase/translation alternations and selective application thereof |
US7788085B2 (en) * | 2004-12-17 | 2010-08-31 | Xerox Corporation | Smart string replacement |
US7908132B2 (en) * | 2005-09-29 | 2011-03-15 | Microsoft Corporation | Writing assistance using machine translation techniques |
US8731954B2 (en) | 2006-03-27 | 2014-05-20 | A-Life Medical, Llc | Auditing the coding and abstracting of documents |
US8209163B2 (en) * | 2006-06-02 | 2012-06-26 | Microsoft Corporation | Grammatical element generation in machine translation |
US7865352B2 (en) * | 2006-06-02 | 2011-01-04 | Microsoft Corporation | Generating grammatical elements in natural language sentences |
US20080221870A1 (en) * | 2007-03-08 | 2008-09-11 | Yahoo! Inc. | System and method for revising natural language parse trees |
US7908552B2 (en) | 2007-04-13 | 2011-03-15 | A-Life Medical Inc. | Mere-parsing with boundary and semantic driven scoping |
US8682823B2 (en) | 2007-04-13 | 2014-03-25 | A-Life Medical, Llc | Multi-magnitudinal vectors with resolution based on source vector features |
US9946846B2 (en) | 2007-08-03 | 2018-04-17 | A-Life Medical, Llc | Visualizing the documentation and coding of surgical procedures |
IL186505A0 (en) * | 2007-10-08 | 2008-01-20 | Excelang Ltd | Grammar checker |
US7475344B1 (en) * | 2008-05-04 | 2009-01-06 | International Business Machines Corporation | Genders-usage assistant for composition of electronic documents, emails, or letters |
US20100228538A1 (en) * | 2009-03-03 | 2010-09-09 | Yamada John A | Computational linguistic systems and methods |
US20100332215A1 (en) * | 2009-06-26 | 2010-12-30 | Nokia Corporation | Method and apparatus for converting text input |
WO2015035193A1 (en) | 2013-09-05 | 2015-03-12 | A-Life Medical, Llc | Automated clinical indicator recognition with natural language processing |
US10133727B2 (en) | 2013-10-01 | 2018-11-20 | A-Life Medical, Llc | Ontologically driven procedure coding |
WO2015112250A1 (en) * | 2014-01-22 | 2015-07-30 | Speak Agent, Inc. | Visual-kinesthetic language construction |
US11423068B2 (en) * | 2018-11-27 | 2022-08-23 | Google Llc | Canonicalizing search queries to natural language questions |
CN110362824B (zh) * | 2019-06-24 | 2022-12-02 | 广州多益网络股份有限公司 | 一种自动纠错的方法、装置、终端设备及存储介质 |
US11636263B2 (en) * | 2020-06-02 | 2023-04-25 | Microsoft Technology Licensing, Llc | Using editor service to control orchestration of grammar checker and machine learned mechanism |
CN112765968A (zh) * | 2021-01-05 | 2021-05-07 | 网易有道信息技术(北京)有限公司 | 语法纠错的方法和用于语法纠错模型的训练方法及产品 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5853787B2 (ja) * | 1979-08-30 | 1983-12-01 | シャープ株式会社 | 電子辞典 |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
US4864502A (en) * | 1987-10-07 | 1989-09-05 | Houghton Mifflin Company | Sentence analyzer |
US5559693A (en) * | 1991-06-28 | 1996-09-24 | Digital Equipment Corporation | Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms |
JP2855409B2 (ja) * | 1994-11-17 | 1999-02-10 | 日本アイ・ビー・エム株式会社 | 自然言語処理方法及びシステム |
US5995920A (en) * | 1994-12-22 | 1999-11-30 | Caterpillar Inc. | Computer-based method and system for monolingual document development |
US5794177A (en) * | 1995-07-19 | 1998-08-11 | Inso Corporation | Method and apparatus for morphological analysis and generation of natural language text |
US5878385A (en) * | 1996-09-16 | 1999-03-02 | Ergo Linguistic Technologies | Method and apparatus for universal parsing of language |
US6424983B1 (en) * | 1998-05-26 | 2002-07-23 | Global Information Research And Technologies, Llc | Spelling and grammar checking system |
US6442524B1 (en) * | 1999-01-29 | 2002-08-27 | Sony Corporation | Analyzing inflectional morphology in a spoken language translation system |
JP3539479B2 (ja) * | 1999-03-11 | 2004-07-07 | シャープ株式会社 | 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体 |
US6405161B1 (en) * | 1999-07-26 | 2002-06-11 | Arch Development Corporation | Method and apparatus for learning the morphology of a natural language |
-
2001
- 2001-03-06 US US09/800,064 patent/US7136808B2/en not_active Expired - Fee Related
- 2001-04-25 DE DE10120262A patent/DE10120262A1/de not_active Ceased
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104484319A (zh) * | 2010-09-24 | 2015-04-01 | 新加坡国立大学 | 用于自动化文本校正的方法和*** |
Also Published As
Publication number | Publication date |
---|---|
US7136808B2 (en) | 2006-11-14 |
US20020128819A1 (en) | 2002-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE10120262A1 (de) | Feststellung und Korrektur von Fehlern bei grammatikalischen Fällen im Deutschen | |
DE69734400T2 (de) | Verfahren und system zur prüfung der richtigkeit der rechtschreibung und grammatik eines dokuments | |
DE69820343T2 (de) | Linguistisches Suchsystem | |
EP1157500B1 (de) | Vorrichtung und verfahren zum verbergen von informationen und vorrichtung und verfahren zum extrahieren von informationen | |
DE19709968C2 (de) | Verfahren und System zum Übersetzen eines Dokumentes | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
DE69725883T2 (de) | Parser für natürliche sprache mit wörterbuch-basierten teilwahrscheinlichkeiten | |
DE69934371T2 (de) | Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache | |
DE602004003513T2 (de) | Vorrichtung zum Ordnen bei der Satzgenerierung für ein System zur Generierung natürlicher Sprache, basierend auf linguistisch informierten statistischen Modellen der Bestandteil-Struktur | |
DE69925831T2 (de) | Maschinenunterstützte übersetzungswerkzeuge | |
DE60308952T2 (de) | Verfahren und System zur Anzeige und Verknüpfung von Gegenständen aus elektronischer Tinte mit erkanntem Text und Objekten | |
DE102004046252A1 (de) | Einrichtung zum Trennen zusammengesetzter Wörter und zur Rechtschreibprüfung | |
DE60304066T2 (de) | Verfahren zur Normalisierung einer Diskursrepräsentationsstruktur und normalisierte Datenstruktur | |
DE112015002695T5 (de) | Systeme und Verfahren zum Bearbeiten einer Datei in einer nicht nativen Anwendung unter Verwendung einer Anwendungs-Engine | |
DE10300545B4 (de) | Vorrichtung, Verfahren, Speichermedium und Datenstruktur zur Kennzeichnung und Speicherung von Daten | |
DE102017008430A1 (de) | Verfahren und Systeme zum Erzeugen von virtuelle Realität-Umgebungen aus elektronischen Dokumenten | |
DE3616751A1 (de) | Uebersetzungssystem | |
DE10308550A1 (de) | System und Verfahren zur automatischen Daten-Prüfung und -Korrektur | |
DE10321944A1 (de) | Vorrichtungen und Verfahren zum Verarbeiten von textbasierten elektronischen Dokumenten | |
Yngve et al. | Mechanical translation | |
DE60002618T2 (de) | Verfahren und Analysewerkzeug zur Fehlerortung in einem Rechner | |
DE19849855C1 (de) | Verfahren zur automatischen Generierung einer textlichen Äußerung aus einer Bedeutungsrepräsentation durch ein Computersystem | |
DE112020003767T5 (de) | Erzeugen eines ausführbaren verfahrens aus einer textbeschreibung, die in einer natürlichen sprache geschrieben ist | |
DE60004788T2 (de) | Verfahren zum aufspüren von verstecktem text und dessen verwendung bei genehmigung von elektronischen dokumenten | |
WO2003054727A1 (de) | Kategorisierungssystem für datenobjekte und verfahren zum prüfen der konsistenz von zuordnungen von datenobjekten zu kategorien |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8131 | Rejection |