DE3789073T2 - System zur maschinellen Übersetzung. - Google Patents

System zur maschinellen Übersetzung.

Info

Publication number
DE3789073T2
DE3789073T2 DE3789073T DE3789073T DE3789073T2 DE 3789073 T2 DE3789073 T2 DE 3789073T2 DE 3789073 T DE3789073 T DE 3789073T DE 3789073 T DE3789073 T DE 3789073T DE 3789073 T2 DE3789073 T2 DE 3789073T2
Authority
DE
Germany
Prior art keywords
language
category
word
translation
machine translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE3789073T
Other languages
English (en)
Other versions
DE3789073D1 (de
DE3789073T3 (de
Inventor
Chiaki Aoyama
Akira Kumano
Yumiko Sugawara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=14619336&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=DE3789073(T2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Toshiba Corp filed Critical Toshiba Corp
Publication of DE3789073D1 publication Critical patent/DE3789073D1/de
Publication of DE3789073T2 publication Critical patent/DE3789073T2/de
Application granted granted Critical
Publication of DE3789073T3 publication Critical patent/DE3789073T3/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf ein Maschinenübersetzungssystem zum Übersetzen von Ausdrücken in einer ersten Sprache in eine zweite Sprache.
  • In jüngerer Zeit stehen Maschinenübersetzungssysteme zum automatischen Übersetzen einer Eingabesentenz in einer Sprache in eine weitere Sprache mittels eines Computers zur Diskussion. Bei diesen Maschinenübersetzungssystemen wird grundlegenderweise eine ursprüngliche Eingabesentenz geteilt in vorbestimmte Morpheme (Übersetzungseinheiten), wie zum Beispiel ein Wort oder ein Ausdruck, und zwar mittels morphologischer Analysegrammatik (Regeln zur Wortbildung); lexikalische syntaktische Information und ein eigenes Wort oder ein geeigneter Ausdruck zur Übersetzung werden bestimmt für jedes Morphem durch Gewinnen von einem Übersetzungswörterbuch; die Eingabesentenz wird syntaktisch analysiert in eine Zwischenstruktur durch eine syntaktische Analysegrammatik in einer ersten Sprache, um eine Zwischenstruktur zu bauen; die Zwischenstruktur in der ersten Sprache wird transferiert in eine Zwischenstruktur in einer zweiten Sprache durch eine Strukturtransfergrammatik; und diese gewonnenen Übersetzungskandidatenworte werden kombiniert mittels einer syntaktischen Erzeugungsgrammatik in der zweiten Sprache, um eine Sentenz in einer zweiten Sprache zu erzeugen.
  • Bei diesen Übersetzungsprozessen, wo beispielsweise Englisch in Deutsch oder umgekehrt übersetzt wird, können, da diese zwei Sprachen beide gebildet sind mit Substantiven im Singular und Plural, Merkmale anzeigend einen Unterschied im Morphem zwischen Substantiven im Singular und Plural der ersten Sprache angewendet werden wie sie sind beim Bestimmen der Singular- oder Pluralform der Substantive der zweiten Sprache. Wo jedoch beispielsweise Japanisch in Englisch übersetzt wird, ist es, da die japanische Sprache normalerweise keine Merkmale anzeigend eine Differenz im Morphem zwischen den Substantiven im Singular und Plural hat, notwendig, zu bestimmen, ob Substantive in der ursprünglichen japanischen Sentenz übersetzt werden sollten in Substantive im Singular oder Substantive im Plural. Weiterhin ist es, wo Japanisch beispielsweise in Deutsch übersetzt wird, wichtig, da Deutsch gebildet ist mit verschiedenen Merkmalen anzeigend eine Differenz im Adjektiv, bestimmten Artikeln, unbestimmten Artikeln usw. zwischen einer Singularform und einer Pluralform, zu bestimmen, ob Substantive in der ursprünglichen japanischen Sentenz im Singular oder im Plural sind.
  • Mit anderen Worten gibt es bei Übersetzungssystemen nach dem Stand der Technik ein Problem insofern, als daß es unmöglich ist, eine erste ursprüngliche Sprache mit Kategorien ohne Unterschied zwischen Singular- und Pluralformen in eine zweite Übersetzungssprache mit Kategorien mit Unterschieden zwischen den zweien zu übersetzen.
  • Ein Beispiel eines bekannten Maschinenübersetzungssystems ist enthalten in dem Fujitsu - Scientific and Technical Journal, Band 18, No. 1, März 1982, Seiten 117 bis 133 in dem Artikel mit dem Titel "Kenntnisdarstellung und Maschinenübersetzung" von S. Sawai et al. Dieses Dokument offenbart ein Maschinenübersetzungssystem zum Übersetzen von Japanisch in Englisch. Jedoch ist es klar aus den Beispielen der Übersetzung, welche in diesem Dokument gegeben sind, daß das offenbarte System nicht in der Lage ist, Pluralformen entsprechend zu berücksichtigen, wo eine Vielzahl nur durch ein Bestimmungswort angezeigt ist.
  • Die Aufgabe der vorliegenden Erfindung ist es deshalb, ein Maschinenübersetzungssystem zum Übersetzen von Ausdrücken in einer ersten Sprache einschließlich Wort-Bestimmungsworten ohne morphologische Unterscheidung zwischen Singular- und Pluralform in eine zweite Sprache mit einer morphologischen Unterscheidung zwischen den zwei Formen zu schaffen, und zwar in einer Situation, wo eine Vielzahl angezeigt ist durch ein Bestimmungswort, um den Anteil von nötigem Nacheditieren zu reduzieren.
  • Nach der Erfindung wird diese Aufgabe gelöst durch ein Maschinenübersetzungssystem zum Übersetzen von Ausdrücken in einer ersten Sprache einschließlich Wort-Bestimmungsworten anzeigend eine Vielzahl von zugehörigen Teilen einer Sprache ohne morphologische Unterscheidung zwischen Singularform und Pluralform in eine zweite Sprache, in der eine morphologische Unterscheidung zwischen den zwei Formen für die Teile der Sprache existiert, mit
  • (a) einer Eingabeeinrichtung zum Eingeben der Ausdrücke in der ersten Sprache;
  • (b) einer Wörterbucheinrichtung zum Speichern verschiedener Information über die erste und zweite Sprache;
  • (c) einer Übersetzungseinrichtung zum Übersetzen der Ausdrücke in der ersten Sprache in die zweite Sprache auf der Basis der in der Wörterbucheinrichtung gespeicherten Information; und
  • (d) einer Ausgabeeinrichtung zum Ausgeben der zweiten übersetzten Sprache, wobei die Übersetzungseinrichtung umfaßt:
  • eine erste Analysiereinrichtung zum morphologischen Analysieren der Ausdrücke in der ersten Sprache in grundlegene Morpheme in der ersten Sprache auf der Basis eines Beugungsinformationswörterbuchs;
  • eine Gewinnungseinrichtung zum Gewinnen lexikalischer syntaktischer Information entsprechend der analysierten grundlegenden Morpheme in der ersten Sprache aus einem Wort- und Ausdruckwörterbuch;
  • eine zweiten Analysiereinrichtung zum syntaktischen Analysieren der Ausdrücke in der ersten Sprache in eine Zwischenstruktur anzeigend eine Modifikationsbeziehung zwischen zumindest zwei Worten in Übereinstimmung mit einer syntaktischen Analysegrammatik in der ersten Sprache;
  • eine Übertragungseinrichtung zum semantischen Transferieren der Zwischenstruktur in der ersten Sprache in eine Zwischenstruktur einer zweiten Sprache in Übereinstimmung mit einer Strukturübertragungsgrammatik;
  • eine erste Erzeugungseinrichtung zum syntaktischen Erzeugen einer Sentenzstruktur einer zweiten Sprache aus der Zwischenstruktur einer zweiten Sprache in Übereinstimmung mit einer syntaktischen Erzeugungsgrammatik in der zweiten Sprache; und
  • eine zweite Erzeugungseinrichtung zum Erzeugen von Morphemen in der erzeugten Sentenzstruktur einer zweiten Sprache in Übereinstimmung mit einer morphologischen Erzeugungsgrammatik, dadurch gekennzeichnet, daß
  • die Übertragungseinrichtung weiterhin darauf ausgelegt ist, Konzeptdaten zu bilden einer ersten Wortkategorie einschließlich eines Merkmals anzeigend einer Vielzahl, wenn die erste Wortkategorie modifiziert ist durch eine zweite Wortkategorie einschließlich eines semantischen Anzeigers einer Vielzahl; und
  • die zweite Erzeugungseinrichtung ausgerichtet ist, Morpheme in Übereinstimmung mit den Konzeptdaten zu erzeugen.
  • Die erste Kategorie kann ein Substantiv, Pronomen, Adjektiv, bestimmte Artikel, unbestimmte Artikel usw. sein, während die zweite Kategorie ein Adjektiv, ein adjektivischer Ausdruck, ein Adverb, ein adverbialer Ausdruck usw. sein kann.
  • Beim Maschinenübersetzungssystem nach der vorliegenden Erfindung ist es trotz der Tatsache, daß die Ausdrücke in der ersten Sprache, welche zu übersetzen sind, keine morphologische Unterscheidung zwischen den Singular- und Pluralformen haben, möglich, genaue Übersetzungen zu erzeugen mit entsprechender morphologischer Unterscheidung zwischen den zweien, und somit das Bedürfnis des mühsamen Editierens und von Revisionsoperationen bei einer Maschinenübersetzung zu reduzieren.
  • Merkmale und Vorteile des Maschinenübersetzungssystems nach der vorliegenden Erfindung über das System nach dem Stand der Technik werden klarer erkannt werden aus der folgenden Beschreibung der bevorzugten Ausführungsform der Erfindung im Zusammenhang mit der begleitenden Zeichnung.
  • Die Figuren zeigen im einzelnen:
  • Fig. 1 ein schematisches Blockdiagramm einer Ausführungsform des Maschinenübersetzungssystems nach der vorliegenden Erfindung;
  • Fig. 2 eine Illustration zum Zeigen einer Anordnung von Tasten einer Eingabeeinheit beinhaltet in dem in Fig. 1 gezeigten System;
  • Fig. 3 eine Illustration zum Zeigen von Anzeigeflächen auf einem Bild einer Anzeigeeinheit beinhaltet in dem in Fig. 1 gezeigten System;
  • Fig. 4 einen Flußplan zum Zeigen der Steuerungsprozedur ausgeführt durch eine Editiersteuereinheit beinhaltet in dem in Fig. 1 gezeigten System;
  • Fig. 5 einen Flußplan zum Zeigen der Steuerprozedur ausgeführt durch eine Übersetzungseinheit beinhaltet in dem in Fig. 1 gezeigten System;
  • Fig. 6A eine Illustration zur Unterstützung beim Erklären von verschiedenen Daten benutzt zum Übersetzen eines Beispiels einer japanischen Sentenz (a) in eine englische Sentenz (d), wobei (b) eine Zwischensentenzstruktur bezeichnet und (c) Konzeptdaten bezeichnet, wobei ein Adjektiv anzeigt, daß ein Substantiv im Plural steht;
  • Fig. 6B eine weitere Illustration zur Unterstützung beim Erklären verschiedener Daten benutzt zum Übersetzen eines weiteren Beispiels einer japanischen Sentenz (a) in eine englische Sentenz (d), wobei ein adverbialer Ausdruck anzeigt, daß ein Substantiv im Plural steht;
  • Fig. 7 einen Flußplan zum Zeigen der Steuerprozedur ausgeführt durch die Übersetzungseinheit zum Bestimmen jedes Morphems; und
  • Fig. 8 ein Beispiel eines Wörterbuchs beinhaltend Substantive irregulärer Beugungsinformation.
  • Eine Ausführungsform des Maschinenübersetzungssystems nach der vorliegenden Erfindung wird im folgenden beschrieben werden mit Bezug auf die begleitende Zeichnung.
  • Fig. 1 ist ein schematisches Blockdiagramm des gesamten Systems. Das System besteht aus einer Eingabeeinheit 1 mit einer Tastatur, einer Speichereinheit 2 für eine ursprüngliche Sentenz zum Speichern ursprünglicher Sentenzen einer ersten Sprache eingegeben durch die Tastatur, einer Speichereinheit 3 einer übersetzten Sentenz zum Speichern von übersetzten Sentenzen in der zweiten Sprache entsprechend den gespeicherten ursprünglichen Sentenzen; einer Editiersteuereinheit 4 zum Steuern des gesamten Systems; einer Übersetzungsverarbeitungseinheit 5 zum Ausführen einer Übersetzung; einer Übersetzungswörterbucheinheit 6 zum Beherbergen verschiedener Information benutzt für die Übersetzungsverarbeitungen, einer Anzeigesteuereinheit 7 zum Steuern der Anzeigeeinheit; einer Anzeigeeinheit 8 zum Anzeigen ursprünglicher Sentenzen, übersetzter Sentenzen usw. und einer Druckereinheit 9 zum Ausgeben ursprünglicher Sentenzen und übersetzter Sentenzen als Hartkopie. Die Übersetzungswörterbucheinheit 6 beinhaltet ein Beugungsinformationswörterbuch 6a zum morphologischen Analysieren der ersten Sprache in grundlegende Morpheme, ein Wort- und Ausdruckswörterbuch 6b zum Gewinnen lexikalischer Information der analysierten grundlegenden Morpheme der ersten Sprache, eine syntaktische Analysegrammatik 6c in der ersten Sprache zum syntaktischen Analysieren der Sentenz in der ersten Sprache in eine Zwischenstruktur anzeigend eine Modifikationsbeziehung zwischen Worten, eine Strukturübertragungsgrammatik 6d zum Transferieren einer Zwischenstruktur in der ersten Sprache in eine Zwischenstruktur in der zweiten Sprache, eine syntaktische Erzeugungsgraminatik 6e in der zweiten Sprache zum syntaktischen Erzeugen der zweiten Sprache aus der Zwischenstruktur in der zweiten Sprache und eine morphologische Erzeugungsgrammatik 6f zum Erzeugen von Morphemen in der Sentenz in der zweiten Sprache abhängig von der analysierten Modifikationsbeziehung zwischen Worten.
  • Fig. 2 zeigt eine beispielhafte Tastenanordnung der Eingabeeinheit 1. Die Tastenanordnung kann grob geteilt werden in eine Übersetzungstaste 100, Zeichentasten 140, Funktionstasten 110 bis 117, Editiertasten 101 bis 106, Zeigertasten 130 bis 133 usw.
  • Die Übersetzungstaste wird benutzt zum Starten einer Übersetzung.
  • Die Funktionstasten sind eine Anzeigetaste 110 für ein übersetztes Wort zum Anzeigen eines grundlegenden Wortes zur Übersetzung entsprechend eines Wortes beinhaltet in der ursprünglichen Sentenz, eine Wörterbuchanzeigetaste 111 zum Anzeigen des Inhalts des Wörterbuchs entsprechend einem Wort beinhaltet in der ursprünglichen Sentenz, eine Wörterbuchregistrierungstaste 112 zum Registrieren neuer Worte oder Ausdrücke, eine Wörterbuchlöschtaste 113 zum Löschen registrierter Worte oder Ausdrücke, eine Teilübersetzungstaste 114 zum Anzeigen einer Teilübersetzung, wenn eine Übersetzung scheitert usw.
  • Die Editiertasten sind eine Einsetztaste 101 zum Einsetzen eines Zeichens oder mehrerer Zeichen vor einer Zeigerposition, eine Löschtaste 102 zum Löschen eines Zeichens oder mehrerer Zeichen angezeigt durch den Zeiger, eine Bewegungstaste 103 zum Bewegen eines Teils bezeichnet durch den Zeiger auf eine andere Position, eine Löschtaste 104 zum Deaktivieren der Editiertasten 101, 102 und 103 und eine Modifikationstaste 105 zum Anzeigen eines weiteren Kandidatenwortes, modifiziert durch ein Wort oder einen Ausdruck, und zwar bezeichnet durch den Zeiger in Übereinstimmung mit Hilfsinformation.
  • Die Zeigertasten sind vier Zeigerbewegungstasten 130 zum Bewegen eines Zeigers in einer gewünschten Richtung, eine Einheitwechseltaste 131 zum Umschalten von Zeigerbewegungseinheiten, eine Flächenbewegungstaste 132 zum Bewegen eines Zeigers zwischen einer ursprünglichen Anzeigefläche und einer Übersetzungsanzeigefläche, eine Zeigergrößentaste 133 zum Aufweiten oder Verkleinern der Größe eines Zeigers auf eine Zeicheneinheit oder eine Worteinheit usw.
  • Fig. 3 zeigt ein exemplarisches Layout auf einem Anzeigebild der Anzeigeeinheit 8, wobei das Bild geteilt ist in drei Teile, nämlich einen Editierbereich, einen ursprünglichen (erste Sprache) Anzeigebereich und einen Übersetzungsanzeigebereich (zweite Sprache). Verschiedene Information notwendig zum Editieren wird angezeigt in dem oberen Anzeigebereich; eine ursprüngliche Sentenz wird angezeigt in dem linken ursprünglichen Bereich; und eine übersetzte Sentenz wird angezeigt in dem rechten Übersetzungsbereich ausgerichtet mit der ursprünglichen Sentenz, so daß sie sich einander entsprechen.
  • Mit Bezug auf den Flußplan, der in Fig. 4 gezeigt ist, wird eine konversationelle Übersetzungsprozedur beschrieben werden. Hier beinhaltet die konversationelle Übersetzung, daß eine eingegebene ursprüngliche Sentenz übersetzt wird in eine übersetzte Sentenz, damit sie sich so entsprechen in Übereinstimmung mit Editieroperationen eines Betreibers.
  • Die Editiersteuereinheit 4 überwacht stets einen Übersetzungsstatus (in Schritt S1) und Niederdrücken einer Übersetzungsstarttaste (in Schritt S2), Zeichentasten (in Schritt S3), Editiertasten (in Schritt S4) und Funktionstasten (in Schritt S5). Wenn die Editiersteuereinheit ein Signal empfängt für eine Übersetzungsvervollständigung, wird eine übersetzte Sentenz angezeigt (in Schritt S7); wenn die Übersetzungsstarttaste gedrückt wird, beginnt eine Übersetzung (in Schritt S10); wenn Zeichentasten gedrückt werden, wird eine ursprüngliche Sentenz in einen Eingabepuffer gesetzt (in Schritt S8) und dann angezeigt (in Schritt S9); wenn eine Editiertaste gedrückt wird, wird eine Editierverarbeitung durchgeführt (in Schritt S11); wenn eine Funktionstaste gedrückt wird, wird eine Funktionsverarbeitung ausgeführt (in Schritt S12); und wenn eine weitere Taste verschieden von den oben erwähnten Tasten gedrückt wird, wird ein weiterer Prozeß ausgeführt (in Schritt S13), beispielsweise eine Zeigertastenbewegung. Die oben erwähnten Prozesse werden alle ausgeführt unter der Steuerung der Editiersteuereinheit 4.
  • Wenn weiterhin eine Übersetzung vervollständigt ist, werden Übersetzungskandidaten (später beschrieben) angezeigt (in Schritt S7), ausgerichtet mit der ursprünglichen Sentenz oder an einer Position entsprechend der ursprünglichen Sentenz, und eine Hilfsinformation wird angezeigt mit höherer Lumineszenz oder in umgekehrter Beleuchtungsanzeigeart. Unter diesen Bedingungen wird, wenn eine Editiertaste gedrückt wird, eine Additionsverarbeitung entsprechend jeder Editiertaste bewirkt für ein Wort oder einen Ausdruck bezeichnet durch den Zeiger (in Schritt S11).
  • Deshalb werden, wenn ein Betreiber eine ursprüngliche Sentenz eingibt durch Drücken von Zeichentasten, Zeichencodes entsprechend den gedrückten Tasten in einem Eingabepuffer gesetzt (in Schritt S8) und dann angezeigt auf dem ursprünglichen Anzeigebereich der Anzeigeeinheit 8 über die Anzeigesteuereinheit 7. Wenn der Betreiber die Übersetzungsstarttaste 100 drückt, und zwar nach Eingabe einer ursprünglichen Sentenz, transferiert die Editiersteuereinheit 4 die ursprüngliche Sentenz, die in dem Eingabepuffer gespeichert ist, an die Übersetzungseinheit 5 und instruiert den Start einer Übersetzungsverarbeitung (in Schritt S10). Während der Eingabeoperation der ursprünglichen Sentenz können verschiedene Editieroperationen, wie zum Beispiel Korrektur, Einsetzen, Löschen usw. bewirkt werden, wo nötig, und zwar durch Bewegen eines Zeigers auf irgendwelche vorgebebene Editierpositionen vor Niederdrücken einer der Editiertasten.
  • Mit Bezug auf den in Fig. 5 gezeigten Flußplan wird die Übersetzungsverarbeitung in der Übersetzungseinheit 5 beschrieben werden. Eine eingegebene ursprüngliche Sentenz (zum Beispiel Japanisch) wird geteilt in einige japanische Morpheme jeweils mit einer Beugung (Übersetzungseinheit), und dann wird jedes geteilte Morphem transferiert in jedes grundlegende Morphem auf der Basis des Beugungsinformationswörterbuchs 6a in Schritt S51 (morphologische Analyse). Verschiedene Information (zum Beispiel eine Kategorie einer Übersetzung usw.) von jedem der geteilten und transferierten grundlegenden Morpheme wird gewonnen aus dem Wort- und Ausdruckswörterbuch 6b in Schritt S52 (Wörterbuchgewinnung), um Übersetzungskandidaten (zum Beispiel Englisch) zu erhalten. Die gewonnene lexikalische syntaktische Information wird eingespeist an den folgenden Schritt im Schritt S53 (namlich die Analysesteuereinheit, vorgesehen in der Übersetzungseinheit 5) zur Analysesteuerung.
  • Andererseits wird die japanische Sentenz syntaktisch analysiert in Übereinstimmung mit einer japanischen syntaktischen Analysegrammatik 6c in Schritt S54 (syntaktische Analyse). Das heißt, eine japanische Zwischenstruktur wird gebaut. Im Fall, daß die syntaktische Analyse scheitert, kehrt eine Steuerung zu Schritt S53 zurück, um die syntaktische Analyse in Schritt S54 zu wiederholen. Die japanische Zwischenstruktur eingerichtet in Übereinstimmung mit einer japanischen Sentenzstruktur wird transferiert in eine englische Sentenzstruktur in Übereinstimmung mit einer Transfergrammatik 6e im Schritt S55 (semantische Analyse), um eine englische Zwischenstruktur zu erhalten. Wenn die transferierte englische Zwischenstruktur durch den Betreiber verworfen wird, springt eine Steuerung zurück zu Schritt S54 (syntaktische Analyse). Die englischen Worte oder Ausdrücke werden in der gewöhnlichen Ordnung angeordnet in Übereinstimmung mit einer englischen syntaktischen Erzeugungsgrammatik 6e in Schritt S56 (syntaktische Erzeugung). Eine Beugung von Worten wird bestimmt in Übereinstimmung mit einer englischen morphologischen Erzeugungsgrammatik 6f in Schritt S57 (morphogolische Erzeugung), um einen übersetzten Satz zu vervollständigen. Die obige Übersetzungsverarbeitungen werden ausgeführt unter einer Steuerung der Editiersteuereinheit 4 und der Übersetzungssteuereinheit 5.
  • Beim oben erwähnten Übersetzungsverfahren ist der Gehalt der vorliegenden Erfindung ein Wort- und Ausdruckwörterbuch einschließlich eines Punkts "NATUR" zu schaffen, wobei eine Semantik (zum Beispiel die Einzahl oder Vielzahl usw.) eines Bestimmungswortes (modifiziertes Wort) geschrieben ist. Mit anderen Worten enthält das Wörterbuch Information-anzeigend einen "PLURAL". Deshalb ist es, wenn die Sentenz syntaktisch analysiert wird, so daß die Beziehung zwischen einem Substantiv und einem Bestimmungswort geklärt ist, möglich, das Substantiv als Plural auf der Basis der Semantik des Bestimmungswortes zu bestimmen. Wenn einmal ein Substantiv als ein Plural bestimmt ist, wird ein Konzeptdatenwert des modifizierten Substantivs gebildet, wobei "ZAHL = PLURAL" geschrieben wird in einem Schlitz "MERKMAL" der Konzeptdaten. Der oben erwähnte Gehalt der vorliegenden Erfindung ist es, eine syntaktische (Satzstruktur) und semantische (Wortbedeutung) Analyse separat zu bewirken.
  • Fig. 6A zeigt ein Beispiel, wo ein Substantiv als Plural bestimmt wird auf der Basis eines Adjektivs anzeigend die Vielzahl.
  • Eine Annahme wird gemacht, daß die japanische Sentenz, wie gezeigt in Fig. 6A(a), eingegeben wird. Die Struktur dieser japanischen Sentenz ist analysiert durch die Schritte S51 bis S54 (Fig. 5), um eine Zwischensentenzstruktur wie gezeigt in Fig. 6A(b) zu erhalten. Hier wird jede Beziehung zwischen zumindest zwei Worten grammatisch und syntaktisch analysiert, und zusätzlich wird jedes Wort verbunden mit jedem Konzeptdatenwert der gewonnen wird bei dem Wörterbuch-Gewinnungsschritt.
  • Beim folgenden Schritt S55 wird die japanische Sentenzstruktur transferiert in eine englische Sentenzstruktur. In diesem Schritt S55, der verschieden ist vom Schritt nach dem Stand der Technik, wird eine semantische Analyse bewirkt. Das heißt, die Konzeptdaten für "TAKUSAN (= many)" (was gewonnen wird aus dem Wort und Ausdruckswörterbuch) beinhaltet eine semantische Information wie zum Beispiel "NATUR = ZAHL: PLURAL"; die Konzeptdaten für "HON (= book)" beinhaltet eine morphologische Information wie zum Beispiel "ZÄHLBAR/NICHT ZÄHLBAR = ZAHLBAR" und "PLURAL = REGULÄRE REGEL (+s)".
  • Da dies "TAKUSAN (= many)" schon analysiert worden ist als ein Adjektiv modifizierend das Substantiv "HON (= book)", wird "ZAHL = PLURAL" addiert zu den Konzeptdaten für "HON (= book)" als das Merkmal dieses Substantivs, wie gezeigt in Fig. 6A (c). Mit anderen Worten wird das Substantiv "HON (= book") bestimmt als Plural auf der Basis des Adjektivs "TAKUSAN (= many)", welches dieses Substantiv modifiziert. Beim folgenden Schritt S56 wird die Reihenfolge der gewonnenen englischen Worte bestimmt in Übereinstimmung mit der englischen syntaktischen Erzeugungsgrammatik, und zwar wie folgt:
  • "(1) → (have) → (many) → (thick) → (book) → (.)"
  • Letztendlich wird in Schritt S57 eine endgültige englische Sentenz erzeugt auf der Basis der Konzeptdaten für alle Worte. Da hierbei ein Merkmal "ZAHL PLURAL" gegeben ist für die Konzeptdaten für "HON (= book)", kann "books" bestimmt werden in Übereinstimmung mit "PLURAL = REGULÄRE REGEL (+s)" beinhaltet in den Konzeptdaten von "HON (= book)", wie dargestellt in Fig. 6A (d).
  • Zusammenfassend wird "book" bestimmt als Plural auf der Basis eines Adjektivs "many", welches "book" modifiziert durch Bilden eines Konzeptdatenwerts für "book", welcher ein Merkmal enthält von "ZAHL = PLURAL". Weiterhin wird beim obigen Beispiel, da das Adjektiv "thick", das ebenfalls "book" modifiziert, eine Natur von "GRÖSSE" hat, kein Merkmal beschrieben in den Konzeptdaten für "thick" ohne Beziehung auf die Zahl des Substantives "book".
  • Fig. 6B zeigt ein weiteres Beispiel, wo ein Substantiv bestimmt wird als Plural über ein Verb auf der Basis eines adverbialen Ausdrucks, anzeigend die Vielzahl.
  • Ein japanischer Satz, wie gezeigt in Fig. 6B(a) wird analysiert in eine Zwischensentenzstruktur, wie gezeigt in Fig. 6B(b). Da die Konzeptdaten für "ACHIRA KOCHIRA (= here and there)" eine semantische Information enthält, wie zum Beispiel "NATUR = ANZAHL : PLURAL" und das Verb modifiziert "ASOBU (= play)" wird das Subjektsubstantiv "KODOMO (= child)" als Plural bestimmt über das Verb. Da weiterhin die Konzeptdaten für "KODOMO (= child)" eine morphologische Information beinhalten, wie zum Beispiel "ZÄHLBAR/NICHT ZÄHLBAR = ZÄHLBAR" und "PLURAL = IRREGULÄR" und weiterhin "ACHIRAKOCHIRA (= here and there)" schon analysiert worden ist als ein adverbialer Ausdruck modifizierend das Verb "ASOBU (= play)", wird "ZAHL = PLURAL" geschrieben in die Konzeptdaten für "KODOMO (= child)" (das Subjekt des Verbs) als das Merkmal dieses Substantivs, wie gezeigt in Fig. 6B (c). Mit anderen Worten wird das Substantiv "KODOMO (= child)" bestimmt als Plural auf der Basis des adverbialen Ausdrucks "ACHIRAKOCHIRA (= here and there)", welche das Substantiv über das Verb (ASOBU (= play)" modifiziert. Die Reihenfolge der gewonnenen englischen Worte wird wie folgt bestimmt:
  • "(child) → (play) → (here and there) → (.)"
  • Eine endgültige englische Sentenz wird erzeugt auf der Basis der Konzeptdaten für alle Worte. Hierbei wird, da ein Merkmal "ZAHL = PLURAL" gegeben ist dem Konzeptdaten für "KODOMO (= child)" "children" auf der Basis einer unregelmäßigen Beugungstabelle (später beschrieben) wie gezeigt in Fig. 6B(d).
  • Fig. 7 zeigt einen Flußplan zum Erzeugen eines Substantivs (Morphem) in Schritt S57, wie gezeigt in Fig. 5. Die Steuerung prüft zunächst, ob ein übersetztes Substantiv im Singular oder Plural steht, auf der Basis des Merkmals enthalten in den Konzeptdaten entsprechend dem Substantiv, und zwar in Schritt S71. Falls das Substantiv als Singularsubstantiv bestimmt wird, wird eine grundlegende Singularform des Substantivs erzeugt in Schritt S72. Falls das Substantiv bestimmt wird als Pluralsubstantiv, prüft die Steuerung, ob das Substantiv ein regulär gebeugtes oder irregulär gebeugtes ist auf der Basis der Information enthalten in den Konzeptdaten entsprechend dem Substantiv, und zwar in Schritt S73. Falls das Substantiv als ein regulär gebeugtes bestimmt wird, wird eine Pluralform des Substantivs erzeugt mit Bezug auf die Beugungsregel oder Formen beinhaltet in den Konzeptdaten von Schritt S74. Beispielsweise wird im Fall von "book", "books" erzeugt in Übereinstimmung mit der regulären Regel (+s). Falls das Substantiv als ein irregulär gebeugtes bestimmt wird, wird eine Pluralform des Substantivs erzeugt in Bezug auf eine irreguläre Beugungstabelle wie gezeigt in Fig. 8, worin eine Pluralform von "child" bestimmt wird zu "children" und die von "man" bestimmt wird als "men", in beispielhafter Weise.
  • Bei der obigen Beschreibung wurde ein Substantiv bestimmt als Plural auf der Basis der semantischen Analyse eines Adjektivs oder eines adverbialen Ausdrucks. In der gleichen Weise ist es möglich, zu bestimmen, ob ein Adjektiv oder ein Artikel Singular oder Plural ist (wie im Fall des Deutschen) auf der Basis der semantischen Analyse eines Adjektivs, eines adjektivischen Ausdrucks, eines Adverbs, eines adverbialen Ausdrucks usw., solange die Natur eines Falls einer Sprache geklärt ist als anzeigend des Konzeptes der "Zahl".

Claims (6)

1. Maschinenübersetzungssystem zum Übersetzen von Ausdrücken einer ersten Sprache, beinhaltend Wort-Bestimmungsworte anzeigend eine Vielzahl von zugehörigen Teilen einer Sprache ohne morphologische Unterscheidung zwischen Singularform und Pluralform in eine zweite Sprache, in der eine morphologische Unterscheidung zwischen den zwei Formen für die Teile der Sprache existiert, mit:
(a) einer Eingabeeinrichtung (1) zum Eingeben der Ausdrücke in der ersten Sprache;
(b) einer Wörterbucheinrichtung (6) zum Speichern verschiedener Information über die erste und zweite Sprache;
(c) einer Übersetzungseinrichtung (5) zum Übersetzen der Ausdrücke in der ersten Sprache in die zweite Sprache auf der Basis der in der Wörterbucheinrichtung (6) gespeicherten Information; und
(d) einer Ausgabeeinrichtung (8) zum Ausgeben der zweiten übersetzten Sprache, wobei die Übersetzungseinrichtung umfaßt:
eine erste Analysiereinrichtung zum morphologischen Analysieren der Ausdrücke in der ersten Sprache in grundlegene Morpheme in der ersten Sprache auf der Basis eines Beugungsinformationswörterbuchs (6a);
eine Gewinnungseinrichtung zum Gewinnen lexikalischer syntaktischer Information entsprechend der analysierten grundlegenden Morpheme in der ersten Sprache aus einem Wort- und Ausdruckswörterbuch (6Bb);
eine zweiten Analysiereinrichtung zum syntaktischen Analysieren der Ausdrücke in der ersten Sprache in eine Zwischenstruktur anzeigend eine Modifikationsbeziehung zwischen zumindest zwei Worten in Übereinstimmung mit einer syntaktischen Analysegrammatik (6c) in der ersten Sprache;
eine Übertragungseinrichtung zum semantischen Transferieren der Zwischenstruktur in der ersten Sprache in eine Zwischenstruktur einer zweiten Sprache in Übereinstimmung mit einer Strukturtransfergrammatik (6d);
eine erste Erzeugungseinrichtung zum syntaktischen Erzeugen einer Sentenzstruktur in der zweiten Sprache aus der Zwischenstruktur der zweiten Sprache in Übereinstimmung mit der syntaktischen Erzeugungsgrammatik (6f) in der zweiten Sprache; und
eine zweite Erzeugungseinrichtung zum Erzeugen von Morphemen in der erzeugten Sentenzstruktur einer zweiten Sprache in Übereinstimmung mit einer morphologischen Erzeugungsgrammatik, dadurch gekennzeichnet, daß
die Übertragungseinrichtung weiterhin ausgerichtet ist, Konzeptdaten zu formen von einer ersten Wortkategorie einschließlich eines Merkmals anzeigend einer Vielzahl, wenn die erste Wortkategorie modifiziert ist durch eine zweite Wortkategorie einschließlich eines semantischen Indikators einer Vielzahl; und
die zweite Erzeugungseinrichtung darauf ausgerichtet ist, Morpheme in Übereinstimmung mit den Konzeptdaten zu erzeugen.
2. Maschinenübersetzungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die erste Kategorie ein Substantiv oder ein Pronomen ist.
3. Maschinenübersetzungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die erste Kategorie ein Adjektiv ist.
4. Maschinenübersetzungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die erste Kategorie ein bestimmter Artikel oder ein unbestimmter Artikel ist.
5. Maschinenübersetzungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die zweite Kategorie ein Adjektiv oder ein adjektivischer Ausdruck ist.
6. Maschinenübersetzungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die zweite Kategorie ein Adverb oder ein adverbialer Ausdruck ist.
DE3789073T 1986-05-20 1987-05-06 System zur maschinellen Übersetzung. Expired - Lifetime DE3789073T3 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61113716A JP2732563B2 (ja) 1986-05-20 1986-05-20 機械翻訳方法及び装置

Publications (3)

Publication Number Publication Date
DE3789073D1 DE3789073D1 (de) 1994-03-24
DE3789073T2 true DE3789073T2 (de) 1994-07-07
DE3789073T3 DE3789073T3 (de) 1999-05-06

Family

ID=14619336

Family Applications (1)

Application Number Title Priority Date Filing Date
DE3789073T Expired - Lifetime DE3789073T3 (de) 1986-05-20 1987-05-06 System zur maschinellen Übersetzung.

Country Status (5)

Country Link
US (1) US4964044A (de)
EP (1) EP0247395B2 (de)
JP (1) JP2732563B2 (de)
KR (1) KR900009120B1 (de)
DE (1) DE3789073T3 (de)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0242571A (ja) * 1988-08-03 1990-02-13 Sharp Corp 電訳機
JPH02165378A (ja) * 1988-12-20 1990-06-26 Csk Corp 機械翻訳システム
JPH02254564A (ja) * 1989-03-29 1990-10-15 Ricoh Co Ltd 翻訳用辞書編集装置
JPH02308370A (ja) * 1989-05-24 1990-12-21 Toshiba Corp 機械翻訳システム
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
JPH04107675A (ja) * 1990-08-28 1992-04-09 Nec Corp 英文ワードプロセッサー
US6760695B1 (en) 1992-08-31 2004-07-06 Logovista Corporation Automated natural language processing
WO1997040452A1 (en) * 1996-04-23 1997-10-30 Language Engineering Corporation Automated natural language translation
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5384702A (en) * 1993-09-19 1995-01-24 Tou Julius T Method for self-correction of grammar in machine translation
JP2773652B2 (ja) * 1994-08-04 1998-07-09 日本電気株式会社 機械翻訳装置
JP3066274B2 (ja) * 1995-01-12 2000-07-17 シャープ株式会社 機械翻訳装置
US5680628A (en) * 1995-07-19 1997-10-21 Inso Corporation Method and apparatus for automated search and retrieval process
US5794177A (en) * 1995-07-19 1998-08-11 Inso Corporation Method and apparatus for morphological analysis and generation of natural language text
US6470306B1 (en) 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US6024571A (en) * 1996-04-25 2000-02-15 Renegar; Janet Elaine Foreign language communication system/device and learning aid
JP3992348B2 (ja) * 1997-03-21 2007-10-17 幹雄 山本 形態素解析方法および装置、並びに日本語形態素解析方法および装置
WO1998058329A1 (fr) * 1997-06-17 1998-12-23 Omron Corporation Appareil et procede de traitement d'informations, et support d'enregistrement contenant un programme de traitement d'informations range en memoire
JP2004362249A (ja) * 2003-06-04 2004-12-24 Advanced Telecommunication Research Institute International 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体
US20080016112A1 (en) * 2006-07-07 2008-01-17 Honeywell International Inc. Supporting Multiple Languages in the Operation and Management of a Process Control System
US8527262B2 (en) * 2007-06-22 2013-09-03 International Business Machines Corporation Systems and methods for automatic semantic role labeling of high morphological text for natural language processing applications
US20100292983A1 (en) * 2008-01-10 2010-11-18 Takashi Onishi Machine translation apparatus and machine translation method
US8650022B2 (en) * 2008-03-13 2014-02-11 Siemens Aktiengesellschaft Method and an apparatus for automatic semantic annotation of a process model
WO2018066319A1 (ja) * 2016-10-07 2018-04-12 住友電気工業株式会社 ダイヤモンド多結晶体の製造方法、ダイヤモンド多結晶体、切削工具、耐摩工具および研削工具
US10671808B2 (en) * 2017-11-06 2020-06-02 International Business Machines Corporation Pronoun mapping for sub-context rendering
CN108874791B (zh) * 2018-07-06 2022-05-24 北京联合大学 一种基于最小语义块的语义分析与汉英调序方法及***
US11195507B2 (en) * 2018-10-04 2021-12-07 Rovi Guides, Inc. Translating between spoken languages with emotion in audio and video media streams

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5937887Y2 (ja) * 1978-10-31 1984-10-20 シャープ株式会社 単語記憶装置
JPS5853787B2 (ja) * 1979-08-30 1983-12-01 シャープ株式会社 電子辞典
JPS59868B2 (ja) * 1979-10-24 1984-01-09 シャープ株式会社 単語の基本形認識装置およびこれを用いた翻訳装置
JPS5748161A (en) * 1980-09-08 1982-03-19 Canon Inc Electronic interpreter
JPS5775375A (en) * 1980-10-28 1982-05-11 Sharp Corp Electronic interpreter
JPS5840684A (ja) * 1981-09-04 1983-03-09 Hitachi Ltd 自然言語間の自動翻訳方式
JPS6126176A (ja) * 1984-07-17 1986-02-05 Nec Corp 言語処理用辞書

Also Published As

Publication number Publication date
US4964044A (en) 1990-10-16
EP0247395A3 (en) 1988-08-10
DE3789073D1 (de) 1994-03-24
EP0247395B2 (de) 1998-11-04
DE3789073T3 (de) 1999-05-06
EP0247395B1 (de) 1994-02-16
KR900009120B1 (ko) 1990-12-22
KR870011550A (ko) 1987-12-24
JPS62271064A (ja) 1987-11-25
EP0247395A2 (de) 1987-12-02
JP2732563B2 (ja) 1998-03-30

Similar Documents

Publication Publication Date Title
DE3789073T2 (de) System zur maschinellen Übersetzung.
DE3751716T2 (de) System zur maschinellen Übersetzung
DE68926845T2 (de) Maschinenübersetzungssystem
DE3587009T2 (de) Uebersetzungssystem.
DE69229204T2 (de) Iteratives Verfahren zum Suchen von Satzteilen und Informationsauffindungssystem, welches dieses benützt
DE69803043T2 (de) Übersetzungssystem
DE69028592T2 (de) Gerät zur automatischen Generierung eines Index
DE68928693T2 (de) Verfahren zur Behandlung von digitalen Textdaten
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
DE19709968C2 (de) Verfahren und System zum Übersetzen eines Dokumentes
DE68928231T2 (de) Verfahren und Vorrichtung zur Maschinenübersetzung
DE69427848T2 (de) Unterstützungssystem zur Herstellung von Wörterbüchern
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE68928775T2 (de) Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes
DE69712216T2 (de) Verfahren und gerät zum übersetzen von einer sparche in eine andere
DE69230814T2 (de) Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen
DE69927000T2 (de) Übersetzungssystem und multifunktioneller computer, insbesondere für die bearbeitung von texten und die übersetzung auf papier
DE69129163T2 (de) Verfahren und Vorrichtung zur Texteingabe
DE69130747T2 (de) Übersetzungsverfahren und -system zur Übertragung zwischen zwei Sprechern mit unterschiedlicher Sprache
DE60029845T2 (de) System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung
DE69400869T2 (de) System zum transkribieren von texteingaben
DE68929461T2 (de) Verfahren zur Verarbeitung von digitalen Textdaten
DE3587152T2 (de) System zur maschinellen uebersetzung.
DE69812162T2 (de) Vorrichtung zur Verwendung bei der Identifizierung semantischer Mehrdeutigkeiten
DE3587993T2 (de) Verfahren und Gerät zur Natursprachenverarbeitung.

Legal Events

Date Code Title Description
8363 Opposition against the patent
8366 Restricted maintained after opposition proceedings