DE19626142A1 - Computer-Aided-Text-Design-System - Google Patents

Computer-Aided-Text-Design-System

Info

Publication number
DE19626142A1
DE19626142A1 DE19626142A DE19626142A DE19626142A1 DE 19626142 A1 DE19626142 A1 DE 19626142A1 DE 19626142 A DE19626142 A DE 19626142A DE 19626142 A DE19626142 A DE 19626142A DE 19626142 A1 DE19626142 A1 DE 19626142A1
Authority
DE
Germany
Prior art keywords
text
catd
logic
structures
texts
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19626142A
Other languages
English (en)
Inventor
Horn Hannes Dr Schulze
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Schulze Horn Hannes Dr-Ing 45966 Gladbeck De
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE19626142A priority Critical patent/DE19626142A1/de
Publication of DE19626142A1 publication Critical patent/DE19626142A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

Die Erfindung betrifft ein Computer-Aided-Text-Design-System, dessen Aufgabe es ist, bei gegenüber bekannten Systemen ver­ ringertem Rechenaufwand logisch einwandfreie Texte zu er­ stellen. Dabei soll insbesondere eine fortlaufende, auch selbsttätige, Verbesserung der Textanalitäten und auch der Systemfunktion möglich sein. Dabei soll es auch möglich sein, die in Textbaustein-Kombinationssystemen verwendeten Textbau­ steine und/oder Masken zu verwenden. Weiterhin soll es mög­ lich sein, logisch einwandfreie Übersetzungen, insbesondere von mit dem System erstellten Patenttexten, durchzuführen.
Die Aufgabe wird im wesentlichen dadurch gelöst, daß compu­ tertechnisch nach Vorgaben aus vorhandenen Textvorlagen durch Merkmals-, Logik- und gegebenenfalls Strukturvergleiche für die Erstellung eines gewünschten (Ziel)Textes geeignete, insbesondere logikmäßig geeignete, Muster entnommen und aus diesen sowie zur Ergänzung gegebenenfalls neu erstellten, logikgerechten Mustern unter Benutzung der vorgegebenen Merk­ male, ein bearbeiteter und vervollständigter (Ziel)Text erstellt wird.
Rechentechnisch arbeitende Texterstellungssysteme sind be­ kannt, so z. B. aus dem US-Patent 5 200 893 (Hitachi) oder in Form eines Übersetzungsprogramms "Personal/Translator Plus (PT plus)" von IBM, die auch logische Zusammenhänge berück­ sichtigt. Diesen bekannten Texterstellungssystemen ist eine mechanistische Bearbeitung linguistischer Regeln und der Logik gemeinsam. Ihr Rechenaufwand ist hoch, ohne daß die Ergebnisse befriedigen können. Sowohl die Schwierigkeiten mit der Logik von generierten Texten als auch der große Rechen­ aufwand, der häufig zum Abbruch der Texterstellung vor Er­ reichen eines brauchbaren Ergebnisses führt, können durch das erfindungsgemäße System überwunden werden. Durch das Vorgehen nach dem erfindungsgemäßen System wird eine sichere Lösung des Logikproblems von erstellten Texten erreicht. Dieses Problem hat bisher einer weiten Verbreitung von rechentech­ nisch erstellten (generierten)Texten entgegengestanden, ob­ wohl für eine rechentechnische Textgenerierung aus Kosten­ gründen schon seit langem ein erhebliches Bedürfnis besteht.
In Ausgestaltung der Erfindung ist vorgesehen, daß die Logik von Texten anhand von Logikmodellen, die insbesondere nach dem Vorbild von neuronalen Netzen aufgebaut sind, ermittelt wird. So wird eine gute rechentechnische Bearbeitung der Logik möglich, wobei von der bekannten, aber bisher bei der Generierung von Texten bisher nicht in gebotenem Maß verwen­ deten, Tatsache ausgegangen wird, daß fast alles in der einen oder anderen Form weitgehend "schon einmal dagewesen" ist. Dies gilt insbesondere für technische Texte, da die Entwick­ lung der Technik im wesentlichen evolutionär verläuft, etwas vollkommen Neues ist in der Technik selten!
In weiterer Ausgestaltung des erfindungsgemäßen Systems ist vorgesehen, daß die Erstellung des gewünschten (Ziel)Textes mit Hilfe von detaillierten Eingaben über gewünschte Merkma­ le, Logiken und gegebenenfalls Strukturen, auch der verwende­ ten Sprache, des (Ziel)Textes und seiner einzelnen Teile erfolgt. Die Eingaben erfolgen insbesondere über Listen, etwa Merkmalslisten und Abhängigkeitslisten. Durch dieses Vorgehen wird sichergestellt, daß der erstellte Text auch wirklich dem gewünschten Text entspricht, d. h., daß ein logisch zielge­ richtetes Arbeiten erfolgt. Die Erstellung des (Ziel)Textes über Logikmodelle erfolgt vorteilhaft aufgabenorientiert strukturiert. Die Logikmodelle werden aufgabenorientiert strukturiert und entsprechend vorgegebenen. Wahlweise werden sie auch durch Suche ermittelten Textgrundstrukturen sowie Teilstrukturen, z. B. den einzelnen Teilen einer Patent- oder Gebrauchsmusteranmeldung, einer Gebrauchsanweisung etc. ent­ nommen. Durch eine aufgabenorientierte Strukturierung und die Unterteilung in Textgrundstrukturen sowie Teilstrukturen, insbesondere bei hierarchischer Aufteilung, wird die Qualität der Textgenerierung erhöht.
Es ist dabei eine gute Vorlagenselektion möglich, wenn auch hierfür die entsprechende Aufteilung in Grundstrukturen, Teilstrukturen etc. vorgenommen wird. Vorteilhaft wird die Verbindung von aus Vorlagen entnommenen Textteilstrukturen durch das Logikmodell der Textgrundlogik oder der Textgrund­ struktur vorgenommen. So ist es möglich, rechentechnisch gut behandelbare Textmodule zu verwenden, die ohne Verlust der Gesamtlogik für die Textgenerierung verwendbar sind.
In Ausgestaltung der Erfindung ist weiterhin vorgesehen, daß die verwendeten Logikmodelle die üblichen Formen von künstli­ chen neuronalen Netzen (KNN) aufweisen, die z. B. die Form von üblichen Feed-Forward-Netzen mit aufgabengerecht angepaßten, z. B. (0/1) Netzknoten und Verbindungen mit Verbindungsstär­ ken-Differenzierungen haben. Bei dem aus der Literatur viel­ fältig bekannten Feed-Forward-Netzen (mehrlagige rückkopp­ lungsfreie Netze) wird die Anzahl der Ausgänge des Netzes durch das Problem vorgegeben. Die Anzahl der Neuronen in der Zwischenschicht zwischen der Eingangsebene und Ausgangsebene ist frei wählbar, wobei die Fähigkeit des Netzes mit der An­ zahl der Neuronen in der Zwischenschicht wächst. Derartige Netze, die mit einem ja/nein (zutreffend-nichtzutreffend) Gesamt-Lernvorgang arbeiten können, sind besonders einfach rechentechnisch beherrschbar. Sie sind die am weitesten bekannten künstlichen neuronalen Netze (KNN) und können vor­ teilhaft für das Textgenerierungssystem verwendet werden. Die Entwicklung spezieller künstlicher neuronaler Netztechniken für das System ist also nicht notwendig.
Es ist bei der Anwendung der Erfindung vorgesehen, daß gege­ benenfalls Logikmodelle in Maskenform, d. h. mit vorher fest­ gelegten Bezügen und Verbindungen, verwendet werden, wobei die dafür vorgesehenen Stellen der Masken mit aufgabengerecht formulierten Texteinzelheiten aufgefüllt werden. So ergibt sich eine insbesondere für technische Texte, wie Patent- oder Gebrauchsmusteranmeldungen, Produktbeschreibungen, Gebrauchs­ anleitungen etc. besonders geeignete Systemausbildung, die die rechentechnische Bearbeitung erheblich vereinfacht. Die übergeordnete Logik ist bereits in der Maskenform enthalten. Nur die Sekundärlogiken müssen aus Textvorlagen extrahiert und mit der Primärlogik eines Textes abgestimmt werden.
Es ist weiterhin vorgesehen, daß die Logikvorgabe in Tabel­ len- oder Matrixform erfolgt, insbesondere mit Angabe der Verbindungsausbildungen, insbesondere Verbindungsstärken, zwischen den einzelnen Teilen, die in die Tabelle oder Matrix aufgenommen sind. So werden die notwendigen Logikvorgaben rechentechnisch handhabbar. Die Eingabe wird vereinfacht und das Textdesign als solches beschleunigt. Desweiteren kommt dieses Vorgehen der Übersichtlichkeit und damit der Kontrolle der Eingaben entgegen.
Es ist dabei vorgesehen, daß Logikmodelle unterschiedlichen Aufbaus aufgabengerecht miteinander verknüpft werden, z. B. zum Erstellen einer Schutzrechts-(Patent- oder Gebrauchs­ muster)Anmeldung, die insbesondere eine Maskenform für den grundsätzlichen Aufbau, ergänzt durch neuronale Netzmodelle für die Logik der Maskenteile und die Abstimmung der Einzel­ logiken aufeinander, aufweist. So ergibt sich eine für Patent- oder Gebrauchsmusteranmeldungen, Produktbeschrei­ bungen etc. besonders geeignete, mit Sicherheit den Mindest­ anforderungen an derartige Texte entsprechende, Ausführung des generierten Textes.
Aus Vorlagen und den daraus extrahierten Logikmodellen lassen sich nicht immer vollständige, zutreffende Zieltexte erstel­ len. Bedingt durch die Tatsache, daß ja technische Verände­ rungen vorliegen und den modulartigen Aufbau, bleiben Lücken, die durch frei generierte Textteile ausgefüllt werden müssen. Diese Textteile, die ihrem Wesen nach Textergänzungen sind, werden über Erstellungsprogrammteile separat erarbeitet. Hierfür werden vorteilhaft ebenfalls gespeicherte Logikmo­ delle verwendet, die entsprechend, z. B. in Trial and Error- Routinen, angepaßt werden. Ebenso wie die aus Vorlagen extrahierten Logikmodelle und die vorgegebenen Strukturen und Masken zur Texterstellung werden diese Modelle und Strukturen in Bibliotheken, vorzugsweise nach den Kriterien der Vor­ lagenbibliotheken geordnet, abgelegt und bei der Erstellung von Zieltexten gesucht. Das Suchen von Zieltexten und ihren Logiken ist ebenfalls bekannt, so z. B. aus der EP-0 639 814 A1 (Canon) und aus der EP-0 375 970 B1 (IBM), die rein mechanistisch arbeiten oder auf Expertensystemgrundlagen beruhen.
Es ist vorteilhaft, wenn bei einer derartigen Suche vornehm­ lich den Logikanforderungen Rechnung getragen wird. Hierfür werden geeignete Netzgrundstrukturen (Logikstrukturen), ins­ besondere hierarchisch gegliedert, durch Mustervergleich ver­ wendet. Zur Suche weist das erfindungsgemäße System Logik­ teilmuster von aufgabenspezifisch getrennten Textteilen, ab­ gestuft von Kapiteln oder Abschnitten des Textes bis zu ein­ zelnen Satzteilen, auf. So ergibt sich eine geeignete rechen­ technische Bearbeitung der gesuchten Texte unter besonderer Berücksichtigung der erforderlichen Logik.
In Durchführung des erfindungsgemäßen Systems ist vorgesehen, daß das Textdesign (Textgenerierung) in den gebildeten Struk­ turen, insbesondere Netzen, mit Wortstammformen, z. B. der Merkmale erfolgt, deren Beziehung zueinander anschließend durch Wortverbindungen, insbesondere in Form von Verbindungs­ objekten, hergestellt wird. Dabei werden die Beziehungen der eingegebenen Wortstammformen, z. B. der Substantive, der Verben etc., zueinander in den Netzstrukturen oder anderen Vorgabestrukturen, algorithmisch ausgedrückt. Die Netzstruk­ turen oder andere Vorgabestrukturen mit den Wortstammformen werden dann mit aus Listen aussuchbaren, linguistischen Objekten objektstrukturiert komplettiert. So ist eine rechen­ technisch gut handhabbare Bearbeitung möglich, die aus der logischen Rohfassung die endgültige Fassung erstellt. So muß nicht eine Wort nach Wort/Erstellung erfolgen, sondern über die objektstrukturierte Komplettierung ergibt sich eine Komplett-Textfassung, die lediglich nach den linguistischen Regeln der jeweiligen Sprache, in der der Text erstellt wird, kontrolliert werden muß. Diese Kontrolle und eine gegebenen­ falls nachfolgende Korrektur, kann ohne Veränderung der Logikstruktur erfolgen.
Zur Kontrolle, ob die gewünschte Textqualität erreicht ist, werden die gebildeten Sätze, Absätze etc. mit, z. B. nach lin­ guistischen Regeln aufgestellten, Satz- bzw. Absatzmasken verglichen und nur die diesen zugelassenen Masken (Patterns) entsprechenden Ergebnisse als endgültige Ergebnisse zuge­ lassen. So ergibt sich ein kontrolliertes, logisch einwand­ freies Ergebnis, wobei die Zulassung als endgültiges Ergebnis gleichzeitig den Abbruch eventuell vorhergehender Optimierun­ gen nach linguistischen Regeln bedeutet. Es ist dabei im Rahmen der Erfindung liegend und für schwierige Texte vor­ teilhaft, mehrere konkurrierende Textausführungen zu erstel­ len, z. B. durch die Verwendung unterschiedlicher Textvor­ lagen, und die am besten in die zugelassenen Muster, die zugelassene Maske o. ä. passende Fassung als endgültige Fas­ sung auszuwählen. Dieses Vorgehen empfiehlt sich, wenn die Suche nach einer zutreffenden Vorlage kein eindeutiges Ergebnis ergibt. Eventuell kann hier auch der Operator des Systems unterstützend eingreifen.
Die Logik und der Aufbau der zugelassenen Ergebnisse (zuläs­ sige Ergebnismuster) wird durch die Logik der Vorlagen bzw. Modelltexte festgelegt. So ergibt sich stets ein auch logisch korrektes Ergebnis. Hierfür erfolgt gegebenenfalls auch noch ein Vergleich mit Musternetzen, z. B. aus einer Musternetz­ bibliothek. Die Endkontrolle erfaßt auch die Textteile, die neu generiert worden sind, da sie sich nicht aus den Vorlage­ teilen ergaben. So werden auch diese Teile noch einmal über­ prüft und gegebenenfalls korrigiert.
Die neu generierten Textteile werden über linguistische Regeln objektorientiert aufgebaut, wobei Vergleichslisten, etwa in Matrixform, für Beziehungsstärken und sprachliche Ausdrucksformen verwendet werden können. Durch eine rechen­ technische Bearbeitung in Matrixform ergibt sich eine beson­ ders günstige Vergleichsmöglichkeit rechentechnischer Art. Dies gilt insbesondere für die gesuchten oder gewählten Logiknetze. Entsprechende Matrixstrukturen und ihre Erläute­ rung ergeben sich aus dem Buch "Parallel Distributed Prozessing" von Rumelhardt und anderen, MIT-Press, 1986, aus dem auch weitere, insbesondere die Logik-Netze betreffende, Angaben entnehmbar sind.
Zur Durchführung der Erfindung ist vorgesehen, daß die Vorla­ genauswahl ganz oder teilweise automatisiert aus Abstract- oder Volltextdatenbanken erfolgt, z. B. aus der Library of Congress, aus Patentamtstextsammlungen, aus der Abstract­ datenbank Derwent oder der Abstractdatenbank Inspec etc. vorgenommen wird. So wird vorteilhaft von dem weltweit vor­ handenen Vorwissen Gebrauch gemacht und für Patent- und Gebrauchsmusteranmeldungen eine Merkmals- und Logikkombina­ tion erreicht, die auch die Prüfung derartiger Schriften wesentlich erleichtert!
Es versteht sich, daß je nach Aufgabe, auch die Datenbanken für Zeitungstexte etc. verwendbar sind.
Die Vorlagenauswahl erfolgt vorteilhaft anhand von in der Grundstruktur besonders wichtigen Komponenten (Logik und anderen Merkmale) nach und/oder Beziehungen anhand aufgaben­ spezifischer Suchkriterien. Die aufgabenspezifischen Such­ kriterien, die auch in Listenform vorgegeben werden können, orientieren sich vorteilhaft an vorhandenen Datenbankstruk­ turen, z. B. an der Patentklassifikation bei Patentdatenbanken sowie an vorhandenen Suchprogrammen für derartige Datenban­ ken. Hierdurch ergibt sich eine weitgehende Übernahmemöglich­ keit vorhandener Software und Softwarestrukturen, die das erfindungsgemäße System in der Entwicklung der Suchprogramm­ teile kostengünstig macht.
Die Vorlagenauswahl erfolgt insbesondere nach den Beziehungs­ stärken zwischen den Komponenten in Textgrundmustern, d. h. unter Einbeziehung künstlicher neuronaler Netze. So ergibt sich eine Suchoptimierung, die zu einer der jeweiligen Logik und den speziellen Merkmalen entsprechenden Vorlage führt, sofern und soweit diese in Datenbanken vorhanden ist.
Die Suche nach Vorlagentexten kann in den Netzen erfolgen, auf die der übliche Zugriff besteht. So kann etwa das WWW verwendet werden, es bieten sich aber auch spezielle Firmen­ netze an. Die Vorlagensuche wird vorteilhaft durch Makrobe­ fehle nach Zielvorgaben unter Menüführung durchgeführt, so wird die Suche besonders leicht gemacht. Kostenmäßig beson­ ders vorteilhaft ist dabei, wenn etwa auf die Verfahrensweise der Suche im Internet zurückgegriffen wird. Dabei ist dieser Suchvorgang mit den vorhandenen Softwarestrukturen und Be­ triebssystemen, etwa Windows, kompatibel.
Das erfindungsgemäße System kann in den verschiedensten Ge­ bieten eingesetzt werden. Neben der Erstellung technischer Texte nach Operatorvorgaben, kann es auch vorteilhaft für Übersetzungen eingesetzt werden. Auch bei Übersetzungen gilt, daß für die allermeisten, insbesondere die technischen Texte, Vorlagen vorhanden sind, die lediglich ergänzt, leicht ge­ ändert o. ä. werden müssen. Auch hierfür eignen sich die vor­ stehend beschriebenen Such- und Ergänzungsvorgänge. Insbeson­ dere für die Logik von Übersetzungen ergibt sich damit eine wesentlich über den bisherigen computertechnischen Über­ setzungen liegende Qualität.
In Durchführung der Erfindung ist vorgesehen, daß ebenso wie für die Komplettierung von Textentwürfen, das erfindungsge­ mäße System für die Texte oder Textteile, für die keine aus­ reichend nahekommende Vorlage existiert oder auffindbar ist, neue Grundstrukturen und Detailstrukturen durch separate Vorgaben erhält. Diese Vorgaben werden z. B. durch Multiple choice Listen mit graphischen Verbindungen der Listenkompo­ nenten vorgegeben. Diese Listen erhalten besonders vorteil­ haft z. B. Matrixform, um gut überschaubar und kontrollierbar zu sein. So ist eine vorteilhafte Erweiterung des Systems über die Vorlagentextbenutzung hinaus möglich.
Bei der Adaption von vorhandenen Vorlagenteilen werden vor­ teilhaft Grundlogiken direkt übernommen und nur die Detail­ logiken und Verbindungsobjektausführungen durch Regeln zur Selbstoptimierung neuronaler Netze oder anderer Programmodule gestaltet, angepaßt und optimiert. Derartige Optimierungen, vorzugsweise in Form von Selbstoptimierungen neuronaler Netze, sind bekannt, auch in Verbindung mit einer Modulstruktur von Modellen. Eine entsprechende Optimierung ist z. B. aus der DE-195 08 476 A1 entnehmbar. Hier ist sie für das Leitsystem einer Industrieanlage gedacht, ihr Prinzip kann jedoch angepaßt für das erfindungsgemäße System über­ nommen werden. Die Optimierung erfolgt vorteilhaft Offline, auch durch genetische Algorithmen, die die neuronalen Netze oder anderen Modulteile z. B. Maskenteile, verbessern, während die aktuelle Textgenerierung Online erfolgt. Die optimierte Ausführung der Modelle wird in die Modellbibliothek über­ nommen, so daß zwar nicht der aktuell generierte Text, aber andere später erstellten Texte, für die etwa der erstellte Text als Vorlage dient, entsprechend optimiert ausgeführt werden können.
Von besonderer Bedeutung für alle Optimierungen ist die Güte­ funktion, bis zu deren Erreichen die Optimierung fortgeführt wird. Bei dem erfindungsgemäßen System ist eine ausreichende Güte erreicht, wenn der generierte Text in ein vorgegebenes Muster einfügbar ist und dessen Logik und linguistische For­ derungen zu einem vorgegebenen % Satz erfüllt. Falls dies nicht in annehmbarer Rechenzeit erreicht werden kann, wird die Optimierung abgebrochen. Wie bei durch Menschen erstell­ ten Texten auch, kann ein gewisser % Satz an Restfehlern in der Regel in Kauf genommen werden (Nobody is perfect). Bei Textvorlagen, deren Logik selbst nicht stimmt, kann eine Vorab-Optimierung durch einen Bearbeiter, also nicht rechen­ technisch, ein vorteilhafter Ausweg sein. Ein gewisser, mit zunehmendem Gebrauch des Systems aber ständig abnehmender, Anteil an den zu generierenden Texten, wird sich einer aus­ reichend guten rechentechnischen Erstellung entziehen. Für den größten Teil der Texte, insbesondere der technischen Texte, wird sich aber eine gute Generierungsmöglichkeit ergeben. Für die Benutzung der Texte ergibt sich, daß sich durch die zwar große, aber letztendlich doch begrenzte, Zahl der verwendeten Logiken und Verbindungsobjekte eine schnellere Erfaßbarkeit des Inhalts durch einen Benutzer dieser Texte ergibt, als es bei individualistisch erstellten Texten der Fall ist. Insbesondere bei für Laien häufig ziemlich unverständliche langen Patentansprüchen dürfte sich dieser Vorteil ergeben. Hier sind die klaren Logiken der Rechentechnik von Vorteil.
Die Erfindung wird anhand von Zeichnungen naher erläutert, aus denen, ebenso wie aus den Unteransprüchen, auch für sich erfinderische Einzelheiten entnehmbar sind. Im einzelnen zeigen:
Fig. 1 vereinfachte Prinzip der Texterstellung unter Berück­ sichtigung der Text-Vorlagensuche und -Auswahl,
Fig. 2 die Zusammenhänge in einem Netz am Beispiel einer rechentechnisch umsetzungsfähigen Netzdarstellung und einer Matrix,
Fig. 3 eine 0-1 Logik, mit der Auswahl-Entscheidungen ge­ troffen werden können,
Fig. 4 ein vereinfachtes Schema zur Darstellung der Bezie­ hungsbeeinflussung zwischen einem Eingangstext und einem Zieltext,
Fig. 5 ein dreilagiges Netz als Beispiel für die Erstellung von passenden Wertverbindungen,
Fig. 6 das Funktionsschema des vorgesehenen Optimierers für Logik und linguistische Bedingungen,
Fig. 7 ein Beispiel für die rechentechnische Generierung von Textteilen,
Fig. 8 die Hauptbestandteile des Speichers der Recheneinheit für die Textgenerierung,
Fig. 9 ein Arbeitsschema für die Erstellung einer Patent- oder Gebrauchsmusteranmeldung,
Fig. 10 eine Textaufbaumaske mit Angaben für die Ausbildung einer Patent- oder Gebrauchsmusteranmeldung.
In Fig. 1 bezeichnet 1 den Operator, der mit Hilfe eines Rech­ ners 8 mit Monitor 6, vorteilhaft unter Menüführung, über eine Tastatur, gegebenenfalls auch über ein Mikrofon und eine Maus 10, den Texterstellungsvorgang durchführt. Eingegeben werden z. B. Suchbefehle 2, etwa welche Datenbank zu benutzen ist, ob Volltexte, Abstracts, Absätze, ganze Figurenbeschrei­ bungen o. ä. gesucht werden sollen. Weiterhin werden die Vor­ gaben für den Zieltext eingegeben, z. B. Listen mit Merkmalen und ihren logischen Beziehungen, vorzugsweise in Matrixform. Gegebenenfalls wird auch die spezielle Sprache, in der der Zieltext erstellt werden soll, eingegeben. Die Vorgaben bzw. die Listen und Logikbeziehungen sind speziell auf den Einzel­ fall des Textes abzustellen. Sie können speziell erstellt werden, aber auch aus vorhandenen Texten (Vorlagen) extra­ hiert werden, z. B. mit Hilfe von Suchroutinen unter Einbe­ ziehung der Logik. U.U. vorteilhaft, werden die Vorgaben, Listen etc. gegebenenfalls in Form eines Auswahl- und Korrekturdialogs erarbeitet und eingegeben. Dieser Dialog wird durch den Zweirichtungspfeil 5 symbolisiert.
Der Zweirichtungspfeil 5 symbolisiert auch die Durchführung der Korrektureingriffe nach Fehlfunktionsangaben etc.
Für den in der Praxis, z. B. bei Patentanmeldungen, recht häufigen Fall, daß ein älterer Textstand an neue Produktaus­ führungen oder an einen vom Patentamt ermittelten neuen Stand der Technik angepaßt werden kann, ist auch die Eingabe von Nachbearbeitungsmaterial 4 vorgesehen. In diesem Fall kann der Suchvorgang nach Vorlagen entfallen, der ältere Text stand dient als Vorlage sowohl für die Hauptmerkmale als auch für die Gesamtlogik. Bei Patentanmeldungen ergibt sich so vorteilhaft die Möglichkeit einer elektronischen Aktenführung und Bearbeitung, da beim Erstellungsvorgang alle für den jeweils zu erstellenden Text relevanten Einzelheiten vom Erstellungssystem gespeichert werden.
Aus den gewählten Textbibliotheken werden zutreffende Gesamt­ texte 15 bzw. Teiltexte, wie Kapitel, Absätze und gegebenen­ falls auch Einzelsätze, symbolisiert durch die Seiten 16, 17 und 18 im Dialog mit der Logikbibliothek, die Gesamtlogiken und Teillogiken für Textteile, Absätze, Sätze und gegebenen­ falls Einzelobjekte, symbolisiert durch die Logikseiten 11, 12, 13 und 14, herausgesucht. Die am besten übereinstimmenden Texte mit ihren Logiken werden im Vergleicher 21 ermittelt und in 23 zu einer neuen logischen Textrohfassung zusammen­ gestellt. Diese Textrohfassung wird dann in 25 adaptiert. Dabei steht die Adaptionseinheit 25 über Dialogverbindungen 27 und 28 und der Logikbibliothek 11 bis 14 in Verbindung, über die ständig die Logik des adaptierten Textes mit den Vorgaben und der ausgewählten Logik bzw. den Logikteilen ver­ glichen werden. Die Informationsweitergabe zwischen den ein­ zelnen Recheneinheiten kann z. B. über die Verbindungen 19, 20, 22, 24 und 26 geschehen. Vorteilhaft wird jedoch eine Netzarchitektur für das erforderliche parallele, verteilte Bearbeiten gebildet, die anforderungsgerecht für die jewei­ lige Textbearbeitungsaufgabe aufgebaut wird.
Nach der Adaption in 25 gelangt der erstellte Text über 30 in die Kontrolle 29, wo er einer Vergleichsmusterprüfung unter­ zogen wird. Es wird also geprüft, ob er den Anforderungen an Standardformen von Sätzen und Rückbezügen zwischen den Sätzen genügt. Hierzu werden z. B. Logikregeln aus 39 und linguisti­ sche Regeln aus 37 eingesetzt, mit denen Standardformen ge­ bildet werden. Die Kontrolle bezieht sich dabei nicht nur auf einzelne Sätze und ihre Bezüge zu den benachbarten Sätzen sondern auch auf die Gesamtlogik und die Teillogiken, vor­ teilhaft ebenfalls durch Mustervergleich. Es versteht sich, daß diese Vergleichsmuster bzw. Standardformen nur eine be­ grenzte Zahl von erstellten Texten und Textteilen prüfen können. Für die Generierung technischer oder sonstiger Infor­ mationstexte ist dies jedoch hinnehmbar, da hier im Prinzip ähnliche Logiken und Satz formen für die Beschreibung unter­ schiedlicher Sachverhalte verwendbar sind. Es kommt ja bei diesen Texten weniger auf eine sprachliche Vielfalt als auf eine klare Ausdrucksweise an, um Mißverständnisse über den Inhalt des Geschriebenen bzw. gegebenenfalls bei Sprachaus­ gabe auch des Gesagten, nicht aufkommen zu lassen. Wegen der begrenzten Zeit, die häufig für das Lesen technischer Texte zur Verfügung steht, ist eine begrenzte Auswahl von Logiken und Satzformen (z. B. 10³-10⁴ je Sachgebiet) sogar vorteil­ haft, da sich so der Leser relativ einfach einen Eindruck über den jeweiligen Inhalt des Textes verschaffen kann. Der Verständlichkeit eines Textes ist in der Technik der Vorzug vor einer unbegrenzten Ausdrucksvielfalt zu geben.
Falls die Kontrolle ergibt, daß der durch die Adaption ent­ standene Text nicht die gestellten, variierbaren Anforde­ rungen an die Logik und die linguistischen Regeln erfüllt, wird eine Bearbeitung des Textes in einem Optimierer 31 vorgenommen, dessen Funktion in den weiteren Figuren noch näher erläutert wird. Der Optimierer, dem ebenfalls aus den Speichern 39 und 37 Logikregeln und linguistische Regeln aufgegeben werden, der darüber hinaus aber auch neue Wort- bzw. Satzkombinationen, Objektkombinationen etc. aufstellt, prüft und gegebenenfalls über 33 weitergibt, hat für das erfindungsgemäße System eine wesentliche Funktion, da er über die jeweilige Einzelaufgabe hinaus eine fortlaufende Verbes­ serung des Systems durch Erweiterung der Vorlagen bewirken kann.
In die Adaption 25 gehen auch noch die Inhalte einer Ergän­ zungsbibliothek 47, einer Verbindungsobjektbibliothek 48 und einer Adaptionsregelbibliothek 49 über die Verbindungen 50, 51 und 52 ein. So können die Teile des Textes, die adaptiv nicht erstellbar sind, d. h. logische Löcher, ausgefüllt werden. Der vollständige Text ergibt sich aus adaptierten Teilen und gegebenenfalls neu geschaffenen Teilen, wobei die neu geschaffenen Teile gegebenenfalls im wesentlichen nur neue Verbindungselement-Objekte (Nachbearbeitung) aufzuweisen brauchen. Die Verbindung zwischen den Logikregelspeichern und den linguistischen Speichern mit Vergleichsmustern wird durch Verbindungen 36 und die Verbindung zwischen Kontrolle und Optimierer 32 geschaffen. 38 steht für die Eingabe der Logik­ regeln und linguistischen Regeln in den Optimierer.
An die Kontrolle 29 schließt sich die Ausgabe 40 über die Verbindung 45 an. Die Ausgabe 40 ist mit einem Drucker 41 bzw. einer Diskette 42 über Verbindungen 43 und 44 verbunden. So ist sowohl eine Darstellung des Textes in gedruckter Form als auch eine Archivierung mit Entstehungsmaterial auf einem elektronischen Datenträger möglich. Patentanmeldungen können auch unmittelbar elektronisch dem jeweiligen, z. B. dem Japanischen oder dem Europäischen, Patentamt übermittelt werden.
Vorteilhaft, insbesondere bei ungeübten Operatoren oder wenn das System noch nicht mit umfangreichen Bibliotheken und Listen ausgestattet werden konnte, ist eine Verbindung 46 der Ausgabe 40 mit dem Rechnermonitor 6 mit seiner Visualisie­ rungsmöglichkeit. So kann in Dialogform mit dem Operator 1 eine eventuell notwendige Neueingabe der Vorgabenlisten etc. bzw. von Nachbearbeitungseinzelheiten erfolgen. Neben der Optimierung mit Hilfe des Optimierers 31 kann so auch eine Optimierung mit Führung durch den Operator 1 erfolgen, die insbesondere in der Aufbauphase eines derartigen Systems sehr vorteilhaft ist. In diesem Fall handelt es sich um ein computerunterstütztes Textgenerierungssystem, während nach Aufbau der notwendigen Bibliotheken, Listen etc. und der endgültigen Ausgestaltung des Optimierers 31, z. B. unter Generierung neuer, besonders geeigneter neuronaler Netzformen durch kombinatorische Optimierung mit Hilfe genetischer Algorithmen, auch eine automatische, nach der Starteingabe ohne Eingreifen des Operators 1 ablaufende, Textgenerierung möglich ist.
Das in Fig. 1 beschriebene System wird vorteilhaft in einem Datennetz oder in einem anderen Client-Server-System ver­ wirklicht. Es erübrigt sich, spezifische Textbibliotheken aufzubauen. Es ist wesentlich günstiger, auf bestehende Text­ bibliotheken zurückzugreifen und lediglich vorteilhaft aus bestehenden Texten extrahierte Logikbibliotheken, Verbin­ dungsobjektbibliotheken etc. aufzubauen. Auch die Rechenein­ richtungen, die verwendet werden - obwohl natürlich die Zusammenfassung in einem Großrechner möglich ist - werden vorteilhaft dezentral ausgestaltet. Dabei können übliche Schaltungsprozeduren übernommen werden, die aus Firmennetzen, dem WWW etc. oder aus anderen Teilen des Internets bekannt sind. Insgesamt ergibt sich dadurch eine erhebliche Reduzie­ rung des Hardwareaufwandes, wenn auch die Bearbeitungszeit steigt. Dies kann aber durch Übertragungen mit ATM weites­ tgehend vermieden werden.
In diesem Zusammenhang ist weiterhin vorgesehen, daß alle mit dem System erstellten Texte in einer user eigene Textbiblio­ thek eingehen, um als besonders geeignete Vorlagen für weite­ re Neu- oder Ergänzungstexte Verwendung zu finden. Mit der Zeit kann sich so z. B. eine Fach-Produkt- oder firmenspezi­ fische Textbibliothek ergeben, aus der ein Großteil der an­ fallenden neu zu generierenden Texte ohne größeren Rechen­ aufwand und mit einheitlicher Logik entnehmbar ist.
Fig. 2, die dem Kapitel "A FRAMEWORK FOR PDP" (PDP = Parallel Distributed Processing) des bereits erwähnten Buches von Rumelhart in The MIT Press, 1986, entnommen ist, zeigt ein Beispiel für ein rechentechnisch aufbereitetes Beziehungs­ muster. Mit derartigen Beziehungsmustern ist ein Ähnlich­ keitsvergleich von Logikmustern und Merkmalsmustern möglich. Fig. 2 illustriert die Zusammenhänge zwischen den Beziehungen innerhalb des Netzes und der Gewichtungsmatrix. Dieses ein­ fache Beispiel gibt das Prinzip derartiger, rechentechnisch aufbereiteter, Vergleichsmuster wieder. Für die erfindungs­ gemäße Ausführung ergibt sich durch Matrixausbildungen eine Erleichterung bei der Erstellung von Logiknetzen für über­ geordnete Logiken, Satz- und Wortbeziehungslogiken. Durch die Matrixform können sie rechentechnisch einfach aus der jewei­ ligen Bibliothek ausgewählt werden. Durch eine hierarchische Ordnung dieser Vorlagenmuster ist es dabei möglich, die Aus­ wahl weiter zu vereinfachen. Zwar ist die Suche in den Modell- und Merkmalsbibliotheken sowie in den Regelbiblio­ theken manchmal zeitaufwendig, hierfür sind jedoch moderne Computer bestens gerüstet. Zu bedenken ist dabei, daß der­ artige Computer ca. um den Faktor 10⁹ schneller als das menschliche Gehirn arbeiten! Das menschliche Gehirn mit seiner wesentlich höheren Knotenzahl, (schätzungsweise 10¹³), nutzt diese nur zu einem sehr geringen Teil für die Bildung von Logiken aus. Es arbeitet aber mit durchaus vergleichbaren Teilmodellen und paßt diese ebenfalls den jeweiligen Bedin­ gungen an. Die Generierungsgeschwindigkeit von Sätzen ist daher durchaus vergleichbar. Ein Beispiel ist das jedem ge­ läufige Suchen nach einem passenden Satzabschluß, wenn der angefangene Satz aus mehreren Unterabschnitten besteht oder unbekannte Begriffe enthält! Auch dies dauert bei einem Menschen deutlich bemerkbare Sekundenbruchteile. Da manche Menschen mit einer relativ geringen Such- und Kombinations­ geschwindigkeit bei ihren Satzbildungen arbeiten, bleiben derartige Sätze in der Sprechpraxis häufig unvollendet. Dies ist zu beobachten, wenn z. B. ein Redner nicht genügend Zeit zur notwendigen Suche nach einem passenden Abschluß des ange­ fangenen Satzes hat.
Logische Beziehungen können mit Einheiten, die mit Schwellen­ werten, z. B. der Schwelle 0-1 arbeiten, bearbeitet werden. Mit derartigen Zweiwerteinheiten kann z. B. ein Netz aufgebaut werden, mit dem das "ausschließlich/oder" (XOR) Problem ge­ löst wird. Ein Beispiel zeigt Fig. 3 in einer ebenfalls dem vorgenannten Buch von Rumelhart entnehmbaren Ausführung. Der Schwellenwert ist 1 und die Einheit reagiert, wenn der Input größer als 0 ist. Die Gewichtungen sind ± 1. Diese Lösung kann für alle Entscheidungsnetzwerke verwendet werden, z. B. können so Bool′sche Funktionen bearbeitet werden.
Das Lernen derartiger Netze ist nicht ohne weiteres direkt möglich, hier wird vorteilhaft die bereits in der Einleitung erwähnte Form des Feedback mit einer ja/nein Antwort in bezug auf das Ergebnis verwendet. Ein derartiges Vorgehen erfordert gegenüber einer Backpropagtion eine erhebliche längere Lern­ zeit. Dies wird jedoch durch die einfachen Rechenoperationen, die zugrundegelegt sind und die dadurch mögliche sehr hohe Verarbeitungsgeschwindigkeit weitgehend wieder wettgemacht.
Für spezielle Fälle ist auch ein direktes Lernen mit Feedback möglich, etwa bei Verwendung des bekannten Perceptrons. Hier ist ein Lernen mit Regeln in Form der "Delta"-Regeln für die Fehlerkorrektur in linearen Modellen möglich. Hierdurch ist vorteilhaft eine gewisse Verkürzung der Rechenzeit für Lern­ vorgänge, zumindest für einfache Teilmodelle, die durch Perceptrons ausgedrückt werden können, möglich.
Fig. 4 zeigt eine vereinfachte Darstellung des Prinzips, wie ein Eingangsmuster, also ein Vorlagenmuster, in ein Ausgangs­ muster, also ein Zielmuster, geändert werden kann (Adaption). Die Änderung geschieht durch ein Beziehungsmuster, das auf die einzelnen Verbindungen zwischen Eingangsmuster und Aus­ gangsmuster zugreift. Es versteht sich, daß das Beziehungs­ muster nicht direkt auf die Verbindungen zwischen Eingangs- und Ausgangsmuster einwirken kann. Hierfür werden Schwellen­ muster zur Verarbeitung nicht linearer Eingaben mit ihnen zugrundeliegenden Wenn-Dann-Verzweigungsmustern notwendig, wie sie z. B. in dem KBAN-System, das von Siemens Corporate Research, Princeton, entwickelt worden ist, in trainierbarer Form beschrieben sind.
In Fig. 5 schließlich, die dem Kapitel "THE PT PERSPECTIVE" des bereits erwähnten Buches von Rumelhart entnommen ist, sind zwei Beispiele eines dreilagigen Netzwerkes gezeigt, mit dem Beziehungen zwischen Begriffen und Regeln hergestellt werden können. Ein entsprechendes Vorgehen kann z. B. auch für die Beziehungen zwischen Satzteilen und Begriffen verwendet werden. Desgleichen für die Beziehungen von ganzen Sätzen und Satzteilen etc. Die Netzbibliotheken, die gebildet werden, werden also entsprechende Netze für unterschiedliche Merkmale und Verbindungsbeziehungen umfassen, aus denen geeignete Netze ausgesucht und angewendet werden. Ausgesuchte Netze, deren Eignung nicht bewiesen ist (Muster) werden vorteilhaft konkurrierend eingesetzt und das am besten passende Netz verwendet. Es ist dabei vorteilhaft möglich, entsprechende Netze weiterzuentwickeln, z. B. durch genetische Algorithmen. Hierbei ist dann das Ziel erreicht, wenn das neu entwickelte Netz in der Anwendung die Vergleichsmuster von Standardformen erfüllt. Der Erfüllungsgrad ist gleichzeitig die Gütefunk­ tion, die den weiterentwickelten Netzen zugrunde zu legen ist.
Geeignete Netze für eine Textgenerierung werden einige Dutzend bis einige Hundert Eingänge aufweisen. Derartige Netze werden bereits rechentechnisch beherrscht, z. B. bei der Optimierung von Industrieanlagen. Auch Trainingsroutinen für derartige Netze stellen kein Problem dar. Das Training er­ folgt vorteilhaft parallel zur Generierungsarbeit und wird sofort ausgenutzt.
Das Beispiel von Fig. 5 bezieht sich auf die Eigenschaften einer Katze, es ist eindeutig, daß das benutzte Vorgehen ohne weiteres auch für technische Begriffe mit technischen Eigen­ schaftszuordnungen verwendbar ist.
Fig. 6 schließlich zeigt die Funktion des in Fig. 1 vorgese­ henen Optimierers 31 für einen Zieltext. Hier handelt es sich um die Lösung der zunächst im Rahmen der Entwicklung wohl häufiger, später weniger häufig auftretende Problematik, daß die Adaption aus den Vorlagenteilen nicht zu einem befriedi­ genden Zieltext führt oder das neue Textteile generiert werden müssen. Hier muß ein entsprechender Generierungsprozeß durchgeführt werden.
In Fig. 6 bezeichnet 60 das Modell und 61 die Modelladaption, die während der Optimierung über 59 im Datenaustausch mitein­ ander stehen. In das Modell gehen ebenso wie in den Speicher 62 die selektierten Teile aus den Textvorlagen, z. B. Sätze, Absätze oder Satzteile, durch den Doppelpfeil 63 symboli­ siert, ein. Desgleichen die speziellen Zieltextvorgaben, die Merkmale aus einer Merkmalsliste und die Logikvorgaben, z. B. aus einer Logikmatrix. Dies wird durch den Doppelpfeil 64 symbolisiert. Aus dem Speicher, bzw. auch direkt, gehen diese Vorgaben ebenso wie Optimierungsregeln, linguistische Regeln und Logikregeln, symbolisiert durch den Doppelpfeil 65 in den Textoptimierer 66 ein. Hier wird der Text entsprechend der Vorgaben optimiert, wobei neben regelbasiertem Wissen auch Trial- und Errorroutinen in bezug auf einzelne Verbindungs­ objekte und Satzteile angewendet werden können.
Aus dem Textoptimierer 66 gelangt der erstellte Zieltext in die rechentechnische Endrolle 67, der auch die linguistischen Regeln und die Logikregeln sowie die Vorgaben über den Inhalt des Zieltextes aufgegeben werden, wenn die Endkontrolle 67 unbefriedigend ausfällt, wird eine erneute Optimierung durch­ geführt, bis das Ergebnis regelgerecht ist. Anschließend an die Endkontrolle in 67 werden in 68 die erstellten einzelnen Textteile gesammelt und schließlich einem Monitor, einem Drucker oder einer Diskette aufgegeben. Damit ist der eigent­ liche Erstellungsvorgang beendet. Wahlweise kann noch eine Endkontrolle z. B. durch den Operator erfolgen. Dies ist in 70 symbolisiert. Diese Endkontrolle kann auch zu einer erneuten Rückgabe von Texten oder Textteilen zum Textoptimierer 66 führen. Dies ist durch den Schalter 71 symbolisiert. Die übrigen Verbindungen in Fig. 6 ergeben sich aus den einge­ zeichneten Beziehungspfeilen. Auch für die einzelnen Teile im wiedergegebenen Funktionsprinzip des Optimierers sind der­ artige Kontrollschleifen, automatisch funktionierend, vorge­ sehen.
Aus Fig. 7 ist das prinzipielle Vorgehen bei der Generierung von Textteilen, Sätzen, Satzteilen etc. aufgrund von Model­ len, d. h. nicht nach vorgegebenen Regeln, zu ersehen. Nach der Startvorgabe in 72 werden Suchschritte 73 eingeleitet, die zu einer passenden Eingabe in ein Modell 74 führen. Die über das Modell 74 erzeugten Teile des Textes werden mit den Text-Daten in dem jeweiligen Datenspeicher 75 verglichen und der Fehlerfunktion zugeleitet, die entscheidet, ob über das Modell ein zutreffender Teiltext erzeugt worden ist. Da dieser gut oder aber weniger gut sein kann, werden die Anga­ ben aus der Fehlerfunktion nach Abschätzung gegebenenfalls einem Abbruchkriterienteil 76 zugeleitet, der wiederum, falls Verbesserungen nötig sind, den Teiltext dem Modell 74 erneut aufgibt, bzw. andere Suchschritte in dem Teil 73 einleitet. Das Vorgehen, wie es hier prinzipiell beschrieben ist und das Methoden der Musterkennung und des Mustervergleichs, z. B. elektronisches "Übereinanderlegen" und Auswertung nach dem Vorliegen wesentlicher oder tolerierbarer Abweichungskrite­ rien benutzt, muß wegen der Häufigkeit der notwendigen Wiederholungen und der Vielzahl von Einzelvorgängen im Rahmen von parallelen Rechenvorgängen ablaufen, deren Ergebnisse ständig miteinander verglichen und auf ihre Tauglichkeit überprüft werden. Auch diese Überprüfung kann entsprechend dem vorerwähnten Prinzip erfolgen. Insgesamt ist zur schnel­ len Texterstellung massives Parallelrechnen notwendig, das vorteilhaft auf entsprechend ausgelegter Hardware abläuft. Für die Benutzung empfiehlt sich ein mit entsprechender Hard- und Software ausgerüsteten Client-Server-System.
Aus Fig. 8 sind die Hauptbestandteile des Speichers für die Textgenerierung ersichtlich. Dies sind zum einen in 78 die linguistischen Regeln, die Logikmodelle und die Adaptions- und Optimierungsregeln, weiterhin in 79 die Text/Ganz- und Teilmodelle und die mehrsprachigen Fachausdrücke und Verbin­ dungsobjekte. Dabei ist zu berücksichtigen, daß die in 78 gespeicherten linguistischen Regeln, die Textlogikmodelle und die Optimierungsregeln ebenfalls an die jeweilige Ausgabe­ sprache des Zieltextes angepaßt sein müssen. Auch die Adap­ tionsregeln, vorzugsweise z. B. als Wenn-Dann-Beziehungen mit und/oder Komponenten ausgebildet, müssen entsprechend ange­ paßt sein. Weiterhin sind in den Hauptbestandteilen des Speichers die Startwerte 80 für den Optimierer enthalten, die jeweils den einzelnen Suchschritten und Optimierungsschritten angepaßt sind. Diese ergeben sich aus dem jeweiligen Textbe­ arbeitungszustand. Weiterhin enthalten die Hauptbestandteile des Speichers den Rechentechnikspeicher 81, z. B. die zu­ treffenden Neuro-Netze, Baumstrukturen, Bool′schen Algorith­ men etc. Insgesamt ergeben die Fig. 6, 7 und 8 eine Über­ sicht über die Rechentechniken der Optimierung und Adaption, die zum Teil ineinander übergehen.
Die folgenden Figuren beziehen sich auf die spezielle Technik der Erstellung von Patent- oder Gebrauchsmusteranmeldungen. Hierfür ist das erfindungsgemäße System besonders gut wirt­ schaftlich einsetzbar, da Patent- und Gebrauchsmusteranmeldun­ gen weltweit dem gleichen Erstellungsmuster zu folgen haben. Sie setzen sich einmal aus den Ansprüchen, dem auf die An­ sprüche bezogenen Beschreibungsteil, der Erläuterung des bekannten Standes der Technik, der zu lösenden Aufgabe und den zu erreichenden Vorteilen zusammen. Dies wird ergänzt durch Zeichnungsfiguren und die Figurenbeschreibung. Da dieser Aufbau weltweit gleich ist, können für alle Ziel­ sprachen identische Masken erstellt werden. Außerdem wird durch die Maskenführung eine Unterteilung der Textgenerierung für Patentanmeldungen und Gebrauchsmuster in kleine, leicht rechentechnisch handhabbare Einheiten möglich. Die Patent- und Gebrauchsmustertexte - wie auch im Prinzip durchaus ähn­ liche Funktionsbeschreibungen, Produktbeschreibungen, Be­ triebshandbücher etc. - sind also besonders geeignet für das erfindungsgemäße CATD-System. Auch ist hier der finanzielle Nutzen am größten, da derartige Texte auf der Welt jährlich in der Größenordnung von mehreren hunderttausend erstellt werden. Allein das Europäische Patentamt erhält jährlich fast einhunderttausend Anmeldungen.
Dabei wird überdies noch der besondere Vorteil erreicht, daß durch die rechentechnische Texterstellung auf Dauer ein Textstandard erreicht werden kann, der bei manueller Erstel­ lung nicht immer gegeben sein wird. Nicht nur die Kosten der­ artiger Texterstellungen werden verringert sondern auch eine gleichmäßige hohe Qualität für alle Patentanmeldungen, Ge­ brauchsmusteranmeldungen etc. wird erreicht werden können. Dabei erhöht sich durch die rechentechnischen, strengen Logikregeln die Vergleichbarkeit und damit die Prüfbarkeit der Texte! Die Verwendung des erfindungsgemäßen Systems für Patent- und Gebrauchsmusteranmeldungen hat dabei den weiteren Vorteil, daß für derartige Texte bereits viele, fein sor­ tierte Muster (IPC), als Trainingsmaterial für ein Vorab- Training der verwendeten neuronalen Netze zur Verfügung stehen. Ein nicht zu unterschätzender Vorteil.
In Fig. 9 wird das Schema einer Textgenerierung am Beispiel einer Patentanmeldung gezeigt. Ausgang ist die Erfindungsmel­ dung, ein erweiterter Laborbericht, ein Pflichtenheft o. ä. Bestandteile sind die zu lösenden Aufgabe, die Zeichnung oder Schaltung sowie gegebenenfalls eine allgemeine Beschreibung des Lösungswegs sowie die erreichten Vorteile. Diese Angaben stammen von den Erfindern oder dem Projekteur bzw. Designer eines neuen Systems, Geräts etc. Diese Angaben sowie gegebe­ nenfalls weitere Angaben sind durch 90 versinnbildlicht.
Die Angaben in 90 werden, vorteilhaft durch eine Verarbeitung im PC, z. B. in Matrixform oder in Form von Listen mit multiple-Choice-Angaben nach Wichtigkeit und Aufgabenlogik geordnet. Hieraus wird dann, zumindest in der Anfangszeit, ein Hauptanspruch durch den Operator in 91 erarbeitet, sofern sich nicht eine Fassung eines neuen Hauptanspruches durch einfaches Hinzufügen o. ä. der Merkmale der neuen Lösung zu einem bereits bestehenden Hauptanspruch, zu einer bereits bestehenden Produktbeschreibung, einer Bedienungsanleitung o. ä. möglich ist. Anschließend an die Generierung des Haupt­ anspruchs, wie vorstehend gesagt, entweder durch einen Operator oder automatisch, werden ebenfalls in 91 die Merk­ male auf die Unteransprüche, auf neue Beschreibungsteile etc. aufgrund der Gliederung der Merkmale in der Matrix oder der Liste verteilt. Die Auswahl der Hauptaufgabe erfolgt ebenso wie die Auswahl der Unteraufgaben sowie der erreichbaren Vorteile, z. B. eine schnellere Arbeitsweise, eine kosten­ günstigere Ausführung, ein vielseitiger einsetzbares System etc. nach den Angaben in der Liste, der Matrix o. ä. Anschlie­ ßend oder gleichzeitig erfolgt eine Auswertung der Zeichnung bzw. der Prinzipskizzen zu der neuen Lösung sowie eine hieraus extrahierte Lösungslogik. Dieser Arbeitsgang wird durch 92 symbolisiert. Hierfür kann durch ein entsprechendes Umsetzungsprogramm das Designprogramm der Zeichnung mit den aus der Zeichnung entnehmbaren Merkmalsangaben verwendet werden. Bei Zeichenprogrammen werden ja die einzelnen Bausteine eines Entwurfs, z. B. in Icons o. ä. dargestellt, durch Linien miteinander verbunden. Hieraus ist bereits die Grundstruktur des Logikmodells der Zeichnungsbeschreibung extrahierbar, bei dem zwischen den bekannten Bestandteilen und den neuen Bestandteilen unterschieden wird.
Um die entstehenden Modelle nicht zu umfangreich und damit zu aufwendig zu bearbeiten zu machen, erfolgt hierfür vorteil­ haft eine Unterteilung in viele Einzelmodelle mit einfachen Rückbezügen in kurzen Sätzen, die dann durch ein Gesamt­ modell, das aus den Vorgaben in 91 gebildet wird, logisch verbunden werden. Eine Zusammenführung der unterschiedlichen Modelle und ihre Adaptionen in 93 erfolgt durch die in den vorhergehenden Figuren näher beschriebenen rechentechnischen Modellbearbeitungsstufen. In 94 wird der generierte Text darauf kontrolliert, ob er den dem Text zugrundeliegenden bogikmustern und Logikregeln sowie den linguistischen Regeln, wie sie z. B. aus dem IBM-Programm bekannt sind, entspricht. Auch hier erfolgt also die bereits ebenfalls in den rechen­ technischen Einzelheiten erwähnte Endkontrolle auf rechen­ technischer Basis. 95 dient gegebenenfalls der endgültigen Optimierung mit Prüfung auf die Logik der Rückbezüge und in 96 erfolgt die Endkontrolle des generierten Textes in allen Teilen.
In Fig. 10 wird eine Texterstellungsmaske für größere Patent- oder Gebrauchsmusteranmeldungen gezeigt. Die einzelnen Mas­ kenteile 100 bis 106 enthalten - für den Patentfachmann so­ fort erkennbar - die üblichen Anmeldungsteile. In sich sind die einzelnen Anmeldungsteile klar strukturierbar. In der Hierarchie steht die Lehre des Hauptanspruches oben, dazu folgen die Unteransprüche. Es ist vorteilhaft, mit dem erfindungsgemäßen CATD-System bei Patent- oder Gebrauchs­ mustertexten zu beginnen. Für Gebrauchsmuster ergibt sich der besondere Vorteil einer gewissen Vorprüfung durch die vor­ lagenbedingte Berücksichtigung des Standes der Technik.
Im einzelnen ergibt sich, wie eine Patentanmeldung oder Gebrauchsmusteranmeldung unter Verwendung der international üblichen Vorgaben für eine derartige Anmeldung mit Hilfe einer dieser Vorgaben enthaltenden Maske generiert wird. Im Teil 100 wird aus der Erfindungsmeldung, dem Laborbericht, dem Pflichtenheft o. ä. automatisch oder durch eine Vorgabe des Operators (Bedienervorgabe) oder extrahierten Vorgaben aus dem ausgewählten Modell(Vorlagen)text der Hauptanspruch, d. h. die Lösung der Hauptaufgabe generiert. In 101 wird aus den Vorlagen und den Bedienereingaben unter der Verwendung von Standardsätzen der Eingangsteil der Beschreibung gene­ riert. Die entsprechenden Standardsätze sind bekannt und werden erfindungsgemäß nicht mehr durch den Bediener diktiert oder eingegeben, sondern durch Selektion entsprechenden Listen entnommen.
In 102 schließlich wird auf den Stand der Technik, d. h. auf den Inhalt der Vorlagen bzw. diesen nahekommenden Unterlagen, eingegangen, z. B. durch Teilzitat. Dies erfolgt u. U. vorteil­ haft unter Verwendung von Abstracts, die z. B. in der inter­ nationalen Patentdatenbank Derwent für Patentanmeldungen, Patente und Gebrauchsmuster oder in der Datenbank Inspec für Fachaufsätze vorliegen. Dabei wird sowohl auf die Merkmale als auch auf die zugrundeliegende Logik, mit der diese Merk­ male miteinander verknüpft sind, geachtet. Aus dem standar­ disierten rechentechnischen Ablauf dieses Teil der Generie­ rung der Anmeldung ergibt sich eine wesentlich verbesserte Prüfbarkeit. Eine weiter verbesserte Prüfbarkeit ergibt sich aus der Einfachheit der rechentechnisch gebildeten Sätze, die - zumindest in der Anfangszeit - kurz sein werden und im wesentlichen einfache Rückbezüge enthalten.
In dem weiteren Teil 103 werden dann die erreichten Vorteile und ihre Logik generiert, so daß sich insbesondere für den Prüfer sofort eine Übersicht über den erfinderischen Gehalt der neuen Lösung ergibt. Auch hierdurch wird die Prüfung wesentlich erleichtert. Gegebenenfalls kann hierdurch die Prüfung auch selbst automatisiert werden. Die Neuheit kann ja durch einen entsprechenden Vergleich mit den Merkmalen der Vorlagen ermittelt werden und die Erfindungshöhe durch den Vergleich, ob es sich um äquivalente oder naheliegende Lö­ sungen handelt, die z. B. entsprechend einem Synonym-Wörter­ buch aus Listen verglichen werden können.
Anschließend erfolgt der Textaufbau in 104 des Beschrei­ bungsteils, der sich auf die Unteransprüche bezieht. Hierfür dient als Grundlage die Merkmalsliste, Vorteilsliste oder eine graphische (Pfeile)Darstellung der erreichten Vorteile in den multiple Choice-Angaben. Die Generierung dieses Teils kann vollständig automatisch, aber auch durch Hilfskräfte o. ä. erfolgen.
Schließlich folgt die im Teil 105 generierte Figurenliste, die durch Rückführung der Zeichnungsprogramme oder Angaben zu den Zeichnungen auffindbaren wesentlichen Merkmale generiert werden kann. Wesentlich ist dabei, ob die Figuren schema­ tische, prinzipielle oder detaillierte Angaben enthalten. Dies kann einfach aus den Zeichnungen entnommen werden.
Die Figurenbeschreibung in 106 kann, wie bereits ausgeführt, direkt durch Übernahme und Umsetzung der Angaben aus dem Zeichnungsprogramm o. ä., aber auch durch eine Hilfskraft erfolgen. Hierfür werden Standardverbindungsobjekte ver­ wendet, wie "ist verbunden mit", oder "weist auf" etc. Derartige Verbindungsobjekte, die im übrigen auch für die anderen Beschreibungsteile verwendbar sind, können aus einer, wie eine Übersicht über die Patentliteratur gezeigt hat, nicht allzu umfangreichen Liste entnommen werden. Eine norma­ le Patentanmeldung enthält, wenn sie auf das wesentliche der Erfindung beschränkt wird, nur einen relativ geringen Ver­ bindungsobjektbereich der jeweiligen Technik. Für den Ma­ schinenbau, für die Elektrotechnik, für die Chemie kann daher mit nur wenigen hundert Verbindungsobjekten gearbeitet wer­ den, um für die meisten in der Praxis vorkommenden (ca. 90% aller Anmeldungen) einen Textzusammenhang herzustellen.
Um eine widerspruchsfreie Gesamtlogik zu erhalten, ist es an­ gezeigt, die Anmeldung insgesamt einer Logik-Kontrolle zu unterziehen. Dies kann z. B. bei einer Patent- oder Gebrauchs­ musteranmeldung durch ein die einzelnen Merkmale prüfender neuronales Netz mit sechs Eingaben entsprechend 100-106 in die Eingangsebene und sechs Ausgangswerten sowie einer ver­ deckten Zwischenschicht geschehen. Für ein derartiges Netz sind einfache Bool′sche Algorithmen, d. h. Algorithmen mit dem Inhalt entspricht oder "entspricht nicht (XOR)" gearbeitet werden. Zwar sind für die Kontrolle des Gesamttextes viele Rechenoperationen für die jeweiligen Merkmale notwendig, hierfür stehen jedoch bereits spezielle, mit sehr hoher Rechengeschwindigkeit arbeitende, Neurocomputer zur Verfü­ gung. Ein Arbeiten mit derartigen Computern, z. B. dem Siemens-Computer Synapse, bringt eine erfindungsgemäße Text­ erstellung, die vorteilhaft nach dem Client-Server-Prinzip, also dezentral erfolgt, auf annehmbare Rechenzeiten.
Für eine Patent- oder Gebrauchsmusteranmeldung ist sogar ein Netz mit festen Verbindungen, also ein ASIC, verwendbar. Für andere Texte, z. B. Produktbeschreibungen, Gebrauchsanlei­ tungen, für Besprechungsberichte technischer Art o. ä. wird vorteilhaft ein relativ großes Universalnetz eingesetzt wer­ den, von dem nur die jeweils gebrauchten Verbindungen akti­ viert sind. Hierbei ist auch eine Optimierung für den jewei­ ligen Text möglich, die aufzubauenden neuronalen Netze können einer Netzbibliothek entnommen werden. Der jeweils passenste Typ kann, wenn er noch nicht bekannt ist, aufgrund von Trial- and Errorversuchen ermittelt werden. Ein derartiges Vorgehen ist aus der Mustererkennung, z. B. bei der Schriftzeichen- oder Satzerkennung bekannt. Die hierfür bekannten Programme können übernommen und adaptiert werden.
Zusammenfassend ist für das erfindungsgemäße System festzu­ stellen, das es sicherlich für die Erstellung von Patent- und Gebrauchsmusteranmeldungen, Produktbeschreibungen oder Ge­ brauchsanweisungen besonders schnell seine Einsatzreife er­ langen wird und hierfür auch die größten Kostenvorteile nach kurzer Entwicklungszeit erreichbar sind. Von besonderem Vor­ teil ist auch der Einsatz für Beschreibung von an vielen Stellen verteilt durchgeführte Teilentwicklungen, wie es bei einer Softwareentwicklung häufig der Fall ist. Diese ist häufig in großen Firmen weltweit verteilt und es bestehen erhebliche Schwierigkeiten für die einzelnen Entwicklungs­ teams miteinander zu kommunizieren. Dadurch, daß das System geeignet ist, Textvorlagen in den unterschiedlichsten Spra­ chen zu verarbeiten - hierfür müssen lediglich die unter­ schiedlichen Lexika bereitgestellt sein - eignet es sich insbesondere für die Koordinierung und Erfassung von Entwick­ lungen, die gleichzeitig in Ländern mit unterschiedlichen Sprachen ablaufen. So kann es zu einer erheblichen Verbesse­ rung der unternehmensinternen Kommunikation oder der Kommu­ nikation von Entwicklungspartnern, etwa Konsortien, kommen. Dabei ist von besonderem Vorteil, daß für die einzelnen Entwickler die Hemmschwelle, die darin besteht, sich in einer fremden Sprache z. B. in der Muttersprache des Auftraggebers, ausdrücken zu müssen, wesentlich erniedrigt wird. Der Schwer­ punkt wird hierbei sicherlich in der Sprachpaarung deutsch/eng­ lisch liegen, aber auch die Sprachpaarungen deutsch/fran­ zösisch, französisch/englisch etc. sind von erheblicher Bedeutung. Für Sprachpaarungen zwischen europäischen und fernöstlichen Sprachen ist dabei die gute Berücksichtigung der unterschiedlichen Logiken, mit denen diese Sprachen arbeiten wichtig.
Es ist dabei vorteilhaft möglich, generierte Texte als Intra­ net oder Internet-Angebot zur Verfügung zu stellen. So ist es auch Tochterunternehmen, kleinen und mittleren Firmen und auch Einzelpersonen möglich, einfache Texte und damit Bot­ schaften auszutauschen. Erleichtert wird dabei das Arbeiten mit dem erfindungsgemäßen System, wenn eine Spracheingabeform für den PC gewählt wird. Derartige PC′s stehen bereits zu Verfügung. Gemeinsam mit den entsprechenden Suchmakros, die ähnlich wie im Internet, von einem Dokument zum anderen führen, bis das am besten zutreffende Dokument gefunden worden ist, ergibt sich eine universelle, einfache Handhabung des erfindungsgemäßen Systems, die es auch weniger geübten Bedienern erlaubt, schnell mit dem System arbeiten zu können.
Für die Entwicklung des Systems ist es von besonderem Vor­ teil, daß die verwendeten Wenn-Dann-Beziehungen mit Bool′schen Algorithmen z. B. in der Form A entspricht B, A entspricht nicht C oder D und so weiter und dies mit beson­ derer Gewichtung zwischen den einzelnen Merkmalen oder den Verbindungsobjekten arbeiten. Ein Beispiel ist in Fig. 10 in 104 gezeigt.
Von Vorteil für die qualitative Evolution des Systems ist es, daß, wie bereits ausgeführt, sowohl die untersuchten und ausgewählten Vorlagen als auch die erstellten Texte mit ihren Logiken in die jeweiligen Vorlagen und Netzbibliotheken ein­ gehen. Damit wird die Erstellungsbasis immer breiter und die Qualität der erstellten Texte automatisch immer besser, ohne daß hierfür eine weitere Programmierung nötig ist. Diese ist nur notwendig bei neuen Sachgebieten, etwa zur Erstellung von Trivialliteratur, Zeitungen aus neuesten Agenturberichten, etc. oder wenn weitere Sprachen mit noch nicht erfaßten Sprachlogiken in das System aufgenommen werden.
Auch eine Verbesserung der jeweiligen Texte und Sprachlogiken durch genetische Algorithmen erfordert keine weitere Pro­ grammierarbeit, wenn die genetischen Algorithmen einmal ent­ wickelt sind und insbesondere die Gütefunktionen, nach denen die Entwicklung durch die genetischen Algorithmen geregelt und gegebenenfalls abgebrochen wird, da die notwendige Güte erreicht ist festgelegt sind.

Claims (39)

1. COMPUTER-AIDED-TEXT-Design-SYSTEM (CATD) zur Erstellung eines Ziel-Textes unter Verwendung vorgegebener Merkmale, dadurch gekennzeichnet, daß mit Computertechnik aus vorhandenen Textvorlagen durch Logik-, Merkmals- und gegebenenfalls Strukturvergleiche für die Erstellung eines gewünschten (Ziel)Textes geeignete, insbe­ sondere logikmäßig geeignete, Muster entnommen und aus diesen sowie zur Ergänzung gegebenenfalls neu erstellten, logikge­ rechten Mustern und unter Benutzung der vorgegebenen Merk­ male, ein bearbeiteter und vervollständigter (Ziel)Text er­ stellt wird.
2. CATD-System nach Anspruch 1, dadurch ge­ kennzeichnet, daß die Logik von Texten anhand von Logikmodellen, die insbesondere nach dem Vorbild von neuronalen Netzen aufgebaut sind, ermittelt wird.
3. CATD-System nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Erstellung des ge­ wünschten (Ziel)Textes mit Hilfe von detaillierten Eingaben über gewünschte Merkmale, Logiken und gegebenenfalls Struk­ turen, auch der verwendeten Sprache, des (Ziel)Textes und seiner einzelnen Teile erfolgt.
4. CATD-System nach Anspruch 1, 2 oder 3, dadurch gekennzeichnet, daß die Erstellung des (Ziel)Textes über Logikmodelle erfolgt, die aufgabenorientiert strukturiert sind und den Textgrundstrukturen sowie Teil­ strukturen entsprechen.
5. CATD-System nach Anspruch 1, 2, 3 oder 4, da­ durch gekennzeichnet, daß die Verbin­ dung von aus Vorlagen entnommenen Textteilstrukturen durch das Logikmodell der Textgrundlogik oder gegebenenfalls der Textgrundstruktur erfolgt.
6. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die verwendeten Logikmodelle die üblichen Formen von künstlichen neuronalen Netzen (KNN) aufweisen, z. B. die Form von üblichen Feed-Forward-Netzen mit aufgabengerecht ange­ paßten, z. B. (0/1)Netzknoten und Verbindungen mit Verbin­ dungsstärken-Differenzierungen, aufweisen.
7. CATD-System nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß Logikmodelle in Masken­ form, d. h. mit vorher festgelegten Bezügen und Verbindungen verwendet werden, wobei die dafür vorgesehenen Stellen der Masken mit aufgabengerecht formulierten Texteinzelheiten, auch unter Verwendung von durch KNN festgelegten Logiken, aufgefüllt werden.
8. CATD-System nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß Logikmodelle in Tabellenform, insbesondere mit Angabe der Verbindungsstärken zwischen den einzelnen Teilen die in die Tabelle aufgenommen sind, verwendet werden, auch unter Verwendung von durch KNN festgelegten Logiken.
9. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß Logikmodelle unterschiedlichen Aufbaus aufgabengerecht miteinander verknüpft werden, z. B. zum Erstellen einer Schutzrechts (Patent- oder Gebrauchsmuster) Anmeldung, die insbesondere eine Maskenform für den grundsätzlichen Aufbau, ergänzt durch KNN für die Logik der Maskenteile und ihre Substrukturen, haben.
10. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Logikmodelle, insbesondere die Logikmodelle in Netz­ form, als Wenn/Dann-Modelle mit Verzweigungen in zugelassene Richtungen, nach den Logikvorgaben geordnet, ausgebildet sind.
11. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Beziehungen zwischen den einzelnen Vorlageteilen und Modellteilen (Strukturteile, Netzteile, Maskenteile oder Tabelleninhalte) rechentechnisch als und/oder Beziehungen ausgebildet werden.
12. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die für unterschiedliche Textergänzungen gebildeten oder aus Vorlagen extrahierten, Logiknetze und/oder Grundstruk­ turen in Netzbibliotheken, insbesondere nach den Kriterien der Vorlagenbibliotheken geordnet, abgelegt und bei der Erstellung von Zieltexten gesucht und verwendet werden.
13. CATD-System nach Anspruch 12, dadurch ge­ kennzeichnet, daß die Netzgrundstrukturen (Logikstrukturen) hierarchisch gegliedert gespeichert, ge­ sucht und verwendet werden.
14. CATD-System nach Anspruch 12 oder 13, dadurch gekennzeichnet, daß es aufgabenangepaßte, vorgegebene Gesamtlogikmuster aufweist, die insbesondere die Logikstrukturen, insbesondere die Logikgrundstrukturen, in Netzform des jeweiligen Textes und Textteils wiedergeben.
15. CATD-System nach Anspruch 12, 13 oder 14, da­ durch gekennzeichnet, daß es Logik­ teilmuster von aufgabenspezifisch getrennten Textteilen, abgestuft von Kapiteln und Abschnitten des Textes bis zu einzelnen Satzteilen, aufweist.
16. CATD-System, insbesondere nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, daß das Textdesign (Textgenerierung) in den gebildeten Strukturen, insbesondere Netzen, mit Wort­ stammformen, z. B. der Merkmale erfolgt, deren Beziehung zueinander anschließend durch Wortverbindungen, insbesondere in Form von Verbindungsobjekten, hergestellt wird.
17. CATD-System nach Anspruch 16, dadurch ge­ kennzeichnet, daß die Beziehungen der einge­ gebenen Wortstammformen (z. B. der Substantive, der Verben etc.) zueinander in den Netzstrukturen oder anderen Vorgabe­ strukturen algorithmisch ausgedrückt werden.
18. CATD-System nach Anspruch 16 oder 17, dadurch gekennzeichnet, daß die Netzstrukturen oder anderen Vorgabestrukturen mit den Wortstammformen durch aus Listen ausgesuchten linguistischen Objekten objektstruk­ turiert komplettiert werden.
19. CATD-System nach Anspruch 16 oder 17, dadurch gekennzeichnet, daß die gebildeten Sätze, Absätze etc. mit, z. B. nach linguistischen Regeln, aufge­ stellten Satz- bzw. Absatzmasken verglichen und nur die diesen zugelassenen Masken (Patterns) entsprechenden Ergeb­ nisse als endgültige Ergebnisse zugelassen werden.
20. CATD-System nach Anspruch 19, dadurch ge­ kennzeichnet, daß die Logik und der Aufbau der zugelassenen Ergebnisse (zulässige Ergebnismuster) durch die Logik der Vorlagen bzw. Modelltexte computertechnisch fest­ gelegt wird, wobei im Rahmen einer Endkontrolle eine Ergeb­ niskontrolle erfolgen kann.
21. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß Vorlagen gegebenenfalls ergänzende Grundstrukturen, ins­ besondere Netze, komponentenorientiert aufgebaut werden und durch einen Orientierungsvergleich der Textkomponenten mit Vorlagen (insbesondere in Form von Musternetzen), z. B. aus einer Musternetzbibliothek, überprüft und gegebenenfalls korrigiert werden.
22. CATD-System nach Anspruch 21, dadurch ge­ kennzeichnet, daß ergänzende Grundstrukturen, insbesondere Netze, über linguistische Regeln objektorien­ tiert aufgebaut werden, wobei Vergleichslisten, etwa in Matrixform für Beziehungsstärken und die entsprechende Ver­ bindungsobjekte verwendet werden.
23. CATD-System, insbesondere nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, daß die Vorlagenauswahl ganz oder teil­ weise automatisiert aus Abstract- oder Volltextdatenbanken erfolgt, z. B. aus der Library of Congress, aus Patentamts­ textsammlungen, aus der Acstractdatenbank Derwent oder der Abstractdatenbank Inspec etc. vorgenommen wird.
24. CATD-System nach Anspruch 21, 22 oder 23, dadurch gekennzeichnet, daß die Vorlagenauswahl an­ hand von in der Logik-Grundstruktur besonders wichtigen Kom­ ponenten nach und/oder Beziehungen anhand aufgabenspezifi­ scher Suchkriterien erfolgt.
25. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Vorlagenauswahl nach den Beziehungsstärken zwischen den Komponenten in Textgrundmustern erfolgt, die vorteilhaft parallel zu der Suche nach Merkmalen und/oder ihren Kombinationen durchgeführt wird.
26. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Suche nach Vorlagetexten in vorhandenen Netzen, ins­ besondere im Internet, z. B. im WWW (World Wide Web) erfolgt, etwa unter Benutzung von vorhandenen Verweis- und Suchstruk­ turen des Internets.
27. CATD-System, insbesondere nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, daß die Vorlagensuche durch Makrobefehle, insbesondere unter Windows ablauffähig, nach Zielvorgaben unter Menüführung erfolgt.
28. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß es als Übersetzungseinheit, insbesondere auf einer für "Parallel Distributed Processing" besonders geeigneten Hard­ wareplattform im Internet oder in Sondernetzen (Intranets) ausgebildet ist, wobei der zu übersetzende Text vorab näher definiert wird.
29. CATD-System nach Anspruch 28, dadurch ge­ kennzeichnet, daß es für Übersetzungen unter Beachtung der jeweils zutreffenden linguistischen Regeln unter Verwendung von entsprechenden Verbindungsobjekten zwischen den Wortgrundformen, z. B. in den europäischen Hauptsprachen und den fernöstlichen Hauptsprachen, ausgebil­ det ist.
30. CATD-System, insbesondere nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekenn­ zeichnet, daß es für die Texte oder die Textteile, für die keine ausreichend gute Vorlage existiert oder auf­ findbar ist, neue Grundstrukturen und Detailstrukturen durch separate Vorgaben erhält, wobei diese z. B. durch "multiple choice Listen" mit graphischen Verbindungen der Listenkom­ ponenten vorgegeben werden.
31. CATD-System nach Anspruch 30, dadurch ge­ kennzeichnet, daß die Grundstrukturen der neuen Texte vorwiegend direkt übernommen und die Detailstrukturen, vorzugsweise in Netzform, durch Regeln zur Selbstoptimierung neuronaler Netze selbst optimiert werden.
32. CATD-System nach Anspruch 31, dadurch ge­ kennzeichnet, daß die Selbstoptimierung mit einem Ja/Nein-Feed-back in bezug auf Übereinstimmung mit vorgegebenen Mustern (Patterns), die z. B. nach linguistischen Regeln erstellt oder aus Vorlagen entnommen sind, erfolgt.
33. CATD-System nach Anspruch 31 oder 32, dadurch gekennzeichnet, daß die Optimierung Off-line ablaufend, auch durch genetische Algorithmen, erfolgt.
34. CATD-System nach Anspruch 31, 32 oder 33, dadurch gekennzeichnet, daß die Optimierung bis zum Erreichen einer vorgegebenen Gütefunktion durchgeführt wird, insbesondere bis zu einer tolerierbaren, insbesondere durch Muster-(Pattern) Vergleich ermittelten Fehlerzahl je Text, durchgeführt wird, wobei die Fehlerzahl insbesondere als ja/nein Feedback dient.
35. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß es zur Erstellung von Patent- oder Gebrauchsmustertexten verwendet wird.
36. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß es zur Erstellung technischer Texte, wie Gebrauchsanlei­ tungen, Produktbeschreibungen, Entwicklungsstandsberichten, Laborberichten etc. verwendet wird.
37. CATD-System nach einem oder mehreren der Ansprüche 1 bis 34, dadurch gekennzeichnet, daß es zur Erstellung von Zeitungs- oder Zeitschriftentexten, insbe­ sondere auf der Grundlage von Agenturmeldungen o. ä., aber auch zur Erstellung von Vertragstexten und anderen juristi­ schen Texten, verwendet wird.
38. CATD-System nach einem oder mehreren der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß es als Internet-Komponente oder als Komponente in Corporate-Netzworks (Intranets) zur multilingualen Übermitt­ lung von Texten, auch mit Sprachein- und -ausgabe, verwendet wird.
39. CATD-System zur Erstellung von schriftlich oder sprach­ lich ausgegebenen Texten, gekennzeichnet durch die Verwendung von "Parallel Distributed Processing" auf der Basis künstlicher neuronaler Netze (KNN) unter Ver­ wendung bekannter oder selbstgelernter Netzformen zur Logik­ einhaltung, ausgehend von ausgewählten Textvorlagen und der ihnen zugrundeliegenden Logik.
DE19626142A 1996-07-01 1996-07-01 Computer-Aided-Text-Design-System Withdrawn DE19626142A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19626142A DE19626142A1 (de) 1996-07-01 1996-07-01 Computer-Aided-Text-Design-System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19626142A DE19626142A1 (de) 1996-07-01 1996-07-01 Computer-Aided-Text-Design-System

Publications (1)

Publication Number Publication Date
DE19626142A1 true DE19626142A1 (de) 1998-01-08

Family

ID=7798401

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19626142A Withdrawn DE19626142A1 (de) 1996-07-01 1996-07-01 Computer-Aided-Text-Design-System

Country Status (1)

Country Link
DE (1) DE19626142A1 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002086757A1 (en) * 2001-04-20 2002-10-31 Voxi Ab Conversion between data representation formats
US6556973B1 (en) 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
FR2855632A1 (fr) * 2003-06-02 2004-12-03 Claude Tumorticchi Dispositif universel de redaction automatique hyperclic
EP3744068B1 (de) 2019-01-17 2021-08-11 IT-Seal GmbH Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments
CN117709907A (zh) * 2024-02-05 2024-03-15 北京睿企信息科技有限公司 一种指引服务的指令发送***

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6556973B1 (en) 2000-04-19 2003-04-29 Voxi Ab Conversion between data representation formats
WO2002086757A1 (en) * 2001-04-20 2002-10-31 Voxi Ab Conversion between data representation formats
FR2855632A1 (fr) * 2003-06-02 2004-12-03 Claude Tumorticchi Dispositif universel de redaction automatique hyperclic
EP3744068B1 (de) 2019-01-17 2021-08-11 IT-Seal GmbH Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments
US12003536B2 (en) 2019-01-17 2024-06-04 IT-Seal GmbH Method for the automated creation of a phishing document addressed to a predefined person
CN117709907A (zh) * 2024-02-05 2024-03-15 北京睿企信息科技有限公司 一种指引服务的指令发送***
CN117709907B (zh) * 2024-02-05 2024-04-26 北京睿企信息科技有限公司 一种指引服务的指令发送***

Similar Documents

Publication Publication Date Title
DE69022842T2 (de) Verwendung von Befehlsähnlichkeiten in einem intelligenten Hilfssystem.
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE602004003513T2 (de) Vorrichtung zum Ordnen bei der Satzgenerierung für ein System zur Generierung natürlicher Sprache, basierend auf linguistisch informierten statistischen Modellen der Bestandteil-Struktur
DE112017006151T5 (de) Anpassbare Verarbeitungskomponenten
DE69532307T2 (de) Ausdrucks-Propagierung für hierarchisches Netzlisten
WO2000063788A2 (de) Situationsabhängig operierendes semantisches netz n-ter ordnung
DE10149693A1 (de) Objekte in einem Computersystem
EP2425331A1 (de) Verfahren zur erzeugung mindestens einer anwendungsbeschreibung
DE102020206135A1 (de) Vorrichtung und Verfahren zum Bestimmen wenigstens eines Teils eines Knowledge Graphs
DE19626142A1 (de) Computer-Aided-Text-Design-System
WO2022037818A1 (de) Vorrichtung und verfahren zur interaktion mit einer graphischen benutzeroberfläche und zum testen einer applikation
WO2021104608A1 (de) Verfahren zum erzeugen eines engineering-vorschlags für eine vorrichtung oder anlage
EP3709188A1 (de) Rechnerarchitektur für eine schnittstelle zur aggregation von datenobjekten in einem verteilten system
WO2004003798A2 (de) Informationserzeugungssystem für die produktentstehung
EP3907574A1 (de) Verfahren zur generierung von einer erklärung zu einer vorgenommenen entscheidung eines fertigungssteuerungssystems
DE102018222156A1 (de) Verfahren, Anordnung und Verwendung zum Erzeugen einer Antwortausgabe in Reaktion auf eine Spracheingabeinformation
DE102016125162B4 (de) Verfahren und Vorrichtung zum maschinellen Verarbeiten von Texten
DE19831651C1 (de) Verfahren zum Erzeugen eines regel- und anpassbaren Netzwerkes von Modellen von Verhaltensmustern einschließlich Software-Systemen
EP1959430A2 (de) Verfahren zur automatischen Generierung von VoiceXML-sprachapplicationen aus Sprachdialogmodellen
DE19828528A1 (de) Expertensystem
DE3627204C2 (de) Digitales Computersystem mit einem Expertensystem
WO2022043455A1 (de) Verfahren und ein system zum erstellen einer industriellen lösung mit einer künstlichen intelligenz
DE19635351C2 (de) Verfahren zur Formatkonvertierung
DE102022110355A1 (de) Verfahren und Vorrichtung zur maschinellen Unterstützung eines Konstrukteurs
DE102021208368A1 (de) Computerimplementiertes Verfahren zur Entwicklung eines Produkts in einem vernetzten System und Anwendersystem zur computergestützten Entwicklung eines Produkts

Legal Events

Date Code Title Description
8122 Nonbinding interest in granting licences declared
8127 New person/name/address of the applicant

Owner name: SCHULZE HORN, HANNES, DR.-ING., 45966 GLADBECK, DE

8139 Disposal/non-payment of the annual fee