DE19626142A1 - Computer-Aided-Text-Design-System - Google Patents
Computer-Aided-Text-Design-SystemInfo
- Publication number
- DE19626142A1 DE19626142A1 DE19626142A DE19626142A DE19626142A1 DE 19626142 A1 DE19626142 A1 DE 19626142A1 DE 19626142 A DE19626142 A DE 19626142A DE 19626142 A DE19626142 A DE 19626142A DE 19626142 A1 DE19626142 A1 DE 19626142A1
- Authority
- DE
- Germany
- Prior art keywords
- text
- catd
- logic
- structures
- texts
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000013461 design Methods 0.000 title claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 18
- 238000005457 optimization Methods 0.000 claims description 28
- 238000012545 processing Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 12
- 238000011161 development Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 9
- 239000000047 product Substances 0.000 claims description 9
- 230000002068 genetic effect Effects 0.000 claims description 7
- 230000014616 translation Effects 0.000 claims description 7
- 238000013519 translation Methods 0.000 claims description 6
- 238000007689 inspection Methods 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 2
- 230000004069 differentiation Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 20
- 230000008901 benefit Effects 0.000 description 19
- 230000006978 adaptation Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 230000018109 developmental process Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 11
- 238000012549 training Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000012805 post-processing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101150049168 Nisch gene Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004870 electrical engineering Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000003973 paint Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000000225 synapse Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Die Erfindung betrifft ein Computer-Aided-Text-Design-System,
dessen Aufgabe es ist, bei gegenüber bekannten Systemen ver
ringertem Rechenaufwand logisch einwandfreie Texte zu er
stellen. Dabei soll insbesondere eine fortlaufende, auch
selbsttätige, Verbesserung der Textanalitäten und auch der
Systemfunktion möglich sein. Dabei soll es auch möglich sein,
die in Textbaustein-Kombinationssystemen verwendeten Textbau
steine und/oder Masken zu verwenden. Weiterhin soll es mög
lich sein, logisch einwandfreie Übersetzungen, insbesondere
von mit dem System erstellten Patenttexten, durchzuführen.
Die Aufgabe wird im wesentlichen dadurch gelöst, daß compu
tertechnisch nach Vorgaben aus vorhandenen Textvorlagen durch
Merkmals-, Logik- und gegebenenfalls Strukturvergleiche für
die Erstellung eines gewünschten (Ziel)Textes geeignete,
insbesondere logikmäßig geeignete, Muster entnommen und aus
diesen sowie zur Ergänzung gegebenenfalls neu erstellten,
logikgerechten Mustern unter Benutzung der vorgegebenen Merk
male, ein bearbeiteter und vervollständigter (Ziel)Text
erstellt wird.
Rechentechnisch arbeitende Texterstellungssysteme sind be
kannt, so z. B. aus dem US-Patent 5 200 893 (Hitachi) oder in
Form eines Übersetzungsprogramms "Personal/Translator Plus
(PT plus)" von IBM, die auch logische Zusammenhänge berück
sichtigt. Diesen bekannten Texterstellungssystemen ist eine
mechanistische Bearbeitung linguistischer Regeln und der
Logik gemeinsam. Ihr Rechenaufwand ist hoch, ohne daß die
Ergebnisse befriedigen können. Sowohl die Schwierigkeiten mit
der Logik von generierten Texten als auch der große Rechen
aufwand, der häufig zum Abbruch der Texterstellung vor Er
reichen eines brauchbaren Ergebnisses führt, können durch das
erfindungsgemäße System überwunden werden. Durch das Vorgehen
nach dem erfindungsgemäßen System wird eine sichere Lösung
des Logikproblems von erstellten Texten erreicht. Dieses
Problem hat bisher einer weiten Verbreitung von rechentech
nisch erstellten (generierten)Texten entgegengestanden, ob
wohl für eine rechentechnische Textgenerierung aus Kosten
gründen schon seit langem ein erhebliches Bedürfnis besteht.
In Ausgestaltung der Erfindung ist vorgesehen, daß die Logik
von Texten anhand von Logikmodellen, die insbesondere nach
dem Vorbild von neuronalen Netzen aufgebaut sind, ermittelt
wird. So wird eine gute rechentechnische Bearbeitung der
Logik möglich, wobei von der bekannten, aber bisher bei der
Generierung von Texten bisher nicht in gebotenem Maß verwen
deten, Tatsache ausgegangen wird, daß fast alles in der einen
oder anderen Form weitgehend "schon einmal dagewesen" ist.
Dies gilt insbesondere für technische Texte, da die Entwick
lung der Technik im wesentlichen evolutionär verläuft, etwas
vollkommen Neues ist in der Technik selten!
In weiterer Ausgestaltung des erfindungsgemäßen Systems ist
vorgesehen, daß die Erstellung des gewünschten (Ziel)Textes
mit Hilfe von detaillierten Eingaben über gewünschte Merkma
le, Logiken und gegebenenfalls Strukturen, auch der verwende
ten Sprache, des (Ziel)Textes und seiner einzelnen Teile
erfolgt. Die Eingaben erfolgen insbesondere über Listen, etwa
Merkmalslisten und Abhängigkeitslisten. Durch dieses Vorgehen
wird sichergestellt, daß der erstellte Text auch wirklich dem
gewünschten Text entspricht, d. h., daß ein logisch zielge
richtetes Arbeiten erfolgt. Die Erstellung des (Ziel)Textes
über Logikmodelle erfolgt vorteilhaft aufgabenorientiert
strukturiert. Die Logikmodelle werden aufgabenorientiert
strukturiert und entsprechend vorgegebenen. Wahlweise werden
sie auch durch Suche ermittelten Textgrundstrukturen sowie
Teilstrukturen, z. B. den einzelnen Teilen einer Patent- oder
Gebrauchsmusteranmeldung, einer Gebrauchsanweisung etc. ent
nommen. Durch eine aufgabenorientierte Strukturierung und die
Unterteilung in Textgrundstrukturen sowie Teilstrukturen,
insbesondere bei hierarchischer Aufteilung, wird die Qualität
der Textgenerierung erhöht.
Es ist dabei eine gute Vorlagenselektion möglich, wenn auch
hierfür die entsprechende Aufteilung in Grundstrukturen,
Teilstrukturen etc. vorgenommen wird. Vorteilhaft wird die
Verbindung von aus Vorlagen entnommenen Textteilstrukturen
durch das Logikmodell der Textgrundlogik oder der Textgrund
struktur vorgenommen. So ist es möglich, rechentechnisch gut
behandelbare Textmodule zu verwenden, die ohne Verlust der
Gesamtlogik für die Textgenerierung verwendbar sind.
In Ausgestaltung der Erfindung ist weiterhin vorgesehen, daß
die verwendeten Logikmodelle die üblichen Formen von künstli
chen neuronalen Netzen (KNN) aufweisen, die z. B. die Form von
üblichen Feed-Forward-Netzen mit aufgabengerecht angepaßten,
z. B. (0/1) Netzknoten und Verbindungen mit Verbindungsstär
ken-Differenzierungen haben. Bei dem aus der Literatur viel
fältig bekannten Feed-Forward-Netzen (mehrlagige rückkopp
lungsfreie Netze) wird die Anzahl der Ausgänge des Netzes
durch das Problem vorgegeben. Die Anzahl der Neuronen in der
Zwischenschicht zwischen der Eingangsebene und Ausgangsebene
ist frei wählbar, wobei die Fähigkeit des Netzes mit der An
zahl der Neuronen in der Zwischenschicht wächst. Derartige
Netze, die mit einem ja/nein (zutreffend-nichtzutreffend)
Gesamt-Lernvorgang arbeiten können, sind besonders einfach
rechentechnisch beherrschbar. Sie sind die am weitesten
bekannten künstlichen neuronalen Netze (KNN) und können vor
teilhaft für das Textgenerierungssystem verwendet werden. Die
Entwicklung spezieller künstlicher neuronaler Netztechniken
für das System ist also nicht notwendig.
Es ist bei der Anwendung der Erfindung vorgesehen, daß gege
benenfalls Logikmodelle in Maskenform, d. h. mit vorher fest
gelegten Bezügen und Verbindungen, verwendet werden, wobei
die dafür vorgesehenen Stellen der Masken mit aufgabengerecht
formulierten Texteinzelheiten aufgefüllt werden. So ergibt
sich eine insbesondere für technische Texte, wie Patent- oder
Gebrauchsmusteranmeldungen, Produktbeschreibungen, Gebrauchs
anleitungen etc. besonders geeignete Systemausbildung, die
die rechentechnische Bearbeitung erheblich vereinfacht. Die
übergeordnete Logik ist bereits in der Maskenform enthalten.
Nur die Sekundärlogiken müssen aus Textvorlagen extrahiert
und mit der Primärlogik eines Textes abgestimmt werden.
Es ist weiterhin vorgesehen, daß die Logikvorgabe in Tabel
len- oder Matrixform erfolgt, insbesondere mit Angabe der
Verbindungsausbildungen, insbesondere Verbindungsstärken,
zwischen den einzelnen Teilen, die in die Tabelle oder Matrix
aufgenommen sind. So werden die notwendigen Logikvorgaben
rechentechnisch handhabbar. Die Eingabe wird vereinfacht und
das Textdesign als solches beschleunigt. Desweiteren kommt
dieses Vorgehen der Übersichtlichkeit und damit der Kontrolle
der Eingaben entgegen.
Es ist dabei vorgesehen, daß Logikmodelle unterschiedlichen
Aufbaus aufgabengerecht miteinander verknüpft werden, z. B.
zum Erstellen einer Schutzrechts-(Patent- oder Gebrauchs
muster)Anmeldung, die insbesondere eine Maskenform für den
grundsätzlichen Aufbau, ergänzt durch neuronale Netzmodelle
für die Logik der Maskenteile und die Abstimmung der Einzel
logiken aufeinander, aufweist. So ergibt sich eine für
Patent- oder Gebrauchsmusteranmeldungen, Produktbeschrei
bungen etc. besonders geeignete, mit Sicherheit den Mindest
anforderungen an derartige Texte entsprechende, Ausführung
des generierten Textes.
Aus Vorlagen und den daraus extrahierten Logikmodellen lassen
sich nicht immer vollständige, zutreffende Zieltexte erstel
len. Bedingt durch die Tatsache, daß ja technische Verände
rungen vorliegen und den modulartigen Aufbau, bleiben Lücken,
die durch frei generierte Textteile ausgefüllt werden müssen.
Diese Textteile, die ihrem Wesen nach Textergänzungen sind,
werden über Erstellungsprogrammteile separat erarbeitet.
Hierfür werden vorteilhaft ebenfalls gespeicherte Logikmo
delle verwendet, die entsprechend, z. B. in Trial and Error-
Routinen, angepaßt werden. Ebenso wie die aus Vorlagen
extrahierten Logikmodelle und die vorgegebenen Strukturen und
Masken zur Texterstellung werden diese Modelle und Strukturen
in Bibliotheken, vorzugsweise nach den Kriterien der Vor
lagenbibliotheken geordnet, abgelegt und bei der Erstellung
von Zieltexten gesucht. Das Suchen von Zieltexten und ihren
Logiken ist ebenfalls bekannt, so z. B. aus der EP-0 639 814 A1
(Canon) und aus der EP-0 375 970 B1 (IBM), die rein
mechanistisch arbeiten oder auf Expertensystemgrundlagen
beruhen.
Es ist vorteilhaft, wenn bei einer derartigen Suche vornehm
lich den Logikanforderungen Rechnung getragen wird. Hierfür
werden geeignete Netzgrundstrukturen (Logikstrukturen), ins
besondere hierarchisch gegliedert, durch Mustervergleich ver
wendet. Zur Suche weist das erfindungsgemäße System Logik
teilmuster von aufgabenspezifisch getrennten Textteilen, ab
gestuft von Kapiteln oder Abschnitten des Textes bis zu ein
zelnen Satzteilen, auf. So ergibt sich eine geeignete rechen
technische Bearbeitung der gesuchten Texte unter besonderer
Berücksichtigung der erforderlichen Logik.
In Durchführung des erfindungsgemäßen Systems ist vorgesehen,
daß das Textdesign (Textgenerierung) in den gebildeten Struk
turen, insbesondere Netzen, mit Wortstammformen, z. B. der
Merkmale erfolgt, deren Beziehung zueinander anschließend
durch Wortverbindungen, insbesondere in Form von Verbindungs
objekten, hergestellt wird. Dabei werden die Beziehungen der
eingegebenen Wortstammformen, z. B. der Substantive, der
Verben etc., zueinander in den Netzstrukturen oder anderen
Vorgabestrukturen, algorithmisch ausgedrückt. Die Netzstruk
turen oder andere Vorgabestrukturen mit den Wortstammformen
werden dann mit aus Listen aussuchbaren, linguistischen
Objekten objektstrukturiert komplettiert. So ist eine rechen
technisch gut handhabbare Bearbeitung möglich, die aus der
logischen Rohfassung die endgültige Fassung erstellt. So muß
nicht eine Wort nach Wort/Erstellung erfolgen, sondern über
die objektstrukturierte Komplettierung ergibt sich eine
Komplett-Textfassung, die lediglich nach den linguistischen
Regeln der jeweiligen Sprache, in der der Text erstellt wird,
kontrolliert werden muß. Diese Kontrolle und eine gegebenen
falls nachfolgende Korrektur, kann ohne Veränderung der
Logikstruktur erfolgen.
Zur Kontrolle, ob die gewünschte Textqualität erreicht ist,
werden die gebildeten Sätze, Absätze etc. mit, z. B. nach lin
guistischen Regeln aufgestellten, Satz- bzw. Absatzmasken
verglichen und nur die diesen zugelassenen Masken (Patterns)
entsprechenden Ergebnisse als endgültige Ergebnisse zuge
lassen. So ergibt sich ein kontrolliertes, logisch einwand
freies Ergebnis, wobei die Zulassung als endgültiges Ergebnis
gleichzeitig den Abbruch eventuell vorhergehender Optimierun
gen nach linguistischen Regeln bedeutet. Es ist dabei im
Rahmen der Erfindung liegend und für schwierige Texte vor
teilhaft, mehrere konkurrierende Textausführungen zu erstel
len, z. B. durch die Verwendung unterschiedlicher Textvor
lagen, und die am besten in die zugelassenen Muster, die
zugelassene Maske o. ä. passende Fassung als endgültige Fas
sung auszuwählen. Dieses Vorgehen empfiehlt sich, wenn die
Suche nach einer zutreffenden Vorlage kein eindeutiges
Ergebnis ergibt. Eventuell kann hier auch der Operator des
Systems unterstützend eingreifen.
Die Logik und der Aufbau der zugelassenen Ergebnisse (zuläs
sige Ergebnismuster) wird durch die Logik der Vorlagen bzw.
Modelltexte festgelegt. So ergibt sich stets ein auch logisch
korrektes Ergebnis. Hierfür erfolgt gegebenenfalls auch noch
ein Vergleich mit Musternetzen, z. B. aus einer Musternetz
bibliothek. Die Endkontrolle erfaßt auch die Textteile, die
neu generiert worden sind, da sie sich nicht aus den Vorlage
teilen ergaben. So werden auch diese Teile noch einmal über
prüft und gegebenenfalls korrigiert.
Die neu generierten Textteile werden über linguistische
Regeln objektorientiert aufgebaut, wobei Vergleichslisten,
etwa in Matrixform, für Beziehungsstärken und sprachliche
Ausdrucksformen verwendet werden können. Durch eine rechen
technische Bearbeitung in Matrixform ergibt sich eine beson
ders günstige Vergleichsmöglichkeit rechentechnischer Art.
Dies gilt insbesondere für die gesuchten oder gewählten
Logiknetze. Entsprechende Matrixstrukturen und ihre Erläute
rung ergeben sich aus dem Buch "Parallel Distributed
Prozessing" von Rumelhardt und anderen, MIT-Press, 1986, aus
dem auch weitere, insbesondere die Logik-Netze betreffende,
Angaben entnehmbar sind.
Zur Durchführung der Erfindung ist vorgesehen, daß die Vorla
genauswahl ganz oder teilweise automatisiert aus Abstract- oder
Volltextdatenbanken erfolgt, z. B. aus der Library of
Congress, aus Patentamtstextsammlungen, aus der Abstract
datenbank Derwent oder der Abstractdatenbank Inspec etc.
vorgenommen wird. So wird vorteilhaft von dem weltweit vor
handenen Vorwissen Gebrauch gemacht und für Patent- und
Gebrauchsmusteranmeldungen eine Merkmals- und Logikkombina
tion erreicht, die auch die Prüfung derartiger Schriften
wesentlich erleichtert!
Es versteht sich, daß je nach Aufgabe, auch die Datenbanken
für Zeitungstexte etc. verwendbar sind.
Die Vorlagenauswahl erfolgt vorteilhaft anhand von in der
Grundstruktur besonders wichtigen Komponenten (Logik und
anderen Merkmale) nach und/oder Beziehungen anhand aufgaben
spezifischer Suchkriterien. Die aufgabenspezifischen Such
kriterien, die auch in Listenform vorgegeben werden können,
orientieren sich vorteilhaft an vorhandenen Datenbankstruk
turen, z. B. an der Patentklassifikation bei Patentdatenbanken
sowie an vorhandenen Suchprogrammen für derartige Datenban
ken. Hierdurch ergibt sich eine weitgehende Übernahmemöglich
keit vorhandener Software und Softwarestrukturen, die das
erfindungsgemäße System in der Entwicklung der Suchprogramm
teile kostengünstig macht.
Die Vorlagenauswahl erfolgt insbesondere nach den Beziehungs
stärken zwischen den Komponenten in Textgrundmustern, d. h.
unter Einbeziehung künstlicher neuronaler Netze. So ergibt
sich eine Suchoptimierung, die zu einer der jeweiligen Logik
und den speziellen Merkmalen entsprechenden Vorlage führt,
sofern und soweit diese in Datenbanken vorhanden ist.
Die Suche nach Vorlagentexten kann in den Netzen erfolgen,
auf die der übliche Zugriff besteht. So kann etwa das WWW
verwendet werden, es bieten sich aber auch spezielle Firmen
netze an. Die Vorlagensuche wird vorteilhaft durch Makrobe
fehle nach Zielvorgaben unter Menüführung durchgeführt, so
wird die Suche besonders leicht gemacht. Kostenmäßig beson
ders vorteilhaft ist dabei, wenn etwa auf die Verfahrensweise
der Suche im Internet zurückgegriffen wird. Dabei ist dieser
Suchvorgang mit den vorhandenen Softwarestrukturen und Be
triebssystemen, etwa Windows, kompatibel.
Das erfindungsgemäße System kann in den verschiedensten Ge
bieten eingesetzt werden. Neben der Erstellung technischer
Texte nach Operatorvorgaben, kann es auch vorteilhaft für
Übersetzungen eingesetzt werden. Auch bei Übersetzungen gilt,
daß für die allermeisten, insbesondere die technischen Texte,
Vorlagen vorhanden sind, die lediglich ergänzt, leicht ge
ändert o. ä. werden müssen. Auch hierfür eignen sich die vor
stehend beschriebenen Such- und Ergänzungsvorgänge. Insbeson
dere für die Logik von Übersetzungen ergibt sich damit eine
wesentlich über den bisherigen computertechnischen Über
setzungen liegende Qualität.
In Durchführung der Erfindung ist vorgesehen, daß ebenso wie
für die Komplettierung von Textentwürfen, das erfindungsge
mäße System für die Texte oder Textteile, für die keine aus
reichend nahekommende Vorlage existiert oder auffindbar ist,
neue Grundstrukturen und Detailstrukturen durch separate
Vorgaben erhält. Diese Vorgaben werden z. B. durch Multiple
choice Listen mit graphischen Verbindungen der Listenkompo
nenten vorgegeben. Diese Listen erhalten besonders vorteil
haft z. B. Matrixform, um gut überschaubar und kontrollierbar
zu sein. So ist eine vorteilhafte Erweiterung des Systems
über die Vorlagentextbenutzung hinaus möglich.
Bei der Adaption von vorhandenen Vorlagenteilen werden vor
teilhaft Grundlogiken direkt übernommen und nur die Detail
logiken und Verbindungsobjektausführungen durch Regeln zur
Selbstoptimierung neuronaler Netze oder anderer Programmodule
gestaltet, angepaßt und optimiert. Derartige Optimierungen,
vorzugsweise in Form von Selbstoptimierungen neuronaler
Netze, sind bekannt, auch in Verbindung mit einer
Modulstruktur von Modellen. Eine entsprechende Optimierung
ist z. B. aus der DE-195 08 476 A1 entnehmbar. Hier ist sie
für das Leitsystem einer Industrieanlage gedacht, ihr Prinzip
kann jedoch angepaßt für das erfindungsgemäße System über
nommen werden. Die Optimierung erfolgt vorteilhaft Offline,
auch durch genetische Algorithmen, die die neuronalen Netze
oder anderen Modulteile z. B. Maskenteile, verbessern, während
die aktuelle Textgenerierung Online erfolgt. Die optimierte
Ausführung der Modelle wird in die Modellbibliothek über
nommen, so daß zwar nicht der aktuell generierte Text, aber
andere später erstellten Texte, für die etwa der erstellte
Text als Vorlage dient, entsprechend optimiert ausgeführt
werden können.
Von besonderer Bedeutung für alle Optimierungen ist die Güte
funktion, bis zu deren Erreichen die Optimierung fortgeführt
wird. Bei dem erfindungsgemäßen System ist eine ausreichende
Güte erreicht, wenn der generierte Text in ein vorgegebenes
Muster einfügbar ist und dessen Logik und linguistische For
derungen zu einem vorgegebenen % Satz erfüllt. Falls dies
nicht in annehmbarer Rechenzeit erreicht werden kann, wird
die Optimierung abgebrochen. Wie bei durch Menschen erstell
ten Texten auch, kann ein gewisser % Satz an Restfehlern in
der Regel in Kauf genommen werden (Nobody is perfect). Bei
Textvorlagen, deren Logik selbst nicht stimmt, kann eine
Vorab-Optimierung durch einen Bearbeiter, also nicht rechen
technisch, ein vorteilhafter Ausweg sein. Ein gewisser, mit
zunehmendem Gebrauch des Systems aber ständig abnehmender,
Anteil an den zu generierenden Texten, wird sich einer aus
reichend guten rechentechnischen Erstellung entziehen. Für
den größten Teil der Texte, insbesondere der technischen
Texte, wird sich aber eine gute Generierungsmöglichkeit
ergeben. Für die Benutzung der Texte ergibt sich, daß sich
durch die zwar große, aber letztendlich doch begrenzte, Zahl
der verwendeten Logiken und Verbindungsobjekte eine
schnellere Erfaßbarkeit des Inhalts durch einen Benutzer
dieser Texte ergibt, als es bei individualistisch erstellten
Texten der Fall ist. Insbesondere bei für Laien häufig
ziemlich unverständliche langen Patentansprüchen dürfte sich
dieser Vorteil ergeben. Hier sind die klaren Logiken der
Rechentechnik von Vorteil.
Die Erfindung wird anhand von Zeichnungen naher erläutert,
aus denen, ebenso wie aus den Unteransprüchen, auch für sich
erfinderische Einzelheiten entnehmbar sind. Im einzelnen
zeigen:
Fig. 1 vereinfachte Prinzip der Texterstellung unter Berück
sichtigung der Text-Vorlagensuche und -Auswahl,
Fig. 2 die Zusammenhänge in einem Netz am Beispiel einer
rechentechnisch umsetzungsfähigen Netzdarstellung und
einer Matrix,
Fig. 3 eine 0-1 Logik, mit der Auswahl-Entscheidungen ge
troffen werden können,
Fig. 4 ein vereinfachtes Schema zur Darstellung der Bezie
hungsbeeinflussung zwischen einem Eingangstext und
einem Zieltext,
Fig. 5 ein dreilagiges Netz als Beispiel für die Erstellung
von passenden Wertverbindungen,
Fig. 6 das Funktionsschema des vorgesehenen Optimierers für
Logik und linguistische Bedingungen,
Fig. 7 ein Beispiel für die rechentechnische Generierung von
Textteilen,
Fig. 8 die Hauptbestandteile des Speichers der Recheneinheit
für die Textgenerierung,
Fig. 9 ein Arbeitsschema für die Erstellung einer Patent- oder
Gebrauchsmusteranmeldung,
Fig. 10 eine Textaufbaumaske mit Angaben für die Ausbildung
einer Patent- oder Gebrauchsmusteranmeldung.
In Fig. 1 bezeichnet 1 den Operator, der mit Hilfe eines Rech
ners 8 mit Monitor 6, vorteilhaft unter Menüführung, über
eine Tastatur, gegebenenfalls auch über ein Mikrofon und eine
Maus 10, den Texterstellungsvorgang durchführt. Eingegeben
werden z. B. Suchbefehle 2, etwa welche Datenbank zu benutzen
ist, ob Volltexte, Abstracts, Absätze, ganze Figurenbeschrei
bungen o. ä. gesucht werden sollen. Weiterhin werden die Vor
gaben für den Zieltext eingegeben, z. B. Listen mit Merkmalen
und ihren logischen Beziehungen, vorzugsweise in Matrixform.
Gegebenenfalls wird auch die spezielle Sprache, in der der
Zieltext erstellt werden soll, eingegeben. Die Vorgaben bzw.
die Listen und Logikbeziehungen sind speziell auf den Einzel
fall des Textes abzustellen. Sie können speziell erstellt
werden, aber auch aus vorhandenen Texten (Vorlagen) extra
hiert werden, z. B. mit Hilfe von Suchroutinen unter Einbe
ziehung der Logik. U.U. vorteilhaft, werden die Vorgaben,
Listen etc. gegebenenfalls in Form eines Auswahl- und
Korrekturdialogs erarbeitet und eingegeben. Dieser Dialog
wird durch den Zweirichtungspfeil 5 symbolisiert.
Der Zweirichtungspfeil 5 symbolisiert auch die Durchführung
der Korrektureingriffe nach Fehlfunktionsangaben etc.
Für den in der Praxis, z. B. bei Patentanmeldungen, recht
häufigen Fall, daß ein älterer Textstand an neue Produktaus
führungen oder an einen vom Patentamt ermittelten neuen Stand
der Technik angepaßt werden kann, ist auch die Eingabe von
Nachbearbeitungsmaterial 4 vorgesehen. In diesem Fall kann
der Suchvorgang nach Vorlagen entfallen, der ältere Text stand
dient als Vorlage sowohl für die Hauptmerkmale als auch für
die Gesamtlogik. Bei Patentanmeldungen ergibt sich so
vorteilhaft die Möglichkeit einer elektronischen Aktenführung
und Bearbeitung, da beim Erstellungsvorgang alle für den
jeweils zu erstellenden Text relevanten Einzelheiten vom
Erstellungssystem gespeichert werden.
Aus den gewählten Textbibliotheken werden zutreffende Gesamt
texte 15 bzw. Teiltexte, wie Kapitel, Absätze und gegebenen
falls auch Einzelsätze, symbolisiert durch die Seiten 16, 17
und 18 im Dialog mit der Logikbibliothek, die Gesamtlogiken
und Teillogiken für Textteile, Absätze, Sätze und gegebenen
falls Einzelobjekte, symbolisiert durch die Logikseiten 11,
12, 13 und 14, herausgesucht. Die am besten übereinstimmenden
Texte mit ihren Logiken werden im Vergleicher 21 ermittelt
und in 23 zu einer neuen logischen Textrohfassung zusammen
gestellt. Diese Textrohfassung wird dann in 25 adaptiert.
Dabei steht die Adaptionseinheit 25 über Dialogverbindungen
27 und 28 und der Logikbibliothek 11 bis 14 in Verbindung,
über die ständig die Logik des adaptierten Textes mit den
Vorgaben und der ausgewählten Logik bzw. den Logikteilen ver
glichen werden. Die Informationsweitergabe zwischen den ein
zelnen Recheneinheiten kann z. B. über die Verbindungen 19,
20, 22, 24 und 26 geschehen. Vorteilhaft wird jedoch eine
Netzarchitektur für das erforderliche parallele, verteilte
Bearbeiten gebildet, die anforderungsgerecht für die jewei
lige Textbearbeitungsaufgabe aufgebaut wird.
Nach der Adaption in 25 gelangt der erstellte Text über 30 in
die Kontrolle 29, wo er einer Vergleichsmusterprüfung unter
zogen wird. Es wird also geprüft, ob er den Anforderungen an
Standardformen von Sätzen und Rückbezügen zwischen den Sätzen
genügt. Hierzu werden z. B. Logikregeln aus 39 und linguisti
sche Regeln aus 37 eingesetzt, mit denen Standardformen ge
bildet werden. Die Kontrolle bezieht sich dabei nicht nur auf
einzelne Sätze und ihre Bezüge zu den benachbarten Sätzen
sondern auch auf die Gesamtlogik und die Teillogiken, vor
teilhaft ebenfalls durch Mustervergleich. Es versteht sich,
daß diese Vergleichsmuster bzw. Standardformen nur eine be
grenzte Zahl von erstellten Texten und Textteilen prüfen
können. Für die Generierung technischer oder sonstiger Infor
mationstexte ist dies jedoch hinnehmbar, da hier im Prinzip
ähnliche Logiken und Satz formen für die Beschreibung unter
schiedlicher Sachverhalte verwendbar sind. Es kommt ja bei
diesen Texten weniger auf eine sprachliche Vielfalt als auf
eine klare Ausdrucksweise an, um Mißverständnisse über den
Inhalt des Geschriebenen bzw. gegebenenfalls bei Sprachaus
gabe auch des Gesagten, nicht aufkommen zu lassen. Wegen der
begrenzten Zeit, die häufig für das Lesen technischer Texte
zur Verfügung steht, ist eine begrenzte Auswahl von Logiken
und Satzformen (z. B. 10³-10⁴ je Sachgebiet) sogar vorteil
haft, da sich so der Leser relativ einfach einen Eindruck
über den jeweiligen Inhalt des Textes verschaffen kann. Der
Verständlichkeit eines Textes ist in der Technik der Vorzug
vor einer unbegrenzten Ausdrucksvielfalt zu geben.
Falls die Kontrolle ergibt, daß der durch die Adaption ent
standene Text nicht die gestellten, variierbaren Anforde
rungen an die Logik und die linguistischen Regeln erfüllt,
wird eine Bearbeitung des Textes in einem Optimierer 31
vorgenommen, dessen Funktion in den weiteren Figuren noch
näher erläutert wird. Der Optimierer, dem ebenfalls aus den
Speichern 39 und 37 Logikregeln und linguistische Regeln
aufgegeben werden, der darüber hinaus aber auch neue Wort- bzw.
Satzkombinationen, Objektkombinationen etc. aufstellt,
prüft und gegebenenfalls über 33 weitergibt, hat für das
erfindungsgemäße System eine wesentliche Funktion, da er über
die jeweilige Einzelaufgabe hinaus eine fortlaufende Verbes
serung des Systems durch Erweiterung der Vorlagen bewirken
kann.
In die Adaption 25 gehen auch noch die Inhalte einer Ergän
zungsbibliothek 47, einer Verbindungsobjektbibliothek 48 und
einer Adaptionsregelbibliothek 49 über die Verbindungen 50,
51 und 52 ein. So können die Teile des Textes, die adaptiv
nicht erstellbar sind, d. h. logische Löcher, ausgefüllt
werden. Der vollständige Text ergibt sich aus adaptierten
Teilen und gegebenenfalls neu geschaffenen Teilen, wobei die
neu geschaffenen Teile gegebenenfalls im wesentlichen nur
neue Verbindungselement-Objekte (Nachbearbeitung) aufzuweisen
brauchen. Die Verbindung zwischen den Logikregelspeichern und
den linguistischen Speichern mit Vergleichsmustern wird durch
Verbindungen 36 und die Verbindung zwischen Kontrolle und
Optimierer 32 geschaffen. 38 steht für die Eingabe der Logik
regeln und linguistischen Regeln in den Optimierer.
An die Kontrolle 29 schließt sich die Ausgabe 40 über die
Verbindung 45 an. Die Ausgabe 40 ist mit einem Drucker 41
bzw. einer Diskette 42 über Verbindungen 43 und 44 verbunden.
So ist sowohl eine Darstellung des Textes in gedruckter Form
als auch eine Archivierung mit Entstehungsmaterial auf einem
elektronischen Datenträger möglich. Patentanmeldungen können
auch unmittelbar elektronisch dem jeweiligen, z. B. dem
Japanischen oder dem Europäischen, Patentamt übermittelt
werden.
Vorteilhaft, insbesondere bei ungeübten Operatoren oder wenn
das System noch nicht mit umfangreichen Bibliotheken und
Listen ausgestattet werden konnte, ist eine Verbindung 46 der
Ausgabe 40 mit dem Rechnermonitor 6 mit seiner Visualisie
rungsmöglichkeit. So kann in Dialogform mit dem Operator 1
eine eventuell notwendige Neueingabe der Vorgabenlisten etc.
bzw. von Nachbearbeitungseinzelheiten erfolgen. Neben der
Optimierung mit Hilfe des Optimierers 31 kann so auch eine
Optimierung mit Führung durch den Operator 1 erfolgen, die
insbesondere in der Aufbauphase eines derartigen Systems sehr
vorteilhaft ist. In diesem Fall handelt es sich um ein
computerunterstütztes Textgenerierungssystem, während nach
Aufbau der notwendigen Bibliotheken, Listen etc. und der
endgültigen Ausgestaltung des Optimierers 31, z. B. unter
Generierung neuer, besonders geeigneter neuronaler Netzformen
durch kombinatorische Optimierung mit Hilfe genetischer
Algorithmen, auch eine automatische, nach der Starteingabe
ohne Eingreifen des Operators 1 ablaufende, Textgenerierung
möglich ist.
Das in Fig. 1 beschriebene System wird vorteilhaft in einem
Datennetz oder in einem anderen Client-Server-System ver
wirklicht. Es erübrigt sich, spezifische Textbibliotheken
aufzubauen. Es ist wesentlich günstiger, auf bestehende Text
bibliotheken zurückzugreifen und lediglich vorteilhaft aus
bestehenden Texten extrahierte Logikbibliotheken, Verbin
dungsobjektbibliotheken etc. aufzubauen. Auch die Rechenein
richtungen, die verwendet werden - obwohl natürlich die
Zusammenfassung in einem Großrechner möglich ist - werden
vorteilhaft dezentral ausgestaltet. Dabei können übliche
Schaltungsprozeduren übernommen werden, die aus Firmennetzen,
dem WWW etc. oder aus anderen Teilen des Internets bekannt
sind. Insgesamt ergibt sich dadurch eine erhebliche Reduzie
rung des Hardwareaufwandes, wenn auch die Bearbeitungszeit
steigt. Dies kann aber durch Übertragungen mit ATM weites
tgehend vermieden werden.
In diesem Zusammenhang ist weiterhin vorgesehen, daß alle mit
dem System erstellten Texte in einer user eigene Textbiblio
thek eingehen, um als besonders geeignete Vorlagen für weite
re Neu- oder Ergänzungstexte Verwendung zu finden. Mit der
Zeit kann sich so z. B. eine Fach-Produkt- oder firmenspezi
fische Textbibliothek ergeben, aus der ein Großteil der an
fallenden neu zu generierenden Texte ohne größeren Rechen
aufwand und mit einheitlicher Logik entnehmbar ist.
Fig. 2, die dem Kapitel "A FRAMEWORK FOR PDP" (PDP = Parallel
Distributed Processing) des bereits erwähnten Buches von
Rumelhart in The MIT Press, 1986, entnommen ist, zeigt ein
Beispiel für ein rechentechnisch aufbereitetes Beziehungs
muster. Mit derartigen Beziehungsmustern ist ein Ähnlich
keitsvergleich von Logikmustern und Merkmalsmustern möglich.
Fig. 2 illustriert die Zusammenhänge zwischen den Beziehungen
innerhalb des Netzes und der Gewichtungsmatrix. Dieses ein
fache Beispiel gibt das Prinzip derartiger, rechentechnisch
aufbereiteter, Vergleichsmuster wieder. Für die erfindungs
gemäße Ausführung ergibt sich durch Matrixausbildungen eine
Erleichterung bei der Erstellung von Logiknetzen für über
geordnete Logiken, Satz- und Wortbeziehungslogiken. Durch die
Matrixform können sie rechentechnisch einfach aus der jewei
ligen Bibliothek ausgewählt werden. Durch eine hierarchische
Ordnung dieser Vorlagenmuster ist es dabei möglich, die Aus
wahl weiter zu vereinfachen. Zwar ist die Suche in den
Modell- und Merkmalsbibliotheken sowie in den Regelbiblio
theken manchmal zeitaufwendig, hierfür sind jedoch moderne
Computer bestens gerüstet. Zu bedenken ist dabei, daß der
artige Computer ca. um den Faktor 10⁹ schneller als das
menschliche Gehirn arbeiten! Das menschliche Gehirn mit
seiner wesentlich höheren Knotenzahl, (schätzungsweise 10¹³),
nutzt diese nur zu einem sehr geringen Teil für die Bildung
von Logiken aus. Es arbeitet aber mit durchaus vergleichbaren
Teilmodellen und paßt diese ebenfalls den jeweiligen Bedin
gungen an. Die Generierungsgeschwindigkeit von Sätzen ist
daher durchaus vergleichbar. Ein Beispiel ist das jedem ge
läufige Suchen nach einem passenden Satzabschluß, wenn der
angefangene Satz aus mehreren Unterabschnitten besteht oder
unbekannte Begriffe enthält! Auch dies dauert bei einem
Menschen deutlich bemerkbare Sekundenbruchteile. Da manche
Menschen mit einer relativ geringen Such- und Kombinations
geschwindigkeit bei ihren Satzbildungen arbeiten, bleiben
derartige Sätze in der Sprechpraxis häufig unvollendet. Dies
ist zu beobachten, wenn z. B. ein Redner nicht genügend Zeit
zur notwendigen Suche nach einem passenden Abschluß des ange
fangenen Satzes hat.
Logische Beziehungen können mit Einheiten, die mit Schwellen
werten, z. B. der Schwelle 0-1 arbeiten, bearbeitet werden.
Mit derartigen Zweiwerteinheiten kann z. B. ein Netz aufgebaut
werden, mit dem das "ausschließlich/oder" (XOR) Problem ge
löst wird. Ein Beispiel zeigt Fig. 3 in einer ebenfalls dem
vorgenannten Buch von Rumelhart entnehmbaren Ausführung. Der
Schwellenwert ist 1 und die Einheit reagiert, wenn der Input
größer als 0 ist. Die Gewichtungen sind ± 1. Diese Lösung kann
für alle Entscheidungsnetzwerke verwendet werden, z. B. können
so Bool′sche Funktionen bearbeitet werden.
Das Lernen derartiger Netze ist nicht ohne weiteres direkt
möglich, hier wird vorteilhaft die bereits in der Einleitung
erwähnte Form des Feedback mit einer ja/nein Antwort in bezug
auf das Ergebnis verwendet. Ein derartiges Vorgehen erfordert
gegenüber einer Backpropagtion eine erhebliche längere Lern
zeit. Dies wird jedoch durch die einfachen Rechenoperationen,
die zugrundegelegt sind und die dadurch mögliche sehr hohe
Verarbeitungsgeschwindigkeit weitgehend wieder wettgemacht.
Für spezielle Fälle ist auch ein direktes Lernen mit Feedback
möglich, etwa bei Verwendung des bekannten Perceptrons. Hier
ist ein Lernen mit Regeln in Form der "Delta"-Regeln für die
Fehlerkorrektur in linearen Modellen möglich. Hierdurch ist
vorteilhaft eine gewisse Verkürzung der Rechenzeit für Lern
vorgänge, zumindest für einfache Teilmodelle, die durch
Perceptrons ausgedrückt werden können, möglich.
Fig. 4 zeigt eine vereinfachte Darstellung des Prinzips, wie
ein Eingangsmuster, also ein Vorlagenmuster, in ein Ausgangs
muster, also ein Zielmuster, geändert werden kann (Adaption).
Die Änderung geschieht durch ein Beziehungsmuster, das auf
die einzelnen Verbindungen zwischen Eingangsmuster und Aus
gangsmuster zugreift. Es versteht sich, daß das Beziehungs
muster nicht direkt auf die Verbindungen zwischen Eingangs- und
Ausgangsmuster einwirken kann. Hierfür werden Schwellen
muster zur Verarbeitung nicht linearer Eingaben mit ihnen
zugrundeliegenden Wenn-Dann-Verzweigungsmustern notwendig,
wie sie z. B. in dem KBAN-System, das von Siemens Corporate
Research, Princeton, entwickelt worden ist, in trainierbarer
Form beschrieben sind.
In Fig. 5 schließlich, die dem Kapitel "THE PT PERSPECTIVE"
des bereits erwähnten Buches von Rumelhart entnommen ist,
sind zwei Beispiele eines dreilagigen Netzwerkes gezeigt, mit
dem Beziehungen zwischen Begriffen und Regeln hergestellt
werden können. Ein entsprechendes Vorgehen kann z. B. auch für
die Beziehungen zwischen Satzteilen und Begriffen verwendet
werden. Desgleichen für die Beziehungen von ganzen Sätzen und
Satzteilen etc. Die Netzbibliotheken, die gebildet werden,
werden also entsprechende Netze für unterschiedliche Merkmale
und Verbindungsbeziehungen umfassen, aus denen geeignete
Netze ausgesucht und angewendet werden. Ausgesuchte Netze,
deren Eignung nicht bewiesen ist (Muster) werden vorteilhaft
konkurrierend eingesetzt und das am besten passende Netz
verwendet. Es ist dabei vorteilhaft möglich, entsprechende
Netze weiterzuentwickeln, z. B. durch genetische Algorithmen.
Hierbei ist dann das Ziel erreicht, wenn das neu entwickelte
Netz in der Anwendung die Vergleichsmuster von Standardformen
erfüllt. Der Erfüllungsgrad ist gleichzeitig die Gütefunk
tion, die den weiterentwickelten Netzen zugrunde zu legen
ist.
Geeignete Netze für eine Textgenerierung werden einige
Dutzend bis einige Hundert Eingänge aufweisen. Derartige
Netze werden bereits rechentechnisch beherrscht, z. B. bei der
Optimierung von Industrieanlagen. Auch Trainingsroutinen für
derartige Netze stellen kein Problem dar. Das Training er
folgt vorteilhaft parallel zur Generierungsarbeit und wird
sofort ausgenutzt.
Das Beispiel von Fig. 5 bezieht sich auf die Eigenschaften
einer Katze, es ist eindeutig, daß das benutzte Vorgehen ohne
weiteres auch für technische Begriffe mit technischen Eigen
schaftszuordnungen verwendbar ist.
Fig. 6 schließlich zeigt die Funktion des in Fig. 1 vorgese
henen Optimierers 31 für einen Zieltext. Hier handelt es sich
um die Lösung der zunächst im Rahmen der Entwicklung wohl
häufiger, später weniger häufig auftretende Problematik, daß
die Adaption aus den Vorlagenteilen nicht zu einem befriedi
genden Zieltext führt oder das neue Textteile generiert
werden müssen. Hier muß ein entsprechender Generierungsprozeß
durchgeführt werden.
In Fig. 6 bezeichnet 60 das Modell und 61 die Modelladaption,
die während der Optimierung über 59 im Datenaustausch mitein
ander stehen. In das Modell gehen ebenso wie in den Speicher 62
die selektierten Teile aus den Textvorlagen, z. B. Sätze,
Absätze oder Satzteile, durch den Doppelpfeil 63 symboli
siert, ein. Desgleichen die speziellen Zieltextvorgaben, die
Merkmale aus einer Merkmalsliste und die Logikvorgaben, z. B.
aus einer Logikmatrix. Dies wird durch den Doppelpfeil 64
symbolisiert. Aus dem Speicher, bzw. auch direkt, gehen diese
Vorgaben ebenso wie Optimierungsregeln, linguistische Regeln
und Logikregeln, symbolisiert durch den Doppelpfeil 65 in den
Textoptimierer 66 ein. Hier wird der Text entsprechend der
Vorgaben optimiert, wobei neben regelbasiertem Wissen auch
Trial- und Errorroutinen in bezug auf einzelne Verbindungs
objekte und Satzteile angewendet werden können.
Aus dem Textoptimierer 66 gelangt der erstellte Zieltext in
die rechentechnische Endrolle 67, der auch die linguistischen
Regeln und die Logikregeln sowie die Vorgaben über den Inhalt
des Zieltextes aufgegeben werden, wenn die Endkontrolle 67
unbefriedigend ausfällt, wird eine erneute Optimierung durch
geführt, bis das Ergebnis regelgerecht ist. Anschließend an
die Endkontrolle in 67 werden in 68 die erstellten einzelnen
Textteile gesammelt und schließlich einem Monitor, einem
Drucker oder einer Diskette aufgegeben. Damit ist der eigent
liche Erstellungsvorgang beendet. Wahlweise kann noch eine
Endkontrolle z. B. durch den Operator erfolgen. Dies ist in 70
symbolisiert. Diese Endkontrolle kann auch zu einer erneuten
Rückgabe von Texten oder Textteilen zum Textoptimierer 66
führen. Dies ist durch den Schalter 71 symbolisiert. Die
übrigen Verbindungen in Fig. 6 ergeben sich aus den einge
zeichneten Beziehungspfeilen. Auch für die einzelnen Teile im
wiedergegebenen Funktionsprinzip des Optimierers sind der
artige Kontrollschleifen, automatisch funktionierend, vorge
sehen.
Aus Fig. 7 ist das prinzipielle Vorgehen bei der Generierung
von Textteilen, Sätzen, Satzteilen etc. aufgrund von Model
len, d. h. nicht nach vorgegebenen Regeln, zu ersehen. Nach
der Startvorgabe in 72 werden Suchschritte 73 eingeleitet,
die zu einer passenden Eingabe in ein Modell 74 führen. Die
über das Modell 74 erzeugten Teile des Textes werden mit den
Text-Daten in dem jeweiligen Datenspeicher 75 verglichen und
der Fehlerfunktion zugeleitet, die entscheidet, ob über das
Modell ein zutreffender Teiltext erzeugt worden ist. Da
dieser gut oder aber weniger gut sein kann, werden die Anga
ben aus der Fehlerfunktion nach Abschätzung gegebenenfalls
einem Abbruchkriterienteil 76 zugeleitet, der wiederum, falls
Verbesserungen nötig sind, den Teiltext dem Modell 74 erneut
aufgibt, bzw. andere Suchschritte in dem Teil 73 einleitet.
Das Vorgehen, wie es hier prinzipiell beschrieben ist und das
Methoden der Musterkennung und des Mustervergleichs, z. B.
elektronisches "Übereinanderlegen" und Auswertung nach dem
Vorliegen wesentlicher oder tolerierbarer Abweichungskrite
rien benutzt, muß wegen der Häufigkeit der notwendigen
Wiederholungen und der Vielzahl von Einzelvorgängen im Rahmen
von parallelen Rechenvorgängen ablaufen, deren Ergebnisse
ständig miteinander verglichen und auf ihre Tauglichkeit
überprüft werden. Auch diese Überprüfung kann entsprechend
dem vorerwähnten Prinzip erfolgen. Insgesamt ist zur schnel
len Texterstellung massives Parallelrechnen notwendig, das
vorteilhaft auf entsprechend ausgelegter Hardware abläuft.
Für die Benutzung empfiehlt sich ein mit entsprechender Hard- und
Software ausgerüsteten Client-Server-System.
Aus Fig. 8 sind die Hauptbestandteile des Speichers für die
Textgenerierung ersichtlich. Dies sind zum einen in 78 die
linguistischen Regeln, die Logikmodelle und die Adaptions- und
Optimierungsregeln, weiterhin in 79 die Text/Ganz- und
Teilmodelle und die mehrsprachigen Fachausdrücke und Verbin
dungsobjekte. Dabei ist zu berücksichtigen, daß die in 78
gespeicherten linguistischen Regeln, die Textlogikmodelle und
die Optimierungsregeln ebenfalls an die jeweilige Ausgabe
sprache des Zieltextes angepaßt sein müssen. Auch die Adap
tionsregeln, vorzugsweise z. B. als Wenn-Dann-Beziehungen mit
und/oder Komponenten ausgebildet, müssen entsprechend ange
paßt sein. Weiterhin sind in den Hauptbestandteilen des
Speichers die Startwerte 80 für den Optimierer enthalten, die
jeweils den einzelnen Suchschritten und Optimierungsschritten
angepaßt sind. Diese ergeben sich aus dem jeweiligen Textbe
arbeitungszustand. Weiterhin enthalten die Hauptbestandteile
des Speichers den Rechentechnikspeicher 81, z. B. die zu
treffenden Neuro-Netze, Baumstrukturen, Bool′schen Algorith
men etc. Insgesamt ergeben die Fig. 6, 7 und 8 eine Über
sicht über die Rechentechniken der Optimierung und Adaption,
die zum Teil ineinander übergehen.
Die folgenden Figuren beziehen sich auf die spezielle Technik
der Erstellung von Patent- oder Gebrauchsmusteranmeldungen.
Hierfür ist das erfindungsgemäße System besonders gut wirt
schaftlich einsetzbar, da Patent- und Gebrauchsmusteranmeldun
gen weltweit dem gleichen Erstellungsmuster zu folgen haben.
Sie setzen sich einmal aus den Ansprüchen, dem auf die An
sprüche bezogenen Beschreibungsteil, der Erläuterung des
bekannten Standes der Technik, der zu lösenden Aufgabe und
den zu erreichenden Vorteilen zusammen. Dies wird ergänzt
durch Zeichnungsfiguren und die Figurenbeschreibung. Da
dieser Aufbau weltweit gleich ist, können für alle Ziel
sprachen identische Masken erstellt werden. Außerdem wird
durch die Maskenführung eine Unterteilung der Textgenerierung
für Patentanmeldungen und Gebrauchsmuster in kleine, leicht
rechentechnisch handhabbare Einheiten möglich. Die Patent- und
Gebrauchsmustertexte - wie auch im Prinzip durchaus ähn
liche Funktionsbeschreibungen, Produktbeschreibungen, Be
triebshandbücher etc. - sind also besonders geeignet für das
erfindungsgemäße CATD-System. Auch ist hier der finanzielle
Nutzen am größten, da derartige Texte auf der Welt jährlich
in der Größenordnung von mehreren hunderttausend erstellt
werden. Allein das Europäische Patentamt erhält jährlich fast
einhunderttausend Anmeldungen.
Dabei wird überdies noch der besondere Vorteil erreicht, daß
durch die rechentechnische Texterstellung auf Dauer ein
Textstandard erreicht werden kann, der bei manueller Erstel
lung nicht immer gegeben sein wird. Nicht nur die Kosten der
artiger Texterstellungen werden verringert sondern auch eine
gleichmäßige hohe Qualität für alle Patentanmeldungen, Ge
brauchsmusteranmeldungen etc. wird erreicht werden können.
Dabei erhöht sich durch die rechentechnischen, strengen
Logikregeln die Vergleichbarkeit und damit die Prüfbarkeit
der Texte! Die Verwendung des erfindungsgemäßen Systems für
Patent- und Gebrauchsmusteranmeldungen hat dabei den weiteren
Vorteil, daß für derartige Texte bereits viele, fein sor
tierte Muster (IPC), als Trainingsmaterial für ein Vorab-
Training der verwendeten neuronalen Netze zur Verfügung
stehen. Ein nicht zu unterschätzender Vorteil.
In Fig. 9 wird das Schema einer Textgenerierung am Beispiel
einer Patentanmeldung gezeigt. Ausgang ist die Erfindungsmel
dung, ein erweiterter Laborbericht, ein Pflichtenheft o. ä.
Bestandteile sind die zu lösenden Aufgabe, die Zeichnung oder
Schaltung sowie gegebenenfalls eine allgemeine Beschreibung
des Lösungswegs sowie die erreichten Vorteile. Diese Angaben
stammen von den Erfindern oder dem Projekteur bzw. Designer
eines neuen Systems, Geräts etc. Diese Angaben sowie gegebe
nenfalls weitere Angaben sind durch 90 versinnbildlicht.
Die Angaben in 90 werden, vorteilhaft durch eine Verarbeitung
im PC, z. B. in Matrixform oder in Form von Listen mit
multiple-Choice-Angaben nach Wichtigkeit und Aufgabenlogik
geordnet. Hieraus wird dann, zumindest in der Anfangszeit,
ein Hauptanspruch durch den Operator in 91 erarbeitet, sofern
sich nicht eine Fassung eines neuen Hauptanspruches durch
einfaches Hinzufügen o. ä. der Merkmale der neuen Lösung zu
einem bereits bestehenden Hauptanspruch, zu einer bereits
bestehenden Produktbeschreibung, einer Bedienungsanleitung
o. ä. möglich ist. Anschließend an die Generierung des Haupt
anspruchs, wie vorstehend gesagt, entweder durch einen
Operator oder automatisch, werden ebenfalls in 91 die Merk
male auf die Unteransprüche, auf neue Beschreibungsteile etc.
aufgrund der Gliederung der Merkmale in der Matrix oder der
Liste verteilt. Die Auswahl der Hauptaufgabe erfolgt ebenso
wie die Auswahl der Unteraufgaben sowie der erreichbaren
Vorteile, z. B. eine schnellere Arbeitsweise, eine kosten
günstigere Ausführung, ein vielseitiger einsetzbares System
etc. nach den Angaben in der Liste, der Matrix o. ä. Anschlie
ßend oder gleichzeitig erfolgt eine Auswertung der Zeichnung
bzw. der Prinzipskizzen zu der neuen Lösung sowie eine
hieraus extrahierte Lösungslogik. Dieser Arbeitsgang wird
durch 92 symbolisiert. Hierfür kann durch ein entsprechendes
Umsetzungsprogramm das Designprogramm der Zeichnung mit den
aus der Zeichnung entnehmbaren Merkmalsangaben verwendet
werden. Bei Zeichenprogrammen werden ja die einzelnen
Bausteine eines Entwurfs, z. B. in Icons o. ä. dargestellt,
durch Linien miteinander verbunden. Hieraus ist bereits die
Grundstruktur des Logikmodells der Zeichnungsbeschreibung
extrahierbar, bei dem zwischen den bekannten Bestandteilen
und den neuen Bestandteilen unterschieden wird.
Um die entstehenden Modelle nicht zu umfangreich und damit zu
aufwendig zu bearbeiten zu machen, erfolgt hierfür vorteil
haft eine Unterteilung in viele Einzelmodelle mit einfachen
Rückbezügen in kurzen Sätzen, die dann durch ein Gesamt
modell, das aus den Vorgaben in 91 gebildet wird, logisch
verbunden werden. Eine Zusammenführung der unterschiedlichen
Modelle und ihre Adaptionen in 93 erfolgt durch die in den
vorhergehenden Figuren näher beschriebenen rechentechnischen
Modellbearbeitungsstufen. In 94 wird der generierte Text
darauf kontrolliert, ob er den dem Text zugrundeliegenden
bogikmustern und Logikregeln sowie den linguistischen Regeln,
wie sie z. B. aus dem IBM-Programm bekannt sind, entspricht.
Auch hier erfolgt also die bereits ebenfalls in den rechen
technischen Einzelheiten erwähnte Endkontrolle auf rechen
technischer Basis. 95 dient gegebenenfalls der endgültigen
Optimierung mit Prüfung auf die Logik der Rückbezüge und in
96 erfolgt die Endkontrolle des generierten Textes in allen
Teilen.
In Fig. 10 wird eine Texterstellungsmaske für größere Patent- oder
Gebrauchsmusteranmeldungen gezeigt. Die einzelnen Mas
kenteile 100 bis 106 enthalten - für den Patentfachmann so
fort erkennbar - die üblichen Anmeldungsteile. In sich sind
die einzelnen Anmeldungsteile klar strukturierbar. In der
Hierarchie steht die Lehre des Hauptanspruches oben, dazu
folgen die Unteransprüche. Es ist vorteilhaft, mit dem
erfindungsgemäßen CATD-System bei Patent- oder Gebrauchs
mustertexten zu beginnen. Für Gebrauchsmuster ergibt sich der
besondere Vorteil einer gewissen Vorprüfung durch die vor
lagenbedingte Berücksichtigung des Standes der Technik.
Im einzelnen ergibt sich, wie eine Patentanmeldung oder
Gebrauchsmusteranmeldung unter Verwendung der international
üblichen Vorgaben für eine derartige Anmeldung mit Hilfe
einer dieser Vorgaben enthaltenden Maske generiert wird. Im
Teil 100 wird aus der Erfindungsmeldung, dem Laborbericht,
dem Pflichtenheft o. ä. automatisch oder durch eine Vorgabe
des Operators (Bedienervorgabe) oder extrahierten Vorgaben
aus dem ausgewählten Modell(Vorlagen)text der Hauptanspruch,
d. h. die Lösung der Hauptaufgabe generiert. In 101 wird aus
den Vorlagen und den Bedienereingaben unter der Verwendung
von Standardsätzen der Eingangsteil der Beschreibung gene
riert. Die entsprechenden Standardsätze sind bekannt und
werden erfindungsgemäß nicht mehr durch den Bediener diktiert
oder eingegeben, sondern durch Selektion entsprechenden
Listen entnommen.
In 102 schließlich wird auf den Stand der Technik, d. h. auf
den Inhalt der Vorlagen bzw. diesen nahekommenden Unterlagen,
eingegangen, z. B. durch Teilzitat. Dies erfolgt u. U. vorteil
haft unter Verwendung von Abstracts, die z. B. in der inter
nationalen Patentdatenbank Derwent für Patentanmeldungen,
Patente und Gebrauchsmuster oder in der Datenbank Inspec für
Fachaufsätze vorliegen. Dabei wird sowohl auf die Merkmale
als auch auf die zugrundeliegende Logik, mit der diese Merk
male miteinander verknüpft sind, geachtet. Aus dem standar
disierten rechentechnischen Ablauf dieses Teil der Generie
rung der Anmeldung ergibt sich eine wesentlich verbesserte
Prüfbarkeit. Eine weiter verbesserte Prüfbarkeit ergibt sich
aus der Einfachheit der rechentechnisch gebildeten Sätze, die
- zumindest in der Anfangszeit - kurz sein werden und im
wesentlichen einfache Rückbezüge enthalten.
In dem weiteren Teil 103 werden dann die erreichten Vorteile
und ihre Logik generiert, so daß sich insbesondere für den
Prüfer sofort eine Übersicht über den erfinderischen Gehalt
der neuen Lösung ergibt. Auch hierdurch wird die Prüfung
wesentlich erleichtert. Gegebenenfalls kann hierdurch die
Prüfung auch selbst automatisiert werden. Die Neuheit kann ja
durch einen entsprechenden Vergleich mit den Merkmalen der
Vorlagen ermittelt werden und die Erfindungshöhe durch den
Vergleich, ob es sich um äquivalente oder naheliegende Lö
sungen handelt, die z. B. entsprechend einem Synonym-Wörter
buch aus Listen verglichen werden können.
Anschließend erfolgt der Textaufbau in 104 des Beschrei
bungsteils, der sich auf die Unteransprüche bezieht. Hierfür
dient als Grundlage die Merkmalsliste, Vorteilsliste oder
eine graphische (Pfeile)Darstellung der erreichten Vorteile
in den multiple Choice-Angaben. Die Generierung dieses Teils
kann vollständig automatisch, aber auch durch Hilfskräfte
o. ä. erfolgen.
Schließlich folgt die im Teil 105 generierte Figurenliste,
die durch Rückführung der Zeichnungsprogramme oder Angaben zu
den Zeichnungen auffindbaren wesentlichen Merkmale generiert
werden kann. Wesentlich ist dabei, ob die Figuren schema
tische, prinzipielle oder detaillierte Angaben enthalten.
Dies kann einfach aus den Zeichnungen entnommen werden.
Die Figurenbeschreibung in 106 kann, wie bereits ausgeführt,
direkt durch Übernahme und Umsetzung der Angaben aus dem
Zeichnungsprogramm o. ä., aber auch durch eine Hilfskraft
erfolgen. Hierfür werden Standardverbindungsobjekte ver
wendet, wie "ist verbunden mit", oder "weist auf" etc.
Derartige Verbindungsobjekte, die im übrigen auch für die
anderen Beschreibungsteile verwendbar sind, können aus einer,
wie eine Übersicht über die Patentliteratur gezeigt hat,
nicht allzu umfangreichen Liste entnommen werden. Eine norma
le Patentanmeldung enthält, wenn sie auf das wesentliche der
Erfindung beschränkt wird, nur einen relativ geringen Ver
bindungsobjektbereich der jeweiligen Technik. Für den Ma
schinenbau, für die Elektrotechnik, für die Chemie kann daher
mit nur wenigen hundert Verbindungsobjekten gearbeitet wer
den, um für die meisten in der Praxis vorkommenden (ca. 90%
aller Anmeldungen) einen Textzusammenhang herzustellen.
Um eine widerspruchsfreie Gesamtlogik zu erhalten, ist es an
gezeigt, die Anmeldung insgesamt einer Logik-Kontrolle zu
unterziehen. Dies kann z. B. bei einer Patent- oder Gebrauchs
musteranmeldung durch ein die einzelnen Merkmale prüfender
neuronales Netz mit sechs Eingaben entsprechend 100-106 in
die Eingangsebene und sechs Ausgangswerten sowie einer ver
deckten Zwischenschicht geschehen. Für ein derartiges Netz
sind einfache Bool′sche Algorithmen, d. h. Algorithmen mit dem
Inhalt entspricht oder "entspricht nicht (XOR)" gearbeitet
werden. Zwar sind für die Kontrolle des Gesamttextes viele
Rechenoperationen für die jeweiligen Merkmale notwendig,
hierfür stehen jedoch bereits spezielle, mit sehr hoher
Rechengeschwindigkeit arbeitende, Neurocomputer zur Verfü
gung. Ein Arbeiten mit derartigen Computern, z. B. dem
Siemens-Computer Synapse, bringt eine erfindungsgemäße Text
erstellung, die vorteilhaft nach dem Client-Server-Prinzip,
also dezentral erfolgt, auf annehmbare Rechenzeiten.
Für eine Patent- oder Gebrauchsmusteranmeldung ist sogar ein
Netz mit festen Verbindungen, also ein ASIC, verwendbar. Für
andere Texte, z. B. Produktbeschreibungen, Gebrauchsanlei
tungen, für Besprechungsberichte technischer Art o. ä. wird
vorteilhaft ein relativ großes Universalnetz eingesetzt wer
den, von dem nur die jeweils gebrauchten Verbindungen akti
viert sind. Hierbei ist auch eine Optimierung für den jewei
ligen Text möglich, die aufzubauenden neuronalen Netze können
einer Netzbibliothek entnommen werden. Der jeweils passenste
Typ kann, wenn er noch nicht bekannt ist, aufgrund von Trial- and
Errorversuchen ermittelt werden. Ein derartiges Vorgehen
ist aus der Mustererkennung, z. B. bei der Schriftzeichen- oder
Satzerkennung bekannt. Die hierfür bekannten Programme
können übernommen und adaptiert werden.
Zusammenfassend ist für das erfindungsgemäße System festzu
stellen, das es sicherlich für die Erstellung von Patent- und
Gebrauchsmusteranmeldungen, Produktbeschreibungen oder Ge
brauchsanweisungen besonders schnell seine Einsatzreife er
langen wird und hierfür auch die größten Kostenvorteile nach
kurzer Entwicklungszeit erreichbar sind. Von besonderem Vor
teil ist auch der Einsatz für Beschreibung von an vielen
Stellen verteilt durchgeführte Teilentwicklungen, wie es bei
einer Softwareentwicklung häufig der Fall ist. Diese ist
häufig in großen Firmen weltweit verteilt und es bestehen
erhebliche Schwierigkeiten für die einzelnen Entwicklungs
teams miteinander zu kommunizieren. Dadurch, daß das System
geeignet ist, Textvorlagen in den unterschiedlichsten Spra
chen zu verarbeiten - hierfür müssen lediglich die unter
schiedlichen Lexika bereitgestellt sein - eignet es sich
insbesondere für die Koordinierung und Erfassung von Entwick
lungen, die gleichzeitig in Ländern mit unterschiedlichen
Sprachen ablaufen. So kann es zu einer erheblichen Verbesse
rung der unternehmensinternen Kommunikation oder der Kommu
nikation von Entwicklungspartnern, etwa Konsortien, kommen.
Dabei ist von besonderem Vorteil, daß für die einzelnen
Entwickler die Hemmschwelle, die darin besteht, sich in einer
fremden Sprache z. B. in der Muttersprache des Auftraggebers,
ausdrücken zu müssen, wesentlich erniedrigt wird. Der Schwer
punkt wird hierbei sicherlich in der Sprachpaarung deutsch/eng
lisch liegen, aber auch die Sprachpaarungen deutsch/fran
zösisch, französisch/englisch etc. sind von erheblicher
Bedeutung. Für Sprachpaarungen zwischen europäischen und
fernöstlichen Sprachen ist dabei die gute Berücksichtigung
der unterschiedlichen Logiken, mit denen diese Sprachen
arbeiten wichtig.
Es ist dabei vorteilhaft möglich, generierte Texte als Intra
net oder Internet-Angebot zur Verfügung zu stellen. So ist es
auch Tochterunternehmen, kleinen und mittleren Firmen und
auch Einzelpersonen möglich, einfache Texte und damit Bot
schaften auszutauschen. Erleichtert wird dabei das Arbeiten
mit dem erfindungsgemäßen System, wenn eine Spracheingabeform
für den PC gewählt wird. Derartige PC′s stehen bereits zu
Verfügung. Gemeinsam mit den entsprechenden Suchmakros, die
ähnlich wie im Internet, von einem Dokument zum anderen
führen, bis das am besten zutreffende Dokument gefunden
worden ist, ergibt sich eine universelle, einfache Handhabung
des erfindungsgemäßen Systems, die es auch weniger geübten
Bedienern erlaubt, schnell mit dem System arbeiten zu können.
Für die Entwicklung des Systems ist es von besonderem Vor
teil, daß die verwendeten Wenn-Dann-Beziehungen mit
Bool′schen Algorithmen z. B. in der Form A entspricht B, A
entspricht nicht C oder D und so weiter und dies mit beson
derer Gewichtung zwischen den einzelnen Merkmalen oder den
Verbindungsobjekten arbeiten. Ein Beispiel ist in Fig. 10 in
104 gezeigt.
Von Vorteil für die qualitative Evolution des Systems ist es,
daß, wie bereits ausgeführt, sowohl die untersuchten und
ausgewählten Vorlagen als auch die erstellten Texte mit ihren
Logiken in die jeweiligen Vorlagen und Netzbibliotheken ein
gehen. Damit wird die Erstellungsbasis immer breiter und die
Qualität der erstellten Texte automatisch immer besser, ohne
daß hierfür eine weitere Programmierung nötig ist. Diese ist
nur notwendig bei neuen Sachgebieten, etwa zur Erstellung von
Trivialliteratur, Zeitungen aus neuesten Agenturberichten,
etc. oder wenn weitere Sprachen mit noch nicht erfaßten
Sprachlogiken in das System aufgenommen werden.
Auch eine Verbesserung der jeweiligen Texte und Sprachlogiken
durch genetische Algorithmen erfordert keine weitere Pro
grammierarbeit, wenn die genetischen Algorithmen einmal ent
wickelt sind und insbesondere die Gütefunktionen, nach denen
die Entwicklung durch die genetischen Algorithmen geregelt
und gegebenenfalls abgebrochen wird, da die notwendige Güte
erreicht ist festgelegt sind.
Claims (39)
1. COMPUTER-AIDED-TEXT-Design-SYSTEM (CATD) zur Erstellung
eines Ziel-Textes unter Verwendung vorgegebener Merkmale,
dadurch gekennzeichnet, daß mit
Computertechnik aus vorhandenen Textvorlagen durch Logik-,
Merkmals- und gegebenenfalls Strukturvergleiche für die
Erstellung eines gewünschten (Ziel)Textes geeignete, insbe
sondere logikmäßig geeignete, Muster entnommen und aus diesen
sowie zur Ergänzung gegebenenfalls neu erstellten, logikge
rechten Mustern und unter Benutzung der vorgegebenen Merk
male, ein bearbeiteter und vervollständigter (Ziel)Text er
stellt wird.
2. CATD-System nach Anspruch 1, dadurch ge
kennzeichnet, daß die Logik von Texten anhand
von Logikmodellen, die insbesondere nach dem Vorbild von
neuronalen Netzen aufgebaut sind, ermittelt wird.
3. CATD-System nach Anspruch 1 oder 2, dadurch
gekennzeichnet, daß die Erstellung des ge
wünschten (Ziel)Textes mit Hilfe von detaillierten Eingaben
über gewünschte Merkmale, Logiken und gegebenenfalls Struk
turen, auch der verwendeten Sprache, des (Ziel)Textes und
seiner einzelnen Teile erfolgt.
4. CATD-System nach Anspruch 1, 2 oder 3, dadurch
gekennzeichnet, daß die Erstellung des (Ziel)Textes
über Logikmodelle erfolgt, die aufgabenorientiert
strukturiert sind und den Textgrundstrukturen sowie Teil
strukturen entsprechen.
5. CATD-System nach Anspruch 1, 2, 3 oder 4, da
durch gekennzeichnet, daß die Verbin
dung von aus Vorlagen entnommenen Textteilstrukturen durch
das Logikmodell der Textgrundlogik oder gegebenenfalls der
Textgrundstruktur erfolgt.
6. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die verwendeten Logikmodelle die üblichen Formen von
künstlichen neuronalen Netzen (KNN) aufweisen, z. B. die Form
von üblichen Feed-Forward-Netzen mit aufgabengerecht ange
paßten, z. B. (0/1)Netzknoten und Verbindungen mit Verbin
dungsstärken-Differenzierungen, aufweisen.
7. CATD-System nach Anspruch 1 oder 2, dadurch
gekennzeichnet, daß Logikmodelle in Masken
form, d. h. mit vorher festgelegten Bezügen und Verbindungen
verwendet werden, wobei die dafür vorgesehenen Stellen der
Masken mit aufgabengerecht formulierten Texteinzelheiten,
auch unter Verwendung von durch KNN festgelegten Logiken,
aufgefüllt werden.
8. CATD-System nach Anspruch 1 oder 2, dadurch
gekennzeichnet, daß Logikmodelle in
Tabellenform, insbesondere mit Angabe der Verbindungsstärken
zwischen den einzelnen Teilen die in die Tabelle aufgenommen
sind, verwendet werden, auch unter Verwendung von durch KNN
festgelegten Logiken.
9. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß Logikmodelle unterschiedlichen Aufbaus aufgabengerecht
miteinander verknüpft werden, z. B. zum Erstellen einer
Schutzrechts (Patent- oder Gebrauchsmuster) Anmeldung, die
insbesondere eine Maskenform für den grundsätzlichen Aufbau,
ergänzt durch KNN für die Logik der Maskenteile und ihre
Substrukturen, haben.
10. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die Logikmodelle, insbesondere die Logikmodelle in Netz
form, als Wenn/Dann-Modelle mit Verzweigungen in zugelassene
Richtungen, nach den Logikvorgaben geordnet, ausgebildet
sind.
11. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die Beziehungen zwischen den einzelnen Vorlageteilen und
Modellteilen (Strukturteile, Netzteile, Maskenteile oder
Tabelleninhalte) rechentechnisch als und/oder Beziehungen
ausgebildet werden.
12. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die für unterschiedliche Textergänzungen gebildeten oder
aus Vorlagen extrahierten, Logiknetze und/oder Grundstruk
turen in Netzbibliotheken, insbesondere nach den Kriterien
der Vorlagenbibliotheken geordnet, abgelegt und bei der
Erstellung von Zieltexten gesucht und verwendet werden.
13. CATD-System nach Anspruch 12, dadurch ge
kennzeichnet, daß die Netzgrundstrukturen
(Logikstrukturen) hierarchisch gegliedert gespeichert, ge
sucht und verwendet werden.
14. CATD-System nach Anspruch 12 oder 13, dadurch
gekennzeichnet, daß es aufgabenangepaßte,
vorgegebene Gesamtlogikmuster aufweist, die insbesondere die
Logikstrukturen, insbesondere die Logikgrundstrukturen, in
Netzform des jeweiligen Textes und Textteils wiedergeben.
15. CATD-System nach Anspruch 12, 13 oder 14, da
durch gekennzeichnet, daß es Logik
teilmuster von aufgabenspezifisch getrennten Textteilen,
abgestuft von Kapiteln und Abschnitten des Textes bis zu
einzelnen Satzteilen, aufweist.
16. CATD-System, insbesondere nach einem oder mehreren der
vorhergehenden Ansprüche, dadurch gekenn
zeichnet, daß das Textdesign (Textgenerierung) in
den gebildeten Strukturen, insbesondere Netzen, mit Wort
stammformen, z. B. der Merkmale erfolgt, deren Beziehung
zueinander anschließend durch Wortverbindungen, insbesondere
in Form von Verbindungsobjekten, hergestellt wird.
17. CATD-System nach Anspruch 16, dadurch ge
kennzeichnet, daß die Beziehungen der einge
gebenen Wortstammformen (z. B. der Substantive, der Verben
etc.) zueinander in den Netzstrukturen oder anderen Vorgabe
strukturen algorithmisch ausgedrückt werden.
18. CATD-System nach Anspruch 16 oder 17, dadurch
gekennzeichnet, daß die Netzstrukturen oder
anderen Vorgabestrukturen mit den Wortstammformen durch aus
Listen ausgesuchten linguistischen Objekten objektstruk
turiert komplettiert werden.
19. CATD-System nach Anspruch 16 oder 17, dadurch
gekennzeichnet, daß die gebildeten Sätze,
Absätze etc. mit, z. B. nach linguistischen Regeln, aufge
stellten Satz- bzw. Absatzmasken verglichen und nur die
diesen zugelassenen Masken (Patterns) entsprechenden Ergeb
nisse als endgültige Ergebnisse zugelassen werden.
20. CATD-System nach Anspruch 19, dadurch ge
kennzeichnet, daß die Logik und der Aufbau der
zugelassenen Ergebnisse (zulässige Ergebnismuster) durch die
Logik der Vorlagen bzw. Modelltexte computertechnisch fest
gelegt wird, wobei im Rahmen einer Endkontrolle eine Ergeb
niskontrolle erfolgen kann.
21. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß Vorlagen gegebenenfalls ergänzende Grundstrukturen, ins
besondere Netze, komponentenorientiert aufgebaut werden und
durch einen Orientierungsvergleich der Textkomponenten mit
Vorlagen (insbesondere in Form von Musternetzen), z. B. aus
einer Musternetzbibliothek, überprüft und gegebenenfalls
korrigiert werden.
22. CATD-System nach Anspruch 21, dadurch ge
kennzeichnet, daß ergänzende Grundstrukturen,
insbesondere Netze, über linguistische Regeln objektorien
tiert aufgebaut werden, wobei Vergleichslisten, etwa in
Matrixform für Beziehungsstärken und die entsprechende Ver
bindungsobjekte verwendet werden.
23. CATD-System, insbesondere nach einem oder mehreren der
vorhergehenden Ansprüche, dadurch gekenn
zeichnet, daß die Vorlagenauswahl ganz oder teil
weise automatisiert aus Abstract- oder Volltextdatenbanken
erfolgt, z. B. aus der Library of Congress, aus Patentamts
textsammlungen, aus der Acstractdatenbank Derwent oder der
Abstractdatenbank Inspec etc. vorgenommen wird.
24. CATD-System nach Anspruch 21, 22 oder 23, dadurch
gekennzeichnet, daß die Vorlagenauswahl an
hand von in der Logik-Grundstruktur besonders wichtigen Kom
ponenten nach und/oder Beziehungen anhand aufgabenspezifi
scher Suchkriterien erfolgt.
25. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die Vorlagenauswahl nach den Beziehungsstärken zwischen
den Komponenten in Textgrundmustern erfolgt, die vorteilhaft
parallel zu der Suche nach Merkmalen und/oder ihren
Kombinationen durchgeführt wird.
26. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß die Suche nach Vorlagetexten in vorhandenen Netzen, ins
besondere im Internet, z. B. im WWW (World Wide Web) erfolgt,
etwa unter Benutzung von vorhandenen Verweis- und Suchstruk
turen des Internets.
27. CATD-System, insbesondere nach einem oder mehreren der
vorhergehenden Ansprüche, dadurch gekenn
zeichnet, daß die Vorlagensuche durch Makrobefehle,
insbesondere unter Windows ablauffähig, nach Zielvorgaben
unter Menüführung erfolgt.
28. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß es als Übersetzungseinheit, insbesondere auf einer für
"Parallel Distributed Processing" besonders geeigneten Hard
wareplattform im Internet oder in Sondernetzen (Intranets)
ausgebildet ist, wobei der zu übersetzende Text vorab näher
definiert wird.
29. CATD-System nach Anspruch 28, dadurch ge
kennzeichnet, daß es für Übersetzungen unter
Beachtung der jeweils zutreffenden linguistischen Regeln
unter Verwendung von entsprechenden Verbindungsobjekten
zwischen den Wortgrundformen, z. B. in den europäischen
Hauptsprachen und den fernöstlichen Hauptsprachen, ausgebil
det ist.
30. CATD-System, insbesondere nach einem oder mehreren der
vorhergehenden Ansprüche, dadurch gekenn
zeichnet, daß es für die Texte oder die Textteile,
für die keine ausreichend gute Vorlage existiert oder auf
findbar ist, neue Grundstrukturen und Detailstrukturen durch
separate Vorgaben erhält, wobei diese z. B. durch "multiple
choice Listen" mit graphischen Verbindungen der Listenkom
ponenten vorgegeben werden.
31. CATD-System nach Anspruch 30, dadurch ge
kennzeichnet, daß die Grundstrukturen der neuen
Texte vorwiegend direkt übernommen und die Detailstrukturen,
vorzugsweise in Netzform, durch Regeln zur Selbstoptimierung
neuronaler Netze selbst optimiert werden.
32. CATD-System nach Anspruch 31, dadurch ge
kennzeichnet, daß die Selbstoptimierung mit
einem Ja/Nein-Feed-back in bezug auf Übereinstimmung mit
vorgegebenen Mustern (Patterns), die z. B. nach linguistischen
Regeln erstellt oder aus Vorlagen entnommen sind, erfolgt.
33. CATD-System nach Anspruch 31 oder 32, dadurch
gekennzeichnet, daß die Optimierung Off-line
ablaufend, auch durch genetische Algorithmen, erfolgt.
34. CATD-System nach Anspruch 31, 32 oder 33, dadurch
gekennzeichnet, daß die Optimierung bis zum
Erreichen einer vorgegebenen Gütefunktion durchgeführt wird,
insbesondere bis zu einer tolerierbaren, insbesondere durch
Muster-(Pattern) Vergleich ermittelten Fehlerzahl je Text,
durchgeführt wird, wobei die Fehlerzahl insbesondere als
ja/nein Feedback dient.
35. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß es zur Erstellung von Patent- oder Gebrauchsmustertexten
verwendet wird.
36. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß es zur Erstellung technischer Texte, wie Gebrauchsanlei
tungen, Produktbeschreibungen, Entwicklungsstandsberichten,
Laborberichten etc. verwendet wird.
37. CATD-System nach einem oder mehreren der Ansprüche 1 bis
34, dadurch gekennzeichnet, daß es
zur Erstellung von Zeitungs- oder Zeitschriftentexten, insbe
sondere auf der Grundlage von Agenturmeldungen o. ä., aber
auch zur Erstellung von Vertragstexten und anderen juristi
schen Texten, verwendet wird.
38. CATD-System nach einem oder mehreren der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
daß es als Internet-Komponente oder als Komponente in
Corporate-Netzworks (Intranets) zur multilingualen Übermitt
lung von Texten, auch mit Sprachein- und -ausgabe, verwendet
wird.
39. CATD-System zur Erstellung von schriftlich oder sprach
lich ausgegebenen Texten, gekennzeichnet
durch die Verwendung von "Parallel Distributed Processing"
auf der Basis künstlicher neuronaler Netze (KNN) unter Ver
wendung bekannter oder selbstgelernter Netzformen zur Logik
einhaltung, ausgehend von ausgewählten Textvorlagen und der
ihnen zugrundeliegenden Logik.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19626142A DE19626142A1 (de) | 1996-07-01 | 1996-07-01 | Computer-Aided-Text-Design-System |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19626142A DE19626142A1 (de) | 1996-07-01 | 1996-07-01 | Computer-Aided-Text-Design-System |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19626142A1 true DE19626142A1 (de) | 1998-01-08 |
Family
ID=7798401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19626142A Withdrawn DE19626142A1 (de) | 1996-07-01 | 1996-07-01 | Computer-Aided-Text-Design-System |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19626142A1 (de) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002086757A1 (en) * | 2001-04-20 | 2002-10-31 | Voxi Ab | Conversion between data representation formats |
US6556973B1 (en) | 2000-04-19 | 2003-04-29 | Voxi Ab | Conversion between data representation formats |
FR2855632A1 (fr) * | 2003-06-02 | 2004-12-03 | Claude Tumorticchi | Dispositif universel de redaction automatique hyperclic |
EP3744068B1 (de) | 2019-01-17 | 2021-08-11 | IT-Seal GmbH | Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments |
CN117709907A (zh) * | 2024-02-05 | 2024-03-15 | 北京睿企信息科技有限公司 | 一种指引服务的指令发送*** |
-
1996
- 1996-07-01 DE DE19626142A patent/DE19626142A1/de not_active Withdrawn
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6556973B1 (en) | 2000-04-19 | 2003-04-29 | Voxi Ab | Conversion between data representation formats |
WO2002086757A1 (en) * | 2001-04-20 | 2002-10-31 | Voxi Ab | Conversion between data representation formats |
FR2855632A1 (fr) * | 2003-06-02 | 2004-12-03 | Claude Tumorticchi | Dispositif universel de redaction automatique hyperclic |
EP3744068B1 (de) | 2019-01-17 | 2021-08-11 | IT-Seal GmbH | Verfahren zur automatisierten erstellung eines an eine vorgegebene person gerichteten phishing-dokuments |
US12003536B2 (en) | 2019-01-17 | 2024-06-04 | IT-Seal GmbH | Method for the automated creation of a phishing document addressed to a predefined person |
CN117709907A (zh) * | 2024-02-05 | 2024-03-15 | 北京睿企信息科技有限公司 | 一种指引服务的指令发送*** |
CN117709907B (zh) * | 2024-02-05 | 2024-04-26 | 北京睿企信息科技有限公司 | 一种指引服务的指令发送*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69022842T2 (de) | Verwendung von Befehlsähnlichkeiten in einem intelligenten Hilfssystem. | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
DE602004003513T2 (de) | Vorrichtung zum Ordnen bei der Satzgenerierung für ein System zur Generierung natürlicher Sprache, basierend auf linguistisch informierten statistischen Modellen der Bestandteil-Struktur | |
DE112017006151T5 (de) | Anpassbare Verarbeitungskomponenten | |
DE69532307T2 (de) | Ausdrucks-Propagierung für hierarchisches Netzlisten | |
WO2000063788A2 (de) | Situationsabhängig operierendes semantisches netz n-ter ordnung | |
DE10149693A1 (de) | Objekte in einem Computersystem | |
EP2425331A1 (de) | Verfahren zur erzeugung mindestens einer anwendungsbeschreibung | |
DE102020206135A1 (de) | Vorrichtung und Verfahren zum Bestimmen wenigstens eines Teils eines Knowledge Graphs | |
DE19626142A1 (de) | Computer-Aided-Text-Design-System | |
WO2022037818A1 (de) | Vorrichtung und verfahren zur interaktion mit einer graphischen benutzeroberfläche und zum testen einer applikation | |
WO2021104608A1 (de) | Verfahren zum erzeugen eines engineering-vorschlags für eine vorrichtung oder anlage | |
EP3709188A1 (de) | Rechnerarchitektur für eine schnittstelle zur aggregation von datenobjekten in einem verteilten system | |
WO2004003798A2 (de) | Informationserzeugungssystem für die produktentstehung | |
EP3907574A1 (de) | Verfahren zur generierung von einer erklärung zu einer vorgenommenen entscheidung eines fertigungssteuerungssystems | |
DE102018222156A1 (de) | Verfahren, Anordnung und Verwendung zum Erzeugen einer Antwortausgabe in Reaktion auf eine Spracheingabeinformation | |
DE102016125162B4 (de) | Verfahren und Vorrichtung zum maschinellen Verarbeiten von Texten | |
DE19831651C1 (de) | Verfahren zum Erzeugen eines regel- und anpassbaren Netzwerkes von Modellen von Verhaltensmustern einschließlich Software-Systemen | |
EP1959430A2 (de) | Verfahren zur automatischen Generierung von VoiceXML-sprachapplicationen aus Sprachdialogmodellen | |
DE19828528A1 (de) | Expertensystem | |
DE3627204C2 (de) | Digitales Computersystem mit einem Expertensystem | |
WO2022043455A1 (de) | Verfahren und ein system zum erstellen einer industriellen lösung mit einer künstlichen intelligenz | |
DE19635351C2 (de) | Verfahren zur Formatkonvertierung | |
DE102022110355A1 (de) | Verfahren und Vorrichtung zur maschinellen Unterstützung eines Konstrukteurs | |
DE102021208368A1 (de) | Computerimplementiertes Verfahren zur Entwicklung eines Produkts in einem vernetzten System und Anwendersystem zur computergestützten Entwicklung eines Produkts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8122 | Nonbinding interest in granting licences declared | ||
8127 | New person/name/address of the applicant |
Owner name: SCHULZE HORN, HANNES, DR.-ING., 45966 GLADBECK, DE |
|
8139 | Disposal/non-payment of the annual fee |