DE69130883T2 - Informationsverarbeitungssystem und Verfahren für die Verarbeitung von Dokumenten mit strukturierten Schlüsselwörtern - Google Patents

Informationsverarbeitungssystem und Verfahren für die Verarbeitung von Dokumenten mit strukturierten Schlüsselwörtern

Info

Publication number
DE69130883T2
DE69130883T2 DE69130883T DE69130883T DE69130883T2 DE 69130883 T2 DE69130883 T2 DE 69130883T2 DE 69130883 T DE69130883 T DE 69130883T DE 69130883 T DE69130883 T DE 69130883T DE 69130883 T2 DE69130883 T2 DE 69130883T2
Authority
DE
Germany
Prior art keywords
document
keyword
data
information
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69130883T
Other languages
English (en)
Other versions
DE69130883D1 (de
Inventor
Masahiro Abe
Takehisa Hayashi
Tsuneya Kurihara
Kouki Noguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of DE69130883D1 publication Critical patent/DE69130883D1/de
Application granted granted Critical
Publication of DE69130883T2 publication Critical patent/DE69130883T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

    HINTERGRUND DER ERFINDUNG
  • Die Erfindung betrifft ein Informationsverarbeitungsverfahren und ein System zum automatischen Sammeln gewünschter Information aus einer großen Informationsmenge.
  • Als Informationsverarbeitungssystem zum Erfassen von Information ist bisher ein Informationssuchsystem bekannt, das so ausgebildet ist, dass es auf eine Datenbank oder Wissensbank zugreift, in der Information zuvor gespeichert oder angesammelt wurde, wie es in JP-A-60-140 443 beschrieben ist.
  • Ferner sind als Verfahren zum Suchen von Information die folgenden bekannt: ein Verfahren, bei dem der Benutzer zu suchende Einzelinformationen entsprechend Einzelinformation in einer Tabelle, die Teil einer Datenbank bildet, auf Grundlage von Information betreffend die bei der Datenbank verwendete Datenspeicherungsstruktur benennt, und ein Verfahren zum Vereinfachen des Benennens der zu suchenden Einzelinformationen dadurch, dass man sich auf eine assoziative Suche und eine Synonymverarbeitung stützt. Außerdem wurden bereits ein Verfahren vorgeschlagen, gemäß dem mit Schlüsselwörtern versehene Dokumente als solche gespeichert werden, um die Entnahme von Dokumentenbestandteilen zu ermöglichen, für die Übereinstimmung mit den Schlüsselwörtern gefunden wird, sowie ein Verfahren, gemäß dem ein gespeichertes Dokument dann aufgefunden wird, wenn die für die Suche verfügbaren Schlüsselwörter mit Synonymen übereinstimmen, wie sie für den Gesamttext des Dokuments erfasst wurden.
  • Das erstgenannte bekannte Verfahren ist jedoch dahingehend von Nachteil, dass andere Information als die vorbestimmten Tabellen-Einzelinformationen wegen der Tabellenstruktur der Datenbank nicht verarbeitet werden können. Wenn die Anzahl von Tabellen-Einzelinformationen bei der Bemühung erhöht wird, das obige Problem zu meistern, wird die Struktur der Datenbank kompliziert, was Schwierigkeiten bei der Wartung und Verwaltung derselben zur Folge hat.
  • Im Fall der Dokumentensuchverfahren, bei denen Schlüsselwörter zur Suche verwendet werden, kann die vom Benutzer gewünschte erforderliche Information nur dann erhalten werden, wenn der Benutzer, der den entnommenen Dokumententeil gelesen hat, dessen Inhalt lesen kann. Infolge dessen nimmt die Belastung des Benutzers wesentlich zu, wenn Information zu einer speziellen Einzelinformation oder einem Gegenstand aus vielen Dokumenten zu sammeln ist, was zu einem Problem führt.
  • Ein Dokumentenverarbeitungssystem, von dem der Oberbegriff des Anspruchs 1 ausgeht, ist in EP-A-32 194 offenbart. Wenn in dieses System ein neues Dokument eingegeben wird, durchsucht das System dasselbe nach Schlüsselwörtern und fügt diese zusammen mit das Dokument identifizierenden Daten und dem Ort des Schlüsselworts in diesem zu einer Liste hinzu. Um ein so verarbeitetes bestimmtes Dokument zu finden, gibt ein Benutzer relevante Schlüsselwörter ein und das System vergleicht diese mit den Schlüsselwörtern in der Liste, um diejenigen Dokumente, in denen diese Schlüsselwörter auftreten, als Kandidatendokumente an den Benutzer zu liefern. Der Erfolg der Suche hängt davon ab, ob die vom Benutzer eingegebenen Schlüsselwörter genau mit den zuvor in der Liste gespeicherten Schlüsselwörtern übereinstimmen.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Es ist eine Aufgabe der Erfindung, ein System und ein Verfahren zur Dokumentenverarbeitung zu schaffen, die gewünschte Daten aus einer großen Informationsmenge in gespeicherten Dokumenten liefern können.
  • Diese Aufgabe ist durch das System gemäß Anspruch 1 und das Verfahren gemäß Anspruch 8 gelöst. Die Unteransprüche sind auf bevorzugte Ausführungsformen der Erfindung gerichtet. Eine Ausführungsform der Erfindung ist ein Informationsverarbeitungssystem, das gegen die Mängel des bekannten Verfahrens wie Schwierigkeiten bei der Wartung und Verwaltung, starke Belastung des Benutzers usw. im wesentlichen unempfindlich ist und automatisch Information aus den Dokumenten sammeln kann.
  • Eine weitere Ausführungsform der Erfindung besteht in einem Datenbank-Suchverfahren und einem Datenbank-Suchsystem, die automatisch diejenigen Daten sammeln können, die der Anfrage des Benutzers genügen, und zwar dadurch, dass sie die Entnahme des Inhalts eines Dokuments mit einer Bedeutung ermöglichen, die durch die spezifizierten Schlüsselwörter umfasst ist.
  • Angesichts der obigen und anderer Aufgaben, wie sie im Verlauf der Beschreibung ersichtlich werden, ist gemäß einer Ausführungsform der Erfindung ein Informationsverarbeitungssystem geschaffen, das eine Kombination aus einem Sende- und einem Empfangssystem umfasst, wobei das Sendesystem ein Wörterbuch mit strukturierten Schlüsselwörtern, nämlich Schlüsselwörtern mit Beziehungen zwischen denselben, die systematisch strukturiert sind, eine Einheit zum Hinzufügen von Verbindungsinformation zu Bestandteilen eines eingegebenen Dokuments, die jeweilige Beziehungen zu den aus dem Wörterbuch für strukturierte Schlüsselwörter ausgewählten Schlüsselwörtern beinhalten, und eine Einheit zum Ausgeben von die strukturierten Schlüsselwörter, die Verbindungsinformation und die mit der Verbindungsinformation versehenen Dokumentendaten enthaltende Suchinformation aufweist, während das Empfangssystem eine auf den Empfang der Suchinformation vom Sendesystem ansprechende Sucheinheit zum Suchen der Dokumentendaten unter Verwendung der Verbindungsinformation und der strukturierten Schlüsselwörter aufweist.
  • Das oben genannte strukturierte Schlüsselwort kann so auf Grundlage einer Wissensdomäne realisiert werden, dass es mindestens eine der folgenden Verbindungen aufweist: eine Verbindung zu einem Schlüsselwort, das ein übergeordnetes Konzept repräsentiert; eine Verbindung zu einem Schlüsselwort, das ein untergeordnetes Schlüsselwort repräsentiert; und eine Verbindung zu einem ein Synonym repräsentierenden Schlüsselwort, wie es in den Fig. 2 und 3 der beigefügten Zeichnungen veranschaulicht ist.
  • Die Entsprechung zwischen dem aus den strukturierten Schlüsselwörtern ausgewählten Schlüsselwort und dem entsprechenden Bestandteil des Dokuments sollte angesichts der Struktur der strukturierten Schlüsselwörter in solcher Weise erstellt werden, dass ein betrachtetes Schlüsselwort, das das übergeordnete Konzept des semantischen Inhalts eines Bestandteils des Dokuments repräsentiert, mit diesem Dokumententeil verbunden wird, das demgemäß das untergeordnete Konzept des betrachteten Schlüsselworts repräsentiert, wie dies später unter Bezugnahme auf Fig. 5 erhellt wird.
  • Ferner kann die Sucheinheit zum Suchen von Dokumentendaten unter Zuhilfenahme der Suchinformation und der strukturierten Schlüsselwörter aus einem Funktionsteil zum Benennen ei nes zur Suche erforderlichen Schlüsselworts durch Befragen des Wörterbuchs mit strukturierten Schlüsselwörtern, einem Speicher zum Speichern der strukturierten Schlüsselwörter, einer Sucheinheit zum Suchen von Dokumentendaten unter Verwendung der im Speicher gespeicherten strukturierten Schlüsselwörter und der Suchinformation sowie einem zweiten Speicher zum Speichern des Suchergebnisses bestehen.
  • In diesem Zusammenhang kann der zweite Speicher zum Speichern des Suchergebnisses vorzugsweise mit einer Funktion zum Editieren der sich aus der Suche ergebenen Daten entsprechend einer benannten oder eingegebenen Formatierung und zum Einspeichern des Editierergebnisses versehen sein, so dass automatisches Editieren der gefundenen Dokumentendaten ausgeführt werden kann.
  • Zum Suchen von Dokumentendaten mittels der Suchinformation und des zur Suche benannten und gespeicherten strukturierten Schlüsselworts sollte derjenige Bestandteil des Dokuments, der das untergeordnete Konzept zu diesem Schlüsselwort repräsentiert, unter Verwendung der Verbindungsinformation vorzugsweise entnommen werden.
  • Die Suchinformation (d. h. die Information zur Suche) kann vorzugsweise zusätzlich mindestens zum strukturierten Schlüsselwort die Verbindungsinformation zum Anzeigen einer Entsprechung zwischen dem strukturierten Schlüsselwort und einem entsprechenden Bestandteil des Dokuments und mit der Verbindungsinformation versehene Dokumentendaten, wie oben beschrieben, und mindestens eine der folgenden Informationen umfassen: Information, die sich aus dem Kopieren oder Entnehmen dem strukturierten Schlüsselwort entsprechenden Bestandteils des Dokuments ergibt; Verbindungsinformation zum Spezifizieren des Orts eines Dokumententeils, die die Position oder den Ort dieses Bestandteils im Dokument anzeigt, oder Identifizierinformation zum Identifizieren eines ursprünglichen Dokuments, zu dem der Dokumententeil gehört. In diesem Fall kann der Editiervorgang entsprechend vereinfacht werden, während die Klarstellung und die Korrektur der Dokumentendaten gemäß einem anderen Vorteil erleichtert sind.
  • Außerdem kann die vom Sendesystem an das Empfangssystem gelieferte Suchinformation über ein Kommunikationsnetzwerk übertragen werden, wie es in Fig. 1 veranschaulicht ist.
  • Alternativ kann die als Eingangs/Ausgangs-Information zu übertragende Suchinformation zumindest Information enthalten, die in ein Informationsträgermedium eingeschrieben und aus diesem gelesen werden kann, wie im Fall der in Fig. 9 dargestellten Ausführungsform der Erfindung.
  • Gemäß einer anderen Ausführungsform der Erfindung ist ferner, zum Lösen der oben angegebenen Aufgabe, ein Informationsverarbeitungsverfahren geschaffen, bei dem ein Prozess zum Errichten von Entsprechung zwischen den strukturierten Schlüsselwörtern und entsprechenden Dokumentendaten folgendes umfasst: eine Eingabeprozedur, die es einem Benutzer ermöglicht, ein einen betrachteten Gegenstand eines Dokuments repräsentierendes Schlüsselwort einzugeben; eine Prozedur zum Entnehmen eines Schlüsselworts durch eine Verarbeitung, gemäß der Übereinstimmung von in einem Wörterbuch mit strukturierten Schlüsselwörtern enthaltenen Schlüsselwörtern mit den Dokumentendaten hergestellt wird; eine Verbindungserzeugungsprozedur zum Erzeugen einer Verbindung zu einem Kandidaten für Bestandteile (Beschreibung) im Dokument, der dem Schlüsselwort entspricht, was durch Syntaxanalyse (lexikalische Analyse) der Dokumentdaten erfolgt; und eine Prozedur, die es dem Benutzer ermöglicht, die Gültigkeit der erzeugten Verbindung zu bestätigen oder die Verbindung zu korrigieren, wie dies nachfolgend im einzelnen unter Bezugnahme auf Fig. 4 beschrieben wird.
  • Gemäß einer anderen Ausführungsform der Erfindung ist ein Informationsverarbeitungsverfahren geschaffen, bei dem ein Prozess zum Sammeln von Dokumentendaten mittels Suche zum Editieren eine Formatierungs-Benennungsprozedur, eine Prozedur zum Benennen von zu suchenden Einzelinformationen, Suchbedingungen und strukturierten Schlüsselwörtern sowie eine Datensammelprozedur umfasst, wobei
  • - die Formatierungs-Benennungsprozedur eine Prozedur zum Eingeben eines Editierformats sowie zu suchender Einzelinformationen und eine Prozedur zum Benennen von Feldern für die Bedingungen und die zu suchenden Einzelinformationen umfasst;
  • - die Prozedur zum Benennen der zu suchenden Einzelinformationen, der Suchbedingung und der strukturierten Schlüsselwörter eine Prozedur zum Benennen der in das Suchbedingungs- Benennungsfeld des Editierformats einzugebenden Suchbedingung und eine Prozedur zum Benennen der in das Sucheinzelinformation-Benennungsfeld des Editierformats einzugebenden Sucheinzelinformationen umfasst; und
  • - die Datensammelprozedur folgendes umfasst: eine Suchprozedur zum Ausführen, auf die Eingabe der Suchinformation hin, einer Verarbeitung zum Herstellen von Übereinstimmung zwischen dem strukturierten Schlüsselwort der Suchinformation und demjenigen der Suchbedingung, und eine Dateneditierprozedur zum Editieren der Dokumentendaten entsprechend dem Editierformat, wobei die Dateneditierprozedur folgendes umfasst: eine Verarbeitungsprozedur zum Herstellen von Übereinstimmung zwischen dem strukturierten Schlüsselwort für die Sucheinzelinformation und demjenigen der Suchinformation; eine Dokumententeil-Entnahmeprozedur zum Entnehmen eines dem Schlüsselwort entsprechenden Bestandteils eines Dokuments unter Verwendung von in der Suchinformation enthaltener Dokument-Schlüsselwort-Verbindungsinformation (d. h. Verbindungsinformation zum Verbinden eines Dokumententeils und eines Schlüsselworts), und eine Speicherprozedur zum Speichern des dem Schlüsselwort entsprechenden Dokumententeils im Sucheinzelinformation-Benennungsfeld entsprechend dem Editierformat.
  • Die zur Suche von Information gemäß der Erfindung verwendeten Schlüsselwörter werden mit dem Wörterbuch für strukturierte Schlüsselwörter in Einklang gebracht, wobei die Beziehungen zwischen oder unter den Schlüsselwörtern auf Wissensdomänenbasis (d. h. für jede Wissensdomäne) systematisch strukturiert sind, wobei in der jeweils relevanten Wissensdomäne diejenigen Schlüsselwörter verwendet werden, die mit standartisierten Semantikbeziehungen wie Beziehungen hinsichtlich über- und untergeordneter Konzepte miteinander verbunden sind. Demgemäß treten bei Individuen kaum Unterschiede hinsichtlich des Verstehens der Schlüsselwörter auf, da die Semantikbeziehungen zwischen den Schlüsselwörtern leicht eindeutig zu verstehen sind.
  • In Verbindung mit dem Errichten von Entsprechungen zwischen den Bestandteilen eines Dokuments und einem strukturierten Schlüsselwort ist zu beachten, dass diejenigen Bestandteile eines Dokuments, die semantisch zum selben Schlüsselwort gehören sollten, verschiedene Ausdrucksformen annehmen können. Gemäß der Erfindung wird angegeben, dass unter Umständen vorab zwischen den aus dem Wörterbuch für strukturierte Schlüsselwörter ausgewählten Schlüsselwörtern und den Bestandteilen des Dokuments unter Verwendung der Verbindungsinformation Entsprechungen hergestellt werden. Demgemäß kann der Benutzer gemäß der Erfindung von der Mühe des Handhabens unnötig großer Datenmengen zur Suche befreit werden. Ferner können Schwierigkeiten bei der Wartung und Verwaltung dadurch deutlich gelindert werden, dass Entsprechungen zwischen den Schlüsselwörtern und den Bestandteilen der Doku mente hergestellt werden und auch das Wörterbuch mit standardisiert strukturierten Schlüsselwörtern als Basis verwendet wird.
  • Wie es aus dem Vorstehenden erkennbar ist, können, da Verbindungsinformation zum Errichten von Entsprechungen zwischen Schlüsselwörtern und den Bestandteilen Eines Dokuments, die semantisch den obigen Schlüsselwörtern entsprechen, zu den Bestandteilen eines Dokuments hinzugefügt werden, die Bestandteile des Dokuments, wie Wörter, Sätze/Klauseln sowie Sätze, die semantisch den Schlüsselwörtern entsprechen, wie sie vom Benutzer für die Einzelinformation benannt wurden, für die er Information zu erlangen wünscht, leicht entnommen werden.
  • Außerdem kann automatisches Sammeln von Daten dadurch realisiert werden, dass im Informationsverarbeitungssystem intern die vom Benutzer für die Einzelinformation, für die Information zu erlangen ist, spezifizierten Schlüsselwörter gespeichert werden, diejenigen Bestandteile eines Dokuments, die semantisch den spezifizierten Schlüsselwörtern entsprechen, aus denjenigen Dokumenten entnommen werden, die über ein Informationsnetzwerk oder verschiedene andere Medien zugeführt werden und die entnommenen Dokumentbestandteile gespeichert werden.
  • Durch Benennen des Editierformats zum Editieren der gesammelten Daten können die vom Benutzer gewünschten Daten progressiv und zunehmend gespeichert und angesammelt werden. Beispielsweise kann als Editierformat ein Tabellenrahmen bereitgestellt werden, wobei die Schlüsselwörter an den Einzelinformationen in der Tabelle entsprechenden Orten benannt werden können. Wenn dem erfindungsgemäßen Informationsverarbeitungssystem frische Dokumentendaten zugeführt werden, können diejenigen Dokumentbestandteile, die semantisch den oben genannten einzelnen Schlüsselwörtern entsprechen, unter Verwendung der Verbindungsinformation entnommen werden und dann in entsprechenden Spalten in die Tabelle eingeschrieben werden. Durch Wiederholen dieser Prozedur kann die Tabelle selbständig und zunehmend erweitert werden.
  • Schließlich kann der Benutzer dadurch, dass er zu den entnommenen Dokumentbestandteilen die Verbindungsinformation hinzufügt, die die Orte in einem Dokument angibt, von denen die Bestandteile entnommen wurden, oder er die Identifikationsnummer des Dokuments hinzufügt, zu dem die entnommenen Dokumentbestandteile gehören, die relevanten Teile eines Dokuments auf unkomplizierte Weise auslesen und leicht klarstellen, ob die Entsprechungen zwischen den Schlilsselwörtern und den Dokumententeilen korrekt sind oder nicht, woraufhin Fehler, falls welche vorhanden sind, korrigiert werden können.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Fig. 1 ist ein Funktionsblockdiagramm, das ein Dokumentenverarbeitungssystem gemäß einem Ausführungsbeispiel der Erfindung zeigt;
  • Fig. 2 ist eine Ansicht zum Veranschaulichen eines Beispiels der Struktur eines strukturierten Schlüsselworts, wie es gemäß den Lehren der Erfindung verwendet wird;
  • Fig. 3 ist eine Ansicht zum Veranschaulichen, auf nur beispielhafte Weise, von Verbindungen zwischen strukturierten Schlüsselwörtern;
  • Fig. 4A bis 4E sind Flussdiagramme zum Veranschaulichen beispielhafter Prozeduren, wie sie beim durch das in Fig. 1 dargestellten System ausgeführten Dokumentenverarbeitungs vorgang vorhanden sind;
  • Fig. 5A bis 5D und Fig. 6 bis 8 sind Ansichten zum Veranschaulichen, auf nur beispielhafte Weise, auf welche Art ein Dokument gemäß einem Ausführungsbeispiel der Erfindung unter Verwendung des in Fig. 1 dargestellten Systems verarbeitet wird;
  • Fig. 9A und 9B sowie Fig. 10 sind Funktionsblockdiagramme, die Dokumentenverarbeitungssysteme gemäß einem jeweiligen weiteren Ausführungsbeispiel der Erfindung zeigen;
  • Fig. 11 und Fig. 12A und 12B sind Ansichten zum Veranschaulichen, auf nur beispielhafte Weise, von Betriebsabläufen der Dokumentenverarbeitungssysteme gemäß den weiteren Ausführungsbeispielen der Erfindung; und
  • Fig. 13 ist ein Funktionsblockdiagramm, das noch ein anderes Ausführungsbeispiel eines erfindungsgemäßen Dokumentenverarbeitungssystems zeigt.
  • BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE
  • Nun wird die Erfindung im einzelnen in Verbindung mit bevorzugten oder beispielhaften Ausführungsformen derselben unter Bezugnahme auf die beigefügten Zeichnungen beschrieben.
  • Fig. 1 zeigt die allgemeine Anordnung eines Dokumentenverarbeitungssystems gemäß einem ersten Ausführungsbeispiel der Erfindung in einem Funktionsblockdiagramm. In dieser Figur bezeichnet die Bezugszahl 200 allgemein ein Informationssendesystem, das so ausgebildet ist, dass es Suchinformation (d. h. Information zur Suche) erzeugt, die über ein Kommunikationsnetz 500 an ein Informationsempfangssystem, das allgemein durch die Zahl 201 gekennzeichnet ist und so ausge bildet ist, dass es eine Verarbeitung zur Suche und zum Editieren unter Verwendung gelieferter Suchinformation, geliefert wird. So kann ausgesagt werden, dass das in Fig. 1 veranschaulichte Dokumentenverarbeitungssystem in Form zuzusagen eines Suchinformation-Sende/Empfangs-Systems realisiert ist. Im Informationssendesystem 200 bezeichnet die Bezugszahl 1 einen Dokumentendatenspeicher, und die Zahl 2 bezeichnet einen Speicher für ein Schlüsselwort-Wörterbuch. Jedes im Schlüsselwort-Wörterbuch 2 enthaltene vorgegebene Schlüsselwort ist so strukturiert, dass es mindestens eine Verbindung der folgenden aufweist: eine Verbindung, die zu einem Schlüsselwort führt, das ein übergeordnetes Konzept des gegebenen Schlüsselworts repräsentiert; eine Verbindung zu einem Schlüsselwort, das ein untergeordnetes Konzept repräsentiert; und eine Verbindung zu einem Schlüsselwort mit semantisch derselben Bedeutung (d. h. ein Synonym) wie das gegebene Schlüsselwort auf Grundlage des Wissensgebiets oder der Wissensdomäne, zu der das gegebene Schlüsselwort gehört (d. h. auf Wissensdomänenbasis), wie es in Fig. 2 veranschaulicht ist. So kann das Schlüsselwort-Wörterbuch 2 als Wörterbuch für strukturierte Schlüsselwörter bezeichnet werden, das diejenigen Schlüsselwörter enthält, die durch Verbindungen zwischen Schlüsselwörtern oder Beziehungen, die auf die oben genannte Weise errichtet wurden, systematisch strukturiert sind. Dieses Wörterbuch 2 wird nachfolgend als Wörterbuch für strukturierte Schlüsselwörter bezeichnet, während mittels der Verbindungen miteinander in Beziehung stehende Schlüsselwörter als strukturierte Schlüsselwörter bezeichnet werden. Nun wird zur Fig. 1 zurückgekehrt, in der die Bezugszahl 3 eine Einheit bezeichnet, die dazu dient, aus dem Wörterbuch 2 für strukturierte Schlüsselwörter die strukturierten Schlüsselwörter in derjenigen Domäne auszuwählen, mit der der Gegenstand eines im Dokumentendatenspeicher 1 enthaltenen gegebenen Dokuments in Beziehung steht, um die strukturierten Wörter und Verbindungsinformation, die dazu erforderlich ist, Entsprechung zwischen den strukturierten Schlüsselwörtern und relevanten Bestandteilen des ausgewählten Dokuments herzustellen, zum ausgewählten Dokument hinzuzufügen. Die Zahl 31 bezeichnet eine Benutzerschnittstelle zum tatsächlichen Errichten der Entsprechungen wischen den strukturierten Schlüsselwörtern und den Bestandteilen des Dokuments entsprechend der Ausgabeinformation der Einheit 3. Ferner dient eine allgemein mit 10 bezeichnete Suchinformation-Speichereinheit dazu, die Suchinformation zu speichern, und sie enthält einen Pufferspeicher 12 zum Speichern der ausgewählten strukturierten Schlüsselwörter (ebenfalls mit 12 bezeichnet), einen Puffer 11 zum Speichern von Dokumentendaten (11), zu denen Verbindungen hinzugefügt sind, die also mit Information zu Verbindungen zwischen den Bestandteilen des Dokuments und den strukturierten Schlüsselwörtern (nachfolgend einfach als Dokument-Schlüsselwort-Verbindungsinformation bezeichnet) versehen sind, und einen Puffer 13 zum Speichern der Dokument-Schlüsselwort-Verbindungsinformation (13) selbst. Die Bezugszahl 21 bezeichnet eine Schnittstelle, über die die Suchinformation 10 auf das Kommunikationsnetz 500 ausgegeben wird.
  • Im Informationsempfangssystem 201, das mit dem Informationssendesystem 200 verbunden werden kann, bezeichnet die Bezugszahl 121 eine Kommunikationsschnittstelle, über die die oben beschriebene Suchinformation empfangen wird und die Zahl 110 bezeichnet eine Speichereinheit zum Speichern der empfangenen Suchinformation. Diese Speichereinheit 110 enthält auch einen Puffer 112 zum Speichern der strukturierten Schlüsselwörter (ebenfalls mit 112 bezeichnet), einen Puffer 111 zum Speichern der Dokumentendaten (111) mit hinzugefügten Verbindungen sowie einen Puffer 113 zum Speichern der Dokument-Schlüsselwort-Verbindungsinformation, wie im Fall der im Informationssendesystem 200 enthaltenen Speichereinheit 10. Mindestens ein mit den Sendesystemen verbundenes Empfangssystem kann die auf dem Kommunikationsnetz 500 ausgesendete Suchinformation 10 über die Kommunikationsschnittstelle 121 empfangen, woraufhin die empfangene Suchinformation 10 entsprechend in der Speichereinheit 110 gespeichert wird.
  • Ein Benutzer, der gewisse Information zu empfangen wünscht, kann mittels einer Benennungseinheit 102 für Sucheinzelinformation/Bedingungen/strukturierte Schlüsselwörter Einzelheiten zur zu erlangenden Information, die Suchbedingung, wie den Umfang oder das Überdeckungsgebiet bei der Suche, und relevante strukturierte Schlüsselwörter benennen, woraufhin diese benannten Daten in einen Pufferspeicher 103 eingespeichert werden. Im Informationsempfangssystem 201 bezeichnet die Bezugszahl 101 ein Wörterbuch für strukturierte Schlüsselwörter, das denselben Inhalt wie das im Informationssendesystem 200 enthaltene Wörterbuch 2 für strukturierte Schlüsselwörter enthält. Ferner kann der Information anfordernde Benutzer über die Nutzerschnittstelle 131 mittels einer Editierformat-Benennungseinheit 104 ein Format zum Editieren von Information oder Daten (nachfolgend auch als Editierformat oder Formatierung bezeichnet) benennen, wobei das spezifizierte Editierformat dann in einen Editierformatpuffer 105 eingespeichert wird. Die Bezugszahl 141 bezeichnet eine Sucheinheit zum Suchen von Übereinstimmungen zwischen den strukturierten Schlüsselwörtern 112 für die empfangene Suchinformation, wie im Puffer 112 gespeichert, und den vom Benutzer benannten Suchdaten, die im Speicher 103 für Einzelinformation/Bedingungen/strukturierte Schlüsselwörter gespeichert sind, um dadurch, beim Erkennen von Übereinstimmung, diejenigen Bestandteile eines Dokuments zu entnehmen, die Bedeutungen oder Inhalte aufweisen, die semantisch den strukturierten Schlüsselwörtern entsprechen, für die die oben genannte Übereinstimmung erkannt wurde, wobei die oben genannte Dokument-Schlüsselwort-Verbindungsin formation 113 genutzt wird. Ferner bezeichnet die Bezugszahl 142 eine Editiereinheit zum Editieren der Bestandteile des Dokuments entsprechend dem Editierformat 105. Die sich beim Editieren ergebenden gesammelten Daten werden dann in einen Speicher 150 für gesammelte Daten eingespeichert. Der Benutzer kann die im Speicher 150 gespeicherten Daten vermittels der Benutzerschnittstelle 131 nutzen.
  • In der folgenden Beschreibung ist angenommen, auf nur beispielhafte Weise, dass ein Benutzer des Empfangssystems 201 eine Vergleichstabelle in Zusammenhang mit der Veröffentlichung einer neuen Mikroprozessorgeneration erzeugt.
  • Fig. 3 zeigt beispielhaft eine Reihe systematisch strukturierter Schlüsselwörter. Da die einschlägige Wissensdomäne eindeutig auf das Gebiet der Mikroprozessortechnik begrenzt ist, kann eine Struktur für systematische Schlüsselwörter erzeugt werden, wie sie in dieser Figur veranschaulicht ist. Gemäß der Figur ist das Schlüsselwort "Funktionsvermögen" dem Schlüsselwort "Mikroprozessor" gemäß einem übergeordneten Konzept zugeordnet, und es sind ihm Schlüsselwörter "Betriebsfunktionsvermögen (in MIPS)", "Taktfrequenz (in MHz)" und "Energieverbrauch (W)" gemäß untergeordneten Konzepten bezüglich dieses Schlüsselworts "Funktionsvermögen" zugeordnet. Gemäß einem anderen beispielhaften Fall, bei dem das übergeordnete Schlüsselwort zu "Funktionsvermögen" das Wort "Verbrennungsmotor" ist, sind entsprechende untergeordnete Schlüsselwörter "PS", "Kraftstoffkosten" usw. Unter Verwendung einer Schlüsselwortstruktur, wie sie in Fig. 3 veranschaulicht ist, können die Bedeutungen der Schlüsselwörter deutlich klargestellt werden.
  • Als nächstes wird die Beschreibung auf den Betrieb der Hinzufügeeinheit für Dokument-Schlüsselwort-Verbindungen (Fig. 1) zum Hinzufügen von Verbindungsinformation zu den Bestand teilen eines Dokuments, die Bedeutungen oder Inhalte aufweisen, die semantisch den strukturierten Schlüsselwörtern entsprechen, gerichtet. Fig. 4A ist ein Flussdiagramm zum Veranschaulichen einer Prozedur, wie sie im Betrieb der Einheit 3 beteiligt ist, d. h. eines Verfahrens zum Hinzufügen der Verbindungsinformation für die Suche zu den Dokumentendaten und die Fig. 5A bis 5D sind Ansichten, die ein konkretes Beispiel zeigen, das zum Verständnis der Prozedur oder des Verfahrens beiträgt, wie es in Fig. 4A dargestellt ist.
  • Genauer gesagt, zeigt Fig. 5A ein konkretes Beispiel eines Dokuments betreffend die Veröffentlichung eines neuen Mikroprozessormodells. Unter Bezugnahme auf diese Figur erfolgt eine Beschreibung dazu, wie die durch unterstrichene Zahlen gekennzeichnete Verbindungsinformation zu den Bestandteilen des veranschaulichten Dokuments unter Verwendung strukturierter Schlüsselwörter mittels der in Fig. 4A dargestellten Prozedur hinzugefügt wird. Zu Beginn wird angenommen, dass der Benutzer des Informationssendesystems 200 in einem in Fig. 4A dargestellten Schritt 401 über die Benutzerschnittstelle 31 die Schlüsselwörter "Mikroprozessor" und "Entwicklung" eingibt, die in Zusammenhang mit dem Gegenstand des Dokuments stehen. Auf diese Eingabe hin arbeitet die in Fig. 1 dargestellte Hinzufügeeinheit 3 für Dokument-Schlüsselwort-Verbindungen so, dass sie aus den im Wörterbuch 2 für strukturierte Schlüsselwörter enthaltenen Schlüsselwörter über eine Verarbeitung zum Herstellen von Übereinstimmung in einem in Fig. 4A dargestellten Schritt 402 geeignete oder relevante Schlüsselwörter dadurch entnimmt, dass sie eine Schlüsselwortstruktur für "Mikroprozessor", wie in Fig. 3 veranschaulicht, nachschlägt. Unter Bezugnahme auf Fig. 5A, zusammen mit Fig. 3, ist leicht erkennbar, dass z. B. das Schlüsselwort "Firma A" als Schlüsselwort gemäß einem übergeordneten Konzept "Herstellername" aufweist. Auf ähnliche Weise verfügt das Schlüsselwort "1,3 um" über "Halbleiter technik" und "Generation" als Schlüsselwörter übergeordneter Konzepte, während "CMOS" "Halbleitertechnik" und "Prozess" als Schlüsselwörter übergeordneter Konzepte aufweist. Im Fall des in Fig. 3 veranschaulichten Beispiels sind Schlüsselwörter wie "Betriebsfunktionsvermögen (MIPS)" und "Taktfrequenz (MHz)" so definiert, dass ihnen entsprechende Zahlenwerte zugeordnet werden können, die in "MIPS" bzw. "MHz" angegeben sind. Dies kann dadurch realisiert werden, dass die in Klammern angegebenen Ausdrücke als Parameter betrachtet werden. Demgemäß arbeitet, wenn diese Schlüsselwörter als Ergebnis der Verarbeitung zum Herstellen von Übereinstimmung im in Fig. 4A dargestellten Schritt 402 entnommen werden, die in Fig. 1 dargestellte Hinzufügeeinheit 3 für Dokument-Wörterbuch-Verbindungen so, dass sie durch einen in Fig. 4A dargestellten Syntaxanalyse-Verarbeitungsschritt 404 eine Verbindung zu einem entsprechenden Zahlenwert herstellt, wie dies beispielhaft durch die Verbindungsinformation 15 angegeben ist, die zu "10MIPS" hinzugefügt ist. Übrigens kennzeichnen in Fig. 4A in in Klammern gesetzte Markierungen "(Benutzer)", dass die zugehörigen Prozeduren oder Verarbeitungen vom Benutzer auszuführen sind, während Markierungen "(System)" anzeigen, dass die entsprechenden Verarbeitungen vom System ausgeführt werden, und die Markierung "(Zusammenwirkung des Benutzers und des Systems)" zeigt an, dass die entsprechende Prozedur durch Zusammenwirkung oder Wechselwirkung zwischen dem Benutzer und dem System auszuführen ist. (Dasselbe gilt in den Fig. 4B ff.) Im Fall des beispielhaft in Fig. 5A dargestellten Dokuments ist angenommen, dass durch die Verarbeitung 402 zum Herstellen von Übereinstimmung entnommene Schlüsselwort "Betriebsfunktionsvermögen" ist. In diesem Fall ist gemäß dem Obigen zu beachten, dass der Bestandteil des Dokuments, für den Entsprechung durch Hinzufügen von Verbindungsinformation unter Verwendung des Schlüsselworts "Betriebsfunktionsvermögen (MIPS)" zu errichten ist "10MIPS" ist, wie es durch die Ver bindungsinformation "15" in Fig. 5A angezeigt ist. Anschließend kann der Benutzer in einem Schritt 405 eine Entscheidung dadurch treffen, dass er einen in der Benutzerschnittstelle 31 enthaltenen Anzeigeschirm (nicht dargestellt) visuell dahingehend betrachtet, ob die als Ergebnis der Syntaxanalyse oder der lexikalischen Analyse erzeugte Verbindung korrekt ist, woraufhin die Verbindungsinformation korrigiert werden kann, falls sie sich als falsch erweist. Wenn durch die Verarbeitung zum Herstellen von Übereinstimmung zu viele Schlüsselwörter entnommen werden, kann vom Benutzer eine Auswahl unter den Schlüsselwörtern über die Benutzerschnittstelle 31 erfolgen, wie es im Schritt 403 in Fig. 4A dargestellt ist.
  • Nun entscheidet der Benutzer des Sendesystems, in einem Schritt 406 in Fig. 4A, ob die Anzahl der im Schritt 402 entnommenen Schlüsselwörter ausreichend ist. Wenn vermutet wird, dass die zum Suchen der vom Benutzer des Empfangssystems geforderten Information erforderlichen Schlüsselwörter unzureichend sind, können zusätzliche geeignete Schlüsselwörter in einem Schritt 407 vom Benutzer von Hand benannt werden. Zu diesem Zweck kann im System ein Unterstützungsmechanismus vorhanden sein, um dem Benutzer Schlüsselwörter anzugeben, wie sie wünschenswerterweise hinzugefügt werden. Übrigens müssen die von Hand benannten Schlüsselwörter selbstverständlich mit dem Wörterbuch für strukturierte Schlüsselwörter übereinstimmen. In der Benutzerschnittstelle 31 kann in für sich bekannte Weise ein Benutzerunterstützungssystem zu diesem Zweck enthalten sein. Durch die oben beschriebene Prozedur kann der Benutzer auch eine Verbindung zwischen dem Schlüsselwort "Chipname" und einem Bestandteil des Dokuments "A40540" unter Zuhilfenahme der Verbindungsinformation "21" herstellen, wie es in Fig. 5C dargestellt ist.
  • In der obigen, unter Bezugnahme auf Fig. 3 erfolgten Erläuterung ist die in Zusammenhang mit einem Synonym stehende Verarbeitung zum Herstellen von Übereinstimmung zum Vereinfachen und Verdeutlichen der Beschreibung weggelassen. Es ist jedoch zu beachten, dass durch eine auf einem Synonym beruhende Übereinstimmung Entsprechung zwischen z. B. "diese Zeit", wie in Fig. 5A dargestellt, und "Datum", wie in Fig. 3 dargestellt, hergestellt werden kann. In diesem Fall trifft man jedoch bei der Herstellung einer Verbindung zwischen "diese Zeit" und "Datum" auf Schwierigkeiten, da der erstere Ausdruck unbestimmt ist und kein spezielles Datum anzeigt. Derartige Schwierigkeiten können dadurch überwunden werden, dass zusätzlich zum in Fig. 5A dargestellten Dokument ein Dokumentbestandteil 55 wie "Mai '87" hinzugefügt wird, der semantisch das Schlüsselwort "diese Zeit" dadurch anzeigt, dass bei anderer Information nachgeschlagen wird, während das Schlüsselwort "Datum der Veröffentlichung (Monat, Jahr)", das ein untergeordnetes Konzept zu "Datum" ist, als Gegenschlüsselwort ausgewählt werden kann, wie es im Schritt 405 in Fig. 4A angezeigt ist. Anschließend kann eine Verbindung dadurch erzeugt werden, dass die Verbindungsinformation "31" hinzugefügt wird. In diesem Zusammenhang sei ferner angegeben, dass diese Verbindung so erzeugt werden kann, dass der zum Dokument hinzugefügte Dokumentbestandteil "55" ausdrücklich eine Anmerkung zu "diese Zeit" repräsentiert, was durch Hinzufügen von "*31" erfolgt.
  • Obwohl die Verbindungsinformation zum Errichten von Entsprechung zwischen den Bestandteilen eines Dokuments und den strukturierten Schlüsselwörtern im Fall des in Fig. 5 veranschaulichten Beispiels mittels entsprechender unterstrichener Buchstaben oder Zahlen angegeben ist, ist zu beachten, dass an Stelle der unterstrichenen Zahlen Zeiger oder andere verkoppelte Indizes in vernünftiger Weise genutzt werden können.
  • Es wird nun zur Fig. 1 zurückgekehrt, gemäß der der Benutzer des Empfangssystems 201 das Editierformat dadurch benennen kann, dass er die Formatierungsbenennungsfunktion oder die Einheit 104 benutzt und dann die Einzelinformation und Bedingungen zur Suche als auch die strukturierten Schlüsselwörter dadurch benennt, dass er die in Fig. 1 dargestellte Benennungseinheit 102 für suchorientierte Einzelinformationen/Bedingungen/strukturierte Schlüsselwörter verwendet, was nachfolgend im einzelnen beschrieben wird.
  • Die Fig. 4B bis 41 sind Ansichten zum Veranschaulichen von Prozeduren zum Sammeln von Daten durch Suchen und Editieren, wobei Fig. 4B ein Flussdiagramm ist, das allgemein die betroffenen Datensammelprozeduren (einschließlich Prozeduren 4000 bis 8000) zeigt, Fig. 4C ein Flussdiagramm ist, das im einzelnen die Prozedur 4000 zeigt, das die Verarbeitungsvorgänge 4100, 4200 usw. enthält, und die Fig. 4D und 4E Flussdiagramme sind, die die Verarbeitungsvorgänge 4100 bzw. 4200 mit weiteren Einzelheiten zeigen. Ferner sind die Fig. 4F bis 41 Ansichten zum Veranschaulichen der individuellen Verarbeitungsvorgänge mit weiteren Einzelheiten, ähnlich den Fig. 4D und 4E.
  • Die Fig. 6 zeigen, auf nur beispielhafte Weise, ein Editierformat zusammen mit den entsprechenden Einzelinformationen und Bedingungen zur Suche.
  • Als erstes benennt der Benutzer des Empfangssystems über die Benutzerschnittstelle 131 das Editierformat wie auch die Einzelinformationen und Bedingungen zur Suche sowie die strukturierten Schlüsselwörter, was in den Schritten 4100 bzw. 4200 in der Datensammel-Vorbereitungsprozedur 4000 erfolgt, wie im einzelnen in den Fig. 4B und 4C dargestellt. Das Editierformat liegt im Fall des veranschaulichten Aus führungsbeispiels in Form einer Tabelle mit einer Konfiguration vor, wie sie in Fig. 6 dargestellt ist. Als nächstes gibt der Benutzer in einem Schritt 4110 Daten zum Benennen der Rahmenstruktur der Tabelle ein, und anschließend gibt er in einem Schritt 4120 Kopfeinzelinformationen für die Tabelle ein. Daraufhin stellt das System die Felder ein, die eine Benennung der Einzelinformationen und der Bedingungen zur Suche ermöglichen, was entsprechend den einzelnen Spalten der Tabelle in einem Schritt 4130 (Fig. 4D) erfolgt. Übrigens kann die oben genannten Tabellenerstellung leicht wie im Fall eines Tabellenkalkulationssystems unter Verwendung eines Tabellenkalkulationsblatts oder einer ähnlichen bisher bekannten Maßnahme erfolgen. In Fig. 6 bezeichnet das Bezugssymbol a0 ein Feld, das die Benennung der Suchbedingung ermöglicht, während Symbole a1 bis a4 Felder zum Benennen der Sucheinzelinformationen bezeichnen, die jeweils den Kopfeinzelinformationen entsprechen. Fig. 7 zeigt Beispiele von Beschreibungen, wie sie in die Felder a1 bis a4 eingegeben werden. In diesem Zusammenhang kann der Benutzer, wozu auf einen Schritt 4220 in Fig. 4E Bezug genommen wird, die korrekten Schlüsselwörter unter interaktiver Unterstützung durch die Benutzerschnittstelle 131 benennen, während er im Wörterbuch 101 (Fig. 1) für strukturierte Schlüsselwörter nachschlägt. In diesem Fall wird als erstes die Suchbedingung 701 (Fig. 7) durch eine Prozedur benannt, wie sie in einem Schritt 4210 in Fig. 4E dargestellt ist. In dieser Prozedur 4210 wird die Suchbedingung durch Wechselwirkung zwischen dem Benutzer und dem System errichtet, wie es in Fig. 4F in Schritten 4211 bis 4219 dargestellt ist. Im Fall des veranschaulichten Beispiels wird die Bedingung zur UND- Verknüpfung von "Mikroprozessor" und "Veröffentlichung eines neuen Modells", wie in Fig. 7 mit 702 dargestellt, benannt oder eingegeben. Auf diese Eingabe hin wird die Struktur der Schlüsselwörter in Zusammenhang mit Mikroprozessor, wie sie im Wörterbuch 101 (Fig. 1) für strukturierte Schlüsselwörter enthalten sind, dem Benutzer über die Benutzerschnittstelle (131) angegeben, woraufhin Benennungen der Schlüsselwörter interaktiv in Übereinstimmung mit der angegebenen Schlüsselwortstruktur ausgeführt werden (Schritte 4221 bis 4223). In Fig. 7 repräsentiert das Symbol "?" eine Verbindung zwischen Schlüsselwörtern.
  • Mittels der auf der angegebenen Schlüsselwortstruktur beruhenden Prozeduren wird das Datum (Monat, Jahr) der Veröffentlichung dadurch bestimmt, dass die verbundenen Schlüsselwörter 703 bis 705 auf den Eingangsbefehl "suchen" hin gesucht werden, woraufhin ein das bestimmte Datum repräsentierender Zahlenwert in einer Variablen "YM" positioniert wird. Bei 706 wird eine andere Suchbedingung, dass nämlich das in der Variablen "YM" positionierte Datum nicht früher als "Januar '87" liegen darf, als Bedingung gemäß dem logischen Produkt benannt, wie bei 706 in Fig. 7 angegeben. Bei 707 wird spezifiziert, die Variable "YM" im Feld a1 auf einen Eingabebefehl "eingeben" hin einzugeben. Anschließend wird in 708 und 709 die Eingabe des Herstellernamens im Feld a2 spezifiziert. Diese Such/Eingabe-Befehle können innerhalb des Systems wahlfrei definiert werden. Als nächstes erfolgt eine Spezifizierung, um entweder "CISC (Complex Instruction Set Computer)" oder "RISC (Reduced Instruction Set Computer)" als Architektur für den betreffenden Mikroprozessor auszuwählen und die ausgewählte Architektur wird in das Feld a3 eingetragen (710 bis 712 in Fig. 7). Abschließend wird spezifiziert, die Suche nach "Betriebsfunktionsvermögen (MIPS)" in das Feld a4 einzutragen, was in 713 bis 715 erfolgt. In diesem Zusammenhang wird darauf hingewiesen, dass zu den Schlüsselwörtern "Veröffentlichungsdatum (Jahr, Monat)" und "Betriebsfunktionsvermögen (MIPS)" jeweilige Parameter hinzugefügt sind, die die Entnahme der entsprechenden Daten von Zahlenwerten aus dem Dokument mit Unterstützung durch die Verbindungsinformation spezifizieren.
  • Automatisches Sammeln von Daten wird im System gemäß der in Fig. 4B dargestellten Prozedur (5000 bis 7000) und u. a. durch die Verarbeitungsvorgänge realisiert, wie sie im einzelnen in den Fig. 4H und 4I dargestellt sind. Genauer gesagt, erfolgt dann, wenn Suchinformation wie strukturierte Schlüsselwörter, Dokument-Schlüsselwort-Verbindungsinformation und Dokumentendaten mit hinzugefüger Verbindung als Eingangsdaten geladen sind (5000), eine Suche durch die Verarbeitung zum Herstellung von Übereinstimmung mit den strukturierten Schlüsselwörtern für die Suchbedingung (6100), wodurch die Suchbedingung erfüllenden Daten entnommen werden, woraufhin ein Editieren der aus den extrahierten Daten ausgewählten Daten entsprechend dem Editierformat erfolgt (6200). Das Editieren der Daten läuft ferner durch eine Prozedur zum Herstellen von Übereinstimmung zwischen den strukturierten Schlüsselwörtern für die Sucheinzelinformationen und denjenigen der Suchinformation (6210), eine Prozedur zum Entnehmen von Bestandteilen eines Dokuments, die semantisch den Schlüsselwörtern entsprechen, unter Verwendung der Dokument-Schlüsselwort-Verbindungsinformation und der Dokumentendaten, zu denen eine Verbindung hinzugefügt ist (6220) sowie einer Prozedur zum Speichern der Bestandteile des Dokuments, die den Schlüsselwörtern entsprechen, im Feld zum Benennen der Sucheinzelinformationen entsprechend dem Editierformat (6230) ab. Ferner wird das sich aus dem Editiervorgang ergebende Dokument mit der im ursprünglichen Dokument vorhandenen Verbindungsinformation versehen (6300), um zur Korrektur oder Umordnung verwendet zu werden.
  • Fig. 8 zeigt in beispielhafter Weise die Daten, wie sie im Empfangssystem 201 mittels der oben beschriebenen Prozeduren automatisch gesammelt wurden. Wie es nun ersichtlich ist, kann die Vergleichstabelle, wie sie in Fig. 8 dargestellt ist, automatisch unter Nutzung der über das Kommunikations netzwerk eintreffenden Information erzeugt werden. Dank der erfindungsgemäßen Systemanordnung nimmt die Menge in einem gewünschten Format gesammelter Daten selbständig im Verlauf der Zeit zu, was einen Vorteil darstellt.
  • In Zusammenhang mit dem in Fig. 1 dargestellten Ausführungsbeispiel, bei dem das Sendesystem 200 und das Empfangssystem 201 über das Kommunikationsnetz 500 miteinander verbunden sind, sei darauf hingewiesen, dass das Kommunikationsnetz auch in Form entweder eines Rundrufkanals oder einer Kommunikationsschaltung realisiert sein kann. Ferner ist es bei der in Fig. 1 dargestellten Systemanordnung selbstverständlich, dass die Suchinformation zwischen dem System zum Erzeugen derselben und dem System zum Ausführen des Editiervorgangs über eine geeignete Leitungsverbindung übertragen werden kann, ohne dass auf die Nutzung der Kommunikationsschnittstellen 21 und 121 und des Kommunikationsnetzes 500 zurückzugreifen ist. Dasselbe gilt nicht nur für das in Fig. 1 dargestellte Ausführungsbeispiel, sondern auch für andere Ausführungsbeispiele, wie sie unten beschrieben sind.
  • Die Fig. 9A und 9B sind Blockdiagramme, die ein anderes Ausführungsbeispiel der Erfindung zeigen, das sich von dem in Fig. 1 dargestellten, bei dem die Suchinformation 10 über das Kommunikationsnetz 500 geliefert wird, dadurch unterscheidet, dass die hier durch die Zahl 810 bezeichnete Suchinformation in einem Medium gespeichert wird und dann als solche zusammen mit dem Medium selbst oder nach einem Kopieren auf ein anderes Medium, das für den Liefervorgang speziell vorgesehen ist, geliefert wird. Als Informationsspeichermedium oder -träger, wie oben angegeben, kann ein Magnetband, eine Magnetplatte, eine optische Platte, eine magnetooptische Platte oder dergleichen verwendet werden. In den Fig. 9A und 9B bezeichnet die Bezugszahl 821 eine Schreibschnittstelle zum Schreiben der Suchinformation auf ein Medium, und die Zahl 921 bezeichnet eine Leseschnittstelle zum Auslesen der Suchinformation. In diesen Figuren dienen andere Funktionseinheiten für dieselben oder ähnliche Vorgänge, wie sie durch entsprechende Markierungen in Fig. 1 angegeben sind. Beim in den Fig. 9A und 9B dargestellten Ausführungsbeispiel erfolgt die Übertragung der Information off-line. Jedoch ist das vorliegende Ausführungsbeispiel gegenüber dem in Fig. 1 dargestellten dahingehend von Vorteil, dass die bei der Kommunikation anfallenden Kosten deutlich verringert werden können. Übrigens kann eine Systemanordnung, die beide Merkmale der in Fig. 1 bzw. in den Fig. 9A, 9B dargestellten Ausführungsbeispiele beinhaltet, wirkungsvoll abhängig von vorgesehenen Anwendungen verwendet werden.
  • Fig. 10 ist ein Blockdiagramm, das noch ein anderes Ausführungsbeispiel der Erfindung zeigt, das sich von dem in Fig. 1 dargestellten dahingehend unterscheidet, dass im Informationssendesystem 1200 die strukturierten Schlüsselwörtern entsprechenden Bestandteile eines Dokuments (nachfolgend als dem Schlüsselwort entsprechender Dokumententeil bezeichnet) 1014 unabhängig von den Dokumentendaten gespeichert werden.
  • Das aktuelle, in Fig. 10 dargestellte Ausführungsbeispiel ist dann günstig, wenn der Inhalt der übertragenen Information (Dokument) lediglich einfache Beziehungen zu den Schlüsselwörtern einhält.
  • Das in Fig. 1 dargestellte Ausführungsbeispiel ist dann geeignet, wenn Beziehungen zwischen den Dokumentendaten mit hinzugefügten Verbindungen und den strukturierten Schlüsselwörtern kompliziert sind, so dass eine relativ große Menge an Verbindungsinformation erforderlich ist und es schwierig ist, vorab diejenigen Bestandteile eines Dokuments zu entnehmen, die der Benutzer benötigt. Demgegenüber ist es im Fall des in Fig. 10 dargestellten Ausführungsbeispiels mög lich, vorab die Kandidaten für die Bestandteile eines Dokuments zu beschränken, die vermutlich vom Benutzer benötigt werden, und zwar dank einer vereinfachten Entsprechungsbeziehung zwischen den Schlüsselwörtern und dem Inhalt des Dokuments. So kann die Belastung des Benutzers beim Ausführen der Verarbeitung dank der Fähigkeit gelindert werden, die zuvor entnommenen Dokumententeile in Form von Kandidaten zuzuteilen. Ferner können, anstatt dass das gesamte Dokument geliefert wird, nur diejenigen Bestandteile desselben geliefert werden, die den strukturierten Schlüsselwörtern entsprechen. Dies bedeutet wiederum, dass die Anzahl von Dokumententeilen verringert werden kann, wodurch Kosten in Zusammenhang mit der Kommunikation und anderen Vorgängen entsprechend verringert werden können, was einen weiteren Vorteil bildet.
  • Gemäß Fig. 10 gibt die Schlüsselwort-Dokumententeil-Verbindungsinformation 1013 zum Errichten von Entsprechung zwischen den strukturierten Schlüsselwörtern 1012 und den einem Schlüsselwort entsprechenden Dokumententeilen 1014 denjenigen Bestandteil eines Dokuments an, der eine dem Schlüsselwort entsprechende Bedeutung und einen entsprechenden Inhalt aufweist. Im Fall des vorliegenden Ausführungsbeispiels ist zu den Dokumentendaten 1016, zu denen eine Verbindung hinzugefügt ist, auch Verbindungsinformation 1015 hinzugefügt, die den Ort eines Dokumententeils benennt, um den Ort im Dokument anzuzeigen, aus dem der dem Schlüsselwort entsprechende Dokumententeil entnommen (oder kopiert) ist. Die strukturierten Schlüsselwörter 1012, die Schlüsselwort-Dokument-Verbindungsinformation 1013, der einem Schlüsselwort entsprechende Dokumentenbestandteil 1014, die den Ort eines Dokumententeils benennende Verbindungsinformation 1015 und die Dokumentendaten 1016, zu denen eine Verbindung hinzugefügt ist, wie im Sendesystem erzeugt, werden entsprechend auch im Empfangssystem bereitgestellt, wie durch 1112, 1113, 1114, 1115 bzw. 1116 gekennzeichnet. Da der einem Schlüsselwort entsprechende Dokumentbestandteil 1114 im Fall des vorliegenden Ausführungsbeispiels in konkreter Form entnommen wird, kann der Editiervorgang 1142 im Vergleich mit dem Editiervorgang beim in Fig. 1 dargestellten System vereinfacht werden. Die editierten Daten werden in einem Speicher 1150 gespeichert, während die gesammelten Dokumentendaten in einem Speicher 1160 gespeichert werden.
  • Fig. 11 ist eine Ansicht, die Verbindungsbeziehungen zeigt, wie sie beim in Fig. 10 dargestellten Ausführungsbeispiel zwischen strukturierten Schlüsselwörtern und einem Schlüsselwort entsprechenden Dokumententeilen existieren. Wie es aus Fig. 11 erkennbar ist, zeichnet sich dieses Ausführungsbeispiel dadurch aus, dass das Schlüsselwort, z. B. "Herstellername" ausdrücklich mit dem entsprechenden Dokumententeil "Firma A" verbunden ist, der mit Verbindungsinformation versehen ist, die den Ort des Dokumententeils benennt.
  • Die Fig. 12A und 12B sind Ansichten, die Beispiele editierter Daten 1150 bzw. gesammelter Dokumentendaten 1160 zeigen. Die editierten Daten enthalten das dem Dokumententeil 3002 (z. B. "Firma A") entsprechende Schlüsselwort in Entsprechung zum Editierformat 3001, wie in Fig. 6 dargestellt. Zu diesem Dokumententeil sind die das ursprüngliche Dokument kennzeichnende Information 3004 und Verbindungsinformation 3003 hinzugefügt, die den Ort oder die Position im ursprünglichen Dokument zeigt, an der der Dokumententeil 3002 vorhanden ist. Die in Fig. 12B dargestellten gesammelten Dokumentendaten entsprechen der Suchinformation, zu der die Dokumentenidentifizierinformation 3014 hinzugefügt ist, die derjenigen entspricht, die in den editierten Daten 1150 mit 3004 benannt ist.
  • Gemäß Fig. 10 kann der Benutzer des Informationsempfangssys tems, wenn er die editierten Daten vermittels der Benutzerschnittstelle 131 betrachtet, mittels der Information 1170 die Positionen oder Orte im Dokument klarstellen, von denen die Einzelinformationen in der Tabelle entnommen wurden, was immer dann erfolgen kann, wenn dies erwünscht ist. Ferner kann der Benutzer, wenn sich als Ergebnis der Klarstellung ein Fehler in einem Schlüsselwort findet, den Fehler unmittelbar korrigieren. Durch Speichern dieses Ereignisses als Adaptionsparameter 1180 in der Benutzerschnittstelle, kann das Auftreten desselben Fehlers beim folgenden Suchvorgang sicher verhindert werden.
  • Fig. 13 ist ein Blockdiagramm, das noch ein anderes Ausführungsbeispiel der Erfindung zeigt, das sich vom in Fig. 10 dargestellten Ausführungsbeispiel dahingehend unterscheidet, dass die Dokumentendaten nicht immer geliefert werden, sondern dass sie nur dann geliefert werden, wenn vom Benutzer des Empfangssystems eine Lieferungsanforderung ausgegeben wird. Im Fall des in Fig. 13 dargestellten Ausführungsbeispiels umfasst die immer an den Empfänger gelieferte Information die strukturierten Schlüsselwörter 2112, den einem Schlüsselwort entsprechenden Dokumentenbestandteil 2114 sowie die zugehörige Verbindungsinformation, zu der die Information 2117 zum Identifizieren des ursprünglichen Dokuments hinzugefügt ist. Wenn die Daten des ursprünglichen Dokuments vom Benutzer benötigt werden, wird die Information 2117 zum Identifizieren des ursprünglichen Dokuments aus einer Vergleichs- und Korrekturdatei 2170 für editierte Daten/Dokumentendaten über die Kommunikationsschnittstelle 2122 an das Sendesystem ausgeliefert, woraufhin die relevante Suchinformation von der Datei 2018 der Sendestation an die Pufferdatei 2170 des Empfangssystems zurückgeliefert wird. Die anschließende Verarbeitung wird auf dieselbe Weise wie im Fall des in Fig. 10 dargestellten Ausführungsbeispiels ausgeführt.
  • Fig. 1
  • 1 - Dokumentendaten
  • 2 - Wörterbuch für strukturierte Schlüsselwörter
  • 3 - Einheit zum Hinzufügen einer Dokument-Schlüsselwort- Verbindung
  • 10 - Suchinformationsspeicher
  • 11 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 12 - Puffer für strukturierte Schlüsselwörter
  • 13 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 21 - Kommunikationsschnittstelle
  • 31 - Benutzerschnittstelle
  • 101 - Wörterbuch für strukturierte Schlüsselwörter
  • 102 - Einheit zum Benennen von Sucheinzelinformation/Bedingungen/strukturierten Schlüsselwörtern
  • 103 - Puffer für benannte Einzelinformation/Bedingungen/- strukturierte Schlüsselwörter
  • 104 - Formatierungsbenennungseinheit
  • 105 - Editierformatpuffer
  • 110 - Suchinformationsspeicher
  • 111 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 112 - Puffer für strukturierte Schlüsselwörter
  • 113 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 121 - Kommunikationsschnittstelle
  • 131 - Benutzerschnittstelle
  • 141 - Sucheinheit
  • 142 - Editiereinheit
  • 150 - Speicher für gesammelte Daten
  • 200 - Informationssendesystem
  • 201 - Informationsempfangssystem
  • 500 - Kommunikationsnetz
  • Fig. 2 und 3
  • siehe alphabetische Auflistung am Ende
  • Fig. 4A
  • 401 - Eingeben eines Schlüsselworts, das den Dokumententitel repräsentiert
  • 402 - Entnehmen eines Schlüsselworts durch eine Verarbeitung zur Herstellung von Übereinstimmung zwischen dem Wörterbuch für strukturierte Schlüsselwörter und Dokumentendaten
  • 403 - Auswahl von Schlüsselwörtern durch den Benutzer
  • 404 - Herstellen einer Verbindung zu einem Schlüsselwort, das einem Beschreibungskandidaten entspricht, durch lexikalische Analyse von Dokumentendaten
  • 405 - Klarstellung der Gültigkeit einer erzeugten Verbindung, Fehlerkorrektur und zusätzliche Dokumenteneingabe durch den Benutzer
  • 406 - Reichen die Schlüsselwörter aus?
  • 407 - Manuelle Benennung eines Schlüsselworts
  • Fig. 4B
  • 4000 - Vorbereitungsverarbeitung zum Sammeln von Daten
  • 5000 - Dateneingabeverarbeitung
  • 6000 - Verarbeitung zum Sammeln von Daten (Fig. 4H)
  • 7000 - Wird das Ergebnis verwendet?
  • Fig. 4C
  • 4000 - Vorbereitungsverarbeitung zum Sammeln von Daten
  • 4100 - Benennen des Editierformats
  • 4200 - Benennen einer Sucheinzelinformation, einer Bedingung und eines strukturierten Schlüsselworts (Fig. 4E)
  • Fig. 4D
  • 4100 - Benennen des Editierformats
  • 4110 - Eingeben eines Tabellenrahmens
  • 4120 - Eingeben von Tabellenkopf-Einzelinformationen
  • 4130 - Erstellen eines Felds zum Benennen von Bedingungen und Einzelinformationen zur Suche
  • Fig. 4E
  • 4200 - Benennen einer Sucheinzelinformation, einer Bedingung und eines strukturierten Schlüsselworts
  • 4210 - Benennen einer Suchbedingung im Bedingungsfeld des Editierformats (Fig. 4F)
  • 4220 - Benennen einer Sucheinzelinformation im Einzelinformationsfeld des Editierformats (Fig. 4 G)
  • Fig. 4F
  • 4210 - Benennen einer Suchbedingung im Bedingungsfeld des Editierformats
  • 4211 - Eingeben oder Auswählen von Kandidaten für ein Schlüsselwort oder mehrere, die den Dokumententitel repräsentieren, für einen Suchvorgang
  • 4212 - Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung von Schlüsselwortkandidaten mit Schlüsselwörtern im Wörterbuch für strukturierte Schlüsselwörter
  • 4212-1 - i.O.
  • 4213 - Bestimmung der Domäne im Wörterbuch für strukturierte Schlüsselwörter, zur Suche
  • 4214 - Erstellen einer Suchbedingung durch Eingeben oder Auswählen eines Schlüsselworts
  • 4215 - Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung mit Schlüsselwörtern im Wörterbuch für strukturierte Schlüsselwörter
  • 4216- Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung mit Schlüsselwörtern gemäß über- und untergeordneten Konzepten
  • 4216-1 - i.O.
  • 4217 - Bestimmung einer Suchbedingung
  • 4218 - Anzeige eines Schlüsselwortkandidaten zum Korrigieren eines durch den Benutzer vorgegebenen Schlüsselworts, um in das Wörterbuch für strukturierte Schlüsselwörter aufgenommen zu werden
  • 4219 - Anzeige von Schlüsselwortkandidaten in Übereinstimmung mit dem Wörterbuch für strukturierte Schlüsselwörter
  • Fig. 4G
  • 4220 - Benennen einer Sucheinzelinformation im Einzelinformationsfeld des Editierformats
  • 4221 - Benennen von Sucheinzelinformationen durch Eingeben oder Auswählen von Schlüsselwörtern
  • 4222 - Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung mit Schlüsselwörtern im Wörterbuch für strukturierte Schlüsselwörter
  • 4221-1 - i.O.
  • 4223 - Bestimmung von Sucheinzelinformationen
  • 4224 - Anzeigen von Schlüsselwortkandidaten in Übereinstimmung mit dem Wörterbuch für strukturierte Schlüsselwörter
  • Fig. 4H
  • 6000 - Verarbeitung zum Sammeln von Daten
  • 6100 - Suchen durch Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung einer Suchbedingung mit strukturierten Schlüsselwörtern
  • 6100-1 - Übereinstimmung aufgefunden?
  • 6200 - Editieren von Daten entsprechend dem Editierformat (Fig. 41)
  • 6300 - Einstellen einer Verbindung (eines Zeigers) zu Daten eines ursprünglichen Dokuments
  • Fig. 4I
  • 6200 - Editieren von Daten entsprechend dem Editierformat
  • 6210 - Ausführen einer Verarbeitung zum Herstellen von Übereinstimmung zwischen strukturierten Schlüsselwörtern für Sucheinzelinformationen und solchen von Suchinformation
  • 6220 - Entnehmen eines Dokumentbestandteils entsprechend dem Schlüsselwort unter Verwendung von Dokument-Schlüsselwort-Verbindungsinformation
  • 6230 - Eingabe eines dem Schlüsselwort entsprechenden Dokumentbestandteils in das Einzelinformationsfeld in Übereinstimmung mit dem Editierformat
  • Fig. 5A
  • Dieses Mal (*31) hat die Firma A (11) einen Mikroprozessor (1) A40540 (21) mit RISC(14)-Struktur entwickelt (2), der einen CMOS (13) von 1,3 um (12) verwendet. Der Prozessor verfügt über ein Betriebsfunktionsvermögen (15) für ganze Zahlen von 10 MIPS (15)... 55 - 31. Mai '87 (31)
  • Fig. 5B, 5C, 5D und 6
  • siehe alphabetische Auflistung am Ende
  • Fig. 7
  • 701 - Benennen einer Suchbedingung
  • 702 - Suchen: Mikroprozessor & Veröffentlichung eines neuen Modells
  • 703 - YM = Mikroprozessor
  • 704 -? Datum
  • 705 -? Veröffentlichungsdatum (Monat, Jahr)
  • 706 - & (suchen: Januar '87 < JM)
  • 707 - Eingabe: (JM);
  • 708 - Eingabe: (Mikroprozessor)
  • 709 -? Herstellername);
  • 710 - Eingabe: Mikroprozessor
  • 711 -? Architektur
  • 712 -? (Auswählen: CISC, RISC));
  • 713 - Eingabe: (Mikroprozessor
  • 714 -? Funktionsvermögen
  • 715 -? Betriebsfunktionsvermögen (MIPS))
  • Fig. 8
  • siehe alphabetische Auflistung am Ende
  • Fig. 9A
  • 801 - Dokumentendaten
  • 802 - Wörterbuch für strukturierte Schlüsselwörter
  • 803 - Einheit zum Hinzufügen einer Dokument-Schlüsselwort- Verbindung
  • 810 - Suchinformationsspeicher
  • 811 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 812 - Puffer für strukturierte Schlüsselwörter
  • 813 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 821 - Schreibschnittstelle
  • 831 - Benutzerschnittstelle
  • 850 - Speicher für gesammelte Daten
  • Fig. 9B
  • 901 - Wörterbuch für strukturierte Schlüsselwörter
  • 902 - Einheit zum Benennen von Sucheinzelinformation/Bedingungen/strukturierten Schlüsselwörtern
  • 903 - Puffer für benannte Einzelinformation/Bedingungen/- strukturierte Schlüsselwörter
  • 904 - Formatierungsbenennungseinheit
  • 905 - Editierformatpuffer
  • 910 - Suchinformationsspeicher
  • 911 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 912 - Puffer für strukturierte Schlüsselwörter
  • 913 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 921 - Leseschnittstelle
  • 931 - Benutzerschnittstelle
  • 941 - Sucheinheit
  • 942 - Editiereinheit
  • 950 - Speicher für gesammelte Daten
  • Fig. 10
  • 1001 - Dokumentendaten
  • 1002 - Wörterbuch für strukturierte Schlüsselwörter
  • 1003 - Entnehmen eines dem strukturierten Schlüsselwort entsprechenden Dokumentbestandteils und Hinzufügen einer Schlüsselwort-Dokumentverbindung
  • 1010 - Suchinformationsspeicher
  • 1012 - Puffer für strukturierte Schlüsselwörter
  • 1013 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 1014 - Puffer für einen einem Schlüsselwort entsprechenden Dokumentbestandteil
  • 1015 - Puffer für Information zum Benennen des Orts eines Dokumentbestandteils
  • 1016 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 1021 - Kommunikationsschnittstelle
  • 1031 - Benutzerschnittstelle
  • 1101 - Wörterbuch für strukturierte Schlüsselwörter
  • 1102 - Einheit zum Benennen von Sucheinzelinformation/Bedingungen/strukturierten Schlüsselwörtern
  • 1103 - Puffer für benannte Einzelinformation/Bedingungen/- strukturierte Schlüsselwörter
  • 1104 - Formatierungsbenennungseinheit
  • 1105 - Editierformatpuffer
  • 1110 - Suchinformationsspeicher
  • 1112 - Puffer für strukturierte Schlüsselwörter 1113 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 1114 - Puffer für einen einem Schlüsselwort entsprechenden Dokumentbestandteil
  • 1115 - Puffer für Information zum Benennen des Orts eines Dokumentbestandteils
  • 1116 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 1121 - Kommunikationsschnittstelle
  • 1131 - Benutzerschnittstelle
  • 1141 - Sucheinheit
  • 1142 - Editiereinheit
  • 1143 - Speichern
  • 1150 - Sammeln editierter Daten
  • 1160 - Sammeln von Dokumentendaten
  • 1170 - Vergleichen/Korrigieren von editierten Daten und Dokumentendaten
  • 1180 - Adaptionsparameterspeicher
  • 1500 - Kommunikationsnetz
  • Fig. 11
  • siehe alphabetische Auflistung am Ende
  • Fig. 12A
  • 1150 - gesammelte editierte Daten
  • 3001 - Editierformat
  • 3002 - Dokumentbestandteilen entsprechendes Schlüsselwort
  • 3003 - Verbindungsinformation zum Benennen des Orts eines Dokumentbestandteils
  • 3004 - Information zum Identifizieren eines Dokuments
  • Fig. 12B
  • 1160 - gesammelte Dokumentendaten
  • 3014 - Information zum Identifizieren eines Dokuments
  • 3021 - strukturierte Schlüsselwörter
  • 3022 - Schlüsselwort-Dokument-Verbindungsinformation
  • 3023 - Dokumentbestandteilen entsprechendes Schlüsselwort
  • 3024 - Verbindungsinformation zum Benennen des Orts eines Dokumentbestandteils
  • 3025 - Dokumentendaten mit hinzugefügter Verbindung
  • Fig. 13
  • 2001 - Dokumentendaten
  • 2002 - Wörterbuch für strukturierte Schlüsselwörter
  • 2003 - Entnehmen eines dem strukturierten Schlüsselwort entsprechenden Dokumentbestandteils und Hinzufügen einer Schlüsselwort-Dokumentverbindung
  • 2010 - Suchinformationsspeicher
  • 2012 - Puffer für strukturierte Schlüsselwörter
  • 2013 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 2014 - Puffer für einen einem Schlüsselwort entsprechenden Dokumentbestandteil
  • 2015 - Puffer für Information zum Benennen des Orts eines Dokumentbestandteils
  • 2016 - Puffer für mit einer Verbindung versehene Dokumentendaten
  • 2017 - Information zum Identifizieren eines Dokuments
  • 2018 - Puffer für mit Schlüsselwortverbindungsinformation versehene Dokumentendaten
  • 2021 - Kommunikationsschnittstelle
  • 2022 - Kommunikationsschnittstelle
  • 2031 - Benutzerschnittstelle
  • 2101 - Wörterbuch für strukturierte Schlüsselwörter
  • 2102 - Einheit zum Benennen von Sucheinzelinformation/Bedingungen/strukturierten Schlüsselwörtern
  • 2103 - Puffer für benannte Einzelinformation/Bedingungen/- strukturierte Schlüsselwörter
  • 2104 - Formatierungsbenennungseinheit
  • 2105 - Editierformatpuffer
  • 2110 - Suchinformationsspeicher
  • 2112 - Puffer für strukturierte Schlüsselwörter
  • 2113 - Puffer für Dokument-Schlüsselwort-Verbindungsinformation
  • 2114 - Puffer für einen einem Schlüsselwort entsprechenden Dokumentbestandteil
  • 2117 - Information zum Identifizieren eines Dokuments 2121 - Kommunikationsschnittstelle
  • 2122 - Kommunikationsschnittstelle
  • 2131 - Benutzerschnittstelle
  • 2141 - Sucheinheit
  • 2142 - Editiereinheit
  • 2150 - Sammeln editierter Daten
  • 2170 - Vergleichen/Korrigieren von editierten Daten und Dokumentendaten
  • 2180 - Puffer für mit Schlüsselwortverbindungsinformation versehene Dokumentendaten
  • 2200 - Informationssendesystem
  • 2209 - Informationsempfangssystem
  • 1500 - Kommunikationsnetz
  • Figurenbeschriftung alphabetisch geordnet
  • architecture Architektur
  • check of result of data collection
  • Prüfen des Ergebnisses des Sammelns von Daten
  • chip name Chipname
  • clock frequency Taktfrequenz
  • collection of data by retrieval and editing
  • Sammeln von Daten durch Suchen und Editieren
  • company Firma
  • date Datum
  • date of publication (month, year)
  • Veröffentlichungsdatum (Monat, Jahr)
  • date of shipping (month, year)
  • Versanddatum (Monat, Jahr)
  • development Entwicklung
  • document location designating linkage information
  • Verbindungsinformation zum Benennen des Orts eines Dokumentbestanteils
  • editing format Editierformat
  • element no. Element Nr.
  • end Ende
  • from other information sending users
  • von anderen Informationen sendenden Benutzern
  • information receiving user
  • Information empfangender Benutzer
  • Information sending user Information sendender Benutzer
  • item no. Einzelinformation Nr.
  • items/condition for retrieval
  • Einzelinformationen/Bedingung zur Suche
  • keyword Schlüsselwort
  • keyword corresponding document constituents
  • Dokumentbestandteilen entsprechendes Schlüsselwort
  • keyword-document linkage information
  • Schlüsselwort-Dokument-Verbindungsinformation
  • keyword of higher rank concept
  • Schlüsselwort gemäß einem übergeordneten Konzept
  • keyword of lower rank concept
  • Schlüsselwort gemäß einem untergeordneten Konzept vom Sendesystem benannte
  • keywords designated by sender system as subject
  • Schlüsselwörter als Gegenstand
  • matter of document eines Dokuments
  • link Verbindung
  • manufacturer name Herstellername
  • March März
  • May Mai
  • microprocessor Mikroprozessor
  • new model neues Modell
  • no nein
  • operation performance Betriebsfunktionsvermögen
  • performance Funktionsvermögen
  • power consumption Energieverbrauch
  • process Prozess
  • publication (M,Y in A. D.) Veröffentlichung (M, J. in A. D.)
  • semiconductor technology Halbleitertechnik
  • series Reihe
  • start Start
  • structured keyword strukturiertes Schlüsselwort
  • synonym keyword Synonym-Schlüsselwort
  • the generation Generation

Claims (13)

1. Dokumentenverarbeitungssystem, aufweisend:
einen Speicher (2, 10, 101, 110, 850, 950) zur Speicherunng von Schlüsselworten eines Dokuments,
ein Ausgabesystem (200) zur Speicherung des Dokuments, mit einer Verbindungseinrichtung (3) zur Lieferung von Verbndungsinformation, die Entsprechungen zwischen den Schlüsselworten und Bestandteilen des Dokuments angibt, und
ein mit dem Ausgabesystem wirksam verbundenes Empfangssystem (201), das eine Wiedergewinnungseinrichtung zur Wiedergewinnung des Dokuments unter Verwendung der Verbindungsinformation beinhaltet,
dadurch gekennzeichnet, daß
die Schlüsselworte in dem Speicher (2, 10, 101, 110, 850, 950) in strukturierter Form gespeichert sind, die Verbindungen von einem Schlüsselwort zu einem Synonym-Schlüsselwort, zu einem übergeordneten Schlüsselwort und zu einem untergeordneten Schlüsselwort erlaubt,
die Verbindungsinformation von der Verbindungseinrichtung (3) so geliefert wird, daß eine Entsprechung zwischen einem gewissen Schlüsselwort und einem Bestandteil des Dokuments, der ein zu dem gewissen Schlüsselwort untergeordnetes Schlüsselwort enthält, angegeben wird, und
die Wiedergewinnungseinrichtung (141) Daten des wiedergewonnenen Dokuments unter Verwendung der Verbindungsinformation und der strukturierten Schlüsselworte in einer vorbestimmten Formatierung liefert.
2. System nach Anspruch 1, wobei das Empfangssystem außerdem beinhaltet:
eine Formatierungs-Benennungseinrichtung (104) zur Bildung der vorbestimmten Formatierung auf der Grundlage der in das Empfangssystem eingegebenen Wiedergewinnungsdaten,
einen Formatierungsspeicher (105), der mit der Formatierungs-Benennungseinrichtung (104) und der Widergewinnungs einrichtung (141) verbunden ist, um Daten der vorbestimmten Formatierung zu speichern und diese Daten auf der Grundlage einer Angabe der Wiedergewinnungseinrichtung an die Formatierungs-Benennungseinrichtung (104) zu liefern, und
eine Formatierungseinrichtung (142), die mit dem Formatierungsspeicher (105) und der Wiedergewinnungseinrichtung (141) verbunden ist, um die in dem Dokument enthaltenen Daten zu formatieren, die von den Daten der vorbestimmten Formatierung bestimmt sind.
3. System nach Anspruch 1, aufweisend:
eine Kommunikationseinrichtung (500), die über jeweils ein entsprechendes Kommunikationsinterface (21, 121) mit dem Ausgabesystem und dem Empfangssystem verbunden ist.
4. System nach Anspruch 1, wobei das Ausgabesystem eine erste Mediumsteuereinrichtung (831) zur Ausgabe des Dokuments und der Verbindungsinformation an ein Speichermedium (850) beinhaltet, und
wobei die Empfangseinrichtung eine zweite Mediumsteuereinrichtung (931) zum Einlegen des Speichermediums (950), das das Dokument und die Verbindungsinformation enthält, beinhaltet.
5. System nach Anspruch 1, wobei die Wiedergewinnungseinrichtung beinhaltet:
eine strukturierte Schlüsselwort-Benennungseinrichtung (102) zur Benennung eines Schlüsselworts zur Wiedergewinnung von Daten des Dokuments auf der Grundlage eines strukturierten Schlüsselwort-Wörterbuchs (101), und
einen Speicher (103) zur Speicherung der von der Benennungseinrichtung benannten strukturierten Schlüsselworte.
6. System nach Anspruch 1 mit mehreren Ausgabesystemen und mehreren Empfangssystemen sowie mit Kommunikationsnetzwerken (1500, 500), die jeweils über entsprechende Kommunikations interface (21, 121; 1021, 1121) mit den Ausgabesystemen und den Empfangssystemen verbunden sind.
7. System nach Anspruch 2 mit einer Schlüsselwortentsprechungs-Dokumententeil-Gewinnungseinrichtung (1114, 1115), die mit der Wiedergewinnungseinrichtung (1141) und der Formatierungseinrichtung (1142) des Empfangssystems (1201) verbunden ist, um Daten aus dem Inhalt des Dokuments zu gewinnen, die von den vorbestimmten Formatierungsdaten bestimmt sind.
8. Verfahren zur Verarbeitung von Dokumenten mit folgenden Schritten:
Speichern von Schlüsselworten eines Dokuments in strukturierter Form, die Verbindungen von einem Schlüsselwort zu einem synonymen Schlüsselwort, zu einem übergeordneten Schlüsselwort und zu einem untergeordneten Schlüsselwort erlaubt,
Liefern von Verbindungsinformation, die eine Entsprechung zwischen einem gewissen Schlüsselwort und einem Bestandteil des Dokuments angibt, der ein untergeordnetes Schlüsselwort des genannten gewissen Schlüsselworts enthält, und
Wiedergewinnen des Dokuments und Liefern von Daten des Dokuments in einer vorbestimmten Formatierung unter Verwendung der Verbindungsinformation und der strukturierten Schlüsselworte.
9. Verfahren nach Anspruch 8, mit folgenden weiteren Schritten:
einem Schritt (4100) zum Bilden der vorbestimmten Formatierung auf der Grundlage von Wiedergewinnungsdaten, die in dem Wiedergewinnungsschritt wiedergewonnen werden, und
einem Schritt (6200) zur Formatierung von Daten, die von den Daten der vorbestimmten Formatierung bestimmt sind, im Anschluß an den Schritt zur Bildung einer Formatierung und den Wiedergewinnungsschritt.
10. Verfahren nach Anspruch 8, wobei ein Ausgabesystem das Dokument und die Wiedergewinnungsdaten über ein Kommunikationsinterface an ein Empfangssystem liefert.
11. Verfahren nach Anspruch 8, wobei ein Ausgabesystem Daten des Dokuments und die Verbindungsinformation an ein Speichermedium ausgibt, während ein Empfangssystem die Daten von dem Speichermedium, das das Dokument und die Verbindungsinformation enthält, entgegennimmt.
12. Verfahren nach Anspruch 8, wobei das Schlüsselwort zur Wiedergewinnung der Dokumentendaten in einem Empfangssystem auf der Grundlage eines strukturierten Schlüsselwort-Wörterbuchs benannt wird.
13. Verfahren nach Anspruch 8, wobei Daten, die von den Daen der vorbestimmten Formatierung bestimmt sind, in einem Empfangssystem unter Verwendung der Verbindungsinformation aus dem Dokument gewonnen werden.
DE69130883T 1990-08-22 1991-08-01 Informationsverarbeitungssystem und Verfahren für die Verarbeitung von Dokumenten mit strukturierten Schlüsselwörtern Expired - Fee Related DE69130883T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2219039A JP2895184B2 (ja) 1990-08-22 1990-08-22 文書処理システム及び文書処理方法

Publications (2)

Publication Number Publication Date
DE69130883D1 DE69130883D1 (de) 1999-03-25
DE69130883T2 true DE69130883T2 (de) 1999-09-16

Family

ID=16729301

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69130883T Expired - Fee Related DE69130883T2 (de) 1990-08-22 1991-08-01 Informationsverarbeitungssystem und Verfahren für die Verarbeitung von Dokumenten mit strukturierten Schlüsselwörtern

Country Status (4)

Country Link
US (1) US5307266A (de)
EP (1) EP0472026B1 (de)
JP (1) JP2895184B2 (de)
DE (1) DE69130883T2 (de)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5404514A (en) * 1989-12-26 1995-04-04 Kageneck; Karl-Erbo G. Method of indexing and retrieval of electronically-stored documents
US5457792A (en) * 1991-11-07 1995-10-10 Hughes Aircraft Company System for using task tables and technical data from a relational database to produce a parsed file of format instruction and a standardized document
US5499329A (en) * 1992-04-30 1996-03-12 Ricoh Company, Ltd. Method and system to handle context of interpretation in a document processing language
JPH06309365A (ja) * 1993-04-20 1994-11-04 Fuji Xerox Co Ltd 文書処理装置
JP3444948B2 (ja) * 1993-12-28 2003-09-08 キヤノン株式会社 文書編集装置および文書編集方法
JP2687882B2 (ja) * 1994-07-05 1997-12-08 日本電気株式会社 検索条件統合装置
US6243172B1 (en) * 1995-01-18 2001-06-05 Varis Corporation Method and system for merging variable text and images into bitmaps defined by a page description language
US5729665A (en) * 1995-01-18 1998-03-17 Varis Corporation Method of utilizing variable data fields with a page description language
US5745602A (en) * 1995-05-01 1998-04-28 Xerox Corporation Automatic method of selecting multi-word key phrases from a document
US6336094B1 (en) * 1995-06-30 2002-01-01 Price Waterhouse World Firm Services Bv. Inc. Method for electronically recognizing and parsing information contained in a financial statement
US5740425A (en) * 1995-09-26 1998-04-14 Povilus; David S. Data structure and method for publishing electronic and printed product catalogs
US5873107A (en) * 1996-03-29 1999-02-16 Apple Computer, Inc. System for automatically retrieving information relevant to text being authored
US7349892B1 (en) 1996-05-10 2008-03-25 Aol Llc System and method for automatically organizing and classifying businesses on the World-Wide Web
AU4495597A (en) 1996-09-23 1998-04-14 Lowrie Mcintosh Defining a uniform subject classification system incorporating document management/records retention functions
US5940821A (en) * 1997-05-21 1999-08-17 Oracle Corporation Information presentation in a knowledge base search and retrieval system
US6487568B1 (en) * 1997-07-18 2002-11-26 Tesseron, Ltd. Method and system for flowing data to an arbitrary path defined by a page description language
US6418429B1 (en) 1998-10-21 2002-07-09 Apple Computer, Inc. Portable browsing interface for information retrieval
US6461166B1 (en) 2000-10-17 2002-10-08 Dennis Ray Berman Learning system with learner-constructed response based testing methodology
US7074128B2 (en) 2001-08-03 2006-07-11 Drb Lit Ltd. Method and system for enhancing memorization by using a mnemonic display
EP1579343A1 (de) * 2002-12-20 2005-09-28 Koninklijke Philips Electronics N.V. Abfrage durch indefinite ausdrücke
US7357640B2 (en) * 2003-07-02 2008-04-15 Drb Lit Ltd. Lock-In Training system
US7383171B2 (en) * 2003-12-05 2008-06-03 Xerox Corporation Semantic stenography using short note input data
TWM249950U (en) * 2004-01-02 2004-11-11 Cvc Technologies Inc Cap tightening machine capable of controlling tightening torque
US7364432B2 (en) * 2004-03-31 2008-04-29 Drb Lit Ltd. Methods of selecting Lock-In Training courses and sessions
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
DE102006001840B4 (de) * 2006-01-13 2007-10-11 Universität Konstanz Verfahren zum computergestützten Bearbeiten von Quelldatenelementen, System und Computerprogrammprodukt
JP4878477B2 (ja) * 2006-01-18 2012-02-15 富士通株式会社 情報検索適切度判定処理プログラムおよびオペレータスキル判定処理プログラム
US8356244B2 (en) * 2006-06-20 2013-01-15 The Boeing Company Managing changes in aircraft maintenance data
JP4865526B2 (ja) * 2006-12-18 2012-02-01 株式会社日立製作所 データマイニングシステム、データマイニング方法及びデータ検索システム
US8135716B2 (en) * 2008-12-10 2012-03-13 Sap Ag Systems and method for mapping large object data content in a database table to a work area
US20120266056A1 (en) * 2009-10-05 2012-10-18 Frank Shaffer Interactive electronic document
JP5441760B2 (ja) * 2010-02-25 2014-03-12 三菱電機株式会社 文書間距離算出器および文章検索器
JP5749626B2 (ja) * 2011-10-21 2015-07-15 株式会社アプリ・スマート ウェブ情報提供システム及びウェブ情報提供プログラム
US9521189B2 (en) * 2013-08-21 2016-12-13 Google Inc. Providing contextual data for selected link units
US9442944B2 (en) * 2013-11-12 2016-09-13 Dropbox, Inc. Content item purging
US11321559B2 (en) * 2019-10-17 2022-05-03 Adobe Inc. Document structure identification using post-processing error correction
US11386685B2 (en) 2019-10-17 2022-07-12 Adobe Inc. Multiple channels of rasterized content for page decomposition using machine learning

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4358824A (en) * 1979-12-28 1982-11-09 International Business Machines Corporation Office correspondence storage and retrieval system
JPS61220027A (ja) * 1985-03-27 1986-09-30 Hitachi Ltd 文書ファイリングシステム及び情報記憶検索システム
US5123103A (en) * 1986-10-17 1992-06-16 Hitachi, Ltd. Method and system of retrieving program specification and linking the specification by concept to retrieval request for reusing program parts
US4972349A (en) * 1986-12-04 1990-11-20 Kleinberger Paul J Information retrieval system and method
EP0280866A3 (de) * 1987-03-03 1992-07-08 International Business Machines Corporation Rechnerverfahren zum automatischen Ziehen von Informationen, die in einer Handelskorrespondenz allgemein spezifiziert sind
GB8719572D0 (en) * 1987-08-19 1987-09-23 Krebs M S Sigscan text retrieval system
US4992972A (en) * 1987-11-18 1991-02-12 International Business Machines Corporation Flexible context searchable on-line information system with help files and modules for on-line computer system documentation
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JP2783558B2 (ja) * 1988-09-30 1998-08-06 株式会社東芝 要約生成方法および要約生成装置
US4958284A (en) * 1988-12-06 1990-09-18 Npd Group, Inc. Open ended question analysis system and method
US5099426A (en) * 1989-01-19 1992-03-24 International Business Machines Corporation Method for use of morphological information to cross reference keywords used for information retrieval

Also Published As

Publication number Publication date
EP0472026B1 (de) 1999-02-10
EP0472026A3 (en) 1993-06-30
DE69130883D1 (de) 1999-03-25
JP2895184B2 (ja) 1999-05-24
JPH04102171A (ja) 1992-04-03
EP0472026A2 (de) 1992-02-26
US5307266A (en) 1994-04-26

Similar Documents

Publication Publication Date Title
DE69130883T2 (de) Informationsverarbeitungssystem und Verfahren für die Verarbeitung von Dokumenten mit strukturierten Schlüsselwörtern
DE69725258T2 (de) System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen
DE3650736T2 (de) Informationswiederauffindungsverfahren
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE69606021T2 (de) Verfahren und/oder vorrichtungen für den zugriff auf informationen
DE69432575T2 (de) Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
DE69834386T2 (de) Textverarbeitungsverfahren und rückholsystem und verfahren
EP1311989B1 (de) Verfahren zur automatischen recherche
DE69526168T2 (de) Verfahren und Gerät zur Klassifikation von Dokumentinformationen
DE60314631T2 (de) Suchmethode für Metadaten und Vorrichtung, welche die Indizes von Metadaten verwendet
DE69934371T2 (de) Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
DE69426714T2 (de) Dokumentverarbeitungsverfahren und Gerät
DE3856313T2 (de) Anpassungsprogramm zum Datenaustausch zwischen Objekten in einem objektbasierten Datenverarbeitungssystem
DE60226232T2 (de) Inhaltsverwaltungssystem
DE60029845T2 (de) System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung
DE69614771T2 (de) Gerät zur Übersetzung von Sätzen einer Konversation, das dem Benutzer die freie Eingabe des zu übersetzenden Satzes erlaubt
DE69129107T2 (de) Automatisches übersetzungs-und fernübertragungssystem
DE69616391T2 (de) System zum Wiederauffinden und zum Anzeigen von Dokumenten mit einer Übersetzungsfunktion
DE69024932T2 (de) Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren
DE69631457T2 (de) Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung
DE69618864T2 (de) Informationsverwaltungseinrichtung zum effizienten Verwalten von Multimedia-Titeln in einem Klient-Server-Netzwerk
DE69530595T2 (de) System und verfahren für die x.500-datenbanknorm
DE3901485A1 (de) Dokumenten-wiedergewinnungssystem
DE19751570A1 (de) Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer

Legal Events

Date Code Title Description
8339 Ceased/non-payment of the annual fee