DE69024932T2 - Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren - Google Patents

Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren

Info

Publication number
DE69024932T2
DE69024932T2 DE69024932T DE69024932T DE69024932T2 DE 69024932 T2 DE69024932 T2 DE 69024932T2 DE 69024932 T DE69024932 T DE 69024932T DE 69024932 T DE69024932 T DE 69024932T DE 69024932 T2 DE69024932 T2 DE 69024932T2
Authority
DE
Germany
Prior art keywords
document
documents
relationship
vector
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69024932T
Other languages
English (en)
Other versions
DE69024932D1 (de
Inventor
Marvin L Williams
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE69024932D1 publication Critical patent/DE69024932D1/de
Publication of DE69024932T2 publication Critical patent/DE69024932T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

  • Diese Erfindung bezieht sich auf ein Verfahren des Verwaltens von Dokumenten in einem Informationsverarbeitungssystem und insbesondere auf ein Verfahren des schnellen Kennzeichnens von Dokumenten, welche dieselben Attribute in einer gemeinsam benutzten Bibliothek aufweisen.
  • Vorgeschichte der Erfindung
  • Das elektronische Büro führte zum Zusammenfassen von Dokumenten in Beziehungen, die dazu vorgesehen sind, das elektronische Speichern, Suchen und Abfragen der Dokumente zu unterstützen. Die Verwendung von Dokumentbibliotheken stellt eine Technik dar, um dieses Bedürfnis zu erfüllen. Wie zur Zeit implementiert, bieten diese Dokumentbibliotheken Funktionen, die dem manuellen Ablegen und Abrufen von Papierdokumenten analog sind, jedoch auf eine viel weniger beschwerliche Art. Eine Struktur des Standes der Technik, die das Bedürfnis nach elektronischem Speichern, Suchen und Abfragen von Dokumenten erfüllt, ist die Dokumentaustauscharchitektur (Document Interchange Architecture, DIA), die Teil eines Bürosystems ist, das durch International Business Machines Corporation vertrieben wird. Die DIA-Dokumentstruktur liefert einen Satz von Deskriptoren für jedes Dokument, das in einer Bibliothek abgelegt ist. Diese Deskriptoren werden in Dokumentprofilen angeordnet und mit den Dokumenten abgelegt. Die Dokumentprofile enthalten Parameter, welche den Inhalt der Dokumente kennzeichnen, wie z.B. den Namen, unter dem es abgelegt ist, die Autoren, das Thema, das es umfaßt, und das Datum, an dem es in der Dokumentbibliothek abgelegt wurde.
  • Die Dokumentprofile werden beim Suchen nach Dokumenten in der Dokumentbibliothek verwendet. Zum Beispiel kann ein Anwender alle Dokumente, welche die Bibliothek zwischen zwei Zeitpunkten empfing, nach einem speziellen Thema von einem bestimmten Autor abfragen. Zum Abschluß der Suche würde dem Anwender eine Liste von Dokumenten gegeben, welche die Suchkriterien erfüllten. Ein Anwender oder Endbenutzer kann eine Person, eine Einheit, ein Programm oder ein Computersystem sein, das die Bibliothek zur Datenverarbeitung und zum Informationsaustausch verwendet.
  • Zusätzlich zum Abfragen von Dokumenten basierend auf speziellen Suchkriterien dient der DIA-Dokumentbibliotheksservice dem Aufbau von Beziehungen zwischen Dokumenten. Diese Dokumentbeziehungen wurden ursprünglich von M.G. Macphail erdacht und in der anhängigen EPO-Anmeldung S.N. 89310909.0 offenbart.
  • Ein Beispiel einer solchen Dokumentbeziehung ist das Konzept der Ordnerdokumente. Ein Ordnerdokument wird erzeugt, wenn ein Anwender Dokumente zu einer linearen oder hierarchischen Struktur zusammenfaßt. Dokumente nehmen eine lineare Struktur an, wenn sie durch Anordnen eines Satzes von Dokumenten an einer benutzerspezifizierten Position innerhalb eines speziellen Ordners organisiert sind. Dokumente können eine hierarchische Struktur annehmen, indem sie Dokumente, die Ordner sind, verschachteln, oder einfacher, sie setzen ein Dokument, das selbst ein Ordner ist, in ein anderes Dokument, das ein Ordner ist. Jedes Dokument in einem Ordner hat ungeachtet seiner Beziehung zu anderen Dokumenten getrennte Dokumentdefinitionen einschließlich Deskriptoren, Zugriffssteuerung und Dokumentinhalt. Daher veranlaßt der Zugriff auf ein Dokument, das innerhalb einer speziellen Beziehung enthalten ist, nichts hinsichtlich des Zugriffs auf andere Dokumente innerhalb derselben Beziehung. Alle Dokumente in der DIA-Dokumentbibliothek haben ein ihnen zugeordnetes Bibliothekmodellobjekt, genannt Dokumentbeziehungsobjekt, das die Dokumentbeziehungen beschreibt. Daher muß, wenn es ein Bedürfnis gibt, auf einen Ordner zuzugreifen, auf jedes Dokumentbeziehungsobjekt für jedes Dokument in einem Ordner zugegriffen werden, um die vollständige Beziehung zwischen den Dokumenten zu bestimmen.
  • Ein anderes Beispiel einer Dokumentbeziehung, die in einer DIA- Bibliothek gestattet ist, ist die Heftbeziehung. Die Heftbeziehung gestattet einem Anwender, zwei Dokumente zusammenzuschließen. Heftbeziehungen liefern eine eng verbundene, gesteuerte Eins-zu-Eins-Dokumentbeziehung zwischen Dokumenten. Zusätzlich können die gehefteten Dokumente innerhalb eines Ordnerdokumentes angeordnet werden. Das Dokumentbeziehungsobjekt für jedes der Dokumente, wie vorher für Ordnerdokumente beschrieben, muß die Beziehung zwischen den gehefteten Dokumenten ebenso wie die Beziehung zwischen den Ordnerdokumenten beschreiben. Somit enthält jedes Dokument innerhalb der Beziehung seine eigenen speziellen Attribute, wie z.B. Sprache, Dokumenttyp, Zeichensätze und andere Profilinformationen, welche die Eigenschaften des Dokumentes selbst beschreiben. Falls zum Beispiel alle Dokumente in einer Beziehung in Französisch verfaßt wurden, würde jedes Dokument Profilinformationen haben, die kennzeichnen, daß das Dokument in Französisch war.
  • Jeder Anwender, der versucht, auf die Dokumente zuzugreifen, die durch die Beziehung definiert sind, würde das Profil jedes Dokumentes lesen und entschlüsseln müssen, um die Attribute aller Dokumente innerhalb der Beziehung zu bestimmen. Was folglich benötigt wird, ist ein Mittel, um die Attribute einmal anzugeben und alle Dokumente innerhalb einer Beziehung zu kennzeichnen, die diese speziellen Attribute enthalten.
  • Die Europäische Patentanmeldung EP-A-0 229 232 von Tektronix mit dem Titel "File Management System" offenbart ein Dateiverwaltungssystem, in dem ein Datenspeicher- und Abfrage-Hilfsprogramm Datendateien integriert, die von unabhängigen Datenverarbeitungsoperationen durch das Verbinden von Datendateien gemäß anwenderdefinierbaren Beziehungen erzeugt werden. Anwender können Datendateien und ihren Verbindungen Attribute zuordnen und damit Gruppen von Dateien und Verbindungen mit ausgewählten Attributen kennzeichnen.
  • Die US-Patentanmeldung US-A-4 817 036 von R.P. Millet mit dem Titel "Computer System and Method for Data Base Indexing and Informational Retrieval" offenbart einen Mechanismus und ein Verfahren, um das Durchsuchen und Abfragen von Datensätzen auf der Basis von Schlüsselworten zu unterstützen. Noch spezieller untersucht Miliet ein Verfahren des Indizierens einzelner Datensätze innerhalb einer Datenbank und des schnellen Suchens und Abfragens ausgewählter Datensätze zu einem oder mehreren Schlüsselworten. Jedoch kann der ursprüngliche Datensatz nicht direkt abgefragt werden, um die Beziehung zu bestimmen.
  • Die US-Patentanmeldung US-A-4 803 614 von Hitachi mit dem Titel "System for retrieving distributed information in a data base" offenbart ein verteiltes Informationsabfragesystem, in dem der zentrale Computer mit einer Vielzahl von Endeinrichtungen verbunden ist und die Verwaltungsinformation einen Satz von Abfrageschlüsseln umfaßt. Damit eine Einheit zum Abfragen einer Abbilddatei einen Satz zugeordneter Dokumente extrahiert, werden allgemeine Elemente, wie z.B. ein Titel und ein Schlüsselwort, in jedes Dokument eingeschlossen, und die allgemeinen Elemente werden als Abfrageschlüssel in der Steuerinformation für den Satz zugeordneter Dokumente aufgezeichnet, wodurch sie die Abfrage der Dokumente durch Verwendung der allgemeinen Elemente gestatten.
  • Die US-Patentanmeldung US-A-4 811 199 von W.L. Kuechler mit dem Titel "System for Storing and Manipulating Information in an Information Base" offenbart, daß es zwei Verfahren zum Kennzeichnen von Datensätzen gibt, die bestimmte Attribute haben. Das erste ist das Ausführen eines erschöpfenden iterativen Durchsuchens jedes Datensatzes der Datenbank. Das zweite ist das Speichern duplizierter Werte ausgewählter Attribute (die einer entsprechenden Datensatzadresse zugeordnet sind) für alle Datensätze in einer spezialisierten Datenstruktur (Index), die für den schnellen Zugriff auf Werte entworfen wurde.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Diese Erfindung wird in Anspruch 1 definiert. Sie bezieht sich auf ein Verfahren des Verringerns der Speicheranforderungen und der Komplexität in einem Dokumentverwaltungssystem, wenn Attribute gekennzeichnet werden, die mehrmals in einer Vielzahl von Dokumenten auftreten. Dokumentverwaltungssysteme speichern Attribute wie z.B. Sprache, Dokumenttyp und Zeichensätze mit dem Dokumentinhalt. Wenn einzelne Dokumente mit anderen Dokumenten kombiniert werden, um Beziehungen, wie z.B. Ordner oder geheftete Dokumente zu erzeugen, muß jedes einzelne Dokument abgefragt werden, um seine Attribute zu bestimmen. Diese Erfindung offenbart ein vektorrelationales bezeichnendes Objekt, das erzeugt wird, wenn eine Beziehung zwischen zwei oder mehr Dokumenten definiert wird. Dieses vektorrelationale bezeichnende Objekt umfaßt ein Feld, um ein spezielles Attribut für mindestens ein Dokument in der Beziehung zu kennzeichnen. Das vektorrelationale bezeichnende Objekt steht Dokumentzugriffsmechanismen zur schnellen Bestimmung von Dokumentattributen zur Verfügung, ohne daß das Bedürfnis nach Scannen jedes einzelnen Dokumentes in der Beziehung nach seinen Attributen besteht.
  • Kurze Beschreibung der Zeichnungen
  • Figur 1 ist ein Blockdiagramm eines Dokumentverwaltungssystems, in dem diese Erfindung angewendet werden könnte.
  • Figur 2 ist ein Basisdokumentmodell, das für jedes Dokument erzeugt wird, das in der Bibliothek des in Figur 1 gezeigten Systems abgelegt wird.
  • Figur 3 ist ein Blockdiagramm einer Dokumentbeziehung, welches das Konzept der Ordnerdokumente darstellt.
  • Figur 4 ist ein Blockdiagramm einer Ordnerbeziehung, das einen Ordner in einem anderen Ordner zeigt.
  • Figur 5 ist ein Blockdiagramm einer Heftbeziehung.
  • Figur 6 ist ein Blockdiagramm gehefteter Dokumente innerhalb eines Ordners.
  • Figur 7 zeigt das Basisdokumentmodell von Figur 2 und außerdem das vektorrelationale bezeichnende Objekt gemäß dem Verfahren der Erfindung.
  • Figuren 8 und 9 sind Strukturen für ein Feld in dem vektorrelationalen bezeichnenden Objekt.
  • Figur 10 ist ein Flußdiagramm, das zeigt, wie das vektorrelationale bezeichnende Objekt innerhalb eines Dokumentaustausch-Verwaltungssystems von Figur 1 verwendet werden kann.
  • Detaillierte Beschreibung
  • Figur 1 zeigt ein Dokumentverwaltungssystem zum Verwalten von Dokumenten in einem Informationsverarbeitungssystem. Ein Anwender 20 ist berechtigt, Dokumente zu speichern und von Bibliothek 28 abzufragen. Auf die Bibliothek 28 kann gleichzeitig von anderen Anwendern zugegriffen werden und sie stellt daher eine gemeinsam benutzte Bibliothek dar. Anders als die Bibliothek 28 werden persönliche oder private Dokumente eines Anwenders im lokalen Dokumentspeicher 24 gespeichert. Dieser lokale Dokumentspeicher 24 wird gewöhnlich nicht mit anderen Anwendern gemeinsam benutzt. Ein Anwender 20 greift auf seinen lokalen Dokumentspeicher 24 durch den Verwalter/Anforderer 22 zu. Der Verwalter/Anforderer 22 ist auch mit dem Bibliotheksserver 26 verbunden, der den Zugriff des Nutzers auf die Bibliothek 28 steuert. Wenn ein Anwender 20 ein Dokument in der Dokumentbibliothek 28 ablegt, muß der Bibliotheksserver 26 Parameter oder Deskriptoren aufbauen, die den Inhalt der gerade in der Bibliothek gespeicherten Information beschreiben.
  • Es wird auf Figur 2 Bezug genommen, dort wird ein Basisdokumentmodell für Informationen gezeigt, die in der in Figur 1 gezeigten Bibliothek 28 gespeichert sind. Dieses Dokumentmodell wird von dem Bibliotheksserver 26 erzeugt und mit jedem Dokument gespeichert. Während es nicht notwendig ist, das Basisdokumentmodell ausdrücklich so zu implementieren, daß die DIA-Bibliothekdienstarchitektur unterstützt wird, gibt es die Anforderung, daß ein Entwurf diesen Modellen oder einer Untergruppe von ihnen zugeordnet wird.
  • Das Anwenderprofilobjekt 36 (User Profile Object, UPO) ist nicht Teil des DIA-Dokumentmodells, sondern es ist stattdessen ein Objekt, auf das sich das DIA-Dokumentmodell bezieht. Das Anwenderprofilobjekt 36 wird erzeugt, wenn die Anwender, die es darstellen, angemeldete Mitglieder eines Bürosystemnetzes sind. Es kennzeichnet einen Anwender und enthält Informationen über den Anwender, wie z.B. Alias-Namen, dem Anwender genehmigte Dienste, Standardabrechnungsinformationen und andere anwenderspezifische Informationen.
  • Das Dokumentmodellobjekt 30 ist das Herzstück des DIA-Dokumentmodells und ist logisch das erste erzeugte Objekt, wenn ein Dokument zum ersten Mal in einer Dokumentbibliothek abgelegt wird. Es umfaßt Informationen bezüglich Eigentümer und Attributen eines speziellen Dokumentes. Insbesondere umfaßt es Dokumentexemplarattribute, wie z.B., ob das Dokument editierbar oder nichteditierbar ist; die maximale Anzahl von Versionen; und die auszuführende Aktion, falls der Anwender versucht hat, ein Dokument zu editieren, das nicht editiert werden kann. Außerdem kann das Dokumentmodellobjekt 30 irgendwelche der folgenden Informationen beinhalten:
  • 1) Dokumentstufen-Sperrinformationen, die den Nutzer anzeigen, der ein Dokument zum Aktualisieren aus der Bibliothek entnommen hat;
  • 2) Anzeigen, daß ein Dokumentinhalt von der direkten Steuerung des Bibliotheksservers entfernt wurde;
  • 3> Anweisungen an einen Bibliotheksadministrator, um Teile eines Dokumentes von der Bibliothekdienststeuerung zu entfernen oder Teile wiederherstellen;
  • 4) Zeit- und Datuminformationen, die der direkten Steuerung des Bibliotheksservers entzogen wurden;
  • 5) Position der Information, die der direkten Steuerung des Bibliotheksservers entzogen wurde; und
  • 6) Wahlfreie Informationen für Archivierungszwecke.
  • Das Zugriffssteuermodellobjekt 32 (Access Control Model Object, ACMO) wird erzeugt, wenn ein Dokument zum erstenmal in eine DIA- Bibliothek abgelegt wird. Der prinzipielle Zweck des Zugriffssteuermodellobjektes 32 soll Informationen zusammenfassen, die beim Bestimmen des Zugriffs durch einen Nicht-Eigentümer auf das Dokument zu verwenden sind. Es beinhaltet Zugriffssteuerinformationen, wie z.B., ob auf das Dokument von jedermann zugegriffen werden kann (öffentlich), ob der Zugriff für eine begrenzte Zahl ausdrücklich gekennzeichneter Anwender gestattet ist (privat) oder ob die Informationen mit anderen gemeinsam benutzt werden. Das Zugriffssteuermodellobjekt 32 beinhaltet auch Informationen, welche das Aufbewahren und Vernichten des Dokumentes regeln.
  • Das Dokumentprotokollobjekt 34 (Document History Log Object, DHLO) wird wahlfrei erzeugt, wenn ein Dokument in der Bibliothek abgelegt wird und der Anwender verschiedene Aktivitäten in dem Dokument aufzeichnen möchte. Zum Beispiel kann ein Anwender aufzeichnen wollen, wievielmal und von wem das Dokument gelesen wurde.
  • Das Dokumentbeziehungsobjekt 42 (Document Relation Object, DRO) wird erzeugt, wenn ein Dokument erstmalig in der Bibliothek abgelegt wird. Sein Zweck ist es, die logischen Beziehungen zwischen einem Dokument und anderen verknüpften oder gruppierten Dokumenten zu beschreiben. Zum Beispiel gestattet die DIA-Architektur die Erzeugung von Ordnerdokumenten, die andere Dokumente beinhalten. Wenn eine solche Beziehung existiert, dann hat jedes Dokument, das innerhalb des Ordners enthalten ist, in dem Dokumentbeziehungsobjekt 42 einen Zeigereintrag, der Bibliothekzugeordneter Dokumentname (Library Assigned Document Name, LADN) genannt wird.
  • Das Versionssteuerobjekt 40 (Version Control Object, VCO) wird erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt wird, und es enthält Informationen für mehrere Objekte, die eine einzeln benannte Version eines Dokumentes umfassen können. Es stellt Platz für Versionsbenennung, Versionsstufensperren und andere versionsbezogene Stufenprozeßsteuerungen zur Verfügung.
  • Das Profilinhaltobjekt 44 (Profile Content Object, PCO) wird erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt wird und ein Nutzer Teilobjekte zur Ausführung oder aus anderen Gründen erzeugen will. Das Profilinhaltobjekt 44 ist das Repository für Profilinformationen bezüglich der Teilobjekte.
  • Das Dokumentinhaltobjekt 46 (Document Content Object, DCO) wird erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt wird, und liefert Speicherplatz für den Dokumentinhalt. Zusätzlich liefert das Dokumentinhaltobjekt 46 Speicherplatz zum Sichern von Informationen bezüglich der tatsächlichen Größe des Dokumentes in verschiedenen Maßeinheiten.
  • Das Suchindexobjekt 48 (Search Index Object, SIO) enthält Einträge, die beim Suchen innerhalb eines Dokumentes verwendet werden. Die Einträge werden in dem SIO als ein Ergebnis der nachstehenden Folge von Aktionen an anderen Objekten angeordnet. Das Basisdokumentmodellobjekt 30 wird zuerst im Rahmen der Verarbeitung eines FILE-Befehls erzeugt. Der Bibliotheksserver liest dann das Profilinhaltobjekt 44, das Dokumentbeziehungsobjekt 42 und das Zugriffssteuermodellobjekt 32, um Ausdrücke zu finden, die zur Unterstützung eines parametrischen SEARCH (Suchen) zu verwenden sind. Wenn jeder Suchausdruck gekennzeichnet ist, erfolgt ein Eintrag in das Suchindexobjekt 48, dessen Name den Wert des parametrischen Suchausdrucks und die Semantik umfaßt. Falls kein SIO 48 besteht, wenn der Bibliotheksserver die obenerwähnten Objekte liest, wird eines erzeugt und die Einträge werden darin angeordnet, als ob das Suchindexobjekt 48 schon immer bestand.
  • Das Indexobjekt für umgekehrte Suche 38 (Reverse Search Index Object, RSIO) besteht, um das Beseitigen von Einträgen des Suchindexobjektes 48 zu unterstützen, wenn ein Dokument durch einen Befehl DELETE (Löschen) aus der Bibliothek entfernt wird. Einträge für parametrische Suchausdrücke werden zur selben Zeit in dem RSIO 38 angeordnet, zu der sie in dem Suchindexobjekt 48 erfolgen.
  • Es wird Bezug auf Figur 3 genommen, dort wird eine Dokumentbeziehung gezeigt, die einen Ordner darstellt. Dokument A (56) und Dokument B (54) stellen einzelne Elemente dar, die im Ordnerdokument 1 (50) enthalten sind. Dokument A (56) ist auch zusammen mit Dokument C (58) im Ordnerdokument 2 (52) enthalten. Ordnerdokument 1 (50) und Ordnerdokument 2 (52) könnten einzelne Personalhüllen sein und Dokument A (56) könnte ein Dokument sein, das eine persönliche Richtlinie erklärt. Es wird nur eine gegenwärtige Kopie von Dokument A 56 benötigt und diese Kopie ist stets durch die Personalhüllen konsistent. Die Beziehung zwischen den Dokumenten und den Ordnern ist in dem Dokumentbeziehungsobjekt (DRO) enthalten. Zugriff auf die Dokumente in jedem Ordner erfordert den Zugriff des Bibliotheksservers auf das Dokumentbeziehungsobjekt jedes Dokumentes, um die Beziehung zu bestimmen.
  • Es wird sich Figur 4 zugewendet, dort wird eine Erweiterung des Dokumentes in einem Ordnerkonzept gezeigt, um einen Ordner in einem Ordner einzuschließen. Dokument A (56) und Dokument B (54) sind Elemente im Ordnerdokument 2 (52). Das Ordnerdokument 2 (52) wird dann in das Ordnerdokument 1 (50) eingeordnet. Zum Beispiel kann das Ordnerdokument 1 (50) ein Firmenmeinungsumfragebericht sein, während Dokument 2 (52) der Austin-Umfragebericht sein kann. Dokument A (56) und Dokument B (54) können Umfrageberichte von zwei verschiedenen Gebieten in Austin sein. Wieder muß jedesmal, wenn der Bibliotheksserver auf die Dokumente zugreift, die in dieser Beziehung gezeigt sind, das Dokumentbeziehungsobjekt für jedes der Elemente geprüft werden.
  • Es wird auf Figur 5 Bezug genommen, dort wird eine andere Dokumentbeziehung gezeigt, bei der ein Dokument an ein anderes geheftet wird. Dokument 1 (60) wird an Dokument 2 (62) geheftet, das an Dokument 3 (64) geheftet wird. Die Heftbeziehung gestattet dem Anwender, auf zwei Dokumente zusammenzuschließen. Das Dokumentbeziehungsobjekt (DRO) für jedes Dokument enthält den aktuellen Zustand der Beziehung.
  • Weitere Beispiele verschiedener Kombinationen von Heft- und Ordnerbeziehungen sind in Figur 6 gezeigt. Dokument 1 (60) und Dokument 2 (62) können zusammengeheftet werden und im Ordnerdokument 1 (50) zusammen mit Dokument 4 (66) angeordnet werden. Auf die gleiche Art kann Dokument 3 (64) an Dokument 2 (62) geheftet werden und im Ordnerdokument 2 (52) angeordnet werden. Ein Dokument 5 (68) ist ebenfalls im Ordnerdokument 2 (52) enthalten. Jedes Dokument innerhalb des Ordners enthält seine eigenen speziellen Attribute, wie z.B. Sprache, Dokumenttyp, Zeichentyp, Zeichensätze und andere Profilinformationen, welche die Merkmale des Dokumentes selbst beschreiben. Um auf Dokumente innerhalb des Ordners zuzugreifen, muß der Bibliotheksserver das Profil jedes Dokumentes lesen und entschlüsseln, um die Attribute aller Dokumente innerhalb der Beziehung zu bestimmen. Falls zum Beispiel alle Dokumente in der Beziehung in Französisch verfaßt wurden, würde jedes Dokument Profilinformationen haben, die kennzeichnen, daß das Dokument in Französisch war. Diese Erfindung beseitigt die Probleme der Notwendigkeit des Speicherns dieser Attributinformation in jedem Dokument durch die Erzeugung eines "vektorrelationalen bezeichnenden Objektes" (Vector-Relational Characteristical Object, VRCO)
  • Es wird sich Figur 7 zugewendet, dort wird das Basisdokumentmodell für die DIA-Dokumentbibliotheksdienste mit dem vektorrelationalen bezeichnenden Objekt 70 (VRCO) dieser Erfindung gezeigt. Das VRCO 70 enthält Felder, um ein spezielles Attribut zu kennzeichnen, das für mindestens eines der Dokumente in einer Beziehung besteht. Die Felder werden von Bezeichnern gefolgt, welche die Dokumente eindeutig kennzeichnen, welche die speziellen Attribute besitzen.
  • Figuren 8 und 9 sind typische Beispiele dafür, wie die Felder in dem VRCO 70 erscheinen. Es wird auf Figur 8 Bezug genommen, falls die Dokumente 1, 2 und 3 alle Attribut X besitzen und die Dokumente 1, 2 und 6 Attribut Y, würde das vektorrelationale bezeichnende Objekt (VRCO) die Felder beinhalten, die in Figur 8 gezeigt sind. Es besteht keine Notwendigkeit, in dem Profil jedes der Dokumente die Attribute X und Y zu kennzeichnen, da das VRCO die Informationen bereits enthält. Das Auftreten eines neuen Attributes zeigt das Ende aller Dokumente an, die das vorherige Attribut besitzen. Diese Erfindung gestattet dem Bibliotheksserver, schnell auf die Attribute von Dokumenten zuzugreifen, die in Beziehungen zueinander stehen, wenn sie von einer Anwendung durch Lesen des VRCO angefordert werden. Daher kann die Beziehung der Dokumente zueinander schnell erreicht werden, wenn solche Beziehungen in dem VRCO gespeichert sind. Das Konzept des Anordnens von Attributen/Merkmalen, die schnellen Zugriff in einem VRCO erfordern, wird in dem folgenden Beispiel noch besser gezeigt. Es wird angenommen, daß eine Anwendung nur in der Lage war, einen speziellen Zeichensatz für den Inhalt eines Dokumentes zu verstehen. Die Anwendung könnte schnell das VRCO überfliegen, wobei sie prüft, ob es Dokumente gibt, die den speziellen Zeichensatz besitzen. Die Anwendung könnte dann dem Anwender nur diese Dokumente zur Präsentation zeigen und Dokumente, welche die Anwendung nicht unterstützt, ignorieren oder löschen. Daher gestattet diese Erfindung, daß Anwendungen schnell Ressourcen für Dokumente freigeben, die Merkmale besitzen, welche die Anwendung nicht unterstützen kann.
  • Das vektorrelationale bezeichnende Objekt (VRCO) kann auch einen Wert VECTOR-BASE (Vektor-Basis) enthalten, um zu kennzeichnen, ob der Vektor außerhalb eines Attributes oder außerhalb des Dokumentbezeichners angeordnet werden soll. Figur 9 stellt noch besser dar, wie die Felder in dem VRCO erscheinen würden. Das Feld VECTOR-BASE enthält einen Wert, um anzuzeigen, ob der Vektor außerhalb der Dokumentbezeichner oder der Dokumentattribute angeordnet wird. Dokument 1 hat die Attribute X, Y und Z, und Dokument 2 hat das Attribut Y. Die Variabilität des Anordnens des Vektors außerhalb des Dokumentes kann Speicherplatz sparen, wenn die Zahl der Dokumente relativ groß ist, bezogen auf die Zahl der definierten Attribute, wie in Figur 9 gezeigt.
  • Es wird auf Figur 19 Bezug genommen, dort wird ein Flußdiagramm für die Nutzung des vektorrelationalen bezeichnenden Objektes gezeigt. In Schritt 71 entscheidet ein Anwender, eine Beziehung zwischen Dokument A und Dokument B zu erzeugen. Zuerst wird in Schritt 72 bestimmt, ob Dokument A ein VRCO hat. Falls Dokument A bereits ein VRCO hat, bestimmt man als nächstes in Schritt 74, ob Dokument B ein VRCO besitzt. In Schritt 76 werden, falls beide Dokumente schon ein vektorrelationales bezeichnendes Objekte enthalten, alle Attribute in Dokument B gekennzeichnet, die nicht in Dokument A sind. Die VRCO-Analyse wird durch das Modifizieren des VRCO von Dokument A vervollständigt, Schritt 78, um die neue Beziehung zwischen den Dokumenten widerzuspiegeln. Es wird nur ein VRCO bestehen, um die Beziehung zwischen den Dokumenten zu definieren.
  • Falls der Anwender nach der Entscheidung, eine Beziehung zwischen Dokument A und Dokument B zu bilden, herausfindet, daß kein VRCO für Dokument A existiert, erfordert Schritt 84 eine Bestimmung, ob für Dokument B ein VRCO existiert. Wenn für Dokument B herausgefunden wird, daß es ein VRCO hat, wird die Profilinformation in Schritt 86 von Dokument A extrahiert und in dem VRCO von Dokument B angeordnet. Attribute von Dokument A werden ebenfalls in Schritt 88 gekennzeichnet und in dem VRCO von Dokument B angeordnet. Schließlich wird das VRCO von Dokument B in Schritt 90 modifiziert, um die Attribute in Dokument A widerzuspiegeln. Dieses Verfahren liefert ein VRCO pro Beziehung. Ungeachtet dessen, wie viele Dokumente in der Beziehung erzeugt werden, besteht nur ein VRCO für die Beziehung. Dies verringert die Menge des Speicherplatzes bedeutend, die notwendig ist, um Attribute eines Dokumentes zu halten.
  • Auf die gleiche Art werden, falls ein VRCO für Dokument A besteht und für Dokument B nicht besteht, Profilinformationen in Schritt 82 von Dokument B extrahiert. Attribute werden in Dokument B gekennzeichnet, Schritt 80, und das VRCO für Dokument A wird modifiziert, um die neue Beziehung zwischen den Dokumenten in Schritt 78 widerzuspiegeln.
  • Falls schließlich kein Dokument ein ihm zugeordnetes VRCO hat, erfordert Schritt 73 die Erzeugung eines VRCO für Dokument A. In Schritt 82 wird die Profilinformation von Dokument B extrahiert und in dem VRCO angeordnet. In Schritt 80 werden Attribute für Dokument B gekennzeichnet und in dem VRCO angeordnet. In Schritt 78 wird das VRCO für Dokument A modifiziert, um die neuen Beziehungen zwischen Dokument A und Dokument B widerzuspiegeln.
  • Zusammenfassend offenbart diese Erfindung ein Verfahren des Kennzeichnens von Dokumentattributen, wenn eine Mehrzahl von Dokumenten in eindeutigen Dokumentbeziehungen kombiniert ist. Diese Dokumentbeziehungen umfassen Ordner, Heftdokumente, ver schiedene Kombinationen der Ordner- und Heftkonzepte oder irgendeine Beziehung, bei der Dokumente innerhalb einer Beziehung mindestens ein gleiches Attribut enthalten. Ein vektorrelationales bezeichnendes Objekt (VRCO) wird dem Satz von Objekten hinzugefügt, die das Basisdokumentmodell bilden, wie in der Dokumentaustauscharchitektur (DIA) implementiert. Das vektorrelationale bezeichnende Objekt steht Dokumentzugriffsmechanismen zur Verfügung und enthält Felder, um die Attribute einmal für jedes Dokument in einer Beziehung zu kennzeichnen. Das VRCO verringert die Speicherplatzanforderungen, indem nur einmal Speicherplatz für das Attribut bereitgestellt wird, wenn die Dokumentbeziehungen erzeugt werden. Das VRCO enthält ein Feld, um ein spezielles Attribut zu kennzeichnen, das für mindestens eines der Dokumente in der Beziehung existiert. Das Feld wird dann von einem Bezeichner gefolgt, der das Dokument eindeutig kennzeichnet, welches das spezielle Attribut besitzt. Da das Attribut nur einmal und in einem einzelnen Objekt gespeichert wird, kann man schnell darauf zugreifen, um zu bestimmen, ob ein Attribut für ein spezielles Dokument existiert.

Claims (1)

1. Verfahren zum Identifizieren von Dokumenten mit einem bestimmten Dokumentattribut, das sich aus einer Entstehung einer Dokumentbeziehung ergibt, insbesondere einer Ordnerbeziehung zum Gruppieren von Dokumenten in eine lineare oder hierarchische Struktur, einer Referenzbeziehung zum Zusammenschließen von Dokumenten, einer Kombination beider oder irgendeiner Beziehung, bei der Dokumente innerhalb der Beziehung mindestens ein Attribut enthalten, das bei einem ersten Dokument A und einem zweiten Dokument B, die in einer gemeinsam benutzten Bibliothek (28) innerhalb eines Dokumentverwaltungssystems (22, 24, 26) gespeichert sind, gleich ist, wobei die gemeinsam benutzte Bibliothek (28) eine Mehrzahl von Dokumenten aufweist, auf die durch einen Anwender (20) zugegriffen wird, wobei eine Mehrzahl von Dokumentattributen für jedes Dokument in einem entsprechenden Profilobjekt (30) gespeichert ist, wobei das Verfahren den folgenden Schritt umfaßt:
durch den Anwender (20) entscheiden, die Dokumentbeziehung zwischen dem ersten Dokument A und dem zweiten Dokument B zu erzeugen (71), wobei das Verfahren dadurch gekennzeichnet ist, daß es die folgenden weitereh Schritte umfaßt:
Abfragen des ersten Dokumentes A und des zweiten Dokumentes B von der gemeinsam benutzten Bibliothek (28) und Entfernen der Mehrzahl der Dokumentattribute von den Profilobjekten (30) des ersten Dokumentes A und des zweiten Dokumentes B,
Erzeugen eines vektorrelationalen bezeichnenden Objektes (70), das für jedes der Dokumentattribute des ersten Dokumentes A und des zweiten Dokumentes B ein Feld umfaßt, um das Dokumentattribut zu identifizieren, das für mindestens eines der Dokumente in der Beziehung besteht, und das eine Kennung umfaßt, um mindestens ein Dokument, welches das Dokumentattribut besitzt, eindeutig zu identifizieren, und
Zuordnen des vektorrelationalen bezeichnenden Objektes (70) zu mindestens einem des ersten Dokumentes A und des zweiten Dokumentes B und Speichern des vektorrelationalen bezeichnenden Objektes in der gemeinsam benutzten Bibliothek (28), wobei zum Identifizieren von Dokumenten mit dem bestimmten Dokumentattribut das vektorrelationale bezeichnende Objekt (70) gesucht wird.
DE69024932T 1989-12-19 1990-10-17 Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren Expired - Fee Related DE69024932T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/454,797 US5162992A (en) 1989-12-19 1989-12-19 Vector relational characteristical object

Publications (2)

Publication Number Publication Date
DE69024932D1 DE69024932D1 (de) 1996-02-29
DE69024932T2 true DE69024932T2 (de) 1996-08-08

Family

ID=23806139

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69024932T Expired - Fee Related DE69024932T2 (de) 1989-12-19 1990-10-17 Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren

Country Status (4)

Country Link
US (1) US5162992A (de)
EP (1) EP0437159B1 (de)
JP (1) JPH0687241B2 (de)
DE (1) DE69024932T2 (de)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0462914A3 (en) * 1990-06-21 1993-06-02 International Business Machines Corporation A method of creating documents using existing documents
US5255389A (en) * 1990-06-21 1993-10-19 International Business Machines Corporation Document interchange replace option via a copy command
US5247661A (en) * 1990-09-10 1993-09-21 International Business Machines Corporation Method and apparatus for automated document distribution in a data processing system
US5551028A (en) * 1991-02-28 1996-08-27 Mentor Graphics Corporation Design data management system and associated method
US5404518A (en) * 1991-12-19 1995-04-04 Answer Computer, Inc. System for building a user-determined database of solution documents from queries that fail within it and from the search steps that do provide a solution
AU3969093A (en) 1992-04-30 1993-11-29 Apple Computer, Inc. Method and apparatus for organizing information in a computer system
ATE185633T1 (de) * 1992-07-06 1999-10-15 Microsoft Corp Verfahren und system zur organisation der internen struktur einer datei
WO1994012944A1 (en) * 1992-11-23 1994-06-09 Paragon Concepts, Inc. Computer filing system with user selected categories to provide file access
EP0633539B1 (de) * 1993-06-30 2001-02-21 Canon Kabushiki Kaisha Dokumentverarbeitungsverfahren und Gerät
JPH0793336A (ja) * 1993-09-21 1995-04-07 Toshiba Corp 画像記憶装置および画像記憶検索装置
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US6085031A (en) * 1994-12-13 2000-07-04 Johnson; William J. Method and system for segmenting an audio object according to a specified profile into a folder structure
US5713016A (en) * 1995-09-05 1998-01-27 Electronic Data Systems Corporation Process and system for determining relevance
US5745893A (en) * 1995-11-30 1998-04-28 Electronic Data Systems Corporation Process and system for arrangement of documents
US5787424A (en) * 1995-11-30 1998-07-28 Electronic Data Systems Corporation Process and system for recursive document retrieval
US5752242A (en) * 1996-04-18 1998-05-12 Electronic Data Systems Corporation System and method for automated retrieval of information
JP3108015B2 (ja) * 1996-05-22 2000-11-13 松下電器産業株式会社 ハイパーテキスト検索装置
US20030061221A1 (en) * 1996-05-24 2003-03-27 Fumiaki Ito Document processing method system and storage medium for document processing programs
US5930801A (en) * 1997-03-07 1999-07-27 Xerox Corporation Shared-data environment in which each file has independent security properties
US6098066A (en) * 1997-06-13 2000-08-01 Sun Microsystems, Inc. Method and apparatus for searching for documents stored within a document directory hierarchy
US6185550B1 (en) * 1997-06-13 2001-02-06 Sun Microsystems, Inc. Method and apparatus for classifying documents within a class hierarchy creating term vector, term file and relevance ranking
US6810404B1 (en) * 1997-10-08 2004-10-26 Scansoft, Inc. Computer-based document management system
JP2002117074A (ja) * 2000-10-04 2002-04-19 Hitachi Ltd 情報検索方法
US7076527B2 (en) 2001-06-14 2006-07-11 Apple Computer, Inc. Method and apparatus for filtering email
US7146362B2 (en) * 2002-08-28 2006-12-05 Bpallen Technologies Llc Method and apparatus for using faceted metadata to navigate through information resources
US7849048B2 (en) * 2005-07-05 2010-12-07 Clarabridge, Inc. System and method of making unstructured data available to structured data analysis tools
US7849049B2 (en) * 2005-07-05 2010-12-07 Clarabridge, Inc. Schema and ETL tools for structured and unstructured data
US10372741B2 (en) 2012-03-02 2019-08-06 Clarabridge, Inc. Apparatus for automatic theme detection from unstructured data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60207974A (ja) * 1984-03-31 1985-10-19 Toshiba Corp 文書フアイル装置
JPS61193266A (ja) * 1985-02-21 1986-08-27 Hitachi Ltd 情報検索システム
US4817036A (en) * 1985-03-15 1989-03-28 Brigham Young University Computer system and method for data base indexing and information retrieval
EP0229232A2 (de) * 1985-12-31 1987-07-22 Tektronix, Inc. Dateiverwaltungssystem
US4811199A (en) * 1987-05-08 1989-03-07 Kuechler William L System for storing and manipulating information in an information base
US4905163A (en) * 1988-10-03 1990-02-27 Minnesota Mining & Manufacturing Company Intelligent optical navigator dynamic information presentation and navigation system

Also Published As

Publication number Publication date
EP0437159A2 (de) 1991-07-17
DE69024932D1 (de) 1996-02-29
JPH0687241B2 (ja) 1994-11-02
EP0437159A3 (de) 1991-07-31
US5162992A (en) 1992-11-10
EP0437159B1 (de) 1996-01-17
JPH03191467A (ja) 1991-08-21

Similar Documents

Publication Publication Date Title
DE69024932T2 (de) Verfahren um Dokumente, die ein bestimmtes Attribut haben, mit Hilfe eines vektorrelationalen charakteristischen Objektes zu identifizieren
DE3650417T2 (de) Informationsaufzeichnungs- und Wiederauffindungssystem.
DE69031491T2 (de) Hypertextdatenverarbeitungssystem und Verfahren
DE69810457T2 (de) System und verfahren zum dynamischen verarbeiten eines index zum erzeugen eines abfragesatzes
DE69131941T2 (de) System und verfahren für informationsauffindung
DE69530595T2 (de) System und verfahren für die x.500-datenbanknorm
DE60025778T2 (de) Verfahren zum Speichern und Verwalten von Daten
DE69409404T2 (de) Dateisystem mit erweiterten attributen
DE69112694T2 (de) Verfahren zum Betrieb eines Datenverarbeitungssystems zur Ausführung von Datenbanktransaktionen.
DE69606021T2 (de) Verfahren und/oder vorrichtungen für den zugriff auf informationen
DE69623227T2 (de) Verfahren und System zur Berechnung von Dateinamen mit hoher Wahrscheinlichkeit der Eindeutigkeit
DE69430943T2 (de) Verfahren und System zum Überwachen von Datei-Attributen
DE69324186T2 (de) Datenverwaltungsverfahren und -gerät
DE60035432T2 (de) System zur verwaltung der rdbm fragmentierungen
DE19627472A1 (de) Datenbanksystem
DE102007037646B4 (de) Computerspeichersystem und Verfahren zum Indizieren, Durchsuchen und zur Datenwiedergewinnung von Datenbanken
DE19844013A1 (de) Strukturierter Arbeitsordner
DE69127399T2 (de) Verfahren zur automatischen Löschung vorübergehender Dokumentverbindungen in einem Datenverarbeitungssystem
DE10162495A1 (de) Erweiterbare Datenbank
DE19959765A1 (de) Datei-Editor für mehrere Datenuntermengen
EP1276056B1 (de) Verfahren zum Verwalten einer Datenbank
DE3586447T2 (de) Kompression von binaerzahlen fuer ihre speicherung.
EP1166228B1 (de) Verfahren zur nutzung von fraktalen semantischen netzen für alle arten von datenbank-anwendungen
DE69708057T2 (de) Verfahren zur verwendung eines computers zum verwalten des informationsaustausches zum erstellen von formularen
DE3736455A1 (de) Hierarchisches ablagesystem

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee