DE102006008287A1 - Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen - Google Patents

Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen Download PDF

Info

Publication number
DE102006008287A1
DE102006008287A1 DE102006008287A DE102006008287A DE102006008287A1 DE 102006008287 A1 DE102006008287 A1 DE 102006008287A1 DE 102006008287 A DE102006008287 A DE 102006008287A DE 102006008287 A DE102006008287 A DE 102006008287A DE 102006008287 A1 DE102006008287 A1 DE 102006008287A1
Authority
DE
Germany
Prior art keywords
node
hierarchical
classification tree
adv
core
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102006008287A
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SIP GMBH, 83607 HOLZKIRCHEN, DE
Original Assignee
SIP GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SIP GmbH filed Critical SIP GmbH
Priority to DE102006008287A priority Critical patent/DE102006008287A1/de
Publication of DE102006008287A1 publication Critical patent/DE102006008287A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Verfahren für eine Recherche nach Informationen, die in zwei hierarchischen Klassifikationsstrukturen abgelegt sind, wobei alle doppelt abgelegten Informationen gelöscht oder als gelöscht markiert werden, so dass in einem Informationsspeicher die aus beiden Klassifikationsspeichern herausgezogenen Informationen nur 1-fach vorliegen.

Description

  • Zusammenfassung
  • Verfahren für eine Recherche nach Informationen, die in zwei hierarchischen Klassisfikationsstrukturen abgelegt sind, wobei alle doppelt abgelegten Informationen gelöscht oder als gelöscht markiert werden, so dass in einem Informationsspeicher die aus beiden Klassifikationspeichern herausgezogenen Informationen nur 1-fach vorliegen.
  • Beschreibung
  • Eine bloße Existenz von Informationen verliert mit der zunehmenden Menge von Informationen sehr schnell Ihren Wert, wenn die Information nicht auf effektive Art auffindbar ist. Eine an sich bekannte Vorgehensweise um eine große Menge an Informationen so zu hinterlegen, daß eine gesuchte Information relativ schnell auffindbar ist, besteht darin, die Informationen nach einem Schema zu gliedern. Beispielsweise kann man die Informationen in einzelene Archive ablegen. Damit wird das gesamte Gebiet gewissermaßen in Teilgebiete aufgeteilt. Jede Information wird bei Ihrer Hinterlegung in einem Archiv wenigstens einem dieser Teilgebiete zugeordnet. Diese Suche nach einer Information läßt sich damit auf die einem Teilgebiet zugeordneten Informationen beschränken. Die Zuordnung zu Teilgebieten wird üblicherweise als Klassifikation bezeichnet, und die Teilgebiete werden als Klassifikatoren verstanden und können mit die Teilgebiete bezeichnenden Namen versehen werden.
  • Neben einer Vielzahl von literarischen und dokumentarischen Dokumentationsschemata hat auf dem Gebiet der Technik die „Internationale Patentklassifikation (IPC)", eine herausragende Bedeutung. Die IPC untergliedert das Gebiet der Technik in eine Vielzahl von Teilgebieten. So kann von Patentbehörden jede Patentanmeldung in technischer Hinsicht analysiert und wenigstens einem Teilgebiet, einer sogenannten Patentklasse zugeordnet werden.
  • Die IPC weist darüber hinaus eine mehrstufige hierarchisch aufgebaute weitere Untergliederung innerhalb der Teilgebiete auf, so daß damit ein Klassifikationsschema bereitgestellt ist, mit dem eine hoch präzise Zuordnung von Schutzrechten zu technischen Teilgebieten und damit das schnelle Auffinden von Schutzrechten innerhalb eines technischen Teilgebietes im Rahmen einer Recherche möglich wird.
  • Der durch eine Vielzahl von Hierarchiestufen beabsichtigte hohe Detaillierungsgrad erfordert bei der Zuordnung vielfach eine intensive technische Analyse des zu klassifizierenden technischen Gegenstandes einer Patentanmeldung, was einen hohen Zeit-, Personal- und damit Kostenaufwand für eine Patentbehörde bedeuten kann.
  • Um diesen Aufwand zu reduzieren, wurde von der WIPO (Word International Patent Organisation) eine ,duale' internationale Patenklassifikation vorgestellt, die zwei Klassifikationsschemata vorsieht, von denen eine erste gegenüber einer zweiten eine geringere Hierarchietiefe aufweist. Das erste Klassifikationsschema – auch Core Klassifikation genannt – findet sich als hierarchischer Oberbau identisch in dem zweiten Klassifikationsschema – auch Advanced Klassifikation genannt – wieder, wobei das zweite Klassifikationsschema noch eine weitergehende Untergliederung vorsieht. Diese zeigt sich an weiteren Patentunterklassen, die in der Core Klassifikation nicht vorhanden sind, und mit denen die in den untersten Hierarchieebenen der Core Klassifikation bezeichneten technischen Detailgebiete noch weiter untergliedert werden.
  • Diese ,duale' Klassifizierung mit zwei Klassifikationschemata gibt die Auswahlmöglichkeit eine Patentanmeldung entweder nach dem einen oder dem anderen Schema zu klassifizieren. In regelmäßigen Zeitabständen wird darüber hinaus vom europäischen Patentamt eine Synchronisation vorgenommen, bei der die Core Klassifikation durch Zuordnungen von all denjenigen Patentanmeldungen ergänzt wird, die zwar in der Advanced Klas sifikation, jedoch noch nicht in der Core Klassifikation zugeordnet sind. Dabei werden die zu einem Klassifikator der Advanced Klassifikation, der wegen des geringeren Detailierungsgrades in der Core Klassifikation nicht existiert, zugeordneten Schutzrechte demjenigen Klassifikator in der Core-Klassifikation zugeordent, der dort an unterster Hierarchieebene das technische Detailgebiet umfaßt. Damit geht zwar Detailierungsinformation verloren, jedoch wird sichergestellt, daß der Core Klassifikation alle Schutzrechte zugeordnet sind.
  • Sowohl die Core- als auch die Advanced stehen für Recherchen in der Patentliteratur zur Verfügung. Vom europäischen Patentamt wird als Vorgehen empfohlen, zunächst in der Advanced Klassifikation das technische Detailgebiet (d.h. den Suchklassifikator) auszuwählen, auf das sich das oder die gesuchten Schutzrechte beziehen. Das Suchergebnis besteht dann aus allen dem ausgewählten technischen Detailgebiet zugeordneten Schutzrechten in der Advanced Klassifikation. Für den Fall, daß das Suchergebnis keine befriedigenden Ergebnisse geliefert hat, wird vom europäischen Patentamt als zweiter Schritt empfohlen, für eine weitere Suche in der Core Klassifikation denjenigen Klassifikator zu ermitteln, der an unterster Hierarchiestufe das ausgewählte technische Detailgebiet umfaßt, und die diesem Klassifikator zugeordneten Schutzrechte als weiteres Suchergebnis anzusehen. Das weitere Suchergebnis enthält in der Regel eine weit größere Anzahl von Schutzrechten als das Suchergebnis aus dem ersten Schritt, wobei eine große Anzahl von Schutzrechten bereits im ersten Schritt ermittelt wurden.
  • Durch die doppelte Suche in den Core und Advanced Klassen muß deutlich mehr Speicher und CPU-Zeit zur Verfügung gestellt werden als wenn nur in einem Klassifikationsschema gesucht wird. Zur Zeit werden bei der IPC weniger als 1% nur der Core Klassifikation zugeordnet. Somit wird knapp doppelt soviel Speicherplatz für die redundante Suche in der Core und Advanced Klassifikation benötigt. Bei einem Datenvolumen von ca. 210 Millionen Zuordnungen zu beiden Patentklassen (Datenbestand IPC 8 Zuordnung des Europäischen Patentamtes) und einem Speicherbedarf von 4 Byte pro Zuordnung sowie jeweils 4 Byte für 70.000 Klassifikationen der Advanced- und 4 Byte für 17.000 Klassifikationen der Core- Klassen ergibt dies ein benötigtes Speichervolumen von ca 840 Mega Byte.
  • Zusätzlich zu dem Speicheraufkommen müssen bei einer vollständigen Recherche beide Klassen (Core und Advanced) durchsucht werden was bedingt durch die redundanten Speicherzugriffe auch zu einer nahezu doppelten CPU Belastung führt.
  • Um eine redundanzfreie Anzeige des Rechercheergebnisses zu gewährleisten muß zusätzlich das Ergebnis der Core und Advanced Recherche vereinheitlicht werden. Auch hier muß sowohl Speicher als auch CPU Leistung ausreichend zur Verfügung stehen.
  • Wird die Recherche in einer Datenbank gleichzeitig von vielen Nutzern durchgeführt – etwa bei einer Onlinenutzung – so vervielfältig sich der Bedarf an Speicher und CPU-Zeit.
  • Es ist Aufgabe der vorliegenden Erfindung Maßnahmen vorzusehen, durch eine geschickte Aufteilung und Nutzung eines zur Verfügung stehenden Speichers, einerseits den für die Recherche notwendigen Speicherbedarf und andererseits die für die Recherche benötigte CPU-Zeit deutlich zu reduzieren. Weiterhin wird durch die vorgestellte Vorgehensweise das Rechercheergebnis in Hinblick auf die Genauigkeit deutlich verbessert und Redundanzen im Suchergebnis weitestgehend unterbunden.
  • Gelöst wird die Aufgabe erfindungsgemäß durch die Merkmale der – Patentansprüche.
  • Vorteilhafte Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.
  • Zwei Ausführungsbeispiele der Erfindung werden im folgenden anhand der Zeichnung näher erläutert.
  • Dabei zeigen
  • 1 in schematischer Darstellung eine Netz-Konfiguration mit einem Datenbankverwalter zum Modifizieren der Klassifikationen.
  • 2 in schematischer Weise ein Beispiel von zwei korrespondierenden Ausschnitten aus einer ersten und einer zweiten hierarchischen Klassifikationsbaumstruktur vor einer Modifikation
  • 3 das Beispiel nach 2 mit einer Modifikation der ersten und zweiten hierarchischen Klassifikationsbaumstruktur
  • 4 das Beispiel nach 2 mit einer Modifikation der zweiten hierarchischen Klassifikationsbaumstruktur
  • 5 die Darstellung eines Speichers für ein Beispiel von zwei korrespondierenden Ausschnitten aus einer ersten und einer zweiten hierarchischen Klassifikationsbaumstruktur vor einer Modifikation
  • 6 die Darstellung eines Speichers für ein Beispiel von zwei korrespondierenden Ausschnitten aus einer ersten und einer zweiten hierarchischen Klassifikationsbaumstruktur nach einer Modifikation
  • 1 zeigt in vereinfachter symbolischer Form eine Netz-Topologie mit einem Datenbankinhaber A, der Datenzugriffe über das Internet auf seine in einer Datenverarbeitungseinrichtung gespeicherte Datenbank mit einer ersten hierarchischen Klassifikationsbaumstruktur – im weiteren auch Core Klassifikation CORE genannt – und einer zweiten hierarchischen Klassifikationsbaumstruktur – im weiteren auch Advanced Klassifikation ADV genannt – erlaubt.
  • Eine Vielzahl von Rechercheuren R greifen über das Internet auf die Datenbank des Datenbankinhabers A zu. Des weiteren ist an das Internet ein Datenbankverwalter SIP angeschlossen, der ebenfalls eine Datenverarbeitungseinrichtung mit einer Datenbank aufweist, in dem jedoch die erste und zweite hierarchische Klassifikationsbaumstruktur in modifizierter Form für Zugriffe durch die Rechercheure R bereitgestellt werden. Ein Rechercheur kann auf die Datenbank des Datenbankinhabers A zugreifen und mit der von diesem empfohlenen Vorgehensweise zuerst in der Advanced Klassifikation (ADV) und danach in der Core Klassifikation (CORE) suchen. Zu diesem Zweck werden zuerst die Klassifikationsknoten der Advanced Klasse ermittelt um die Informationselemente der Advanced Klassen auslesen zu können. Anschließend werden die Klassifikationsknoten der Core Klasse ermittelt bzw. vom Rechercheur ausgewählt um wie derum die Informationselemente der Core Klasse auslesen zu können. Das Ergebnis enthält redundante Daten, da gleiche Informationselemnte sowohl den Advanced Klassen als auch den korrespondierenden, übergeordneten Core Klassen zugeordnet sind. 5 veranschaulicht die Vorgänge beispielhaft im Hauptspeicher. Sobald mit Hilfe der Klassenidentifikationsnummer (Klassen Id) das Klassenelement im Speicher für die Klassenbaumstruktur gefunden wurde, wird mit Hilfe der Information – Speicheradresse für die erste Zuordnung – und der Information wie viele Informationselemente gelesen werden müssen die zugeordneten Informationselemente gelesen. Der gleiche Vorgang wiederholt sich für die Zuordnungen der Informationselemente der Core Klassen. Am Ende werden entweder die Redundanten Informationselemente dem Rechercheur dargestellt, was ein höheres Übertragungsvolumen sowie einen Mehraufwand beim Rechercheur bedeutet oder die Informationselemente müssen vereinheitlicht werden, was zu einer CPU Belastung und zusätzlichen Speicheraufwand führt.
  • Greift hingegen der Rechercheur R auf die Datenbank der Fa. SIP zu, so werden ebenfalls die Informationselemente der ausgewählten Advanced Klassen ermittelt. Anschließend wird mindestens ein korrespondierender, übergeordneter Knoten der Core Klasse ermittelt und die diesem zugeordneten Informationselemente aus der Core Klasse ausgelesen. Da die redundaten Informationselemente bereits entfernt wurden, können bei der Ermittlung der Informationselemente aus der Core Klasse keine redundanten Informationselemente gefunden werden. Die Ermittlung der Informationselemente ist wie in 6 dargestellt erheblich schneller da es sich um wesentlich weniger Informationselemente handelt. Eine Aufbereitung des Ergebnisses hinsichtlich der Entfernung der redundanten Informationen entfällt.
  • In 2 ist auf der linken Seite in schematischer Weise ein Ausschnitt aus einer ersten hierarchischen Klassifikationsbaumstruktur (CORE) und auf der rechten Seite ein korrespondierender Ausschnitt aus einer zweiten hierarchischen Klassifikationsbaumstruktur (ADV) symbolisch dargestellt. Das durch den Ausschnitt angesprochene technische Teilgebiet ist durch einen Klassifikator H repräsentiert, der als Knoten mit hoher Hierarchie in der ersten und zweiten hierarchischen Klassifi kationsbaumstruktur Core und ADV zu erkennen ist. In dem durch den Klassifikator H bezeichneten technischen Teilgebiet existieren im gezeigten Beispiel wenigstens zwei technische Unterteilgebiete, die z.B. durch die Klassifikatoren H01 und H02 repräsentiert sind. In der ersten und zweiten hierarchischen Klassifikationsbaumstruktur (CORE; ADV) stellen diese Klassifikatoren H01, H02 Knoten dar, die eine um eine Stufe tiefere Hierarchie haben als der die beiden Unterteilgebiete H01 und H02 umfassende Klassifikator H d.h. Knoten H. Wird der Knoten H mit der Hierarchiestufe –1 gemessen, so werden die beiden seine Teiluntergebiete bezeichnenden Klassifikatoren d.h. Knoten H01, H02 mit der Hierarchiestufe –2 gemessen. Das technische Teiluntergebiet H01 hat im Beispiel wiederum drei weitere technische Untergebiete, die jeweils die Hierarchiestufe –3 aufweisen und im Beispiel als H01A, H01B und H01C bezeichnet sind. Das Teiluntergebiet H01B wiederum hat zwei weitere technische Untergebiete H01B/00 und H01B/01, die sich in einer Hierarchiestufe –4 befinden. 5 zeigt beispielhaft den Speicheraufbau für diese Anordnung.
  • Die Knoten d.h. Klassifikatoren der ersten hierarchischen Klassifikationsbaumstruktur CORE sind als hierarchischer Oberbau auch in der zweiten hierarchischen Klassifikationsbaumstruktur ADV enthalten. Zusätzlich hingegen wird das technische Teiluntergebiet H01B/00 durch drei weitere technische Teiluntergebiete, die jeweils die Hierarchiestufe –5 tragen, unterteilt. Dieses sind im Beispiel die Klassifikatoren d.h. Knoten mit den Bezeichnungen H01B/00/001, H01B/00/002 und H01B/00/003. Außerdem ist in der zweiten Klassifikationsbaumstruktur ADV das Teiluntergebiet H01C durch zwei weitere Teiluntergebiete H01C/00 und H01C/01, beide in der Hierarchiestufe –4, unterteilt.
  • Bei der Zuordnung von Klassifikatoren zu Schutzrechten handelt es sich um eine wechselseitige Zuordnung, das heißt man kann auch von einer Zuordnung der Klassifikatoren zu Schutzrechten sprechen. Für eine vereinfachte Veranschaulichung der Zuordnung wird in der Zeichnung einem Klassifikator d.h. Knoten eine Blase zugeordnet, in der diejenigen Schutzrechte symbolisch mit #... bezeichnet sind, die diesem Knoten d.h. Klassifikator zugeordnet sind. In der ersten hierarchischen Klassifikationsbaumstruktur CORE sind im Beispiel dem Knoten H01B/00 die Schutzrechte mit den symbolischen Bezeichnungen #010, #001 #002, #003, #004, #005, #006, #009 zugeordnet. Dem Knoten H01C sind die Schutzrechte mit den symbolischen Bezeichnungen #022, #023, #025 zugeordnet.
  • In der zweiten hierarchischen Klassifikationsbaumstruktur ADV findet sich dagegen in dem Knoten H01B/00 eine Zuordnung des Schutzrechtes mit der symbolischen Bezeichnung #010. In dem Knoten H01B/00/001 finden sich zugeordnet die Schutzrechte mit den symbolischen Bezeichnungen #001 #002 #003. In dem Knoten H01B/00/002 zugeordnet finden Sie die Schutzrechte mit den symbolischen Bezeichnungen #004 und #005. Zum Knoten H01B/00/003 findet sich die Zuordnung des Schutzrechts mit der symbolischen Bezeichnung #006. Des weiteren ist dem Knoten H01C/00 das Schutzrecht mit der symbolischen Bezeichnung #022 und dem Knoten H01C/01 das Schutzrecht mit der symbolischen Bezeichnung #023 zugeordnet.
  • In 3 sind die beiden hierarchischen Klassifikationsbaumstrukturen CORE; ADV mit ihrer Zuordnung von Schutzrechten dargestellt, wie sie sich nach Modifizierung gemäß einem ersten Ausführungsbeispiel der Erfindung darstellen. 6 zeigt beispielhaft den zugehörigen Speicheraufbau.
  • In der ersten hierarchischen Klassifikationsbaumstruktur CORE werden die Zuordnungen zu denjenigen Knoten d.h. Klassifikatoren überprüft, die hierarchisch als Abschlußknoten anzusehen sind. Dies sind entweder Knoten d.h. Klassifikatoren, bei denen das von ihnen bezeichnete technische Teilgebiet keine weitere Untergliederung erfährt und/oder Knoten die als wichtige Zuordnungsknoten bestimmt werden. Am Beispiel sind als Abschlußknoten in der ersten hierarchischen Klassifikationsbaumstruktur CORE die Knoten H01A und H01C der Hierarchiestufe –3 sowie die Knoten H01B/00 und H01B/01 der Hierarchiestufe –4 anzusehen. Diese Knoten werden auch als hierarchische Abschlussknoten bezeichnet.
  • Gemäß dem ersten Ausführungsbeispiel der Erfindung werden die den hierarchischen Abschlußknoten H01B/00; H01C zugeordneten Informationselemente (im Beispiel sind dies die symbolischen Bezeichnungen der zugeordneten Schutzrechte) dann gelöscht oder als gelöscht markiert, wenn sie in der zweiten hierarchischen Klassifikationsbaumstruktur ADV dem gleichen Abschlussknoten H01B/00; H01C oder weiteren Knoten, die sich in wenigstens einer Hierarchiestufe unter dem betreffenden Abschlußknoten befinden, zugeordnet sind. Damit wird Speicherplatz wie in 6 dargestellt freigegeben. Im dargestellten Beispiel werden also in dem Abschlußknoten H01B/00 der ersten hierarchischen Klassifikationsbaumstruktur CORE die Zuordnungen zu den Informationselementen (symbolische Bezeichnung von Schutzrechten) #010, #001, #002, #003, #004, #005 und #006 gelöscht oder als gelöscht markiert. Lediglich die Zuordnung zu dem Informationselement mit der symbolischen Bezeichnung #009 bleibt erhalten. Von den Zuordnungen beim Abschlußknoten H01C werden die symbolischen Bezeichnungen #022 und #023 gelöscht oder als gelöscht markiert. Gelöscht oder als gelöscht markierte Informationselemente sind in der Zeichnung 3 als schräg durchgestrichen dargestellt. Des weiteren wird in der zweiten Klassifikationsbaumstruktur ADV der in der ersten Klassifikationsbaumstruktur CORE ermittelte Abschlußknoten als Sammelklassifikator markiert. Dies ist in der Zeichnung durch ein X symbolisiert.
  • Basierend auf dieser Modifizierung der ersten und zweiten Klassifikationsbaumstruktur CORE; ADV kann eine datenverarbeitungstechnische Suche dann wie folgt erfolgen. Ausgehend von dem von einem Rechercheur anhand eines Suchklassifikators z.B. H01B/00/002, spezifizieren technischen Teiluntergebiet, wird zunächst in der zweiten hierarchischen Klassifikationsbaumstruktur ADV nach dem Suchklassifikator, d.h. Knoten, gesucht und die diesem Knoten zugeordneten Informationselemente, also im vorliegenden Fall die symbolischen Bezeichnungen #004 und #005 als Suchergebnis ausgegeben. Wie in 6 dargestellt, wird zuerst der Klassifikationsknoten ermittelt und anschließend werden die Informationselemente, beginnend mit der verwiesenen Speicheradresse und er gegebenen Anzahl, ausgelesen.
  • Für den Fall, daß das Suchergebnis nicht zufriedenstellend ist, wird in einem zweiten Schritt in der Hierarchie nach oben der nächste als Sammelknoten markierte Knoten und/oder Knoten die als wichtige Zuordnungsknoten bestimmt wurden – in dem vorliegenden Ausführungsbeispiel ist es H07B/00 – ermittelt und unter diesem ermittelten Sammelknoten in der ersten Klassifikationsbaumstruktur CORE nach Zuordnungen gesucht. Im Ausführungsbeispiel ist nur noch die Zuordnung zu dem Informationselement mit der symbolischen Bezeichnung #009 diesem Knoten gültig zugeordnet. Die symbolische Bezeichnung #009 wird dann als weiteres Suchergebnis zu den im ersten Schritt ermittelten symbolischen Bezeichnungen #004, #005 in einen Anzeigespeicher übertragen und an den Rechercheur als Ergebnis übermittelt.
  • Wie in diesem Beispiel dargestellt, ergibt sich durch dieses Verfahren eine Reduzierung der Datenmenge um mehr als 50%. Dies wird deshalb erreicht, da auch die Informationselemente aus den zu dem ausgewählten parallelen Knoten nicht angezeigt werden. In dem Beispiel sind das die Informationselemente zu den Knoten H01B 00/001 und H01B 00/003.
  • Da es sich bei der IPC tatsächlich zur Zeit um ca. 105.000.000 Zuordnungen zur Core und ca. 104.000.000 Zuordnungen zur Advanced Klassifikation handelt, ergibt dies einen Speicherbedarf ohne der vorliegenden Erfindung, ausgehend von dem in 5 dargestellten Verfahren, folgenden Speicherbedarf: Core: (105.000.000 Informationselemente (4 Byte)) + (17.000 Klassen·(KlassenId (4 Byte) + Anzahl zugeordneter Patente (4 Byte) + Speicheradresse der ersten Zuordnung (4 Byte)) = 420.000.000 Byte + 204.000 Byte = 420.204.000 Byte ADV: (104.000.000 Informationselemente (4 Byte)) + (70.000 Klassen·(KlassenId (4 Byte) + Anzahl zugeordneter Patente (4 Byte) + Speicheradresse der ersten Zuordnung (4 Byte)) = 416.000.000 Byte + 840.000 Byte = 416.840.000 Byte
  • Der Speicherplatz ergäbe wie in 5 dargestellt insgesamt 837.044.000 Byte.
  • Mit der Erfindung ergibt sich, wie in 6 dargestellt, folgender Speicherbedarf: Core: (1.000.000 Informationselemente (4 Byte)) + (17.000 Klassen·(KlassenId (4 Byte) + Anzahl zugeordneter Patente (4 Byte) + Speicheradresse der ersten Zuordnung (4 Byte)) = 4.000.000 Byte + 204.000 Byte = 4.204.000 Byte ADV: (104.000.000 Informationselemente (4 Byte)) + (70.000 Klassen·(KlassenId (4 Byte) + Anzahl zugeordneter Patente (4 Byte) + Speicheradresse der ersten Zuordnung (4 Byte)) = 416.000.000 Byte + 840.000 Byte = 416.840.000 Byte
  • Der Speicherplatz ergäbe, wie in 6 dargestellt, insgesamt 421.044.000 Byte. Dies ergibt eine Speicherplatzersparnis von 416.000.000 Byte.
  • Zusätzlich zur Speicherplatzersparnis und der damit verbundenen schnelleren Ermittlung der Informationselemente wird die CPU Belastung auch durch die redundanzfreie Ermittlung der Informationselemente reduziert. Diese Entlastung ergibt sich nicht nur durch das Auslesen der reduzierten Informationselemente. Auch der Aufwand für die Entfernung der Redundanzen entfällt und es müssen weniger Daten zum Rechercheur übertragen werden.
  • Mit diesem Verfahren wird die Datenmenge in der Datenbank des Datenbankverwalters SIP verringert. Zugleich laufen die Suchvorgänge beträchtlich schneller ab, d.h. es wird weniger CPU-Zeit benötigt. Die Auswertung des Suchergebnisses beim Rechercheur R im Hinblick auf redundante Informationselemente entfällt, wodurch auch der Bearbeitungsaufwand beim Rechercheur R geringer wird.
  • Das Suchverfahren läßt sich zudem noch in der Geschwindigkeit erhöhen, wenn die einem hierarchischen Abschlußknoten H01B/00, H01C der ersten hierarchischen Klassifikationsbaumstruktur CORE gültig zugeordneten Informationselemente (#009 für den Knoten H01/00 und #025 für den Knoten H01C) den jeweiligen als Sammelknoten markierten Knoten der zweiten hierarchischen Klassifikationsbaumstruktur ADV zugeordnet werden (#009 zu dem Knoten H01/00 und #025 zu dem Knoten H01C). Die auf diese Weise in die zweite hierarchischen Klassifikationsbaumstruktur ADV übertragenen Zuordnungen werden als übertragen markiert, um bei der Suche ein Unterscheidung vornehmen zu können, ob das Informationselement im ersten Suchschritt schon ermittelt und ausgegeben wurde. Die als übertragen markierten Informationselemente werden erst im zweiten Schritt als Suchergebnis ausgegeben.
  • In 4, die ebenso wie die beiden vorhergehenden Figuren die erste und zweite Klassifikationsbaumstruktur CORE; ADV darstellt, ist dieses Vorgehen dadurch ersichtlich gemacht, daß dem Sammelknoten H01B/00 in der zweiten Klassifikationsbaumstruktur ADV eine Zuordnung des Informationselementes #009 hinzugefügt wurde. Ebenso wurde dem Abschlußknoten H01C der zweiten Klassifikationsbaumstruktur ADV eine Zuordnung zum Informationselement #025 hinzugefügt.
  • Damit der aus der ersten Klassifikationsbaumstruktur CORE stammende Ursprung der Informationselemente #025, #009 beim Suchen erkennbar ist, werden – wie bereits erwähnt – die von der ersten in die zweite Klassifikationsbaumstruktur CORE; ADV übertragenen Zuordnungen #009, #025 als solche markiert siehe in 4 durch „!").
  • Im Falle einer Übertragung von Informationselementen von der ersten in die zweite Klassifikationsbaumstruktur ADV wird die erste Klassifikationsbaumstruktur CORE bei einer Suche nicht mehr genutzt. Sie muß im Grunde also auch nicht von dem Datenbankverwalter SIP zur Verfügung gestellt werden. Die Reduzierung des Speicherbedarfes durch den Wegfall des Spei cherbedarfs für die Core Klassifikationsbaumstruktur wird durch das Hinzufügen der Kennzeichnung an den Speicher für die Informationselemente ersetzt. Bei 105.000.000 Informationselementen erhöht sich der Speicherbedarf gegenüber dem 1. Verfahren der Erfindung um ca. 105.000.000 Byte (die Kennzeichnung benötigt maximal 1 Byte). Allerdings verringern sich die Zugriffe und somit die CPU Belastung bei der Ermittlung der zugeordneten Informationselemente für die Core und Advanced Klassifizierung, da jetzt nur noch eine Klassifikationsbaumstruktur durchlaufen werden muß.
  • Um eine Bearbeitung der ersten hierarchischen Klassifikationsbaumstruktur CORE durch Löschen oder durch Gelöscht-Markierungen zu vermeiden, kann im Rahmen eines zweiten Ausführungsbeispiels die erste hierarchische Klassifikationsbaumstruktur CORE unverändert belassen werden. In diesem Fall werden in der zweiten hierarchischen Klassifikationsbaumstruktur ADV an einen jeweiligen Sammelknoten H01b/00; H01c solche Zuordnungen angefügt, die an dem korrespondierenden Abschlußknoten H01b/00; H01c der ersten Klassifikationsbaumstruktur CORE vorhanden sind, jedoch in der zweiten Klassifikationsbaumstruktur ADV nicht bereits dem betreffenden Sammelknoten H01b/00; H01c oder hierarchisch unter diesem befindlichen weiteren Knoten H01b/00/001, H01b/00/002, H01b/00/003; H01c/00, H01c/01 zugeordnet sind.
  • In 4 sind die erste und zweite Klassifikationsbaumstruktur CORE; ADV mit dem gleiche Ausschnitt wie in den vorhergehenden Figuren dargestellt. Die erste Klassifikationsbaumstruktur CORE weist weder gelöschte noch als gelöscht markierte Zuordnungen auf und ist damit unverändert. In der zweiten Klassifikationsbaumstruktur ADV weisen die Sammelknoten H01b/00; H01c übertragene Zuordnungen #009, #025 auf, die als solche markiert sind (in der Zeichnung mit „!") versehen).

Claims (8)

  1. Verfahren für eine Recherche nach Informationen, die in zwei hierarchischen Klassisfikationsstrukturen abgelegt sind, wobei alle doppelt abgelegten Informationen gelöscht oder als gelöscht markiert werden, so dass in einem Informationsspeicher die aus beiden Klassifikationspeichern herausgezogenen Informationen nur 1-fach vorliegen.
  2. Verfahren nach Anspruch 1, zum Modifizieren einer ersten und/oder einer zweiten hierarchischen Klassifikationsbaumstruktur (CORE, ADV) für eine redundanzfreie Suche nach zugehörig zu Knoten im Sinne von Klassifikatoren gespeicherten Informationselementen, bei dem die zweite hierarchische Klassifikationsbaumstruktur (ADV) die erste Klassifikationsbaumstruktur (CORE) als hierarchische Dachstruktur enthält, an die wenigstens an einem ihrer hierarchischen Abschlußknoten zusätzlich eine oder mehrere weitere Knoten als Klassifikatoren angebunden sind, bei dem die den Knoten der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) zugeordneten Informationselemente auch den entsprechenden Knoten der ersten hierarchischen Klassifikationsbaumstruktur (CORE) zugeordnet sind, und bei dem die einem weiteren Knoten zugeordneten Informationselemente dem zugehörigen hierarchischen Abschlussknoten oder einem definierten hierarchisch darüber liegenden Knoten in der ersten hierarchischen Klassifikationsbaumstruktur (CORE) zugeordnet sind, wobei in der ersten hierarchischen Klassifikationsbaumstruktur (CORE) diejenigen einem hierarchischen Abschlußknoten oder einem definierten hierarchisch darüber liegenden Knoten zugeordneten Informationselemente, die in der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) auch dem hierarchischen Abschlußknoten oder einem seiner einen oder mehreren weiteren Knoten zugeordnet sind, gelöscht oder als gelöscht markiert werden.
  3. Verfahren nach Anspruch 1 und 2, bei dem die einem Abschlußknoten oder einem definierten hierarchisch darüber liegenden Knoten der ersten hierarchischen Klassifikationsbaumstruktur (CORE) noch gültig zugeordneten Informationselemente dem gleichen Knoten in der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) zugeordnet und dort als übertragen markiert werden.
  4. Verfahren nach Anspruch 1 zum Modifizieren einer ersten und/oder einer zweiten hierarchischen Klassifikationsbaumstruktur (CORE, ADV) für eine redundanzfreie Suche nach zugehörig zu Knoten im Sinne von Klassifikatoren gespeicherten Informationselementen, bei dem die zweite hierarchische Klassifikationsbaumstruktur (ADV) die erste Klassifikationsbaumstruktur (CORE) als hierarchische Dachstruktur enthält, an die wenigstens an einem ihrer hierarchischen Abschlußknoten (H01b/00; H01c) zusätzlich eine oder mehrere weitere Knoten als Klassifikatoren angebunden sind, bei dem die den Knoten der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) zugeordneten Informationselemente auch den entsprechenden Knoten der ersten hierarchischen Klassifikationsbaumstruktur (CORE) zugeordnet sind, und bei dem die einem weiteren Knoten zugeordneten Informationselemente dem zugehörigen hierarchischen Abschlussknoten oder einem definierten hierarchisch darüber liegenden Knoten in der ersten hierarchischen Klassifikationsbaumstruktur (CORE) zugeordnet sind, wobei diejenigen einem hierarchischen Abschlußknoten oder einem definierten hierarchisch darüber liegenden Knoten in ersten hierarchischen Klassifikationsbaumstruktur (CORE) zugeordneten Informationselemente, die in der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) weder dem gleichen hierarchischen Abschlußknoten (H01b/00; H01c) noch einem seiner einen oder mehreren weiteren Knoten zugeordnet sind, auch dem gleichen Abschlußknoten der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) zugeordnet werden.
  5. Verfahren nach Anspruch 4, bei dem die auch dem gleichen Abschlußknoten der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) zugeordneten Informationselemente als übertragen markiert werden.
  6. Verfahren nach einem der vorhergehenden Ansprüche, bei dem in der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) der Abschlußknoten oder ein definierter hierarchisch darüber liegender Knoten als Sammelklassifikator (x) markiert wird.
  7. Verfahren zum redundanzfreien Suchen von zu einem Suchklassifikator gehörigen Informationselementen in nach einem Verfahren nach Anspruch 6 in Verbindung mit Anspruch 3 modifizierten ersten und zweiten hierarchischen Klassifikationsbaumstrukturen (CORE; ADV), – bei dem aus der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) die dem den Suchklassifikator repräsentierenden Knoten zugeordneten Informationselemente in einen Anzeigespeicher übertragen werden, und im Falle einer Existenz von wenigstens einem diesem Knoten hierarchisch nachfolgenden Knoten, die diesem nachfolgenden Knoten zugeordneten Informationselemente auch in den Anzeigespeicher übertragen werden, und – bei dem zu dem den Suchklassifikator repräsentierenden Knoten hierarchisch aufwärts ein als Sammelklassifikator markierter Knoten gesucht wird, wobei bei Auffinden eines solchen, der entsprechende Knoten in der ersten hierarchischen Klassifikationsbaumstruktur (CORE) ermittelt wird und die ihm gültig zugeordneten Informationselemente auch in den Anzeigespeicher übertragen werden.
  8. Verfahren zum redundanzfreien Suchen von zu einem Suchklassifikator gehörigen Informationselementen in nach einem Verfahren nach Anspruch 6 in Verbindung mit Anspruch 4 modifizierten zweiten hierarchischen Klassifikationsbaumstruktur (ADV), – bei dem aus der zweiten hierarchischen Klassifikationsbaumstruktur (ADV) die dem den Suchklassifikator repräsentieren den Knoten zugeordneten Informationselemente in einen Anzeigespeicher übertragen werden, und im Falle einer Existenz von wenigstens einem diesem Knoten hierarchisch nachfolgenden Knoten, die diesem nachfolgenden Knoten zugeordneten Informationselemente auch in den Anzeigespeicher übertragen werden, und – bei dem zu dem den Suchklassifikator repräsentierenden Knoten hierarchisch aufwärts ein als Sammelklassifikator markierter Knoten gesucht wird, wobei bei Auffinden eines solchen, die ihm zugeordneten Informationselemente auch in den Anzeigespeicher übertragen werden.
DE102006008287A 2006-02-22 2006-02-22 Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen Withdrawn DE102006008287A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102006008287A DE102006008287A1 (de) 2006-02-22 2006-02-22 Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006008287A DE102006008287A1 (de) 2006-02-22 2006-02-22 Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen

Publications (1)

Publication Number Publication Date
DE102006008287A1 true DE102006008287A1 (de) 2007-08-30

Family

ID=38319753

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006008287A Withdrawn DE102006008287A1 (de) 2006-02-22 2006-02-22 Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen

Country Status (1)

Country Link
DE (1) DE102006008287A1 (de)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030016466A1 (en) * 2001-07-17 2003-01-23 International Business Machines Corporation Method and apparatus for performing position error signal conditioning of LTO media servo format written-in velocity variation
US6757678B2 (en) * 2001-04-12 2004-06-29 International Business Machines Corporation Generalized method and system of merging and pruning of data trees
WO2004057491A1 (en) * 2002-12-20 2004-07-08 Redbank Manor Pty Ltd Search engine result reporter

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6757678B2 (en) * 2001-04-12 2004-06-29 International Business Machines Corporation Generalized method and system of merging and pruning of data trees
US20030016466A1 (en) * 2001-07-17 2003-01-23 International Business Machines Corporation Method and apparatus for performing position error signal conditioning of LTO media servo format written-in velocity variation
WO2004057491A1 (en) * 2002-12-20 2004-07-08 Redbank Manor Pty Ltd Search engine result reporter

Similar Documents

Publication Publication Date Title
DE19810843B4 (de) Verfahren und Zugriffseinrichtung zum Bestimmen der Speicheradresse eines Datenwerts in einer Speichereinrichtung
DE60118973T2 (de) Verfahren zum abfragen einer struktur komprimierter daten
EP1183690B1 (de) Speicheranordnung mit adressverwürfelung
DE1499182A1 (de) Elektrische Datenverarbeitungsanlage
DE2758829C2 (de) Datenverarbeitungsanlage mit mehreren Prozessoren
DE602004008240T2 (de) Verfahren zum Verwalten von defekten Speicherblöcken in einem nicht-flüchtigen Speicher und nicht-flüchtiger Speicher zur Ausführung des Verfahrens
DE112019000627T5 (de) Speicherstrukturbasiertes Coherency Directory Cache
DE10120615B4 (de) Dynamische Speicherverwaltung für Objekte unterschiedlicher Größe
DE60114299T2 (de) Verfahren und Vorrichtung zum Übersetzen von IP Telekommunikationsnetzwerkadressen mit einem gesteuerten undichten Speicher
DE102006008287A1 (de) Verfahren zum Modifizieren einer hierarchischen Klassifikationsbaumstruktur sowie Verfahren zum redundanzfreien Suchen von Informationselementen
EP0134822A1 (de) Digitalspeicher
DE2062164A1 (de) Verfahren zur Erzeugung eines mehr stufigen Index für gespeicherte Daten einheiten
DE19810784B4 (de) Rechnersystem
EP2102766A1 (de) Verfahren zum auslesen von daten aus einem speichermedium
DE19718479C1 (de) Chipkarte mit Speicherzugriffsmaximierung und Protokollierung
EP0912952B1 (de) Datenbanksystem und verfahren zum verwalten eines n-dimensionalen datenbestands
DE60307688T2 (de) Hardware-unterstützter Tupelraum
EP1675010A2 (de) Verfahren zur Aktualisierung von Einträgen von Adressumsetzpuffern in einem Mehrprozessor-Computersystem
EP1728162A1 (de) Speicherbereinigung (garbage collection) für smart cards
DE10343328A1 (de) Verfahren zum Abbilden eines hierarchischen technischen Systems in eine relationale Datenbank
EP0651897B1 (de) Verfahren zur dynamischen verwaltung eines freien speichers einer rechenanlage, des freispeichers, für den eine unterteilung in wenigstens zwei logische speicherbereiche, die sich in ihren zugriffseigenschaften unterscheiden, vorgesehen ist
DE10218646A1 (de) An einen Bus angeschlossene Einrichtung
DE102010063336B4 (de) Verfahren zur Erzeugung von standarisierten Navigationsdaten
DE19835751B4 (de) Verfahren zur Einstellung der Grenzen mindestens eines cache-fähigen logischen Speicherbereichs
DE102007061939B4 (de) Verfahren zur Bereitstellung eines hierarchisch strukturierten Datensatzes für den Zugriff einer Applikation

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8181 Inventor (new situation)

Inventor name: WAGNER, ALEXANDER, 83624 OTTERFING, DE

8127 New person/name/address of the applicant

Owner name: SIP GMBH, 83607 HOLZKIRCHEN, DE

8139 Disposal/non-payment of the annual fee