EP2188742A1

EP2188742A1 - Erfassung von zusammenhängen zwischen informationen repräsentierenden daten

Info

Publication number: EP2188742A1
Application number: EP07802081A
Authority: EP
Inventors: Jörg Wurzer
Original assignee: Iqser IP AG
Current assignee: Iqser IP GmbH
Priority date: 2007-09-03
Filing date: 2007-09-03
Publication date: 2010-05-26
Also published as: US20100223248A1; US9336309B2; WO2009030246A1; WO2009030288A1; US9323842B2; US20100223247A1

Abstract

Die vorliegende Erfindung betrifft ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes erfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes erzeugt wird. Ferner betrifft die vorliegende Erfindung ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand sowie eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche jeweils ausgebildet und/oder eingerichtet sind ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen.

Description

Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten

Die vorliegende Erfindung betrifft ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandeserfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandeserzeugt wird.

Ferner betrifft die vorliegende Erfindung ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, welches ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen. Gegenstand der vorliegenden Erfindung ist darüber hinaus eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines erfindungsgemäßen Datenverarbeitungssystems.

Verfahren, Systeme und Vorrichtungen zur elektronischen Verarbeitung von Daten sind im Stand der Technik in zahlreichen Ausgestaltungen bekannt, insbesondere aus der WO 2005/050471 A2, deren Offenbarungen hiermit explizit referenziert werden.

Verfahren, Datenverarbeitungssysteme und/oder Datenverarbeitungsvorrichtungen der eingangs genannten Art finden im Rahmen von Suchanwendungen beziehungsweise - routinen, beispielsweise seitens Betriebssystemen und/oder seitens sogenannter Suchmaschinen, sowie im Rahmen der Organisation, Bereitstellung und/oder Auslieferung von Informationen Verwendung.

Üblicherweise werden Inhalte als Informationen repräsentierende Daten eines Datenbestandes maschinell verarbeitet, insbesondere um Anwendern als technisches Hilfsmittel zur Lösung von Aufgaben zur Verfügung gestellt zu werden und/oder zu dienen. Datenbestände im Sinne der vorliegenden Erfindung sind einfache, universell nutzbare, persistente Datenobjekte die insbesondere wie Dateien und/oder Dokumente in Betriebssystemen oder Datenbanken, Struktur-, Inhalts- und bedarfsweise Verwaltungsinformationen enthalten.

Bei Datenverarbeitungssystemen und/oder Datenverarbeitungsvorrichtungen sind die Datenbestände einem Datenverarbeitungssystem und/oder einer

Datenverarbeitungsvorrichtung üblicherweise über wenigstens eine Datenquelle, in der Regel einem in einem Datenverarbeitungssystem vorhandenen oder über ein Kommunikationsnetzwerk anschließbaren beziehungsweise verbindbaren Datenträger, beispielsweise einer Festplatte oder dergleichen Datenaufzeichnungsmittel, zugänglich.

Betriebssysteme arbeiten mit einer hierarchischen Ordnung von Dateien, beispielsweise in ihrem sogenannten Filesystem. Dabei sind die Dateien als Datenbestand in einer Baumstruktur in Verzeichnissen eingeordnet. Eine Navigation in den Dateien erfolgt in der Regel entlang einer aristotelischen Logik über die Namen der einzelnen Verzeichnisse bis hin zu einer Datei. Die Navigation kann dabei mehrere Schritte umfassen und beinhaltet ferner das Problem einer eindeutigen Zuordnung. Darüber hinaus wird bei Betriebssystemen die Verwaltung von Dateien von der Verwaltung von Daten, welche ausschließlich über auf Datenbanken oder dateibasierende Datenstrukturen, wie beispielsweise XML, zugreifende Anwendungsprogramme zugänglich sind, getrennt. Üblicherweise erfolgt die Trennung dabei entsprechend der technischen Implementation beziehungsweise Realisierung der Persistenz der jeweiligen Daten.

In datenbankgestützten Anwendungen kommen bisher relationale Datenbanken zum Einsatz, die statische Verknüpfungen von mit Daten versehenen Tabellen verwalten. Aufgrund der verwendeten statischen Verknüpfungen in den seitens Suchmaschinen verwalteten Tabellen, sind Änderungen in den Datenbeständen nicht beziehungsweise nur eingeschränkt und verzögert erfassbar. Die Auswertung beziehungsweise Verwendung der Daten muss vorausschauend festgelegt werden.

Suchmaschinen ermöglichen Anwendern in der Regel nur Datenbestände nach Stichwörtern beziehungsweise nach einer booleschen Kombination von Stichwörtern zu durchsuchen. Präzise Suchanfragen wie beispielsweise der Aufruf von Rechnungen oder dergleichen aus einem bestimmten Zeitraum oder dergleichen Abfragen sind nicht möglich.

Datenverarbeitungssysteme arbeiten darüber hinaus in der Regel mit einer statischen - das heißt fest vorgegebenen - hierarchisch strukturierten Menüstruktur die dem Anwender eine Auswahl von möglichen Funktionen zur Bedienung des Datenverarbeitungssystems bereitstellen. Bei Betriebssystemen, beispielsweise bei MacOS X der Firma Apple, werden ferner sogenannte Kontextmenüs verwendet. Dabei handelt es sich ebenfalls um hierarchisch strukturierte Menüstrukturen, die jedoch in Abhängigkeit der installierten Anwendungsprogramme wenigstens teilweise um entsprechende Menüpunkte zum Starten beziehungsweise Aufrufen einzelner Anwendungsprogramme und/oder von Funktionalitäten derselben ergänzbar sind. Abgesehen von der Ergänzbarkeit der Menüstrukturen sind diese in ihrer Nutzung dennoch statisch hierarchisch strukturiert. Die insbesondere bei Datenverarbeitungssystemen bisher gegebene statisch hierarchische Strukturierung von Menüstrukturen kann somit Nutzungsvorlieben eines Anwenders nicht beziehungsweise nur bedingt nachkommen. Eine Berücksichtigung des jeweiligen Benutzungskontextes seitens der Menüstrukturen, wobei insbesondere die Menüpunkte in einem Menü angeboten werden, die im Kontext der Situation beziehungsweise der aufgerufenen Inhalte Sinn macht beziehungsweise sinnvoll ist, ist nicht möglich, insbesondere nicht aufgrund der statisch hierarchischen Strukturierung der Menüs. Die Synchronisation von Informationen repräsentierenden Daten in Datenbeständen zwischen verschiedenen die Datenbestände gemeinsam nutzenden Datenverarbeitungsvorrichtungen ist - insbesondere angesichts der zunehmenden Verbreitung von mobil nutzbaren Datenverarbeitungsvorrichtungen wie sogenannten PDA's (PDA: Personal Digital Assistant) - ein wichtiger Bestandteil von Datenverarbeitungssystemen und ist beispielsweise in Form von sogenannten PIM- Systemen (PIM: Personal Information Management) in Datenverarbeitungssystemen integriert . Die Funktionalität der Synchronisation ist dabei bisher auf eine rein manuelle Auswahl von zu synchronisierenden Informationen beschränkt. Ein Anwender kann dabei beispielsweise durch manuelle Eingabe lediglich auswählen, welche beziehungsweise welchen Teil seiner seitens des Datenverarbeitungssystems verwalteten Kontaktadressen er synchronisieren will. Eine nähere beziehungsweise detailreichere Spezifizierung hinsichtlich einer inhaltlichen Beschränkung der zu synchronisierenden Informationen ist nicht möglich, insbesondere nicht als automatisierter Vorgang, der sich selbstständig dem Bedarf des Anwenders anpasst.

In Anbetracht dieses Standes der Technik liegt der vorliegenden Erfindung die Aufgabe zugrunde, die Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten unter Meidung der beschriebenen Nachteile zu verbessern, insbesondere hinsichtlich Art und Weise, Umfang sowie Handhabung der Erfassung von Zusammenhängen als auch der Nutzung der erfassten Zusammenhänge, insbesondere unter Berücksichtigung der jeweiligen anwenderindividuellen Nutzungen der Zusammenhänge.

Zur technischen Lösung wird mit der vorliegenden Erfindung ein Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandeserfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandeserzeugt wird, vorgeschlagen, wobei im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) nur solche Informationen repräsentierenden Daten für die Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt werden, die wenigstens einen Zusammenhang zu wenigstens einer vorgebbaren Information aufweisen.

Erfindungsgemäß wird so eine Kontextsuche realisiert, wobei nur solche Inhalte im Rahmen der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) berücksichtigt werden, die in einem Zusammenhang eines bestimmten Inhaltes stehen. Die erfindungsgemäße Kontextsuche erlaubt es so ein auffinden von Ergebnissen von Zusammenhangsanfragen mit Kontextabhängigkeit. Eine Suche ist somit kontextabhängig wesentlich verfeinert.

Eine besonders bevorzugte Ausgestaltung der Erfindung sieht vor, dass die Zusammenhangsanfrage als eine Anfrage an eine Suchmaschine erfolgt. Eine Suchmaschine im Sinne der vorliegenden Erfindung ist dabei insbesondere ein Programm zur Recherche von Dokumenten und/oder Datensätzen - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum eines Datenbestandes sind - die seitens einer Recheneinrichtung - auch Rechner beziehungsweise Computer genannt - oder in beziehungsweise über ein Rechnernetz, insbesondere dem Internet oder einem Intranet bereitgestellt beziehungsweise bereitgehalten werden. Im Rahmen einer erfindungsgemäßen Verfahrensnutzung der Zusammenhangsanfrage für beziehungsweise mit einer Suchmaschine wird vorteilhafterweise ein Schlüsselwort-Index für die Dokumentbasis - die im Sinne der vorliegenden Erfindung ein Ergebnis einer Suchanfrage beziehungsweise Zusammenhangsanfrage ist - erstellt, um Suchanfragen über Schlüsselwörter - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum der Zusammenhangsanfrage sind - mit einer nach Relevanz geordneten Trefferliste zu beantworten. Nach Eingabe eines oder mehrerer Suchbegriffe - die im Sinne der vorliegenden Erfindung ein eine Information repräsentierendes Datum der Zusammenhangsanfrage sind - wird dabei über die Suchmaschine eine Liste von Verweisen auf möglicherweise relevante Dokumente oder Datensätze - die im Sinne der vorliegenden Erfindung ein wenigstens eine Information repräsentierendes Datum eines Datenbestandes sind - geliefert.

Die Anfragen nach einem Zusammenhang zwischen den Inhalten Informationen repräsentierender Daten, Zusammenhangsanfragen im Sinne der vorliegenden Erfindung, sind vorteilhafterweise selbst Informationen und/oder Aktionen repräsentierende Daten. Dementsprechend werden erfindungsgemäß vorteilhafterweise ganz allgemein Zusammenhänge zwischen zwei aufeinanderfolgenden Inhalten als Informationen repräsentierenden Daten eines oder zweier Datenbestände erfasst und erfindungsgemäß deren Kontext zueinander berücksichtigt.

Der Erfindung liegt die Erkenntnis zugrunde, dass sich durch Berücksichtigung beziehungsweise Einbindung des Kontexts von beziehungsweise zwischen Inhalten Zusammenhangsanfragen weiter verbessern und optimieren lassen, insbesondere hinsichtlich der Nutzbarkeit für Anwender einer erfindungsgemäßen Zusammenhangserfassung. Erfindungsgemäß wird eine selbstlernende Lösung realisiert. Die Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten ist damit insgesamt verbessert, insbesondere hinsichtlich Art und Weise, Umfang sowie Handhabung der Erfassung von Zusammenhängen als auch der Nutzung der erfassten Zusammenhänge. Erfindungsgemäß sind dabei Zusammenhänge als Wissen verwaltbar.

Dabei wird durch die erfindungsgemäße Verfahrensführung die Erkenntnis umgesetzt, dass Wissen durch die Verknüpfung von Inhalten entsteht. Im Gegensatz zu einer Verwendung von Begriffsnetzen, die in einer sogenannten Topic-Map gemäß ISO/IEC 13250 kodiert und beispielsweise branchenbezogen von Beratungsunternehmen oder vertikalisierten Wissensmanagementlösungen von Softwareherstellern erstellt werden, wird mit der Erfindung eine selbstlernende Lösung bereitgestellt, welche sich selbst an die Bedürfnisse und Vorlieben des jeweiligen Anwenders beziehungsweise Nutzers anpasst. Dementsprechend können die Funktionalitäten des erfindungsgemäßen Verfahrens einfach und problemlos in bestehende Lösungen, insbesondere Datenverarbeitungssysteme und/oder Datenverarbeitungsvorrichtungen, integriert werden. Aufwendige und schulungsintensive Einführungen einer erfindungsgemäßen Lösung in bestehende oder neue Projekte können entfallen. Die erfindungsgemäße Lösung ermöglicht es einem Anwender, einfach und schnell, von einem Inhalt zu über Zusammenhänge verknüpften anderen Inhalten zu kommen. Da vorteilhafterweise alle Inhalte über Zusammenhänge, insbesondere in erfindungsgemäßen Gruppierungen, mehrfach verknüpfbar sind, kann eine Navigation im Rahmen einer Zusammenhangsanfrage vorteilhafterweise auch wieder zum Ausgangspunkt der Anfrage zurückführen, das heißt zu der Zusammenhangsanfrage selbst. Der Anwender kann so vorteilhafterweise Sinnzusammenhänge erkennen, insbesondere zu beziehungsweise zwischen seinen Nutzungen, die beispielsweise für seinen augenblicklichen Interessenfokus relevant sind. In einer festgelegten, statischen hierarchischen Ordnung von Datenverarbeitungssystemen, wie sie beispielsweise bei in der Regel Baumstrukturen für die Auswahl von Inhalten nützenden Betriebssystemen und deren Anwendungsprogrammen gegeben ist, ist dies nicht möglich, da diese eine Berücksichtigung neuer Ordnungsstrukturen nicht zu lassen.

Während Anwender von Datenverarbeitungssystemen ansonsten über vom Datenverarbeitungssystem bereitgestellte Eingabemasken Daten eingeben, ermöglicht es die erfindungsgemäße Lösung vorteilhafterweise Daten entsprechend eines aktuellen Bedarfs des Anwenders zu beschreiben. So wird die Beschreibung einer Adresse oder eines Projektes durch die erfindungsgemäße dynamische Datenhaltung und die Gestaltung einer entsprechenden graphischen Benutzeroberfläche hinsichtlich der Nutzungshandhabung für Anwender äußerst flexibel und individuell, insbesondere da die Beschreibung einer Adresse oder eines Projektes nicht wie ansonsten üblich, starr festgelegt wird.

Vorteilhafterweise wird die vorgebbare Information zusammen mit einem erfassten Zusammenhang als eine Information repräsentierendes Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt. Im Rahmen einer Zusammenhanganfrage kann ein Anwender also einfach die vorgebbare Information gemeinsam mit einem Inhalt aus einem bereits zuvor erfassten Ergebnis einer Zusammenhangsanfrage eingeben und an den das Verfahren umsetzenden Prozess übergeben.

In einer besonders bevorzugten Ausgestaltung der Erfindung ist vorgesehen, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zunächst eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt, anschließend eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt und schließlich das wenigstens eine Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfasst und wiedergegeben wird.

Eine weitere vorteilhafte Ausgestaltung der Erfindung ist dadurch gekennzeichnet, dass die vorgebbare Information eine von einem Anwender und/oder einer Anwendung wählbare Abfolge von Buchstaben und Sonderzeichen ist (Suchstring).

Eine weitere besonders vorteilhafte Ausgestaltung der Erfindung ist, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zwischen den wenigstens eine Information repräsentierenden Daten einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) automatisch eine Aussagenmenge im Sinne von Subjekt- Prädikat-Objekt-Beziehungen erzeugt wird, so dass natürlichsprachliche Anfragen nach einem Zusammenhang (Zusammenhangsanfragen) erfolgen können. Erfindungsgemäß wird dabei eine Zusammenhangsanfrage mit einer impliziten Ontologie (ontologische Zusammenhangsanfrage) realisierbar.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird.

Eine vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Wörter in der Liste (Wortliste) von in dem Volltext enthaltenen Wörtern nach der Häufigkeit ihres Vorhandenseins in dem Volltext aufsteigend sortiert werden und die sortierten Wörter unter Berücksichtigung der Häufigkeit ihres Vorhandenseins in dem Volltext als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung ist vorgesehen, dass eine vorgebbare Anzahl der nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortierten Wörter in einer Liste (sortierte Wortliste) erfasst und die Wörter der Liste (sortierte Wortliste) als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden. Vorteilhafterweise enthält die Liste (sortierte Wortliste) die Wörter mit der geringsten Häufigkeit ihres Vorhandenseins in dem Volltext. In einer weiteren Ausgestaltung der Erfindung werden die Wörter vorteilhafterweise nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortiert. Die vorgebbare Anzahl ist vorzugsweise auf bis zu 32 beschränkt, insbesondere da durch die vorgebbare Anzahl die Anzahl der für eine Zusammenhangsanfrage nutzbaren, vorzugsweise logisch miteinander verknüpfbaren Attribute definierbar ist und darüber hinaus so - wie empirisch festgestellt wurde - die Leistungsfähigkeit der erfindungsgemäßen Lösung im Einsatz seitens von Datenverarbeitungssystemen optimierbar ist.

Gemäß einem weiteren Vorschlag der Erfindung werden die Wörter der Liste zumindest teilweise, vorzugsweise vollständig - das heißt die gesamte Wortliste - parallel als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet. Dabei werden vorteilhafterweise die Wörter der sortierten Wortliste miteinander logisch verknüpft, vorzugsweise mit einer Booleschen Oder- Verknüpfung, und die Verknüpfung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet. Als Ergebnis liefert die Zusammenhanganfrage vorzugsweise über eine Suchmaschine dann einen Ähnlichkeitswert. Der Ähnlichkeitswert ist vorteilhafterweise eine prozentuale Angabe bezogen auf die Ähnlichkeit, wobei bei einem Ähnlichkeitswert von 100 % sämtliche der für die Anfrage als Attribute genutzten Wörter aus der sortierten Wörteiiiste in dem angefragten Zusammenhang, besonders bevorzugt zwischen zwei Volltexten beziehungsweise Volltextdokumenten, vorkommen und/oder relevant sind und bei einem Ähnlichkeitswert von 0 % keins der für die Anfrage als Attribute genutzten Wörter aus der sortierten Wörterliste in dem angefragten Zusammenhang, besonders bevorzugt zwischen zwei Volltexten beziehungsweise Volltextdokumenten, vorkommt und/oder ähnlich ist beziehungsweise hinsichtlich der Ähnlichkeit relevant ist. Eine Alternative und/oder ergänzende Ausgestaltung der Erfindung sieht vorteilhafterweise vor, dass die Wörter der Liste der Reihe nach als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.

Vorteilhafterweise werden die Verknüpfungen wie und vorzugsweise mit den dynamisch erfassten Zusammenhängen erfasst. Im Gegensatz relationalen Datenbanken, bei denen Verknüpfungen von mit Daten versehenen Tabellen verwaltet werden, werden bei der erfindungsgemäßen Lösung Verknüpfungen der erfassten Zusammenhänge dynamisch erstellt, vorzugsweise in n-zu-n-Relationen, wobei die Zusammenhänge verfahrensgemäß vorteilhafterweise selbstständig ermittelt und gepflegt, das heißt insbesondere auf dem aktuellsten Stand gehalten werden.

Erfindungsgemäß werden vorteilhafterweise alle im System vorhandenen und/oder angeschlossenen beziehungsweise einbindbaren Datenbestände indiziert. Aus Anwendersicht wird so eine Auflösung der ansonsten beispielsweise bei Suchmaschinen gegebenen Trennung von Datenbank und Dateisystem geschaffen beziehungsweise bereitgestellt. Die erfindungsgemäße Lösung ermöglicht somit unabhängig der technischen Realisierung der Persistenz von Daten, ein Durchsuchen von Inhalten. Dabei wird erfindungsgemäß quasi eine Verbindung von Indexen und Datenbanken geschaffen, die verschiedene Suchoptionen nach Zusammenhängen ermöglicht, insbesondere eine Integration präziser Suchanfragen und Voütextsucnen. Suchanfrageπ werden analysiert und für eine interne Abfrage der Datenquellen umgewandelt.

Die Erfindungsgemäße Lösung ermöglicht vorteilhafterweise eine Einbindung von Datenquellen, ohne Daten replizieren oder Ressourcen für Redundanzen einzusetzen zu müssen. Ein erfindungsgemäßes Datenverarbeitungssystem weist dazu vorteilhafterweise eine Strukturierung auf, die es ermöglicht, Datenquellen einzubinden, ohne Daten replizieren oder Ressourcen für Redundanzen einzusetzen zu müssen (Plug-in-Struktur des Datenverarbeitungssystems). Die ansonsten einen hohen Entwicklungsaufwand und große Systemressourcen erfordernde Anbindung von Datenquellen zur Datenmigration kann somit vorteilhafterweise entfallen.

Gemäß einem weiteren Vorschlag der Erfindung berücksichtigt die erfindungsgemäße Lösung auch lokale Datenbestände die beispielsweise verschiedene Anwender in einem Computer-Netzwerk miteinander zur Nutzung teilen können, beispielsweise verschiedene Mitarbeiter in einem Firmennetzwerk, insbesondere einem Client-Server- Netzwerk. Inhalte und deren Zusammenhänge sind so in einem Firmennetzwerk beispielsweise für Marktforschungs- und/oder der Wettbewerbsanalysen oder dergleichen Anwendungen nutzbar.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung wird die Verknüpfung durch einen syntaktischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) und des wenigstens einen Datenbestandes erzeugt. Die Besonderheit der erfindungsgemäßen Technik ist dabei ein syntaktischer Vergleich auf der Basis von in einfügbaren Modulen, sogenannten Plug-ins jeweils beschreibbaren Regeln (Keys). Das hat zwei entscheidende Vorteile: Zum einen lassen sich valide, vom Anwender spezifizierte Zusammenhänge (beispielsweise Geschäftsregeln) definieren und auf den Datenbestand anwenden. Das erlaubt zugleich eine flexible Datenstruktur. Zum anderen können durch die Regeln Zusammenhänge zwischen Informationen und Handlungsoptionen (dynamische Funktionen) hergestellt werden. Hierbei kommt erfindungsgemäß eine Lösung zum Einsatz, bei dem die Information von Aktionen seitens eines Anwenders oder automatischen Prozesses allen Datenquellen verwaltenden Systemkomponenten (Plug-ins) mitgeteilt wird, um gegebenenfalls selbst Aktionen auszulösen oder Veränderungen am Datenbestand vorzunehmen. Vorteilhafterweise kommt die syntaktische Analyse in Kombination mit weiteren Analysen zur Anwendung, um schnelle Ergebnisse und ein unmittelbar einsatzfähiges Gesamtsystem zu realisieren.

Eine weitere vorteilhafte Ausgestaltung der Erfindung sieht vor, dass die Verknüpfung durch einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) und des wenigstens einen Datenbestandes erzeugt wird. Im Rahmen des semantischen Vergleiches wird dabei vorteilhafterweise ein semantisches Netz, aus dem Zusammenhänge erfassbar sind, erzeugt.

In einer besonders vorteilhaften Ausgestaltung der Erfindung werden die verschiedenen Möglichkeiten der Verknüpfungserzeugung kombinativ angewendet. Im Unterschied zu neuronalen Netzen arbeitet die erfindungsgemäße Lösung mit einer Kombination von syntaktischen und/oder semantischen Analyseprozessen, um eine hohe Lerngeschwindigkeit zu erzielen.

Gemäß einem vorteilhaften Vorschlag der Erfindung wird die Verknüpfung durch manuelle Eingabe erzeugt, vorzugsweise durch eine Auswahleingabe. In einer weiteren besonders vorteilhaften Ausgestaltung der Erfindung sind weitere Vergleiche zur Verknüpfungserfassung in das erfindungsgemäße Datenverarbeitungssystem integrierbar. So kann der Anwender beispielsweise seinen individuellen Bedürfnissen entsprechend zusätzlich zu den genannten Möglichkeiten einer Verknüpfungserfassung weitere Analyseverfahren und/oder -methoden integrieren und das Datenverarbeitungssystem entsprechend um diese erweitern.

Ein weiterer vorteilhafter Vorschlag der Erfindung ist gekennzeichnet durch wenigstens eine elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage). Eine besonders vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch eine Erfassung von elektronischen Nutzungen von wenigstens eine Information repräsentierenden Daten wenigstens eines Datenbestandes nach Zeit und/oder Häufigkeit und Nutzung dieser Erfassung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage). Eine weitere vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch wenigstens eine Erfassung eines Zusammenhangs als elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums eines Datenbestandes. Eine weitere Ausgestaltung der Erfindung ist gekennzeichnet durch Nutzung wenigstens eines Verweises auf wenigstens einen Informationen repräsentierende Daten umfassenden Datenbestand. Mit diesen Maßnahmsn ist vorteilhafterweise einzeln oder in Kombination beispielsweise die Nutzung einer Datei mit einem Anwendungsprogramm als Zusammenhang erfassbar. Umfang und Handhabung der erfindungsgemäßen Lösung lassen sich so weiter verbessern und Anwendernutzungen weiter individualisieren. Für die Analyse werden erfindungsgemäß vorteilhafterweise Aktionen, Zeitpunkt und Folge des Anwenders sowie Ergebnisse von Datenveränderungen protokolliert. Die Datenveränderungen werden vorteilhafterweise mit einem sogenannten Crawler überprüft.

Vorteilhafterweise erfolgt die Zusammenhangserfassung gewichtet. Dadurch ist die Dynamik der Erfassung von Zusammenhängen vorteilhafterweise weiter erhöhbar oder abschwächbar. In einer bevorzugten Ausgestaltung der Erfindung wird die Zusammenhangsgewichtung wenigstens eines bereits als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand erfassten Zusammenhangs in Abhängigkeit der Zusammenhangsgewichtung eines nachfolgend erfassten Zusammenhangs verändert, vorzugsweise wird die

Zusammenhangsgewichtung erhöht (inkrementiert) oder erniedrigt (dekrementiert). In einer besonders bevorzugten Ausgestaltung der Erfindung erfolgt die Gewichtung nicht nur nach einer prozentualen Treffergenauigkeit einer Suchanfrage, sondern anhand des von der erfindungsgemäßen Lösung durch dynamische Erfassung gebildeten semantischen Netzes, welches durch zahlreiche Parameter selbstständig und fortlaufend optimiert wird, insbesondere durch kontinuierliche Aktualisierung der erfassten Zusammenhänge. Details dieses iterativen, mehrere Bifurkationen umfassenden Prozesses ergeben sich insbesondere im Zusammenhang mit der unten noch folgenden Beschreibung der in den Figuren der Ausführungsbeispiele dargestellten Flussdiagramme, insbesondere aus Figur 14.

Vorteilhafterweise wird wenigstens ein erfasster Zusammenhang wiedergegeben, vorzugsweise seitens einer optischen und/oder akustischen Anzeigeeinrichtung des erfindungsgemäßen Datenverarbeitungssystems beziehungsweise einer erfindungsgemäßen Datenverarbeitungsvorrichtung. Gemäß einem weiteren vorteilhaften Vorschlag der Erfindung wird mit dem erfassten Zusammenhang dessen Gewichtung wiedergegeben.

In einer weiteren Ausgestaltung der Erfindung werden Gewichtungen mit einer Verfallszeit versehen, um Zusammenhänge in Abhängigkeit der Zeit abzuwerten. Da jeder Anwender die erfindungsgemäße Lösung unterschiedlich intensiv nutzen wird, ist es zweckmäßig für die Verfallszeit einen Zähler, der als kleinste Zeiteinheit eine Aktion verwendet, zu verwenden. Eine Aktion ist in diesem Fall, der Aufruf eines Inhaltes vorzugsweise einschließlich der Bearbeitung desselben und/oder dem Anlegen eines neuen Inhaltes vom Datenverarbeitungssystem aus. In einer weiteren Ausgestaltung der Erfindung findet die Zeitdauer, innerhalb der ein Anwender einen Zusammenhang genutzt hat, beispielsweise angeschaut hat, bei der Bestimmung der Verfallszeit Verwendung. Vorteilhafterweise verlängert sich die Verfallszeit einer Gewichtung eines Zusammenhangs, je länger und/oder häufiger der Anwender sich mit einem Inhalt beschäftigt hat, da dessen Bedeutung für den Anwender umso höher ist beziehungsweise sein muss.

Gegenstand der vorliegenden Erfindung ist ferner ein Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, welches ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen.

Eine weitere vorteilhafte Ausgestaltung der Erfindung ist gekennzeichnet durch eine graphische Benutzerschnittstelle zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen. Vorteilhafterweise ist die graphische Benutzerschnittstelle weiter zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet und/oder eingerichtet. Die Benutzerschnittstelle stellt vorteilhafterweise eine graphische Benutzeroberfläche bereit, die eine handlungsorientierte Navigation ermöglicht. Das heißt, dass an Stelle von ansonsten bei hierarchisch strukturierten Menüstrukturen dem Anwender zur Auswahl angebotenen möglichen Funktionen erfindungsgemäß Handlungsoptionen zur Auswahl angeboten werden, die im Kontext der Situation beziehungsweise aufgerufenen Inhalte sinnvoll ist beziehungsweise Sinn macht. Gemäß einem besonders bevorzugten Vorschlag der Erfindung nutzt die handlungsorientierte Navigation eine binäre Grundstruktur, die auf der einen Seite eine Eingabe von Inhalten und auf der anderen Seite eine Ausgabe von Inhalten ermöglicht. Vorteilhafterweise wird diese handlungsorientierte, binäre Navigation mit geräteübergreifender Gültigkeit, das heißt unabhängig von der jeweiligen Datenverarbeitungsvorrichtung realisiert.

In einer besonders bevorzugten Ausgestaltung der Erfindung teilt die graphische Benutzerschnittstelle den zur Wiedergabe seitens einer optischen Anzeigeeinrichtung zur Verfügung stehenden optischen Anzeigebereich in drei Bereiche auf, wobei in einem ersten Bereich das Ergebnis einer Selektion von Informationen repräsentierenden Daten, in einem zweiten Bereich mit einer Anzeige eine aus der Selektion im ersten Bereich ausgewählte Information und in einem dritten Bereich, der wenigstens eine Zusammenhang wiedergegeben wird. Die Wiedergabe der aus der Selektion im ersten Bereich ausgewählten Information im zweiten Bereich erfolgt vorzugsweise als Vorschau oder als Vollansicht der Information. Der Anzeigebereich kann dabei auch in Form eines Fensters seitens der Anzeigeeinrichtung bereitgestellt werden. Ein weiterer Vorschlag der Erfindung ist gekennzeichnet durch eine horizontale oder vertikale Aufteilung. Vorteilhafterweise ist die Größe der Bereiche ein- und/oder verstellbar.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung erfolgt die Wiedergabe zumindest teilweise in auswählbarer Form, das heißt die wiedergegebenen Zusammenhänge sind beispielsweise selbst als Menüpunkt für Handlungsoptionen und/oder als Verknüpfung nach Art eines Links ausgebildet, und durch Auswahl, beispielsweise durch sogenanntes "Anklicken", entsprechend nutzbar. Vorteilhafterweise werden Inhalte beziehungsweise Inhalte aufweisende Dokumente im Rahmen einer Vorschau seitens des Datenverarbeitungssystems wiedergegeben. Dadurch werden die Orientierungsmöglichkeiten für Anwender in den Zusammenhängen und den Inhalten weiter verbessert. Vorteilhafterweise ist die Vorschau während des Navigierens beziehungsweise der Steuerung durch Datenbestände wiedergebbar, so dass der Anwender einen schnellen Überblick über Zusammenhänge erlangen kann. Vorteilhafterweise enthält diese Vorschau eine Zusammenfassung des Inhaltes, beispielsweise eine hinsichtlich der dargestellten Elemente beziehungsweise Bestandteile reduzierte Internetseite oder einen zusammengefassten Text. Dadurch sind ansonsten gegebene Beschränkungen, die beispielsweise bei eine Vorschau auf Dokumente in Form von kleinen Bildern (sogenannte Thumbnails), in Form von Anfängen von Texten oder in Form von Programm- beziehungsweise Dokumentensymbolen (sogenannten Icons) gebenden Betriebssystemen gegeben sind, erfindungsgemäß beseitigbar.

In einer besonders bevorzugten Ausgestaltung der Erfindung wird das erfindungsgemäße Datenverarbeitungssystem, vorzugsweise im Rahmen einer auf einem Rechner laufenden Software, zur dynamischen Organisation von Informationen und/oder Prozessen eingesetzt.

Vorteilhafterweise ist das erfindungsgemäße Datenverarbeitungssystem Bestandteil einer Datenbankanwendung oder zumindest zusammen mit einer Datenbankanwendung nutzbar.

Gegenstand der vorliegenden Erfindung ist ferner eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, welche ausgebildet und/oder eingerichtet ist ein erfindungsgemäßes Verfahren zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines erfindungsgemäßen Datenverarbeitungssystems.

In einer weiteren vorteilhaften Ausgestaltung der Erfindung wird eine Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, bereitgestellt, die gekennzeichnet ist durch eine Nutzung eines erfindungsgemäßen Datenverarbeitungssystems. In einer vorteilhaften Ausgestaltung der Erfindung ist die Datenverarbeitungsvorrichtung als mobiles Endgerät ausgebildet, vorzugsweise als ein in Mobilfunknetzen nutzbares beziehungsweise betreibbares mobiles Endgerät. Besonders bevorzugt ist eine Ausgestaltung der Datenverarbeitungsvorrichtung als Mobilfunktelefon.

Vorteilhafterweise ist das erfindungsgemäße Datenverarbeitungssystem derart ausgebildet, dass dieses mit einer Java VM lauffähig ist, so dass das Datenverarbeitungssystem prinzipiell auf allen mobilen Endgeräten nutzbar ist. In einer besonders bevorzugten Ausgestaltung der Erfindung unterstützt die Datenverarbeitungsvorrichtung dabei die besondere Ergonomie des Datenverarbeitungssystems.

Die erfindungsgemäße Lösung beinhaltet und realisiert in einer bevorzugten Ausgestaltung der Erfindung vorteilhafterweise die nachfolgenden Verfahren, Systeme und/oder Vorrichtungen zur Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten:

Basierend auf Erkenntnissen der Linguistik, der Epistemologie und der Neurologie, werden Zusammenhänge zwischen Inhalten (Informationen repräsentierenden Daten) erfasst, wobei die Zusammenhänge entsprechend neuronalen Mustern beziehungsweise Assoziationen im menschlichen Gehirn, dynamisch als modifizierbare, vorteilhafterweise verstärkbare oder abschwächbare, n-zu-n-Verknüpfungen (n: natürliche, ganze Zahi) erfasst werden.

So wie das menschliche Gehirn Reize seiner Sinnesorgane als mentale Präsentate zu mentalen Repräsentaten verdichtet beziehungsweise verarbeitet, beispielsweise leitet das menschliche Gehirn mittels des visuellen Wahrnehmungssystems aus synchron aktivierten Reizen ein bewegtes Objekt ab, werden bei der erfindungsgemäßen Lösung Zusammenhänge zwischen Inhalten (Informationen repräsentierenden Daten) erfasst. In Iterationsprozessen lassen sich auf Basis der dementsprechend erfassten dynamischen Zusammenhänge Informationen beziehungsweise Inhalte zu Wissen verdichten. Ferner sind die so erfassten Zusammenhänge erfindungsgemäß selbst in Form von Informationen repräsentierenden Daten als neuer Inhalt nutzbar, beispielsweise als Handlungsoptionen, die dem Anwender zur Auswahl angeboten werden oder im Rahmen automatisierter Abläufe in Prozesssteuerungen oder dergleichen einfließen. Vorteilhafterweise ist die erfindungsgemäße Lösung dabei pragmatisch und selbstorganisierend, so dass keine Konfigurationen durch den Anwender erforderlich sind. Dabei erlaubt die erfindungsgemäße Lösung dennoch offene Steuerungen durch den Anwender.

Vorteilhafterweise werden im Rahmen der Erfassung von Zusammenhängen verschiedene Methoden zum Herstellen, Modifizieren und Auflösen von dynamischen n- zu-n-Verknϋpfungen kombinativ miteinander angewendet, insbesondere Verknüpfungen durch manuelle Eingaben, Verknüpfungen durch syntaktische Vergleiche und/oder Verknüpfungen durch semantische Vergleiche. Ferner können mathematischstatistische Analyseverfahren zur Erfassung von Zusammenhängen Verwendung finden. Vorteilhafterweise werden die durch Verknüpfungen erfassten Zusammenhänge mit einer Gewichtung versehen. Die Gewichtung erfolgt dabei vorteilhafterweise mit Werten, vorzugsweise mit Werten zwischen 0 und 1 , entsprechend keinem Zusammenhang (Wert 0) oder einem unmittelbaren Zusammenhang (Wert 1 ).

Zusammenhangsverknüpfungen durch manuelle Eingaben seitens des Anwenders kann mit dem größtmöglichen Gewichtungswert, vorliegend 1 , versehen, dass heißt die Gewichtung der Verknüpfung bekommt den höchsten und fixen Wert Dabei findet insbesondere die nachfolgend noch näher beschriebene Ergonomie handlungsorientierter Logik Verwendung. Als Alternative kann ein kleinerer Wert gesetzt werden, um die Verknüpfung in das semantische Netz einfließen zu lassen.

Bei Zusammenhangsverknüpfungen durch syntaktische Vergleiche und/oder Regeln werden die Inhalte (Informationen repräsentierenden Daten) von Dateien und/oder Datenbanken oder definierte Teile von Inhalten als Datenbestand nach übereinstimmenden Worten, Wortbestandteilen beziehungsweise Zeichenketten durchsucht, die den Inhalten (Informationen repräsentierenden Daten) der Zusammenhangsanfrage entsprechen. Durch diese schnelle und valide Verknüpfung, die eine Art Grundgerüst für Zusammenhänge bereitstellt, wird die selbstständige Erfassung von Zusammenhängen, das sogenannte "Selbstlernen" der erfindungsgemäßen Lösung, beschleunigt.

Bei Zusammenhangsverknüpfungen durch semantische Vergleiche werden dynamische Zusammenhänge vorteilhafterweise anhand oder mittels der Folge von Inhalten (Informationen repräsentierende Daten) von Datenbeständen (Dateien und/oder Datenbanken) und/oder von Nutzungen von Inhalten (Informationen repräsentierende Daten) von Datenbeständen (Dateien und/oder Datenbanken) erfasst. Dabei nutzt die erfindungsgemäße Lösung vorteilhafterweise Erkenntnisse der impliziten Semantik. Als implizit wird die Semantik bezeichnet, weil diese vorliegend nicht explizit durch ein Begriffsnetz (Topic Map) oder semantischen Regeln der Linguistik modelliert wird, sondern nach der Erkenntnis, dass Zusammenhänge zwischen Inhalten wie Bedeutungen in einer Sprache nicht per definitionem entstehen, sondern dynamisch durch den Gebrauch derselben. So entstehen Bedeutungen einer Sprache dadurch, dass die Sprache verwendet wird und erfindungsgemäße Zusammenhänge zwischen Inhalten dadurch, dass diese Inhalte genutzt werden. Semantik ist insofern nicht von der Sprachpraxis beziehungsweise vorliegend von den Inhalten abstrahierbar.

In der technischen Realisierung von Zusammenhangsverknüpfungen durch semantisches Vergleichen erhält jede dynamische Verknüpfung systemintern einen Wert zwischen 0 und 1 , wobei der Wert 0 anzeigt, dass kein Zusammenhang besteht und der Wert 1 einen unmittelbaren Zusammenhang anzeigt, welcher beispielsweise manuell oder durch syntaktisches Vergleichen hergestellt wurde. Die erfindungsgemäße Lösung protokolliert alle Aktionen des Anwenders mit dem Datenverarbeitungssystem beziehungsweise die Folge aller aufgerufenen oder genutzten Inhalte, beispielsweise editierte Inhalte. Als Inhalte werden - wie bereits erläutert - Informationen repräsentierende Daten eines beliebigen Datenbestandes, beispielsweise einer Datei und/oder einer Datenbank, verstanden, die in beziehungsweise aus unterschiedlichen Datenformaten und aus unterschiedlichen Datenquellen stammen können.

Folgen zwei Inhalte aufeinander, entsteht eine latente Verknüpfung. Taucht diese Folge mehrfach auf wird die Verknüpfung verstärkt. Jede Verknüpfung ist vorteilhafterweise ferner zugleich mit einer Verfallszeit einer vorgebbaren Zeiteinheit versehen, wobei in einer Zeiteinheit der Wert einer Verknüpfung abgeschwächt wird und letztendlich nach mehreren Zeiteinheiten gegen den Wert 0 tendiert.

Über die unmittelbare Folge von zwei Inhalten hinaus sind seitens der erfindungsgemäßen Lösung vorteilhafterweise Gruppierungen von Inhaltsaufrufen, die ein Muster bilden, gegeben. Unter Muster wird dabei eine Folge von Inhaltsaufrufen verstanden, die unabhängig von ihrer Reihenfolge wiederkehren. Die Muster können von unterschiedlicher Größe beziehungsweise Zahl der Inhalte pro Folge sein und vorteilhafterweise ein sogenanntes Cluster bilden, welches über den Zusammenhang hinaus auf einer semantischen Metaebene ein Thema bildet. Ein solches Thema wäre wiederum beispielsweise als Zusammenhangsanfrage mit Hilfe eines syntaktischen Vergleichs zur Erfassung benennbar.

Ferner ist die erfindungsgemäße Lösung in der Lage, die Relevanz von erfassten Zusammenhängen für den jeweiligen Anwender durch den semantischen Vergleich zu bestimmen. Dadurch vermeidet die erfindungsgemäße Lösung eine übermäßige Informationsflut und ist in der Lage, Zusammenhangsanfragen des Anwenders präziser und fokussierter zu beantworten. Vorteilhafterweise kann die Relevanz von der erfindungsgemäßen Lösung ferner zu einer selbstorganisierenden Pflege des Datenverarbeitungssystem genutzt werden, beispielsweise um nicht genutzte, alte und/oder unwichtige beziehungsweise unwichtig gewordene Daten, die ansonsten das Datenverarbeitungssystem belasten würden, zu entfernen.

Bei Zusammenhangsverknüpfungen durch semantisches Vergleichen lassen sich durch entsprechende Ausgestaltung vorteilhafterweise Inhalte und/oder Nutzungen von Inhalten nach individuellen Interessen eines Anwenders analysieren, nachfolgend Interessen- beziehungsweise Aktionsanalyse genannt.

Bei einer Interessenanalyse wird untersucht welche Inhaltskategorien der Anwender vorzugsweise im Zusammenhang benötigt. Auf diese Weise trainiert die erfindungsgemäße Lösung die anwenderspezifischen Regeln für die syntaktische Analyse der Inhalte. Benötigt der Anwender beispielsweise Rechnungen und Aufträge wenn er einen Adresssatz aufruft, werden diese Beziehungen seitens des erfindungsgemäßen Datenverarbeitungssystems auch vorzugsweise angezeigt. Unter Inhaltskategorien versteht die erfindungsgemäße Lösung Inhalte, die formale Ähnlichkeit haben, beispielsweise elektronische Post (E-Mail), Adressen, Rechnungen, Aufträge, Projektplanungen, Termine, und/oder dergleichen. Wie bei semantischen Vergleichen werden die Ergebnisse der Interessenanalyse durch ein dynamisches Netz repräsentiert, dessen Beziehungen verstärkbar oder abschwächbar sind.

Durch diese Interessenanalyse lässt sich ein engerer Fokus auf die den Anwender interessierenden Inhalte, Nutzungen von Inhalten und/oder Aspekte eines Themas von Inhalten eingrenzen. Unter Thema ist dabei eine Gruppe von Inhalten zu verstehen, die - wie bereits erläutert - im Rahmen eines semantischen Vergleichs identifiziert und zusammengefasst wurden oder die sich aus einem abgefragten und erfassten Zusammenhang ergibt. Die Zusammenhangsanfrage kann dabei vorteilhafterweise auf unterschiedliche Art und Weise initiiert werden, beispielsweise durch dynamisch erfasste Nutzungen des Datenverarbeitungssystems durch den Anwender oder durch eine manuell oder - bei Integration einer Spracherkennung und natürlichsprachliche Interpretation seitens des erfindungsgemäßen Datenverarbeitungssystems - mündlich gestellte Zusammenhangsanfrage, beispielsweise in einem dafür vorgesehenen Suchfeld seitens einer graphischen Benutzerschnittstelle zur Steuerung des erfindungsgemäßen Datenverarbeitungssystems. Bei einer Aktionsanalyse wird untersucht welche Nutzungen von Inhalten der Anwender vorzugsweise im Zusammenhang benötigt. Es werden somit nicht die Inhalte, sondern die mit den Inhalten verbundenen Handlungen, die vorteilhafterweise zu Handlungsoptionen in Abhängigkeit von Variablen wie Inhalt, Inhaltstyp oder Thema seitens der erfindungsgemäßen Lösung aufbereitet werden, vernetzt erfasst. Für jeden aufgerufenen Inhalt oder eine Zusammenhangsanfrage ist die erfindungsgemäße Lösung in der Lage, dynamisch Handlungsoptionen anzubieten, die in dem jeweiligen Fall für den Anwender Sinn machen beziehungsweise aufgrund seiner üblichen Aktionsweise besonders wahrscheinlich sind. So macht es beispielsweise Sinn, dass in einem entsprechenden Datenverarbeitungssystem oder dergleichen Anwendung eine erstellte Rechnung verbucht wird oder auf eine E-Mail eine Antwort erfolgen kann.

Bei einer vorteilhaften Analyse nach Mustern in den Inhalten und/oder deren Nutzungen wird vorliegend vorteilhafterweise ein sogenannter Pattern Analyzer verwendet, ein Prozess, welcher in unstrukturierten Inhalten nach Mustern, die er als eigenständigen Inhalt erkennt oder für eine Zusammenfassung von Inhalten nutzt, sucht.

So erkennt der sogenannte Pattern Analyzer beispielsweise eine Adresse oder ein Bild im Text und kann diese Informationen nutzen, um Sie als eigenständigen Inhalt verfügbar zu machen. Internetseiten können auf diese weise zu einer automatisierten Addressrecherche genutzt werden. Damit greift der Pattern Analyzer vorteilhafterweise die Konzepte der beschriebenen erfindungsgemäßen semantischen Analyse auf. Vorteühafterweise werden ausgewählte Inhalte, beispielsweise E-Mails, automatisiert ausgewertet und als strukturierte Information bereitgestellt.

Wie oben bereits erläutert überprüft der Analyzer im Anschluss an die semantische Analyse, ob es nun Verknüpfungen zwischen den Links gibt und ob ein Meta-Link etabliert werden kann.

Für die Erstellung von Metainhalten beziehungsweise für die Identifikation von Themen überprüft der Semantic Analyzer zunächst wie viele Links zu einem Inhalt bestehen. Ist eine kritische Zahl, die dynamisch definierbar ist, erreicht und existiert noch kein Metainhalt, der die Menge der Links des vom Analyzer untersuchten Inhaltes als Teilmenge seiner Links enthält, wird ein neuer Metainhalt erstellt. Dafür werden die einzelnen Inhalte zusammengeführt und zusammengeführt. Das kann vorteilhafterweise mit dem Pattern Analyzer oder anderen Analyseverfahren beziehungsweise -methoden erfolgen. Existiert ein Thema und wird die kritische Zahl der Verknüpfungen unterschritten, wird der Metainhalt gelöscht. Metainhalte können vorteilhafterweise über ein entsprechendes Plug-in verwaltet werden.

Die erfindungsgemäße Lösung ist prinzipiell in der Lage, unbegrenzte Datenbestände in Form von Dateien und/oder Datenbanken unterschiedlicher Formate und aus verschiedenen Datenquellen in das Datenverarbeitungssystem einzubinden. Dabei sollen die Datenquellen weder importiert noch verändert werden, um vorteilhafterweise in ihrem ursprünglichen Systemkontext funktionsfähig und nutzbar zu bleiben. Das dient der Investitionssicherheit und beschleunigt beziehungsweise unterstützt ferner eine Implementierung der erfindungsgemäßen Lösung. Dazu weist das erfindungsgemäße Datenverarbeitungssystem vorteilhafterweise eine zentrale Datenverwaltung - nachfolgend "Repository" genannt - auf, welche Verweise auf die verschiedenen Datenbestände und Datenquellen enthält. Dabei werden nicht die kompletten Inhalte gespeichert, sondern nur Verweise zu den jeweiligen Daten. Dadurch kann eine doppelte Datenhaltung vermieden werden.

Wie bereits erläutert, ist die erfindungsgemäße Lösung in der Lage, Informationen repräsentierende Daten als Inhalte aus verschiedenen Datenbeständen sowohl Datenbanken als auch Dateien, in unterschiedlichen Formaten aus unterschiedlichsten Datenquellen, beispielsweise über das Internet oder ein lokales Firmennetzwerk, zu integrieren, deren Struktur zu identifizieren und die ermittelten Zusammenhänge der Inhalte beziehungsweise Inhaltsbestandteile, beispielsweise den Absender einer E-Mail zu identifizieren. Dabei werden die einzelnen Inhaltsbestandteile vorteilhafterweise in Beziehung zu korrespondierenden Inhaltsbestandteilen anderer Inhalte gesetzt. Durch diese Maßnahme wird die erfindungsgemäße Lösung beim Durchsuchen von Inhalten von Datenbeständen - insbesondere auch Volltexten - nach Worten, Wortbestandteilen und/oder Zeichenketten beschleunigt.

Dieser Prozess des Durchsuchens von Inhalten von Datenbeständen nach Worten, Wortbestandteilen und/oder Zeichenketten - nachfolgend auch "Crawler" genannt - wird vorteilhafterweise im Hintergrund der Anwendung der erfindungsgemäßen Lösung seitens eines erfindungsgemäßen Datenverarbeitungssystems ausgeführt und sucht in periodischen Abständen nach neuen und veränderten Inhalten, die für die Analyse vorzugsweise in temporären Dateien zwischengespeichert werden. Sobald die Analyse abgeschlossen ist, werden die temporären Daten wieder gelöscht. Weitere Einzelheiten, Merkmale und Vorteile der Erfindung werden nachfolgend anhand der Beschreibung der in den Figuren der Zeichnung dargestellten Ausführungsbeispiele näher erläutert. Dabei zeigen:

Fig. 1 in einem Blockdiagramm die prinzipiellen Komponenten eines erfindungsgemäßen Datenverarbeitungssystems;

Fig. 2 ein prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 3 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen Datenverarbeitungssystems nach Fig. 1 ;

Fig. 4 ein weiteres prinzipielles Ausführungsbeispiel einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 5 in einem Blockdiagramm ein prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindυngsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 6 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 7 prinzipielle Details der Kommunikation nach Fig. 6;

Fig. 8 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 9 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 10 in einem Blockdiagramm ein weiteres prinzipielles Ausführungsbeispiel einer programmtechnischen Umsetzung einer Kommunikation zwischen ausgewählten Komponenten des erfindungsgemäßen

Datenverarbeitungssystems nach Fig. 1 ;

Fig. 11 in einem Flussdiagramm ein Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 12 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 13 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 14 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 15 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 16 in einem Flussdiagramm ein weiteres Ausführungsbeispiel einer erfindungsgemäßen Zusammenhangserfassung;

Fig. 17 in einer schematischen Darstellung ein prinzipielles Ausführungsbeispiel einer erfindungsgemäßen graphischen Benutzerschnittstelle zur Nutzung eines erfindungsgemäßen Datenverarbeitungssystems;

Fig. 18 in einer schematischen Darstellung ein weiteres prinzipielles Ausführungsbeispiel einer erfindungsgemäßen graphischen

Benutzerschnittstelle zur Nutzung eines erfindungsgemäßen Datenverarbeitungssystems;

Fig. 19 in einem Flussdiagramm ein Ausführungsbeispiel für eine erfindungsgemäße Kontextsuche im Rahmen einer erfindungsgemäßen

Zusammenhangserfassung und Fig. 20 in einem Flussdiagramm ein Ausführungsbeispiel für eine erfindungsgemäße ontologische Zusammenhangserfassung im Rahmen einer erfindungsgemäßen Zusammenhangserfassung.

Dass eine erfindungsgemäßes Erfassung von Zusammenhängen zwischen Informationen repräsentierenden Daten realisierende Hardware- beziehungsweise Softwarekonzept einschließlich der Benutzerführung ergibt sich insbesondere aus der erfindungsgemäßen kontextsensitiven Verwaltung von Informationen und/oder Aktionen derart, dass ein belegbarer Zusammenhang gegeben ist.

Das Datenverarbeitungssystem besteht aus mehreren Komponenten, die ihrerseits wieder weitere Subkomponenten enthalten. Im Zusammenhang mit den Figuren 1 bis 13 werden nachfolgend die jeweiligen Hauptkomponenten für einen allgemeinen Überblick über die Architektur des Datenverarbeitungssystems beschrieben. Hintergrund der hier dargestellten und beschriebenen Architektur ist, dass die Komponenten nicht zwingend innerhalb einer Anwendung ausgeführt werden müssen, sondern auch eine Aufteilung in verschiedenen Anwendungen und Systemen möglich ist. Dadurch wird sowohl eine sogenannte Standalone- als auch eine sogenannte Client/Server-Anwendung unterstützt.

Wie anhand von Fig. 1 zu erkennen, weist das Datenverarbeitungssystem eine Benutzeroberfläche, einen Kernel und ein sogenanntes Repository auf.

Die Benutzeroberfläche (nachfolgend GUI genannt) ist die Schnittstelle zum Anwender. Die Benutzeroberfläche (GUI) ist dabei derart realisiert und gestaltet, αass die ergonomischen Bedürfnisse des Benutzers beziehungsweise Anwenders vollständig erfüllt werden. Vorliegend ist die Benutzeroberfläche (GUI) plattform- beziehungsweise geräteabhängig und wird dementsprechend für jede Plattform beziehungsweise Datenverarbeitungsvorrichtung an deren Fähigkeiten individuell angepasst. Vorliegend sind beispielsweise Implementierungen der Benutzeroberfläche (GUI) für PC's, PDA's, Web- beziehungsweise HTML-Anwendungen, Mobilfunktelefon- beziehungsweise WML/WAP-Anwendungen vorgesehen, die vorzugsweise mittels oder als JAVA- Anwendungen realisiert werden.

Der Kernel ist der zentrale Applikationskern des Datenverarbeitungssystems, in dem sämtliche Komponenten zusammenlaufen und miteinander verbunden werden. Der Kernel selbst unterteilt sich in weitere Subkomponenten, nachfolgend IQser, Content Provider, Crawler, Logger beziehungsweise Tracker (in Fig. 1 nicht explizit dargestellt) und Analyzer genannt.

Der Kernel stellt eine Schnittstelle zur graphischen Benutzeroberfläche (GUI) bereit, die nachfolgend IQser-Komponente genannt wird. Dabei werden die jeweiligen Methoden- Aufrufe der Benutzeroberfläche (GUI) an die jeweils zuständigen Komponenten weitergeleitet und bei Bedarf vor der Rückgabe zur Benutzeroberfläche (GUI) entsprechend aufbereitet, wie anhand des in Fig. 2 dargestellten Prinzips ersichtlich. Das Ausführen der jeweils angeforderten Aufgaben gemäß Fig. 2 wird von den dazu jeweils vorgesehenen Komponenten vorgenommen. Fig. 3 gibt einen beispielhaften Überblick über die Verbindungen der einzelnen Komponenten untereinander.

Des weiteren ist die IQser-Komponente die Controller-Instanz, die die Zugriffe auf das Repository beziehungsweise die Repositories regelt sowie die Crawler- und Analyzer- Prozesse steuert. Ferner realisiert die IQser-Komponente vorliegend die Aufgabe, die jeweiligen Content Provider in das System zu integrieren.

Die Komponente Content Provider ist ein abstrakte Komponente. Es handelt sich vorliegend um ein Framework, dass es ermöglicht jede beliebige Datenquelle in das Datenverarbeitungssystem zu integrieren. Dadurch wird das Gesamtsystem sehr flexibel und lässt sich in die bestehende Infrastruktur des Anwenders einbinden.

Die Crawier-Komponente hat die Aufgabe nach neuen Content-Objekten oder nach Änderungen an bestehenden Objekten zu suchen. Alle Änderungen und Neuerungen werden im Repository synchronisiert, so dass das Repository immer auf dem aktuellen Stand ist. Der von der Crawler-Komponente realisierte Prozess läuft dabei im Hintergrund und wird über ein frei definierbares Intervall gestartet.

Aufgabe der in Fig. 1 nicht explizit dargestellten Logger- beziehungsweise Tracker- Komponente ist es, jede Aktivität des Anwenders mit einem Inhalt (nachfolgend auch Content-Objekt genannt) zu protokollieren. Diese Protokollierung wird benötigt, um im Analyzer später bestimmte Bearbeitungs- beziehungsweise Nutzungsmuster des Anwenders in Beziehung zu verschiedenen Content-Objekten zu erfassen und gegebenenfalls weniger relevante Zusammenhänge (sogenannte „weak links") zwischen Objekten zu erstellen oder zu löschen.

Die Analyzer-Komponente läuft vorliegend als eigenständiger Prozess im Hintergrund des Datenverarbeitungssystems und übernimmt mehrere Aufgaben. Für einen semantischen Vergleich durchsucht die Analyzer-Komponente von der Loggerbeziehungsweise Tracker-Komponente protokollierte Aktivitäten beziehungsweise Nutzungen des Anwenders nach Mustern und erzeugt beziehungsweise löscht die genannten Zusammenhänge im Repository. Dadurch kann das Datenverarbeitungssystem dynamisch Zusammenhänge zwischen Inhalten und deren Nutzungen selbstständig erkennen und quasi erlernen. Bei syntaktischen Vergleichen vergleicht die Analyzer-Komponente den tatsächlichen Inhalt eines Datenbestandes (Content-Objekt) auf Textfragmente, die auf andere Datenbestände (Content-Objekte) hinweisen.

Das Datenverarbeitungssystem verweist auf fremde Datenbestände und nutzt diese zur Zusammenhangserfassung. Das können Einträge in fremden Datenbanken sein, zum Beispiel E-Mails oder Adressen, aber auch Dokumente und Objekte des Datenverarbeitungssystems selbst. Folgt der Anwender einem Zusammenhangsverweis öffnet sich der Datensatz oder das externe Dokument in der dafür passenden Applikation. Greift der Anwender über Netzwerkverbindungen auf einen Datenbestand zu, öffnet sich das Dokument beispielsweise in einem zusätzlichen Browserfenster, nachdem es vorher entsprechend von dem Datenverarbeitungssystem konvertiert wurde.

Das Repository ist die Schnittstelle zur Datenhaltung. Hier werden Zusammenhänge und/oder Verweise auf die Datenbestände (Content-Objekte) und deren jeweiligen Verknüpfungen verwaitet. in Fig. 1 ist exemplarisch nur ein Repository dargestellt. Es sind jedoch auch mehrere Repositories in das Datenverarbeitungssystem einbindbar, so dass beispielsweise lokale, serverbasierte Zusammenhänge und Datenbestände in das jeweilige Anwendersystem integriert werden können.

Das Datenverarbeitungssystem weist weiter eine Schnittstelle zur Integration von Datenbeständen auf, um jede erdenkliche Art von Inhalten in Form von Informationen repräsentierenden Daten verarbeiten zu können. Da in der Regel nicht von vornherein alle Möglichkeiten und Arten einer Integration von Datenbeständen vorgebbar sind, ist der Content-Provider-Komponente vorliegend als programmierbare Schnittstelle implementiert. Dadurch wird es Entwicklern ermöglicht weitere Content-Provider individuell zu programmieren, die dann von dem Datenverarbeitungssystem verwendet werden können. Diese Programmierschnittstelle wird nachfolgend auch Plug-in genannt und ist in Fig. 4 dargestellt. Das Plug-in (Fig. 4) besteht aus mehreren Objekten, die vom Entwickler zu implementieren sind:

- ContentProvider: Das ist die Schnittstelle zum Kernel und bietet die Methoden, die für die Verarbeitung von Inhalten notwendig sind.

- Content: Das Content-Objekt ist der eigentliche Inhalt. Es wird dazu verwendet um die Inhalte zwischen den Komponenten auszutauschen.

- ContentView: Die Schnittstelle zur GUI. Hiermit werden die Darstellung und die möglichen Aktionen beziehungsweise Nutzungen der Inhalte implementiert.

Wie anhand von Fig. 5 zu erkennen ist, werden Plug-ins (Plugins) von zwei Objekten verwaltet, dem PluginManager und dem Plugin. Der PluginManager hat die Aufgabe, bei Start der IQser-Komponente des Datenverarbeitungssystems nach installierten Plugins zu suchen, vorhandene Plugins zu laden und zu initialisieren. Das Plugin selbst wird dabei vorliegend als Datencontainer verwendet. Es enthält eine Instanz des ContentProviders und die Konfiguration des jeweiligen Plugins.

Für die Entwicklung eines neuen Plugins sind vom Entwickler die Objekte ContentProvider, Content und ContentView zu implementieren. Die Konfiguration eines Plugins erfolgt über eine Datei (vorliegend plugin.xml), die im jeweiligen Plugin- Verzeichnis vorhanden sein muss. Fehlt sie, wird das Verzeichnis von der vorliegend als IQser bezeichneten Komponente des Datenverarbeitungssystems nicht als Plugin übernommen.

In Fig. 6 sind beispielhaft die von der Crawler-Komponente realisierten Prozesse, die im Hintergrund der Anwendung des Datenverarbeitungssystems ablaufen dargestellt. Dabei werden die Datenbestände nach neuen und veränderten Inhalten durchsucht und diese beispielsweise in Form einer Tabelle zur Analyse gespeichert. Die Prozesse werden dabei vorliegend mit einer niedrigen Priorität in periodischen Abständen ausgeführt.

Wie anhand der Darstellung in Fig. 7 zu erkennen ist, holt sich der sogenannte Crawler vom PluginManager die Liste der installierten Plugins und arbeitet diese sukzessive ab. Jeder ContentProvider eines Plugins wird dabei nach neuen oder geänderten Content- Objekten abgefragt. Der ContentProvider liefert jeweils eine Liste mit Content-Ids zurück. Diese Listen werden vom Crawler dann in einer Cache-Tabelle gespeichert. Die Tabelle wird von den Analyzem dann wiederum abgearbeitet.

Die Aufgabe der sogenannten, in Fig. 8 beispielhaft dargestellten Loggerbeziehungsweise Tracker-Komponente ist ähnlich der der Crawler-Komponente. Der Tracker beziehungsweise Logger protokolliert die Aktionen des Anwenders zu Content- Objekten. Durch diese Protokollierung werden später durch den InterestAnalyzer Muster in der Bearbeitung und/oder Nutzung von Inhalten erfasst und einer weiteren Nutzung zugeführt. So können Zusammenhänge zwischen Inhalten dynamisch erzeugt werden. Diese Zusammenhänge werden niedrig gewichtet und werden, sobald sie für einen längeren, vorgebbaren Zeitraum nicht verwendet wurden, durch Freigabe quasi wieder vergessen. Der Zeitraum, über den der Tracker beziehungsweise Logger die Aktivitäten protokollieren soll, ist konfigurierbar. Je geringer der Zeitraum, umso schneller ist auch die Verarbeitung. Je länger der Zeitraum, umso höher ist die Möglichkeit Bearbeitungs- beziehungsweise Nutzungsmuster zu erfassen.

Der in Fig. 9 dargestellte Analyzer ist ein Prozess der im Hintergrund des Datenverarbeitungssystems die vom Crawler „gefundenen" Inhalte nach verschiedenen Kriterien analysiert. Der Analyzer selbst besteht vorliegend wiederum aus nachfolgenden Unterkomponenten beziehungsweise -prozessen:

- IndexAnalyzer: Analysiert die Inhalte nach Stichworten_: die für die Zusammenhangserfassung notwendig sind.

- SemanticAnalyzer: Analysiert die Inhalte nach semantischen Kriterien um Verbindungen zwischen Inhalten zu erfassen.

- SyntaxAnalyzer: Analysiert die Inhalte auf syntaktische Verbindungen zu anderen Inhalten.

- InterestAnalyzer: Analysiert Inhalte nach Mustern in der Bearbeitung beziehungsweise der Nutzung durch den Anwender.

Wurden mindestens zwei Ereignisse im Protokoll (Tracker) eingetragen, kann eine Analyse mit dem Aufruf des Analyseprozesses beginnen. Dafür betrachtet der Analyzer die ersten beiden Einträge des Protokolls. Handelt es sich beim zweiten Eintrag nicht um ein Ereignis, dass durch die Auswahl (zum Beispiel: „zur Anzeige") eines Inhaltes ausgelöst wurde, startet die Syntaxanalyse (vgl. Fig. 11 ). Handelte es sich um einen Zusammenhang (nachfolgend auch Selektion genannt), wird die Syntaxanalyse übersprungen. Handelt es sich bei beiden Einträgen um ein Ereignis, das durch den Anwender ausgelöst wurde, werden beide Inhalte vorliegend jeweils im Semantik- und Interest-Analyser und untersucht. Anschließend können weitere Analyseschritte folgen. Sind alle Analyseschritte durchgeführt, wird der erste Eintrag gelöscht. Nun wiederholt sich der gesamte Prozess bis nur noch ein Eintrag im Protokoll vorhanden ist.

In Fig. 14 ist dazu beispielsweise der Prozess eines sogenannten Metaanalyzers dargestellt. Der Metaanalyzer überprüft, ob die Zahl der Verknüpfungen zu einem untersuchten Inhalt einen Grenzwert n überschreitet. Wenn nicht, wird überprüft, ob es einen Meta-Inhalt gibt, der - wenn er existiert - gelöscht werden muss. Ist der Grenzwert erreicht, wird zunächst auch überprüft, ob es einen Metainhalt gibt. In beiden Fällen werden alle verknüpften Inhalte zusammengeführt und zusammengefasst. Gab es schon einen Metainhalt, wird dieser durch die Zusammenfassung aktualisiert. Gab es noch keinen Metainhalt, wird ein solcher erstellt und in einer Datenbank hinterlegt.

Das in Fig. 10 beispielhaft im Detail dargestellte Repository ist die Schnittstelle zu den Datenbeständen. Es übernimmt die Speicherung aller für den Kernel relevanten Daten, vorliegend sind dies insbesondere:

- Ein Index zu allen Inhalten.

- Zusammenhänge beziehungsweise Verknüpfungen von Inhalten zu anderen Inhalten.

- Temporäre Informationen zur Reihenfolge von der Bearbeitung von Inhalten durch den Anwender (Tracker).

- Temporäre Informationen zu neuen und veränderten Inhalten (Crawler).

- Ein Index über alle Schlüsselwerte der Inhalte (Gewichtung).

Beim Start der Semantik-Analyse wird überprüft, ob es bereits eine Verknüpfung zwischen den beiden Inhalten gibt. Gibt es keine wird eine Verknüpfung mit einem niedrigen Wert größer 0 für die Gewichtung erstellt. Gibt es bereits eine Verknüpfung fragt der SemanticAnalyzer, ob die Gewichtung kleiner 1 ist. Ist dieser Wert 1 , wird die Analyse abgebrochen, ist sie kleiner 1 , wird sie fortgesetzt. Nun wird die Gewichtung der Verknüpfung um einen kleinsten Wert größer 0 erhöht. Im Anschluss daran wird überprüft, ob die resultierende Gewichtung größer oder gleich 1 ist. Ist der Wert kleiner 1 ist die Semantik Analyse beendet. Ist der Wert größer oder gleich 1 , wird die Gewichtung auf einen größten Wert kleiner 1 herabgesetzt. Im Anschluss daran werden alle weiteren bestehenden Verknüpfungen aufgerufen und deren Gewichtung um einen Faktor herabgesetzt, der der Herabsetzung der aktuell untersuchten Verknüpfung entspricht. Der SemanticAnalyzer wird anschließend beendet.

Fig. 11 zeigt den iterativen Analyseprozess der Zusammenhangserfassung. Dabei werden vorliegend - wie bereits erläutert - verschiedene Analyseprozesse kombinativ angewandt. Im Rahmen der Zusammenhangserfassung wird der Analyseprozess von einem Eintrag im Tracker (Ereignisprotokoll) gestartet und ist beendet, wenn nur ein Eintrag im Tracker verbleibt. Wie oben bereits erläutert, hat die Analyzer-Komponente die Aufgabe, die Zusammenhänge zwischen den Inhalten selbstständig zu erkennen. Dafür verwendet das Datenverarbeitungssystem kombinativ insbesondere eine syntaktische und semantische Analyse. Fig. 12 zeigt den Ablauf der oben bereits erläuterten Prozesse im Rahmen einer semantischen Analyse. Fig. 13 zeigt die prinzipielle Struktur der Prozesse im Rahmen einer syntaktischen Analyse.

In Fig. 11 sind die prinzipiellen von der Analyzer-Komponente realisierten Verfahrensschritte dargestellt. Im Rahmen des Aufrufs der Analyzer-Komponente werden Logfiles oder die Datenbankeinträge (Logs) nach der zeitlichen Folge, in der die einzelnen Positionen geschrieben wurden abgearbeitet. Wurden auf diese Weise Einträge abgearbeitet, werden diese aus der Liste gelöscht, wobei jedoch wenigstens die letzte Aktion gespeichert bleibt . Wie lang die Liste der Aktionen im Logfile beziehungsweise der Datenbanktabelle ist, richtet sich also danach, wie schnell der Analyzer arbeitet beziehungsweise wie viel Rechnerleistung dem sekundären Thread zugewiesen wird. Priorität hat immer der Thread der IQser-Komponente beziehungsweise die Aktionen, die der Anwender des Datenverarbeitungssystems durchführt. Sobald eine neue Aktion im Logfile geschrieben wird und der Analyzer noch nicht aktiv war, beginnt die Analyse zur Zusammenhangserfassung. Folgende Situationen können dabei zum Aufruf des Analyzers führen:

- Beim Start des Datenverarbeitungssystems sind bereits mindestens zwei Einträge aus der letzten Session im Log.

- Der Crawler hat neue Inhalte identifiziert, beispielsweise durch ein neues Plugin.

- Der Anwender erzeugt einen neuen Inhalt. - Der Anwender wählt einen Inhalt aus einer aufgerufenen Liste.

Der SyntaxAnalyzer ermittelt die Regeln für die Syntax-Analyse durch den Aufruf der „Schlüssel" (Keys) für den jeweils zu untersuchenden Inhalt. Jene "Schlüssel" sind Attribute, die beschreiben, welche Informationsbausteine (Datenfelder) und Datentypen für die Ermittlung von Sinnzusammenhängen genutzt werden sollen. Aus den Keys stellt der Analyzer einen Filter zusammen, der eine Suche über den insgesamt erfassten Datenbestand auslöst. Zu den gefundenen Inhalten wird schließlich eine Verknüpfung hergestellt, die in Abhängigkeit von der Implementierung und den Anforderungen des Anwenders mit 1 oder einem größten Wert kleiner 1 oder der Treffergenauigkeit gewichtet wird.

Wie bereits erläutert, können alle Inhalte mit beliebigen und beliebig vielen anderen Inhalten in Zusammenhängen verknüpft werden. Zusammenhänge sind sowohl kategorieübergreifend als auch innerhalb einer Kategorie möglich. Zum Beispiel lassen sich Adressen mit Adressen aber auch Adressen mit Projekten verknüpfen. Eine hierarchische Ordnung gibt es nicht. Das Datenverarbeitungssystem unterscheidet statische und dynamische Verknüpfungen für Zusammenhänge beziehungsweise deren Erfassung. Statische Verknüpfungen werden immer angezeigt und können vom Anwender hergestellt und bearbeitet werden. Dynamische Verknüpfungen stellt das System mit einer Gewichtung automatisch her. Als Kriterien der Gewichtung dienen:

- Die Häufigkeit des Aufrufs eines Inhaltes.

- Die Häufigkeit des Aufrufs von Inhalten in dem von dem Zusammenhang hergestellten Kontext.

- Das Alter des letzten Aufrufs des Zusammenhangs oder der verknüpften Inhalte.

Bei Suchergebnissen einer Zusammenhangsanfrage gibt es darüber hinaus eine Gewichtung nach der Häufigkeit des gesuchten Inhaltes im jeweiligen Zusammenhang.

Es gibt - wie bereits erläutert - einen internen Schwellenwert, nach dem eine dynamische Verknüpfung angezeigt wird oder nicht. Der Wert (Gewichtung) ändert sich in Abhängigkeit des Benutzerverhaltens beziehungsweise der Auswertung des Protokolls aller Aktionen, die der Anwender mit dem Datenverarbeitungssystem durchführt. Im Datenverarbeitungssystem werden die Zusammenhänge als dynamisch verknüpfte Objekte abgebildet.

Fig. 15 zeigt und beschreibt exemplarisch wie für die Identifizierung neuer Inhalte das entsprechende Plug-in nach einem Crawler Task abgefragt wird. Technisch gesehen handelt es sich bei diesem Synchronisationsprozesse realisierenden Teilsystem um eine sogenannte Klasse, die die jeweiligen Datenquellen des Plug-ins nach neuen, gelöschten oder generierten Zusammenhängen abfragt.

Fig. 16 zeigt und beschreibt exemplarisch den Ablauf einer erfindungsgemäßen Analyse von Volltexten im Rahmen einer erfindungsgemäßen Zusammenhangserfassung, wobei wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird. Die bei der Musteranalyse aus einem Volltext erstellte Wortliste wird aufsteigend nach der Häufigkeit der Worte sortiert. Die ersten 32 Worte der daraus entstehenden Liste wird als Suchanfrage - das heißt als Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) - an einen Volltextindex einer Suchmaschine gestellt. Als Ergebnis wird eine Liste der ähnlichen Dokumente mit einer aus der Suchmaschine ermittelten Gewichtung geliefert. Anschließend wird in der weiteren Analyse jeweils geprüft, ob bereits eine Verknüpfung des Volltextes zum Suchtreffer gibt. Ist das der Fall wird die höhere Gewichtung übernommen, ist das nicht der Fall wird eine Verknüpfung hergestellt und die Gewichtung des Suchergebnisses übernommen.

Das erfindungsgemäße Datenverarbeitungssystem stellt ferner eine geräteübergreifende Mensch-Maschine-Schnittstelle für die Anzeige, Bearbeitung und Steuerung komplexer Inhalte beziehungsweise Datenbestände und deren Zusammenhänge bereit, insbesondere um den Anforderungen hinsichtlich einer transparenten Steuerung zur Modifikation von großen Datenbeständen und deren Zusammenhängen zu genügen und eine solche insbesondere für den ungeschulten Anwender verständlich und im Vergleich zu anderen Systemen einfacher zu machen. Vorteilhafterweise sind die von der Mensch-Maschine-Schnittstelle genutzte Logik und Ergonomie unabhängig von den für oder mit dem erfindungsgemäßen Datenverarbeitungssystem genutzten Datenverarbeitungsvorrichtungen oder Datenverarbeitungsendgeräten, beispielsweise deren Ausgabeeinheiten wie Monitore oder Displays. Vorteilhafterweise wird mit der Mensch-Maschine-Schnittstelle des erfindungsgemäßen Datenverarbeitungssystems eine handlungsorientierte Steuerung des Datenverarbeitungssystems ermöglicht. Die erfindungsgemäße handlungsorientierte Steuerung des Datenverarbeitungssystems ersetzt die heute in der Regel eingesetzte funktionale Menüsteuerung rechnergestützter Programme. Eine funktionale Menüsteuerung bietet eine Auswahl von Funktionen, die nach abstrakten Kriterien gruppiert und in Menübäumen zugänglich sind. Solche abstrakten Kriterien sind zum Beispiel „Datei" und „Bearbeiten" für die Windows-Betriebssysteme der Firma Microsoft. Demgegenüber arbeitet die erfindungsgemäße handlungsorientierte Steuerung - auch handlungsorientierte . Navigation genannt - mit kontextsensitiven Handlungsoptionen, die in jeder Anwendungssituation des Systems binär strukturiert sind. Die binäre Struktur bezieht sich auf eine Eingabe auf der einen und eine Ausgabe von Inhalten auf der anderen Seite, beziehungsweise auf das Verfassen oder Verändern und das Anzeigen von Datenbeständen. Vorteilhafterweise werden die binären Handlungsoptionen in Abhängigkeit des jeweiligen Handlungskontextes angepasst, das heißt es können in Abhängigkeit des jeweiligen Handlungskontextes neue Handlungsoptionen hinzukommen und/oder andere Handlungsoptionen wegfallen. Vorteilhafterweise lässt sich die binäre handlungsorientierte Steuerung so zugleich auf alle Ausgabemedien anwenden, beispielsweise bei kleine Displays mobiler Endgeräte oder bei einer Spracheingabe und/oder -ausgäbe, wozu die Datenverarbeitungsvorrichtung dann vorteilhafterweise Mikrofon und Lautsprecher als Ein- und Ausgabeeinheiten aufweist.

Die Steuerung beziehungsweise Navigation durch komplexe Datenbestände und deren Zusammenhänge realisiert die Mensch-Maschine-Schnittstelle des erfindungsgemäßen Datenverarbeitungssystems vorteilhafterweise mit einer graphischen Benutzerschnittstelle die zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen dient. Die graphische Benutzerschnittstelle ist dabei zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet.

Die graphische Benutzerschnittstelle teilt den zur Wiedergabe seitens einer Anzeigeeinrichtung zur Verfügung stehenden Anzeigebereich in drei Bereiche, wobei in einem ersten Bereich Informationen repräsentierende Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, in einem zweiten Bereich wenigstens ein wenigstens eine Information repräsentierendes Datum einer Zusammenhangsanfrage und in einem dritten Bereich wenigstens ein erfasster Zusammenhang zwischen dem wenigstens eine Information repräsentierenden Datum der Zusammenhangsanfrage und dem wenigstens eine Information repräsentierenden Datum des Datenbestandes wiedergegeben wird.

Die erfindungsgemäße Aufteilung des Anzeigebereichs in drei Teilbereiche wird nachfolgend triadische Fenstertechnik genannt. Während die aus den grafischen Oberflächen moderner Betriebssysteme bekannten Fenstertechniken entweder mit Listen-, Icon- oder Baumdiagrammen zur Darstellung der hierarchischen Struktur der Daten und Dateien eines Computersystems arbeiten, arbeitet die erfindungsgemäße triadische Fenstertechnik mit einer horizontalen oder vertikalen Dreiteilung des zur Verfügung stehenden Anzeigebereichs (Fensters).

In Fig. 17 und Fig. 18 ist jeweils eine entsprechende graphische Benutzerschnittstelle dargestellt. Vorliegend in Form eines prinzipielles Beispiels eines sogenannten Intemet- Frontends, mit einer vertikalen Aufteilung des Anzeigebereichs. Dabei ist das erfindungsgemäße Datenverarbeitungssystem in Form eines sogenannten Webbrowsers (Fig. 17) oder eines sogenannten JAVA-Clients (Fig. 18) nutzbar.

Bei der in Fig. 17 und Fig. 18 dargestellten vertikalen Aufteilung des Anzeigebereichs befindet sich beispielsweise im oberen Drittel des Anzeigebereichs (Fensters) eine Auswahl von Inhalten als tabellarisch dargestellte Liste, im zweiten Drittel des Anzeigebereichs (Fensters) eine Detailansicht eines aus der ersten Liste ausgewählten Inhaltes und in dem letzten Drittel des Anzeigebereichs (Fensters) sämtliche mit der Auswahl verknüpften Inhalte, die beispielsweise ebenfalls in einer Liste erscheinen beziehungsweise wiedergegeben werden. Der Anwender sieht so auf einem Blick welche Inhalte zusammengehören und kann von dort gleich weiternavigieren, um Inhalte zu suchen oder aus den Zusammenhängen Erkenntnisse abzuleiten. Die Epistemologie zeigt, dass Wissen durch Verknüpfung von Information entsteht. Das erfindungsgemäße Datenverarbeitungssystem macht somit nicht nur Informationen transparent sondern auch Wissen. Wählt der Anwender einen Inhalt aus der Liste im letzten Drittel des Fensters, wird vorteilhafterweise eine Animation gestartet, die die letzte Animation nach oben schiebt, wobei das anschließend zu sehende "triadische Fenster" den gleichen Aufbau und gleiche Logik hat. Ferner kann der Anwender auch zurücknavigieren, so dass sich die Animation entsprechend umkehrt.

Bei einer weiteren, in den Figuren nicht dargestellten vertikalen Aufteilung des Anzeigebereichs befindet sich beispielsweise im oberen Drittel des Anzeigebereichs (Fensters) das Ergebnis einer (Selektion) in Form einer Liste der Inhalte, im zweiten Drittel des Anzeigebereichs (Fensters) die Verknüpfungen beziehungsweise die Zusammenhänge zu einem ausgewählten Inhalt aus der Liste des ersten Bereiches und im letzten Drittel des Anzeigebereichs (Fensters) eine Vorschau des ausgewählten Inhaltes (Informationen repräsentierenden Datums). Die in dem dritten Bereich des Anzeigebereichs wiedergegebene Vorschau ist mitunter besser lesbar beziehungsweise sehbar, wenn das Größenverhältnis zwischen den ersten beiden Bereichen und dem dritten Bereich variabel einstellbar ist, sogenanntes "Splitplane". Die Steuerung beziehungsweise Navigation ist in diesem Fall vorteilhafterweise auf die beiden ersten Bereiche des Anzeigebereichs beschränkt, während die Vorschau im dritten Bereich an gleicher Stelle einfach wechselt. Die Reihenfolge der Fensterbereiche kann je nach Implementierung variieren.

Vorteilhaft an der graphischen Benutzerschnittstelle des erfindungsgemäßen Datenverarbeitungssystems ist, dass der Anwender auf einen Blick erkennen kann welche Inhalte zusammen gehören und direkt weitersteuern beziehungsweise - navigieren kann, um Inhalte zu suchen oder aus erfassten Zusammenhängen direkt Erkenntnisse abzuleiten. Dabei wird erfindungsgemäß eine endlose Steuerung beziehungsweise Navigation bereitgestellt.

Die in Fig. 18 mit den Bezugszeichen 1 bis 7 gekennzeichneten Felder weisen nachfolgende Funktionalität auf:

1 : Listeneinträge lassen sich per Drag and Drop in die Liste der Verweise ziehen, um eine Verknüpfung herzustellen. Ein Doppelklick öffnet die Detailansicht in einem neuen Fenster;

2: Spaltenüberschriften: Mit einem Mausklick ist ein Sortierkriterium auswählbar;

3: Scrollbalken, um Listen und Detaillisten, die im Fensterbereich nicht vollständig darstellbar sind, komplett ansehen zu können;

4: der Bereich für die Liste lässt sich mit gedrückter Maustaste verschieben und auch ganz "einklappen";

5: Detaillisteneintrag weist Scrollingbalken auf, um Listen und Detaillisten, die im Fensterbereich nicht vollständig darstellbar sind, komplett ansehen zu können; 6: mit Funktionen hinterlegte Spaltenpositionen, beispielsweise führt eine E-Mail- Adresse zu einer Maske zum Schreiben einer E-Mail und

7: Verweise, können einfach gelöscht werden, indem man diese per Maus aus dem Fensterbereich zieht.

Nachfolgend werden exemplarisch im Rahmen der Nutzung des Datenverarbeitungssystems anfallende Prozesse und deren Realisierungen seitens der jeweiligen Benutzeroberfläche beschrieben:

- "Anzeigen einer Liste"

In der Anwendung der Benutzeroberfläche (GUI) wählt der Anwender aus dem Menü beziehungsweise der Navigation zur Anzeige von Inhalten einen Menüpunkt aus, beispielsweise, um alle jüngsten Projekte zu sehen. Die Liste der auszuwählenden Menüpunkte ist ähnlich einer Bookmarkliste eines Browsers. Beim erfindungsgemäßen Datenverarbeitungssystem verweisen die Bookmarks jedoch nicht auf statische Seiten oder Listen, sondern auf dynamische Zusammenhänge. Dementsprechend wird dieser Teil der Navigation von Anwender zu Anwender unterschiedlich aussehen. Vorliegend ist das Datenverarbeitungssystem als JA VA-Client realisiert.

- "Attribute hinzufügen"

Um ein neues Attribut einem Inhaltsobjekt hinzuzufügen, ruft der Anwender den Bearbeitungsmodus eines Inhaltsobjektes aus. Neben den vorhandenen Attributen findet der Benutzer ein freies Feld, in das er ein neues Attribut eintragen kann oder auf eine nebenstehenden Liste auswählen kann. Eine Adresse ist ein Objekt für das der IQser Attribute vorschlägt.

Weil im Java-Client nicht zwischen Bearbeitungs- und Ansichtsmodus unterscheiden, wird vorteilhafterweise vorgeschlagen für diese Variante, bei der Navigation "neu" die Option "Attribut hinzufügen" zu ergänzen. Wird mit externen Datenquellen gearbeitet, werden die zusätzlichen Attribute im IQser gespeichert.

Wählt der Anwender im Menü die Option "Baustein" (oder eine andere Bezeichnung) wird in der Detailansicht ein neuer leerer Baustein gezeigt. Die Bezeichnung ist ebenfalls leer. Vorteilhafterweise gibt es eine zusätzliche Auswahlbox mit den bisher definierten Bausteinen. Vorteilhafterweise überprüft das Datenverarbeitungssystem im Anschluss, ob es diese Bezeichnung für einen Baustein bereits gab und korrigiert gegebenenfalls einen Schreibfehler oder Redundanzen.

Fig. 19 zeigt und beschreibt exemplarisch den Ablauf einer erfindungsgemäßen Kontextsuche im Rahmen einer erfindungsgemäßen Zusammenhangserfassung. Bei einer erfindungsgemäßen Kontextsuche werden vorliegend in einem semantischen Netz nur solche Inhalte durchsucht, die im Zusammenhang eines bestimmten Inhaltes stehen. Damit kann die Suche kontextabhängig erheblich verfeinert werden. Die Kontextsuche wird mit einem Suchstring sowie einer Content-ID an die Datenverarbeitungseinrichtung, vorzugsweise einen Server, übergeben. Wie das Flussdiagramm nach Fig. 19 zeigt, erfolgt zunächst eine Suchanfrage auf der Basis des Suchstrings. Dann werden die Verknüpfungen zu dem Content-Object aufgerufen, in dessen Kontext das Suchergebnis stehen soll. Dann wird diese Liste durchiteriert und überprüft, ob ein Listeneintrag in dem Suchergebnis vorkommt. Wenn ja, wird dieser Listeneintrag in die Ergebnisliste aufgenommen. Erfindungsgemäß erfolgt die Zusammenhangsanfrage dabei vorteilhafterweise als eine Anfrage an eine Suchmaschine. Im Rahmen einer Zusammenhangsanfrage erfolgt also zunächst eine Zusammenhangsanfrage mit der wenigstens einen vorgebbaren Information (Suchstring) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Zusammenhangsanfrage, anschließend erfolgt eine Zusammenhangsanfrage mit dem wenigstens einen Ergebnis der Zusammenhangsanfrage mit dem Suchstring als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Zusammenhangsanfrage mit der Content-ID. Schließlich wird das Ergebnis der Zusammenhangsanfrage mit dem Ergebnis der Zusammenhangsanfrage mit dem Suchstring erfasst und wiedergegeben.

Fig. 20 zeigt ein Ausführungsbeispiel für eine erfindungsgemäße ontologische Zusammenhangserfassung im Rahmen einer erfindungsgemäßen

Zusammenhangserfassung. Implizite Ontotogie bedeutet dabei vorliegend, dass automatisch eine Menge von Aussagen im Sinne einer Subjekt-Prädikat-Objekt- Beziehung (SPO-Beziehung) erzeugt wird, die auch im Semantic Web, insbesondere OWL und RDF eine Rolle spielt. Damit werden natürlichsprachliche Abfragen ermöglicht, die mit Hilfe von AIML aufgelöst werden können.

Schon während des erfindungsgemäßen Analyseprozess wird die SPO-Beziehung festgelegt und abgespeichert. Immer wenn ein Link erzeugt wird, wird die Methode createl_ink(c1 , c2, p, w)

aufgerufen, wobei p das Prädikat repräsentiert, das das Subjekt d mit dem Objekt c2 verbindet. Mit w wird die Gewichtung der Verknüpfung repräsentiert. Bei der Musteranalyse bekommt p die Bezeichnung "alike" (ähnlich). Bei der Syntax-Analyse erhält p die Bezeichnung des Schlüsselattributes, das die Verknüpfung hergestellt hat. Bei manuellen Verknüpfungen kann p frei bestimmt werden.

Es sind bei der Verwaltung der Aussagen (SPO-Beziehungen) zwei vorteilhafte Möglichkeiten gegeben:

• Es gibt mehrere Prädikate (sozusagen Tags) für jede Beziehung. Hier wird bei einem Link, der bereits existiert, überprüft, ob das Prädikat bereits vorhanden ist. Wenn nicht, wird es den existierenden Tag hinzugefügt.

• Es gibt mehrere Beziehungen des selben Paares d und c2 mit jeweils einem Prädikat. Hier wird jeweils überprüft ob es eine Beziehung mit dem neuen Tag bereits gibt. Wenn nicht, wird eine neue Beziehung angelegt, die mit dem aktuellen Tag geschrieben wird.

Die erste Variante sorgt bei der Anzeige der Verknüpfungen vorteilhafterweise für mehr Übersichtlichkeit.

Damit sind beispielsweise folgende Abfragen erfindungsgemäß möglich:

• Wer ist Autor eines Dokumentes, dass sich mit dem Thema "Umweltschutz" beschäftigt?

• Wer ist Freund von Max Mustermann (falls dieser Tag gesetzt wurde).

• Wer ist Projektleiter in einem Projekt über Solarzellen?

• Welches Zubehör gibt es für das Gerät XY?

In der Umsetzung dieser Abfragen werden vorteilhafterweise Kombinationen aus Filter- und/oder Verknüpfungsabfragen eingesetzt. Besonders vorteilhaft in die erfindungsgemäß vorgesehene und eingerichtete Möglichkeit, bei jeder Verknüpfung einsehen zu können, wie diese Verknüpfung zustande gekommen ist. Das wird zum Beispiel mit einer Spalte in einer Ergebnistabelle angezeigt.

Das Flussdiagramm in Fig. 20 zeigt, wie die Zusammenhangsanfrage "Wer ist Autor von Dokumenten, die sich mit Umweltschutz beschäftigen?" erfindungsgemäß ontologisch umgesetzt wird.

Eine ähnliche Zusammenhangsanfrage könnte lauten: „Wer war oder ist Mitarbeiter in einem Projekt über Solarzellen?" Die Frage lässt sich auf zwei Variablen reduzieren:

• Tag für den Zusammenhang

• Filter für die Suchanfrage

Damit ist eine neue Methode bereitgestellt, die komplexe Anfragen ermöglicht.

Eine weitere vorteilhafte Anwendung einer ontologischen Zusammenhangsanfrage ist in einem erfindungsgemäßen Verfahren für eine automatische thematische Zuordnung von Texten gegeben.

Unternehmen verfügen oft über eine Vielzahl von Texten. Es ist für den Zugriff und die Verarbeitung von Information hilfreich, wenn Texte automatisch einem Sachgebiet zugeordnet werden bzw. einem Sachgebiet die entsprechenden Quellen. Für Zusammenhangsanfragen gemäß der vorliegenden Erfindung sind folgende Möglichkeiten gegeben:

1. Über ein Plugin wird eine Datenbank mit Sachgebieten angebunden. Für jedes Sachgebiet kann ein Experte die Morpheme und Wörter zusammenstellen, die charakteristisch für das Sachgebiet sind. Die automatischen Analysen der erfindungsgemäßen Lösung übernehmen im Rahmen von Zusammenhangsanfragen die Aufgabe der Zuordnung von Texten aber auch die Beziehung von Sachgebieten, die sich ergänzen oder einschließen. Im Ergebnis kann der Anwender über Sachgebiete navigieren und entsprechende Quellen finden. 2. Das Unternehmen stellt eine Textsammlung zur Verfügung, die mit einem speziellen Werkzeug auf charakteristische Wörter und Morpheme untersucht wird. Dafür wird aus den Texten eine Wortliste generiert, wobei jedem Wort die statistische Häufigkeit zugeordnet wird. Diese Wortliste wird durch eine Liste von Artikeln und Basisverben (Stoppwörter) gefiltert und in eine Absteigende Reihenfolge nach Worthäufigkeit gebracht. Die 32 häufigsten Wörter werden für die Beschreibung des Sachgebietes verwendet.

3. In Anlehnung an die Musteranalyse von Volltexten können in der in Ziffer 2. beschriebenen Wortliste die 32 am wenigsten vorkommenden Wörter genommen werden. Dadurch wird eine unscharfe Abgrenzung von Stoppwörtern verhindert bzw. eingespart.

4. In einem Analyseprozess wird ein Text in eine Wortliste überführt. Jedes Wort wird im Anschluss mit der Datenbank des Projektes Deutscher Wortschatz (http://www.wortschatz.uni-leipzig.de) abgeglichen aus dem das Sachgebiet ermittelt wird. So entsteht aus der erfindungsgemäßen Wortliste eine Liste von Sachgebieten. Diese Liste wiederum wird zusammengefasst, indem jedes Sachgebiet nur einmal mit der zugeordneten Häufigkeit vorkommt. Anschließend wird die Liste absteigend sortiert. Die drei am häufigsten auftauchenden Sachgebiete werden als Tag dem Inhalt (Content-Object) zugeordnet.

δ. Eine besonders bevorzugte und präzises Methode der Erfindung ist mit einer Differenzanalyse gegeben. Dabei werden vorteilhafterweise zwei Textsammlungen verglichen. Vorzugsweise eine Textsammlung mit allgemeinen Themen, zum Beispiel die Basis des Projektes Deutscher Wortschatz, und eine Textsammlung mit Texten aus einem bestimmten Fachgebiet. Aus beiden Textsammlungen wird eine Wortliste, vorzugsweise ohne Dubletten, generiert. Die Worte werden dabei in absteigender Reihenfolge ihrer Häufigkeit gemeinsam mit diesem Wert sortiert. Im zweiten Schritt wird für jedes Wort der beiden Wortlisten die relative Häufigkeit berechnet aus dem Quotienten der absoluten Häufigkeit und der Gesamtzahl der Wortformen der jeweiligen Liste. Im dritten Schritt werden die beiden Wortlisten verglichen. Für die Wortliste aus dem Textkorpus der Fachtexte wird für jedes Wort ein Quotient aus der relativen Häufigkeit der selben Liste mit der relativen Häufigkeit aus der anderen Liste gebildet. Anschließend wird die so ergänzte Wortliste nach diesem Wert sortiert. Vorliegend werden die 32 häufigsten Wörter als beschreibend für ein Fachgebiet ausgewählt. Diese 32 Wörter können zur Beschreibung eines Sachgebietes im Rahmen einer erfindungsgemäßen Lösung (IQser) genutzt werden, um Texte mit Hilfe der Musteranalyse automatisch zuzuordnen.

Die in den Figuren der Zeichnung dargestellten und in Zusammenhang mit der Beschreibung erläuterten Ausführungsbeispiele der Erfindung dienen lediglich der Erläuterung der Erfindung und sind für diese nicht beschränkend.

Claims

Ansprüche:

1. Verfahren zum Erfassen wenigstens eines Zusammenhangs zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem wenigstens eine Information repräsentierenden Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes seitens eines Datenverarbeitungssystems mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, wobei der wenigstens eine Zusammenhang selbst als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand dynamisch als Verknüpfung zwischen wenigstens einem wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und wenigstens einem weiteren wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes und/oder wenigstens einer elektronischen Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes erfasst und seitens einer optischen und/oder akustischen Anzeigeeinrichtung des Datenverarbeitungssystems wiedergegeben wird, wobei die Verknüpfung durch wenigstens einen syntaktischen Vergleich und/oder durch wenigstens einen semantischen Vergleich des wenigstens einen wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen wenigstens eine Information repräsentierenden Datum wenigstens eines Datenbestandes erzeugt wird, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) nur solche Informationen repräsentierenden Daten für die Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt werden, die wenigstens einen Zusammenhang zu wenigstens einer vorgebbaren Information aufweisen.

2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, dass die Zusammenhangsanfrage als eine Anfrage an eine Suchmaschine erfolgt.

3. Verfahren nach Anspruch 1 oder Anspruch 2, dadurch gekennzeichnet, dass die vorgebbare Information zusammen mit einem erfassten Zusammenhang als eine Information repräsentierendes Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) genutzt wird.

4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zunächst eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt, anschließend eine Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfolgt und schließlich das wenigstens eine Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit dem wenigstens einen Ergebnis der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) mit der wenigstens einen vorgebbaren Information als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) als das wenigstens eine wenigstens eine Information repräsentierende Datum einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) erfasst und wiedergegeben wird.

5. Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die vorgebbare Information eine von einem Anwender und/oder einer Anwendung wählbare Abfolge von Buchstaben und Sonderzeichen ist (Suchstring).

6. Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass im Rahmen einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) zwischen den wenigstens eine Information repräsentierenden Daten einer Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) automatisch eine Aussagenmenge im Sinne von Subjekt-Prädikat-Objekt-Beziehungen erzeugt wird, so dass natürlichsprachliche Anfragen nach einem Zusammenhang (Zusammenhangsanfragen) erfolgen können.

7. Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass wenigstens ein Wort einer aus einem Volltext erstellten Liste (Wortliste) von in dem Volltext enthaltenen Wörtern als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet wird.

8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, dass die Wörter in der Liste (Wortliste) von in dem Volltext enthaltenen Wörtern nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortiert werden und die sortierten Wörter unter Berücksichtigung der Häufigkeit ihres Vorhandenseins in dem Volltext als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.

9. Verfahren nach Anspruch 8, dadurch gekennzeichnet, dass eine vorgebbare Anzahl der nach der Häufigkeit ihres Vorhandenseins in dem Volltext sortierten Wörter in einer Liste (sortierte Wortliste) erfasst werden und die Wörter der Liste (sortierte Wortliste) als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.

10. Verfahren nach Anspruch 9, dadurch gekennzeichnet, dass die Liste (sortierte Wortliste) die Wörter mit der geringsten Häufigkeit ihres Vorhandenseins in dem Volltext enthält.

11. Verfahren nach Anspruch 9 oder Anspruch 10, dadurch gekennzeichnet, dass die Wörter nach der Häufigkeit ihres Vorhandenseins in dem Volltext aufsteigend sortiert werden.

12. Verfahren nach einem der Ansprüche 1 bis 11 , dadurch gekennzeichnet, dass die Wörter der Liste zumindest teilweise parallel als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage) verwendet werden.

13. Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, die Verknüpfung durch manuelle Eingabe erzeugt wird, vorzugsweise durch eine Auswahleingabe.

14. Verfahren nach einem der Ansprüche 1 bis 13, gekennzeichnet durch wenigstens eine elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums wenigstens eines Datenbestandes als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage).

15. Verfahren nach einem der Ansprüche 1 bis 14, gekennzeichnet durch eine Erfassung von elektronischen Nutzungen von wenigstens eine Information repräsentierenden Daten wenigstens eines Datenbestandes nach Zeit und/oder Häufigkeit und Nutzung dieser Erfassung als das wenigstens eine wenigstens eine Information repräsentierende Datum der Anfrage nach einem Zusammenhang (Zusammenhangsanfrage).

16. Verfahren nach einem der Ansprüche 1 bis 15, gekennzeichnet durch wenigstens eine Erfassung eines Zusammenhangs als elektronische Nutzung eines wenigstens eine Information repräsentierenden Datums eines Datenbestandes.

17. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, dass die Zusammenhangserfassung gewichtet erfolgt.

18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Zusammenhangsgewichtung wenigstens eines bereits als ein wenigstens eine Information repräsentierendes Datum in einem Datenbestand erfassten Zusammenhangs in Abhängigkeit der Zusammenhangsgewichtung eines nachfolgend erfassten Zusammenhangs verändert wird, vorzugsweise die Zusammenhangsgewichtung erhöht (inkrementiert) oder erniedrigt (dekrementiert) wird.

19. Verfahren nach einem der Ansprüche 1 bis 18, dadurch gekennzeichnet, dass wenigstens ein erfasster Zusammenhang mit dessen Gewichtung wiedergegeben wird.

20. Verfahren nach einem der Ansprüche 1 bis 19, gekennzeichnet durch Nutzung wenigstens eines Verweises auf wenigstens einen Informationen repräsentierende Daten umfassenden Datenbestand.

21. Datenverarbeitungssystem mit Informationen repräsentierenden Daten in wenigstens einem über wenigstens eine Datenquelle zugänglichen Datenbestand, dadurch gekennzeichnet, dass dieses ausgebildet und/oder eingerichtet ist ein Verfahren nach einem der Ansprüche 1 bis 20 zumindest teilweise auszuführen.

22. Datenverarbeitungssystem nach Anspruch 21 , gekennzeichnet durch eine graphische Benutzerschnittstelle zur Eingabe und/oder Wiedergabe von Zusammenhangsanfragen, Verknüpfungen, Zusammenhängen und/oder Zusammenhangsgewichtungen.

23. Datenverarbeitungssystem nach Anspruch 22, dadurch gekennzeichnet, dass die graphische Benutzerschnittstelle weiter zur Eingabe, Änderung und/oder Wiedergabe von Informationen repräsentierenden Daten in wenigstens einem Datenbestand ausgebildet und/oder eingerichtet ist.

24. Datenverarbeitungssystem nach Anspruch 22 oder Anspruch 23, dadurch gekennzeichnet, dass die graphische Benutzerschnittstelle den zur Wiedergabe seitens einer optischen Anzeigeeinrichtung zur Verfügung stehenden Anzeigebereich in drei Bereiche aufteilt, wobei in einem ersten Bereich das Ergebnis einer Selektion von Informationen repräsentierenden Daten, in einem zweiten Bereich mit einer Anzeige eine aus der Selektion im ersten Bereich ausgewählte Information und in einem dritten Bereich, der wenigstens eine Zusammenhang wiedergegeben wird.

25. Datenverarbeitungssystem nach Anspruch 24, gekennzeichnet durch eine horizontale oder vertikale Aufteilung.

26. Datenverarbeitungssystem nach Anspruch 24 oder Anspruch 25, dadurch gekennzeichnet, dass die Größe der Bereiche ein- und/oder verstellbar ist.

27. Datenverarbeitungssystem nach einem der Ansprüche 21 bis 26, dadurch gekennzeichnet, dass die Wiedergabe zumindest teilweise in auswählbarer Form erfolgt.

28. Datenverarbeitungssystem nach einem der Ansprüche 21 bis 27, dadurch gekennzeichnet, dass dieses Bestandteil einer Datenbankanwendung ist oder zumindest zusammen mit einer Datenbankanwendung nutzbar ist.

29. Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, dadurch gekennzeichnet, dass diese ausgebildet und/oder eingerichtet ist ein Verfahren nach einem der Ansprüche 1 bis 20 zumindest teilweise auszuführen, vorzugsweise unter Nutzung wenigstens eines Teils eines Datenverarbeitungssystems nach einem der Ansprüche 21 bis 28.

30. Datenverarbeitungsvorrichtung zur elektronischen Verarbeitung von Daten, mit einer Kontroll- und/oder Recheneinheit, einer Eingabeeinheit und einer Ausgabeeinheit, gekennzeichnet durch eine zumindest teilweise gegebene Nutzung eines Datenverarbeitungssystems nach einem der Ansprüche 21 bis 29.

31. Datenverarbeitungsvorrichtung nach Anspruch 29 oder Anspruch 30, dadurch gekennzeichnet, dass diese als mobiles Endgerät ausgebildet ist, vorzugsweise als ein in Mobilfunknetzen nutzbares beziehungsweise betreibbares mobiles Endgerät, besonders bevorzugt als ein Mobilfunktelefon.