EP1159689A2 - Such- und navigationseinrichtung für hypertext-dokumente - Google Patents

Such- und navigationseinrichtung für hypertext-dokumente

Info

Publication number
EP1159689A2
EP1159689A2 EP00916782A EP00916782A EP1159689A2 EP 1159689 A2 EP1159689 A2 EP 1159689A2 EP 00916782 A EP00916782 A EP 00916782A EP 00916782 A EP00916782 A EP 00916782A EP 1159689 A2 EP1159689 A2 EP 1159689A2
Authority
EP
European Patent Office
Prior art keywords
documents
document
similarity
symbols
references
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP00916782A
Other languages
English (en)
French (fr)
Inventor
Heiko Holzheuer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of EP1159689A2 publication Critical patent/EP1159689A2/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • G06F16/94Hypermedia

Definitions

  • the invention relates to navigation and search in documents linked by references, which are mainly referred to as hypertext documents.
  • hypertext documents Documents linked to references are commonly referred to as hypertext documents.
  • HTML Hypertext Markup Langauage
  • Another example of hypertext documents are the help files contained in the graphic user interface "WINDOWS" distributed by Microsoft.
  • HTML pages should be viewed as representative of all hypertext documents.
  • Search engines are known as a further aid. These are called up with one or more key words, which are applied to a previously created, continuously updated, mostly very extensive, not directly visible index and references to a number of Documents in which those keywords are mentioned, displ ⁇ gen case these indexes are HTML documents used in either the assignable via the META tag keywords in the preparation, or it can be.
  • the text content of other tags, especially the " TITLE "tags, or in addition the entire text content is used. This is primarily a question of the database to be indexed in relation to the available resources.
  • Hypertext pages represent a tree in their basic structure, because each page appears as a node with references to subordinate nodes. The jerk and cross references, however, disturb this structure. Nevertheless, it is known as a navigation aid to display a structure tree of hypertext documents, which is also referred to as a 'site map'.
  • a structure tree of hypertext documents which is also referred to as a 'site map'.
  • a tree is built up, with all references that contradict the tree structure being completely suppressed or only weakly displayed.
  • a number of mostly two-dimensional graphic representation forms are known. Recently, three-dimensional images have been chosen that the user can rotate interactively in the room can, with a corresponding projection being displayed on a two-dimensional surface.
  • US Pat. No. 5,847,708 shows a device in which documents, in particular hypertext documents, are displayed spatially arranged according to a similarity measure. A content reference is thus given; however, the chaining of the documents is no longer visible.
  • the object of the invention is to provide a device which, based on a known hypertext document, automatically displays other documents without the user having to extract search words from the content of the original document in order to initiate an index or full-text search.
  • the invention uses the knowledge that a page of similar content is required in many cases.
  • the invention therefore provides a device with which a symbolic representation of an original document and the documents associated therewith is simultaneously displayed with the symbol of the degree of similarity to the selected original document.
  • F g. 1 an image displayed by the facility.
  • the device consists of a computer with a graphic display and the well-known Emabeemhe th such as mouse and keyboard.
  • the graphic display is preferably operated with the program packages X / Wmdows, JAVA, an operating system ending in -ix, etc. It is also possible to use the Microsoft programs, often shortened to 'Windows'.
  • This display shows a document that is a hypertext document that is preferably saved in HTML format.
  • a program called a browser is used for the display, which evaluates the HTML format instructions for display.
  • the hypertext references are of particular importance for the present invention, hereinafter referred to briefly as references or 'links'.
  • a JAVA application provides the user with an additional function in addition to the functions already provided by the browser, which is described in more detail below. But it is also easily possible to do this with your own program m JAVA or another suitable programming language, to which the address of the source document referred to as URL is given as a parameter.
  • this program will first use the references contained in the original document to get to the documents designated with it, which in turn repeat the procedure recursively. Since the reference structures of hypertext documents do not necessarily represent a tree, the search depth must be restricted. This is done either by specifying the recursion depth, e.g. four, or the number of documents visited, or the time spent, or a combination thereof. It can also be specified that only addresses of a certain domain are tracked.
  • document AI contains two references to documents B1 and B2; B1 references to Cl, C2, C3 and D4; B2 references to C3 and C4; Cl references to Dl, D2 and D3; C2 references to D3, D4 and D5; C3 references to D5 and D6; C4 on D7 and D8.
  • the first approximation of the frequency is simply the number of occurrences in the document.
  • An improved variant takes into account how the location of the occurrence is marked. For example, words in the title or keyword list could be rated with greater weight, so that the frequency appears as a fraction. Standardization to the total number is also possible. This results in a matrix that grows with the number of documents examined, m whose rows are the documents and m whose columns the words are indexed.
  • a distance between two documents can be determined by multiplying two line vectors and summing the products. This distance measure is the greater, the more similar the two documents are because the number is particularly large if the documents have common words that also occur equally frequently in both documents.
  • the first proposals in this direction were proposed by H. Luhn in the article "The automatic creation of literature abstracts", IBM Journal of Research and Development 2, 158-165, 1958.
  • Other functions that use the matrix or extract a square symmetrical matrix of the spacing of the documents from one another by determining spacings in pairs and thus eliminating the words are likewise possible.
  • the distance measure does not meet the criteria of a topological distance, since the triangular equation does not have to be satisfied and the distance to itself provides a maximum value instead of zero.
  • word attention vectors is advantageous in that the matrix of the weighted word occurrences can occur dynamically during the recursive search and each document only has to be transmitted and analyzed once. However, this does not preclude the device from being operated in such a way that a distance measure is determined anew each time by the documents concerned being currently loaded and evaluated.
  • a combination is also possible, in which the determination via word frequencies determines a preselection of documents, for which the distance measure is then determined in pairs according to other methods which require the document text itself. As indicated above, this could be Languages apply in which the process of reducing the number of stems requires extensive syntax and semantic analysis.
  • the reference structure is preferably displayed.
  • a variety of forms are known for this; starting with a list with prints, a tree-like graphic representation or elaborate 3D / 2D representations. In all the usual forms of representation, the focus is on a building structure that canonically arises during recursive descent. The references that do not correspond to the tree structure are then either not shown or shown as additional lines, possibly in a weak form.
  • Various formats are known as 3D / 2D representations, in which the structure is initially built up as a graphic in a three-dimensional space and then projected onto a two-dimensional surface, as is known, for example, as a "fish-eye view".
  • the invention consists in the fact that the distance to the original document, determined via the matrix or otherwise, is indicated by the symbols m of the structural representation.
  • Color is preferably used because it does not play a significant role in the known representations. For example, red could be used for the greatest similarity, green for the closest ones, yellow and blue to black for relative unlikeness.
  • Grayscale represents a different type of coloring, whereby white is used as less significant and black as highly similar is preferred for a display with a light background.
  • a size of the symbols is also equivalent to a color; therefore "color” also stands for grayscale as well as for other scalable representations such as the diameter of a circular area.
  • color also stands for grayscale as well as for other scalable representations such as the diameter of a circular area.
  • 3D / 2D representations in which a reduction in perspective is desired due to the projection in order to visualize the spatial position, is the size not applicable as "color”.
  • the use of the form is also possible because a triangle is a significantly more significant representation and clearly distinguishable from a square, whereas the difference between a hexagon and a heptagon is hardly visible. Nevertheless, in this example the number of corners also represents a "color”.
  • For users with reduced is compensated ed Sehfahtechnik in bright colors, the re mostly by Besse ⁇ distinguishable from forms such as this facility is important and can be combined with the development Buntfarbdarstel ⁇ .
  • a symbol that is not yet the source document can be made the new source document using an input device (mouse).
  • the new color of the representation can then be quickly determined and displayed. In this case, preferably no new descent is carried out from the new position, but the already accumulated data are used. With appropriate equipment, however, it is advisable to add the missing documents that have been moved within reach of the new reference point; possibly as a background process, which then brings the display to the possibly changed state on request.
  • the words are still available as a list, these can be made available to the user as a further selection means. This can be done alphabetically or by frequency. If the user chooses one or more words, the document that is best for this becomes the source document fits. Formally, a virtual document output document is then ⁇ ment, which was the maximum Worthauflgkeiten include the selected words.
  • Another embodiment uses, preferably in addition to the color, the spacing of the symbols in 3D space as a "color feature".
  • 3D representations in particular still leave considerable room for maneuver in the relative spacing of the symbols.
  • the dimensions used, as stated above do not represent a metric, such an image is not clearly defined.
  • an iterative procedure can cause a deformation that clearly shows the relative proximity of different documents. It can be bought that the display does not stand still, but the display constantly changes slightly due to the opposing effects. Rather, this "breathing” is more suitable for displaying the relative uncertainty of the classification better than a "frozen” image that simulates a final arrangement that is not stable at all.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Einrichtung zum Suchen von bzw. Navigieren in durch Verweise verketteten Dokumenten, die auf einer Ausgabeeinheit symbolisch dargestellt sind, wobei, ausgehend von einem Ausgangsdokument, die Symbole der weiteren Dokumente mit einer Markierung versehen sind, die den Grad der Ähnlichkeit zu dem Ausgangsdokument gemäß einem Ähnlichkeitsmaß anzeigt.

Description

Beschreibung
Such- und Navigationseinrichtung für Hypertext-Dokumente
Technisches Gebiet
Die Erfindung betrifft die Navigation und Suche in durch Verweise verketteten Dokumente, die überwiegend als Hypertext-Dokumente bezeichnet werden.
Stand der Technik
Mit Verweisen verkettete Dokumente werden üblicherweise als Hypertext-Dokumente bezeichnet. Dabei sind die im Internet verwendeten, in der "Hypertext Markup Langauage" (HTML) beschriebenen Dokumente weit verbreitet und allgemein bekannt. Ein weiteres Beispiel für Hypertext-Dokumente sind die in den von der Firma Microsoft vertriebene graphischen Benutzeroberfläche "WINDOWS" enthaltenen Hilfedateien. Im folgenden sollen HTML-Seiten als stellvertretend für alle Hypertext-Dokumente angesehen werden.
Wenngleich die Navigation über die Hyperlinks eines Hypertext-Dokuments die Suche nach Information wesentlich gegenüber einem traditionellen Dokument mit hierarchischer Kapi- telstruktur wesentlich verbessert hat, so sind doch weitere Hilfsmittel zur Suche und Navigation notwendig. Dazu gehört sicherlich ein Index, der von Suchwörtern zu den entsprechenden Seiten verweist.
Als weiteres Hilfsmittel sind "Suchmaschinen" bekannt. Die- se werden mit einem oder mehreren Stichwörtern aufgerufen, die auf einen im vorab erstellten, kontinuierlich aktualisierten, meist sehr umfangreichen, nicht direkt sichtbaren Index angewendet werden und Verweise auf eine -Anzahl von Dokumenten, in denen diese Stichworte erwähnt sind, anzei¬ gen. Dabei werden bei der Erstellung dieser Indizes bei HTML-Dokumenten entweder nur die über das META-Tag angebbaren Schlüsselwörter verwendet, oder es werden zusätzlich die Text-Inhalte weiterer Tags, insbesondere des "TITLE"- Tags, oder zusatzlich der gesamte Textinhalt verwendet. Dies ist primär eine Frage des zu indizierenden Datenbestandes in Relation zu den verfugbaren Betriebsmitteln.
Allerdings ist bei den Suchmaschinen zum einen die richtige Wahl der Suchworter ausschlaggebend für ein gutes Suchergebnis. Zum zweiten wird der Zusammenhang der Dokumente untereinander weder berücksichtigt noch dargestellt.
Es tritt aber m der Praxis häufig der Fall ein, daß man bereits eine halbwegs passende Hypertext-Seite gefunden hat, die jedoch noch nicht die gewünschte Information enthalt. Man muß also die Verweise systematisch vor- und zurück absuchen und die Hypertext-Seiten selbst inspizieren, um die gewünschte Information zu finden.
Hypertext-Seiten stellen m ihrer Basis-Struktur einen Baum dar, weil ede Seite als Knoten mit Verweisen zu untergeordneten Knoten erscheint. Die Ruck- und Querverweise jedoch stören diese Struktur empfindlich. Dennoch ist es als Navigationshilfe bekannt, einen Strukturbaum der Hypertext- Dokumente anzuzeigen, der auch als 'site-map' bezeichnet wird. Hierbei wird, ausgehend von einer, meist als 'home page' bezeichneten, Wurzel ein Baum aufgebaut, wobei alle der Baumstruktur widersprechenden Verweise ganz unterdruckt oder nur schwach angezeigt werden. Hierzu sind eine Anzahl von meist zweidimensionalen graphischen Darstellungsformen bekannt. Neuerdings werden auch dreidimensionale Abbildungen gewählt, die der Benutzer interaktiv im Räume drehen kann, wobei eine entsprechende Projektion auf eine zweidi- mensionale Flache angezeigt wird.
Nachteilig ist dabei, daß diese Darstellung nur mit einem kurzen Text, meist dem vergebene Titel, bezeichnet sind. Damit ist zwar die Navigation übersichtlicher, als wenn der Benutzer diesen Baum im Gedächtnis aufbaut oder auf Papier mitschreibt. Dennoch hat der Benutzer immer noch keine Hilfe, welcher der Knoten vielleicht die höchste Relevanz hatte. Die Benutzung einer Suchmaschine, d.h. eines Index, ist zwar möglich, steht und fallt aber mit der passenden Auswahl der zu suchenden Stichworter.
In der Patentschrift US 5,847,708 wird eine Einrichtung gezeigt, bei der Dokumente, insbesondere Hypertext-Dokumente, gemäß einem TAhnlichkeitsmaß raumlich angeordnet dargestellt werden. Damit ist zwar ein inhaltlicher Bezug angegeben; die Verkettung der Dokumente ist jedoch nicht mehr sichtbar.
Aufgabe der Erfindung ist es, eine Einrichtung anzugeben, die, ausgehend von einem bekannte Hypertext-Dokument, auto- matisch andere Dokumente anzeigt, ohne daß der Benutzer aus dem Inhalt des Ausgangsdokuments Suchworte extrahieren muß, um damit eine Index- oder Volltextsuche anzustoßen.
Darstellung der Erfindung
Die Erfindung verwendet die Erkenntnis, daß m vielen Fal- len eine Seite ahnlichen Inhalts benotigt wird. Daher stellt die Erfindung eine Einrichtung bereit, mit der m einer symbolischen Darstellung eines Ausgangsdokuments und der damit verknüpften Dokumente zugleich mit dem Symbol der Grad der Ähnlichkeit zu dem ausgewählten Ausgangsdokument angezeigt wird. Weitere Merkmale und Vorteile der Erfindung ergeben sich aus der folgenden Beschreibung, welche m Verbindung mit den beigefugten Zeichnungen die Erfindung an Hand eines Ausfuhrungsbeispiels erläutert.
Kurzbeschreibung der Zeichnungen
Es zeigen
F g. 1 ein von der Einrichtung angezeigtes Bild.
Beschreibung einer Ausfuhrungsform der Erfindung
In der bevorzugten Ausfuhrungsform besteht die Einrichtung aus einem Computer mit einer graphischen Anzeige und den bekannten Emgabeemhe ten wie Maus und Tastatur. Die graphische Anzeige wird bevorzugt mit den Programmpaketen X/Wmdows, JAVA, einem auf -ix endenden Betriebssystem usw. betrieben. Die Verwendung der häufig verk rzt als 'Windows' bezeichneten Programme der Firma Microsoft ist gleichfalls möglich.
Auf dieser Anzeige werde ein Dokument angezeigt, welches ein Hypertext-Dokument ist, das bevorzugt im HTML-Format gespeichert ist. Zu der Anzeige wird ein als Browser be- zeichnetes Programm verwendet, welches die Formatanweisungen von HTML zur Darstellung auswertet. Für die vorliegende Erfindung sind dabei die Hypertext-Verweise von besonderer Bedeutung, im folgenden kurz als Verweise oder 'links' bezeichnet .
Durch beispielsweise eine JAVA-Anwendung wird dem Benutzer zusatzlich zu den ohnehin vom Browser bereitgestellten Funktionen eine Zusatzfunktion bereitgestellt, die im folgenden genauer beschrieben wird. Es ist aber auch ohne weiteres möglich, hierzu eine eigenes Programm m JAVA oder einer anderen geeigneten Programmiersprache zu verwenden, dem die als URL bezeichnete Adresse des Ausgangsdokuments als Parameter mitgegeben wird.
Dabei wird dieses Programm zunächst die m dem Ausgangsdo- kument enthaltenen Verweise benutzen, um zu den damit bezeichneten Dokumenten zu gelangen, bei denen wiederum das Vorgehen rekursiv wiederholt wird. Da die Verweisstrukturen von Hypertext-Dokumenten nicht unbedingt einen Baum darstellen, ist eine Beschrankung der Suchtiefe notwendig. Diese erfolgt entweder durch die -Angabe der Rekursionstiefe, z.B. vier, oder die Anzahl der besuchten Dokumente, oder die verbrauchte Zeit, oder eine Kombination hiervon. Auch kann festgelegt werden, daß nur Adressen einer bestimmten Domäne verfolgt werden.
In Fig. 1 ist eine im wesentliche baumartige Darstellung gezeigt, wie sie als Ergebnis eines rekursiven -Abstiegs m vier Ebenen, das Ausgangsdokument eingeschlossen, nach dem Stand der Technik entstanden sein konnte. Die Dokumente sind als Kreise dargestellt und die Verweise als Pfeile. Die Schraffur einiger Kreise ist im Stand der Technik noch nicht vorhanden, sondern Teil der Erfindung. Offensichtlich enthalt Dokument AI zwei Verweise auf die Dokumente Bl und B2; Bl Verweise auf Cl, C2, C3 und D4; B2 Verweise auf C3 und C4; Cl Verweise auf Dl, D2 und D3; C2 Verweise auf D3, D4 und D5; C3 Verweise auf D5 und D6; C4 auf D7 und D8.
Da die Dokumente für die Bestimmung der m ihnen enthaltenen Verweise ohnehin m die Einrichtung geladen werden müssen, erfolgt für jedes neu geladene Dokument eine Bearbeitung. Hierbei werden die Worter des Dokuments extrahiert und m ihrer Häufigkeit bewertet. Daß dabei nicht signifikante Worter wie Artikel, Konjunktionen usw., sogenannte Stoppworter, ignoriert werden, versteht sich von selbst. Stark flektierende Sprachen sollten gegebenenfalls ein Wör¬ terbuch o.a. für die Bestimmung der Grundformen benutzen und dann nur die Grundformen verwenden.
Die Bewertung der Häufigkeit ist m erster Näherung einfach die Anzahl des Vorkommens m dem Dokument. In einer verbesserten Variante wird berücksichtigt, wie der Ort des Vorkommens markiert ist. Beispielsweise konnten Worter im Titel bzw. der Stichwortliste mit höherem Gewicht bewertet werden, so daß die Häufigkeit als Bruch erscheint. Ferner ist eine Normierung auf die Gesamtzahl möglich. Damit ergibt sich ein mit der -Anzahl der untersuchten Dokumente wachsende Matrix, m deren Zeilen die Dokumente und m deren Spalten die Worter indiziert sind.
Mittels dieser Matrix kann durch Multiplikation zweier Zei- lenvektoren und Summierung der Produkte ein -Abstand zweier Dokumente bestimmt werden. Dieses -Abstandsmaß ist um so großer, e ähnlicher sich die beiden Dokumente sind, weil die Zahl besonders groß ist, wenn die Dokumente gemeinsame Worter haben, die zudem noch m beiden Dokumenten gleich häufig vorkommen. Die ersten Vorschlage m dieser Richtung wurden von H. Luhn m dem Artikel "The automatic creation of literature abstracts", IBM Journal of Research and Development 2, 158-165, 1958, vorgeschlagen. -Andere Funktionen, die die Matrix verwenden oder aus der Matrix eine quadrati- sehe symmetrische Matrix des -Abstands der Dokumente untereinander extrahieren, indem paarweise Abstände bestimmt und damit die Worter eliminiert werden, sind gleichfalls möglich. Die Auswahl kann nach pragmatischen Gesichtspunkten erfolgen und ist ohne wesentliche Auswirkung auf die Grund- funktionalitat der Erfindung, wenn auch davon ein praktischer Erfolg, bezogen auf ein Fachgebiet, wesentlich abhangen kann. Im übrigen entspricht das Abstandsmaß nicht den Kriterien eines topologischen -Abstands, da die Dreiecksun- gleichung nicht erfüllt sein muß und der -Abstand zu sich selbst einen maximalen Wert anstelle von Null liefert.
Die Verwendung von Worthauflgkeitsvektoren ist insofern vorteilhaft, als die Matrix der gewichteten Worthauflgkei- ten dynamisch wahrend des rekursiven Durchsuchens erfolgen kann und jedes Dokument nur einmal übertragen und analysiert werden muß. Dies schließt jedoch nicht aus, daß die Einrichtung auch derart betrieben wird, daß ein Abstandsmaß jedesmal neu bestimmt wird, indem die betroffenen Dokumente aktuell geladen und ausgewertet werden. Auch ist eine Kombination möglich, bei der die Bestimmung über Worthaufig- keiten eine Vorauswahl von Dokumenten bestimmt, für die dann paarweise das -Abstandsmaß nach anderen Verfahren, die den Dokumententext selbst benotigen, genau bestimmt wird. Wie oben angedeutet, konnte dies für stark flektierende o.a. Sprachen gelten, bei denen der Vorgang der Reduktion auf Wortstamme einer aufwendigen Syntax- und Semantikanaly- se bedarf.
Bevorzugt wird, nachdem der Suchvorgang abgeschlossen und die Matrix erstellt ist, die Verweisstruktur angezeigt. Hierfür sind eine Vielzahl von Formen bekannt; beginnend bei einer Auflistung mit Emruckungen, einer baumähnlichen graphischen Darstellung oder aufwendigen 3D/2D Darstellungen. In allen üblichen Darstellungsformen steht eine Bau - Struktur im Vordergrund, wie sie bei rekursiven Abstieg kanonisch entsteht. Die nicht der Baumstruktur entsprechenden Verweise werden dann entweder nicht gezeigt oder als zusätzliche Linien, ggf. m schwacher Form, dargestellt. Als 3D/2D Darstellung sind verschiedene Formate bekannt, bei denen die Struktur zunächst als Graphik m einem dreidimensionalen Raum aufgebaut und dann auf eine zweidimensionale Flache projeziert wird, wie sie z.B. als "Fisheye-View" bekannt ist. In Fig. 1 ist eine stark vereinfache solche Darstellung zu sehen, bei der Farbe durch Schraffur dargestellt wird. Do¬ kument AI ist das Ausgangsdokument und besonders gekenn¬ zeichnet, hier durch eine doppelte Umrandung. Da es ferner der Ausgangspunkt der Ähnlichkeiten ist, hat es dieselbe Schraffur wie die beiden dazu ahnlichsten Dokumente D3 und C3. Die beiden nächst ähnlichen Dokumente Bl und D2 sind gepunktet dargestellt.
Unabhängig von der Darstellung besteht die Erfindung darin, daß der über die Matrix oder sonstwie bestimmte -Abstand zu dem Ausgangsdokument durch die Symbole m der Strukturdarstellung angezeigt wird. Bevorzugt wird dabei Farbe verwendet, weil diese m den bekannten Darstellungen keine wesentliche Rolle spielt. Beispielsweise konnte Rot für die größte Ähnlichkeit, Grün f r die nachstnaheren, ber Gelb und Blau bis Schwarz für relative Unahnlichkeit verwendet werden. Graustufen stellen eine andere Art der Färbung da, wobei hier bei einer Anzeige mit hellem Hintergrund Weiß als wenig signifikant und schwarz als höchst ähnlich bevor- zugt verwendet werden.
Ein Große der Symbole ist gleichfalls einer Farbe äquivalent; daher steht m den Ansprüchen "Farbe" sowohl auch f r Graustufen als auch für andere, skalierbare Darstellungen wie dem Durchmesser einer Kreisflache. Lediglich bei den 3D/2D Darstellungen, bei denen durch die Projektion eine perspektivische Verkleinerung gewünscht ist, um die Raumlage zu visualisieren, ist die Große nicht als "Farbe" anwendbar. Die Verwendung der Form ist zwar auch möglich, weil ein Dreieck eine wesentlich signifikantere Darstellung und deutlich von einem Quadrat unterscheidbar ist, wohingegen der Unterschied zwischen einem Sechs- und einem Siebeneck kaum sichtbar ist. Dennoch stellt m diesem Beispiel die Eckenzahl auch eine "Farbe" dar. Für Benutzer mit redu- zierter Sehfahigkeit bei Buntfarben, die meist durch besse¬ re Unterscheidbarkeit von z.B. Formen kompensiert wird, ist diese Möglichkeit wichtig und kann mit der Buntfarbdarstel¬ lung kombiniert werden.
Sind die Abstände und Farben der Symbole bestimmt, dann ist noch ein besondere Hervorhebung der dem Ausgangsdokument am nächsten liegenden sinnvoll, beispielsweise durch ein ganz oder teilweise blinkendes Symbol, beispielsweise durch einen blinkenden gelben Umring, wenn die Symbole Kreisflächen sind und eine dunkle Farbe größere --hnlichkeit signalisiert als eine helle.
Da die Symbole alle auf der Oberflache erscheinen, kann auch ein Symbol, welches bislang nicht das Ausgangsdokument ist, durch ein Eingabegerat (Maus) zum neuen Ausgangsdoku- ment gemacht werden. In der bevorzugten Ausfuhrungsform mit bereits m Matrizen akkumulierten Daten kann dann schnell die neue Emfarbung des Darstellung bestimmt und angezeigt werden. Bevorzugt wird hierbei kein neuer Abstieg von der neuen Position aus durchgeführt, sondern es werden die be- reits akkumulierten Daten verwendet. Bei entsprechenden Betriebsmitteln ist jedoch ein Hinzufugen der noch fehlenden, durch den neuen Bezugspunkt m Reichweite geruckten, Dokumente sinnvoll; gegebenenfalls als Hintergrundprozeß, der die Anzeige dann auf Anforderung auf den möglicherweise veränderten Stand bringt.
Da m der oben beschrieben Ausfuhrung mit einer Matrixdarstellung von Wortern und Dokumenten die Worter noch als Liste verfugbar sind, können diese dem Benutzer als weiteres Auswahlmittel bereitgestellt werden. Hierzu ist eine alpha- betische oder eine Sortierung nach Häufigkeit möglich. Wählt der Benutzer eines oder mehrere Worter, so wird dasjenige Dokument zum Ausgangsdokument, daß hierzu am besten paßt. Formal ist dann ein virtuelles Dokument Ausgangsdoku¬ ment, das die maximalen Worthauflgkeiten der ausgewählten Worter umfassen wurde.
Im Unterschied zu einer Suche über einen Index wird dabei nicht eine geänderte graphische Anordnung der angezeigten Struktur bewirkt, sondern lediglich deren Emfarbung geändert.
Eine andere Ausfuhrungsform verwendet, bevorzugt zusätzlich zur Farbe, noch den Abstand der Symbole im 3D-Raum zueinan- der als "Farbmerkmal". Gerade 3D-Darstellungen lassen noch erheblichen Spielraum im relativen -Abstand der Symbole zueinander. Da jedoch die verwendeten Maße, wie oben angegeben, keine Metrik darstellen, ist ein solches Bild nicht eindeutig bestimmt. Durch iteratives Vorgehen kann jedoch eine Verformung bewirkt werden, die deutlich die relative Nahe verschiedener Dokumente anzeigt. Dabei kann m Kauf genommen werden, daß die -Anzeige nicht stillsteht, sondern wegen der gegensätzlichen Einwirkungen die Anzeige sich standig leicht verändert. Vielmehr ist dieses "Atmen" ge- eignet, die relative Unsicherheit der Einordnung besser anzuzeigen als ein "eingefrorenes" Bild, das eine finale Anordnung vortauscht, die gar nicht stabil ist.

Claims

Patentansprüche
1. Einrichtung zum Suchen von bzw. Navigieren m durch Verweise verketteten Dokumenten, die auf einer Ausgabe¬ einheit m einer durch die Verkettung bestimmten Anord- nung symbolisch dargestellt sind, d a du r c h g e k e nn z e i c hn e t , daß, ausgehend von einem Ausgangsdokument, die Symbole der weiteren Dokumente mit einer Markierung versehen sind, die den Grad der Ähnlichkeit zu dem Ausgangsdoku- ment gemäß einem Ahnlichkeitsmaß anzeigt.
2. Einrichtung nach -Anspruch 1, wobei ein Ahnlichkeitsmaß verwendet wird, für das zunächst aus den Dokumenten ein Kennzahlvektor extrahiert wird, dieser m der Einrichtung abgelegt wird und sodann das Maß für die Ahnlich- keit zweier Dokumente ohne Ruckgriff auf das jeweilige Dokument durch Operationen auf den Kennzahlvektoren bestimmt wird.
3. Einrichtung nach -Anspruch 2, wobei m einem Vorberei- tungsschπtt, ausgehend von dem ersten Ausgangsdoku- ment, den Verweisen bis zu einer vorgegeben Tiefe nachgegangen wird und von den besuchten Dokumenten der Kennzahlvektor extrahiert und abgelegt wird.
4. Einrichtung nach Anspruch 2 oder 3, wobei das Ahnlichkeitsmaß durch eine gewichtete Funktion über den Hau- figkeiten gemeinsamer Worter der zu vergleichenden Dokumente bestimmt wird.
5. Einrichtung nach einem der Ansprüche 1 bis 4, wobei der Grad der Ähnlichkeit durch die Gestaltung der Symbole angezeigt wird.
6. Einrichtung nach Anspruch 5, wobei als Mittel zur Gestaltung der Symbole Farbe verwendet wird.
7. Einrichtung nach Anspruch 5 oder 6, wobei alternativ oder zusäztlich zu der Gestaltung der Symbole selbst deren -Anordnung zueinander so modifiziert wird, daß der Abstand zum Symbol des Ausgangsdokuments entsprechend der Abstandsmetrik bei großer Ähnlichkeit relativ gering wird.
8. Einrichtung nach einem der vorhergehenden Ansprüche, wobei ein Eingabegerät vorgesehen ist, mit dem eine die Einrichtung benutzende Person ein Symbol auswählen kann, welches dadurch das Ausgangsdokument bestimmt.
9. Einrichtung nach Anspruch 8 in Kombination mit einem der -Ansprüche 4 bis 7, wobei eine Eingabevorrichtung vorgesehen ist, mittels derer eine die Einrichtung benutzende Person ein oder mehrere Wörter auswählen kann, womit das Dokument mit der größten gewichteten Worthäufigkeit dieser Wörter zum Ausgangsdokument wird.
EP00916782A 1999-03-09 2000-03-01 Such- und navigationseinrichtung für hypertext-dokumente Withdrawn EP1159689A2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19910357 1999-03-09
DE19910357 1999-03-09
PCT/DE2000/000603 WO2000054167A2 (de) 1999-03-09 2000-03-01 Such- und navigationseinrichtung für hypertext-dokumente

Publications (1)

Publication Number Publication Date
EP1159689A2 true EP1159689A2 (de) 2001-12-05

Family

ID=7900263

Family Applications (1)

Application Number Title Priority Date Filing Date
EP00916782A Withdrawn EP1159689A2 (de) 1999-03-09 2000-03-01 Such- und navigationseinrichtung für hypertext-dokumente

Country Status (4)

Country Link
US (1) US7020847B1 (de)
EP (1) EP1159689A2 (de)
CA (1) CA2366762C (de)
WO (1) WO2000054167A2 (de)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8127252B2 (en) * 2003-11-07 2012-02-28 Microsoft Corporation Method and system for presenting user interface (UI) information
US7644367B2 (en) 2003-05-16 2010-01-05 Microsoft Corporation User interface automation framework classes and interfaces
US8577893B1 (en) * 2004-03-15 2013-11-05 Google Inc. Ranking based on reference contexts
US20070028189A1 (en) * 2005-07-27 2007-02-01 Microsoft Corporation Hierarchy highlighting
US20070276419A1 (en) 2006-05-26 2007-11-29 Fox Hollow Technologies, Inc. Methods and devices for rotating an active element and an energy emitter on a catheter
USD709901S1 (en) 2011-05-31 2014-07-29 Lifescan, Inc. Display screen with computer icon for blood glucose monitoring
USD682304S1 (en) 2012-01-06 2013-05-14 Path, Inc. Display screen with graphical user interface
US9727656B2 (en) * 2013-07-04 2017-08-08 Excalibur Ip, Llc Interactive sitemap with user footprints
USD776140S1 (en) 2014-04-30 2017-01-10 Yahoo! Inc. Display screen with graphical user interface for displaying search results as a stack of overlapping, actionable cards
US9830388B2 (en) * 2014-04-30 2017-11-28 Excalibur Ip, Llc Modular search object framework
US9335911B1 (en) * 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
CN106445321A (zh) * 2016-09-13 2017-02-22 宇龙计算机通信科技(深圳)有限公司 一种文档内容显示的方法和终端
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
US20240152562A1 (en) * 2022-11-03 2024-05-09 Bold Limited Systems and methods for improved search and interaction with an online profile

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5021976A (en) * 1988-11-14 1991-06-04 Microelectronics And Computer Technology Corporation Method and system for generating dynamic, interactive visual representations of information structures within a computer
US5295243A (en) * 1989-12-29 1994-03-15 Xerox Corporation Display of hierarchical three-dimensional structures with rotating substructures
US5911138A (en) * 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
CA2127764A1 (en) * 1993-08-24 1995-02-25 Stephen Gregory Eick Displaying query results
US5515488A (en) * 1994-08-30 1996-05-07 Xerox Corporation Method and apparatus for concurrent graphical visualization of a database search and its search history
US5855015A (en) * 1995-03-20 1998-12-29 Interval Research Corporation System and method for retrieval of hyperlinked information resources
US6067552A (en) * 1995-08-21 2000-05-23 Cnet, Inc. User interface system and method for browsing a hypertext database
US6088032A (en) * 1996-10-04 2000-07-11 Xerox Corporation Computer controlled display system for displaying a three-dimensional document workspace having a means for prefetching linked documents
US5778363A (en) * 1996-12-30 1998-07-07 Intel Corporation Method for measuring thresholded relevance of a document to a specified topic
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US5895470A (en) * 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
US6216134B1 (en) * 1998-06-25 2001-04-10 Microsoft Corporation Method and system for visualization of clusters and classifications

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO0054167A2 *

Also Published As

Publication number Publication date
WO2000054167A3 (de) 2001-07-26
CA2366762A1 (en) 2000-09-14
CA2366762C (en) 2009-07-14
WO2000054167A2 (de) 2000-09-14
US7020847B1 (en) 2006-03-28

Similar Documents

Publication Publication Date Title
DE19960043B4 (de) Verfahren zum Navigieren in einer Baumstruktur
DE3855756T2 (de) Schnittstelle für Materialliste für CAD/CAM-Umgebung
DE69329265T2 (de) Graphischer Datenbankzugriff
DE69602364T2 (de) Rechnersystem um semantische objektmodelle von existierenden relationellen datenbanksystemen herzustellen
DE69129712T2 (de) Arbeitsraumanzeigen
DE69418908T2 (de) Verfahren und Gerät zum Informationsanschauen in einer Rechnerdatenbank
DE69526545T2 (de) Ein Verfahren und Gerät zur Darstellung von Datenbanksuchergebnissen
DE69534331T2 (de) Verfahren und Vorrichtung zur Hervorhebung der Einzelheit einer Baumstruktur
DE3650417T2 (de) Informationsaufzeichnungs- und Wiederauffindungssystem.
DE69434096T2 (de) Verfahren und System, um mit einer graphischen Benutzerschnittstelle in einer Datenbank zu suchen
DE69230331T2 (de) Computervorrichtung und verfahren zur identifizierung von finite-elementen in der interaktiven modellierung
DE60031664T2 (de) Computerverfahren und vorrichtung zum schaffen von sichtbarer graphik unter verwendung von graph algebra
EP0910829B1 (de) Datenbanksystem
DE69418474T2 (de) Semantisches objektmodellierungssystem und verfahren um relationelle datenbankschemata herzustellen
DE69835753T2 (de) Verfahren und gerät zur graphischen abbildung von webteilen
DE69731045T2 (de) Navigation und Interaktion in strukturierten Informationsräumen
DE69424586T2 (de) Verfahren und System zum formulieren interaktiver Abfragen
DE19842688B4 (de) Verfahren zum Filtern von Daten, die von einem Datenanbieter stammen
DE69126795T2 (de) Dateienverwaltungssystem mit graphischer benutzerschnittstelle zum aufstellen von fragen
DE69515296T2 (de) Font-manager mit selektivem zugriff auf installierte fonts
DE69622350T2 (de) Ein Geschichtsanzeigegerät
DE69808780T2 (de) Browser für hierarchische strukturen
EP1311989B1 (de) Verfahren zur automatischen recherche
DE69615596T2 (de) Auf Auslassungen basierende Darstellung von geordneten Daten
WO2000054167A2 (de) Such- und navigationseinrichtung für hypertext-dokumente

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20010820

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

17Q First examination report despatched

Effective date: 20020705

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: SIEMENS AKTIENGESELLSCHAFT

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: SIEMENS AKTIENGESELLSCHAFT

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20150825