DE60212330T2 - Verfahren zur Verarbeitung von mehrsprachigen Abfragen - Google Patents

Verfahren zur Verarbeitung von mehrsprachigen Abfragen Download PDF

Info

Publication number
DE60212330T2
DE60212330T2 DE60212330T DE60212330T DE60212330T2 DE 60212330 T2 DE60212330 T2 DE 60212330T2 DE 60212330 T DE60212330 T DE 60212330T DE 60212330 T DE60212330 T DE 60212330T DE 60212330 T2 DE60212330 T2 DE 60212330T2
Authority
DE
Germany
Prior art keywords
database
words
language
user
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE60212330T
Other languages
English (en)
Other versions
DE60212330D1 (de
Inventor
Morten Middelfart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Targit AS
Original Assignee
Targit AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Targit AS filed Critical Targit AS
Application granted granted Critical
Publication of DE60212330D1 publication Critical patent/DE60212330D1/de
Publication of DE60212330T2 publication Critical patent/DE60212330T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Hardware Redundancy (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Description

  • Die Erfindung bezieht sich auf ein Computer-implementiertes Verfahren zum Ausführen einer Übertragung zwischen einem Benutzer und einer Datenbank, wobei die Datenbank Elemente aufweist, die an eine Datenbanksprache angepasst sind, wobei Elemente in der Übertragung enthalten sein können, und wobei Hinweise auf eine Anfrage nach Elementen in der Datenbank an eine Benutzersprache angepasst sind und wobei das Verfahren die Schritte aufweist, in Antwort auf eine Anfrage an die Datenbank Elemente von der Datenbank, die in der Anfrage angefordert wurden, zu liefern, wobei diese Elemente Worte in der Datenbanksprache aufweisen können, wobei die Anfrage in einem Benutzergerät erzeugt wurde und die angeforderten Elemente zu dem Benutzergerät geliefert werden; und wobei eine Übersetzung in natürlicher Sprache zwischen Worten in den Elementen in der Datenbanksprache und in der Benutzersprache ausgeführt wird.
  • Datenbanken verschiedener Arten sind zentrale Komponenten bei moderner Anwendung der Informationstechnologie. Datenbanken können von verschiedenen Arten sein, die für verschiedene Anwendungen optimiert sind, jedoch können zwei Haupttypen einerseits Transaktions-Datenbanken sein, die für eine schnelle Speicher- und Zugriffszeit optimiert sind, und andererseits so genannte Daten-Warenhäuser, die zur Analyse der in der Datenbank gespeicherten Daten optimiert sind. Typischerweise enthalten Daten-Warenhäuser mehr redundante Daten als eine Transaktions-Datenbank. Die vorliegende Erfindung ist insbesondere auf Daten-Warenhäuser bezogen, jedoch hierauf nicht beschränkt.
  • Die weit verbreitete Nutzung des Internet führte mit zu einer verstärkten Entwicklung von Datenbanken. Zudem haben, in Kombination hierzu, große Organisa tionen und/oder Firmen in verschiedenen Ländern verstärkt das Bedürfnis nach Datenbanken geäußert, die mehrere natürliche Sprachen unterstützen.
  • Ein wichtiger Punkt in der Technologie von Datenbanken ist es, die Datenbank zu pflegen und es zu gewährleisten, dass der Inhalt der Datenbank kohärent und konsistent über verschiedene Grenzen ist, so zum Beispiel Sprachbarrieren in der Datenbank.
  • Um den Benutzern der Datenbank einen verbesserten Service zu liefern, werden die Benutzer mit einer Schnittstelle zu der Datenbank ausgerüstet, von der es möglich ist, mit der Datenbank in einer natürlichen Sprache (üblicherweise ihrer Muttersprache) zu interagieren. Eine erste Grundlösung, um solch einen verbesserten Service zu liefern, ist es, den Inhalt der Datenbank in verschiedenen Sprachen anzubieten. Jedoch ist dieses sehr umständlich im tatsächlichen Leben zu handhaben. Daher besteht eine andere Lösung darin, die Daten in der Datenbank in einer einzigen natürlichen Sprache bereitzustellen, einer so genanten Datenbanksprache, und bei der Kommunikation mit der Datenbank Übersetzungen in eine natürlichen Sprache auszuführen. Jedoch sind nicht überarbeitete Übersetzungen, die an sich erwünscht sind, da sie automatisch und damit schneller ausgeführt werden können, nicht geeignet, da das Auftreten von Synonymen in einer Übersetzung die Widerspruchsfreiheit der Datenbank zerstört oder alternativ fehlerhafte Anfragen an die Datenbank und/oder Antworten von der Datenbank erzeugt.
  • Wenn daher mehr als eine mögliche Übersetzung eines Wortes in einer Anfrage an die Datenbank oder in Antwort von der Datenbank auftreten kann, können Widersprüche oder Fehler in das Verfahren bei der Aufstellung von Anfragen und bei den erzielten Ergebnissen eingeführt werden.
  • Üblicherweise werden Wörter in dem Ergebnis einer ersten ungenauen Anfrage dazu verwendet, das Ergebnis für eine spätere Anfrage zu verbessern. Da üblicherweise ein Wort mehr als eine Übersetzung in Wörter in einer anderen Sprache hat, ist es ein Problem – speziell bei der Verbesserung von Anfragen -, dass die Übersetzungen nicht widerspruchsfrei sind.
  • Die WO 00/26766 beschreibt ein System zum Benutzen einer Datenbank. Das System empfängt ein von einem Benutzer eingegebenes Passwort und bearbeitet das von dem Benutzer eingegebene Passwort in Hinblick auf eine Liste von so genannten beschränkten Passwörtern. Wenn das von dem Benutzer eingegebene Passwort zu einem Passwort in der Liste der beschränkten Passwörter passt, wird das Passwort angenommen, um Daten in die Datenbank einzugeben oder die Datenbank abzufragen. Wenn hingegen das von dem Benutzer eingegebene Passwort nicht passend ist, bearbeitet das System das von dem Benutzer eingegebene Passwort als ein Eingangswort in Hinblick auf eine Liste von synonymen Worten. In der Liste von Synonymen werden (mehrere) Eingangsworte auf ein beschränktes Passwort bezogen, wenn das von dem Benutzer eingegebene Passwort unter den Eingangsworten gefunden wird, und es wird auf ein beschränktes Passwort bezogen, das benutzt wird, um je nach der Situation die Datenbank abzufragen oder Daten einzugeben.
  • Jedoch müssen alle Wörter, die ein Benutzer eingibt, in der Liste von Synonymen enthalten sein, und es muss ein Zusammenhang mit einem Passwort in der Datenbank vorliegen. Dies erfordert einen erheblichen Aufwand bei der Definition der Liste von Synonymen. Obwohl das System Suchen in der Datenbank anbieten kann, die weniger Passwort-empfindlich sind, wird es gleichzeitig eine geringe Präzision beim Erfassen spezieller Teile der Information liefern.
  • Die obigen Probleme werden gelöst, wenn das in dem Oberbegriff erwähnte Verfahren dadurch gekennzeichnet ist, dass es ferner die Schritte umfasst, zu bestimmen, ob die Übertragung sich auf eine Anfrage oder eine Antwort von der Datenbank bezieht und dann, wenn es sich auf eine Anfrage bezieht, die Übersetzung auf eine Liste von vorbestimmten Übersetzungsrelationen zu beschränken, wobei eine Übersetzungsrelation eine Beziehung zwischen einem Wort in der Datenbanksprache und einem korrespondierenden Wort in der Benutzersprache ist; wenn es sich auf eine Antwort bezieht, wird die Liste durchsucht, um eine Übersetzungsrelation für ein Wort in der Antwort zu finden, und dann, wenn keine solche Übersetzungsbeziehung für das Wort in der Liste existiert, das Wort zu einem Übersetzungsdienst zu übermitteln, um daraufhin eine Übersetzungsrelation zwischen dem Wort und einem korrespondierenden Wort in der Benutzersprache zu empfangen, wobei diese Übersetzungsrelation in der Liste gespeichert wird.
  • Folglich werden Worte, die zwischen der Datenbank und dem Benutzer übertragen werden, nur mit Hilfe eines Übersetzungsdienstes übersetzt – wobei Widersprüche eingeführt werden können –, wenn die Worte von der Datenbank geliefert werden. Das Speichern einer Übersetzungsrelation zwischen dem Wort aus der Datenbank und einem korrespondierenden Wort in der Benutzersprache gewährleistest, dass diese Beziehung gesichert ist, um präzis und widerspruchsfrei auf die durch das Wort in der Datenbank identifizierten Elemente zuzugreifen. Die Übersetzung dieses Wortes wird dabei auch in der Liste für nachfolgenden Gebrauch gespeichert. Ein solcher nachfolgender Gebrauch kann in einer weiteren Anfrage verwendet werden.
  • Um eine Mehrdeutigkeit bei einer Übersetzung im Falle zu vermeiden, dass mehrere Übersetzungen eines Wortes existieren, kann so vorgegangen werden, dass zum Beispiel eine erste von solchen mehreren Übersetzungen ausgewählt wird. Dies beeinflusst nicht die Widerspruchsfreiheit in der Datenbank, solange die Übersetzung für den Benutzer geeignet ist, einen gewünschten Inhalt in der Datenbank zu identifizieren oder zu erkennen.
  • Durch das Verfahren gemäß der Erfindung ist es möglich, die Datenbank in der vom Benutzer bevorzugten Sprache, der Benutzersprache, abzufragen. Worte im Hinblick auf Elemente, die vorher als Ausgang geliefert worden sind, werden in der Liste gespeichert. Aus diesem Grund können nach und nach detailliertere Anfragen abgefragt werden, was im Gegenzug die Anzahl der Wörter in der Liste nach und nach erhöht.
  • Darüber hinaus wird gewährleistet, dass die Worte in der Datenbanksprache, die aus der Benutzersprache übersetzt wurden, tatsächlich in der Datenbank exis tieren. Aus diesem Grund werden Fehler aufgrund von mehrdeutigen Übersetzungen vermieden.
  • Es sei darauf hingewiesen, dass die Benutzersprache die in der Datenbank verwendete Sprache sein kann, die so genannte Datenbanksprache, oder dass sie unterschiedlich zu der Datenbanksprache ist.
  • Vorzugsweise weist das Verfahren den Schritt auf, das korrespondierende Wort in der Benutzersprache zu dem Benutzergerät als Teil der Antwort von der Datenbank zu dem Benutzergerät zu übermitteln. Hierdurch wird dem Benutzer eine übersetzte Antwort von der Datenbank geliefert.
  • Das Verfahren kann den Schritt aufweisen, die Anfrage in der Benutzersprache, wie sie von dem Benutzergerät übermittelt wurde, in eine in die Datenbanksprache übersetzte Anfrage neu zu formulieren, um dadurch die Anfrage in der Datenbanksprache zu behandeln. Das liefert die Möglichkeit, dass die Anfrage automatisch Wort für Wort übersetzt werden kann, sodass gewährleistet ist, dass die Anfrage in der Benutzersprache in eine entsprechende Anfrage in der Datenbanksprache übersetzt wird, wobei die Wörter in der korrespondierenden Anfrage unzweideutige Übersetzungen von Wörtern in der Anfrage in der Benutzersprache sind. Zudem können Übersetzungsrelationen zwischen einzelnen Wörtern, die schon einmal übersetzt und in früheren Anfragen verwendet worden sind und in der Datenbanksprache und für korrespondierende Wörter in einer Benutzersprache benutzt worden sind, erneut bei der Behandlung von Anfragen, die diese einzelnen Wörter enthalten, wieder verwendet werden. Das resultiert in weniger Übersetzungen und daher in einem geringeren Zeitaufwand.
  • Es wird bevorzugt, dass die Übersetzungsbeziehung zwischen Wörtern in der Benutzersprache und übersetzten Wörtern in der Datenbanksprache eine „Wort-für-Wort" Übersetzungsrelation ist. Obwohl ein Wort mehrere Übersetzungen haben kann, wird dieses nicht die Anfrage an die Datenbank beeinflussen, sondern lediglich die Darstellung der Daten. Auf diese Weise werden unzweideutige Übersetzungen keine Fehler bei Anfragen an die Datenbank erzeugen.
  • Die Anfrage kann erzeugt werden, indem ein Anfangssatz von Wörtern verwendet wird, die „Wort-für-Wort"-Übersetzungsrelationen von vorbestimmten Wörtern der Datenbanksprache sind und vorbestimmte, in der Datenbank existierende Elemente darstellen. Das hat den Vorteil, dass keine Kenntnis der Datenbanksprache für die Erzeugung einer Anfrage erforderlich ist. Aus diesem Grunde kann ein Benutzer die Datenbank lediglich in seiner eigenen Sprache oder in irgendeiner anderen bevorzugten Benutzersprache verwenden.
  • Vorzugsweise repräsentieren die vorbestimmten Wörter Elemente, die Kategorien von Elementen in der Datenbank sind. Damit wird ein relevanter aber typisch beschränkter und damit auch weniger Speicherplatz erforderlicher Satz von Wörtern, d. h. Übersetzungsbeziehungen zum Erzeugen einer ersten groben Anfrage an die Datenbank, im Vergleich mit einer Übersetzung aller Wörter in der Datenbank oder aller Kategorien oder anderer weniger beschränkter Sätze von Wörtern geliefert.
  • Vorzugsweise wird der Anfangssatz der Wörter um eine Übersetzungsrelation erweitert, wenn eine Antwort von der Datenbank und als Folge des Schrittes, die Übersetzungsrelation in der Liste zu speichern, empfangen wird, um dadurch einen erweiterten Satz aus Worten zu bilden. Damit können die Übersetzungsrelationen, die in der Liste gespeichert sind und von Übersetzungen aus der Datenbanksprache in die Benutzersprache herrühren, verwendet werden, um weitere Anfragen zu verbessern oder zu erweitern. Wie oben beschrieben, ist der Anfangssatz von Worten ein Satz aus Übersetzungsrelationen vorbestimmter Worte, wobei die Übersetzungsrelationen zwischen Worten in der Datenbanksprache und korrespondierenden Worten in der Benutzersprache bestehen. Der Anfangssatz von Worten ist vorzugsweise ein Satz von Worten, die Kategorien von Elementen repräsentieren, für die Anfragen erzeugt werden können. Beispiele für Kategorien können „Finanzen", „Personal", „Firmen", „Geschäftszweige", „Umsatz", „Gewinn", „Zeitperiode", „Produkte", etc. sein. Natürlich hängt der erweiterte Satz von Worten von der erzeugten Anfrage ab. Wenn die Anfra ge sich zum Beispiel auf „Umsatz pro Produkt" bezieht, kann der erweiterte Satz von Worten die Produktgruppen und/oder Produktnamen enthalten, zum Beispiel „Molkerei", „Bäckerei", „Verschiedenes", etc. Wenn „Molkerei" gewählt wird, um die Anfrage zu präzisieren, kann der erweiterte Satz von Worten zum Beispiel „Milch", „Butter", „Käse", etc. enthalten. Der erweiterte Satz von Worten kann als neuer Anfangssatz von Worten für weitere Anfragen betrachtet und verwendet werden.
  • Vorzugsweise wird der erweiterte Satz von Worten Wort-für-Wort in Übereinstimmung mit dem Datum des Gebrauchs oder der Häufigkeit des Gebrauches des Wortes gekürzt. Auf diese Weise kann der Anfangssatz von Worten ein statischer Satz von Worten sein, der zum Beispiel durch den Administrator der Datenbank ausgewählt wird, und der erweiterte Satz von Worten kann ein dynamischer sein, der während der Bearbeitung von Anfragen an die Datenbank in einer anderen Sprache als der Datenbanksprache erweitert wird. Üblicherweise erzeugt der Administrator den Anfangssatz von Worten auf der Basis eines Datenbankmodelles mit dem Inhalt der Datenbank. Üblicherweise wird der erweiterte Satz von Worten mehrere Übersetzungsrelationen als der Anfangssatz der Worte enthalten, da eine Kategorie üblicherweise mehr als ein Element enthält. Jedoch ist es möglich, einen erweiterten Satz von Worten zu finden, der weniger Übersetzungsrelationen als der Anfangssatz der Worte aufweist, zum Beispiel, wenn alle Ergebnisse von Anfragen lediglich aus Zahlen bestehen. Schließlich kann der erweiterte Satz von Worten Null-Übersetzungsrelationen enthalten, zum Beispiel vor der ersten Anfrage an die Datenbank oder dann, wenn der erweiterte Satz von Worten von der Liste gestrichen worden ist, was regelmäßig erfolgen könnte, um eine exzessive Listengröße und daher Speicherverbrauch zu vermeiden.
  • Wie oben erläutert, ist der Anfangssatz von Worten eine Anzahl von Übersetzungsrelationen von vorbestimmten Wörtern und der erweiterte Satz von Worten betrifft weitere Übersetzungsrelationen, die während der Benutzung der Datenbank erzeugt werden. Somit wird der Anfangssatz von Worten vor der ersten Nutzung der Datenbank bestimmt, zum Beispiel durch den Ersteller oder Administrator der Datenbank. Diese Bestimmung des Anfangssatzes der Worte kann eine Angabe von Worten lediglich in der Datenbanksprache sein, wobei diese Worte anschließend in die Benutzersprachen durch den Übersetzungsdienst übersetzt werden, oder die Bestimmung des Anfangssatzes von Worten könnte Wörter in der Datenbanksprache gemeinsam mit Übersetzungsrelationen zu Worten in den Benutzersprachen enthalten, sodass die Liste vorab mit Übersetzungsrelationen durch den Administrator der Datenbank geladen wird. Es ist ebenfalls möglich, dass der Administrator die Liste vorab mit Übersetzungsrelationen einiger der Worte in dem Anfangssatz der Worte lädt, und dass der Rest der Worte in dem Anfangssatz der Worte automatisch in die Benutzersprachen durch den Übersetzungsdienst übersetzt wird. Schließlich könnte es möglich sein, dass der Anfangssatz der Worte aufgrund anderer Tatsachen als der Entscheidung des Administrators geändert werden kann, zum Beispiel automatisch dann, wenn neue Kategorien in die Datenbank eingeführt werden.
  • Es ist erkennbar, dass der erweiterte Satz von Worten extrem voluminös wird, was nachteilig sein könnte. Zusätzlich wird die Qualität der Übersetzungsleistungen verbessert, was es möglich macht, dass neue Übersetzungen genauer als ältere sind. Diese Probleme können vorteilhaft verwendet werden, um bereits etablierte Übersetzungsrelationen in der Liste zu eliminieren und sind an eine bevorzugte Ausführung des Verfahrens gemäß der Erfindung gerichtet, bei der der erweiterte Satz von Worten Wort-für-Wort in Übereinstimmung mit dem Datum der Nutzung oder der Häufigkeit der Nutzung des Wortes gekürzt wird. Zum Beispiel kann entschieden werden, aus dem erweiterten Satz von Worten Worte zu kürzen, wenn diese Worte nicht in irgendeiner Anfrage oder in einem Ergebnis einer Anfrage für eine gewisse Zeitspanne benutzt wurden, zum Beispiel während eines Monats, einer Woche, etc. Eine weitere Möglichkeit ist es, alle Worte aus dem erweiterten Satz von Worten zu kürzen, ausgenommen die am Meisten gebrauchten Teile von Worten, wobei dieses im Wesentlichen ein beliebiger Prozentsatz des erweiterten Satzes von Worten sein kann. Dieser Prozentsatz wird typischerweise durch einen Administrator der Datenbank oder durch den Benutzer festgelegt. Andere Möglichkeiten, wann und in welcher Weise Worte von der Liste gestrichen werden, sind natürlich auch möglich.
  • Gemäß einer bevorzugten Ausführung des Verfahrens sind folgende Schritte vorgesehen: Liefern von Anfragekomponenten zur Auswahl durch einen Benutzer, wobei die Anfragekomponenten Teile einer Anfrage sind; Zusammenstellen ausgewählter Anfragekomponenten, um eine Anfrage zu erstellen. Auf diese Weise wird eine benutzerfreundliche Art zum Erstellen von Anfragen geliefert, sodass ein Benutzer sich auf das Erstellen der Anfrage konzentrieren kann, anstatt durch geringe jedoch kritische syntaktische Fehler verwirrt zu werden. Gemäß einer Ausführung des Verfahrens gemäß der Erfindung weisen die Anfragekomponenten Worte aus dem Anfangssatz und/oder Worte aus dem erweiterten Satz auf.
  • Daher weiß der Benutzer exakt, welche Übersetzungen der Worte in der Datenbanksprache in der Benutzersprache zur Verfügung stehen, und er kann leicht Anfragen auf der Basis des existierenden Anfangssatzes der Worte und des erweiterten Satzes der Worte erzeugen.
  • Vorzugsweise weist das Verfahren die Schritte auf, ein Ausgabeergebnis von der Datenbank an eine Benutzer-Schnittstelle des Benutzergerätes zu liefern; und Möglichkeiten an diese Benutzer-Schnittstelle zu liefern, um neue Fragen zu starten, indem Ausgangsdaten aus frühren Anfragen angezeigt und angeklickt und verwendet werden als Eingaben für eine folgende Anfrage. Dies ermöglicht eine speziell benutzerfreundliche und leicht durchzuführende Verbesserung von Anfragen.
  • Gemäß einer bevorzugten Ausführung werden mehrere Listen von vorbestimmten Übersetzungsrelationen zur Verfügung gestellt; vorzugsweise weist das Verfahren ferner den Schritt auf, eine Liste in Abhängigkeit einer Information auszuwählen, die eine bevorzugte Benutzersprache und/oder die Identität eines Benutzers identifiziert. Dieses kann unterstützt werden durch eine Vielzahl von Listen, auf die Benutzer zugreifen können, sodass durch die Identität des Benutzers oder der bevorzugten Benutzersprachen die zu verwendende Liste bestimmt wird. Auf diese Weise kann ein Benutzer von der Nutzung der Datenbank durch andere Benutzer profitieren und auch von der resultierenden Erweiterung des Anfangssatzes der Worte oder von seiner eige nen früheren Benutzung der Datenbank und der damit verbundenen Erweiterung des Anfangssatzes der Worte.
  • Darüber hinaus bezieht sich die Erfindung auf ein Computer-lesbares Medium, das mit einem Programm zum Durchführen des Verfahrens beim Ablauf auf einem Computer kodiert ist; ebenso auf ein Computersystem mit einer Datenbank und einem Computer, die programmiert sind, um das Verfahren auszuführen; und auf ein Ausbreitungssignal, das Befehle trägt, um das Verfahren auszuführen, wenn es auf einem Computer durchgeführt wird.
  • Die Erfindung wird im Folgenden in Verbindung mit einem bevorzugten Ausführungsbeispiel und in Bezug auf die Zeichnung näher erläutert, in der:
  • 1 ein Arbeitsdiagramm für das Verfahren gemäß der Erfindung ist;
  • 2 ein Flussdiagramm für das Verfahren gemäß der Erfindung ist;
  • 3 ein Beispiel für ein Blockschaltbild und die Benutzer-Schnittstelle zum Erzeugen und Bearbeiten einer Anfrage gemäß der Erfindung darstellt;
  • 4 ein Beispiel für ein Ausgabeergebnis an einer Benutzer-Schnittstelle zeigt;
  • 5 ein Strukturdiagramm für ein Verfahren gemäß der Erfindung ist.
  • 1 ist ein Blockschaltbild für die Erfindung. Ein Benutzer erzeugt Anfragen Q1 10a an eine Datenbank DB in einer Benutzersprache auf der Basis des Anfangssatzes von Worten, die an die Benutzer-Schnittstelle (nicht gezeigt) geliefert wurde. Da die Anfrage 10a auf der Basis des Anfangssatzes der Worte erzeugt worden ist, existiert eine Übersetzungsrelation zwischen diesen Worten innerhalb des Anfangssatzes der Worte in der Benutzersprache und der Datenbanksprache in der Liste, und diese Liste ist bei 20 in eine Tabelle gefasst, um diese Übersetzungsrelation zu finden und zu verwenden und damit die Worte in der Datenbanksprache entsprechend jedem Wort in der Anfrage Q1 in der Benutzersprache zu verwenden. Damit wird die Anfrage 10a in die Datenbanksprache mit Hilfe von Übersetzungsrelationen in der Liste übersetzt. Diese Übersetzungsrelationen wurden mit Hilfe eines Übersetzungsdienstes erstellt und anschließend in der Liste gespeichert. Welche Worte den Anfangssatz der Worte bilden, wird üblicherweise durch den Ersteller oder den Administrator der Datenbank bestimmt.
  • Danach wird die Anfrage in der Datenbank 30 bearbeitet, wonach der Prozess bei 40 fortgesetzt wird, wo bestimmt wird, ob die Antwort von der Datenbank zu übersetzende Worte enthält, d. h. Worte, für die eine Übersetzungsrelation nicht in der Liste existiert. Wenn dieses nicht der Fall ist, läuft der Prozess direkt zu 70, wo ein Ergebnis der Anfrage an den Benutzer ausgegeben wird. Im anderen Falle wird ein Übersetzungsdienst TS 50 verwendet, um eine eindeutige Übersetzung eines jeden Wortes in dem Ergebnis zu der Anfrage an die Datenbank zu finden, wobei diese unzweideutige Übersetzung anschließend in der Liste 60 als Wort-für-Wort-Relation gespeichert wird. Ein Beispiel eines Teiles einer solchen Liste ist unten in Tabelle 1 dargestellt.
  • Die in der Liste 60 gespeicherten Worte liefern einen Beitrag zu dem erweiterten Satz von Worten, der von einem Benutzer verwendet werden kann, eine weitere Anfrage Q2 10b zu formulieren. Das Bearbeiten der Anfrage Q2, 10b bis 70d, ist analog zu der Bearbeitung der Anfrage Q1, 1070, jedoch kann der Satz von Worten, die der Benutzer verwenden kann, um seine Frage Q2 zu formulieren, größer als der Satz von Worten sein, auf den bei der Formulierung der ersten Anfrage zugegriffen werden kann, da das Ergebnis aus der ersten Anfrage neue Worte enthalten kann, die in die Benutzersprache übersetzt und in dem erweiterten Satz von Worten gespeichert wurden, wie oben erläutert, um zusätzliche Worte in dem erweiterten Satz von Worten für nachfolgende Anfragen zur Verfügung zu stellen.
  • Es sei bemerkt, dass es möglich ist, zu bestimmen, ob die Übertragung zwischen dem Benutzergerät und der Datenbank sich auf eine Anfrage oder eine Ant wort von der Datenbank bezieht, indem der Sender, der Empfänger oder der Inhalt der Übertragung bestimmt wird. Daher ist es möglich zu bestimmen, ob der Übersetzungsdienst eingeschaltet werden soll (vergl. die Entscheidungseinheit 40) oder ob die Liste durchgesehen werden soll (vergl. CM LU, 20), um eine Übersetzungsrelation zu finden.
  • Tabelle 1: Beispiel eines Teiles einer Liste
    Figure 00120001
  • Die Tabelle 1 zeigt ein Beispiel eines Teiles einer Liste. Bei diesem Beispiel sind die Datenbanksprache Englisch und die Benutzersprache Deutsch. Die Übersetzung wird aus dem Englischen (der Datenbanksprache) in das Deutsche (die Benutzersprache) ausgeführt. Wie in Tabelle 1 gezeigt, haben die beiden Worte „Brownies" und „Cookies" die gleiche Übersetzung in Deutsch. Aus diesem Grunde wird eine Index-Nummer zu der zweiten Übersetzung hinzugefügt, um sicherzustellen, dass alle Übersetzungen 1-zu-1-Übersetzungen sind, d. h. dass keine Worte in der Datenbanksprache die gleiche Übersetzung in der Benutzersprache haben können. Die Spalte „Datumsstempel" enthält Informationen hinsichtlich des Speicherdatums der Übersetzungsrelation, wobei diese Information in Entscheidungen verwendet werden kann, wie lange die Übersetzungsrelationen in der Liste gehalten werden. Zum Beispiel kann entschieden werden, Worte aus dem erweiterten Satz von Worten zu streichen, wenn diese Worte nicht in einer Anfrage oder in einem Ergebnis für eine Anfrage für eine gewisse Zeitspanne enthalten war, zum Beispiel einen Monat, eine Woche, etc.
  • Eine Neuformulierung einer Anfrage in der Benutzersprache, in diesem Falle Deutsch, in die Datenbanksprache, d. h. Englisch, kann auf der Basis der Übersetzungsrelation in der Liste entsprechend Tabelle 1 erfolgen.
  • Eine weitere Möglichkeit ist es, eine Information aufzunehmen hinsichtlich der Häufigkeit der Verwendung von Worten in der Liste und alle Worte aus dem erweiterten Satz von Worten zu streichen, ausgenommen für die am meisten benutzten Anteile von Worten, wobei dieser Anteil im Wesentlichen jeden Prozentsatz des erweiterten Satzes von Worten umfassen kann. Dieser Prozentsatz wird üblicherweise durch einen Administrator der Datenbank oder durch den Benutzer festgesetzt.
  • 2 ist ein Flussdiagramm für ein Verfahren gemäß der Erfindung, das im Schritt 100 beginnt. Im Schritt 101 wird entschieden, ob die Benutzersprache unterschiedlich zu der Datenbanksprache ist. Wenn dieses der Fall ist, wird zu dem Schritt 102 übergegangen, indem der Anfangssatz der Worte an den Benutzer 102 geliefert wird, um ihm bei der Erzeugung einer Anfrage 103 zu unterstützen. Wenn die Benutzersprache die gleiche wie die Datenbanksprache ist, geht das Verfahren direkt zu dem Schritt 103 über. Damit kann die Anfrage in einer für sich wohlbekannten Art erzeugt werden, wenn die Benutzersprache ähnlich oder gleich der Datenbanksprache ist. Der Anfangssatz von Worten wird in der Liste abgespeichert. Im Schritt 104 wird die Anfrage in einer wohlbekannten Art bearbeitet, um eine Datenbankantwort zu erzeugen, wonach es wiederum bestimmt wird, Schritt 105, ob die Datenbanksprache unterschiedlich zu der Benutzersprache ist.
  • Wenn dieses der Fall ist, wird die Liste im Schritt 106 durchgesehen, um nach Übersetzungsrelationen für Worte zu suchen, die in der Datenbankantwort enthalten sind. Wenn eine Übersetzungsrelation für ein Wort in der Datenbankantwort existiert, wird diese Übersetzungsrelation verwendet, um eine unzweideutige Übersetzung dieses Wortes auszuführen. Im Schritt 107 wird bestimmt, ob die Datenbankantwort Worte enthält, für die keine Übersetzungsrelation in der Liste gespeichert ist. Wenn dieses der Fall ist, geht das Verfahren zum Schritt 108 über, in dem ein Übersetzungsdienst verwendet wird, um eine Übersetzungsrelation für jedes der Worte zu erzeugen, für die keine Übersetzungsrelation in der Liste gespeichert ist. Dieser Übersetzungsdienst kann ein lokaler Dienst sein, ein Dienst im Intranet oder im Internet. Die Übersetzungsrelationen, die in dem Schritt 109 erzeugt wurden, werden in der Liste im Schritt 109 gespeichert. Dieses Speichern von Übersetzungsrelationen im Hinblick auf die Datenbankantwort in der Benutzersprache wird verwendet, um den Anfangssatz von Worten auf einen erweiterten Satz von Worten zu erweitern, die in wei teren Anfragen wie bei dem Anfangssatz im Schritt 102 verwendet werden können. Nach dem Schritt 109 kehrt das Verfahren zum Schritt 107 zurück, um zu bestimmen, ob die Datenbankantwort weitere Wörter enthält, für die keine Übersetzungsrelation in der Liste gespeichert ist, und die Schritte 107 bis 109 werden wiederholt, bis dieses nicht länger der Fall ist, wonach das Verfahren mit dem Schritt 110 fortfährt, indem ein Bericht der Datenbankantwort in der Benutzersprache ausgeführt ist, wonach das Verfahren im Schritt 111 endet. Bei einer alternativen Ausführung ist es möglich, dass ein Benutzer, dessen bevorzugte Benutzersprache gleich der Datenbanksprache ist, mit einem Anfangssatz von Worten beliefert wird, um ihm beim Erzeugen einer Anfrage zu unterstützen.
  • Wie oben erwähnt, wird eine Übersetzung angefertigt, indem ein Übersetzungsdienst verwendet wird, der in dem Intranet, dem Internet oder lokal verfügbar ist. Ein Beispiel könnte die Übersetzung der folgenden Worte sein:
    Bakery
    Dairy
    Miscellaneous
  • Dieses könnte ausgeführt werden, indem eine Anfrage an einen Übersetzungsdienst im Internet geschickt wird, in dem zum Beispiel angefragt wird:
    www.translationservice.com/translate?lng=en_ge&words=bakery + diary + miscellaneous.
  • Der Bericht in Anfrage auf diesen hypothetischen Service ist ein Dokument mit den folgenden Worten
    Bäckerei
    Molkerei
    Verschiedenes
  • Die Erfindung deckt natürlich auch andere Verfahren zum Ausführen von Übersetzungen über einen Übersetzungsdienst ab.
  • 3 zeigt ein kombiniertes Blockschaltbild und eine Benutzer-Schnittstelle 211 eines Benutzersystemes. Die Benutzer-Schnittstelle unterstützt das Erzeugen von strukturierten Anfragen mit Hilfe von Blöcken 212 bis 214. Als Beispiel kann der Benutzer in dem Block 212 zur Verfügung stehende Optionen, zum Beispiel Namen, Titel, Einheiten, Zahlen entsprechend der Art von Information auswählen, die in der Datenbank vorliegen; einige Optionen basieren auf einer vorhergehenden Auswahl. Der Block 213 kann zum Beispiel eine Liste der Anfangssätze von Worten oder der erweiterten Sätze von Worten enthalten.
  • Während der Auswahl von Optionen, die Anfragekomponenten der Anfrage bilden können, kann der Benutzer die laufende Anfrage in einem Block 214 erstellen. Gemäß einer Ausführung der Erfindung kann die Schnittstelle die Erzeugung der Anfrage in einer natürlichen menschlichen Sprache unterstützen. Dem Benutzer kann ein Satz mit vorbestimmten Teilen eines unvollständigen Satzes präsentiert werden, zum Beispiel „Ich möchte gerne einen Bericht erzeugen ..." wobei verschiedene Optionen ausgewählt werden können oder Satzteile hinzugefügt werden, bis ein vollständiger Satz erzeugt ist, der alle Details über die gewünschte Datenbanksuche beschreibt, wobei dieser Satz in dem Block 214 an der Benutzer-Schnittstelle angezeigt wird. Die Satzteile können in einer beliebigen Folge hinzugefügt werden, und der Satz kann geändert werden, indem Anfragekomponenten ausgegeben oder entfernt werden. Andere Beispiele von unvollständigen auszuwählenden Sätzen könnten sein „ mit dem Titel ...", „Die Informationen in dem Bericht sollten gruppiert werden durch ...", „Der Bericht sollte formatiert werden mit ...". Es ist selbstverständlich, dass diese Beispiele nicht beschränkende Beispiele sind, und dass viele andere Arten verwendet werden können. Es soll bemerkt werden, dass die Abfolge dieser unvollständigen Sätze nicht wichtig ist. Die unvollständigen Sätze können in dem Block 212 angezeigt werden, die auszuwählenden Elemente können in dem Block 213 angezeigt werden. Das Liefern von Anfragekomponenten kann in der Benutzer-Schnittstelle mit Hilfe von anzukreuzenden Kästchen, Aktionslisten, Anzeige- und Klick-Schaltflächen oder ein Feld bewirkt werden, um Text einzugeben, oder in jeder beliebigen anderen herkömmlichen Art. Die Aktivierung eines Feldes an der Benutzer-Schnittstelle (nicht dargestellt) übermittelt die angeforderte Datenbanksuche entsprechend zu der in dem Block 216 erzeugten Anfrage. Dem Benutzer wird mitgeteilt, dass er in einer natürlichen Sprache schreiben kann, die unterschiedlich zu der Programmiersprache oder Computersprache oder einer speziellen Anfragesprache der Datenbank mit Kodierungen und einer speziellen Syntax sein kann. Jedoch wird die strukturierte Anfrage tatsächlich im Gegensatz zu einem freien Text formuliert, wenn der Benutzer zwischen unvollständigen existierenden Sätzen auswählt.
  • Im Vorherigen wurde eine Art der Formulierung einer strukturierten Anfrage mit Hilfe von Text erläutert. Es ist auch möglich, eine strukturierte Anfrage zu formulieren, indem dem Benutzer die Wahl zwischen unterschiedlichen Darstellungsarten gelassen wird, zum Beispiel einem Graphen, einer Tabelle, einem Diagramm, einem Balkendiagramm, und der nachher die Elemente angeben kann, die mit der gewählten Präsentationsform dargestellt werden, zum Beispiel mit Hilfe von Ausklappfenstern mit Text, und optional mit dem Format oder anderen Anforderungen, wie die Daten an der Benutzer-Schnittstelle dargestellt werden sollen.
  • Die Anfrage wird dann zu einem Übersetzungsdienst 216 geleitet, um Übersetzungen von Worten in einer Benutzersprache in der Anfrage und entsprechende Wörter in der Datenbanksprache zu finden. Dieses Liefern von Übersetzungen wird durch die Liste 220 unterstützt, die einen Anfangssatz von Worten 218 und einen erweiterten Satz von Worten 219 enthält. Die Anfrage wird dann zu der Datenbank 217 geleitet, wird darin bearbeitet und dann wieder zu dem Übersetzungsdienst geleitet, um Übersetzungsrelationen zwischen Worten in der Datenbanksprache in der Datenbankantwort und entsprechenden Worten in der Benutzersprache zu finden. Wiederum wird diese Übersetzung durch die Liste unterstützt, sodass Übersetzungsrelationen, falls solche vorliegen, aus der Liste verwendet werden. Wenn keine solchen Übersetzungsrelationen in der Liste bestehen, werden neue Übersetzungsrelationen für die nicht in der Liste repräsentierten Worte mit Hilfe des Übersetzungsdienstes gefunden, und diese werden in dem erweiterten Satz von Worten gespeichert.
  • Wie durch den Pfeil 222 dargestellt, wird der Inhalt der Liste bei der Auflistung in dem Block 213 in der Benutzer-Schnittstelle 211 verwendet. Die im Schritt 216 ausgeführte Übersetzung wird verwendet, um eine Antwort 221 an den Benutzer zu erzeugen, wobei diese Antwort 221 an der Benutzer-Schnittstelle auf verschiedene Weise angezeigt werden kann. Ein Beispiel ist in 4 gezeigt, das ein nicht beschränkendes Beispiel eines Ausgaberesultates an einer Benutzer-Schnittstelle 300 zeigt.
  • Die Benutzer-Schnittstelle 300 enthält Blöcke 301 und 302a bis c. Der Block 301 enthält Textinformation hinsichtlich einer Kategorie, und die Blöcke 302a bis 302c enthalten Textinformation hinsichtlich Elementen. Beispiele für Kategorien könnten „Umsatz pro Produkt", „Gewinn pro Produkt" etc. sein; Beispiele für Elemente könnten „Produktname", „Produktgruppe" etc. sein. In der Benutzer-Schnittstelle 300 könnte der Block 301 daher die Worte „Umsatz pro Produkt" und die Blöcke 302a bis 302c die Worte „Molkerei", „Bäckerei", „Verschiedenes" enthalten. Als Verbesserung dieser Anfrage könnte ein Benutzer detailliertere Informationen anfordern, indem ein Objekt an der Benutzer-Schnittstelle angewählt und angeklickt wird. Diese weitere Anfrage könnte zum Beispiel beinhalten, den Umsatz pro Produkt in der Produktgruppe „Molkerei" abzufragen, wobei korrespondierende Beispiele von Elementen zum Beispiel „Milch", „Butter", „Käse" usw. sein könnten. Wiederum wird diese Anfrage verfeinert; zum Beispiel hinsichtlich unterschiedlicher Käsearten. Ein wesentliches Merkmal der Erfindung im Hinblick auf die Benutzer-Schnittstelle ist, dass der Benutzer lediglich Text in seiner bevorzugten Benutzersprache sieht, sodass alle Worte in der Ausgabeantwort in die Benutzersprache übersetzt sind. Ein weiteres wesentliches Merkmal entsprechend der Erfindung ist, dass die Übersetzungen der verfeinerten Anfragen auf der Liste basieren, sodass 1-zu-1-Übersetzungen zwischen Elementen in der Datenbanksprache und korrespondierenden Übersetzungen in der Benutzersprache stets gewährleistet sind.
  • Typischerweise wird der Text in dem Block 301 ein oder mehrere Worte aus dem Anfangssatz der Worte sein, wohingegen der Text in den Blöcken 302a bis 302c Worte sein werden, die nach dieser Anfrage als Worte in dem erweiterten Satz von Worten gespeichert werden.
  • 5 zeigt als nicht beschränkendes Beispiel ein Strukturdiagramm des Verfahrens gemäß der Erfindung, das mehrere Benutzer unterstützt. Aus Gründen der Klarheit sind lediglich drei Benutzer 210 gezeigt, jedoch ist es selbstverständlich, dass im Wesentlichen eine beliebige Anzahl von Benutzern involviert sein kann. Das Verfahren gemäß der Erfindung unterstützt die Nutzung in einer Vielzahl von Benutzersprachen. Ein Benutzer 210 erstellt eine Anfrage in seiner bevorzugten Sprache, der Benutzersprache. Diese Anfrage wird zu dem Übersetzungsdienst TS 216 geleitet, wobei Information hinsichtlich der Benutzersprache und/oder der Identifizierung des Benutzers in dem Block 223 herangezogen wird und zu dem Block 224 gesendet wird, in dem eine Wahl getroffen wird, welche Liste unter einer Vielzahl von Arbeitsspeichern 220 in der Übersetzung zwischen einer Benutzersprache und einer Datenbanksprache verwendet werden soll. Es sei bemerkt, dass die Anzahl von Arbeitsspeichern gleich der Anzahl beziehungsweise kleiner oder größer als die Anzahl der Benutzer sein kann. Zum Beispiel könnte eine Liste 220 jedem Benutzer 210 zugeordnet werden, oder es kann eine Liste 220 jeder Benutzersprache zugeordnet werden. Nach Identifizierung der Benutzersprache und Auswahl der korrespondierenden Liste, wird die Bearbeitung der Anfrage in der Datenbank in der Datenbanksprache ausgeführt, wie oben erläutert. Die Anfragen werden wie zu 3 erläutert, erzeugt, wobei die Anfragen, wie in Bezug auf die 1 und 2 erläutert, bearbeitet und die Ergebnisse wie in Bezug zu den 3 und 4 erläutert, ausgegeben werden.
  • Es sei darauf hingewiesen, dass die Liste von Übersetzungsrelationen auch einen Cache-Speicher CM angibt. Die Liste oder der Cache-Speicher können als Tabelle oder eine ähnliche Struktur in einer Datenbank integriert sein. Alternativ kann die Liste als einfache Datei in einem elektronischen Dateisystem integriert sein.
  • Gemäß einer bevorzugten Ausführung wird die Erfindung als Mittelschicht-Software-Komponente (wie detailliert oben beschrieben) auf einem Server-Computer ausgeführt, der mit der Datenbank verbunden ist und zumindest mit einem Kundencomputer verbunden ist. Software-Komponenten auf dem Kundencomputer werden installiert, um eine Interaktion mit dem Benutzer oder den Benutzern oder dem Administrator beziehungsweise den Administratoren zu liefern, wie dieses oben eben falls im Detail beschrieben worden ist. Die Datenbank, der Server-Computer und der Kundencomputer können mit einem Datennetzwerk untereinander verbunden sein, zum Beispiel einem lokalen Bereichsnetzwerk oder einem externen Bereichsnetzwerk.
  • Der Speicher (einschließlich die Liste) kann ein Magnetband, ein optischer Speicher, ein digitaler Videospeicher (DVD), ein Kompaktspeicher (CD oder CD-ROM), eine Minidisk, eine Harddisk, eine Floppydisk, ein ferroelektrischer Speicher, ein elektrisch löschbarer programmierbarer Nur-Lesespeicher (EEPROM), ein Flashspeicher, EPROM, ein Nur-Lesespeicher (ROM), ein statischer Zugriffspeicher (SRAM), ein dynamischer Zugriffsspeicher (DRAM), ein synchroner dynamischer Zugriffsspeicher (SDRAM), ein ferromagnetischer Speicher, ein optischer Speicher, eine ladungsgekoppelte Einrichtung, eine Smart-Card, eine PCMCIA-Karte etc. sein.
  • Eingabeeinrichtungen zum Aufnehmen von Eingaben eines Benutzers und/oder eines Administrators können eine Tastatur, ein Tastenkissen, einen Knopf oder eine Anordnung von Knöpfen, einen Berührungsschirm, ein Zeigergerät wie zum Beispiel eine Maus, einen Trackball, ein Berührungskissen, einen digitalen Stift oder dergleichen umfassen. Die Eingabeeinrichtungen können ferner andere Formen von Mensch-Maschine-Schnittstellen, so zum Beispiel eine auf Stimmen reagierende Schnittstelle oder dergleichen aufweisen.
  • Ausgabeeinrichtungen zum Liefern von Ausgaben an einen Benutzer und/oder einen Administrator können eine Anzeigeeinrichtung, wie einen Monitor, eine Flüssigkristallanzeige, eine Kathodenstrahlröhre aufweisen, um eine Anzeige an eine graphische Benutzer-Schnittstelle oder eine andere Mensch-Maschinen-Schnittstelle zu liefern. Alternativ oder zusätzlich können die Ausgabeeinrichtungen eine Audio-Ausgabeeinrichtung, zum Beispiel eine Soundkarte oder einen Lautsprecher aufweisen.
  • Die Bearbeitungsreinrichtungen zum Ausführen eines Programmes oder einer Software-Komponente zum Ausführen der Erfindung können einen Mikroprozessor enthalten, einen anwendungsspezifischen integrierten Schaltkreis oder einen anderen integrierten Schaltkreis, eine Smart-Card, einen Universalcomputer mit geeigneter Software oder dergleichen.
  • Ein Computer-lesbares Medium kann ein Magnetband, eine optische Platte, eine digitale Videoplatte (DVD), eine Kompaktplatte (CD oder CD-ROM), eine Minidisk, eine Harddisk, eine Floppydisk, eine Smart-Card, eine PCMCIA-Karte etc. sein.

Claims (15)

  1. Computer-implementiertes Verfahren zum Ausführen einer Übertragung zwischen einem Benutzergerät und einer Datenbank, wobei die Datenbank Elemente aufweist, die an eine Datenbanksprache angepasst sind, wobei eine Datenbanksprache eine natürliche Sprache ist, wobei Elemente in der Übertragung enthalten sind, und wobei Hinweise auf eine Anfrage nach diesen Elementen in der Datenbank an eine Benutzersprache angepasst sind, wobei das Verfahren die Schritte aufweist: Erstellen einer Anfrage an die Datenbank an einem Benutzergerät; Liefern der angeforderten Elemente von der Datenbank in Antwort auf die Anfrage an die Datenbank, wobei aus diesen Elementen zusammengesetzte Worte in der Datenbanksprache vorliegen; Ausführen einer Übersetzung in natürlicher Sprache zwischen Worten in den Elementen in der Datenbanksprache und in der Benutzersprache: Zuführen der angeforderten Elemente an das Benutzergerät; dadurch gekennzeichnet, dass das Verfahren ferner die Schritte aufweist: Bestimmen, ob die Übertragung auf eine Anfrage oder eine Antwort von der Datenbank bezogen ist, und Beschränken der Übersetzung, wenn die Übertragung auf eine Anfrage gerichtet ist, auf eine Liste von vorbestimmten Übersetzungsrelationen, wobei eine Übersetzungsrelation eine Beziehung zwischen einem Wort in der Datenbanksprache und einem korrespondierenden Wort in der Benutzersprache ist; und Durchsuchen der Liste, falls respondierenden Wort in der Benutzersprache ist; und Durchsuchen der Liste, falls die Übertragung sich auf eine Antwort bezieht, um eine Übersetzungsrelation für ein Wort in der Antwort zu finden, und, falls keine Übersetzungsrelation für das Wort in der Liste existiert, Übermitteln des Wortes zu einem Übersetzungsdienst, um daraufhin eine Übersetzungsrelation zwischen dem Wort und einem korrespondierenden Wort in der Benutzersprache zu empfangen, wobei diese Übersetzungsrelation in der Liste gespeichert wird.
  2. Verfahren nach Anspruch 1, das ferner den Schritt aufweist, das korrespondierende Wort in der Benutzersprache zu dem Benutzergerät als Teil der Antwort von der Datenbank zu dem Benutzergerät zu übermitteln.
  3. Verfahren nach Anspruch 1 bis 2, wobei ferner der Schritt vorgesehen ist, die Anfrage in der Benutzersprache, die von dem Benutzergerät übermittelt wird, in eine in die Datenbanksprache übersetzte Anfrage neu zu formulieren, um die Anfrage in der Datenbanksprache zu behandeln.
  4. Verfahren nach den Ansprüchen 1 bis 3, wobei die Übersetzungsrelation zwischen Worten in der Benutzersprache und übersetzten Worten in der Datenbanksprache eine „Wort-für-Wort"-Übersetzungsrelation ist.
  5. Verfahren nach den Ansprüchen 1 bis 4, wobei die Anfrage erstellt wird, indem ein Startsatz aus Worten verwendet wird, die „Wort-für-Wort"-Übersetzungsrelationen von vorbestimmten Worten in der Datenbanksprache sind und vorbestimmte, in der Datenbank existierende Elemente repräsentieren.
  6. Verfahren nach Anspruch 5, wobei die vorbestimmten Worte Elemente repräsentieren, die Kategorien von Elementen in der Datenbank sind.
  7. Verfahren nach Anspruch 6, wobei der Startsatz aus Worten erweitert wird, wenn eine Antwort von der Datenbank und als eine Folge des Schrittes, die Übersetzungsre lation in der Liste zu speichern, empfangen wird, um dadurch einen erweiterten Satz aus Worten zu bilden.
  8. Verfahren nach Anspruch 7, wobei der erweiterte Satz von Worten Wort-für-Wort in Übereinstimmung mit verwendeten Daten oder verwendeten Frequenzen des Wortes gekürzt wird.
  9. Verfahren nach den Ansprüchen 1 bis 8, das ferner den Schritt aufweist: Liefern von Anfragekomponenten zur Auswahl durch einen Benutzer, wobei die Anfragekomponenten Teile einer Anfrage sind; und Zusammenstellen ausgewählter Anfragekomponenten, um eine Anfrage zu erstellen.
  10. Verfahren nach Anspruch 9, wobei die Anfragekomponenten Worte aus dem Startsatz und/oder Worte aus dem erweiterten Satz aufweist.
  11. Verfahren nach Ansprüchen 1 bis 10, wobei ferner die Schritte vorgesehen sind: Liefern eines Ausgabeergebnisses von der Datenbank an eine Benutzer-Schnittstelle des Benutzergerätes; und Liefern von Möglichkeiten in dieser Benutzer-Schnittstelle, um neue Fragen zu starten, indem Ausgangsdaten aus früheren Anfragen angezeigt und angeklickt und verwendet werden als Eingaben für eine folgende Anfrage.
  12. Verfahren nach Ansprüchen 1 bis 11, wobei mehrere Listen von vorbestimmten Übersetzungsrelationen zur Verfügung gestellt werden; und wobei das Verfahren ferner den Schritt aufweist, eine Liste in Abhängigkeit einer Information auszuwählen, die eine bevorzugte Benutzersprache und/oder die Identität eines Benutzers identifiziert.
  13. Computer-lesbares Medium, das mit einem Programm zum Durchführen des Verfahrens nach einem der Ansprüche 1 bis 12 beim Ablauf auf einem Computer kodiert ist.
  14. Computersystem mit einer Datenbank und einem Computer, der programmiert ist, das Verfahren nach einem der Ansprüche 1 bis 12 auszuführen.
  15. Ausbreitungssignal, das Befehle trägt, um das Verfahren gemäß einem der Ansprüche 1 bis 12 auszuführen, wenn es auf einem Computer durchgeführt wird.
DE60212330T 2002-04-12 2002-04-12 Verfahren zur Verarbeitung von mehrsprachigen Abfragen Expired - Lifetime DE60212330T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP02388030A EP1353280B1 (de) 2002-04-12 2002-04-12 Verfahren zur Verarbeitung von mehrsprachigen Abfragen

Publications (2)

Publication Number Publication Date
DE60212330D1 DE60212330D1 (de) 2006-07-27
DE60212330T2 true DE60212330T2 (de) 2007-06-21

Family

ID=28051875

Family Applications (1)

Application Number Title Priority Date Filing Date
DE60212330T Expired - Lifetime DE60212330T2 (de) 2002-04-12 2002-04-12 Verfahren zur Verarbeitung von mehrsprachigen Abfragen

Country Status (5)

Country Link
US (1) US7630961B2 (de)
EP (1) EP1353280B1 (de)
AT (1) ATE330287T1 (de)
DE (1) DE60212330T2 (de)
DK (1) DK1353280T3 (de)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000057320A2 (en) * 1999-03-19 2000-09-28 Trados Gmbh Workflow management system
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US7813917B2 (en) * 2004-06-22 2010-10-12 Gary Stephen Shuster Candidate matching using algorithmic analysis of candidate-authored narrative information
EP1866799A2 (de) * 2005-03-23 2007-12-19 Corporate Modelling Holdings PLC Globales datenbanksystem
US20070298384A1 (en) * 2006-06-09 2007-12-27 Scientific Learning Corporation Method and apparatus for building accuracy and fluency in recognizing and constructing sentence structures
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8577866B1 (en) * 2006-12-07 2013-11-05 Googe Inc. Classifying content
US8983970B1 (en) 2006-12-07 2015-03-17 Google Inc. Ranking content using content and content authors
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
EP2341450A1 (de) * 2009-08-21 2011-07-06 Mikko Kalervo Väänänen Verfahren und Mittel zur Datensuche und Sprachübersetzung
US8423576B2 (en) * 2010-01-11 2013-04-16 International Business Machines Corporation System and method for querying data streams
US20120116751A1 (en) * 2010-11-09 2012-05-10 International Business Machines Corporation Providing message text translations
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
EP2989615A4 (de) * 2013-04-23 2016-12-14 Nokia Technologies Oy Verfahren und vorrichtung für digitale fahrkartenkontrolle
US10140293B2 (en) 2015-05-18 2018-11-27 Google Llc Coordinated user word selection for translation and obtaining of contextual information for the selected word
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation
US10831999B2 (en) * 2019-02-26 2020-11-10 International Business Machines Corporation Translation of ticket for resolution
KR102256664B1 (ko) * 2019-10-30 2021-05-27 주식회사 솔트룩스 다국어 질의 응답 시스템

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7384A (en) * 1850-05-21 Feed-regulator for canals
SE466029B (sv) * 1989-03-06 1991-12-02 Ibm Svenska Ab Anordning och foerfarande foer analys av naturligt spraak i ett datorbaserat informationsbehandlingssystem
JP3960562B2 (ja) * 1994-09-30 2007-08-15 株式会社東芝 機械翻訳の学習方法
JP3161942B2 (ja) * 1995-06-14 2001-04-25 シャープ株式会社 訳振り機械翻訳装置
AU6849196A (en) * 1995-08-16 1997-03-19 Syracuse University Multilingual document retrieval system and method using semantic vector matching
JPH09128396A (ja) * 1995-11-06 1997-05-16 Hitachi Ltd 対訳辞書作成方法
US6233544B1 (en) * 1996-06-14 2001-05-15 At&T Corp Method and apparatus for language translation
US5956740A (en) * 1996-10-23 1999-09-21 Iti, Inc. Document searching system for multilingual documents
US6092035A (en) * 1996-12-03 2000-07-18 Brothers Kogyo Kabushiki Kaisha Server device for multilingual transmission system
US5956711A (en) * 1997-01-16 1999-09-21 Walter J. Sullivan, III Database system with restricted keyword list and bi-directional keyword translation
JP3181548B2 (ja) * 1998-02-03 2001-07-03 富士通株式会社 情報検索装置及び情報検索方法
US6623529B1 (en) * 1998-02-23 2003-09-23 David Lakritz Multilingual electronic document translation, management, and delivery system
US6345244B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically aligning translations in a translation-memory system
AU1380599A (en) * 1998-11-04 2000-05-22 Sullivan Walter III Database system with restricted keyword list and bi-directional keyword translation
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
JP3539479B2 (ja) * 1999-03-11 2004-07-07 シャープ株式会社 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体
US6598039B1 (en) * 1999-06-08 2003-07-22 Albert-Inc. S.A. Natural language interface for searching database
CN1176432C (zh) * 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和***
JP4291532B2 (ja) * 1999-11-17 2009-07-08 国際連合 言語変換システム
JP2003529845A (ja) * 2000-03-31 2003-10-07 アミカイ・インコーポレイテッド ネットワーク経由の多言語翻訳を提供する方法と装置
US6604101B1 (en) * 2000-06-28 2003-08-05 Qnaturally Systems, Inc. Method and system for translingual translation of query and search and retrieval of multilingual information on a computer network
CN1369834B (zh) * 2001-01-24 2010-04-28 松下电器产业株式会社 语音转换设备
JP3969628B2 (ja) * 2001-03-19 2007-09-05 富士通株式会社 翻訳支援装置、方法及び翻訳支援プログラム

Also Published As

Publication number Publication date
DK1353280T3 (da) 2006-10-16
US7630961B2 (en) 2009-12-08
US20030229622A1 (en) 2003-12-11
EP1353280B1 (de) 2006-06-14
DE60212330D1 (de) 2006-07-27
ATE330287T1 (de) 2006-07-15
EP1353280A1 (de) 2003-10-15

Similar Documents

Publication Publication Date Title
DE60212330T2 (de) Verfahren zur Verarbeitung von mehrsprachigen Abfragen
DE69923650T2 (de) System für mehrsprachige Informationswiederauffindung
DE69735628T2 (de) Verfahren und system zum auswählen eines informationssatzes in einem informationsverarbeitungssystem und lokale station in einem solchen system
DE102004012839B4 (de) System und Verfahren zur Bereitstellung von Hilfeinformation
DE19842688B4 (de) Verfahren zum Filtern von Daten, die von einem Datenanbieter stammen
DE69831904T2 (de) Dynamische Erstellung von Internetseiten
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE69112694T2 (de) Verfahren zum Betrieb eines Datenverarbeitungssystems zur Ausführung von Datenbanktransaktionen.
DE102005016561B4 (de) Verfahren und Vorrichtung zur strukturierten Erfassung und Bearbeitung von in einem System auftretenden Problemen
DE69126795T2 (de) Dateienverwaltungssystem mit graphischer benutzerschnittstelle zum aufstellen von fragen
DE19755798A1 (de) Verfahren und Vorrichtung für adaptive Computer-Directory- und File-Auswahl
DE69533193T2 (de) Paralleles verarbeitungssystem zum durchlaufen einer datenbank
DE69628374T2 (de) Datenverwaltungssystem
DE10000124A1 (de) Verfahren zum Übertragen und Indexieren von Daten von alten Medien zu neuen Medien
DE10320615A1 (de) Verwendung erweiterbarer Markup-Sprache in einem System und Verfahren zum Beeinflussen einer Position auf einer Suchergebnisliste, die von einer Computernetzwerksuchmaschine erzeugt wird
DE10004822A1 (de) System und Verfahren zur Identifizierung und zum beschleunigten Zugriff auf Online-Dienste
DE102007026799A1 (de) Systeme und Verfahren zur Verfeinerung der Identifikation von Kandidaten für klinische Studien
DE112018005272T5 (de) Suchen von mehrsprachigen dokumenten auf grundlage einer extraktion der dokumentenstruktur
DE10244623A1 (de) Dynamische Datenbankumleitung unter Verwendung semantischer Taxonomie-Information
DE19534819A1 (de) Verfahren und Vorrichtung zum Konfigurieren einer Datenbank
DE60037681T2 (de) Verfahren zum automatischen und gesicherten suchen von daten mit hilfe eines datenübertragungsnetzwerks
DE69909360T2 (de) Verfahren und System um Dokumente über eine elektronische Datei wiederaufzufinden
Hider The bibliographic advantages of a centralised union catalogue for ILL and resource sharing
DE3689502T2 (de) System und Verfahren zur Programmstrukturierung durch Datentabellenübersetzung.
DE10238596A1 (de) Verteiltes System und Verfahren zur Darstellung und Bearbeitung medizinisch relevanter Datenobjekte

Legal Events

Date Code Title Description
8364 No opposition during term of opposition