DE69733294T2 - Einrichtung und Verfahren zum Zugriff auf eine Datenbank - Google Patents

Einrichtung und Verfahren zum Zugriff auf eine Datenbank Download PDF

Info

Publication number
DE69733294T2
DE69733294T2 DE69733294T DE69733294T DE69733294T2 DE 69733294 T2 DE69733294 T2 DE 69733294T2 DE 69733294 T DE69733294 T DE 69733294T DE 69733294 T DE69733294 T DE 69733294T DE 69733294 T2 DE69733294 T2 DE 69733294T2
Authority
DE
Germany
Prior art keywords
words
entry
group
word
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69733294T
Other languages
English (en)
Other versions
DE69733294D1 (de
Inventor
Victor Sandford-on-Thames Oxford Poznanski
John Luis Beaven
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of DE69733294D1 publication Critical patent/DE69733294D1/de
Application granted granted Critical
Publication of DE69733294T2 publication Critical patent/DE69733294T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

  • Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zum Zugreifen auf eine Datenbank, z.B. von der Art, welche in maschinenlesbaren Wörterbüchern verwendet wird, wie monolinguale bzw. einsprachige Wörterbücher, Thesauren, Enzyklopädien und bilinguale bzw. zweisprachige Wörterbücher.
  • Solch eine Datenbank ist typischerweise indiziert unter Verwendung eines einzelnen Worts, welches ein Anfangswort bzw. eine Spitzmarke bzw. Schlagwort genannt wird.
  • JP-A-6243162 bezieht sich auf ein Maschinenübersetzungssystem umfassend ein OCR, um ein Dokument einzugeben. Das Dokument wird in Morpheme aufgeteilt durch eine morphologische Analyse zur Verarbeitung. Ein "part of speech"- bzw. "Teil der Sprache"-Inferenzverfahren wird verwendet, basierend auf den vorhergehenden zwei Wörtern in dem Morphem, um die Wahrscheinlichkeit der Geeignetheit einer Übersetzung zu berechnen.
  • EP 0 262 938 offenbart ein System zum Übertragen von Phrasen bzw. Sätzen von einer ersten Sprache in eine zweite Sprache. Das System weist einen Speicher auf, welcher eine Sammlung von Phrasen in der zweiten Sprache beinhaltet, und versucht zu identifizieren, welche dieser Phrasen jeder eingegebenen Phrase in der ersten Sprache entspricht. Insbesondere versucht das System eine relativ geringe Anzahl von Schlüsselwörtern zu erkennen zum Charakterisieren der Eingabephrase, um die entsprechenden Ausgabephrasen zu identifizieren und eine relativ schnelle Übersetzung bereitzustellen.
  • US 5 181 163 offenbart eine Technik zum Erzeugen oder Aktualisieren von Einträgen in einem Zusammentreffens- bzw. Gemeinsamauftretungswörterbuch (engt.: "cooccurence dictioanry"). Solch ein Wörterbuch enthält eine Liste von Wortpaaren, welche gemeinsam auftreten in einer bestimmten syntaktischen Beziehung in einer natürlichen Sprache. Solche Wörterbücher werden in manchen Maschinenübersetzungssystemen verwendet zum Über setzen von einer ersten Sprache in eine zweite Sprache und stellen Information über die erste Sprache bereit. Ein gegebener Text wird syntaktisch analysiert und das Ergebnis wird analysiert bezüglich der Mehrdeutigkeit von Paaren von Wörtern, welche die gewünschte semantische Beziehung aufweisen. Paare von Wörtern, welche frei von Mehrdeutigkeit sind, werden dann verwendet, um Einträge zu erzeugen oder zu aktualisieren.
  • "Dictionary access method with word occurrence", IBM Technical Disclosure Bulletin, Vol. 38, Nr. 8, August 1995, Seiten 365–6 offenbart ein neues Wörterbuchformat und ein Verfahren des Zugreifens auf das Wörterbuch. Jeder Eintrag für jedes Wort enthält zusätzlich zu einer Definition für jede mögliche Bedeutung, jegliche andere Wörter, welche assoziiert sind mit dem "Schlag"-Wort, wenn es verwendet wird, um diese Bedeutung zu haben. Auf das Wörterbuch wird mit dem Schlagwort zugegriffen und der Text, welcher das Schlagwort enthält, wird überprüft auf das Vorhandensein der assoziierten Wörter. Wenn vorhanden, werden die assoziierten Wörter und Definitionen an den Kopf der Liste für diesen Eintrag verschoben.
  • Gemäß eines ersten Aspekts der vorliegenden Erfindung, wird ein Verfahren bereitgestellt zum Zugreifen auf eine Datenbank, umfassend eine Mehrzahl von Einträgen, wobei jeder Eintrag einen Haupteintrag, welcher ein Schlagwort bzw. Anfangswort bzw. eine Spitzmarke beinhaltet, umfasst und zumindest einer der Einträge einen ersten Nebeneintrag umfasst, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, von welchen jeder bzw. jedes mit dem Schlagwort assoziiert werden kann, wobei das Verfahren die Schritte umfasst:
    • (i) Eingeben des Abschnitts von Text umfassend eine Mehrzahl von Wörtern;
    • (ii) Lokalisieren des Eintrags, dessen Haupteintrag das Schlagwort beinhaltet, welches einem ausgewählten Wort des Abschnitts von Text entspricht;
    • (iii) wo der lokalisierte Eintrag einen ersten Nebeneintrag aufweist, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, Auswählen aus dem ersten Nebeneintrag einer Gruppe von Wörtern, von welchen zumindest ein Wort vorhanden ist in zumindest einem Teil des Abschnitts von Text;
    • (iv) Zuweisen zu der ausgewählten Gruppe eines Präferenzwerts, welcher bestimmt wird als eine Funktion der Wörter in der Gruppe; und
    • (v) Wiederholen der Schritte (ii) bis (iv) für jedes Wort des Abschnitts von Text.
  • Vorzugsweise umfasst der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt.
  • Vorzugsweise umfasst der zumindest Teil des Abschnitts von Text N Wörter an jeder Seite des ausgewählten Worts, wobei N eine ganze Zahl größer oder gleich eins ist.
  • Die Funktion kann der Kardinalität der Gruppe entsprechen oder einer Eigenschaft von einem oder mehreren Wörtern in der Gruppe, wie die Wahrscheinlichkeit deren einzelnen oder gemeinsamen Auftretens.
  • Alternativ oder zusätzlich kann die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung der Gruppe entsprechen.
  • In einer Ausführungsform ist die Datenbank ein mehrsprachiges Wörterbuch, wobei die Haupteinträge und die ersten Nebeneinträge Quellsprachenwörter beinhalten, und jeder Eintrag weiter einen zweiten Nebeneintrag umfasst, welcher zumindest eine Zielsprachenübersetzung des Schlagworts beinhaltet. Das Mehrsprachenwörterbuch kann ein umkehrbares zweisprachiges Wörterbuch sein.
  • Vorzugsweise ist jede Zielsprachenübersetzung assoziiert mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten Nebeneintrag. Weiter bevorzugt umfasst das Verfahren weiter die Schritte des Auswählens einer der Zielsprachenübersetzungen und Sperren bzw. Verhindern der Auswahl einer Übersetzung von jedem Wort, welcher in der Gruppe von Wörtern, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, enthalten ist. Am meisten bevorzugt umfasst das Verfahren den Schritt des Auswählens der Zielsprachenübersetzungen für die Wörter des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
  • Vorzugsweise umfasst das Verfahren die weiteren Schritte des Nichtauswählens der ausgewählten der Zielsprachenübersetzungen, Nichtsperrens bzw.
  • Entsperrens der Auswahl einer Übersetzung von jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, Auswählens einer anderen der Zielsprachenübersetzungen und Sperrens der Auswahl einer Übersetzung von jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche mit der ausgewählten anderen Übersetzung assoziiert ist bzw. sind.
  • Die Datenbank kann ein maschinenlesbares Wörterbuch, ein Thesaurus oder eine Enzyklopädie oder ein Multimediawörterbuch sein. Der maschinenlesbare Thesaurus kann ein umkehrbarer maschinenlesbarer Thesaurus sein. Dem lokalisierten Eintrag kann im Wesentlichen dieselbe linguistische Beugung gegeben werden, wie dem zumindest einem Wort, welches in dem zumindest Teil des Abschnitts von Text vorhanden ist. Die Datenbank kann auf einer CD-ROM gespeichert sein.
  • Gemäß eines zweiten Aspekts der vorliegenden Erfindung wird eine Vorrichtung bereitgestellt zum Zugreifen auf eine Datenbank, umfassend eine Mehrzahl von Einträgen, wobei jeder Eintrag einen Haupteintrag, welcher ein Schlagwort beinhaltet, umfasst und zumindest einer der Einträge einen Nebeneintrag umfasst, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, von welchen jeder bzw. jedes mit dem Schlagwort assoziiert werden kann, wobei die Vorrichtung umfasst:
    • (i) eine Eingabeeinrichtung zum Eingeben eines Abschnitts von Text umfassend eine Mehrzahl von Wörtern;
    • (ii) eine Einrichtung zum Lokalisieren des Eintrags, dessen Haupteintrag das Schlagwort beinhaltet, welches einem Wort des Abschnitts von Text entspricht;
    • (iii) eine Einrichtung zum Auswählen aus jedem ersten Nebeneintrag eines Satzes bzw. der Gruppe von Wörtern, von welchen zumindest ein Wort vorhanden ist in zumindest einem Teil des Abschnitts von Text, wo der lokalisierte Eintrag einen ersten Nebeneintrag aufweist, welcher eine Mehrzahl von Gruppen von Wörtern beinhaltet; und
    • (iv) eine Zuweisungseinrichtung zum Zuweisen zu jeder ausgewählten Gruppe eines Präferenzwerts als eine Funktion der Wörter in der Gruppe.
  • Vorzugsweise umfasst der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt.
  • Vorzugsweise umfasst der zumindest Teil des Abschnitts von Text N Wörter an jeder Seite des ausgewählten Worts, wobei N eine ganze Zahl größer oder gleich eins ist.
  • Die Funktion kann der Kardinalität der Gruppe entsprechen, oder Eigenschaften von einem oder mehreren Wörtern in der Gruppe, wie die Wahrscheinlichkeit deren einzelnen oder gemeinsamen Auftretens.
  • Alternativ oder zusätzlich kann die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung der Gruppe entsprechen.
  • In einer Ausführungsform ist die Datenbank ein elektronisches mehrsprachiges Wörterbuch, wobei die Haupteinträge und die ersten Nebeneinträge Quellsprachenwörter beinhalten, und jeder Eintrag weiter einen zweiten Nebeneintrag umfasst, welcher zumindest eine Zielsprachenübersetzung des Schlagworts beinhaltet. Das Mehrsprachenwörterbuch kann ein umkehrbares zweisprachiges Wörterbuch sein.
  • Vorzugsweise ist jede Zielsprachenübersetzung assoziiert mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten Nebeneintrag. Weiter bevorzugt ist eine Einrichtung bereitgestellt zum Auswählen einer der Zielsprachenübersetzungen und Sperren der Auswahl einer Übersetzung von jedem Wort, welches in der Gruppe von Wörtern, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, enthalten ist. Am meisten bevorzugt wird eine Einrichtung bereitgestellt zum Auswählen der Zielsprachenübersetzungen für die Wörter des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
  • Vorzugsweise ist eine Einrichtung zum Nichtauswählen der ausgewählten der Zielsprachenübersetzungen bereitgestellt, Nichtsperren der Auswahl einer Übersetzung von jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, Auswählen einer anderen der Zielsprachenübersetzungen und Sperren der Auswahl einer Übersetzung von jedem Wort, welches in der Gruppe von Wörtern enthalten ist, welche mit der ausgewählten anderen Übersetzung assoziiert ist bzw. sind.
  • Die Datenbank kann ein maschinenlesbares Wörterbuch, Thesaurus, Enzyklopädie oder Multimediawörterbuch sein. Der maschinenlesbare Thesaurus kann ein umkehrbarer maschinenlesbarer Thesaurus sein. Eine Erzeugungseinrichtung kann vorgesehen sein, um dem lokalisierten Eintrag im Wesentlichen dieselbe linguistische Beugung zu geben, wie dem zumindest einen Wort, welches in dem zumindest Teil des Abschnitts von Text vorhanden ist. Die Datenbank kann auf einer CD-ROM gespeichert sein.
  • Es ist somit möglich, eine Vorrichtung und ein Verfahren zum Zugreifen auf eine Datenbank bereitzustellen, welche Einträge erhalten, welche passend sind bezüglich einer bestimmten Anfrage und dem Kontext.
  • Die vorliegende Erfindung wird nun beispielhaft beschrieben mit Bezug auf die begleitenden Zeichnungen, in welchen:
  • 1 ein Beispiel einer Datenstruktur gemäß einer Ausführungsform der vorliegenden Erfindung zeigt;
  • 2 eine Vorrichtung gemäß einer Ausführungsform der vorliegenden Erfindung zeigt;
  • 3 ein Flussdiagramm eines Verfahrens gemäß einer Ausführungsform der vorliegenden Erfindung zur Verwendung mit der Vorrichtung von 2 ist;
  • 4 ein Flussdiagramm ist, welches einen Schritt des in 3 gezeigten Verfahrens in größerem Detail zeigt;
  • 5 und 6 die Datenstruktur von 1 beinhaltend Beispieldaten zeigen;
  • 7 einen Nachschlagepuffer gemäß des Verfahrens von 3 darstellt;
  • 8 ein Beispiel des Nachschlagepuffers von 7 in Übereinstimmung mit einer anderen Ausführungsform der vorliegenden Erfindung bezüglich zweisprachiger Wörterbücher zeigt.
  • Die Datenstruktur von 1 wird verwendet, um die verschiedenen Einträge in einer Datenbank 28 zu speichern (siehe 2). Jeder Eintrag umfasst einen Haupteintrag beinhaltend ein Schlagwort 1 und einen ersten Nebeneintrag 2, welcher Sätze bzw. Gruppen von Wörtern (Gruppe, bis Gruppe3) umfasst, welche mit dem Schlagwort 1 assoziiert werden können, um eine linguistische Konstruktion bzw. einen linguistischen Aufbau auszubilden. Wenn keine Gruppen von Wörtern, welche mit dem Schlagwort 1 kombiniert werden können, vorhanden sind, ist nichts in dem ersten Nebeneintrag 2 gespeichert. Die Datenstruktur weist ebenfalls einen zweiten Nebeneintrag 3 auf, welcher Definitionen Def1, Def2, Def3 oder Zielsprachenübersetzungen, welche entsprechenden Kombinationen des Schlagworts 1 und den Gruppen von Wörtern in dem ersten Nebeneintrag 2 entsprechen, umfasst.
  • Die Vorrichtung von 2 umfasst einen Eingabeanschluss bzw. ein Eingabeendgerät 21 zum Eingeben eines Abschnitts von Text, welcher abgefragt oder übersetzt werden soll in eine Zielsprache. Alternativ kann eine andere Einrichtung, welche einen Abschnitt von Text, z.B. ein Spracherkennungssystem oder ein optischer Buchstabenleser bzw. Optical Character Reader (OCR), verwendet werden. Das Eingabeendgerät 21 ist mit einem Nachschlagepuffer 23 über ein Reduktionsmodul 22 verbunden zum Segmentieren und Reduzieren des Abschnitts von Text. Der Nachschlagepuffer 23 speichert temporär den Abschnitt von Text, welcher durch das Reduktionsmodul 22 segmentiert und reduziert wurde, und ist mit einem Suchmodul 25 und einem ersten Auswahlmodul 24 verbunden, wobei das Suchmodul 25 ebenfalls mit einer Datenbank 28 verbunden ist. Das Suchmodul 25 und der Nachschlagepuffer 23 sind mit einem zweiten Auswahlmodul 26 verbunden. Der Nachschlagepuffer 23 ist ebenfalls mit einer Ausgabeeinrichtung 27, z.B. einer Anzeige oder einem Drucker, verbunden über ein Filtermodul 29, ein Neuanordnungsmodul 30 und ein Erzeugungsmodul 31.
  • Die vorstehend beschriebene Vorrichtung kann in Hardware oder Software implementiert sein und integriert sein in ein elektronisches einsprachiges Wörterbuch, Thesaurus, Enzyklopädie, zweisprachiges Wörterbuch oder jede andere Vorrichtung, welche die Datenbank auf der Basis eines Abschnitts von eingegebenem Text, z.B. von einem CD-ROM-System durchsucht.
  • Bezug nehmend auf 3, wird beim Betrieb ein grammatikalisch vollständiger Abschnitt von Text, z.B. ein Ausdruck, ein Halbsatz bzw. abhängiger Satz oder ein Satz wie "John made good use of his knowledge" durch einen Nutzer (nicht gezeigt) eingegeben (Schritt S1) unter Verwendung des Eingabeendgeräts 21. Die Wörter, welche den Abschnitt von Text umfassen, werden segmentiert oder aufgebrochen in Wörter, und zu ihren assoziierten Schlagwörtern (oder indizierten Begriffen) reduziert, z.B. durch eine morphologische Analyse durch das Reduktionsmodul 22 (Schritt S2). In dem Fall von "John made good use of ist knowledge" ist es nur notwendig, das Wort "made" zu "make" zu ändern. Der reduzierte Text wird dann zu dem Nachschlagepuffer 23 übertragen (S3). Das erste Wort in dem Nachschlagepuffer 23 wird dann ausgewählt durch das erste Auswahlmodul 24 (Schritt S4) und in der Datenbank 28 gesucht durch das Suchmodul 25 (Schritt S5). Wenn ein Eintrag gefunden wird, wird der Eintrag in dem Nachschlagepuffer gespeichert und kommentiert bzw. vermerkt. Dieser Schritt des Suchens, Speicherns und Kommentierens bzw. Vermerkens wird weiter im Folgenden beschrieben.
  • Der Nachschlagepuffer 23 wird dann überprüft auf nicht gesuchte Wörter (Schritt S7) und wenn nicht gesuchte Wörter existieren, werden sie wiederum ausgewählt (Schritt S8) und in der Datenbank 28 gesucht (Schritt S5). Sobald alle Wörter in dem Nachschlagepuffer 23 gesucht wurden, werden die Ergebnisse zu dem Filtermodul 29, dem Neuanordnungsmodul 30 und dem Erzeugungsmodul 31 gesendet, bevor sie angezeigt werden oder an ein Anzeigemodul gesendet werden zum Abfragen durch den Nutzer (Schritt S9).
  • Die morphologische Analyse, welche durch das Reduktionsmodul 22 (Schritt S2) durchgeführt wird, reduziert nicht einfach ein Wort zu einem entsprechenden Infinitiv, z.B. "made" zu "make", aber assoziiert andere linguistische Information mit dem reduzierten Wort; z.B. kann "made" reduziert werden auf "make past". Die zusätzliche linguistische Information wird beibehalten, für den Fall, wo die Datenbank ein Thesaurus oder ein zweisprachiges Wörterbuch ist. In solchen Fällen kann es notwendig sein, ein gebeugtes Wort von der verfügbaren linguistischen Information zu rekonstruieren, z.B. kann "make use of" reduziert werden auf "make past use of". Wenn die Datenbank ein Thesaurus ist, kann der Eintrag, welcher gefunden wird für "made use of", das englische Wort "utilize", konvertiert werden zu "utilize past"; das Erzeugungsmodul 31 führt solch eine Umwandlung durch durch Anpassen des "past"-Zusatzes an "utilize" um "utilized" zu erzeugen (wenn durch den Nutzer benötigt). Die Verwendung des Erzeugungsmoduls 31 sollte nicht auf Fälle beschränkt sein, in welchen die Datenbank ein Thesaurus ist.
  • Das Filtermodul 29 kann mehr als einen Filter umfassen, z.B. einen "Zusatzfilter" und/oder einen "Kontextfilter". Der Zusatzfilter kann Zusätze wie "past" (vorstehend beschrieben) von dem Ergebnis bzw. den Ergebnissen, welche bzw. welches ausgegeben werden soll bzw. sollen, entfernen. Zum Beispiel wird anstatt des Anzeigens von "utilized past" das Wort "utilize" einfach ausgegeben. Der Kontextfilter wird verwendet, wenn benötigt durch den Nutzer, um Wörter von dem Nachschlagepuffer 23 anzuzeigen, welche für eine Suche relevant sind. Zum Beispiel, um die Übersetzung eines einzelnen Worts in einem Satz zu bestätigen, kann der Nutzer nur die Wörter in dem Nachschlagepuffer 23 wollen, welche relevant sind für die Übersetzung des einzelnen Worts, welche angezeigt werden soll.
  • Das Neuanordnungsmodul 30 ordnet die Suchergebnisse oder "Ziel-"Wörter neu, z.B. in einer Übersetzung, um die geeignetste Wortreihenfolge zu erhalten. Ein Beispiel von diesem ist "John made good use of his knowledge" kann übersetzt werden ins Französische als "John bien utiliser son connaisance". Jedoch wäre eine geeignetere und intuitivere Reihenfolge "John utiliser bien son connaisance".
  • Das Suchen bzw. Durchsuchen der Datenbank 23, Speichern von Einträgen und Kommentieren (Schritt S5) wird nun mit Bezug auf 4 beschrieben.
  • Ein Eintrag wird von der Datenbank 28 ausgewählt (Schritt S10) und das Schlagwort 1 des Eintrags wird verglichen mit dem Wort, welches aus dem Nachschlagepuffer 23 ausgewählt wurde, zum Suchen (Schritt S11) durch das Suchmodul 25.
  • Wenn eine Übereinstimmung gefunden wird, wird der erste Nebeneintrag überprüft, um sicherzustellen, ob er Einträge enthält oder nicht (Schritt S11a). Wenn kein Eintrag existiert, wird keine weitere Maßnahme durchgeführt, und die Suche der Datenbank ist beendet bezüglich des aus dem Nachschlagepuffer 23 ausgewählten Worts. Wenn, jedoch, ein Eintrag existiert, wird eine Gruppe von Wörtern aus dem ersten Nebeneintrag ausgewählt (Schritt S12) und der Nachschlagepuffer 23 wird durchsucht (Schritt S13) durch das zweite Auswahlmodul 26 bezüglich der Anwesenheit von diesen Wörtern in dem Nachschlagepuffer 23. Wenn all die Wörter in der Gruppe von Wörtern in dem Nachschlagepuffer 23 gefunden werden, wird der erste Nebeneintrag 2 überprüft, um sicherzustellen, ob Gruppen von Wörtern übrig sind, welche nicht gesucht wurden in dem Nachschlagepuffer 23 (Schritt S14). Wenn Gruppen von Wörtern existieren, welche noch nicht gesucht wurden, wird jede Gruppe von Wörtern wiederum ausgewählt (Schritt S15) und gesucht (Schritt S13) bis keine ungesuchten Gruppen von Wörtern in dem ersten Nebeneintrag 2 verbleiben. Wenn beim Durchführen des Schritts S13 eine Übereinstimmung gefunden wird, werden das Schlagwort und die Gruppe von Wörtern in dem ersten Nebeneintrag kommentiert und gespeichert (Schritt S16) zur Anzeige durch die Ausgabeeinrichtung 27 oder Manipulation durch den Nutzer. Die Suche gegen die Gruppe von Wörtern in dem ersten Nebeneintrag 2 wird dann weitergeführt (Schritte S14, S15, S13) bis keine ungesuchten Gruppen von Wörtern verbleiben.
  • Wenn beim Vergleichen der Schlagwörter (Schritt S11) eine Übereinstimmung nicht gefunden wird zwischen dem Schlagwort 1 des bei Schritt S10 ausgewählten Eintrags und dem Wort aus dem Nachschlagepuffer 23, welcher gesucht werden soll, wird die Datenbank 28 überprüft, um sicherzustellen, ob irgendwelche Einträge existieren deren Schlagwörter nicht verglichen wurden mit dem zu suchenden Wort (Schritt S17). Wenn keine ungesuchten Einträge in der Datenbank 28 verbleiben, wird die Suche beendet. Jedoch, wenn ungesuchte Einträge in der Datenbank 28 verbleiben, wird ein anderer Eintrag durch das Suchmodul 25 ausgewählt (Schritt S18) und gesucht (Schritt S11). Es sollte beachtet werden, in dem Fall, wenn die Datenbank 28 einzigartige Schlagworteinträge beinhaltet, z.B. eine Enzyklopädie, wird die Suche beendet, sobald das aus dem Nachschlagepuffer 23 ausgewählte Wort gefunden ist (ohne Suchen irgendwelcher verbleibender, nicht gesuchter Einträge in der Datenbank 28).
  • Bezug nehmend auf 7, wenn der Beispielinhalt des Nachschlagepuffers 23"John make good use of his knowledge" gesucht wird, wenn das Wort "make" gefunden wird, werden vier mögliche Definitionen gefunden, welche das Schlagwort 1 "make" beinhalten ("make", "make-up", "make it to", "make the grade"), wie aus 5 gesehen werden kann. Jedoch ist nur eine der Definitionen geeignet, da die anderen Gruppen von Wörtern nicht in dem Nachschlagepuffer 23 vorhanden sind. Ähnlich wird das Wort "good" nachgeschlagen und dann das Wort "use". Zu diesem Zeitpunkt, werden fünf mögliche Gruppen von Wörtern für das Wort "use" gefunden (siehe 6) ("use" [noun], "use" [verb], "use to", "use up", "make use of"), von welchen nur drei geeignet sind aufgrund ihres Vorhandenseins in dem Nachschlagepuffer 23, wobei der bemerkenswerteste von diesen der Eintrag "make use of" ist. Der Nachschlagepuffer 23 wird aktualisiert mit den geeigneten Datenbankeinträgen, welche kommentiert werden mit den Wörtern in dem Nachschlagepuffer 23, auf welche sie sich beziehen.
  • Sobald dies durchgeführt wurde, kann ein Nutzer jedes Wort wiederum abfragen, z.B. mit der Hilfe einer grafischen Nutzerschnittstelle bzw. Graphical User Interface (GUI). Jedes Wort des Abschnitts von Text wird durch die GUI angezeigt. Wenn ein Wort in dem Abschnitt von Text durch den Nutzer abgefragt wird, wird der Nachfragepuffer 23 überprüft, um jegliche Kommentierungen (Schlagwortzeiger) zu finden, welche mit dem abgefragten Wort assoziiert sind. Der Nachschlagepuffer 23 wird dann gesucht bezüglich der Anwesenheit von jeglichen kommentierten Einträgen, welche zu dem abgefragten Wort zeigen. In dem Fall des Worts "make" in dem vorliegenden Beispiel, wird ein Schlagwortzeiger gefunden für das Wort "make" und ein Wortzeiger wird gefunden für die Konstruktion "make use of" ("use2,5").
  • Die Wörter können in der Reihenfolge des Vorzugs gelistet werden, wobei das Kriterium für den Vorzug die Anzahl von Wörtern in der Gruppe von Wörtern in dem ersten Nebeneintrag 2 ist; wobei größere Nummern einen höheren Vorzug anzeigen würden. Somit kann für einen Eintrag, welcher nur das Schlagwort umfasst, der Vorzugswert gleich eins sein. Wenn es X Anzahl von Wörtern in einer Gruppe, welche mit dem Schlagwort assoziiert ist, gibt, kann ein Vorzugswert von (X + 1) für diese Gruppe gegeben werden. Wo die Gruppen oder Kombinationen von Wörtern angezeigt werden zur Nutzerauswahl, können sie in absteigender Reihenfolge von Vorzugswerten angezeigt werden.
  • Bezug nehmend auf 8, kann das vorstehende Beispiel ausgeweitet werden, um zweisprachige oder mehrsprachige Wörterbücher zu umfassen. Dem Nutzer kann die Option des Auswählens einer Zielsprache gegeben werden.
  • Wie vorher, wird der Abschnitt von Text auf Wörter und Schlagwörter reduziert und dann zu dem Nachschlagepuffer 23 übertragen. Jedes Wort wird gesucht und mögliche Übersetzungen (Datenbankeinträge) für jedes Wort werden in dem Nachschlagepuffer 23 gespeichert und, wo geeignet, werden die Einträge kommentiert auf welche Wörter in dem Nachschlagepuffer 23 sie sich beziehen.
  • Als ein Beispiel, wird die Übersetzung des Satzes "John make good use of his knowledge" ins Französische wie folgt ausgeführt. Zunächst wird jedes Wort reduziert auf sein Wörterbuchschlagwort, d.h. "John make good use of his knowledge", und an den Nachschlagpuffer 23 übertragen. Jedes Wort in dem Nachschlagepuffer 23 wird in einem Wörterbuch (der Datenbank 28) gesucht. Die möglichen Übersetzungen (Einträge) für jedes Wort werden unterhalb der entsprechenden Wörter in der Tabelle in 8 gezeigt. Die tiefgestellten Nummern repräsentieren eine Kommentierung bezüglich welche Wörter in dem Nachschlagepuffer 23 einem besonderen französischen Wort entsprechen. Zum Beispiel bezieht sich das Verb "utiliser" ebenfalls auf die Wörter "make" und "of" zusätzlich zu dem Wort "use".
  • Sobald alle möglichen Übersetzungen für jedes Wort in dem Abschnitt von Text gefunden wurden, kann der Nutzer die Ergebnisse abfragen. Es ist möglich, dem Benutzer eine Aufzählung von allen konsistenten Alternativen bereitzustellen, aber es ist bevorzugt, ein Menü von Alternativen für jedes Wort bereitzustellen, da dies die Anzahl von zu listenden Alternativen reduziert.
  • Wenn der Nutzer eine Übersetzung auswählt, welche dem Schlagwort entspricht und eine Gruppe beinhaltend zumindest ein Wort von dem ersten Nebeneintrag, kann eine Auswahl von Übersetzungen von jedem Wort, welches in der Gruppe beinhaltet ist, gehemmt werden, da solche Wörter bereits abgedeckt wurden durch die ausgewählte Übersetzung. Wenn der Nutzer entscheidet, diese Übersetzung abzuwählen bzw. nicht auszuwählen und einer andere Übersetzung auszuwählen, wird die Hemmung bzw. Blockierung entfernt und wenn die andere Übersetzung sich auf einen Satz bzw. eine Gruppe, welche zumindest ein Wort beinhaltet, bezieht, dann wird die Übersetzung des oder jedes Worts der Gruppe wiederum blockiert bzw. gehemmt.
  • Obwohl solch eine Auswahl manuell durchgeführt werden kann, ist es möglich, Auswahlen automatisch durchzuführen, wo den verschiedenen Gruppen von Wörtern Vorzugswerte zugewiesen wurden. Zum Beispiel können all die Wörter verwendet werden, um auf das Wörterbuch zuzugreifen, um eine oder mehrere Kombinationen entsprechend jedem Wort zu ermöglichen. Diese Kombinationen sind in absteigender Reihenfolge des Vorzugs angeordnet und die höchste Präferenzkombination wird ursprünglich ausgewählt. Wörter, welche in der Gruppe enthalten sind, welche mit dem relevanten Schlagwort assoziiert ist, werden dann blockiert vom weiteren Teilnehmen in dem Verfahren. Aus den verbleibenden verfügbaren Gruppen von Wörtern, wird diejenige mit dem höchsten Vorzugswert ausgewählt, usw. Solch eine Technik kann verändert werden bei einem mehrsprachigen Wörterbuch, um eine Grundform einer automatischen Übersetzung bereitzustellen, obwohl eine weitere Intervention bzw. ein weiterer Eingriff wohl benötigt werden kann, um eine endgültige Übersetzung zu erzeugen. Zum Beispiel, um auf das Wörterbuch zuzugreifen, können die in dem Nachschlagepuffer eingetragenen Wörter zunächst auf Grundformen reduziert worden sein. Zum Beispiel, können Verben in die Infinitivform verändert worden sein und Substantive können Einzahl gemacht worden sein. Die ursprüngliche Übersetzung kann ebenfalls Grundformen beinhalten, so dass z.B. Verben dekliniert werden müssen, bevor ein erster Anlauf bei einer endgültigen Übersetzung vollendet ist.
  • Der Nutzer kann in dieses Verfahren intervenieren, z.B., um Gruppen oder Kombinationen von Wörtern mit niedrigeren Vorzugswerten auszuwählen. Jedoch stellt das System sicher, dass ein Wort in dem Abschnitt von Text nicht zweimal verwendet werden kann, um Inkonsistenzen zu vermeiden.
  • Das mehrsprachige Wörterbuch kann ein umkehrbares Wörterbuch sein, z.B. zum Übersetzen vom Englischen ins Französische. Ein Beispiel eines Eintrags ist:
    Make *use of <=> * utiliser
    wo "use" das englische Schlagwort ist, welches mit einer Anzahl von ersten Nebeneinträgen assoziiert ist, wie vorstehend beschrieben, und ein zweiter Nebeneintrag von "utiliser", und "utiliser" das französische Schlagwort ist, welches keine ersten Nebeneinträge aufweist, aber einen zweiten Nebeneintrag von "make use of". Somit, wenn es gefunden wurde in dem Kontext von "make" und "of", kann "make use of" übersetzt werden als "utiliser". Ähnlich kann "utiliser", wenn gefunden, übersetzt werden als "make use of".
  • Wenn die Datenbank ein Thesaurus ist, können die Datenbankeinträge sein:
    *make use of <=> utilise
    *make (verb) <=> construct
    *make (noun) <=> trademark
    *use (verb) <=> employ
  • Das Sternchen bezeichnet ein Schlagwort und die Wörter auf der rechten Seite von dem <=>-Symbol sind zweite Nebeneinträge. Die Wörter auf der linken Seite, welche nicht mit einem Sternchen markiert sind, und welche nicht in Klammern sind, sind erste Nebeneinträge.
  • Die Schlagwörter können ebenfalls kommentiert sein, um die Eigenschaften des Worts zu beschreiben. Beispiele von Kommentierungen sind vorstehend in Klammern gezeigt.
  • Zusätzlich kann der Thesaurus ein umkehrbarer Thesaurus sein analog zu dem vorstehend beschriebenen umkehrbaren Wörterbuch.
  • Eine alternative Anwendung der Datenbank ist ein Verwendungsprüfer. In solch einer Anwendung kann der zweite Nebeneintrag eine Folge von Text beinhalten. Zum Beispiel:
    *make use of <=> "consider using just 'use'''
  • Wenn die Datenbank ein einsprachiges Wörterbuch ist, kann der zweite Nebeneintrag einen Zeiger beinhalten, z.B.
    *make use of <=> p245
    wo p245 ein Zeiger oder ein Index ist zu einem Eintrag in einem Wörterbuch, welches z.B. in einem Speicher oder einer CD-ROM gespeichert ist. Solche Zeiger können auf verschiedene Typen von Einträgen zeigen, z.B. Text, Ton oder Filme. Zusätzlich können Wörter, Text und Zeiger gleichzeitig als zweite Nebeneinträge gespeichert werden. Die Datenbank 28 kann deshalb eine Multimediaenzyklopädie sein.

Claims (40)

  1. Verfahren zum Zugreifen auf eine Datenbank (28) umfassend eine Mehrzahl von Einträgen, wobei jeder Eintrag einen Haupteintrag, welcher ein Schlagwort (1) beinhaltet, umfasst und zumindest einer der Einträge einen ersten Nebeneintrag (2) umfasst, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, von welchen jede bzw. jedes mit dem Schlagwort (1) assoziiert werden kann, wobei das Verfahren die Schritte umfasst: (i) Eingeben (S1) eines Abschnitts von Text umfassend eine Mehrzahl von Wörtern; (ii) Lokalisieren (S10, S11, S17, S18) des Eintrags, dessen Haupteintrag das Schlagwort (1) beinhaltet, welches einem ausgewählten Wort des Abschnitts von Text entspricht; (iii) wo der lokalisierte Eintrag einen ersten Nebeneintrag (2) aufweist, welcher eine Mehrzahl von Gruppen von Wörtern beinhaltet, Auswählen (S12 – S16) aus dem ersten Nebeneintrag (2) einer Gruppe von Wörtern, von welchen zumindest ein Wort vorhanden ist in zumindest einem Teil des Abschnitts von Text; (iv) Zuweisen zu der ausgewählten Gruppe eines Präferenzwerts, welcher bestimmt wird als eine Funktion der Wörter in einer Gruppe; und (v) Wiederholen der Schritte (ii) bis (iv) für jedes Wort des Abschnitts von Text.
  2. Verfahren gemäß Anspruch 1, wobei der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt umfasst.
  3. Verfahren gemäß Anspruch 1 oder 2, wobei der zumindest Teil des Abschnitts von Text N Wörter an jeder Seite des ausgewählten Worts umfasst, wobei N eine ganze Zahl größer oder gleich eins ist.
  4. Verfahren gemäß einem der vorangehenden Ansprüche, wobei die Funktion der Kardinalität einer Gruppe entspricht.
  5. Verfahren gemäß einem der Ansprüche 1 bis 3, wobei die Funktion einer Eigenschaft von einem oder mehreren Wörtern in einer Gruppe entspricht.
  6. Verfahren gemäß Anspruch 5, wobei die Eigenschaft die Wahrscheinlichkeit des einzelnen oder gemeinsamen Auftretens des bzw. der einen oder mehr Wörter in einer Gruppe ist.
  7. Verfahren gemäß einem der Ansprüche 1 bis 3, wobei die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung einer Gruppe entspricht.
  8. Verfahren gemäß einem der vorangehenden Ansprüche, wobei die Datenbank (28) ein maschinenlesbares mehrsprachiges Wörterbuch ist, wobei die Haupteinträge und die ersten Nebeneinträge (2) Quellsprachenwörter beinhalten, und jeder Eintrag weiter einen zweiten Nebeneintrag (3) umfasst, welcher zumindest eine Zielsprachenübersetzung des Schlagworts beinhaltet.
  9. Verfahren gemäß Anspruch 8, wobei das Mehrsprachenwörterbuch ein umkehrbares zweisprachiges Wörterbuch ist.
  10. Verfahren gemäß Anspruch 8 oder Anspruch 9, wobei jede Zielsprachenübersetzung assoziiert ist mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten Nebeneintrag (2).
  11. Verfahren gemäß Anspruch 10, umfassend die weiteren Schritte des Auswählens einer der Zielsprachenübersetzungen und Sperren der Auswahl einer Übersetzung von jedem Wort, welches in einer Gruppe von Wörtern, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, enthalten ist.
  12. Verfahren gemäß Anspruch 11, umfassend Auswählen der Zielsprachenübersetzungen für die Wörter des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
  13. Verfahren gemäß Anspruch 11, umfassend die weiteren Schritte des Nichtauswählens der ausgewählten der Zielsprachenübersetzungen, Nichtsperren der Auswahl einer Übersetzung von jedem Wort, welches in einer Gruppe von Wörtern enthalten ist, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, Auswählen einer anderen der Zielsprachenübersetzungen, und Sperren der Auswahl einer Übersetzung von jedem Wort, wel ches in einer Gruppe von Wörtern enthalten ist, welche mit der ausgewählten anderen Übersetzung assoziiert ist bzw. sind.
  14. Verfahren gemäß einem der Ansprüche 1 bis 7, wobei die Datenbank (28) ein maschinenlesbares Wörterbuch ist.
  15. Verfahren gemäß einem der Ansprüche 1 bis 7, wobei die Datenbank (28) ein maschinenlesbarer Thesaurus ist.
  16. Verfahren gemäß Anspruch 15, wobei der maschinenlesbare Thesaurus ein umkehrbarer maschinenlesbarer Thesaurus ist.
  17. Verfahren gemäß einem der Ansprüche 14, 15 oder 16, wobei dem lokalisierten Eintrag im Wesentlichen dieselbe linguistische Beugung gegeben wird wie dem zumindest einen Wort, welches in dem zumindest Teil des Abschnitts von Text vorhanden ist.
  18. Verfahren gemäß einem der Ansprüche 1 bis 7, wobei die Datenbank (28) eine maschinenlesbare Enzyklopädie ist.
  19. Verfahren gemäß einem der Ansprüche 1 bis 7, wobei die Datenbank (28) eine Multimedia-Enzyklopädie ist.
  20. Verfahren gemäß einem der vorangehenden Ansprüche, wobei die Datenbank (28) auf einer CD-ROM gespeichert ist.
  21. Vorrichtung zum Zugreifen auf eine Datenbank (28) umfassend eine Mehrzahl von Einträgen, wobei jeder Eintrag einen Haupteintrag, welcher ein Schlagwort (1) beinhaltet, umfasst und zumindest einer der Einträge einen Nebeneintrag (2) umfasst, welcher eine Mehrzahl von Sätzen bzw. Gruppen von Wörtern beinhaltet, von welchen jede bzw. jedes mit dem Schlagwort assoziiert werden kann, wobei die Vorrichtung umfasst: (i) eine Eingabeeinrichtung (21) zum Eingeben eines Abschnitts von Text umfassend eine Mehrzahl von Wörtern; (ii) eine Einrichtung (24, 25) zum Lokalisieren des Eintrags, dessen Haupteintrag (1) das Schlagwort beinhaltet, welches einem Wort des Abschnitts von Text entspricht; (iii) eine Einrichtung (25, 26) zum Auswählen aus jedem ersten Nebeneintrag (2) einer Gruppe von Wörtern, von welchen zumindest ein Wort vorhan den ist in zumindest einem Teil des Abschnitts von Text, wo der lokalisierte Eintrag einen ersten Nebeneintrag (2) aufweist, welcher eine Mehrzahl von Gruppen von Wörtern beinhaltet; und (iv) eine Zuweisungseinrichtung zum Zuweisen zu jeder ausgewählten Gruppe eines Präferenzwerts als eine Funktion der Wörter in einer Gruppe.
  22. Vorrichtung gemäß Anspruch 21, wobei der Abschnitt von Text einen grammatikalisch vollständigen Abschnitt umfasst.
  23. Vorrichtung gemäß Anspruch 21 oder 22, wobei der zumindest Teil des Abschnitts von Text N Wörter an jeder Seite des ausgewählten Worts umfasst, wobei N eine ganze Zahl größer oder gleich eins ist.
  24. Vorrichtung gemäß einem der vorangehenden Ansprüche 21 bis 23, wobei die Funktion der Kardinalität einer Gruppe entspricht.
  25. Vorrichtung gemäß einem der Ansprüche 21 bis 23, wobei die Funktion einer Eigenschaft von einem oder mehreren Wörtern in einer Gruppe entspricht.
  26. Vorrichtung gemäß Anspruch 25, wobei die Eigenschaft die Wahrscheinlichkeit des einzelnen oder gemeinsamen Auftretens des bzw. der einen oder mehreren Wörter in einer Gruppe ist.
  27. Vorrichtung gemäß einem der Ansprüche 21 bis 23, wobei die Funktion der Wahrscheinlichkeit oder Frequenz der Verwendung einer Gruppe entspricht.
  28. Vorrichtung gemäß einem der Ansprüche 21 bis 27, wobei die Datenbank ein maschinenlesbares mehrsprachiges Wörterbuch ist, wobei die Haupteinträge und die ersten Nebeneinträge (2) Quellsprachenwörter beinhalten, und jeder Eintrag weiter einen zweiten Nebeneintrag (3) umfasst, welcher zumindest eine Zielsprachenübersetzung des Hauptworts beinhaltet.
  29. Vorrichtung gemäß Anspruch 28, wobei das Mehrsprachenwörterbuch ein umkehrbares zweisprachiges Wörterbuch ist.
  30. Vorrichtung gemäß Anspruch 28 oder Anspruch 29, wobei jede Zielsprachenübersetzung assoziiert ist mit einer entsprechenden Gruppe von Wörtern in dem assoziierten ersten Nebeneintrag (2).
  31. Vorrichtung gemäß Anspruch 30, umfassend eine Einrichtung zum Auswählen einer der Zielsprachenübersetzungen und Sperren der Auswahl einer Übersetzung von jedem Wort, welches in einer Gruppe von Wörtern, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, enthalten ist.
  32. Vorrichtung gemäß Anspruch 31, umfassend eine Einrichtung zum Auswählen der Zielsprachenübersetzungen für die Wörter des Abschnitts von Text in absteigender Reihenfolge der Präferenzwerte.
  33. Vorrichtung gemäß Anspruch 31, umfassend eine Einrichtung zum Nichtauswählen der ausgewählten der Zielsprachenübersetzungen, Nichtsperren der Auswahl einer Übersetzung von jedem Wort, welches in einer Gruppe von Wörtern enthalten ist, welche mit der ausgewählten Übersetzung assoziiert ist bzw. sind, Auswählen einer anderen der Zielsprachenübersetzungen, und Sperren der Auswahl einer Übersetzung von jedem Wort, welches in einer Gruppe von Wörtern enthalten ist, welche mit der ausgewählten anderen Übersetzung assoziiert ist bzw. sind.
  34. Vorrichtung gemäß einem der Ansprüche 21 bis 27, wobei die Datenbank (28) ein maschinenlesbares Wörterbuch ist.
  35. Vorrichtung gemäß einem der Ansprüche 21 bis 27, wobei die Datenbank (28) ein maschinenlesbarer Thesaurus ist.
  36. Vorrichtung gemäß Anspruch 35, wobei der maschinenlesbare Thesaurus ein umkehrbarer maschinenlesbarer Thesaurus ist.
  37. Vorrichtung gemäß einem der Ansprüche 34, 35 oder 36, umfassend eine Erzeugungseinrichtung (31), um dem lokalisierten Eintrag im Wesentlichen dieselbe linguistische Beugung zu geben wie dem zumindest einen Wort, welches in dem zumindest Teil des Abschnitts von Text vorhanden ist.
  38. Vorrichtung gemäß einem der Ansprüche 21 bis 27, wobei die Datenbank (28) eine maschinenlesbare Enzyklopädie ist.
  39. Vorrichtung gemäß einem der Ansprüche 21 bis 27, wobei die Datenbank (28) ein Multimedia-Wörterbuch ist.
  40. Vorrichtung gemäß einem der Ansprüche 21 bis 39, wobei die Datenbank (28) auf einer CD-ROM gespeichert ist.
DE69733294T 1996-06-14 1997-06-16 Einrichtung und Verfahren zum Zugriff auf eine Datenbank Expired - Lifetime DE69733294T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9612474A GB2314183A (en) 1996-06-14 1996-06-14 Accessing a database
GB9612474 1996-06-14

Publications (2)

Publication Number Publication Date
DE69733294D1 DE69733294D1 (de) 2005-06-23
DE69733294T2 true DE69733294T2 (de) 2006-01-19

Family

ID=10795301

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69733294T Expired - Lifetime DE69733294T2 (de) 1996-06-14 1997-06-16 Einrichtung und Verfahren zum Zugriff auf eine Datenbank

Country Status (5)

Country Link
US (1) US5978798A (de)
EP (1) EP0813160B1 (de)
JP (1) JP3231004B2 (de)
DE (1) DE69733294T2 (de)
GB (1) GB2314183A (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2327133B (en) * 1997-05-17 2002-01-16 Aintree Hospitals Nhs Trust Method and apparatus for data entry and coding
GB2328297B (en) * 1997-08-13 2002-04-24 Ibm Text in anchor tag of hyperlink adjustable according to context
JPH11127545A (ja) 1997-10-23 1999-05-11 Nippon Seiki Co Ltd 車両用計器装置
GB2336694A (en) * 1998-01-23 1999-10-27 Electronic Village Limited Menu-based dictionary information retrieval system
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
GB2338089A (en) 1998-06-02 1999-12-08 Sharp Kk Indexing method
JP3817378B2 (ja) * 1998-12-15 2006-09-06 富士通株式会社 情報入力装置
JP2000284680A (ja) * 1999-03-31 2000-10-13 Seiko Instruments Inc 語彙学習機能付き電子辞書
US6394278B1 (en) 2000-03-03 2002-05-28 Sort-It, Incorporated Wireless system and method for sorting letters, parcels and other items
GB2362971B (en) * 2000-05-30 2004-03-24 Com Nation Ltd A method of searching the internet and an internet search engine
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
US8239253B2 (en) * 2006-07-26 2012-08-07 Wu Louis L Election-based electronic compilations
GB2444084A (en) * 2006-11-23 2008-05-28 Sharp Kk Selecting examples in an example based machine translation system
US7680780B2 (en) * 2007-04-06 2010-03-16 International Business Machines Corporation Techniques for processing data from a multilingual database
WO2010102268A2 (en) * 2009-03-06 2010-09-10 Riskradius, Llc Systems and methods for matching consumer requests with supplier appetites
EP2244194A1 (de) 2009-04-24 2010-10-27 Jose Luis Moises Gonzalez Verfahren und Vorrichtung zum Abrufen von Informationen unter Verwendung linguistischer Prädiktoren
US8484218B2 (en) * 2011-04-21 2013-07-09 Google Inc. Translating keywords from a source language to a target language

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
DE3788488T2 (de) * 1986-10-03 1994-05-11 British Telecomm Sprachenübersetzungssystem.
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
JPH06243162A (ja) * 1992-04-15 1994-09-02 Ricoh Co Ltd 機械翻訳装置
JPH06325081A (ja) * 1993-03-26 1994-11-25 Casio Comput Co Ltd 翻訳支援装置
JPH0773464A (ja) * 1993-03-31 1995-03-17 Sony Corp 情報処理装置
DE69424902T2 (de) * 1993-08-20 2000-11-09 Canon Kk Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche
US5606690A (en) * 1993-08-20 1997-02-25 Canon Inc. Non-literal textual search using fuzzy finite non-deterministic automata
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition

Also Published As

Publication number Publication date
JP3231004B2 (ja) 2001-11-19
EP0813160A2 (de) 1997-12-17
DE69733294D1 (de) 2005-06-23
EP0813160A3 (de) 1998-12-23
EP0813160B1 (de) 2005-05-18
US5978798A (en) 1999-11-02
GB9612474D0 (en) 1996-08-14
GB2314183A (en) 1997-12-17
JPH1069497A (ja) 1998-03-10

Similar Documents

Publication Publication Date Title
DE60029845T2 (de) System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung
DE69820343T2 (de) Linguistisches Suchsystem
DE60304331T2 (de) Abrufen übereinstimmender dokumente durch abfragen in einer nationalen sprache
DE60029732T2 (de) Phrasenübersetzungsverfahren und -system
DE69733294T2 (de) Einrichtung und Verfahren zum Zugriff auf eine Datenbank
DE69934371T2 (de) Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
DE69930690T2 (de) Verfahren und Gerät um einen Index herzustellen, Benutzung von einem Index und ein Speichermedium
DE69911842T2 (de) Verfahren und Vorrichtung zum Wiederauffinden von Information und entsprechendes Speichermedium
DE69432575T2 (de) Dokumentenerkennungssystem mit verbesserter Wirksamkeit der Dokumentenerkennung
DE3853894T2 (de) Auf Paradigmen basierende morphologische Textanalyse für natürliche Sprachen.
DE69631457T2 (de) Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung
EP1157500B1 (de) Vorrichtung und verfahren zum verbergen von informationen und vorrichtung und verfahren zum extrahieren von informationen
DE69829389T2 (de) Textnormalisierung unter verwendung einer kontextfreien grammatik
DE69925831T2 (de) Maschinenunterstützte übersetzungswerkzeuge
DE3587009T2 (de) Uebersetzungssystem.
DE69725883T2 (de) Parser für natürliche sprache mit wörterbuch-basierten teilwahrscheinlichkeiten
DE68928231T2 (de) Verfahren und Vorrichtung zur Maschinenübersetzung
DE68928230T2 (de) System zur grammatikalischen Verarbeitung eines aus natürlicher Sprache zusammengesetzten Satzes
DE68928250T2 (de) Übertragungssystem mit Übersetzung
US5541838A (en) Translation machine having capability of registering idioms
US20060224580A1 (en) Natural language based search engine and methods of use therefor
DE3789073T2 (de) System zur maschinellen Übersetzung.
DE2854837A1 (de) Uebersetzungsvorrichtung
DE3616751A1 (de) Uebersetzungssystem
DE69934195T2 (de) Identifikation einer Wortgruppe durch modifizierte Schlüsselwörter, die aus Transformationen von aufeinanderfolgenden Suffixen erzeugt sind

Legal Events

Date Code Title Description
8364 No opposition during term of opposition