DE29514054U1 - Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung - Google Patents

Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung

Info

Publication number
DE29514054U1
DE29514054U1 DE29514054U DE29514054U DE29514054U1 DE 29514054 U1 DE29514054 U1 DE 29514054U1 DE 29514054 U DE29514054 U DE 29514054U DE 29514054 U DE29514054 U DE 29514054U DE 29514054 U1 DE29514054 U1 DE 29514054U1
Authority
DE
Germany
Prior art keywords
microcomputer
ccd
control device
read
scanner device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE29514054U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ELEFTHERIADIS THEOFILOS
Original Assignee
ELEFTHERIADIS THEOFILOS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ELEFTHERIADIS THEOFILOS filed Critical ELEFTHERIADIS THEOFILOS
Priority to DE29514054U priority Critical patent/DE29514054U1/de
Publication of DE29514054U1 publication Critical patent/DE29514054U1/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/02Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
    • G06F15/025Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)

Description

Beschreibung
Elektronisches Übersetzungsgerät
Handelsübliche elektronische Übersetzer von einer Fremdsprache in die andere sind heutzutage relativ günstig zu erhalten. Sie ermöglichen es, zu übersetzende Worte oder Sätze mittels einer Tastatur einzugeben. Diese werden dann übersetzt durch Zuordnung der möglichen Zielworte aus dem Fremdsprachendatenspeicher (siehe Referenzen).
Die immer weiter fortschreitende Miniaturisierung macht es möglich immer größere Rechenleistung in ein Taschenrechnergehäuse zu verpacken. Darüberhinaus ist es heute möglich sehr hohe Speicherkapazitäten auf einem Speicherchip zu realisieren. Ein CCD-Flächensensor (400 mal 800 Pixel) mit der zugehörigen Steuerelektronik nimmt auf einer sauber ausgearbeiten Platine heute nur noch einen sehr kleinen Platz ein ( siehe Layouts von Camcordern, z.b. dem kleinsten der Welt). Heute existiert auch relativ sichere und leistungsfähige OCR-Software im PC-Bereich. Diese läßt sich relativ einfach mit einer Übersetzungsdatenbank koppeln. Solche Datenbanken sind relativ leicht zu implementieren, es existieren auch Fertigprodukte in diesem Bereich, Wörterbücher in elektronischer Form.
Referenzen:
Recherche unter dem Begriff translator, translating,.. G06F -15/38 EP 0353756 A2 900207
Datenbank Derwent Information 1995:
G06F 003-033 DE 4124939 Al 930204 (9306)* G06F 015-00 US 5164899 A 921117 (9249)*
FR 2659461 A 910913 (9147)*
G06F015-38 DE 3779743 G 920716 (9230)
Datenbank Patosde WiIa 1995
G06F015-38
DE 82-3244631
DE 82-3240209
DE 82-3233194
OCR und Archivierung Wolfgang Limper ISBN 3-89362-252-7
Der im Schutzanspruch 1. angegebenen Erfindung liegt das Problem zugrunde, daß die Nutzung herkömmlicher Mittel für schnelle Übersetzungszwecke in Dokumenten mit einer relativ hohen Dichte an Fremdworten zu umständlich ist. Dieses Problem wird durch ein Gerät mit den in Schutzanspruch 1. beschriebenen Merkmalen durch Einsatz und Wahl der richtigen Verfahren gelöst.
Der mit dieser Erfindung erzielte Vorteil besteht darin, daß in Sekundenbruchteilen ohne Einsatz einer Tastatur und nur durch korrektes Positionieren des Gerätes auf dem Dokument mittels der Scannereinrichtung ein Wort eingelesen und direkt übersetzt wird. Setzt man einmal Sicherheit und Robustheit der OCR- Software
voraus so können hierdurch immense Arbeitserleichterungen fur Arbeiten mit fremdsprachigen Dokumenten erzielt werden.
Das Gerät kann mit oder ohne Starterknopf, mit oder ohne Beleuchtungsfunktion zum Ausleuchten des Lesefeldes produziert werden, (abhängig von der Robustheit und Leistungsfähigkeit der Komponenten)
Ein CCD-Sensor mit 400 mal 800 Pixel kann bei einer Auflösung von 300 dpi ein Lesefeld von etwa 7cm mal 3,5cm digitalisieren Im Idealfall integriert das Gerät eine CCD, einen 32-Bit-Mikrorechner mit 16 MB und eine mehrzellige LCD in einem Taschenrechnergehäuse, bequem in der Hosentasche zu tragen.
Ein Ausführungsbeispiel ist in den folgenden Zeichnungen dargestellt und wird näher beschrieben.
Es zeigen
Fig. 1 das Zusammenspiel der Baugruppen
Fig. 2 Aufsicht auf das fertige Gerät
Fig. 3 Querschnitt durch das Gerät
Fig. 4 Prozeßmodell der Übersetzung
Grundfunktionalitäten der implementierten Software:
Der Mikrorechner verfügt über einen
Speicher für Daten und Verfahren/Programme, in der Weise, daß:
Daten zu den bitmaps (21),(22) gesepeichert werden; Daten zu den erkannten Zeichenketten (23) gespeichert werden; Daten zur Auswahl der für das Übersetzen relevanten Zeichenkette (24) gespeichert werden;
Daten fur die Worte aus dem Ausgangs- und Zielwortschatz gespeichert werden;
Verfahren (a) zur Kontrastveränderung und Reskalierung einer Grauwertbitmap gespeichert werden;
Verfahren (b) zur automatischen Zeichenerkennung (OCR) (siehe zum Beispiel OmniPage) gespeichert werden;
Verfahren (c) zur Erkennung der für die Übersetzung relevanten Zeichenkette (Einführen eines Abstandsmaßes für eine zusammenhängende Zeichenkette relativ zu einem Orientierungspunkt, der dem Orientierungspunkt auf dem Durchsichtfeld auf dem halbdurchlässigen Spiegel entspricht.) gespeichert werden;
Verfahren (d) zur Zuordnung der Ausgangszeichenkette zu einem Wort des Ausgangswortschatzes (Ahnlichkeitsmaße, fuzzy search, pattern matching) gespeichert werden;
Verfahren (e) zur Zuordnung des Ausgangswortes zu allen möglichen Zielworten aus dem Zielwortschatz gespeichert werden;
Verfahren (f) zur Darstellung der gefundenen Ergebnisse auf einem mehrzelligen
LCD gespeichert werden;
Einfach beschrieben ist die Erfindung im wesentlichen ein elektronischer Übersetzer, bei dem die Eingabe durch Tasten überflüssig gemacht worden ist. Diese Änderung des Auftaus geschieht auf Kosten der Einfachheit der Schaltung, denn Worte werden jetzt eingescannt und durch relativ komplizierte Algorithmen als zu übersetzende Zeichenfolge festgelegt.
Figur 2 zeigt die Aufsicht auf ein mögliches fertiges Gerät. Hierbei entspricht (1) einem Orientierungspunkt auf der Oberfläche des Sichtfensters (2), das zum halbdurchlässigen Spiegel gehört. Mit diesem Orientierungs punkt korrespondiert ein Orientierungspunkt auf der Bitmap (21), die durch die CCD als Bild vom Lesefeld (20) gemacht wurde. Dieser Punkt dient als Hilfe für den Benutzer, um das zu übersetzende Wort zu lokalisieren, während er es auf dem Dokument in das Sichtfenster holt.
Der Auslöser (4) (Fig 1 (7)) dient beim Übersetzungsprozeß in mehrfacher Weise. Ist das Gerät eingeschaltet, so kann es aus seinem Power-Down Modus durch Betätigen der Taste (4) erweckt werden. Es würde dann einen Verarbeitungsprozeß nach Figur 4 einleiten, wenn dieser durch ein Betätigen der Taste (4) getriggert wird.
Ist das Ergebnis nach dem in Figur 4 beschriebenen Vorgehen auf der LCD (3) angezeigt, so wird durch einen vertikal laufenden Cursor die Zeile durch Betätigen der Taste 4 ausgewählt, die für die nächste Operation verantwortlich ist. Etwas längeres Drücken hier, wie auch an anderer Stelle terminiert den Verarbeitungsprozeß. Nur im Falle, daß durch den vertikalen Cursor eine Auswahl stattgefunden hat ist kein Abbruch möglich. Wurde er aber abgebrochen, so befinden wir uns dann im Startzustand, der Prozeß gemäß Figur 4 kann durch ein erneutes Triggern eingeleitet werden. Triggert die Taste während sich der Cursor auf der Zeile 1 befindet (hier : refined ), so läuft ein horizontaler Cursor, um den Buchstaben festzulegen der in der ersten Zeile zu ändern ist. Durch Triggern wiird dieser festgelegt, gleichzeitig die Taste gehalten, um im Schnelldurchlauf das Alphabet zu durchlaufen, nähert man sich einem Zielbuchstaben, so läßt man los, drückt aber bei Erreichen des Zielbuchstabens wieder auf die Taste, ein Buchstabe wird an dieser Stelle jetzt ersetzt.
Das zu übersetzende Wort kann zur Not so geändert werden. Es erfolgt ein automatisches Reiterieren von Teilprozess ((5), (6), (7), (8)) in Figur 4. Es läuft wieder der vertikale Cursor.
Drückt man die Taste (4) während der vertikale Cursor nicht in Zeile 1 ist, so
werden weitere mögliche Bedeutungen des Begriffs refined in der LCD dargestellt.
Figur (3) zeigt einen Querschnitt durch das Gerät, wobei hier nur die wesentlichen optischen Elemente dargestellt sind.
Ein einzulesender Teil des Dokuments wird hierbei ins Sichtfenster (1) geholt.
Die von unten kommende vom Dokument reflektierte Lichtinformation gelangt einmal als durchgelassene Information in das Auge des Betrachters (0), wird zum anderen aber durch den halbdurchlässigen Spiegel (2) auf den Scanner (4), hier eine flächige CCD3 projiziert.
Die Lichtquelle (3) dient bei schlechten Lichtverhältnissen zum Ausleuchten des einzulesenden Feldes. Sie liegt etwas axialer als hier dargestellt. Das von ihr kommende Licht geht den umgekehrten Lichtweg.
Notwendig ist ein empfindlicher CCD-Sensor, der über einen großen Bereich möglicher Lichtintensitäten eine kontrastreiche Abbildung möglich macht. Den Rest erledigen die Verfahren (a).
Figur 4 stellt den gesamten Übersetzungsprozeß dar.
Das Lesefeld (20) wird durch den halbdurchlässigen Spiegel auf die CCD projiziert Dies entspricht dem Schritt (1) nach (2).
Die Projektion wird durch die CCD digitalisiert, es entsteht die zugehörige "Rohbitmap" (21).
Dies entspricht dem Schritt (2) nach (3).
Diese Rohbitmap wird jetzt einem automatischen Kontrastausgleich unterworfen, sogar räumliche Kontraständerungen aufgrund inhomogener Intensitätsverteilungen, wie sie zum Beispiel im Falle schlechter Lichtverhältnisse durch Einsatz der Lichtquelle (3) entstehen können, sollten hierdurch korrigierbar sein. Eine unter Umständen notwendige vertikale Reskalierung der Rohbitmap kann hier auch durchgeführt werden, die fur diese Operationen notwendigen Algorithmen fallen alle unter die Verfahren (a).
Es entsteht aus der Rohbitmap (21) die reskalierte, kontrastreiche OCR-würdige Bitmap (22).
Dies entspricht dem Schritt (3) nach (4).
Die Verfahren (b),(c) werden nun auf einem als relevant erkannten Bereich der Bitmap (22) (bei der Erklärung zu Figur 2 beschriebener Orientierungspunkt muß von erkannten Zeichenketten (23) (wenn nötig bis zum Rand der Bitmap gehen) eingeschlossen sein) angewandt, sukzessive Einzelbuchstaben- und Zeichenkettenabstände vom Orientierungspunkt der Übersetzung ausgerechnet (dropping-Kriterien um möglichst wenige Zeichen erkennen zu müssen). Die naheliegendste Zeichenkette, die mitlerweile erkannt worden ist, wird als zur Übersetzung relevante Zeichenkette (24) extrahiert.
Nur im schlechtesten Fall ist am Ende dieses Teils der Orientierungspunkt wirklich von erkannten Zeichenketten eingeschlossen.
Verfahren zu (b) gehören zum weiten Feld der Merkmalanalyse (ein OmniPage- oder Catchwordäquivalent)
Dies entspricht dem Schritt (4) nach (5).
Dem Schritt (5) nach (6) entspricht ein match fur die gefundene Zeichenkette mit einem Wort aus dem Ausgangswortschatz, auch hier gibt es viele verschiedene Verfahren des patternmatching.. (Verfahren (d)) Dem Schritt (6) nach (7) entspncht die Zuordnung des Ausgangswortes zu allen möglichen Zielworten. (Verfahren (e)).
Die Darstellung der Ergebnisse und der laufenden Cursoren geschieht entsprechend Verfahren (f) als Schritt (7) nach (8).

Claims (1)

Schutzansprüche:
1. Elektronisches Übersetzungsgerät mit einem Mikrorechner, zugehörigem Speicher, und mit dem Mikrorechner gekoppelter Informationseingabe und -ausgabeschaltung, das Worte aus einer Sprache in korrespondierende Worte einer anderen Sprache übersetzt.
Dieses Gerät ist gekennzeichnet durch folgende Baugruppen: einem halbdurchlässigen Spiegel (1), der das Lesefeld (20), in dem das einzulesende Wort enthalten ist, projiziert auf einen zweidimensionalen Scanner, hier einem CCD-Flächenscanner;
einem Mikrorechner (3), der die CCD (0) über eine Steuereinrichtung (4) ausliest und die gelesene "Roh-Bitmap" (21) weiterverarbeitet; einem mehrzelligen LCD-Feld (5), das über eine Steuereinrichtung (6) durch den Mikrorechner (3) angesprochen werden kann;
einem Steuerknopf (7), einer dazugehörigen Steuerleitung (8), die ebenfalls über eine Steuereinrichtung (9) vom Mikrorechner (3) ausgelesen werden kann.
DE29514054U 1995-09-01 1995-09-01 Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung Expired - Lifetime DE29514054U1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE29514054U DE29514054U1 (de) 1995-09-01 1995-09-01 Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE29514054U DE29514054U1 (de) 1995-09-01 1995-09-01 Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung

Publications (1)

Publication Number Publication Date
DE29514054U1 true DE29514054U1 (de) 1996-02-29

Family

ID=8012495

Family Applications (1)

Application Number Title Priority Date Filing Date
DE29514054U Expired - Lifetime DE29514054U1 (de) 1995-09-01 1995-09-01 Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung

Country Status (1)

Country Link
DE (1) DE29514054U1 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3305527A1 (de) * 1983-02-18 1984-08-30 Herbert 7731 Fischbach Rigoni Verfahren zur uebersetzung von woertern und elektronisches uebersetzungsgeraet
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
US5063508A (en) * 1989-03-22 1991-11-05 Oki Electric Industry Co., Ltd. Translation system with optical reading means including a moveable read head
DE19504111A1 (de) * 1994-02-08 1995-08-10 Chinon Ind Inc Bildlesevorrichtung

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3305527A1 (de) * 1983-02-18 1984-08-30 Herbert 7731 Fischbach Rigoni Verfahren zur uebersetzung von woertern und elektronisches uebersetzungsgeraet
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
US5063508A (en) * 1989-03-22 1991-11-05 Oki Electric Industry Co., Ltd. Translation system with optical reading means including a moveable read head
DE19504111A1 (de) * 1994-02-08 1995-08-10 Chinon Ind Inc Bildlesevorrichtung

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP 1-41069 A.,In: Patents Abstracts of Japan, P-878,May 29,1989,Vol.13,No.231 *

Similar Documents

Publication Publication Date Title
DE69029251T2 (de) System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem
DE69033042T2 (de) Datenverarbeitung
DE69428590T2 (de) Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung
EP0131676B1 (de) Verfahren zum automatischen Digitalisieren des Umrisses von Strichgraphiken z.B. Buchstaben
DE69517564T2 (de) Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes
DE69709939T2 (de) Gerät und verfahren zur anzeige und erfassung von text in einer schreibstiftartigen eingabevorrichtung
DE69938395T2 (de) Bildscanner und vorrichtung zur optischen zeichenerkennung welche diesen scanner verwendet
DE69623569T2 (de) System zur Zeichenerkennung und Übersetzung
DE69425105T2 (de) Informationsverarbeitungsvorrichtung mit integriertem Anzeige/Eingabesystem
DE69724755T2 (de) Auffinden von Titeln und Photos in abgetasteten Dokumentbildern
DE3750543T2 (de) Elektronisches Wörterbuch.
DE69302003T2 (de) Dateneingabeanlage
DE3689416T2 (de) Mustermerkmalextraktion.
DE60116442T2 (de) System zur Zuordnung von Schlüsselwörtern zu Dokumenten
DE60219048T2 (de) Sektionsextrahierungswerkzeug für pdf-dokumente
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE10321944A1 (de) Vorrichtungen und Verfahren zum Verarbeiten von textbasierten elektronischen Dokumenten
DE102011079443A1 (de) Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung
DE102013108892A1 (de) Lernfähige tragbare Systeme zur optischen Zeichenerkennung und Verfahren
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
DE69218272T2 (de) Bildeingabegerät
DE69834971T2 (de) Zeichenerkennungsvorrichtung
DE3786816T2 (de) Optische Zeichenerkennungsvorrichtung und optisches Zeichenerkennungsverfahren.
DE60123730T2 (de) Gerät und Verfahren zur Bestimmung des Formats von Dokumenten
DE10313019B4 (de) Einhandbedienung von Endgeräten per Gestikerkennung

Legal Events

Date Code Title Description
R086 Non-binding declaration of licensing interest
R207 Utility model specification

Effective date: 19960411

R163 Identified publications notified

Effective date: 19960506

R156 Lapse of ip right after 3 years

Effective date: 19990901