DE29514054U1 - Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung - Google Patents
Elektronischer Pocketübersetzer natürlicher Sprachen mit ScannervorrichtungInfo
- Publication number
- DE29514054U1 DE29514054U1 DE29514054U DE29514054U DE29514054U1 DE 29514054 U1 DE29514054 U1 DE 29514054U1 DE 29514054 U DE29514054 U DE 29514054U DE 29514054 U DE29514054 U DE 29514054U DE 29514054 U1 DE29514054 U1 DE 29514054U1
- Authority
- DE
- Germany
- Prior art keywords
- microcomputer
- ccd
- control device
- read
- scanner device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 7
- 238000003825 pressing Methods 0.000 description 4
- 230000001960 triggered effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/02—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
- G06F15/025—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators adapted to a specific application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Description
Elektronisches Übersetzungsgerät
Handelsübliche elektronische Übersetzer von einer Fremdsprache in die andere
sind heutzutage relativ günstig zu erhalten. Sie ermöglichen es, zu übersetzende
Worte oder Sätze mittels einer Tastatur einzugeben. Diese werden dann übersetzt durch Zuordnung der möglichen Zielworte aus dem Fremdsprachendatenspeicher
(siehe Referenzen).
Die immer weiter fortschreitende Miniaturisierung macht es möglich immer größere
Rechenleistung in ein Taschenrechnergehäuse zu verpacken. Darüberhinaus ist es heute möglich sehr hohe Speicherkapazitäten auf einem Speicherchip zu realisieren.
Ein CCD-Flächensensor (400 mal 800 Pixel) mit der zugehörigen Steuerelektronik nimmt auf einer sauber ausgearbeiten Platine heute nur noch einen sehr kleinen
Platz ein ( siehe Layouts von Camcordern, z.b. dem kleinsten der Welt).
Heute existiert auch relativ sichere und leistungsfähige OCR-Software im PC-Bereich.
Diese läßt sich relativ einfach mit einer Übersetzungsdatenbank koppeln. Solche Datenbanken sind relativ leicht zu implementieren, es existieren auch Fertigprodukte
in diesem Bereich, Wörterbücher in elektronischer Form.
Referenzen:
Recherche unter dem Begriff translator, translating,.. G06F -15/38 EP 0353756 A2 900207
Datenbank Derwent Information 1995:
G06F 003-033 DE 4124939 Al 930204 (9306)* G06F 015-00 US 5164899 A 921117 (9249)*
FR 2659461 A 910913 (9147)*
G06F015-38 DE 3779743 G 920716 (9230)
Datenbank Patosde WiIa 1995
G06F015-38
DE 82-3244631
DE 82-3240209
DE 82-3233194
OCR und Archivierung Wolfgang Limper ISBN 3-89362-252-7
Datenbank Derwent Information 1995:
G06F 003-033 DE 4124939 Al 930204 (9306)* G06F 015-00 US 5164899 A 921117 (9249)*
FR 2659461 A 910913 (9147)*
G06F015-38 DE 3779743 G 920716 (9230)
Datenbank Patosde WiIa 1995
G06F015-38
DE 82-3244631
DE 82-3240209
DE 82-3233194
OCR und Archivierung Wolfgang Limper ISBN 3-89362-252-7
Der im Schutzanspruch 1. angegebenen Erfindung liegt das Problem zugrunde,
daß die Nutzung herkömmlicher Mittel für schnelle Übersetzungszwecke in Dokumenten mit einer relativ hohen Dichte an Fremdworten zu umständlich ist.
Dieses Problem wird durch ein Gerät mit den in Schutzanspruch 1. beschriebenen
Merkmalen durch Einsatz und Wahl der richtigen Verfahren gelöst.
Der mit dieser Erfindung erzielte Vorteil besteht darin, daß in Sekundenbruchteilen
ohne Einsatz einer Tastatur und nur durch korrektes Positionieren des Gerätes auf dem Dokument mittels der Scannereinrichtung ein Wort eingelesen und direkt
übersetzt wird. Setzt man einmal Sicherheit und Robustheit der OCR- Software
voraus so können hierdurch immense Arbeitserleichterungen fur Arbeiten mit
fremdsprachigen Dokumenten erzielt werden.
Das Gerät kann mit oder ohne Starterknopf, mit oder ohne Beleuchtungsfunktion
zum Ausleuchten des Lesefeldes produziert werden, (abhängig von der Robustheit
und Leistungsfähigkeit der Komponenten)
Ein CCD-Sensor mit 400 mal 800 Pixel kann bei einer Auflösung von 300 dpi
ein Lesefeld von etwa 7cm mal 3,5cm digitalisieren Im Idealfall integriert das Gerät eine CCD, einen 32-Bit-Mikrorechner mit 16 MB
und eine mehrzellige LCD in einem Taschenrechnergehäuse, bequem in der Hosentasche
zu tragen.
Ein Ausführungsbeispiel ist in den folgenden Zeichnungen dargestellt und wird
näher beschrieben.
Es zeigen
Fig. 1 das Zusammenspiel der Baugruppen
Fig. 2 Aufsicht auf das fertige Gerät
Fig. 3 Querschnitt durch das Gerät
Fig. 4 Prozeßmodell der Übersetzung
Grundfunktionalitäten der implementierten Software:
Der Mikrorechner verfügt über einen
Speicher für Daten und Verfahren/Programme, in der Weise, daß:
Daten zu den bitmaps (21),(22) gesepeichert werden; Daten zu den erkannten Zeichenketten (23) gespeichert werden;
Daten zur Auswahl der für das Übersetzen relevanten Zeichenkette (24)
gespeichert werden;
Daten fur die Worte aus dem Ausgangs- und Zielwortschatz gespeichert werden;
Verfahren (a) zur Kontrastveränderung und Reskalierung einer Grauwertbitmap
gespeichert werden;
Verfahren (b) zur automatischen Zeichenerkennung (OCR) (siehe zum Beispiel
OmniPage) gespeichert werden;
Verfahren (c) zur Erkennung der für die Übersetzung relevanten Zeichenkette
(Einführen eines Abstandsmaßes für eine zusammenhängende Zeichenkette
relativ zu einem Orientierungspunkt, der dem Orientierungspunkt auf dem Durchsichtfeld auf dem halbdurchlässigen Spiegel entspricht.) gespeichert
werden;
Verfahren (d) zur Zuordnung der Ausgangszeichenkette zu einem Wort des
Ausgangswortschatzes (Ahnlichkeitsmaße, fuzzy search, pattern matching)
gespeichert werden;
Verfahren (e) zur Zuordnung des Ausgangswortes zu allen möglichen Zielworten
aus dem Zielwortschatz gespeichert werden;
Verfahren (f) zur Darstellung der gefundenen Ergebnisse auf einem mehrzelligen
LCD gespeichert werden;
Einfach beschrieben ist die Erfindung im wesentlichen ein elektronischer
Übersetzer, bei dem die Eingabe durch Tasten überflüssig gemacht worden ist. Diese Änderung des Auftaus geschieht auf Kosten der Einfachheit der Schaltung,
denn Worte werden jetzt eingescannt und durch relativ komplizierte Algorithmen als zu übersetzende Zeichenfolge festgelegt.
Figur 2 zeigt die Aufsicht auf ein mögliches fertiges Gerät. Hierbei entspricht (1) einem Orientierungspunkt auf der Oberfläche des Sichtfensters
(2), das zum halbdurchlässigen Spiegel gehört. Mit diesem Orientierungs punkt korrespondiert ein Orientierungspunkt auf der Bitmap (21), die durch die
CCD als Bild vom Lesefeld (20) gemacht wurde. Dieser Punkt dient als Hilfe für den Benutzer, um das zu übersetzende Wort zu lokalisieren, während er es auf dem
Dokument in das Sichtfenster holt.
Der Auslöser (4) (Fig 1 (7)) dient beim Übersetzungsprozeß in mehrfacher Weise.
Ist das Gerät eingeschaltet, so kann es aus seinem Power-Down Modus durch Betätigen der Taste (4) erweckt werden. Es würde dann einen
Verarbeitungsprozeß nach Figur 4 einleiten, wenn dieser durch ein Betätigen der Taste (4) getriggert wird.
Ist das Ergebnis nach dem in Figur 4 beschriebenen Vorgehen auf der LCD (3)
angezeigt, so wird durch einen vertikal laufenden Cursor die Zeile durch Betätigen
der Taste 4 ausgewählt, die für die nächste Operation verantwortlich ist.
Etwas längeres Drücken hier, wie auch an anderer Stelle terminiert den Verarbeitungsprozeß.
Nur im Falle, daß durch den vertikalen Cursor eine Auswahl stattgefunden hat ist kein Abbruch möglich. Wurde er aber abgebrochen, so
befinden wir uns dann im Startzustand, der Prozeß gemäß Figur 4 kann durch ein erneutes Triggern eingeleitet werden.
Triggert die Taste während sich der Cursor auf der Zeile 1 befindet (hier : refined ),
so läuft ein horizontaler Cursor, um den Buchstaben festzulegen der in der ersten
Zeile zu ändern ist. Durch Triggern wiird dieser festgelegt, gleichzeitig die Taste
gehalten, um im Schnelldurchlauf das Alphabet zu durchlaufen, nähert man sich einem Zielbuchstaben, so läßt man los, drückt aber bei Erreichen
des Zielbuchstabens wieder auf die Taste, ein Buchstabe wird an dieser Stelle jetzt ersetzt.
Das zu übersetzende Wort kann zur Not so geändert werden. Es erfolgt ein automatisches
Reiterieren von Teilprozess ((5), (6), (7), (8)) in Figur 4. Es läuft wieder der vertikale Cursor.
Drückt man die Taste (4) während der vertikale Cursor nicht in Zeile 1 ist, so
Drückt man die Taste (4) während der vertikale Cursor nicht in Zeile 1 ist, so
werden weitere mögliche Bedeutungen des Begriffs refined in der LCD dargestellt.
Figur (3) zeigt einen Querschnitt durch das Gerät, wobei hier nur die wesentlichen
optischen Elemente dargestellt sind.
Ein einzulesender Teil des Dokuments wird hierbei ins Sichtfenster (1) geholt.
Die von unten kommende vom Dokument reflektierte Lichtinformation gelangt
einmal als durchgelassene Information in das Auge des Betrachters (0), wird zum anderen aber durch den halbdurchlässigen Spiegel (2) auf den Scanner (4), hier eine
flächige CCD3 projiziert.
Die Lichtquelle (3) dient bei schlechten Lichtverhältnissen zum Ausleuchten des
einzulesenden Feldes. Sie liegt etwas axialer als hier dargestellt. Das von ihr kommende Licht geht den umgekehrten Lichtweg.
Notwendig ist ein empfindlicher CCD-Sensor, der über einen großen Bereich
möglicher Lichtintensitäten eine kontrastreiche Abbildung möglich macht. Den Rest
erledigen die Verfahren (a).
Figur 4 stellt den gesamten Übersetzungsprozeß dar.
Das Lesefeld (20) wird durch den halbdurchlässigen Spiegel auf die CCD projiziert
Dies entspricht dem Schritt (1) nach (2).
Die Projektion wird durch die CCD digitalisiert, es entsteht die zugehörige "Rohbitmap"
(21).
Dies entspricht dem Schritt (2) nach (3).
Diese Rohbitmap wird jetzt einem automatischen Kontrastausgleich unterworfen,
sogar räumliche Kontraständerungen aufgrund inhomogener Intensitätsverteilungen,
wie sie zum Beispiel im Falle schlechter Lichtverhältnisse durch Einsatz der Lichtquelle (3) entstehen können, sollten hierdurch korrigierbar
sein. Eine unter Umständen notwendige vertikale Reskalierung der Rohbitmap
kann hier auch durchgeführt werden, die fur diese Operationen notwendigen Algorithmen fallen alle unter die Verfahren (a).
Es entsteht aus der Rohbitmap (21) die reskalierte, kontrastreiche OCR-würdige
Bitmap (22).
Dies entspricht dem Schritt (3) nach (4).
Die Verfahren (b),(c) werden nun auf einem als relevant erkannten Bereich der Bitmap
(22) (bei der Erklärung zu Figur 2 beschriebener Orientierungspunkt muß von erkannten Zeichenketten (23) (wenn nötig bis zum Rand der Bitmap gehen) eingeschlossen
sein) angewandt, sukzessive Einzelbuchstaben- und Zeichenkettenabstände vom Orientierungspunkt der Übersetzung ausgerechnet (dropping-Kriterien
um möglichst wenige Zeichen erkennen zu müssen). Die naheliegendste Zeichenkette,
die mitlerweile erkannt worden ist, wird als zur Übersetzung relevante Zeichenkette (24) extrahiert.
Nur im schlechtesten Fall ist am Ende dieses Teils der Orientierungspunkt wirklich
von erkannten Zeichenketten eingeschlossen.
Verfahren zu (b) gehören zum weiten Feld der Merkmalanalyse (ein OmniPage- oder Catchwordäquivalent)
Dies entspricht dem Schritt (4) nach (5).
Verfahren zu (b) gehören zum weiten Feld der Merkmalanalyse (ein OmniPage- oder Catchwordäquivalent)
Dies entspricht dem Schritt (4) nach (5).
Dem Schritt (5) nach (6) entspricht ein match fur die gefundene Zeichenkette mit
einem Wort aus dem Ausgangswortschatz, auch hier gibt es viele verschiedene Verfahren des patternmatching.. (Verfahren (d))
Dem Schritt (6) nach (7) entspncht die Zuordnung des Ausgangswortes zu allen möglichen Zielworten. (Verfahren (e)).
Die Darstellung der Ergebnisse und der laufenden Cursoren geschieht entsprechend
Verfahren (f) als Schritt (7) nach (8).
Claims (1)
1. Elektronisches Übersetzungsgerät mit einem Mikrorechner, zugehörigem Speicher,
und mit dem Mikrorechner gekoppelter Informationseingabe und -ausgabeschaltung, das Worte aus einer Sprache in korrespondierende Worte einer anderen Sprache
übersetzt.
Dieses Gerät ist gekennzeichnet durch folgende Baugruppen: einem halbdurchlässigen Spiegel (1), der das Lesefeld (20), in dem das einzulesende
Wort enthalten ist, projiziert auf einen zweidimensionalen Scanner, hier einem CCD-Flächenscanner;
einem Mikrorechner (3), der die CCD (0) über eine Steuereinrichtung (4) ausliest
und die gelesene "Roh-Bitmap" (21) weiterverarbeitet;
einem mehrzelligen LCD-Feld (5), das über eine Steuereinrichtung (6) durch den Mikrorechner (3) angesprochen werden kann;
einem Steuerknopf (7), einer dazugehörigen Steuerleitung (8), die ebenfalls über eine
Steuereinrichtung (9) vom Mikrorechner (3) ausgelesen werden kann.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE29514054U DE29514054U1 (de) | 1995-09-01 | 1995-09-01 | Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE29514054U DE29514054U1 (de) | 1995-09-01 | 1995-09-01 | Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE29514054U1 true DE29514054U1 (de) | 1996-02-29 |
Family
ID=8012495
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE29514054U Expired - Lifetime DE29514054U1 (de) | 1995-09-01 | 1995-09-01 | Elektronischer Pocketübersetzer natürlicher Sprachen mit Scannervorrichtung |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE29514054U1 (de) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3305527A1 (de) * | 1983-02-18 | 1984-08-30 | Herbert 7731 Fischbach Rigoni | Verfahren zur uebersetzung von woertern und elektronisches uebersetzungsgeraet |
US4890230A (en) * | 1986-12-19 | 1989-12-26 | Electric Industry Co., Ltd. | Electronic dictionary |
US5063508A (en) * | 1989-03-22 | 1991-11-05 | Oki Electric Industry Co., Ltd. | Translation system with optical reading means including a moveable read head |
DE19504111A1 (de) * | 1994-02-08 | 1995-08-10 | Chinon Ind Inc | Bildlesevorrichtung |
-
1995
- 1995-09-01 DE DE29514054U patent/DE29514054U1/de not_active Expired - Lifetime
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3305527A1 (de) * | 1983-02-18 | 1984-08-30 | Herbert 7731 Fischbach Rigoni | Verfahren zur uebersetzung von woertern und elektronisches uebersetzungsgeraet |
US4890230A (en) * | 1986-12-19 | 1989-12-26 | Electric Industry Co., Ltd. | Electronic dictionary |
US5063508A (en) * | 1989-03-22 | 1991-11-05 | Oki Electric Industry Co., Ltd. | Translation system with optical reading means including a moveable read head |
DE19504111A1 (de) * | 1994-02-08 | 1995-08-10 | Chinon Ind Inc | Bildlesevorrichtung |
Non-Patent Citations (1)
Title |
---|
JP 1-41069 A.,In: Patents Abstracts of Japan, P-878,May 29,1989,Vol.13,No.231 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69029251T2 (de) | System zur Ueberprüfung von Dokumenten, zur Verwendung mit einem Lese- und Uebersetzungssystem | |
DE69033042T2 (de) | Datenverarbeitung | |
DE69428590T2 (de) | Auf kombiniertem lexikon und zeichenreihenwahrscheinlichkeit basierte handschrifterkennung | |
EP0131676B1 (de) | Verfahren zum automatischen Digitalisieren des Umrisses von Strichgraphiken z.B. Buchstaben | |
DE69517564T2 (de) | Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes | |
DE69709939T2 (de) | Gerät und verfahren zur anzeige und erfassung von text in einer schreibstiftartigen eingabevorrichtung | |
DE69938395T2 (de) | Bildscanner und vorrichtung zur optischen zeichenerkennung welche diesen scanner verwendet | |
DE69623569T2 (de) | System zur Zeichenerkennung und Übersetzung | |
DE69425105T2 (de) | Informationsverarbeitungsvorrichtung mit integriertem Anzeige/Eingabesystem | |
DE69724755T2 (de) | Auffinden von Titeln und Photos in abgetasteten Dokumentbildern | |
DE3750543T2 (de) | Elektronisches Wörterbuch. | |
DE69302003T2 (de) | Dateneingabeanlage | |
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE60116442T2 (de) | System zur Zuordnung von Schlüsselwörtern zu Dokumenten | |
DE60219048T2 (de) | Sektionsextrahierungswerkzeug für pdf-dokumente | |
DE69428475T2 (de) | Verfahren und Gerät zur automatischen Spracherkennung | |
DE10321944A1 (de) | Vorrichtungen und Verfahren zum Verarbeiten von textbasierten elektronischen Dokumenten | |
DE102011079443A1 (de) | Lerngewichtungen von Schriftarten für getippte Proben bei der Handschriftenschlüsselwortauffindung | |
DE102013108892A1 (de) | Lernfähige tragbare Systeme zur optischen Zeichenerkennung und Verfahren | |
CN114092938B (zh) | 图像的识别处理方法、装置、电子设备及存储介质 | |
DE69218272T2 (de) | Bildeingabegerät | |
DE69834971T2 (de) | Zeichenerkennungsvorrichtung | |
DE3786816T2 (de) | Optische Zeichenerkennungsvorrichtung und optisches Zeichenerkennungsverfahren. | |
DE60123730T2 (de) | Gerät und Verfahren zur Bestimmung des Formats von Dokumenten | |
DE10313019B4 (de) | Einhandbedienung von Endgeräten per Gestikerkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R086 | Non-binding declaration of licensing interest | ||
R207 | Utility model specification |
Effective date: 19960411 |
|
R163 | Identified publications notified |
Effective date: 19960506 |
|
R156 | Lapse of ip right after 3 years |
Effective date: 19990901 |