DE19508203C2 - Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von Schriften - Google Patents
Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von SchriftenInfo
- Publication number
- DE19508203C2 DE19508203C2 DE19508203A DE19508203A DE19508203C2 DE 19508203 C2 DE19508203 C2 DE 19508203C2 DE 19508203 A DE19508203 A DE 19508203A DE 19508203 A DE19508203 A DE 19508203A DE 19508203 C2 DE19508203 C2 DE 19508203C2
- Authority
- DE
- Germany
- Prior art keywords
- column
- values
- row
- characters
- indices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
- G06V30/1478—Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Description
Die vorliegende Erfindung betrifft ein Verfahren zur
Schräglagenkorrektur bei maschinellem Lesen von Schriften. Maschinelle Lesesysteme
werden z. B. in Briefverteilanlagen eingesetzt, um die Verteilung von Postsendungen
entsprechend der gelesenen Postleitzahlen in die bestimmten Postleitzahlen
zugeordneten Verteilfächer zu steuern.
Maschinelle Lesesysteme lassen sich in zwei Teilsysteme gliedern, von denen das erste
die Aufgabe der Bildvorbereitung und das zweite die Aufgabe der eigentlichen
Erkennung hat. Die zu erkennenden Zeichen liegen zunächst im optischen Bereich vor
und werden für die weitere Verarbeitung mittels eines Abtasters, vorzugsweise eines
integrierten Halbleiterabtasters gewandelt. Für die weitere Verarbeitung wird die
kontinuierlich gemessene Schwärzung im allgemeinen unmittelbar in eine Schwarz
Weiß-Entscheidung, also schwarze und weiße Bildpunkte (Pixel) gewandelt. Aus
diesem Abbild der Vorlage werden Schriftfelder, Textzeilen und schließlich die
einzelnen Zeichen herauspräpariert. Weiterhin werden Schräglagen der einzelnen
Schriftfelder, Textzeilen oder einzelnen Zeichen korrigiert. In Anschriften-Lesern und
sonstigen Lesegeräten kommt es vor, daß die Schriftzeichen eines Adreßblocks oder
sonstigen Schriftfeldes wegen schrägen Briefeinlaufs, wegen schräg aufgeklebter
Adreßfelder oder wegen sonstiger verdrehter Schriftfelder verdreht eingelesen werden.
Das kann zu einer Verringerung der Erkennungsleistung führen und vor allem
Probleme bei der Segmentierung der Schriftfelder mit sich bringen, weil bei der
Segmentierung eine Verdrehung der einzelnen Zeile aus dem orthogonalen Raster die
Weißwegsuche und die Trennung verklebter Schriftzeichen erschweren oder gar
verhindern kann. Die Drehlagenkorrektur auf Schriftfeld- und Schriftzeilenebene
verringert die negativen Auswirkungen der Verdrehung der Schriftzeichen. Dabei ist es
nicht ausreichend, die Schriftfelder, Schriftzeilen oder Zeichen durch eine einfache
Verschiebung orthogonal auszurichten, diese müssen vielmehr vollständig in ihrer
Drehlage korrigiert werden. Eine Drehlagenkorrektur in einer maschinellen
Lesevorrichtung besteht aus zwei Schritten. Zuerst muß die Drehlage (d. h. der
Drehwinkel) des gedrehten Schriftfeldes bestimmt werden, dann können die
Einzelzeichen, die Worte, Schriftzeilen oder das gesamte Schriftfeld mittels eines
geeigneten Verfahrens in die Normallage zurückgedreht werden.
Bekannte Vorrichtungen und Verfahren führen eine erforderliche Drehung mittels
komplexer Rechnungen aus, die eine lange Rechenzeit erfordern und somit die
Lesegeschwindigkeit des Lesegerätes bei erforderlichen Korrekturen der Drehlage
stark herabsetzen.
Aus der DE 38 23 622 A1 ist ein Verfahren zum maschinellen Lesen von Schriften
bekannt, bei denen eine Schräglagenkorrektur durchzuführen ist. Hierbei erfolgt die
Schräglagenkorrektur durch ein horizontales und!oder vertikales Scheren der
Zeichen, Schriftzeilen oder Schriftfelder.
Aus der US 50 50 225 ist es bekannt, Drehlagenkorrekturen durch ein Pressen und
Dehnen (Skalieren) des Bildes und anschließenden horizontalen und vertikalen
Scherens der einzelnen Bildpunkte des skalierten Bildes auszuführen, was eine
große Rechenmenge und somit eine lange Rechenzeit erforderlich macht. Zur
Reduzierung dieser erforderlichen Rechenzeit schlägt die vorgenannte Schrift vor,
nach dem Skalieren die erste Spalte des Bildes horizontal und vertikal zu scheren
und anschließend die noch fehlenden Bildpunkte mit einem Bresenham′s
Liniengenerator zu berechnen. Doch auch dieses Verfahren benötigt insgesamt
noch verhältnismäßig viel Zeit.
In den meisten Fällen sind nur geringe Drehlagenkorrekturen für die zu lesenden
Schriften erforderlich
Aufgabe der vorliegenden Erfindung ist es daher, ein
Verfahren anzugeben, welche das Zurückdrehen um relativ kleine Winkel (max.20
bis 30 Grad) mit ausreichender Genauigkeit in möglichst kurzer Zeit ausführt. Diese
Aufgabe wird durch ein Verfahren nach Anspruch 1 gelöst. Vorteilhafte
Ausgestaltungen der Erfindung sind den Unteransprüchen zu entnehmen.
Eine dem Drehen eines Zeichens absolut entsprechende Darstellung erfordert
neben dem horizontalen und vertikalen Scheren des Zeichens auch noch
entsprechendes Pressen und Dehnen. So sind für eine einer Drehung
entsprechende Darstellung nach dem horizontalen Scheren erst ein horizontales
Pressen und vertikales Dehnen vor dem vertikalen Scheren erforderlich. Sofern
zuerst vertikal geschert wird, ist anschließend ein vertikales Pressen, dann ein
horizontales Dehnen und schließlich horizontales Scheren erforderlich. Diese
Vorgehensweise erfordert aber sehr viel Zeit. Erfindungsgemäß kann auf das
horizontale bzw. vertikale Pressen und Dehnen bei kleinen Winkeln verzichtet
werden. Im Normalfall wird erfindungsgemäß sowohl horizontal wie vertikal geschert.
Die optimale Reihenfolge richtet sich nach dem zu lesenden Schrifttyp. So wird bei
zu lesenden Handschriften die Erkennungsleistung am besten, wenn zunächst
vertikal und dann horizontal geschert wird. Bei Maschinenschriften ist es
vorzuziehen, zunächst horizontal und dann vertikal zu scheren. Sollen mit einer
Vorrichtung bzw. mit einem Verfahren sowohl Hand- wie Maschinenschriften gelesen
werden, ist es besonders vorteilhaft, zunächst horizontal und dann vertikal zu
scheren. Es kann auch ausreichend sein, eine einzige Scherung vorzunehmen. Es
ist weiterhin besonders vorteilhaft, die Werte von i x tan α bzw. j x tan α als
gerundete Integerwerte zu den Spalten- bzw. Zeilenindizes zu addieren. Der durch
die Stufung entstehende Fehler wirkt sich vor allem an den Rändern aus und
beeinträchtigt so die Erkennungsleistung kaum.
Vorteilhaft ist es auch, die gerundeten Werte von i x tan α bzw. j x tan α als gerundete
Werte für die auftretenden Winkelverdrehungen in einem Puffer zu speichern, so daß sie
nur noch zu den Zeilen- bzw. Spaltenindex-Werten hinzuaddiert werden müssen.
Die Erfindung wird anschließend anhand der Figuren näher erläutert.
Es zeigen:
Fig. 1 Ein vereinfachtes Rasterbild eines Buchstabens A mit Zeilen- und Spaltenindex.
Fig. 2 Eine Tabelle mit den zeilenweisen 0-1- und 1-0-Übergängen (Kantencode) des
Rasterbildes aus Fig. 1.
Fig. 3 Eine Tabelle mit den gerundeten i x tan o′ Werten für die entsprechenden Zeilen-
und Spaltenindizes.
Fig. 4 Eine Tabelle mit den Indexwerten der 0-1 und 1-0 Übergänge des horizontal
gescherten Buchstabens.
Fig. 5 Die Tabelle aus Fig. 4, überführt in einen Spaltenkantenpuffer.
Fig. 6 Den Spaltenkantenpuffer aus Fig. 5, vertikal geschert mit den Werten für die
Spaltenindizes aus Fig. 3.
Fig. 7 Das Binärrasterbild einer handgeschriebenen Ziffer 3.
Fig. 8 Das Binärrasterbild der Ziffer 3 aus Fig. 7, wenn diese um 20 Grad gedreht gelesen
wird.
Fig. 9 Das Bild aus Fig. 8 horizontal geschert.
Fig. 10 Das Bild aus Fig. 9 vertikal geschert.
In den Figuren bezeichnet Zi den Zeilenindex und Si den Spaltenindex, also die
Kennziffern der einzelnen Zeilen bzw. Spalten. Zunächst werden die 0-1- und 1-0-
Übergänge (Kantencode) festgestellt und in eine Tabelle eingetragen. In Fig. 2 ist dies für
die Übergänge der einzelnen Zeilen dargestellt. Ein Kantencode für die einzelnen Spalten
ist entsprechend darstellbar. Die Werte, die in der Tabelle in Fig. 3 dargestellt sind,
werden durch Rundung in ix tan α erhalten, wobei i den Abstand der einzelnen Zeilen
bzw. Spalten vom gedachten Drehpunkt und α den Winkel darstellt, um den gedreht
werden soll. Der Zeilenindex Zi bzw. Spaltenindex Si gilt im Beispiel für die gewünschte
Drehung um den Punkt mit Zi = 14 und Si = 0. Die Werte der einzelnen Spaltenindizes
aus Fig. 3 werden zu den Werten des Kantencodes aus Fig. 2 addiert. So wird der
Zeilenkantenpuffer in Fig. 4 erhalten. Diese Werte stellen den in
Fig. 1 gezeigten Buchstaben horizontal um den Winkel α geschert dar. Um nun eine
vertikale Scherung durchführen zu können, muß der Zeilenkantenpuffer aus Fig.4 in einen
Spaltenkantenpuffer überführt werden. Dies ist in Fig. 5 dargestellt. Die horizontalen und
vertikalen Indizes sind vertauscht. Man liest in Zeile 0 des Zeilenkantenpuffers in Fig. 5
die Einträge 0 und 1. Weiterhin liest man in Zeile 1 des Zeilenkantenpuffers die Werte 8
und 13. Damit ergeben sich im Spaltenkantenpuffer in den Zeilen 8 bis 12 die Einträge 1
und 2. Die bereits vorhandene 1 in den Zeilen 9 bis 11 zeigt an, daß ein 1-0 Übergang
verlängert wird. Daher wird die 1 gestrichen und durch eine 2 ersetzt. Wenn man
zeilenweise fortschreitet, ergibt sich das Schema in Fig. 5. Die durchgestrichenen Ziffern
zeigen Ersetzungen, also Kantenverlängerungen, an. Als Endergebnis erhält man den in
Fig. 6 dargestellten Spaltenkantenpuffer. Nun kann vertikal geschert werden, indem zu
den Werten des Spaltenkantenpuffers in Fig. 6 die entsprechenden Werte der
Spaltenindizes in Fig. 3 addiert werden.
Die Fig. 8 bis 10 zeigen anschaulich die hohe Qualität des erfindungsgemäßen
Verfahrens. In Fig. 8 ist eine um minus 20 Grad gedrehte handgeschriebene 3 im
Binärrasterbild dargestellt. In Fig. 9 ist dieses Rasterbild um plus 20 Grad horizontal
geschert. In Fig. 10 ist das Bild aus Fig. 9 schließlich um plus 20 Grad vertikal geschert.
Der Vergleich des horizontal und vertikal gescherten Rasterbildes in Fig. 10 mit dem
Rasterbild der nicht verdrehten Ziffer in Fig. 7 zeigt eine gute Übereinstimmung zwischen
den beiden Darstellungen. Die "unruhigeren" Ränder der Ziffer beeinträchtigen die
Erkennbarkeit in der Lesevorrichtung nicht.
Claims (5)
1. Verfahren zum maschinellen Lesen von Schriften, bei denen eine Schräg
lagenkorrektur durchzuführen ist, bei dem die Schräglagenkorrektur durch ein
horizontales und/oder vertikales Scheren der Zeichen, Schriftzeilen oder
Schriftfelder erfolgt und bei dem
eine horizontale Scherung zeilenweise erfolgt wobei die Werte von j x tan α als gerundete Integerwerte zu den Spaltenindezes Si der schwarzen Pixel addiert werden, und bei denen eine vertikale Scherung spaltenweise erfolgt wobei die Werte von k x tan α als gerundete Integerwerte zu den Zeilenindizes (Zi) der schwarzen Pixel addiert werden, wobei j den Abstand der jeweiligen Zeile von dem gedachten Drehpunkt, k den Abstand der jeweiligen Spalte von dem gedachten Drehpunkt und α den Winkel darstellt, um den die Schräglagenkorrektur durchgeführt werden soll,
dadurch gekennzeichnet, daß das Verfahren einen Zeilenkantenpuffer bzw. Spaltenkantenpuffer anlegt und verwaltet, der nur die Indexwerte der 0-1 - und 1-0- Übergänge enthält,
daß nur diese Indexwerte geschert werden und daß anschließend die Zwischenräume zwischen den gescherten 0-1- und 1-0-Übergängen mit schwarzen Pixeln ausgefüllt werden.
eine horizontale Scherung zeilenweise erfolgt wobei die Werte von j x tan α als gerundete Integerwerte zu den Spaltenindezes Si der schwarzen Pixel addiert werden, und bei denen eine vertikale Scherung spaltenweise erfolgt wobei die Werte von k x tan α als gerundete Integerwerte zu den Zeilenindizes (Zi) der schwarzen Pixel addiert werden, wobei j den Abstand der jeweiligen Zeile von dem gedachten Drehpunkt, k den Abstand der jeweiligen Spalte von dem gedachten Drehpunkt und α den Winkel darstellt, um den die Schräglagenkorrektur durchgeführt werden soll,
dadurch gekennzeichnet, daß das Verfahren einen Zeilenkantenpuffer bzw. Spaltenkantenpuffer anlegt und verwaltet, der nur die Indexwerte der 0-1 - und 1-0- Übergänge enthält,
daß nur diese Indexwerte geschert werden und daß anschließend die Zwischenräume zwischen den gescherten 0-1- und 1-0-Übergängen mit schwarzen Pixeln ausgefüllt werden.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Werte von j x tan α
und k x tan α als gerundete Werte in einem Puffer gespeichert vorliegen und zu
den Spaltenindezes (Si) bzw. Zeilenindizes (Zi) addiert werden.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß
Zeilenkantenpuffer in entsprechende Spaltenkantenpuffer überführt werden, derart,
daß die horizontalen und vertikalen Indizes vertauscht werden und anschließend
die Einträge m₁ - mn in Zeile no des Zeilenkantenpuffers, entsprechend in Zeile m₁ -
mn-1 die Einträge no und n₁ eingetragen werden und bei den folgenden Zeilen
entsprechend verfahren wird,
daß ein Eintrag (n₁ - nn) gestrichten wird, sofern ein Eintrag mit dem gleichen Index nochmals in dieselbe Zeile des Spaltenkantenpuffers nach der vorstehenden Handlungsweisung einzutragen ist.
daß ein Eintrag (n₁ - nn) gestrichten wird, sofern ein Eintrag mit dem gleichen Index nochmals in dieselbe Zeile des Spaltenkantenpuffers nach der vorstehenden Handlungsweisung einzutragen ist.
4. Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, daß das
Verfahren zuerst eine horizontale und dann eine vertikale Scherung der Zeichen,
Schriftzeichen oder Schriftfelder durchführt.
5. Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, daß das
Verfahren zuerst eine vertikale und dann eine horizontale Scherung der Zeichen,
Schriftzeichen oder Schriftfelder ausführt.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19508203A DE19508203C2 (de) | 1995-03-08 | 1995-03-08 | Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von Schriften |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19508203A DE19508203C2 (de) | 1995-03-08 | 1995-03-08 | Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von Schriften |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19508203A1 DE19508203A1 (de) | 1996-09-12 |
DE19508203C2 true DE19508203C2 (de) | 1997-02-13 |
Family
ID=7756023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19508203A Expired - Fee Related DE19508203C2 (de) | 1995-03-08 | 1995-03-08 | Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von Schriften |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19508203C2 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1450295B2 (de) † | 2003-02-19 | 2011-02-23 | Solystic | Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6418187A (en) * | 1987-07-13 | 1989-01-20 | Sharp Kk | Pseudo font input system |
JPH02287684A (ja) * | 1989-04-28 | 1990-11-27 | Ibm Japan Ltd | イメージ処理装置および方法 |
-
1995
- 1995-03-08 DE DE19508203A patent/DE19508203C2/de not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1450295B2 (de) † | 2003-02-19 | 2011-02-23 | Solystic | Verfahren zur optischen Erkennung von Postsendungen mittels mehrfacher Binarisierung |
Also Published As
Publication number | Publication date |
---|---|
DE19508203A1 (de) | 1996-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0131676B1 (de) | Verfahren zum automatischen Digitalisieren des Umrisses von Strichgraphiken z.B. Buchstaben | |
DE3419063C2 (de) | ||
DE69302003T2 (de) | Dateneingabeanlage | |
DE3689416T2 (de) | Mustermerkmalextraktion. | |
EP0980293B1 (de) | Verfahren und anordnung zum erkennen von verteilinformationen | |
DE68915006T2 (de) | System zum Generieren von Musterdaten. | |
DE3716787C2 (de) | ||
DE69022784T2 (de) | Verfahren und Systeme zur Unterschriftprüfung mit Optimierung statischer Parameter. | |
DE60204005T2 (de) | Verfahren und einrichtung zur erkennung eines handschriftlichen musters | |
DE69029594T2 (de) | Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument | |
DE19646522C2 (de) | Verfahren und Vorrichtung zur Erkennung von Verteilinformationen auf Sendungen | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE2410306C3 (de) | Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen | |
EP0301384B1 (de) | Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen | |
EP0125266B1 (de) | Verfahren und vorrichtung zum identifizieren von gegenständen | |
DE19508203C2 (de) | Verfahren zur Schräglagenkorrektur bei maschinellem Lesen von Schriften | |
EP0903723A2 (de) | Anzeigevorrichtung mit und ohne Antialiasing | |
EP0304509B1 (de) | Bildschirmgerät zur Textdarstellung | |
DE2254913A1 (de) | Verfahren zur erzeugung graphischer darstellungen aus parametrischen daten | |
DE69127173T2 (de) | Abbildungsaufzeichnungsvorrichtung für Bilder hoher Qualität | |
DE3229590A1 (de) | Verfahren und anordnung zum bedrucken von formularen | |
DE19605261A1 (de) | Overheadprojektor-Vorrichtung, sowie Steuerverfahren hierfür | |
DE102018126212A1 (de) | Verfahren zur Ausrichtung einer Kamera nach ihren extrinsischen Parametern | |
DE1281726B (de) | Verfahren und Einrichtung zur maschinellen Zeichenerkennung | |
DE19522394C2 (de) | Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
D2 | Grant after examination | ||
8364 | No opposition during term of opposition | ||
8327 | Change in the person/name/address of the patent owner |
Owner name: SIEMENS AG, 80333 MUENCHEN, DE |
|
8339 | Ceased/non-payment of the annual fee |