DD297527A5

DD297527A5 - Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb

Info

Publication number: DD297527A5
Application number: DD34362590A
Authority: DD
Inventors: Hans-Joachim Roethe
Original assignee: Deutsche Post Zentrum Fuer Postdienste,De
Priority date: 1990-08-24
Filing date: 1990-08-24
Publication date: 1992-01-09

Abstract

Verfahren zur groeszenunabhaengigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen im Echtzeitbetrieb. Aufgabe der Erfindung ist es, bei reduziertem zeitlichen und technischen Aufwand im Echtzeitbetrieb eine Zeichenerkennung auf Dokumenten, insbesondere von Postleitzahlen, zu ermoeglichen. Erfindungsgemaesz wird die Aufgabe geloest durch ein Verfahren, dasz dadurch gekennzeichnet ist, dasz eine Kombination einer effektiven zeitbegrenzten Skelettierung durch Nachbarschaftsrelationen (NBR) und indirekte NBR in zwei jeweils rekursiven Arbeitsschritten, mit einer formalisierten Linienverfolgung und Klassifizierung nach Methoden der kuenstlichen Intelligenz erfolgt, wobei die Merkmale zeichen- und nicht zeichenklassenbezogen ausgewertet werden. Fig. 7{Zeichenerkennung, groeszenunabhaengig; Zeichen, handgeschrieben, maschinengeschrieben; Postleitzahl, alphanumerisch; Skelettierung; Linienverfolgung}

Description

Hierzu 7 Seiten Zeichnungen

Anwendungsgebiet der Erfindung

Gegenstand der Erfindung ist ein Verfahren zur Erkennung von alphanumerischen hand- und/oder maschinengeschriebenen Zeichen in Echtzeit, wobei an diesen Zeichen keine Größennormierung vorgenommen werden muß. Dieses Verfahren kann vorzugsweise für die Echtzeitauswertung von Belegen mit hand- und/oder maschinengeschriebenen Zeichen in vorgegebenen Erwartungszonen, wie zum Beispiel Kennungen auf Dokumenten oder Postleitzahlen auf Briefsendungen, mittels stationärer oder nichtstationärer Vorrichtungen angewendet werden.

Charakteristik des bekannten Standes der Technik

Bei den bekannten Leseeinrichtungen haben die unterschiedlichsten Randbedingungen zu folgendem Kompromiß geführt: Verwendung möglichst einfacher Klassifikationsverfahren, die relativ geringe Verarbeitungszeiten für ein Zeichen benötigen, wodurch aber sowohl die Erkennungssicherheit als auch der Zeichenvorrat auf Varianten innerhalb einer Zeichenklasse beschränkt bleiben

In der Regel führen die bekannten Verfahren zur Zeichenerkennung folgende 4 Arbeitsgänge durch:

1. Gewinnung elektrischer Signale, die die Zeichen codiert darstellen,

2. Isolierung einzelner Zeichen,

3. Analyse der Signale zur Ermittlung von Merkmalen eines Zeichens,

4. Bestimmung der Zeichenklasse anhand der ermittelten Merkmale.

Die Erkennung beruht auf dem Vorhandensein von intuitiv oder automatisch approximativ, aber keinesfalls wirklich schlüssig ausgewählten Merkmalen, die unabhängig voneinander identifiziert werden. Notwendig ist jedoch die Kombination der Merkmale, um eine sichere Identifikation zu ermöglichen. Dazu muß das Zeichen in abhängiger Folge von Merkmalen codiert werden. So kann der oben genannte Nachteil zumindest teilweise ausgeglichen werden. Die Erfindung betrifft die Punkte 3 und 4.

Es sind folgende Quellen aus dem Fonds der Patentschriften, bekannt: DE 2007577, Anordnung zur Erkennung von Schriftzeichen

- Erkennung von Schriftzeichen durch die Extraktion von Formelementen, dadurch vereinfacht und optimiert, daß benachbarte Flächen eines gefundenen Fo,, nelementes bewertet (Erwartungswerte) und unter Umständen sogar modifiziert (Phasenverschoben - gedreht) untersucht werden. Die Klassifikation erfolgt dann durch Serienschaltungen, die über Verzögerungsleitungen und Zeitsteuerkurven während eines sogenannten Arbeitsspieles mehrere unterschiedliche Erkennungsversuche durchführen.

Dabei bleibt jedoch als Mangel offen, daß durch Schwellwertbetrachtungen und dem Vergleich mit einer begrenzten Zahl von repräsentativen Ergebniskurven zu jeder Zeichenklasse die Erkennungssicherheit leidet. Die Möglichkeit durch eine deutliche Steigerung der Menge der Vergleichskurven, auf die Menge, die der Anzahl von Zeichentypen aller Zeichenklassen zusammengenommen entspricht, zu kommen, wäre technisch sehr aufwendig und würde die Echtzeitfähigkeit aufheben.

DE 24 59427, Anordnung zum Skelettieren von Zeichen

- Systematische Skelettierung über (direkte) Nachbarschaftsbeziehungen (NBR) relativ funktionsfolgenunabhängig durch Auswertung von Positionsdaten, Sammlung von Beispielinformationen (60), inversiertor Operatorfigur von höchstens 13 Positionen. Das Skelett wird bei Verwendung symmetrischer Operatoren (4 Lagen) oder asymmetrischen, einfachen und zusammengesetzten Operatoren unterbrechungsfrei und auslassungsarm. Dabei bleiben jedoch folgende Mängel offen:

- zu hoher technischer und zeitlicher Aufwand durch die hohe Anzahl von Beispielinformationen sowie die Abarbeitung mittels eines unbewerteten Flächenalgorythmusses um kosten- und ausreichend zeitgünstig (echtzeitgerecht) zu bleiben

- Ausfransen der Ränder und damit einer Merkmalsverwischung sowie möglicher Anstrichauflösungen mit der Folge sinkender Erkennungssicherheit.

DE 2817341, Optisches Handlesegerät für maschinelle Zeichenerkennung

- Nichtlineares Klassifikatorverfahren mit auswechselbaren Klassifikatoren und Berechnung durch Vektormultiplikation des Zeichenvektors mit auswechselbaren klassenspezifischen Koeffizientenvektoren.

- Dabei jedoch durch die vollständige Berechnung der Vektoren und die Multiplikation mit allen klassenspezifischen Koeffizientenvektoren folgende Mängel offen lassend:

zu hoher technischer und zeitlicher Aufwand durch die Berechnung aller Merkmale und deren vollständige Vektormultiplikation ohne Wichtung und Begrenzung auf die relevanten Merkmale und deren Verknüpfungen.

DE 3247832, Einrichtung zur gestuften Erkennung von Zeichen, Mustern oder dgl.

- Kaskadierte Herauslösung von jeweils einer Zeichenklasse, wobei die Erweiterbarkeit um weitere Zeichenklassen relativ unaufwendig (eine weitere Ebene) möglich wird,

- jedoch bleiben folgende Mängel offen:

mangelnde Echtzeitfähigkeit, da die Reaktionszeit vom ungünstigsten Fall in der Stufenhierarchie ausgehen muß.

DE 3425449, Klassifizierung durch Bewertung des Randlinienverlaufes

- Erkennung von Schriftzeichen sowohl durch Vorhandensein von bestätigenden Merkmalen, die für eine Zeichenklasse typisch sind, als auch durch Nachweisbarkeit von Unterschiede kennzeichnenden Merkmalen, die in einer Zeichenklasse nicht auftreten können, also in jedem Fall klassenbezogenen Merkmalen, die nach einer gestuften Hierarchie klassenweise abgearbeitet werden.

Dabei bleiben jedoch folgende Mangel offen:

- Erkennungsunschärfe, da als Linie verstandene Objekte als Flächen interpretiert werden, und die Steigerung des technischen und zeitlichen Aufwandes, da die Menge der Informationen sich dabei etwa verdoppelt, ohne deren Substanz zu erhöhen.

- Verwischung von Merkmalen, und damit Reduzierung der Erkennungssicherheit, durch die Unscharfe der Randlinien insbesondere bzgl. der Erkennbarkeit von Entstehungsreihenfolge, der Trennbarkeit von Berührungs- und Schnittpunkten sowie der logischen Richtung von Linienenden (Haken).

EP 03399, Mustererkennungssystem

- Klassifizierung durch Filterung {Auswahl und Wichtung) der Merkmale und Anpassung der Filter sowie dem Vergleich mit Standardabbildwerten. Dabei sind eine dynamisch anpaßbare Genauigkeit sowie eine dynamische Filtermodifizierung durch Wichtungsmodifikation möglich.

Dabei bleiben jedoch folgende Mängel offen:

- mangelnde Erkennungssicherheit durch den Bezug auf eine begrenzte Anzahl von Standardbildern, die der Formenvielfalt nicht angemessen sein können,

- Verlust der Echtzeitfähigkeit bei wesentlicher Erweiterung der Anzahl von Standardbildern,

- hohor.Aufwand, um alle Merkmale zu berechnen und diese dann auch noch mit allen Standardwerten zu vergleichen.

Ziel der Erfindung

Ziel der Erfindung ist die Angabe eines Verfahrens zur Erkennung hand- oder maschinengeschriebener Zeichen, bei dem eine Skelettierung der zu erkennenden Zeichen vorgenommen wird, die gegenüber dem bekannten Stand der Technik eine Einsparung der üblichen Größennormierung und eine reduzierte Anzahl von Testschritten ermöglicht und bei der eine Klassifikation der zu erkennenden Zoichen vorgenommen wird, die durch ihre neuartige Merkmalsauswahl die Erkennungssicherheit verbessert.

Darlegung des Wesens der Erfindung

Die Aufgabe der Erfindung besteht in der Angabe eines Verfahrens, das es gestattet, hand- oder maschinengeschriebene Zeichen zu erkennen, wobei eine Reduzierung des technischen und zeitlichen Aufwandes derart angestrebt wird, daß die Forderung nach Echtzeitverarbeitung erfüllt werden kann, wobei die Erkennungssicherheit die des Menschen erreichen soll. Eine Lernfähigkeit des Systems soll eine dynamische Anpassung an einsatztypische Formen der Zeichen und einsatzortabhängige Formenauswahl ermöglichen.

Der Widerspruch zwischen Zeichenklassenzahl und Erkennungszeit einerseits und Erkennungsrate anderseits und zwischen Erkennungsrate einerseits und Fehlerrate anderseits soll weitestgehend aufgelöst werden. Dabei sollen insbesondere folgende Mängel beseitigt werden:

Unzureichende Erkennungsraten sollen

- durch verlustfreiere Extraktion der Merkmale verbessert werden,

- durch den Übergang der Bewertung von zeichenklassentypischen Merkmalen zu den Merkmalen typischer Vertreter einer Zeichenklasse verringert und

- durch eine verbesserte Trennfunktion zwischen den Vertretern eines Types von Zeichen einer Zeichenklasse zu ähnlichen Typen von Zeichen einer anderen Zeichenklasse verbessert werden.

Die unerwünscht hohe Reaktionszeit

- soll durch ein mehrstufiges räumlich abhängig bewertetes Skelettierungsverfahren reduziert und

- durch eine zeichenbezogene zeitlich und räumlich bewertete dynamische Interpretation der vorkonzentrierten Merkmale gering gehalten werden und dadurch,

- daß dabei tatsächlich nur die Merkmale berechnet werden, die notwendig sind, um den speziellen Typ dieses Zeichen einer Zeichenklasse von ähnlichen Typen anderer Zeichenklassen zu trennen.

Erfindungsgemäß wird die Aufgabe gelöst durch ein Verfahren, das dadurch gekennzeichnet ist, daß eine Kombination einer effektiven, zeitbegrenzten Skelettierung durch Nachbarschaftsrelationen (NBR) und indirekte NBR in zwei jeweils rekursiven Arbeitsschritten, mit einer formalisierten Linienverfolgung und Klassifizierung nach Methoden der künstlichen Intelligenz, d. h. eines lernenden Systems erfolgt, wobei die Merkmale zeichen- und nicht zeichenklassenbezogen ausgewertet werden. Das Verfahren zur größenunabhängigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen in Echtzeitbetrieb unter Verwendung der an sich bekannten Prinzipien der Skelettierung, der Linienverfolgung und der Merkmalsklassifikation abgetasteter Zeichen ist dadurch gekennzeichnet, daß

- in einem ersten Verfahrensschritt das digitalisierte Abbild des abgetasteten und isolierten Zeichens matrixförmig abgespeichert wird, wobei das Zeichen in der Regel links- und obenbündig in der Matrix angeordnet wird,

- daß in einem zweiten Schritt eine Reduzierung des Bildausschnittes derart erfolgt, daß seitenweise umlaufend zuerst der das Zeichen umgebende weiße Rand durch spalten- bzw. zeilenweises Testen bestimmt und dezimiert wird und danach mit an sich bekannten Mitteln eine Verdünnung der Ränder des Zeichens parallel zu den Rändern der Matrix erfolgt, solange alle gesetzten Punkte einer Reihe ohne die Erzeugung von Aufrissen oder Auflösung von Linien gelöscht werden, wobei Punkt für Punkt, aber mit Rückschrittmöglichkeit untersucht wird, ob eine NBR aus einer hierfür Seiten- und lageabhängig vorgegebenen Menge von NBR zum Setzen oder Löschen eines Punktes angewendet werden kann,

- daß in einem dritten Schritt in an sich bekannter Weise ein Raster über das verbliebene Abbild gelegt wird, so daß das verbleibende Teil der Matrix mit Ausnahme des Randes in vier gleichverteilte, disjunkte Teilmengen zerlegt wird,

- daß in einem vierten Schritt jeder Punkt dieser 4 Teilmengen nacheinander in an sich bekannter Weise systematisch und vollständig dahingehend untersucht wird, ob eine NBR aus einer hierfür vorgegebenen Menge von NBR vorhanden ist und bei Vorhandensein einer NBR gemäß dieser NBR der jeweilige Punkt gelöscht, gesetzt oder bei Vorhandensein einer indirekten NBR (INBR) verschoben wird,

daß in einem fünften Schritt spiralförmig mit Rückschrittmöglichkeit eine erneute punktweise Untersuchung des Randes derverbliebenen Matrix erfolgt, wobei eine dritte Teilmenge von NBR zuzüglicher einer Menge von NBR zum Löschen und

Verschieben zugrunde gelegt v*'ird, um eine weitere Reduzierung der Bildmatrix und eine Glättung der Randlinien des Abbildes

zu erreichen,

daß die Schritte drei bis fünf solange zyklisch wiederholt werden, bis kein Punkt mehr verändert werden kann, d. h. bis ein

Skelett vorliegt,

daß in einem sechsten Verfahrensschritt eine Linienverfolgung vorgenommen wird, bei der das Skelett eines Zeichens in einoder mehrere Komponenten zerlegt wird, und wobei unter einer Komponente ein linearer, unverzweigter Bestandteil eines

Skeletts zu verstehen ist, wobei ausgehend von dem in der obersten Zeile der Matrix am weitesten links stehenden Punkt der

jeweils nächste Punkt bestimmt wird, indem zuerst die orthogonalen Nachbarn, rechts beginnend, dann die diagonalen

Nachbarn, im Uhrzeigersinn umlautend, abgetastet werden und daß der in dieser Folge jeweils zuerst gefundene Punkt auf das Vorhandensein mehrerer Merkmale analysiert wird, solange bis die Komponente ohne Verzweigung oder Unterbrechung

nicht mehr erweiterbar ist, worauf falls noch vorhanden, ein Punkt gesucht wird, der noch nicht in den bisher erfaßten

Komponenten enthalten ist, der zum Ausgangspunkt der nächsten Komponente genommen wird, die analog erfaßt wird

daß in einem siebenten Verfahrensschritt, ausgehend vom Vorhandensein sein oder NichtVorhandensein von Merkmalen der

Zeichen, mit einem optimierten erweiterbaron Entscheidungsgraphen eine Einteilung in Subklassen vorgenommen wird,

wobei aus der Lage jedes Hakens oder Schnittpunktes, in bezug auf den Mittelpunkt des Schwärzungsgebietes bzw. in Relationzu seinen Rändern Informationen gewonnen werden können und daß aus der Lage, auf dem Rand, in der Nähe des Randes,innerhalb welches Quadranten, oben oder unten, rechts oder links, zur Mitte bzgl. der x- oder y-Achse sowie aus der Distanzzwischen Anfangs- und Endpunkten der gleichen oder verschiedener Komponenten bzw. Schnittpunkte, aus den bei der

Linienverfolgung ermittelten Werten und der Reihenfolge der Erfassung der Komponenten und Schnittpunkte Informationen

gewonnen werden.

daß in einem achten Verfahrensschritt die Subklassen den Zeichenklassen zugeordnet werden, wobei Subklassen die nur

Zeichen einer Zeichenklasse enthalten dieser Zeichenklasse zugeordnet werden, Subklassen denen Elemente mehrerer Zeichenklassen zugeordnet werden, zu denen es optisch keine signifikant zuverlässigen Trennmerkmale gibt, als nicht

klassifizierbar rückgewiesen werden, nichtklassifizierbare Subklassen aus Elementen zweier oder mehrerer Zeichenklassenbestehen können, wobei diese Zeichenklassengruppe ebenfalls ein verwertbares, da sicheres wenn auch allgemeineres

Erkennungsergebnis darstellt. Da die Subklassen einen Wahrscheinlichkeitsanteil an der Gesamtmenge haben, wird bei sehr

großen Anteilsunterschieden der einzelnen Zeichenklassen in dieser Zeichenklassengruppe und geringem

Wahrscheinlichkeitsanteil der Subklasse selbst, die eigentlich nichtklassifizierbare Subklasse der überwiegenden Zeichenklasse zugeordnet, wenn dadurch der Grenzwert der Fehlerrate deutlich unterschritten bleibt. Die wesentliche Qualität des Algorithmus wird durch die Auswahlfolge der Tests erreicht, wobei

die bewußte Auswahl der Punktfolge bei der Linienverfolgung insbesondere der Anfangswerte für die einzelnen Komponenten

Rückschlüsse auf die Aufzeichnungsfolge und damit unter anderem Anhaltspunkte für die Unterscheidung Berührung bzw. Schnittpunkte gestattet,

die Reihenfolge der Erfassung der Komponenten und Schnittpunkte Rückschlüsse auf die Aufzeichnungsfolge und damit aufdie Semantik des Zeichens gestattet,

die Mischung von räumlicher Varianz und Invarianz z. B. „Links oben" oder „auf Ecke links oben" es gestatten, sowohl

Formenvielfalt als auch prägnante Merkmale zu erfassen,

benutzt wird, daß die Trennbarkeit von einzelnen Zeichenvarianten einer Zeichenklasse zu ähnlichen Zeichenvarianten eineranderen Zeichenklasse (potentielle Fehlergruppen) wesentlich höher ist als die der gesamten Zeichenklassen voneinander,jede Ebene des Entscheidungsbaumes eine weitere Dimension darstellt, so daß damit eine mathematische

Beschreibungsfunktion (n * m + 1 )-ten Grades ausgedrückt wird, wobei η die Anzahl der Teste die maximal in einem Test

verknüpften Punkte und Relationen ist und sie zusätzlich die Aufzeichnungsfolge als Funktion der Aufzeichnungszeit einbringt,so daß

das wesentliche Problem der Echtzeitfähigkeit der automatisierten Lösung, daß der Lösungsaufwand und die Lösungsmengeexponential zum Grad der Verknüpfung von Punkten (Merkmalmalen) steigt, lösbar wirddie geringe Vergrößerung des zeitlichen Aufwandes (1 + 1/n wobei η die maximale Anzahl ausgewerteter Merkmale ist unddie Anzahl möglicher Subklassen 2«»n) bei der Verdoppelung der Zahl der Subklassen und damit Erhöhung der Trennschärfe,die Sicherung einer geringen Fehlerrate ermöglicht

von den etwa 200 verschiedenen komplexen, den 4 linearen Merkmalen und den 5 Summenzählern lediglich η (η ä Anzahl der

Zeichenklassen, η = 5) gebildet werden müssen, wodurch 2**n zeichenabhängig vorausgewählte Subklassen gebildet

werden können

im Falle zu großer oder ansteigender Fehlerzahl durch Erweiterung des Zeichentypenspektrums oder örtlicher Varianz durch

Nachhilfeunterricht zur Erweiterung der Subklassen und Neuoptimierung des Entscheidungsbaumes mit minimaler Erhöhung

des Aufwandes die Fehlerrate wieder begrenzt werden kann,

die Klasse der Abweisungen bei ausreichend hoher Lernrate (nach Literaturangaben ca. pro Klasse eine Menge von ca.

3*fache Anzahl möglicher Kombinationen unabhängiger Testzeichen) in der gleichen Größenordnung wie beim Menschenliegen,

Subklassen denen Elemente mehrerer Zeichenklassen zugeordnet werden, durch weitere Merkmalsunterschiede

(Trennfunktion gemäß der Zeichenklassentrennung) in zwei weitere Subklassen zerlegt werden, der Lernprozeß bis zu einerausreichend hohen Erkennung und ausreichend geringen Fehlerrate, erfolgen kann.

Ausführungsbeispiel Am nachstehenden Ausführungsbeispiel soll die Erfindung näher erläutert werden. In Figur 1 ist das binär codierte Eingangsbild gemäß Arbeitsschritt 1 dargestellt. In Figur 2.1 sind durch den Verfahrensschritt 2 Teil 1, Reduzierung von rechts, löschbaren Punkte durch einen Kreis

gekennzeichnet.

In Figur 2.2 ist das Ergebnis der Reduzierung der Matrix gemäß Vurfahrensschritt 2 Teil 1, Reduzierung von rechts, dargestellt,

gleichzeitig sind die im Verfahrensschritt 2 Teil 2 zu löschenden Punkte, Reduzierung von unten, durch Kreise gekennzeichnet.

In Figur 2.3 ist das Ergebnis das Verfahrensschrittes 2 Teil 2, Reduzierung von unten, dargestellt, gleichzeitig sind die in Verfahrensschritt 2 Teil 3 zu löschenden Punkte, Reduzierung von links, durch Kreise gekennzeichnet. In Figur 2.4 ist das Ergebnis des Verfahrensschritts 2 Teil 3, Reduzierung von links, dargestellt, gleichzeitig sind die im Verfahrensschritt 2 Teil 4 zu löschenden Punkte, Reduzierung von oben, durch Kreise gekennzeichnet. In Figur 2 ist das Ergebnis des Verfahrensschrittes 2 dargestellt. In den Figuren 3.1 ...3.4 wird die Einteilung in die 4 Teilmengen für den verbleibenden Matrixrest, in die Teilmengen a, b, c, d,

gemäß Verfahrensschritt 3 dargestellt.

In Figur4.1 werden die gemäß Verfahrensschritt 4 Teil 1, Reduzierung der in derTeilmenge a enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4.2 ist das Ergebnis des Verfahrensschrittes 4 Teil 1 dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 2, Reduzierung der in der Teilmenge b enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4.3 ist das Ergebnis des Verfahrensschrittes 4 Teil ? dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 3, Reduzierung der in der Teilmenge c enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4.4 ist das Ergebnis des Verfahrensschrittes 4 Teil 3 dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 2, Reduzierung der in der Teilmenge d enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4 ist das Ergebnis des Verfahrensschrittes 4 Teil 4 dargestellt. In Figur 5.1 ist die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 1, spiralförmiger Randumlauf, rechte Seite, gelöscht oder verschoben werden können. In Figur 5.2 ist das Ergebnis des Verfahrensschrittes 5 Teil 1 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 2, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5.3 ist das Ergebnis des Verfahrensschrittes 5 Teil 2 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 3, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5.4 ist das Ergebnis des Verfahrensschrittes 5 Teil 3 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 4, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5 ist das Ergebnis des Verfahrensschritts 5 dargestellt. Da im Durchlauf (4. und 5.Verfahrensschritt) Reduzierungen

vorgenommen werden konnten, erfolgt eine Wiederholung der Verfahrensschritte 4 und 5. In Figur 4.1 a werden die gemäß

Verfahrensschritt 4 Teil 1, Reduzierung der in derTeilmenge a enthaltenen Punkte, zu löschenden Punkte durch Kreise

gekennzeichnet.

In Figur 4.2 a ist das Ergebnis des Verfahrensschrittes 4 Teil 1 dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 2, Reduzierung der in der Teilmenge b enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4.3 a ist das Ergebnis des Verfahrensschrittes 4 Teil 2 dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 3, Reduzierung der in der Teilmenge c enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4.4a ist das Ergebnis des Verfahrensschrittes 4 Teil 3 dargestellt, gleichzeitig sind die im Verfahrensschritt 4 Teil 2, Reduzierung der in der Teilmenge d enthaltenen Punkte, zu löschenden Punkte durch Kreise gekennzeichnet. In Figur 4 a ist das Ergebnis des Verfahrensschritte·.; 4 Teil 4 dargestellt. In Figur 5.1 a ist die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 1, spiralförmiger Randumlauf, rechte Seite, gelöscht oder verschoben werden können. In Figur 5.2 a ist das Ergebnis des Verfahrensschrittes 5 Teil 1 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 2, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5.3 a ist das Ergebnis des Verfahrensschrittes 5 Teil 2 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 3, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5.4 a ist das Ergebnis des Verfahrensschrittes 5 Teil 3 dargestellt und die Menge von Punkten gekennzeichnet, die im Verfahrensschritt 5 Teil 4, spiralförmiger Randumlauf, untere Seite, gelöscht oder verschoben werden können. In Figur 5a ist das Ergebnis des Verfahrensschritts 5 dargestellt. Da die Wiederholung der Verfahrensschritte 4 und 5 keine

weitere Reduzierung brachte (nur 2 Verschiebungen) wird die Skelettierung jetzt abgebrochen. Damit stellt Figur 8 das Ergebnisder Skelettierung dar.

Im sechsten Verfahrensschritt wird zuerst der Anfangspunkt für die Linienverfolgung bestimmt. Aus dem Algorithmus ergibt

sich der in Figur 6 markierte Punkt als Punkt 1 der Komponente 1.

Dieser besitzt 2 orthogonale Nachbarn, einen rechts, einen unten. Nach dem Verfahren wird der rechte orthogonale Nachbar als Punkt 2 Komponente 1 gewählt. Die Anzahl der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung

des Nachfolgers wird rechts.

Der Punkt 2 Komponente 1 besitzt wiederum 2 Nachbarn, einen link, einen rechts. Nach dem Verfahrensalgorithmus wird der rechte Nachbar, der nicht der Vorgänger ist, als Punkt 3 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Der Punkt 3 der Komponente 1 besitzt wiederum 2 Nachbarn, einen links, einen rechts. Nach dem Verfahrensalgorithmus wird

der rechte Nachbar der nicht der Vorgänger ist, als Punkt 4 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingenpeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich

zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung.

Der Punkt 4 der Komponente 1 besitzt wiederum 2 Nachbarn, einen links, einen rechts. Nach dem Verfahrensalgorithmus wird

der rechte Nachbar der nicht als Vorgänger ist, als Punkt 5 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich

Der Punkt 5 der Komponente 1 besitzt wiederum 2 Nachbarn, einen links, einen rechts. Nach dem Verfahrensalgorithmus wird

der rechte Nachbar der nicht der Vorgänger ist, als Punkt 6 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich

zwischen dem ersten und dem aktuellen Punkt der Komponente erbibt keine Übereinstimmung.

Der Punkt 6 der Komponente 1 besitzt genau einen linken Nachbarn. Da die Anzahl der orthogonalen Nachbarn 1 ist, wird geprüft,

ob diagonale Nachbarn existieren. Da das nicht der Fall ist, wird er als Haken registriert und die Komponente gewendet d. h.

durch Umpufferung wird der Punkt 1 zum Punkt 6 der Komponente 1 und der Punkt 6 zum Punkt 1 der Komponente, wird der

Punkt 2 zum Punkt 5 der Komponente 1 und analog Punkt 5 zu Punkt 2, wird der Punkt 3 zum Punkt 4 der Komponente 1 und

analog Punkt 4 zu Punkt 3. Es wird ein rechtes Maximum registriert, die Nachfolgerichtung wird links.

Punkt 6 der Komponente 1 ist jetzt der ursprüngliche Anfangspunkt, der 2 Nachbarschaftspunkte, einen rechten, einen unteren,

besitzt. Der rechte Nachbarpunkt würde als erster Fortsetzungspunkt ausgewählt. Da er jedoch der Vorgänger in der Komponenteist, wird er abgewiesen und der untere Punkt als Fortsetzungspunkt Punkt 7 der Komponente 1 gewählt. Die Anzahl der Nachbarnwird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich.

Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Der Punkt 7 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen oben, einen unten. Nach dem Verfahrensalgorithmus wird

der untere Punkt, der nicht der Vorgänger ist, als Punkt 8 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich

zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 9 und10 der Komponente 1 erfaßt: Der Punkt 7 der Kompor.ante 1 besitzt 2 orthogonale Nachbarn, einen oben, einen unten. Nach dem

Verfahrensalgorithmus wird der untere Punkt, der nic.it der Vorgänger ist, als Punkt 8 der Komponente 1 bestimmt. Die Anzahl

der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich.

Ein Koordinatenvargleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 9,10 und 11 der Komponente 1 erfaßt. Der Punkt 11 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen oben, einen rechts. Nach dem Verfahrensalgorithmus

wird der rechte Punkt, der nicht der Vorgänger ist, als Punkt 12 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers wird rechts. Es wird ein linkes Maximumregistriert. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine

Übereinstimmung. Der Punkt 12 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen links, einen rechts. Nach dem Verfahrensalgorithmus wird

der rechte Punkt, der nicht der Vorgänger ist, als Punkt 13 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleichzwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 14,15 und 16 der Komponente 1 erfaßt.

Der Punkt 16 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen links, einen unten. Nach dem Verfahrensalgorithmus wird

der untere Punkt, der nicht der Vorgänger ist, als Punkt 17 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleichzwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung.

Der Punkt 17 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen ober., einen unten. Nach dem Verfahrensalgorithmus

wird der untere Punkt, der nicht der Vorgänger ist, als Punkt 18 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert.

Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten

und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 19,20 und 21 der

Komponente 1 erfaßt. Der Punkt 21 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen oberrTeinen links. Nach dem Verfahrensalgorithmus wird der linke Punkt, der nicht der Vorgänger ist, als Punkt 22 der Komponente 1 bestimmt. Die Anzahl

der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers wird links, es wird einrechtes Maximum registriert. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibtkeine Übereinstimmung.

Der Punkt 22 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen links, einen rechts. Nach dem Verfahrensalgorithmus wird

der rechte Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen, und der zweite, der linke

Punkt als Punkt 23 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt

registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punktder Komponente ergibt keine Übereinstimmung.

Analog werden die Punkte 24,25,26 und 27 der Komponente 1 erfaßt. Der Punkt 27 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen oben, einen rechts. Nach dem Verfahrensalgorithmus

wird der rechte Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen und der zweite, der obige

Punkt, als Punkt 28 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt

registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und den aktuellen Punktder Komponente ergibt keine Übereinstimmung.

Der Punkt 28 der Komponente 1 besitzt 2 orthogonale Nachbarn, einen unten, einen oben. Nach dem Verfahrensalgorithmus

wird der untere Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen und der zweite, der obige

Punkt, als Punkt 13 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt

registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt

der Komponente ergibt keine Übereinstimmung.

Analog wird der Punkt 29 der Komponente 1 erfaßt.

Der Punkt 29 der Komponente 1 besitzt nur einen orthogonalen Nachbarn. Da er auch keine weiteren diagonalen Nachbarn besitzt, wird er als Haken gewertet und registriert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Da der Punkt 1 der Komponente ebenfalls ein Haken war, wird der zuletzt gefundene Punkt zum Komponentenende deklariert. Die Komponente wird abgeschlossen. Da die Richtung links ist und kein Schnittpunkt vorliegt, wird die Anzahl linker Maxima um eins erhöht. Da bisher kein Schnittpunkt gefunden wurde, wird geprüft, ob es noch nicht erfaßte Bildpunkt gibt. In diesem Fall sind alle gesetzten Punkte in der Komponente enthalten, es kann keine weiteren mehr geben. Die Linienverfolgung ist vollständig abgeschlossen

In Fig. 7 ist ein Teil des Entscheidungsgraphen dargestellt. Das gewählte Beispiel ordnet sich hier wie folgt ein

Anzahl von Kreisen = 0 - ja Anzahl von Komponenten = 1 -ja Komponentenanfang rechts oben - ja Komponentenende links unten - ja Komponentenende am Rand -ja Komponentenanfang von links - nein

schmaler als 3 Spalten - nein

schmalerals4Spalten - nein Komponentenende auf unterem Rand - nein

Komponentenende von oben - ja Daraus ergibt sich eine Zuweisung zur Zeichenklasse „5".

Claims

1. Das Verfahren zur größenunabhängigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen in Echtzeitbetrieb unter Verwendung der an sich bekannten Prinzipien der Skelettierung, der Linienverfolgung und der Merkmalsklassifikation abgetasteter Zeichen ist dadurch gekennzeichnet, daß

- daß in einem zweiten Schritt eine Reduzierung des Bildausschnittes derart erfolgt, daß seitenweise umlaufend zuerst der das Zeichen umgebende weiße Rand durch spalten- bzw. zeilenweises Testen bestimmt und dezimiert wird und danach mit an sich bekannten Mitteln eine Verdünnung der Ränder des Zeichens parallel zu den Rändern der Matrix erfolgt, solange alle gesetzten Punkte einer Reihe ohne die Erzeugung von Aufrissen oder Auflösung von Linien gelöscht werden, wobei Punkt für Punkt, aber mit Rückschrittmöglichkeit untersucht wird, ob eine Nachbarschaftsrelation (NBR) aus einer hierfür Seiten- und lageabhängig vorgegebenen Menge von NBR zum Setzen oder Löschen eines Punktes angewendet werden kann,

- daß in einem fünften Schritt spiralförmig mit Rückschrittmöglichkeit eine erneute punktweise Untersuchung des Randes derverbliebenen Matrix erfolgt, wobei eine dritte Teilmenge von NBR zuzüglich einer Menge von NBR zum Löschen und Verschieben zugrunde gelegt wird, um eine weitere Reduzierung der Bildmatrix und eine Glättung der Randlinien des Abbildes zu erreichen,

- daß die Schritte drei bis fünf solange zyklisch wiederholt werden, bis kein Punkt mehr verändert werden kann, d. h. bis ein Skelett vorliegt,

- daß in einem sechsten Verfahrensschritt eine Linienverfolgung vorgenommen wird, wobei ausgehend von dem in der obersten Zeile der Matrix am weitesten links stehenden Punkt der jeweils nächste Punkt bestimmt wird, indem zuerst die orthogonalen Nachbarn, rechts beginnend, dann die diagonalen Nachbarn, im Uhrzeigeisinn umlaufend, abgetastet werden und daß der in dieser Folge jeweils zu θ rot gefundene Punkt auf das Vorhandensein mehrerer Merkmale analysiert wird,

- daß in einem siebenten Verfahrensschritt, ausgehend vom Vorhandensein sein oder NichtVorhandensein von Merkmalen der Zeichen, mit einem optimierten erweiterbarem Entscheidungsgraphen eine Einteilung in Subklassen vorgenommen wird, wobei aus der Lage jedes Hakens oder Schnittpunktes, in bezug auf den Mittelpunkt des Schwärzungsgebietes bzw. in Relation zu seinen Rändern eine Information gewonnen werden und daß dazu aus der Lage, auf dem Rand, in der Nähe des Randes, innerhalb welches Quadranten, oben oder unten, rechts oder links, zur Mitte bzgl. der x- oder y-Achse sowie aus der Distanz zwischen Anfangs- und Endpunkten der gleichen oder verschiedener Komponenten bzw. Schnittpunkte

• aus den bei der Linienverfolgiing ermittelten Werten

• der Reihenfolge der Erfassung der Komponenten und Schnittpunkte Informationen gewonnen werden,

- daß in einem achten Verfahrensschritt die Subklassen den Zeichenklassen zugeordnet werden, wobei Subklassen, die nur Zeichen einer Zeichenklasse enthalten, dieser Zeichenklasse zugeordnet werden, Subklassen, denen Elemente mehrerer Zeichenklassen zugeordnet werden, zu denen es optisch keine signifikant zuverlässigen Trennmerkmale gibt, als nicht klassifizierbar rückgewiesen werden.

2. Verfahren nach Punkt 1, dadurch gekennzeichnet, daß bei der Analyse auf das Vorhandensein von Merkmalen eines Punktes gemäß sechstem Verfahrensschritt die Beziehungen zu den benachbarten Punkten ermittelt werden, wobei

- Punkte mit nur einem Nachbarn als Haken aufgefaßt werden,

- Punkte mit mehr als 2 Nachbarn als Schnittpunkte aufgefaßt werden,

- registriert wird, ob die Linie eine Richtungsänderung (rechts, links) vollführt,

- jeder neue Punkt mit dem ersten Punkt der Komponente verglichen vird, um Kreise zu erkennen und zu erfassen sowie um Zyklen zu vermeiden und für den Fall, das mn Haken ge'unden wird, überprüft wird, ob er diagonale Nachbarn besitzt, wobei

- besitzt er diagonale Nachbarn, wird er in den Status eines normalen Verbindungsgliedes gesetzt, und die Linienverfolgung wird normal fortgesetzt,

- besitzt er keine diagonalen Nachbarn, wird überprüft, ob der Komponentenbeginn ein Haken war,

- ist der Komponentenanfang ein Haken, wird der Punkt als Komponentenende und als Haken definiert der Zähler erhöht und mit dem Suchen einer weiteren Komponente fortgesetzt,

- war der Komponentenanfang kein Haken, wird getestet, ob es sich um ein gewöhnliches Kettenglied oder einen Schnittpunkt handelt,

- ist der Komponentenbeginn ein normales Kettenglied, wird die Komponente gewendet, der Punkt zum Haken deklariert und die Komponente in der anderen Richtung erweitert,

- war der Komponentenbeginn ein Schnittpunkt, wird geprüft, ob die Komponente bereits einmal aus diesem Grund gewendet wurde,

- wurde sie noch nicht deshalb gewendet, so wird sie gewendet und versucht, die Komponente in dieser Richtung zu erweitern,

- wurde sie bereits gewendet, wird in Abhängigkeit vom Anfangspunkt die Anzahl der Haken oder Kreise (beides Schnittpunkte) erhöht,

- wurde ein Schnittpunkt erreicht, wird geprüft, ob dieser bereits erfaßt wurde,

- handelt es sich um einen neu gefundenen Schnittpunkt, wird dieser Schnittpunkt registriert, der Nachfolger bestimmt und die bei diesem Durchlauf noch nicht erfaßten Nachbarn als offene Relation erfaßt,

- war der Schnittpunkt bereits bekannt, wird die Ankunftsrelation gelöscht und überprüft, ob der Anfangspunkt der Komponente ein Haken war,

- war der Anfangspunkt der Komponente ein Haken, wird diese Komponente abgeschlossen und als Haken registriert,

- war der Anfangspunkt kein Haken, wird geprüft, ob dieser ein Schnittpunkt war,

- war der Anfangspunkt kein Haken und kein Schnittpunkt, wird die Komponente gewendet und am früheren Anfang der Komponente weiter erweitert,

- wurde ein Schnittpunkt gefunden, so ist die Komponente als Kreis zu registrieren und mit der Bestimmung der nächsten Komponente fortzufahren.

3. Verfahren nach Punkt 2, gekennzeichnet dadurch, daß bei noch nicht vollständiger Erfassung des Skeletts der Startpu.ikt einer weiteren Komponente bestimmt wird, indem geprüft wird, ob bereits ein Schnittpunkt gefunden wurde, und ob alle seine Abzweigungen bereits ausgewertet wurden,

- wurden alle Abzweigungen aller erfaßten Schnittpunkte bereits abgearbeitet und ist die Anzahl der noch nicht erfaßten Punkte (Gesamtzahl schwarzer Punkte - Längen der erfaßten Komponenten) größer als eine minimale Restmenge, wird ein noch nicht erfaßter Punkt gesucht,

- wurde mindestens ein Schnittpunkt noch nicht vollständig abgearbeitet, wird eine unbearbeitete Ankunfts-Relation im zuletzt ermittelten Schnittpunkt gelöscht, der erste Nachfolgepunkt bestimmt und als Anfangspunkt der nächsten Komponente definiert- wurde noch kein Schnittpunkt ermittelt und ist die Anzahl der noch nicht erfaßten Punkte (Gesamtzahl schwarzer Punkte - Längen der erfaßten Komponenten) größer als eine minimale Restmenge, wird ein noch nicht erfaßter Punkt gesucht.