DD297527A5 - Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb - Google Patents
Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb Download PDFInfo
- Publication number
- DD297527A5 DD297527A5 DD34362590A DD34362590A DD297527A5 DD 297527 A5 DD297527 A5 DD 297527A5 DD 34362590 A DD34362590 A DD 34362590A DD 34362590 A DD34362590 A DD 34362590A DD 297527 A5 DD297527 A5 DD 297527A5
- Authority
- DD
- German Democratic Republic
- Prior art keywords
- point
- component
- intersection
- points
- character
- Prior art date
Links
Landscapes
- Character Input (AREA)
Abstract
Verfahren zur groeszenunabhaengigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen im Echtzeitbetrieb. Aufgabe der Erfindung ist es, bei reduziertem zeitlichen und technischen Aufwand im Echtzeitbetrieb eine Zeichenerkennung auf Dokumenten, insbesondere von Postleitzahlen, zu ermoeglichen. Erfindungsgemaesz wird die Aufgabe geloest durch ein Verfahren, dasz dadurch gekennzeichnet ist, dasz eine Kombination einer effektiven zeitbegrenzten Skelettierung durch Nachbarschaftsrelationen (NBR) und indirekte NBR in zwei jeweils rekursiven Arbeitsschritten, mit einer formalisierten Linienverfolgung und Klassifizierung nach Methoden der kuenstlichen Intelligenz erfolgt, wobei die Merkmale zeichen- und nicht zeichenklassenbezogen ausgewertet werden. Fig. 7{Zeichenerkennung, groeszenunabhaengig; Zeichen, handgeschrieben, maschinengeschrieben; Postleitzahl, alphanumerisch; Skelettierung; Linienverfolgung}
Description
Hierzu 7 Seiten Zeichnungen
Gegenstand der Erfindung ist ein Verfahren zur Erkennung von alphanumerischen hand- und/oder maschinengeschriebenen Zeichen in Echtzeit, wobei an diesen Zeichen keine Größennormierung vorgenommen werden muß. Dieses Verfahren kann vorzugsweise für die Echtzeitauswertung von Belegen mit hand- und/oder maschinengeschriebenen Zeichen in vorgegebenen Erwartungszonen, wie zum Beispiel Kennungen auf Dokumenten oder Postleitzahlen auf Briefsendungen, mittels stationärer oder nichtstationärer Vorrichtungen angewendet werden.
Bei den bekannten Leseeinrichtungen haben die unterschiedlichsten Randbedingungen zu folgendem Kompromiß geführt: Verwendung möglichst einfacher Klassifikationsverfahren, die relativ geringe Verarbeitungszeiten für ein Zeichen benötigen, wodurch aber sowohl die Erkennungssicherheit als auch der Zeichenvorrat auf Varianten innerhalb einer Zeichenklasse beschränkt bleiben
In der Regel führen die bekannten Verfahren zur Zeichenerkennung folgende 4 Arbeitsgänge durch:
1. Gewinnung elektrischer Signale, die die Zeichen codiert darstellen,
2. Isolierung einzelner Zeichen,
3. Analyse der Signale zur Ermittlung von Merkmalen eines Zeichens,
4. Bestimmung der Zeichenklasse anhand der ermittelten Merkmale.
Die Erkennung beruht auf dem Vorhandensein von intuitiv oder automatisch approximativ, aber keinesfalls wirklich schlüssig ausgewählten Merkmalen, die unabhängig voneinander identifiziert werden. Notwendig ist jedoch die Kombination der Merkmale, um eine sichere Identifikation zu ermöglichen. Dazu muß das Zeichen in abhängiger Folge von Merkmalen codiert werden. So kann der oben genannte Nachteil zumindest teilweise ausgeglichen werden. Die Erfindung betrifft die Punkte 3 und 4.
Es sind folgende Quellen aus dem Fonds der Patentschriften, bekannt: DE 2007577, Anordnung zur Erkennung von Schriftzeichen
- Erkennung von Schriftzeichen durch die Extraktion von Formelementen, dadurch vereinfacht und optimiert, daß benachbarte Flächen eines gefundenen Fo,, nelementes bewertet (Erwartungswerte) und unter Umständen sogar modifiziert (Phasenverschoben - gedreht) untersucht werden. Die Klassifikation erfolgt dann durch Serienschaltungen, die über Verzögerungsleitungen und Zeitsteuerkurven während eines sogenannten Arbeitsspieles mehrere unterschiedliche Erkennungsversuche durchführen.
Dabei bleibt jedoch als Mangel offen, daß durch Schwellwertbetrachtungen und dem Vergleich mit einer begrenzten Zahl von repräsentativen Ergebniskurven zu jeder Zeichenklasse die Erkennungssicherheit leidet. Die Möglichkeit durch eine deutliche Steigerung der Menge der Vergleichskurven, auf die Menge, die der Anzahl von Zeichentypen aller Zeichenklassen zusammengenommen entspricht, zu kommen, wäre technisch sehr aufwendig und würde die Echtzeitfähigkeit aufheben.
DE 24 59427, Anordnung zum Skelettieren von Zeichen
- Systematische Skelettierung über (direkte) Nachbarschaftsbeziehungen (NBR) relativ funktionsfolgenunabhängig durch Auswertung von Positionsdaten, Sammlung von Beispielinformationen (60), inversiertor Operatorfigur von höchstens 13 Positionen. Das Skelett wird bei Verwendung symmetrischer Operatoren (4 Lagen) oder asymmetrischen, einfachen und zusammengesetzten Operatoren unterbrechungsfrei und auslassungsarm. Dabei bleiben jedoch folgende Mängel offen:
- zu hoher technischer und zeitlicher Aufwand durch die hohe Anzahl von Beispielinformationen sowie die Abarbeitung mittels eines unbewerteten Flächenalgorythmusses um kosten- und ausreichend zeitgünstig (echtzeitgerecht) zu bleiben
- Ausfransen der Ränder und damit einer Merkmalsverwischung sowie möglicher Anstrichauflösungen mit der Folge sinkender Erkennungssicherheit.
DE 2817341, Optisches Handlesegerät für maschinelle Zeichenerkennung
- Nichtlineares Klassifikatorverfahren mit auswechselbaren Klassifikatoren und Berechnung durch Vektormultiplikation des Zeichenvektors mit auswechselbaren klassenspezifischen Koeffizientenvektoren.
- Dabei jedoch durch die vollständige Berechnung der Vektoren und die Multiplikation mit allen klassenspezifischen Koeffizientenvektoren folgende Mängel offen lassend:
zu hoher technischer und zeitlicher Aufwand durch die Berechnung aller Merkmale und deren vollständige Vektormultiplikation ohne Wichtung und Begrenzung auf die relevanten Merkmale und deren Verknüpfungen.
DE 3247832, Einrichtung zur gestuften Erkennung von Zeichen, Mustern oder dgl.
- Kaskadierte Herauslösung von jeweils einer Zeichenklasse, wobei die Erweiterbarkeit um weitere Zeichenklassen relativ unaufwendig (eine weitere Ebene) möglich wird,
- jedoch bleiben folgende Mängel offen:
mangelnde Echtzeitfähigkeit, da die Reaktionszeit vom ungünstigsten Fall in der Stufenhierarchie ausgehen muß.
DE 3425449, Klassifizierung durch Bewertung des Randlinienverlaufes
- Erkennung von Schriftzeichen sowohl durch Vorhandensein von bestätigenden Merkmalen, die für eine Zeichenklasse typisch sind, als auch durch Nachweisbarkeit von Unterschiede kennzeichnenden Merkmalen, die in einer Zeichenklasse nicht auftreten können, also in jedem Fall klassenbezogenen Merkmalen, die nach einer gestuften Hierarchie klassenweise abgearbeitet werden.
Dabei bleiben jedoch folgende Mangel offen:
- Erkennungsunschärfe, da als Linie verstandene Objekte als Flächen interpretiert werden, und die Steigerung des technischen und zeitlichen Aufwandes, da die Menge der Informationen sich dabei etwa verdoppelt, ohne deren Substanz zu erhöhen.
- Verwischung von Merkmalen, und damit Reduzierung der Erkennungssicherheit, durch die Unscharfe der Randlinien insbesondere bzgl. der Erkennbarkeit von Entstehungsreihenfolge, der Trennbarkeit von Berührungs- und Schnittpunkten sowie der logischen Richtung von Linienenden (Haken).
- Klassifizierung durch Filterung {Auswahl und Wichtung) der Merkmale und Anpassung der Filter sowie dem Vergleich mit Standardabbildwerten. Dabei sind eine dynamisch anpaßbare Genauigkeit sowie eine dynamische Filtermodifizierung durch Wichtungsmodifikation möglich.
- mangelnde Erkennungssicherheit durch den Bezug auf eine begrenzte Anzahl von Standardbildern, die der Formenvielfalt nicht angemessen sein können,
- Verlust der Echtzeitfähigkeit bei wesentlicher Erweiterung der Anzahl von Standardbildern,
- hohor.Aufwand, um alle Merkmale zu berechnen und diese dann auch noch mit allen Standardwerten zu vergleichen.
Ziel der Erfindung ist die Angabe eines Verfahrens zur Erkennung hand- oder maschinengeschriebener Zeichen, bei dem eine Skelettierung der zu erkennenden Zeichen vorgenommen wird, die gegenüber dem bekannten Stand der Technik eine Einsparung der üblichen Größennormierung und eine reduzierte Anzahl von Testschritten ermöglicht und bei der eine Klassifikation der zu erkennenden Zoichen vorgenommen wird, die durch ihre neuartige Merkmalsauswahl die Erkennungssicherheit verbessert.
Die Aufgabe der Erfindung besteht in der Angabe eines Verfahrens, das es gestattet, hand- oder maschinengeschriebene Zeichen zu erkennen, wobei eine Reduzierung des technischen und zeitlichen Aufwandes derart angestrebt wird, daß die Forderung nach Echtzeitverarbeitung erfüllt werden kann, wobei die Erkennungssicherheit die des Menschen erreichen soll. Eine Lernfähigkeit des Systems soll eine dynamische Anpassung an einsatztypische Formen der Zeichen und einsatzortabhängige Formenauswahl ermöglichen.
Der Widerspruch zwischen Zeichenklassenzahl und Erkennungszeit einerseits und Erkennungsrate anderseits und zwischen Erkennungsrate einerseits und Fehlerrate anderseits soll weitestgehend aufgelöst werden. Dabei sollen insbesondere folgende Mängel beseitigt werden:
- durch verlustfreiere Extraktion der Merkmale verbessert werden,
- durch den Übergang der Bewertung von zeichenklassentypischen Merkmalen zu den Merkmalen typischer Vertreter einer Zeichenklasse verringert und
- durch eine verbesserte Trennfunktion zwischen den Vertretern eines Types von Zeichen einer Zeichenklasse zu ähnlichen Typen von Zeichen einer anderen Zeichenklasse verbessert werden.
- soll durch ein mehrstufiges räumlich abhängig bewertetes Skelettierungsverfahren reduziert und
- durch eine zeichenbezogene zeitlich und räumlich bewertete dynamische Interpretation der vorkonzentrierten Merkmale gering gehalten werden und dadurch,
- daß dabei tatsächlich nur die Merkmale berechnet werden, die notwendig sind, um den speziellen Typ dieses Zeichen einer Zeichenklasse von ähnlichen Typen anderer Zeichenklassen zu trennen.
Erfindungsgemäß wird die Aufgabe gelöst durch ein Verfahren, das dadurch gekennzeichnet ist, daß eine Kombination einer effektiven, zeitbegrenzten Skelettierung durch Nachbarschaftsrelationen (NBR) und indirekte NBR in zwei jeweils rekursiven Arbeitsschritten, mit einer formalisierten Linienverfolgung und Klassifizierung nach Methoden der künstlichen Intelligenz, d. h. eines lernenden Systems erfolgt, wobei die Merkmale zeichen- und nicht zeichenklassenbezogen ausgewertet werden. Das Verfahren zur größenunabhängigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen in Echtzeitbetrieb unter Verwendung der an sich bekannten Prinzipien der Skelettierung, der Linienverfolgung und der Merkmalsklassifikation abgetasteter Zeichen ist dadurch gekennzeichnet, daß
- in einem ersten Verfahrensschritt das digitalisierte Abbild des abgetasteten und isolierten Zeichens matrixförmig abgespeichert wird, wobei das Zeichen in der Regel links- und obenbündig in der Matrix angeordnet wird,
- daß in einem zweiten Schritt eine Reduzierung des Bildausschnittes derart erfolgt, daß seitenweise umlaufend zuerst der das Zeichen umgebende weiße Rand durch spalten- bzw. zeilenweises Testen bestimmt und dezimiert wird und danach mit an sich bekannten Mitteln eine Verdünnung der Ränder des Zeichens parallel zu den Rändern der Matrix erfolgt, solange alle gesetzten Punkte einer Reihe ohne die Erzeugung von Aufrissen oder Auflösung von Linien gelöscht werden, wobei Punkt für Punkt, aber mit Rückschrittmöglichkeit untersucht wird, ob eine NBR aus einer hierfür Seiten- und lageabhängig vorgegebenen Menge von NBR zum Setzen oder Löschen eines Punktes angewendet werden kann,
- daß in einem dritten Schritt in an sich bekannter Weise ein Raster über das verbliebene Abbild gelegt wird, so daß das verbleibende Teil der Matrix mit Ausnahme des Randes in vier gleichverteilte, disjunkte Teilmengen zerlegt wird,
- daß in einem vierten Schritt jeder Punkt dieser 4 Teilmengen nacheinander in an sich bekannter Weise systematisch und vollständig dahingehend untersucht wird, ob eine NBR aus einer hierfür vorgegebenen Menge von NBR vorhanden ist und bei Vorhandensein einer NBR gemäß dieser NBR der jeweilige Punkt gelöscht, gesetzt oder bei Vorhandensein einer indirekten NBR (INBR) verschoben wird,
daß in einem fünften Schritt spiralförmig mit Rückschrittmöglichkeit eine erneute punktweise Untersuchung des Randes derverbliebenen Matrix erfolgt, wobei eine dritte Teilmenge von NBR zuzüglicher einer Menge von NBR zum Löschen und
zu erreichen,
daß die Schritte drei bis fünf solange zyklisch wiederholt werden, bis kein Punkt mehr verändert werden kann, d. h. bis ein
daß in einem sechsten Verfahrensschritt eine Linienverfolgung vorgenommen wird, bei der das Skelett eines Zeichens in einoder mehrere Komponenten zerlegt wird, und wobei unter einer Komponente ein linearer, unverzweigter Bestandteil eines
jeweils nächste Punkt bestimmt wird, indem zuerst die orthogonalen Nachbarn, rechts beginnend, dann die diagonalen
nicht mehr erweiterbar ist, worauf falls noch vorhanden, ein Punkt gesucht wird, der noch nicht in den bisher erfaßten
daß in einem siebenten Verfahrensschritt, ausgehend vom Vorhandensein sein oder NichtVorhandensein von Merkmalen der
wobei aus der Lage jedes Hakens oder Schnittpunktes, in bezug auf den Mittelpunkt des Schwärzungsgebietes bzw. in Relationzu seinen Rändern Informationen gewonnen werden können und daß aus der Lage, auf dem Rand, in der Nähe des Randes,innerhalb welches Quadranten, oben oder unten, rechts oder links, zur Mitte bzgl. der x- oder y-Achse sowie aus der Distanzzwischen Anfangs- und Endpunkten der gleichen oder verschiedener Komponenten bzw. Schnittpunkte, aus den bei der
gewonnen werden.
daß in einem achten Verfahrensschritt die Subklassen den Zeichenklassen zugeordnet werden, wobei Subklassen die nur
klassifizierbar rückgewiesen werden, nichtklassifizierbare Subklassen aus Elementen zweier oder mehrerer Zeichenklassenbestehen können, wobei diese Zeichenklassengruppe ebenfalls ein verwertbares, da sicheres wenn auch allgemeineres
großen Anteilsunterschieden der einzelnen Zeichenklassen in dieser Zeichenklassengruppe und geringem
die bewußte Auswahl der Punktfolge bei der Linienverfolgung insbesondere der Anfangswerte für die einzelnen Komponenten
die Reihenfolge der Erfassung der Komponenten und Schnittpunkte Rückschlüsse auf die Aufzeichnungsfolge und damit aufdie Semantik des Zeichens gestattet,
die Mischung von räumlicher Varianz und Invarianz z. B. „Links oben" oder „auf Ecke links oben" es gestatten, sowohl
benutzt wird, daß die Trennbarkeit von einzelnen Zeichenvarianten einer Zeichenklasse zu ähnlichen Zeichenvarianten eineranderen Zeichenklasse (potentielle Fehlergruppen) wesentlich höher ist als die der gesamten Zeichenklassen voneinander,jede Ebene des Entscheidungsbaumes eine weitere Dimension darstellt, so daß damit eine mathematische
verknüpften Punkte und Relationen ist und sie zusätzlich die Aufzeichnungsfolge als Funktion der Aufzeichnungszeit einbringt,so daß
das wesentliche Problem der Echtzeitfähigkeit der automatisierten Lösung, daß der Lösungsaufwand und die Lösungsmengeexponential zum Grad der Verknüpfung von Punkten (Merkmalmalen) steigt, lösbar wirddie geringe Vergrößerung des zeitlichen Aufwandes (1 + 1/n wobei η die maximale Anzahl ausgewerteter Merkmale ist unddie Anzahl möglicher Subklassen 2«»n) bei der Verdoppelung der Zahl der Subklassen und damit Erhöhung der Trennschärfe,die Sicherung einer geringen Fehlerrate ermöglicht
von den etwa 200 verschiedenen komplexen, den 4 linearen Merkmalen und den 5 Summenzählern lediglich η (η ä Anzahl der
werden können
im Falle zu großer oder ansteigender Fehlerzahl durch Erweiterung des Zeichentypenspektrums oder örtlicher Varianz durch
des Aufwandes die Fehlerrate wieder begrenzt werden kann,
die Klasse der Abweisungen bei ausreichend hoher Lernrate (nach Literaturangaben ca. pro Klasse eine Menge von ca.
3*fache Anzahl möglicher Kombinationen unabhängiger Testzeichen) in der gleichen Größenordnung wie beim Menschenliegen,
(Trennfunktion gemäß der Zeichenklassentrennung) in zwei weitere Subklassen zerlegt werden, der Lernprozeß bis zu einerausreichend hohen Erkennung und ausreichend geringen Fehlerrate, erfolgen kann.
gekennzeichnet.
gleichzeitig sind die im Verfahrensschritt 2 Teil 2 zu löschenden Punkte, Reduzierung von unten, durch Kreise gekennzeichnet.
gemäß Verfahrensschritt 3 dargestellt.
vorgenommen werden konnten, erfolgt eine Wiederholung der Verfahrensschritte 4 und 5. In Figur 4.1 a werden die gemäß
gekennzeichnet.
weitere Reduzierung brachte (nur 2 Verschiebungen) wird die Skelettierung jetzt abgebrochen. Damit stellt Figur 8 das Ergebnisder Skelettierung dar.
sich der in Figur 6 markierte Punkt als Punkt 1 der Komponente 1.
des Nachfolgers wird rechts.
der rechte Nachbar der nicht der Vorgänger ist, als Punkt 4 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingenpeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich
zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung.
der rechte Nachbar der nicht als Vorgänger ist, als Punkt 5 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich
zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung.
der rechte Nachbar der nicht der Vorgänger ist, als Punkt 6 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich
zwischen dem ersten und dem aktuellen Punkt der Komponente erbibt keine Übereinstimmung.
ob diagonale Nachbarn existieren. Da das nicht der Fall ist, wird er als Haken registriert und die Komponente gewendet d. h.
durch Umpufferung wird der Punkt 1 zum Punkt 6 der Komponente 1 und der Punkt 6 zum Punkt 1 der Komponente, wird der
analog Punkt 4 zu Punkt 3. Es wird ein rechtes Maximum registriert, die Nachfolgerichtung wird links.
besitzt. Der rechte Nachbarpunkt würde als erster Fortsetzungspunkt ausgewählt. Da er jedoch der Vorgänger in der Komponenteist, wird er abgewiesen und der untere Punkt als Fortsetzungspunkt Punkt 7 der Komponente 1 gewählt. Die Anzahl der Nachbarnwird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich.
der untere Punkt, der nicht der Vorgänger ist, als Punkt 8 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich
zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 9 und10 der Komponente 1 erfaßt: Der Punkt 7 der Kompor.ante 1 besitzt 2 orthogonale Nachbarn, einen oben, einen unten. Nach dem
der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich.
wird der rechte Punkt, der nicht der Vorgänger ist, als Punkt 12 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers wird rechts. Es wird ein linkes Maximumregistriert. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine
der rechte Punkt, der nicht der Vorgänger ist, als Punkt 13 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleichzwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 14,15 und 16 der Komponente 1 erfaßt.
der untere Punkt, der nicht der Vorgänger ist, als Punkt 17 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleichzwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung.
wird der untere Punkt, der nicht der Vorgänger ist, als Punkt 18 der Komponente 1 bestimmt. Die Anzahl der Nachbarn wirdeingespeichert.
und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Analog werden die Punkte 19,20 und 21 der
der Nachbarn wird eingespeichert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers wird links, es wird einrechtes Maximum registriert. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibtkeine Übereinstimmung.
der rechte Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen, und der zweite, der linke
registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punktder Komponente ergibt keine Übereinstimmung.
wird der rechte Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen und der zweite, der obige
registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und den aktuellen Punktder Komponente ergibt keine Übereinstimmung.
wird der untere Punkt als Nachfolger bestimmt, der aber der Vorgänger ist, deshalb wird er abgewiesen und der zweite, der obige
registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt
der Komponente ergibt keine Übereinstimmung.
Der Punkt 29 der Komponente 1 besitzt nur einen orthogonalen Nachbarn. Da er auch keine weiteren diagonalen Nachbarn besitzt, wird er als Haken gewertet und registriert. Es wird kein Schnittpunkt registriert. Die Richtung des Nachfolgers bleibt gleich. Ein Koordinatenvergleich zwischen dem ersten und dem aktuellen Punkt der Komponente ergibt keine Übereinstimmung. Da der Punkt 1 der Komponente ebenfalls ein Haken war, wird der zuletzt gefundene Punkt zum Komponentenende deklariert. Die Komponente wird abgeschlossen. Da die Richtung links ist und kein Schnittpunkt vorliegt, wird die Anzahl linker Maxima um eins erhöht. Da bisher kein Schnittpunkt gefunden wurde, wird geprüft, ob es noch nicht erfaßte Bildpunkt gibt. In diesem Fall sind alle gesetzten Punkte in der Komponente enthalten, es kann keine weiteren mehr geben. Die Linienverfolgung ist vollständig abgeschlossen
In Fig. 7 ist ein Teil des Entscheidungsgraphen dargestellt. Das gewählte Beispiel ordnet sich hier wie folgt ein
schmaler als 3 Spalten - nein
schmalerals4Spalten - nein Komponentenende auf unterem Rand - nein
Claims (3)
1. Das Verfahren zur größenunabhängigen Erkennung hand- und/oder maschinengeschriebener alphanumerischer Zeichen in Echtzeitbetrieb unter Verwendung der an sich bekannten Prinzipien der Skelettierung, der Linienverfolgung und der Merkmalsklassifikation abgetasteter Zeichen ist dadurch gekennzeichnet, daß
- in einem ersten Verfahrensschritt das digitalisierte Abbild des abgetasteten und isolierten Zeichens matrixförmig abgespeichert wird, wobei das Zeichen in der Regel links- und obenbündig in der Matrix angeordnet wird,
- daß in einem zweiten Schritt eine Reduzierung des Bildausschnittes derart erfolgt, daß seitenweise umlaufend zuerst der das Zeichen umgebende weiße Rand durch spalten- bzw. zeilenweises Testen bestimmt und dezimiert wird und danach mit an sich bekannten Mitteln eine Verdünnung der Ränder des Zeichens parallel zu den Rändern der Matrix erfolgt, solange alle gesetzten Punkte einer Reihe ohne die Erzeugung von Aufrissen oder Auflösung von Linien gelöscht werden, wobei Punkt für Punkt, aber mit Rückschrittmöglichkeit untersucht wird, ob eine Nachbarschaftsrelation (NBR) aus einer hierfür Seiten- und lageabhängig vorgegebenen Menge von NBR zum Setzen oder Löschen eines Punktes angewendet werden kann,
- daß in einem dritten Schritt in an sich bekannter Weise ein Raster über das verbliebene Abbild gelegt wird, so daß das verbleibende Teil der Matrix mit Ausnahme des Randes in vier gleichverteilte, disjunkte Teilmengen zerlegt wird,
- daß in einem vierten Schritt jeder Punkt dieser 4 Teilmengen nacheinander in an sich bekannter Weise systematisch und vollständig dahingehend untersucht wird, ob eine NBR aus einer hierfür vorgegebenen Menge von NBR vorhanden ist und bei Vorhandensein einer NBR gemäß dieser NBR der jeweilige Punkt gelöscht, gesetzt oder bei Vorhandensein einer indirekten NBR (INBR) verschoben wird,
- daß in einem fünften Schritt spiralförmig mit Rückschrittmöglichkeit eine erneute punktweise Untersuchung des Randes derverbliebenen Matrix erfolgt, wobei eine dritte Teilmenge von NBR zuzüglich einer Menge von NBR zum Löschen und Verschieben zugrunde gelegt wird, um eine weitere Reduzierung der Bildmatrix und eine Glättung der Randlinien des Abbildes zu erreichen,
- daß die Schritte drei bis fünf solange zyklisch wiederholt werden, bis kein Punkt mehr verändert werden kann, d. h. bis ein Skelett vorliegt,
- daß in einem sechsten Verfahrensschritt eine Linienverfolgung vorgenommen wird, wobei ausgehend von dem in der obersten Zeile der Matrix am weitesten links stehenden Punkt der jeweils nächste Punkt bestimmt wird, indem zuerst die orthogonalen Nachbarn, rechts beginnend, dann die diagonalen Nachbarn, im Uhrzeigeisinn umlaufend, abgetastet werden und daß der in dieser Folge jeweils zu θ rot gefundene Punkt auf das Vorhandensein mehrerer Merkmale analysiert wird,
- daß in einem siebenten Verfahrensschritt, ausgehend vom Vorhandensein sein oder NichtVorhandensein von Merkmalen der Zeichen, mit einem optimierten erweiterbarem Entscheidungsgraphen eine Einteilung in Subklassen vorgenommen wird, wobei aus der Lage jedes Hakens oder Schnittpunktes, in bezug auf den Mittelpunkt des Schwärzungsgebietes bzw. in Relation zu seinen Rändern eine Information gewonnen werden und daß dazu aus der Lage, auf dem Rand, in der Nähe des Randes, innerhalb welches Quadranten, oben oder unten, rechts oder links, zur Mitte bzgl. der x- oder y-Achse sowie aus der Distanz zwischen Anfangs- und Endpunkten der gleichen oder verschiedener Komponenten bzw. Schnittpunkte
• aus den bei der Linienverfolgiing ermittelten Werten
• der Reihenfolge der Erfassung der Komponenten und Schnittpunkte Informationen gewonnen werden,
- daß in einem achten Verfahrensschritt die Subklassen den Zeichenklassen zugeordnet werden, wobei Subklassen, die nur Zeichen einer Zeichenklasse enthalten, dieser Zeichenklasse zugeordnet werden, Subklassen, denen Elemente mehrerer Zeichenklassen zugeordnet werden, zu denen es optisch keine signifikant zuverlässigen Trennmerkmale gibt, als nicht klassifizierbar rückgewiesen werden.
2. Verfahren nach Punkt 1, dadurch gekennzeichnet, daß bei der Analyse auf das Vorhandensein von Merkmalen eines Punktes gemäß sechstem Verfahrensschritt die Beziehungen zu den benachbarten Punkten ermittelt werden, wobei
- Punkte mit nur einem Nachbarn als Haken aufgefaßt werden,
- Punkte mit mehr als 2 Nachbarn als Schnittpunkte aufgefaßt werden,
- registriert wird, ob die Linie eine Richtungsänderung (rechts, links) vollführt,
- jeder neue Punkt mit dem ersten Punkt der Komponente verglichen vird, um Kreise zu erkennen und zu erfassen sowie um Zyklen zu vermeiden und für den Fall, das mn Haken ge'unden wird, überprüft wird, ob er diagonale Nachbarn besitzt, wobei
- besitzt er diagonale Nachbarn, wird er in den Status eines normalen Verbindungsgliedes gesetzt, und die Linienverfolgung wird normal fortgesetzt,
- besitzt er keine diagonalen Nachbarn, wird überprüft, ob der Komponentenbeginn ein Haken war,
- ist der Komponentenanfang ein Haken, wird der Punkt als Komponentenende und als Haken definiert der Zähler erhöht und mit dem Suchen einer weiteren Komponente fortgesetzt,
- war der Komponentenanfang kein Haken, wird getestet, ob es sich um ein gewöhnliches Kettenglied oder einen Schnittpunkt handelt,
- ist der Komponentenbeginn ein normales Kettenglied, wird die Komponente gewendet, der Punkt zum Haken deklariert und die Komponente in der anderen Richtung erweitert,
- war der Komponentenbeginn ein Schnittpunkt, wird geprüft, ob die Komponente bereits einmal aus diesem Grund gewendet wurde,
- wurde sie noch nicht deshalb gewendet, so wird sie gewendet und versucht, die Komponente in dieser Richtung zu erweitern,
- wurde sie bereits gewendet, wird in Abhängigkeit vom Anfangspunkt die Anzahl der Haken oder Kreise (beides Schnittpunkte) erhöht,
- wurde ein Schnittpunkt erreicht, wird geprüft, ob dieser bereits erfaßt wurde,
- handelt es sich um einen neu gefundenen Schnittpunkt, wird dieser Schnittpunkt registriert, der Nachfolger bestimmt und die bei diesem Durchlauf noch nicht erfaßten Nachbarn als offene Relation erfaßt,
- war der Schnittpunkt bereits bekannt, wird die Ankunftsrelation gelöscht und überprüft, ob der Anfangspunkt der Komponente ein Haken war,
- war der Anfangspunkt der Komponente ein Haken, wird diese Komponente abgeschlossen und als Haken registriert,
- war der Anfangspunkt kein Haken, wird geprüft, ob dieser ein Schnittpunkt war,
- war der Anfangspunkt kein Haken und kein Schnittpunkt, wird die Komponente gewendet und am früheren Anfang der Komponente weiter erweitert,
- wurde ein Schnittpunkt gefunden, so ist die Komponente als Kreis zu registrieren und mit der Bestimmung der nächsten Komponente fortzufahren.
3. Verfahren nach Punkt 2, gekennzeichnet dadurch, daß bei noch nicht vollständiger Erfassung des Skeletts der Startpu.ikt einer weiteren Komponente bestimmt wird, indem geprüft wird, ob bereits ein Schnittpunkt gefunden wurde, und ob alle seine Abzweigungen bereits ausgewertet wurden,
- wurden alle Abzweigungen aller erfaßten Schnittpunkte bereits abgearbeitet und ist die Anzahl der noch nicht erfaßten Punkte (Gesamtzahl schwarzer Punkte - Längen der erfaßten Komponenten) größer als eine minimale Restmenge, wird ein noch nicht erfaßter Punkt gesucht,
- wurde mindestens ein Schnittpunkt noch nicht vollständig abgearbeitet, wird eine unbearbeitete Ankunfts-Relation im zuletzt ermittelten Schnittpunkt gelöscht, der erste Nachfolgepunkt bestimmt und als Anfangspunkt der nächsten Komponente definiert- wurde noch kein Schnittpunkt ermittelt und ist die Anzahl der noch nicht erfaßten Punkte (Gesamtzahl schwarzer Punkte - Längen der erfaßten Komponenten) größer als eine minimale Restmenge, wird ein noch nicht erfaßter Punkt gesucht.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DD34362590A DD297527A5 (de) | 1990-08-24 | 1990-08-24 | Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DD34362590A DD297527A5 (de) | 1990-08-24 | 1990-08-24 | Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb |
Publications (1)
Publication Number | Publication Date |
---|---|
DD297527A5 true DD297527A5 (de) | 1992-01-09 |
Family
ID=5620315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DD34362590A DD297527A5 (de) | 1990-08-24 | 1990-08-24 | Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb |
Country Status (1)
Country | Link |
---|---|
DD (1) | DD297527A5 (de) |
-
1990
- 1990-08-24 DD DD34362590A patent/DD297527A5/de not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0312905B1 (de) | Verfahren zur automatischen Zeichenerkennung | |
DE3633743C2 (de) | ||
DE2831582C2 (de) | Verfahren zur Identifizierung einer Person und Vorrichtung zur Durchführung des Verfahrens | |
DE3879254T2 (de) | Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben. | |
DE3650446T2 (de) | Paralleler, adaptiver, nichtlinearer Musterklassentrenner und -erkenner in mehreren Einheiten. | |
DE19521346C2 (de) | Bilduntersuchungs/-Erkennungsverfahren, darin verwendetes Verfahren zur Erzeugung von Referenzdaten und Vorrichtungen dafür | |
DE69027519T2 (de) | Handschrifterkennung mit Verwendung von jeweils zwischen zwei Klassen unterscheidenden Massnahmen | |
DE3722444A1 (de) | Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten | |
DE69623581T4 (de) | Merkmalextrahierung zur Fingerabdruckerkennung | |
DE3632832A1 (de) | Zeichenerkennungssystem | |
DE2640537A1 (de) | Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen | |
DE2909153A1 (de) | Einrichtung zur elektronischen verarbeitung von bild- und/oder zeichenmustern | |
DE1549930A1 (de) | Vorrichtung zum Lesen handschriftlicher Zeichen | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
EP2082357B1 (de) | Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE2829808A1 (de) | Verfahren und vorrichtung zum lesen von zeichen | |
EP0402868A2 (de) | Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen | |
DE69030614T2 (de) | Gerät zur Erkennung handgeschriebener Zeichen | |
DE2749222A1 (de) | Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen | |
DE3246631C2 (de) | Zeichenerkennungsvorrichtung | |
DE3026055C2 (de) | Schaltungsanordnung zur maschinellen Zeichererkennung | |
EP1989662B1 (de) | Verfahren zum erkennen von objekten und objekterkennungssystem | |
DE3414455C2 (de) | Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht | |
DD297527A5 (de) | Verfahren zur groessenunabhaengigen erkennung hand und/oder maschinengeschriebener alphanumerischer zeichen im echtzeitbetrieb |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
ENJ | Ceased due to non-payment of renewal fee |