DE2749222A1 - Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen - Google Patents

Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen

Info

Publication number
DE2749222A1
DE2749222A1 DE19772749222 DE2749222A DE2749222A1 DE 2749222 A1 DE2749222 A1 DE 2749222A1 DE 19772749222 DE19772749222 DE 19772749222 DE 2749222 A DE2749222 A DE 2749222A DE 2749222 A1 DE2749222 A1 DE 2749222A1
Authority
DE
Germany
Prior art keywords
character
codes
segment
code
scans
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19772749222
Other languages
English (en)
Inventor
Morton Nadler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Norprint Ltd
Original Assignee
Norprint Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Norprint Ltd filed Critical Norprint Ltd
Publication of DE2749222A1 publication Critical patent/DE2749222A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

A. GRÜNECKER
mpi inc;
H. KINKELDEY
DR INt;
OH INti A** (CAlT I 111·+
K. SCHUMANN
IJR RfR NAT DiPI «<YS
P. H. JAKOB
DtPl INt j
G. BEZOLD
DR W H NAT tun CX M
8 MÜNCHEN
MÄXIMILIANSTRASSE
llorprint Linitod Γ 12
: meantIo road 3.Hov.1977
Iloeton, Lincolneliiro
Verfahren und Vorrichtung zum autoraatisclien
Erkennen oder Lorsen von Zeichen
Die Erfindung bezieht eich auf eine Vorrichtung und auf ein Verfahren zum automatischen Erkennen oder Lesen von •Symbolen, wie z.B. alphanumerischen Zeichen.
Die Erfindung ist in den Ansprüchen 1 und l) gekennzeichnet.
In folgenden wi rd die Erfindung aniiand eines erfindungsgemäßen automata sehen Zeichen-Lesegerätes beispielhaft unter Bezugnahme auf die Zeichnung beschrieben. Es zeigen:
Fig. 1 ein Diagramm, das die bei der erfindungsgemäßen Vorrichtung und dem erfindungsgemäßen Verfahren verwendete Abtasttechnik zeigt,
809820/0761
Tf Il f ON (ΟβΟ) 32 2ΒΛ3 Tf L i < fif> J9 3HO Tt I I CiHAMMf MONACAI T[ IE M(U1IC Nt I
Fig. 2a bis 2d Diagramme zur Veranschaulichunp; der Funktionsweise der Technik gemäß Fig. 1,
Fig. 3 ein Diagramm, das die Anwendung der Abtiinttechriilc gemäß Fig. 1 bei einem anderen Zeichen veranschaulicht,
Fig. iv ein Diagramm, das die Abtasttechnik genau Fig. 1 bei Anwendung an einem anderen Zeichen erläutert,
Fig. 5 ein Diagramm zur Veranschaulichung einor modifizierten Form der in Fig. 1 erläuterten Abtasttechnik,
Fig. 6a bis 6d, 7a bis 7d und 8a bis 8d Diagramme zur Verdeutlichung der Arbeitsweise der Abtasttechnik gemäß Fig. 5»
Fig. 9 ein Blockdiagramm einer Vorrichtung zum Ann führen der in Fig. 5 erläuterten Technik,
Fig. 10 eine Diagrammdarstellung der Information, die durch die Vorrichtung gemäß Fig. 9 gespeichert werden kann,
Fig. 1 la bis Hq Diagramme zur detaillierten Erklärung der Arbeitsweine der Vorrichtung f^enäß FiR. 9,
Fig. 12, 13 und 1'»-
Diagramme zum Veranschaulichen der Abtasttechnik gemäß Fig. 5» angewandt bei bestimmten Zeichen,
Fig. 15 einen in dem System verwendeten Matrixspeicher,
Fig. 16 und 17 zwei unterschiedliche Arten von \l':\r,i :;t;!rn, «lie in dun »Speicher gemäß Fig. l'> voruen-lnt i/jrlen
IjI)'JO 70/076 1
Fig. Ιο, K), ?')Α und 2f)\\
eine I)Hi1S fco L Lung, (ILo zeigt, wie Zeichen durch das ο,7£;ton in So-y.ionfco aiir.";:-:;£;oa L fco t worden,
Fig. ·' eine ilarsfce L 1 mir;, die 7,0 igt, υίο die Z-ihi "7" in d;i.-i lipe» icher go:ml$ FLf-. '1^j gespeichert wird,
Fi';. '_'<.! und '.''> ο in'.1 Durste L Lung ^rornilii Fig. 21, Ln der ge-7,0 Lgt ist, wLo auduro ZoLchon in dem Speicher geriil) Ki;·;. l;i i-;of »pt ? icihori; v;erd(;n,
1''L^- ;'4A und '^kM t: i ru,· L.j^Lycho Anordnung zum Steuern des in Kif,·. Vj ijiizoi^fcen Spi!Lchorn, und
Fi 17. '-H> oiiio D'u-.'jfco 1 I w.ir,, Ln (h;r {*■.;:', ο L n;fc ist, v/ie das in i'i·-. ,J..)B go.viisjfco ZoLcivMi in dom Speicher gem'iß l'ifj. I1' ab ge s pe ichex'fc wird.
I)Lc in f\>l ;;-:ii I .;n boüf-hr·Lfibono '/oi-richbung erkennt Zeichen dut';:h '/Όΐ''./tmduri.·,· /on t\uir, Lhopo lo';i solion ('öden (QTG), d.h. durch (!)1;::j, di-i Inf'ir n.'it ion bij:',ügl. ich der Fora oder GeijfcaLfc yerijohLodoii'H· ',oichon b'.'Lnhalfcen und die selbsfcverijfcüiidL Ich solche I nforrrit; ion beinhalten isoLLen, die eine Unterseil;; i luiif; «ler /,(iich.Jti untereinander ermöglicht.
Fig. 1 '/,-!igt als Hc Ί'.ψ i el. die nögLichen QTO (nuarsitopologisch Mi (Jo-hiii) für· eine Zahl "4". Uird die ZahL einer fort 1 auI'ondtMi Abtastung entlang vertikaler Linien a bis J untei'uor-f-η, !./.)b:i ,] : 1-; Abtu:5tung ab'./ärts entlang den ent.'j})!' :ch-nd:ii I, in ion erfolgt, r.ü wird dt;r Beginn doii 7j(! Lcheji.i lui'1Ii die Vbhastung ent Lung d;r Iiinie a festgestellt, li·; Öffnung oinor Ausnehnung in den lieichen ii-d IV ;t , :'.t ;llt dut'.'h dLe Abtastung entlang der Linie c,
il) )') 'fl /D /fi I
das Schließen der Ausnehmung wird festgestellt durch die Abtastung entlang der Linie g, und das Ende des Zeichens wird durch die Abtastung entlang der Linie j festgestellt. Stellt man diese Zusammenhänge dar durch die oynbole "S" ("Start", Beginn des Zeichens), "0" ("Opening", Öffnung des Zeichens), "C" ("Closing", Schließen des Zeichens) und iipit («Finish", Ende des Zeichens), so läßt sich der gesamte QTC für das Zeichen "4" als "SOCF" auszudrücken.
Bevor dies?]be Technik auf weitere Zeichen angewandt wird, ist es notwendig, einige der Ausdrücke klarer zu definieren. Fig. 2a, 2b, 2c und 2d zeigen die Zeichenfornen, die entsprechend als "Beginn", "Öffnung", "Schlies-GGii" und "Ende" feststellbar sind. Die entsprechenden Codes sind mit S , 0 , C und F bezeichnet (der Index ν int hinzugefügt, um anzudeuten, daß die Abtastriehtung vertikal verläuft). Die ungefähren Rmkte, wo die entsprechenden Codes festgestellt werden, sind durch mit Pfeilen versehene Punkte angedeutet. Dementsprechend ist bei Anwendung der neuen Schreibweise und der Definitionen gemäß den Fig. 2a bis 2d auf die Zahl "4" von Fig. 1 der gesamte QTC für die Zahl "4":"SV 0y Cv Fv".
Fig. 3 zeigt die Zahl "7"» die dem gleichen Abtastvorgang unterworfen ist. Bei Anwendung der in Fig. 2a bis 2d gegebenen Definitionen auf die Zahl "7", wie sie in -^•ig· 3 gezeigt ist, werden zwei Anfangspunkts durch die Abtastung entlang der Linie a festgestellt, ein Schließen wird festgestellt durch die Abtastung entlang der Linie g, und ein Ende wird festgestellt durch die Abtastung entlang der Linie j. Der QTC für die Zahl "7" ist dementsprechend "3V Sv Cv Fv".
H 0 9 8 ? f) / 0 7 G 1
27A9222
Aus der obigen Beschreibung v/ird deutlich, daß der QTC für die Zahl "7" sich von dem QTC für das Zeichen "4" unterscheidet, wodurch eine Unterscheidung der zvrei Zahlen ermöglicht wird.
Die unter Bezugnahme auf die Figuren 1 bis 3 kurz beschriebene Methode könnte beispielsweise durch Verwendung einer vertikal angeordneten Spalte von Fotozellen und durch Bewegen dieser Spalte von Fotozellen in einer horizontalen Richtung über jedes zu erkennende Zeichen implementiert werden. Man erkennt, daß die Codes Sv, 0 , C und F durch eine entsprechende Logik leicht erkennbar sind.
Fig. 4 zeigt die Zahl "0", die der selben Abtasttechnik wie in den Fig. 1 und 3 unterworfen wurde.
Durch Anwendung der Definitionen gemäß den Fig. 2a bis 2d bei Fig. 4 wird deutlich, daß der Code 3γ durch die Abtastung entlang der Linie a festgestellt wird, daß 0 durch Abtastung entlang der Linie c, C durch Abtastung entlang der Linie 1 und Fy durch Abtastung entlang der Linie η festgestellt werden. Somit lautet der QTC für die Zahl "0":"Sv 0v Cv Fv" - und ist daher
das Zeichen "V zu unterscheiden.
"0":"Sv 0v Cv Fv" - und ist daher nicht von dem QTG für
Die soweit beschriebene Technik ist somit nicht zufriedenstellend, um einheitlich bestimmte Zahlen zu unterscheiden und ist selbstverständlich noch weniger befriedigend, wenn handgeschriebene Zahlen unterschieden werden sollen.
Fig. 5 zeigt eine modifizierte Form der bisher beschriebenen Abtasttechnik.
809820/0761
-α- 27A9222
In Fig. 5 ist eine Zahl "4" gezeigt, die einer vertikalen Abtastung entlang der Linien a bis j, einer horizontalen Abtastung entlang der Linien k bis v, einer schrägabfallenden Abtastung entlang der Linien a1 bis j1 und einer schrägansteigenden Abtastung entlang der Linien k1 bis r1 unterworfen ist. Wie zuvor werden der jeweilige Beginn, das Ende, die öffnung und das Schließen des Zeichens aufgezeichnet, so wie sie durch die Abtastungen entlang der verschiedenen Linien festgestellt werden.
Fig. 6a, 6b, 6c und 6d definieren die Zeichenformen, die jeweils am Beginn ("Sj1")» Öffnungen ("0h"), Schließungen ("Ch") und Ende (11Pj1 11) für die horizontale Abtastung erkannt werden. Auf ähnliche Weise definieren die Fig. 7a, 7b, 7c und 7d die Zeichengestaltung, die als Beginn ("Sd"), Öffnungen ("0d"), Schließungen (nGd") und Enden ("Fd") für die schrägabfallende Abtastung erkannt werden, und die Fig. 8a bis 8d definieren die Zeichenformen, die erkannt werden als Beginn ("S"), öffnungen (11O'1),
8 el
Schließungen ("C ") und Enden (11F ") für die schrägansteigenden Abtastungen erkannt werden.
Durch Anwenden der Definitionen gemäß den Fig. 2a bis 2d, 6a bis 6d, 7a bis 7d und 8a bis 8d auf die Zahl "4", wie sie in Fig. 5 gezeigt ist, werden, wie man leicht sieht, folgende Codes festgestellt:
809820/0761
Tabelle
ibtastzeilen
a c
b1 c1 e1
h1 Ü1 I1 m' o1 q'
festgestellter
0.
809820/0761
Aus der Tabelle ist ersichtlich, daß die erweiterte Abtasttechnik ermöglicht, die Zahl "4" von der Zahl "O" zu unterscheiden, weil die erweiterte Abtasttechnik ermöglicht, sowohl die untere Ausnehmung der Zahl "4-" als auch die durch den "Schwanz" der Zahl "4" gebildeten Ausnehmungen zu erkennen; keine dieser Ausnehmungen könnte durch einfache vertikale Abtastung gemäß Fig. 1 erkannt werden.
Die Art und Weise, in der eine Abtasttechnik, die in Zusammenhang mit Fig. 5 beschrieben wurde, implementiert werden kann, soll im folgenden ausführlicher beschrieben werden.
Wie oben bereits kurz erwähnt, kann die Abtasttechnik durch ein Feld von Fotozellen ausgeführt werden, welches in Form von nebeneinanderliegenden Spalten angeordnet ist (der Ausdruck "Spalte" soll eine Zeile von Fotozellen andeuten, die bezüglich der normalen Orientierung eines Zeichens beim Lesen lotrecht hierzu angeordnet ist). Die Fotozellen können in einem Lesekopf vorgesehen sein, der so ausgebildet ist, daß er in einer horizontalen Richtung (d.h. lotrecht zu der definierten Richtung der Spalten) bezüglich der Leserichtung des Zeichens bewegt werden kann. Bei fortdauernder Bewegung können die Ausgangsgrößen der Fotozellen (d.h. "schwarz" oder "weiß", abhängig davon, ob die Fotozellen das Vorhandensein oder Nichtvorhandensein eines Zeichenteils feststellen) in einen Speicher übertragen werden, der somit am Ende des Abtastvorgangs ein Abbild des Zeichens in Ausdrücken von "schwarzen" und "weißen" Fotozellen-Ausgangsgrößen speichert, wobei der Speicher funktionell so betrachtet werden kann, als besitze er eine -aus Speicherplätzen bestehende Matrix aus Spalten und Reihen. Diese Speicherplätze können dann sequentiell in einer derartigen Reihenfolge abgefragt werden, da3 die vertikalen, horizontalen, schräg ansteigen-
809820/0761
den und schräg abfallenden Abtastungen, die oben erwähnt wurden, ausgeführt werden,und die Speicherausgangsgrößen können dann verarbeitet werden, um als Ausgangssignale die Codes Beginn ("S"), Öffnen ("0"), Schließen ("C") und Ende ("F") abzugeben. Fig. 9 zeigt ein Blockdiagranim einer derartigen Einrichtung. 3ine höher entwickelte Technik ist in einem Artikel des Erfinders beschrieben, der den Titel "Sequentially-Local Picture Operators" trägt und in den "proceedings of the Second International Joint Pattern Recognition Conference, Copenhagen, 1974·" veröffentlicht wurde.
Wie aus der Zeichnung hervorgeht, ist das aus Fotozellen bestehende Feld 20 durch einen Datenkanal 22 mit einem Datenspeicher 24 verbunden. Wenn das Fotozellenfeld horizontal über das Zeichen bewegt wird, werden die Ausgangssignale der Fotozellen in entsprechende Speicherstellen innerhalb des Speichers 22 über einen Datenweg 2Pt geführt. Daher kann z.B. nach einem Überstreichen des Zeichens durch das Fotozellenfeld der Inhalt des Speichers 22 das schematisch in Fig. 10 angedeutete Aussehen haben, wenn angenommen wird, daß der Buchstabe "4-" gelesen wurde. In Fig. 10 ist das Feststellen eines Zeichenteils durch eine Fotozelle in Form eines "X" angedeutet, während eine Leerstelle angibt, daß die Fotozelle das Nichtvorhandensein eines Zeichenteils festgestellt hat. In Fig. 10 ist zur Unterstützung der Zeichenerkennung eine Umrandungslinie um die gespeicherten Fotozellenausgangsgrößen gezeichnet.
Daran anschließend können unter Zuhilfenahme einer entsprechenden Logik 26 die Speicherstellen in entsprechenden Folgen abgefragt werden, so daß die vertikale, horizontale, schräg ansteigende und schräg abfallende Abtastung durchgeführt wird, wie es oben in Zusammenhang mit Fig. 5 beschrieben wurde. Sind die Speicherstellen
809820/0781
abgetastet, so werden die Ausgangsgrößen an eine Coderlogik 23 gegeben, die ebenfalls durch die Abfragelogik 26 gesteuert wird. Die Logik 28 erzeugt die Codes für Beginn ("S"), öffnung ("0"), Schließen ("C") und Ende (11F") auf den Leitungen 30, 32, 34- und 36 für jeweils die vertikale, horizontale, schräg ansteigende und schräg abfallende Abtastung. Die Codes können in den Puffern 38, 40, 42 und 44 gespeichert werden und dann der Zeichenerkennungslogik 46 zugeführt werden, welche die Kombination der ihr angebotenen QTC analysiert, und zwar gemäß einem vorbestimmten Algorithmus, um so das Zeichen zu erkennen.
Im folgenden sollen ausführlicher die von der Codierlogik 28 ausgeführten Operationen beschrieben werden.
Die Fig. 11a bis 11p zeigen die Zeichenkonturen aus den Fig. 2a bis 2d, 6a bis 6d, ?a bis 7d und 8a bis 8d, die in Form von Fotozellen-Ausgangsgrößen aufgezeichnet sind. Sie definieren die speziellen Muster der Foto.-i Zellenausgangsgrößen, die als den Codes S , 0 , C und F und den Codes für die horizontale, schräg abfallende und schräg ansteigende Abtastung entsprechende Größen erkannt werden. Wie bereits oben deutet auch hier der Punkt in jeder Figur an, wo der entsprechende QTC tatsächlich festgestellt wird. Fig. 11q zeigt, wie ein Extracode, S1 , definiert ist. Der Zweck dieses Codes wird weiter unten ausführlicher erklärt. Kurz gesagt, zeigt dieser Codes die mögliche Abtastung eines neuen Strichs eines Zeichens an - jedoch wird der Code nicht wirksam (d.h., er wird nicht herangezogen, um einen neuen Zeichenstrich anzuzeigen), bis dies durch einen nachfolgenden Code Sy bestätigt wird.
80 98 ZO/&7 61
Zum Feststellen der QTC für die vertikale und horizontale Abtastung v/erden die gespeicherten Fotozellen-Ausgangsgrößer, paarweise abgefragt. Das bedeutet, daß im Fall der vertikalen Abtastungen die benachbarten Spaicherstellen in zv/ei nebeneinanderliegenden Spalten gleichzeitig abgefragt werden; die nächsten zwei Speicherplätze in zwei angrenzenden Reihen v/erden zuerst abgefragt; dann werden die nächsten zv/ei Speicherstellen rechts davon abgefragt; so wird der Vorgang fortgesetzt bis zum Ende dieser Reihen. Die Abtastung wird dann um eine Reihe verschoben und der Vorgang wiederholt. Um den Stör- oder "Rausch"-Effekt zu vermindern, ist es vorteilhaft, einen aufwendigeren Abtastvorgang zu verwenden, in dem drei Abtaststellen gleichzeitig abgetastet v/erden.
Im Fall der schrägen Abtastungen ist es notwendig, die Speicherstellen in fünf Spalten gleichzeitig abzufragen, un"-Mehrdeutigkeiten zu vermeiden, obschon natürlich beim Fortschreiten jeder Abtastung die fünf Spalten, deren Speicherstellen inspiziert werden, wechseln, indem, eine Spalte für jeden Schritt der Abtastung nach rechts verschoben wird, um die Schrägneigung der Abtastung zu bewirken.
Am Ende jeder Abtastzeile wird das System automatisch zurückgesetzt.
Aus dem oben Gesagten wird klar, wie bei der Verwendung von vier Abtastungen, der vertikalen, horizontalen, schräg abfallenden und schräg ansteigenden Abtastung, eine Anzahl von Zeichen seperat erkannt werden können. Jedoch können immer noch Mehrdeutigkeiten auftreten, insbesondere in Fall von handgeschriebenen oder schlecht gedruckten Zeichen. So zeigt z.B. Fig. 12 eine einfache Form der Doppeldeutigkeit, die möglicherweise auftreten kann. Hier ist das
809820/0761
27A9222
Zeichen "1" (eine handgeschriebene 1 ohne einen Querbalken), ein "/" und ein "-" gezeigt. Unter diesen Zeichen ist jeweils in vergrößerter Darstellung das entsprechende Abbild aufgezeichnet, wie es durch das Fotozellenfeld festgestellt und in den Speicher 24 gespeichert wird; die Uinrißlinien sind zur Erleichterung des Verständnisses eingezeichnet. Ferner sind in der Fig. 12 die QTC eingetragen. Es ist klar zu sehen, daß die QTC für diese drei Zeichen identisch sind und daher nicht dazu verwendet werden können, die Zeichen zu unterscheiden.
Als weiteres Beispiel zeigt Fig. 13 zwei handgeschriebene Zahlen, nämlich "3" und "7" (bei der letztgenannten Zahl handelt es sich um eine "7", die in der in vielen Ländern üblichen Schreibweise mit horizontalem Balken geschrieben ist). Unter den Zahlen sind ihre sich ergebenden Abbilder gezeichnet, wie sie in dem Speicher 24 nach Abtastung durch das Fotozellenfeld gespeichert sind, wobei die ausgezogene Umrißlinie zwecks Erleichterung des Verständnisses eingezeichnet wurde. Ferner sind in Fig. 13 die Punkte eingezeichnet, in denen die verschiedenen QTC festgestellt werden. Die an den QTC vorgesehenen oberen Indizies sollen dazu dienen, jedes QTC einem bestimmten Segment des Zeichens in einer noch zu beschreibenen Weise zuzuordnen. Eine Analyse der QTC für die zwei Zahlen zeigt, daß sie identisch sind und die QTC aus diesem Grund nicht dazu verwendet werden können, um die beiden Zahlen zu unterscheiden.
Ein weiteres Beispiel ist in Fig. 14 gezeigt. Hier handelt es sich um das Zeichen für "größer als" (">") und um die geschlossene Klammer (")"). Es ist wiederum klar, daß die QTC für beiden Zeichen gleich sind.
809820/0761
In jedem Fall (Fig. 12, 13 und 14) kann jedoch festgestellt werden, daß es Unterschiede in den Verhältnissen Höhe/Breite und in der neigung der Zeichen oder in Teilen der Zeichen gibt.la Fall der Fig. 12 sind, wenn man annimmt, daß die x- und y-Koordinaten (bezüglich eines vorbestimmten Bezugpunktes) für jeden der QTC bekannt sind, die Höhen/ Breiten-Verhältnisse (h/w) der Zeichen gegeben durch die Gleichung:
h/w = (ys - 7j )/Cx? - xs ) CO
a h b. ν
während die Neigung (s) gegeben ist durch
(-.', - y- )/(xo - Xu ) C2).
h. h ii ö
Die Gleichungen (1) und (2) können verallgemeinert in der Form
geschrieben werden.
Man sieht, daß Gleichung (1) und (2) Spezialfälle der Gleichung (3) sind, wobei eine der Komponenten jedes Abstandes in der letztgenannten Gleichung den Wert null hat.
Bei Anwendung der Gleichung (3) zum Unterscheiden der zwei in Fig. 13 gezeigten Zeichen können verschiedene Eigenschaften der unteren Ausnehmungen der beiden Zeichen inspiziert werden. So z.B. kann ein erster Test (T^) das Ausmessen des Verhältnisses der Länge der Linie M zu der Länge der Linie N für jedes Zeichen umfassen, wobei die Längen dieser Linien bestimmt wenden durch die x- und y-Koordinaten der Punkte S2 v, C2 y und s' . Ein zweiter Test (T2) könnte das
809820/0761
Ausmessen des Verhältnisses der Längen der Linien P und Q für jedes Zeichen umfassen, wobei die Längen dieser Linien "bestimmt sind durch die x- und y-Koordinaten der Punkte S2 V, C2 d und S3 V.
Durch Anwendung der Gleichung (3)i um die zv/ei in Fig. 14-gezeigten Zeichen zu unterscheiden, könnte ein erster Test, T^, die Berechnung des Verhältnisses des horizontalen Abstandes vzwischen den QTC S^ und F zu dem horizontalen Abstand zwischen den QTC S^ und S'v umfassen. Ein zweiter Test, To, könnte die Berechnung des Verhältnisses des vertikalen Abstandes zwischen den QTC F. und F zum vertikalen Abstand zwischen den QTC S^ und Fj1 umfassen. Somit gilt
und
T2 - **d - X
Somit ergibt sich z.B. unter Amiendung von T^ und T2 auf die in Fig. 14· gezeigten Zeichen und bei Skalierung gemäß der Zeichnung:
(a) T1 - 4 - * , für■·">■", und
T1 » 2 ,für ")";
(b) I2 = Λ , für H> », und
T2 - Λ ,für ··)'·.
Diese Ausdrücke würden daher eine klare Unterscheidung zwischen den Zeichen "V und ")" ermöglichen.
Es versteht sich, daß solche Tests für Mehrdeutigkeiten zwischen anderen Zeichen erdacht werden können.
809820/0761
SS.
Daher ist es notwendig, einen Weg zu finden, un die Koor^ ' ^Z dinaten der QTC für jedes Zeichen in einer Art und Weise zu speichern, die es ermöglicht, daß auf diese Koordinaten leicht zugegriffen werden kann, um sie dann zum Ausführen verschiedener Tests zu verwenden. Dieses soll im Folgenden beschrieben werden.
Um diese Funktion auszuführen, ist es notwendig, daß die QTC für jedes Zeichen in einer Weise gespeichert werden, die ein Erkennen ihrer relativen Lage innerhalb des Zeichens ermöglicht, und es ist notwendig, daß dies erreicht werden kann, obschon kleinere Störungen des Zeichens die Reihenfolge, in der die QTC gelesen werden, ändern können. So z.B. kann eine "3" in verschiedener V/eise geschrieben werden; so können z.B. entweder der obere Strich oder der unterste Strich weit nach links herausgezogen sein und somit als Erste festgestellt werden (durch die erste Spalte des Fotozellenfeldes). In jedem Fall muß das System sicherstellen, daß der QTC des ersten erkannten Teils des Zeichens als daßjenige erkannt wird, daß zu dem richtigen Teil des Zeichens gehört.
Um diese Funktion auszuführen, ist die Vorrichtung mit einem Speicher ausgestattet (er wird als Katrix-Speicher bezeichnet), der eine Anzahl von Registern (von denen jedes eine Anzahl von Speicherstellen umfaßt) enthält, die funktionell in einer vorbestimmten Weise angeordnet sind.
Wie in Fig. 15 gezeigt ist, enthält der Matrixspeicher zwei Arten von Registern: einen ersten Registertyp, der dazu verwendet wird, jene Code zu speichern, die konkaven Abschnitten der Zeichen entsprechen (diese Register sind in der Fig. als Sechsecke dargestellt), und einen zv/eiten Registertyp zum Speichern derjenigen QTC, die konvexen Abschnitten der Zeichen entsprechen (diese Regidsr sind als Quadrate in der Fig. dargestellt). Die Register sind
in alternierender V/eise in einer aus Reihen und Spalten bestehenden Katrix angeordnet, wie es in Fig. 15 gezeigt ist. Die Spalten und Reihen sind nuneriert, bzw. nit Buchstaben versehen, so daß jedes Register durch Koordinatenangabe identifiziert werden kann; so z.B. ist das Register 2-a einen konvexen Abschnitt speicherndes Register in der zweiten Spalte und ersten Reihe des Matrixspeichers.
Unter Bezugnahme auf die Figuren 11a bis 11 q erkennt man, daß die folgenden QTC Formen repräsentieren, die sich auf konkave Abschnitte oder Teile davon beziehen:
oa, ov, od, ch, ca, cv, cd, On.
Im Gegensatz hierzu repräsentieren die folgenden QTC Formen, die sich auf konvexe Abschnitte oder Teile davon beziehen:
Sa' SV Sv' Sd' pFv' Fa' Ed' Sh*
In einer noch zu beschreibenden Weise wird jeder QTC (quasitopologischer Code) gelesen . und einem entsprechendes Register innerhalb des Matrixspeicher zügel eitet, so daß am Ende des Lesevorgangs die relativen Positionen der Register, in denen die QTC gespeichert sind, die Form des Zeichens zumindest annäherungsweise repräsentieren.
Wie schon gesagt wurde, enthält jedes Register innerhalb des Matrixspeichers eine vorbestimmte Anzahl von Speicherstellen - wobei acht derartige Speicherstellen für jedes Register einen konkaven Abschnitt und neun derartige Speicherstellen für jedes Register einen konvexen Abschnitt repräsentieren. Jede Speichersteile in einem Register ist einem bestimmten QTC zugeordnet und wird aktiviert (d.h. in einen clatenspeichernden Zustand geschaltet), wenn der entsprechende QTC festgestellt wird.
809820/0761
Fig. 16 ^eigt eines der Register des Iiatri::speichers, welches ZU3 Speichern eines konkaven Abschnittes dient und illustriert in diagrammähnlichor Weise die acht Speichersteller, des Registers und zeigt an, welche Speicherstelle velclae.:· QTG zugeordnet ist.
Fig. 17 zeigt dasselbe für ein Beispiel eines Speicher- ■ registers für einen konvexen Abschnitt.
Um den QTC-Speichervorgang auszuführen, teilt das System jedes Zeichen in Segnente auf (durch vertikale Linien getrennt), wobei die Segmente Zeichenabschnitte darstellen, die Einbuchtungen umklammern.
Die Fig. 18 und 19 illustrieren, wie ein Zeichen in derartige Segaente aufgespaltet wird.
Fig. 18 zeigt eine "0". Die Feststellung des QTC S'v (gefolgt durch einen Bestätigungscode Sv) wird durch das System erkannt als Anzeige für den Beginn eines ersten Segments A. Taucht der Code 0 auf, so antwortet das System durch Beginnen eines neuen Segments, nämlich des Segments B. Wird der Code C festgestellt, so gilt die Vereinbarung, daß das untere Segment B als beendent betrachtet wird und daß das obere Segment A fortfährt.
Fig. 19 zeigt den selben Vorgang angewendet auf die Zahl "7". Hier wird der obere Balken der Zahl zuerst festgestellt, und der entsprechende Code S'v (gefolgt durch den Bestätigungscode S) identifiziert diesen Teil eines ersten Segments, nämlich des Segments A. Erzeugt ein nachfolgender vertikaler Abtastschritt einen Code S1 für den unteren Balken der Zahl (gefolgt durch den Bestätigungscode S), so wird ein zweites Segment B identifiziert. Taucht der Code C auf, so wird das Segment B beendet,während das Segment A weiterhin besteht.
809820/0761
ar
Die Figuren 2OA und 203 zeigen denselben Vorgang angewendet auf zwei unterschiedliche Darstellungen der Zahl "2". Sin Vergleich der Figuren 2OA und 203 verdeutlicht, daß es in den einen Fall das untere Segment ist, das anfangs festgestellt wird, während in dem anderen Fall es sich -on das obere Segment handelt. In einer noch zu beschreibenden Weise stellt das System sicher, daß in jedem dieser Fälle der QTC, der den unterschiedlichen Segmenten entspricht, korrekt in dein Matrixspeicher positioniert wird.
Wie in den Figuren 2OA und 203 gezeigt ist, wird bei Feststellung des Codes 0 ein neues Segment begonnen, nämlich das Segment C (auf dieselbe Weise, wie es in Fig.18 angedeutet ist).
Fig. 21 verdeutlicht als ein erstes Beispiel, wie der QTC, der der Zahl "7" entspricht, in den Matrixspeicher abgespeichert wird.
Die Figur zeigt eine Darstellung der Zahl, und die an dieser Zahl angebrachten Zahlenwerte zeigen die Reihenfolge an, in der die QTC festgestellt werden. Der tatsächliche durch die Zahlerwerte repräsentierte QTC ist folgender:
809820/0761
at?
Tabelle 2
QTG
ffr.
Amp
1 S'v
2 , Sv
3 S'v
4 Sv
5 Sa
6 Sd
7 Sd
8 Fh
9 Fa
10 Cv
11 Cd
12 Sh
13 Fd
14
809820/0761
Diejenigen Stellen in dem Matrixspeicher, in denen die QTC gespeichert sind, sind durch kleine Kreuzchen gekennzeichnet .
Man sieht, daß der QTC Nr. 1 der Code S'v ist und den Start eines Segments, nämlich des Segments A anzeigt. Da dies das erste festgestellte Segment ist, wird dieser Code in den entsprechenden Speicherstellen im Register 1-a abgespeichert. QTC Nr. 2 ist der Code 3γ und wird in dein Register 1-a gespeichert. QTC Nr. 3 ist ein zweiter Code S1 , und er zeigt (nach Bestätigung durch den folgenden Code S , den QTC Nr. 4) den Beginn eines separaten Segments, des Segments B, an und muß daher in dem nächsten zur Verfügung stehenden Register für konvexe Bereiche, dem Register 1-c abgespeichert werden.
Dieser Vorgang fährt fort, wobei die QTC mit den Nummern 5, 6, 7» 8 und 9 in der dargestellten Weise abgespeichert werden.
Das Auftreten des QTC Nr. 10, d.h., des Codes Cv zeigt die Beendigung des unteren Segmentes B an. Dieser QTC, sowie der nachfolgende QTC mit der Nr. 11 (der Code C,) werden in dem Register für konkave Abschnitte (Register 1-b) zwischen den Registern 1-a und 1-c abgespeichert.
Die Beendigung des Segmentes 3 stellt sicher, daß die verbleibende QTC mit den Nummern 12, 13 und 14, obschon sie noch mit dem Segment A in Zusammenhang stehen, in einem unterschiedlichen Register für konvexe Abschnitte, dem Register 2-b, gespeichert werden, weil die Beendigung des Segmentes B anzeigt, daß das Segment A sich nach rechte hin fortsetzt.
Am Ende des Abtastvorgangs speichern daher die Register 1-a, 2-b und 1-c Daten, zusammen mit dem Register 1-b für konkave Abschnitte. Die Buchstaben A und B zeigen an,
809820/0761
at?
v/elclie Segmente der Zeichen in den Registern gespeichert sind. Es wird deutlich, daß aa Ende des Abtastvorgangs die aktivierten Speicherregister für konvexe Abschnitte physikalisch derart in Bezug aufeinander angeordnet sind, daß sich in etwa die Form der Zahl "7" ergeben; in der Zeichnung wurden zur Verdeutlichung dieses Umstandes die betreffenden Register schraffiert. In einer weiter unten . noch ausführlicher zu erklärenden Weise wird dieser Umstand als Teil des Gesarat-Erkennungsvorgangs ausgenutzt.
Fig. 22 und 23 zeigen, wie der Matrixspeicher die Zeichen ">'! und ")" abspeichern. Für ^edes Zeichen ist der QTC derselbe; sie werden wie folgt gekennzeichnet (die Zahlen beziehen sich auf die in den Figuren an den Zeichen angebrachten Ziffern):
Tabelle 3
QTC
No.
QTC
1
2
3
4
5
6
7
8
9
B\
Sv
ßlv
Sv
Öa
\
Cv
Fv
809820/0761
Wiederum "bilden die aktivierten Speicherregister für konvexe Abschnitte in den Figuren 22 und 23 eine in Bezug aufeinander den jeweiligen Zeichen ähnelnde Formen.
Jedes Register in dem Matrixspeicher "besitzt ein dazugehöriges entsprechendes Adressregister (nicht gezeigt), und jedes Adressregister besitzt eine Speicherstelle, die einem speziellen Speicherplatz in dem zugehörigen Matrixspeicher-Register entspricht. Wenn ein QTC in den entsprechenden Speicherplatz in einem der Register des Matrixspeichers gespeichert wird, so wird seine Adresse (d.h. die Koordinaten, die seine Position in der Matrix der Abtast-Fotozellen kennzeichnen) automatisch in der entsprechenden Stelle des Adressregisters gespeichert.
In den oben betrachteten Beispielen war die Gestalt oder Form jedes Zeichens, z.B. der Zahl "7" (Fig. 21) derart, daß das jeweilige obere Segment, das Segment A, eher abgetastet wurde als das untere Segment, das Segment B, und aus diesem Grund wurden die QTC der Segmente in Registern für konvexe Abschnitte gespeichert, deren relative Position richtig war (d.h. richtig in Bezug aufeinander gemäß der Gestalt des Zeichens).
In vielen Fällen kann die Form des Zeichens derart sein, daß ein unteres Segment zuerst abgetastet wird, und daher rau3 das System so ausgelegt sein, daß dies festgestellt wird, und es muß sichergestellt werden, daß am Ende des Speichervorgangs die Segmente in die richtigen Register gelangt sind.
So z.B. hat die Zahl "2" von Fig. 2OA eine derartige Gestalt, daß ihr oberes Segment A vor dem Abtasten des unteren Segments 3 durch den Abtastvorgang festgestellt wird, und die Segmente werden somit zu Beginn in die richtigen Register für konvexe Abschnitte innerhalb der Speicher-
809820/0761
matrix gespeichert.
Hat jedoch die "2" die in Fig. 2OB gezeigte Gestalt, so wird das untere Segment, das Segment B, durch den Abtastvorgang vor dem Feststellen des oberen Segments A erkannt. Um dieser Situation gerecht zu werden, enthält das System eine in den Figuren 24-A und 24-B gezeigte logische Anordnung, die aus einem FIFO-Speicher (FIFO, Speicherprinzip: first in - first out) 80 mit Ausgangsregistsrn 82 und 84-, sowie einem Eingangsregister 86 besteht. Im folgenden soll in Zusammenhang mit den Fig. 24-A, 24-3 und 25 (letztere zeigt eine Darstellung des Matrixspeichers) der Vorgang beschrieben werden, der beim Speichern der QTC, die die "2" gemäß Fig. 2OB repräsentieren, stattfindet.
Die logische Anordnung gemäß den Fig. 24-A und 24-B wird durch die QTC selbst gesteuert, insbesondere durch die QTC S' und 3 .
V ν
Wenn der Abtastvorgang zum Abtasten der Zahl "2" gemäß Fig. 2OB beginnt, wird zu Beginn das Segment B festgestellt, und die QTC hierfür v/erden in das erste Register für konvexe Abschnitte, das Register 1-a (Fig. 25) gebracht, wie es durch die gepunktete Darstellung des Buchstaben "3" angedeutet ist. Gleichzeitig wird ein Code, der dieses Gegrient B identifiziert, in den Fli'O-opeicher 80 durch das Eingangsregister 85 eingegeben, und wird automatisch diirch die Register 80 und 82 in das End-Ausgangsregister 84- geschaltet, wie in Fig. 24-A zu sehen ist.
Beim Fortgang des Abtastvorgangs wird der erste Teil des oberen Segmentes A festgestellt. Das obere Segment A wird durch das Auftreten seiner QTC 3' und 3 entdeckt, und da das System (welches am Ende jeder Abtastzeile zurückgesetzt wird) diese Codes vor irgendeinem anderen QTC in
809820/0761
der Abtastzeile feststellt, erkennt das System daher, daß das Segment A oberhalb des Segmentes B liegt. Daher wird ein Code, der das Segment A identifiziert, durch das Eingangsregister S5 in den PI?O-Speicher 80 eingegeben, und der Code wird automatisch durch die Register 80 und 82 in das abschließende Ausgangsregister 84· geschaltet, wobei aus diesem Register der Code, der das Segment B repräsentiert, entfernt wird; diese entfernte Code wird automatisch in das Register 86 zurückgeführt und läuft durch den FIFO-Speicher 80 in das Register 82. Die Codes nehmen schließlich eine Position ein, wie sie in Fig. 24-B verdeutlicht ist, d.h., der das Segment A repräsentierende Code befindet sich im Register 84- und somit über dem das Segment B repräsentierenden Code, der schließlich in das Register 82 gelangt. Diese Abwärtsverschiebung des das Segment B repräsentierenden Codes veranlaßt automatisch die QTC in dem Register 1-a des Watrixspeichers, daß sie in das Register 1-c verschoben werden, wie es in der Zeichnung durch den Pfeil I angedeutet ist; ferner wird hierdurch sichergestellt, daß die QTC, die das Segment A repräsentieren, in das Register 1-a gespeichert werden.
Aus diesem Grund sind die Segmente in ihren richtigen relativen Positionen innerhalb des Matrixspeichers gespeichert.
Beim Fortfahren des Abtastvorganges wird der Code C auf die in Fig.25 dargestellte Weise festgestellt und zeigt somit das Ende des Segments B an. In der Art und Weise, die oben in Zusammenhang mit Fig. 4· erläutert wurde, werden weitere QTC für das Segment A in dem nächsten Register, dem Register 2-b, auf der rechten Seite gespeichert, weil der Code Cv anzeigt, daß das Segment A sich noch weiter nach rechts hin erstreckt.
809820/0761
Auf ähnliche Weise zeigt die Feststellung des Codes O r das Ende des Segments B und den Beginn eines neuen Segments, des Segr-errjs C an, welches auf die rechte Seite des Segmentes 3 verschoben v/erden muß. Der QTC für das Segment C wird somit in dem Register 2-d gespeichert.
Man erkennt, daß während des οDigen Vorgangs die QTG für . die konkaven Bereiche X und Y (siehe Fig. 25) in den Registern für konkave Abschnitte 1-b, bzw. 2-c gespeichert v/erden.
Am Ende des Abtastvorgangs speichern somit die Register für konvexe Abschnitte 1-a, 1-c, 2-b und 2-d die QTC, wie es durch schräge Linien angedeutet ist, wobei die relativen Positionen in dem Matrixspeicher näherungsweise die Gestalt der Zahl "2" aufweisen.
Wenn die logische Anordnung, die in den Fig. 24A und 24-B gezeigt ist, feststellt, daß eine Verschiebung der QTC-Daten von einem Register für konvexe Abschnitte innerhalb des Matrixspeichers zu einem anderen Register in der beschriebenen Weise notwendig ist, so stellt die logische Anordnung automatisch sicher, daß die Adressdaten in den zugehörigen Adresspeichern entsprechend verschoben werden.
Die obige Diskussion zeigt, wie eine logische Folge von binären Entscheidungen durchlaufen werden kann, um einen vollständigen Zeichenerkennungsvorgang zu bilden.
Zu Beginn wird das Zeichen in der beschriebenen Weise gelesen, am Ende des Lesevorgangs werden die Zeichensegmente in ihren entsprechenden relativen Positionen innerhalb des Matrixspeichers abgespeichert, und die Koordinaten adressen der QTC werden in entsprechenden Adressregistern
809820/0761
abgespeichert. In anderen Worten: die gesamten QTC (quasitopologischen Codes) für die Zeichen sind zusanmenidt ihren relativen Koordinatenpositionen bekannt.
Der erste Schritt ira Erkennungsvorgang besteht aus der Inspizierung des Matrixspeichers und in der Betrachtung der relativen Positionen der Register, in denen Segmente gespeichert sind. Dieeer Vorgang resultiert wahrscheinlich nicht in einer vollständigen Erkennung des Zeichens. So z.B. zeigen die Fig. 21 bis 23, daß die Register innerhalb des Matrixspeicher, die Segmente speichern, im Pail von drei verschiedenen Zeichen ("7", ">" und ")") identisch sind, obwohl es sich tun unterschiedliche Zeichen handelt. Jedoch wird wenigstens dieser Teil der Erkennungsabfolge eine große Anzahl in Frage könnender Zeichen eliminieren.
Der nächste Schritt bei der Erkennungsabfolge besteht darin, die tatsächlichen QTC zu inspizieren. Selbst wenn die aktuellen Register, die Zeichensegnente in dem Matrixspeicher speichern, es nicht ermöglichen, zwischen zwei Zeichen (z.B. "7", ">" und ")") zu unterscheiden, so kann es jedoch sein, daß der aktuelle QTC (gespeichert innerhalb des Hatrixspeichers) ein spezielles Zeichen exklusiv kennzeichnet. Dies hängt bis zu einem gewissen Maß von dem Bereich der Zeichen ab, welche das System zu behandeln vermag; je größer dieser Bereich ist, je geringer ist die Wahrscheinlichkeit, daß die tatsächliche Identität der QTC eine exklusive Zeichenerkennung erlaubt. So z.B. besitzen die Symbole M>" und H)M die selben QTC und belegen die selben Register für konvexe Abschnitte innerhalb des Matrixspeichers. Andererseits unterscheidet sich der QTC von "711 etwas von dem QTC der Zeichen ">" und Ό11» weil die beiden letzteren Zeichen nicht den QTC Cj aufweisen; dies ist der Fall, obschon die Zeichen "7" ">" und ")" dieselben Register ifür konvexe Abschnitte innerhalb des Matrixspe^gaj J^yJf1
-ry-
Der dritte und abschließende Schritt des Srkennungsvorgangs zum unterscheiden zwischen den Zeichen, die dieselben !Register für konvexe Abschnitte innerhalb des Hatrixspeichers belegen und ferner die selben QTC aufweisen, besteht in den Durchführen der metrischen Tests, wie sie oben in Zusammenhang mit den Fig. 12, 13 und 14- beschrieben wurden. Das System identifiziert hierbei durch spezielle Tests, UI2 auf der Grundlage derjenigen Information weiterzuarbeiten, die aus den vorhergehenden Polgen des Erkennungsvorgangs erhalten vmrden. In anderen Worten: in diesem Stadium des Erkennungsvorgangs hat das System die meisten Möglichkeiten eliminiert und weiß, daß das Zeichen eines aus einer beschränkten Gruppe sein muß; daher weiß das System, welche metrischen Tests ausgeführt v/erden müssen.
In der in Zusammenhang mit den Fig. 12, 13 und 14 beschriebenen Weise wählt daher das System gemäß dem speziellen metrischen Tes+ oder den auszuführenden Tests die entsprechenden QTC aus, ruft deren Koordinaten aus den Adressregistern ab und führt daran anschließend die notwendigen Berechnungen durch, um den Test oder die Tests durchzuführen. Dies ermöglicht eine abschließende Erkennung des Zeichens.
809820/0761

Claims (1)

  1. Patentansprüche
    Verfahren zum Identifizieren von Zeichen durch deren Gestalt, bei dem ein vorbestimmter Bereich, der eine Darstellung des zu identifizierenden Zeichens heinhaltet, einer Mehrzahl von Rahnenabtastungen unterworfen wird, dadurch gekennzeichnet, daß die Abtastungen mindestens drei Abtastvorgänge in jeweils eine unterschiedliche Richtung umfassen, daß bei jedem Abtastvorgang festgestellt wird, ob jedes in dem Bereich liegende, abgetastete Element einen Teil der Zeichendarstellung enthält oder nicht, daß jeder Abtastvorgang keinen, oder einen oder mehrere Codes gemäß den folgenden Bedingungen in Abhängigkeit von der Gestalt der Zeichendarstellung erzeugt:
    Beginn des Zeichens (8), Ende des Zeichens (F), Öffnung des Zeichens (0), Schließen des Zeichens (C),
    daß diese Codes ausgewertet werden, um die Zeichendarstellung in Segmente zu unterteilen, von denen jedes wenigstens teilweise eine Einbuchtung umschließt, daß diejenigen Codes jedes Segments, welche konvexen Formen entsprechen, in einem zu dem Segment gehörigen Teil der Speichereinrichtung gespeichert werden, und daß ein Identifizierungsvorgang dadurch
    809820/0761
    <oa») aaaaeo
    TELEX ΟΒ-9β3·Ο
    TELEeRAMME MONAPAT
    TELEKORtERCR
    begonnen --.-ird, da'; die funktioneilen Positionen in der Speichereinrichtung der· Teile der Speichereinrichtung, in denen die Codes gespeichert sind, verglichen werden.
    2. Verfahren T-3.o':i Anspruch 1 . dadurch ge kennzeich· net, daf: diejenigen Codes jedes Segmentes, die konkaven Formen entsprechen, in einen Teil der Speichereinrichtung gespeichert v/erden, der zu diesem Segment gehört und sich von dem Teil unterscheidet, der zu demselben Segment gehört und zum Speichern jener Codes dient, die sich auf konvexe Formen beziehen.
    3· Verfahren nach Anspruch 2, dadurch gekennseich· net, dai3 die konvexen Formen entsprechenden Codes von zwei Bereichen eines bestimmten Segmentes, die jeweils auf gegenüberliegenden Seiten einer Verbindungslinie zwischen diesem und einem weiteren Segment liegen (oder auf gegenüberliegenden Seiten einer geradlinigen Verlängerung dieser Linie), in unterschiedlichen Teilen der Speichereinrichtung gespeichert v/erden, welche jedoch beide zu dem bestimmten Segment gehören.
    4-, Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der Beginn eines Segmentes durch die Feststellung entweder eines Codes "BEGIIiIT" (S) oder "ÖFFNUNG" (O) während einer speziellen Rahmenabtastung erkannt wird, und daß das Ende eines Segments durch Feststellen eines Codes "GCTILIZSSSN" (C) oder "ΞΉΠ" (?) während derselben Rahinenabtastung erkannt wird.
    5· Verfahren zum Identifizieren von Zeichen durch deren Gestalt, bei dem mehrere Rahmenabtastungen über einem Bereich, durchgeführt werden, auf dem eine Darstellung des Zeichens gegeben ist, so daß unterschieden wird zwischen. Elementen des Bereichs, die einen Teil der Zeichendarstellung enthalten und Elementen, die keinen solchen Teil ent-
    80982Π/0761
    halten, dadurch ge kennzeichnet, daß die Rahmensbtastungen in wenigstens drei verschiedene Richtungen erfolgen, dai? bei ^eder: Abtastvorgang in Abhängigkeit von der Zeichendarstellung keine, oder eine oder mehrere der folgenden Codes erzeugt v/erden:
    Beginn des Zeichens (S),
    Ende des Zeichens (1?),
    öffnung des Zeichens (0),
    Schließen des Zeichens (C),
    wobei sich diese Codes auf wenigstens einen Teil des betreffenden Zeichens beziehen, und daß die Abstände zwischen ausgewählten Paaren der sich auf eine Zeichendarstellung beziehenden Codes verglichen werden, wodurch wenigstens teilweise das Zeichen identifiziert wird.
    6. Verfahren nach Anspruch 5i dadurch gekennzeichnet, daß die Koordinatenposition jedes Codes bezüglich eines festen Bezugspunktes in dem Bereich gespeichert werden, und daß die Abstände zwischen den Paaren der Codes dadurch verglichen werden, daß die Koordinaten der Codepaare verglichen v/erden.
    7· Verfahren zum Identifizieren von Zeichen durch deren Gestalt, dadurch gekennzeichnet, daß eines der Verfahren nach den Ansprüchen 1 bis 4 mit einem der Verfahren gemäß den Ansprüchen 5 und 6 kombiniert wird, und daß die Ergebnisse dar beiden Verfahren kombiniert v/erden, um das Zeichen besser zu identifizieren.
    8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß vier Abtastungen durchgeführt werden, daß zwei erste Abtastrichtungen lotrecht zueinander verlaufen und daß die Richtungen der zwei anderen Abtastungen jeweils schräg zu den Richtungen der beiden ersten Abtastungen und zu sich selbst lotrecht verlaufen.
    809820/0761
    9· Verfahren nach wenigstens einan der Ansprüche 1 bis 7■> dadurch gekennzeichnet, daß drei Abtastungen durchgeführt werden, deren Richtungen .jeweils um 120 versetzt sind.
    10. Verfahren nach wenigstens einen der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Identitäten aller für eine bestimmte Zeichendarstellung erzeugten Codes mit einem vorbestimmten Satz von Codegruppen verglichen v/erden, wobei jede Gruppe sich auf ein unterschiedliches Zeichen aus einer Folge von Zeichen vorbestinnter Gestalt bezieht und aus einer Liste von diesem Zeichen entsprechenden Codes besteht, wodurch wenigstens teilweise die Zeichendarstellung identifiziert wird.
    11. Vorrichtung sun Identifizieren von Zeichen durch deren Gestalt, zum Durchführen des Verfahrens nach Anspruch 1, nit einem Bereich zum Sapfangen einer Darstellung des zu identifizierenden Zeichens, einen Abtastgerät, nit dem der Bereich nehrfachen Rahnenabtastungen unterv/orfen werden kann, dadurch gekennzeichnet, daß die Abtastungen in wenigstens drei verschiedene Richtungen erfolgen können,daß durch eine Detektoreinrichtung (20) während jeder Abtastung feststellbar ist, ob jedes Elenent in dem Bereich einen Teil der Zeichendarstellung enthält oder nicht, daß durch logische Einrichtungen (38-4-4-) aus den Abtastun-
    den Codes in Abhängigkeit von der Gestalt der Zeichendarstellung erzeugbar sind:
    Beginn des Zeichens (S),
    Ende des Zeichens (F),
    öffnung des Zeichens (0),
    Schließen des Zeichens (C),
    daß eine Einrichtung (46) zun Auswerten der Codes vorgesehen ist, um die Zeichendarstellung in Segnente zu unterteilen, von denen jedes wenigstens teilweise eine Einbuchtung des Zeichens ungibt, daß ein Codespeicher (Fig.15-17) vorge-
    809820/0761
    sehen ist, daß eine Eingabeeinrichtung ε;τα Speichern .jener Codes ,jedes Segmentes, da3 konvexen ?ornea entspricht, in einen Teil des Ccdespeichers (z.B. 1-a, 2-b, 1-c, ... Fig. 21), welcher zu diesen Segnent gehört,vorgesehen ist, und daß ein Vergleiche? zun Vergleichen der funktioneilen Positionen in den Codespeicher von feilen (1-a, 2"b, 1-c,) des Codespeichers vorgesehen ist, v/elche die Codes speichern, wodurch wenigstens teilweise das Zeichen identifiziert wird.
    12. Vorrichtung nach Anspruch 11, dadurch gekennzeichnet, daß eine Eingabeeinrichtung zum Speichern jener Codes ,jedes Segments, welche konkaven Formen entsprechen, in einem Teil (z.B.1-b, Fig. 21) des Codespeichers vorgesehen ist, welcher zu diesem Segment gehört und sich von dein Teil (1-a, 2-b, 1-c, Fig. 21) unterscheidet, der zu dem selben Segnent gehört und zum Speichern jener Codes dient, die sich auf konvexe Formen beziehen.
    13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, daß eine Eingabeeinrichtung zun Speichern jener sich auf konvexe Formen beziehenden Codes von den zv/ei Bereichen eines bestimmten Segments vorgesehen ist, Vielehe auf gegenüberliegenden Seiten einsr Verbindungslinie zwischen diesem Segment und einem anderen Segment (oder auf gegenüberliegenden Seiten einer geradlinigen Verlängerung dieser Linie) liegen, wobei diese Codes in unterschiedlichen Teilen (z.B. 1-a, 2-b, Fig. 21) des Codespeichers abgespeichert warden, und beide Teile dem bestimmten oegnent zugeordnet sind.
    1zi-. Vorrichtung nach Anspruch 12 oder 13, dadurch gekennzeichnet, daß die Einrichtung zum Auswerten eine Einrichtung umfaßt, die dan Beginn eines Segments durch Feststellen entweder des Codes "BEGINN" oder des Codes "GFFITUTiG" während einer der Rahmenabtastungen erkennt und die das Ende das Segments durch die Feststellung eines
    809820/0 7 61
    Codes :<60:iLIZS5Z::;" oder eines Codes "EITDE=1 v;ährend derselben Abtastung entdeckt.
    15· Vorrichtung "un Identifizieren von Zeichen durch deren
    i T:i C *~ ^ ! -^ ~T~ """Ϊ ■ : T * "1^ Λ ^ " " ^ """^ w '■"> ^i ti ^ ι / O T"* ""* 53 "1^ """^ O "Λ C* Ύ~1 Ci C* "^ j "^ ""* Ό """"M 1Λ Vi W
    g e k e η η ζ 3 i c h net durch einen Bereich zus Aufnehmen einer Darstellung des zu identifizierenden Zeichens, ein Abtastgerät (26) zun Ausführen mehrerer Rahmenabtastur,-gen über den Bereich,, un so zv/ischen Eleaenten des Bereichs zu unterscheiden, die einen Teil der Zeichendarstellung enthalten und Sienenten, die keinen derartigen Teil enthalten,*.^· "bei die Rahmenabtastungen in wenigstens drei verschiedener Richtungen erfolgen, durch logische Einrichtungen (33-4-^-;, die aus jeder Abtastung in Abhängigkeit von der Gestalt der Zeichendarstellung keinen, oder einen oder mehrere der folgenden Codes erzeugen:
    Beginn des Zeichens (S),
    Ende des Zeichens (F),
    öffnung des Zeichens (O)1
    Schließen des Zeichens (C),
    wobei sich diese Cedes auf das ganze Zeichen oder einen Teil davon beziehen, und eine Vergleicheranordnung zu~n Vergleichen der Abstände zwischen Paaren der Codes, die sich auf eine Zeichendarstellung beziehen, wodurch wenigstens teilweise dieses Zeichen identifiziert wird.
    ^-^ Vo ^"^2 O^ tu^iC~ τλz*'2~~ \'^ ^oruch ^ ~) dadurch ^ e k ~* ? ^
    zeichnet, daß ein Speicher zum Speichern der Koordinatenpositionen jedes Codes bezüglich eines festen Bezugspunktes innerhalb des Bereichs vorgesehen ist, und daß die Vergleichereinrichtung eine Einrichtung zum Vergleichen der Koordinaten der Codepaare aufweist.
    17· Vorrichtung zun Ausführen des Verfahrens nach Anspruch 7, dadurch gekennze ichnet, daß eine Vorrichtung nach einen der Ansprüche 1 bis 11 mit einer Vorrichtung
    809820/0761
    nach einen der Ansprüche 15 "eis 16 kombiniert ist, und daß eine Tergleicnereinrichtung zun Vergleichen der durch die jeweiligen Vorrichtungen erzeugten Identifikationsergebnisse vorgesehen ist, un das Zeichen besser zu identifiziere:
    18. Vorrichtung nach, einem der Ansprüche 11 bis 1?, dadurch gekennzeichnet, daß vier Abtastungen vorgesehen sind. da3 zwei erste Äbtastrichtungen lotrecht zueinander verlaufen und daß die Sichtungen der zwei anderen Abtastungen jeweils schräg zu den Sichtungen der beiden ersten Abtastungen und zu sich selbst lotrecht verlaufen.
    19- Vorrichtung nach, einem der Ansprüche 11 bis 1?i dadurch gekennz eichnet, daß drei Abtastungen vorgesehen sind, deren Richtungen jeweils um 120° versetzt sind.
    20. Vorrichtung nach einen der Ansprüche 12 bis 19, dadurch gekennzeichnet, daß ein Speicher sun Speichern eines vorbestimmten Satzes von Codegruppen vorgesehen ist, wobei jede Gruppe tich auf unterschiedliche Folgen von Zeichen vorbestinnter Gestalt bezieht und auf eine Liste von Codes besteht, Vielehe diesen Zeichen entsprechen, und daß ein Vsrgleicher vorgesehen ist, mit den die Identitäten aller für eine bestimmte Zeichendarstellung erzeugter Codes nit den vorbestinnten Satz von Codegruppen verglichen werden, wodurch wenigstens teilweise das Zeichen identifiziert wird.
    809820/0761
DE19772749222 1976-11-04 1977-11-03 Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen Withdrawn DE2749222A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB45872/76A GB1587613A (en) 1976-11-04 1976-11-04 Character identification

Publications (1)

Publication Number Publication Date
DE2749222A1 true DE2749222A1 (de) 1978-05-18

Family

ID=10438932

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19772749222 Withdrawn DE2749222A1 (de) 1976-11-04 1977-11-03 Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen

Country Status (5)

Country Link
US (1) US4163213A (de)
JP (1) JPS5357927A (de)
DE (1) DE2749222A1 (de)
FR (1) FR2370325A1 (de)
GB (1) GB1587613A (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0106354A2 (de) * 1982-10-19 1984-04-25 Siemens Aktiengesellschaft Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung
EP0107789A2 (de) * 1982-09-30 1984-05-09 Siemens Aktiengesellschaft Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5242028A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Letter recognition system
US4177448A (en) * 1978-06-26 1979-12-04 International Business Machines Corporation Character recognition system and method multi-bit curve vector processing
DE3005206C2 (de) * 1980-02-12 1983-01-05 Computer Gesellschaft Konstanz Mbh, 7750 Konstanz Verfahren zur automatischen Zeichenerkennung
JPS57113185A (en) * 1980-12-29 1982-07-14 Comput Basic Mach Technol Res Assoc Character recognition system
DE3280036D1 (en) * 1981-04-25 1989-12-28 Image Processing Tech Device for the automatic segmentation of a scanned image in an image pattern recognition system
US4827531A (en) * 1983-04-11 1989-05-02 Magnetic Peripherals Inc. Method and device for reading a document character
US4596037A (en) * 1984-03-09 1986-06-17 International Business Machines Corporation Video measuring system for defining location orthogonally
EP0405400A3 (en) * 1989-06-30 1992-09-02 Mita Industrial Co., Ltd. Image distinguishing device
JPH0743764B2 (ja) * 1990-08-08 1995-05-15 富士ゼロックス株式会社 線図形折線化処理装置
US5357581A (en) * 1991-11-01 1994-10-18 Eastman Kodak Company Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition
EP0539854B1 (de) * 1991-11-01 1999-03-17 Eastman Kodak Company Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung
EP0609474A1 (de) * 1993-02-03 1994-08-10 International Business Machines Corporation Verfahren und Vorrichtung zum Umsetzen eines Bildes zur Klassifizierung oder Mustererkennung

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3503043A (en) * 1960-11-17 1970-03-24 Bell Telephone Labor Inc Apparatus for interrogating alpha-numeric characters
US3178688A (en) * 1962-12-20 1965-04-13 Control Data Corp Character recognition by feature selection
US3290650A (en) * 1963-05-13 1966-12-06 Rca Corp Character reader utilizing stroke and cavity detection for recognition of characters
GB1180290A (en) * 1966-10-31 1970-02-04 Tokyo Shibaura Electric Co Apparatus for Recognising a Pattern
US3992697A (en) * 1974-12-27 1976-11-16 Scan-Data Corporation Character recognition system utilizing feature extraction

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0107789A2 (de) * 1982-09-30 1984-05-09 Siemens Aktiengesellschaft Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung
EP0107789A3 (de) * 1982-09-30 1986-05-28 Siemens Aktiengesellschaft Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung
EP0106354A2 (de) * 1982-10-19 1984-04-25 Siemens Aktiengesellschaft Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung
EP0106354A3 (de) * 1982-10-19 1984-10-17 Siemens Aktiengesellschaft Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung

Also Published As

Publication number Publication date
FR2370325A1 (fr) 1978-06-02
US4163213A (en) 1979-07-31
JPS5357927A (en) 1978-05-25
GB1587613A (en) 1981-04-08

Similar Documents

Publication Publication Date Title
DE69230631T2 (de) Verfahren zum Vergleichen von Wortgestalten
DE69230633T2 (de) Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich
DE69131216T2 (de) Lagebestimmung von Strichkodierungen
DE3633743C2 (de)
DE69728482T2 (de) Zweidimensionaler Codeleser
DE69131006T2 (de) Gerät und Verfahren zur optischen Zeichenerkennung
DE3879254T2 (de) Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
DE69600461T2 (de) System und Verfahren zur Bewertung der Abbildung eines Formulars
DE3751612T2 (de) Gerät zum lesen eines nummernschildes.
DE3716787C2 (de)
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE2431451C3 (de) Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens
DE2432129C3 (de) Verfahren zum maschinellen Lesen von Zeichen und Vorrichtung zur Durchführung des Verfahrens
DE2749222A1 (de) Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen
DE2858688C2 (de)
DE2330181B2 (de) Verfahren und Vorrichtung zum Lesen von Datenmarkierungen
DE3722444A1 (de) Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten
DE2943749A1 (de) Lernende anordnung zum erkennen von mustern digitaler signale
DE3783974T2 (de) Optischer buchstabenleser.
DE2540101A1 (de) Automatisches zeichenerkennungs- system
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE2410306C3 (de) Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen
DE1946861A1 (de) Geraet zur automatischen Ermittlung der Mittelpunkte von jeweils eine Vielzahl von Hautleisten aufweisenden Fingerabdruecken
DE2461651C3 (de) Zählvorrichtung zum Zählen von Mustern
DE3303841C2 (de) Musterprüfeinrichtung und Verfahren zum Prüfen eines Musters

Legal Events

Date Code Title Description
8139 Disposal/non-payment of the annual fee