DE2749222A1 - Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen - Google Patents
Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichenInfo
- Publication number
- DE2749222A1 DE2749222A1 DE19772749222 DE2749222A DE2749222A1 DE 2749222 A1 DE2749222 A1 DE 2749222A1 DE 19772749222 DE19772749222 DE 19772749222 DE 2749222 A DE2749222 A DE 2749222A DE 2749222 A1 DE2749222 A1 DE 2749222A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- codes
- segment
- code
- scans
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18076—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
A. GRÜNECKER
mpi inc;
H. KINKELDEY
DR INt;
OH INti A** (CAlT I 111·+
K. SCHUMANN
IJR
RfR NAT DiPI «<YS
P. H. JAKOB
DtPl INt j
G. BEZOLD
DR W H NAT
tun
CX M
8 MÜNCHEN
llorprint Linitod Γ 12
: meantIo road 3.Hov.1977
Iloeton, Lincolneliiro
Verfahren und Vorrichtung zum autoraatisclien
Erkennen oder Lorsen von Zeichen
Erkennen oder Lorsen von Zeichen
Die Erfindung bezieht eich auf eine Vorrichtung und auf
ein Verfahren zum automatischen Erkennen oder Lesen von
•Symbolen, wie z.B. alphanumerischen Zeichen.
Die Erfindung ist in den Ansprüchen 1 und l) gekennzeichnet.
In folgenden wi rd die Erfindung aniiand eines erfindungsgemäßen
automata sehen Zeichen-Lesegerätes beispielhaft unter Bezugnahme auf die Zeichnung beschrieben. Es zeigen:
Fig. 1 ein Diagramm, das die bei der erfindungsgemäßen
Vorrichtung und dem erfindungsgemäßen Verfahren verwendete Abtasttechnik zeigt,
809820/0761
Tf Il f ON (ΟβΟ) 32 2ΒΛ3 Tf L i <
fif> J9 3HO Tt I I CiHAMMf MONACAI T[ IE M(U1IC Nt I
Fig. 2a bis 2d Diagramme zur Veranschaulichunp; der Funktionsweise
der Technik gemäß Fig. 1,
Fig. 3 ein Diagramm, das die Anwendung der Abtiinttechriilc
gemäß Fig. 1 bei einem anderen Zeichen veranschaulicht,
Fig. iv ein Diagramm, das die Abtasttechnik genau Fig. 1
bei Anwendung an einem anderen Zeichen erläutert,
Fig. 5 ein Diagramm zur Veranschaulichung einor modifizierten
Form der in Fig. 1 erläuterten Abtasttechnik,
Fig. 6a bis 6d, 7a bis 7d und 8a bis 8d Diagramme zur Verdeutlichung der Arbeitsweise der
Abtasttechnik gemäß Fig. 5»
Fig. 9 ein Blockdiagramm einer Vorrichtung zum Ann führen
der in Fig. 5 erläuterten Technik,
Fig. 10 eine Diagrammdarstellung der Information, die
durch die Vorrichtung gemäß Fig. 9 gespeichert werden kann,
Fig. 1 la bis Hq Diagramme zur detaillierten Erklärung
der Arbeitsweine der Vorrichtung f^enäß FiR. 9,
Fig. 12, 13 und 1'»-
Diagramme zum Veranschaulichen der Abtasttechnik gemäß Fig. 5» angewandt bei bestimmten Zeichen,
Fig. 15 einen in dem System verwendeten Matrixspeicher,
Fig. 16 und 17 zwei unterschiedliche Arten von \l':\r,i :;t;!rn,
«lie in dun »Speicher gemäß Fig. l'>
voruen-lnt i/jrlen
IjI)'JO 70/076 1
Fig. Ιο, K), ?')Α und 2f)\\
eine I)Hi1S fco L Lung, (ILo zeigt, wie Zeichen durch das
ο,7£;ton in So-y.ionfco aiir.";:-:;£;oa L fco t worden,
Fig. ·' eine ilarsfce L 1 mir;, die 7,0 igt, υίο die Z-ihi "7" in
d;i.-i lipe» icher go:ml$ FLf-. '1^j gespeichert wird,
Fi';. '_'<.! und '.''>
ο in'.1 Durste L Lung ^rornilii Fig. 21, Ln der ge-7,0
Lgt ist, wLo auduro ZoLchon in dem Speicher geriil)
Ki;·;. l;i i-;of »pt ? icihori; v;erd(;n,
1''L^- ;'4A und '^kM t: i ru,· L.j^Lycho Anordnung zum Steuern des
in Kif,·. Vj ijiizoi^fcen Spi!Lchorn, und
Fi 17. '-H>
oiiio D'u-.'jfco 1 I w.ir,, Ln (h;r {*■.;:', ο L n;fc ist, v/ie das in
i'i·-. ,J..)B go.viisjfco ZoLcivMi in dom Speicher gem'iß
l'ifj. I1' ab ge s pe ichex'fc wird.
I)Lc in f\>l ;;-:ii I .;n boüf-hr·Lfibono '/oi-richbung erkennt Zeichen
dut';:h '/Όΐ''./tmduri.·,· /on t\uir, Lhopo lo';i solion ('öden (QTG), d.h.
durch (!)1;::j, di-i Inf'ir n.'it ion bij:',ügl. ich der Fora oder GeijfcaLfc
yerijohLodoii'H· ',oichon b'.'Lnhalfcen und die selbsfcverijfcüiidL
Ich solche I nforrrit; ion beinhalten isoLLen, die eine
Unterseil;; i luiif; «ler /,(iich.Jti untereinander ermöglicht.
Fig. 1 '/,-!igt als Hc Ί'.ψ i el. die nögLichen QTO (nuarsitopologisch
Mi (Jo-hiii) für· eine Zahl "4". Uird die ZahL einer
fort 1 auI'ondtMi Abtastung entlang vertikaler Linien a bis J
untei'uor-f-η, !./.)b:i ,] : 1-; Abtu:5tung ab'./ärts entlang den
ent.'j})!' :ch-nd:ii I, in ion erfolgt, r.ü wird dt;r Beginn doii
7j(! Lcheji.i lui'1Ii die Vbhastung ent Lung d;r Iiinie a festgestellt,
li·; Öffnung oinor Ausnehnung in den lieichen
ii-d IV ;t , :'.t ;llt dut'.'h dLe Abtastung entlang der Linie c,
il) )') 'fl /D /fi I
das Schließen der Ausnehmung wird festgestellt durch die
Abtastung entlang der Linie g, und das Ende des Zeichens wird durch die Abtastung entlang der Linie j festgestellt.
Stellt man diese Zusammenhänge dar durch die oynbole
"S" ("Start", Beginn des Zeichens), "0" ("Opening", Öffnung des Zeichens), "C" ("Closing", Schließen des Zeichens) und
iipit («Finish", Ende des Zeichens), so läßt sich der gesamte
QTC für das Zeichen "4" als "SOCF" auszudrücken.
Bevor dies?]be Technik auf weitere Zeichen angewandt
wird, ist es notwendig, einige der Ausdrücke klarer zu definieren. Fig. 2a, 2b, 2c und 2d zeigen die Zeichenfornen,
die entsprechend als "Beginn", "Öffnung", "Schlies-GGii"
und "Ende" feststellbar sind. Die entsprechenden Codes sind mit S , 0 , C und F bezeichnet (der Index
ν int hinzugefügt, um anzudeuten, daß die Abtastriehtung
vertikal verläuft). Die ungefähren Rmkte, wo die entsprechenden
Codes festgestellt werden, sind durch mit Pfeilen versehene Punkte angedeutet. Dementsprechend ist
bei Anwendung der neuen Schreibweise und der Definitionen
gemäß den Fig. 2a bis 2d auf die Zahl "4" von Fig. 1 der
gesamte QTC für die Zahl "4":"SV 0y Cv Fv".
Fig. 3 zeigt die Zahl "7"» die dem gleichen Abtastvorgang
unterworfen ist. Bei Anwendung der in Fig. 2a bis 2d gegebenen Definitionen auf die Zahl "7", wie sie in
-^•ig· 3 gezeigt ist, werden zwei Anfangspunkts durch die
Abtastung entlang der Linie a festgestellt, ein Schließen
wird festgestellt durch die Abtastung entlang der Linie g, und ein Ende wird festgestellt durch die Abtastung entlang
der Linie j. Der QTC für die Zahl "7" ist dementsprechend "3V Sv Cv Fv".
H 0 9 8 ? f) / 0 7 G 1
27A9222
Aus der obigen Beschreibung v/ird deutlich, daß der QTC
für die Zahl "7" sich von dem QTC für das Zeichen "4" unterscheidet, wodurch eine Unterscheidung der zvrei
Zahlen ermöglicht wird.
Die unter Bezugnahme auf die Figuren 1 bis 3 kurz beschriebene
Methode könnte beispielsweise durch Verwendung einer vertikal angeordneten Spalte von Fotozellen und
durch Bewegen dieser Spalte von Fotozellen in einer horizontalen Richtung über jedes zu erkennende Zeichen
implementiert werden. Man erkennt, daß die Codes Sv,
0 , C und F durch eine entsprechende Logik leicht erkennbar
sind.
Fig. 4 zeigt die Zahl "0", die der selben Abtasttechnik wie
in den Fig. 1 und 3 unterworfen wurde.
Durch Anwendung der Definitionen gemäß den Fig. 2a bis 2d bei Fig. 4 wird deutlich, daß der Code 3γ durch die Abtastung
entlang der Linie a festgestellt wird, daß 0 durch Abtastung entlang der Linie c, C durch Abtastung entlang
der Linie 1 und Fy durch Abtastung entlang der Linie η
festgestellt werden. Somit lautet der QTC für die Zahl "0":"Sv 0v Cv Fv" - und ist daher
das Zeichen "V zu unterscheiden.
das Zeichen "V zu unterscheiden.
"0":"Sv 0v Cv Fv" - und ist daher nicht von dem QTG für
Die soweit beschriebene Technik ist somit nicht zufriedenstellend,
um einheitlich bestimmte Zahlen zu unterscheiden und ist selbstverständlich noch weniger befriedigend, wenn
handgeschriebene Zahlen unterschieden werden sollen.
Fig. 5 zeigt eine modifizierte Form der bisher beschriebenen
Abtasttechnik.
809820/0761
-α- 27A9222
In Fig. 5 ist eine Zahl "4" gezeigt, die einer vertikalen
Abtastung entlang der Linien a bis j, einer horizontalen
Abtastung entlang der Linien k bis v, einer schrägabfallenden
Abtastung entlang der Linien a1 bis j1 und einer
schrägansteigenden Abtastung entlang der Linien k1 bis r1
unterworfen ist. Wie zuvor werden der jeweilige Beginn, das Ende, die öffnung und das Schließen des Zeichens aufgezeichnet,
so wie sie durch die Abtastungen entlang der verschiedenen Linien festgestellt werden.
Fig. 6a, 6b, 6c und 6d definieren die Zeichenformen, die jeweils am Beginn ("Sj1")» Öffnungen ("0h"), Schließungen
("Ch") und Ende (11Pj1 11) für die horizontale Abtastung erkannt
werden. Auf ähnliche Weise definieren die Fig. 7a, 7b, 7c und 7d die Zeichengestaltung, die als Beginn ("Sd"),
Öffnungen ("0d"), Schließungen (nGd") und Enden ("Fd")
für die schrägabfallende Abtastung erkannt werden, und die Fig. 8a bis 8d definieren die Zeichenformen, die erkannt
werden als Beginn ("S"), öffnungen (11O'1),
8 el
Schließungen ("C ") und Enden (11F ") für die schrägansteigenden
Abtastungen erkannt werden.
Durch Anwenden der Definitionen gemäß den Fig. 2a bis 2d,
6a bis 6d, 7a bis 7d und 8a bis 8d auf die Zahl "4", wie
sie in Fig. 5 gezeigt ist, werden, wie man leicht sieht, folgende Codes festgestellt:
809820/0761
ibtastzeilen
a c
b1 c1 e1
h1 Ü1
I1 m' o1
q'
festgestellter
0.
809820/0761
Aus der Tabelle ist ersichtlich, daß die erweiterte Abtasttechnik ermöglicht, die Zahl "4" von der Zahl "O" zu
unterscheiden, weil die erweiterte Abtasttechnik ermöglicht, sowohl die untere Ausnehmung der Zahl "4-" als auch
die durch den "Schwanz" der Zahl "4" gebildeten Ausnehmungen zu erkennen; keine dieser Ausnehmungen könnte durch
einfache vertikale Abtastung gemäß Fig. 1 erkannt werden.
Die Art und Weise, in der eine Abtasttechnik, die in Zusammenhang mit Fig. 5 beschrieben wurde, implementiert
werden kann, soll im folgenden ausführlicher beschrieben werden.
Wie oben bereits kurz erwähnt, kann die Abtasttechnik durch ein Feld von Fotozellen ausgeführt werden, welches
in Form von nebeneinanderliegenden Spalten angeordnet ist (der Ausdruck "Spalte" soll eine Zeile von Fotozellen
andeuten, die bezüglich der normalen Orientierung eines Zeichens beim Lesen lotrecht hierzu angeordnet ist). Die
Fotozellen können in einem Lesekopf vorgesehen sein, der so ausgebildet ist, daß er in einer horizontalen Richtung
(d.h. lotrecht zu der definierten Richtung der Spalten) bezüglich der Leserichtung des Zeichens bewegt werden
kann. Bei fortdauernder Bewegung können die Ausgangsgrößen der Fotozellen (d.h. "schwarz" oder "weiß", abhängig davon,
ob die Fotozellen das Vorhandensein oder Nichtvorhandensein eines Zeichenteils feststellen) in einen Speicher
übertragen werden, der somit am Ende des Abtastvorgangs ein Abbild des Zeichens in Ausdrücken von "schwarzen"
und "weißen" Fotozellen-Ausgangsgrößen speichert, wobei der Speicher funktionell so betrachtet werden kann, als
besitze er eine -aus Speicherplätzen bestehende Matrix aus Spalten und Reihen. Diese Speicherplätze können dann
sequentiell in einer derartigen Reihenfolge abgefragt werden, da3 die vertikalen, horizontalen, schräg ansteigen-
809820/0761
den und schräg abfallenden Abtastungen, die oben erwähnt
wurden, ausgeführt werden,und die Speicherausgangsgrößen
können dann verarbeitet werden, um als Ausgangssignale die Codes Beginn ("S"), Öffnen ("0"), Schließen ("C")
und Ende ("F") abzugeben. Fig. 9 zeigt ein Blockdiagranim
einer derartigen Einrichtung. 3ine höher entwickelte Technik ist in einem Artikel des Erfinders beschrieben, der
den Titel "Sequentially-Local Picture Operators" trägt und in den "proceedings of the Second International Joint
Pattern Recognition Conference, Copenhagen, 1974·" veröffentlicht
wurde.
Wie aus der Zeichnung hervorgeht, ist das aus Fotozellen bestehende Feld 20 durch einen Datenkanal 22 mit einem
Datenspeicher 24 verbunden. Wenn das Fotozellenfeld horizontal
über das Zeichen bewegt wird, werden die Ausgangssignale der Fotozellen in entsprechende Speicherstellen
innerhalb des Speichers 22 über einen Datenweg 2Pt geführt.
Daher kann z.B. nach einem Überstreichen des Zeichens durch das Fotozellenfeld der Inhalt des Speichers 22 das schematisch
in Fig. 10 angedeutete Aussehen haben, wenn angenommen wird, daß der Buchstabe "4-" gelesen wurde. In Fig.
10 ist das Feststellen eines Zeichenteils durch eine Fotozelle in Form eines "X" angedeutet, während eine Leerstelle
angibt, daß die Fotozelle das Nichtvorhandensein eines Zeichenteils festgestellt hat. In Fig. 10 ist zur
Unterstützung der Zeichenerkennung eine Umrandungslinie um die gespeicherten Fotozellenausgangsgrößen gezeichnet.
Daran anschließend können unter Zuhilfenahme einer entsprechenden Logik 26 die Speicherstellen in entsprechenden
Folgen abgefragt werden, so daß die vertikale, horizontale, schräg ansteigende und schräg abfallende Abtastung
durchgeführt wird, wie es oben in Zusammenhang mit Fig. 5 beschrieben wurde. Sind die Speicherstellen
809820/0781
abgetastet, so werden die Ausgangsgrößen an eine Coderlogik
23 gegeben, die ebenfalls durch die Abfragelogik 26 gesteuert wird. Die Logik 28 erzeugt die Codes für
Beginn ("S"), öffnung ("0"), Schließen ("C") und Ende
(11F") auf den Leitungen 30, 32, 34- und 36 für jeweils
die vertikale, horizontale, schräg ansteigende und schräg abfallende Abtastung. Die Codes können in den Puffern
38, 40, 42 und 44 gespeichert werden und dann der Zeichenerkennungslogik
46 zugeführt werden, welche die Kombination der ihr angebotenen QTC analysiert, und zwar gemäß
einem vorbestimmten Algorithmus, um so das Zeichen zu erkennen.
Im folgenden sollen ausführlicher die von der Codierlogik 28 ausgeführten Operationen beschrieben werden.
Die Fig. 11a bis 11p zeigen die Zeichenkonturen aus den Fig. 2a bis 2d, 6a bis 6d, ?a bis 7d und 8a bis 8d,
die in Form von Fotozellen-Ausgangsgrößen aufgezeichnet sind. Sie definieren die speziellen Muster der Foto.-i
Zellenausgangsgrößen, die als den Codes S , 0 , C und
F und den Codes für die horizontale, schräg abfallende
und schräg ansteigende Abtastung entsprechende Größen erkannt werden. Wie bereits oben deutet auch hier der
Punkt in jeder Figur an, wo der entsprechende QTC tatsächlich festgestellt wird. Fig. 11q zeigt, wie ein
Extracode, S1 , definiert ist. Der Zweck dieses Codes
wird weiter unten ausführlicher erklärt. Kurz gesagt, zeigt dieser Codes die mögliche Abtastung eines neuen
Strichs eines Zeichens an - jedoch wird der Code nicht wirksam (d.h., er wird nicht herangezogen, um einen
neuen Zeichenstrich anzuzeigen), bis dies durch einen nachfolgenden Code Sy bestätigt wird.
80 98 ZO/&7 61
Zum Feststellen der QTC für die vertikale und horizontale
Abtastung v/erden die gespeicherten Fotozellen-Ausgangsgrößer,
paarweise abgefragt. Das bedeutet, daß im Fall der vertikalen Abtastungen die benachbarten Spaicherstellen
in zv/ei nebeneinanderliegenden Spalten gleichzeitig abgefragt
werden; die nächsten zwei Speicherplätze in zwei angrenzenden Reihen v/erden zuerst abgefragt; dann werden
die nächsten zv/ei Speicherstellen rechts davon abgefragt;
so wird der Vorgang fortgesetzt bis zum Ende dieser Reihen. Die Abtastung wird dann um eine Reihe verschoben und der
Vorgang wiederholt. Um den Stör- oder "Rausch"-Effekt zu
vermindern, ist es vorteilhaft, einen aufwendigeren Abtastvorgang zu verwenden, in dem drei Abtaststellen gleichzeitig
abgetastet v/erden.
Im Fall der schrägen Abtastungen ist es notwendig, die Speicherstellen in fünf Spalten gleichzeitig abzufragen,
un"-Mehrdeutigkeiten zu vermeiden, obschon natürlich beim Fortschreiten jeder Abtastung die fünf Spalten, deren
Speicherstellen inspiziert werden, wechseln, indem, eine Spalte für jeden Schritt der Abtastung nach rechts verschoben
wird, um die Schrägneigung der Abtastung zu bewirken.
Am Ende jeder Abtastzeile wird das System automatisch zurückgesetzt.
Aus dem oben Gesagten wird klar, wie bei der Verwendung von vier Abtastungen, der vertikalen, horizontalen, schräg
abfallenden und schräg ansteigenden Abtastung, eine Anzahl von Zeichen seperat erkannt werden können. Jedoch können
immer noch Mehrdeutigkeiten auftreten, insbesondere in Fall von handgeschriebenen oder schlecht gedruckten Zeichen.
So zeigt z.B. Fig. 12 eine einfache Form der Doppeldeutigkeit, die möglicherweise auftreten kann. Hier ist das
809820/0761
27A9222
Zeichen "1" (eine handgeschriebene 1 ohne einen Querbalken), ein "/" und ein "-" gezeigt. Unter diesen Zeichen ist jeweils
in vergrößerter Darstellung das entsprechende Abbild aufgezeichnet, wie es durch das Fotozellenfeld festgestellt
und in den Speicher 24 gespeichert wird; die Uinrißlinien
sind zur Erleichterung des Verständnisses eingezeichnet. Ferner sind in der Fig. 12 die QTC eingetragen. Es ist
klar zu sehen, daß die QTC für diese drei Zeichen identisch sind und daher nicht dazu verwendet werden können, die
Zeichen zu unterscheiden.
Als weiteres Beispiel zeigt Fig. 13 zwei handgeschriebene Zahlen, nämlich "3" und "7" (bei der letztgenannten Zahl
handelt es sich um eine "7", die in der in vielen Ländern üblichen Schreibweise mit horizontalem Balken geschrieben
ist). Unter den Zahlen sind ihre sich ergebenden Abbilder gezeichnet, wie sie in dem Speicher 24 nach Abtastung durch
das Fotozellenfeld gespeichert sind, wobei die ausgezogene Umrißlinie zwecks Erleichterung des Verständnisses
eingezeichnet wurde. Ferner sind in Fig. 13 die Punkte eingezeichnet, in denen die verschiedenen QTC festgestellt
werden. Die an den QTC vorgesehenen oberen Indizies sollen dazu dienen, jedes QTC einem bestimmten Segment des Zeichens
in einer noch zu beschreibenen Weise zuzuordnen. Eine Analyse der QTC für die zwei Zahlen zeigt, daß sie identisch
sind und die QTC aus diesem Grund nicht dazu verwendet werden können, um die beiden Zahlen zu unterscheiden.
Ein weiteres Beispiel ist in Fig. 14 gezeigt. Hier handelt es sich um das Zeichen für "größer als" (">") und um die
geschlossene Klammer (")"). Es ist wiederum klar, daß die QTC für beiden Zeichen gleich sind.
809820/0761
In jedem Fall (Fig. 12, 13 und 14) kann jedoch festgestellt werden, daß es Unterschiede in den Verhältnissen Höhe/Breite
und in der neigung der Zeichen oder in Teilen der Zeichen gibt.la Fall der Fig. 12 sind, wenn man annimmt, daß
die x- und y-Koordinaten (bezüglich eines vorbestimmten Bezugpunktes) für jeden der QTC bekannt sind, die Höhen/
Breiten-Verhältnisse (h/w) der Zeichen gegeben durch die Gleichung:
h/w = (ys - 7j )/Cx? - xs ) CO
a h b. ν
während die Neigung (s) gegeben ist durch
(-.', - y- )/(xo - Xu ) C2).
h. h ii ö
Die Gleichungen (1) und (2) können verallgemeinert in der Form
geschrieben werden.
Man sieht, daß Gleichung (1) und (2) Spezialfälle der
Gleichung (3) sind, wobei eine der Komponenten jedes Abstandes in der letztgenannten Gleichung den Wert null hat.
Bei Anwendung der Gleichung (3) zum Unterscheiden der zwei
in Fig. 13 gezeigten Zeichen können verschiedene Eigenschaften der unteren Ausnehmungen der beiden Zeichen inspiziert
werden. So z.B. kann ein erster Test (T^) das Ausmessen
des Verhältnisses der Länge der Linie M zu der Länge der Linie N für jedes Zeichen umfassen, wobei die Längen dieser
Linien bestimmt wenden durch die x- und y-Koordinaten der
Punkte S2 v, C2 y und s' . Ein zweiter Test (T2) könnte das
809820/0761
Ausmessen des Verhältnisses der Längen der Linien P und Q für jedes Zeichen umfassen, wobei die Längen dieser Linien
"bestimmt sind durch die x- und y-Koordinaten der Punkte
S2 V, C2 d und S3 V.
Durch Anwendung der Gleichung (3)i um die zv/ei in Fig. 14-gezeigten
Zeichen zu unterscheiden, könnte ein erster Test, T^, die Berechnung des Verhältnisses des horizontalen Abstandes
vzwischen den QTC S^ und F zu dem horizontalen Abstand
zwischen den QTC S^ und S'v umfassen. Ein zweiter
Test, To, könnte die Berechnung des Verhältnisses des vertikalen
Abstandes zwischen den QTC F. und F zum vertikalen Abstand zwischen den QTC S^ und Fj1 umfassen. Somit gilt
und
T2 - **d - X
Somit ergibt sich z.B. unter Amiendung von T^ und T2 auf
die in Fig. 14· gezeigten Zeichen und bei Skalierung gemäß der Zeichnung:
(a) T1 - 4 - * , für■·">■", und
T1 » 2 ,für ")";
(b) I2 = Λ , für H>
», und
T2 - Λ
,für ··)'·.
Diese Ausdrücke würden daher eine klare Unterscheidung
zwischen den Zeichen "V und ")" ermöglichen.
Es versteht sich, daß solche Tests für Mehrdeutigkeiten zwischen anderen Zeichen erdacht werden können.
809820/0761
SS.
Daher ist es notwendig, einen Weg zu finden, un die Koor^ ' ^Z
dinaten der QTC für jedes Zeichen in einer Art und Weise
zu speichern, die es ermöglicht, daß auf diese Koordinaten leicht zugegriffen werden kann, um sie dann zum Ausführen
verschiedener Tests zu verwenden. Dieses soll im Folgenden beschrieben werden.
Um diese Funktion auszuführen, ist es notwendig, daß die QTC für jedes Zeichen in einer Weise gespeichert werden,
die ein Erkennen ihrer relativen Lage innerhalb des Zeichens ermöglicht, und es ist notwendig, daß dies erreicht werden
kann, obschon kleinere Störungen des Zeichens die Reihenfolge, in der die QTC gelesen werden, ändern können.
So z.B. kann eine "3" in verschiedener V/eise geschrieben werden; so können z.B. entweder der obere Strich oder der
unterste Strich weit nach links herausgezogen sein und somit als Erste festgestellt werden (durch die erste Spalte
des Fotozellenfeldes). In jedem Fall muß das System sicherstellen,
daß der QTC des ersten erkannten Teils des Zeichens als daßjenige erkannt wird, daß zu dem richtigen Teil des
Zeichens gehört.
Um diese Funktion auszuführen, ist die Vorrichtung mit einem Speicher ausgestattet (er wird als Katrix-Speicher bezeichnet),
der eine Anzahl von Registern (von denen jedes eine Anzahl von Speicherstellen umfaßt) enthält, die funktionell
in einer vorbestimmten Weise angeordnet sind.
Wie in Fig. 15 gezeigt ist, enthält der Matrixspeicher
zwei Arten von Registern: einen ersten Registertyp, der dazu verwendet wird, jene Code zu speichern, die konkaven
Abschnitten der Zeichen entsprechen (diese Register sind in der Fig. als Sechsecke dargestellt), und einen zv/eiten
Registertyp zum Speichern derjenigen QTC, die konvexen Abschnitten der Zeichen entsprechen (diese Regidsr sind
als Quadrate in der Fig. dargestellt). Die Register sind
in alternierender V/eise in einer aus Reihen und Spalten
bestehenden Katrix angeordnet, wie es in Fig. 15 gezeigt
ist. Die Spalten und Reihen sind nuneriert, bzw. nit Buchstaben versehen, so daß jedes Register durch Koordinatenangabe
identifiziert werden kann; so z.B. ist das Register 2-a einen konvexen Abschnitt speicherndes Register
in der zweiten Spalte und ersten Reihe des Matrixspeichers.
Unter Bezugnahme auf die Figuren 11a bis 11 q erkennt man,
daß die folgenden QTC Formen repräsentieren, die sich auf konkave Abschnitte oder Teile davon beziehen:
oa, ov, od, ch, ca, cv, cd, On.
Im Gegensatz hierzu repräsentieren die folgenden QTC Formen, die sich auf konvexe Abschnitte oder Teile davon beziehen:
Sa' SV Sv' Sd' ph» Fv' Fa' Ed' Sh*
In einer noch zu beschreibenden Weise wird jeder QTC (quasitopologischer
Code) gelesen . und einem entsprechendes Register innerhalb des Matrixspeicher zügel eitet, so daß
am Ende des Lesevorgangs die relativen Positionen der Register, in denen die QTC gespeichert sind, die Form des
Zeichens zumindest annäherungsweise repräsentieren.
Wie schon gesagt wurde, enthält jedes Register innerhalb des Matrixspeichers eine vorbestimmte Anzahl von Speicherstellen
- wobei acht derartige Speicherstellen für jedes Register einen konkaven Abschnitt und neun derartige Speicherstellen
für jedes Register einen konvexen Abschnitt repräsentieren. Jede Speichersteile in einem Register ist
einem bestimmten QTC zugeordnet und wird aktiviert (d.h. in einen clatenspeichernden Zustand geschaltet), wenn der
entsprechende QTC festgestellt wird.
809820/0761
Fig. 16 ^eigt eines der Register des Iiatri::speichers, welches
ZU3 Speichern eines konkaven Abschnittes dient und
illustriert in diagrammähnlichor Weise die acht Speichersteller, des Registers und zeigt an, welche Speicherstelle
velclae.:· QTG zugeordnet ist.
Fig. 17 zeigt dasselbe für ein Beispiel eines Speicher- ■
registers für einen konvexen Abschnitt.
Um den QTC-Speichervorgang auszuführen, teilt das System
jedes Zeichen in Segnente auf (durch vertikale Linien getrennt), wobei die Segmente Zeichenabschnitte darstellen,
die Einbuchtungen umklammern.
Die Fig. 18 und 19 illustrieren, wie ein Zeichen in derartige Segaente aufgespaltet wird.
Fig. 18 zeigt eine "0". Die Feststellung des QTC S'v (gefolgt
durch einen Bestätigungscode Sv) wird durch das System
erkannt als Anzeige für den Beginn eines ersten Segments A. Taucht der Code 0 auf, so antwortet das System durch Beginnen
eines neuen Segments, nämlich des Segments B. Wird der Code C festgestellt, so gilt die Vereinbarung, daß
das untere Segment B als beendent betrachtet wird und daß das obere Segment A fortfährt.
Fig. 19 zeigt den selben Vorgang angewendet auf die Zahl
"7". Hier wird der obere Balken der Zahl zuerst festgestellt, und der entsprechende Code S'v (gefolgt durch
den Bestätigungscode S) identifiziert diesen Teil eines ersten Segments, nämlich des Segments A. Erzeugt ein nachfolgender vertikaler Abtastschritt einen Code S1 für den
unteren Balken der Zahl (gefolgt durch den Bestätigungscode S), so wird ein zweites Segment B identifiziert. Taucht
der Code C auf, so wird das Segment B beendet,während das
Segment A weiterhin besteht.
809820/0761
ar
Die Figuren 2OA und 203 zeigen denselben Vorgang angewendet
auf zwei unterschiedliche Darstellungen der Zahl "2". Sin Vergleich der Figuren 2OA und 203 verdeutlicht,
daß es in den einen Fall das untere Segment ist, das anfangs festgestellt wird, während in dem anderen Fall
es sich -on das obere Segment handelt. In einer noch zu
beschreibenden Weise stellt das System sicher, daß in jedem dieser Fälle der QTC, der den unterschiedlichen Segmenten
entspricht, korrekt in dein Matrixspeicher positioniert wird.
Wie in den Figuren 2OA und 203 gezeigt ist, wird bei Feststellung des Codes 0 ein neues Segment begonnen, nämlich
das Segment C (auf dieselbe Weise, wie es in Fig.18 angedeutet ist).
Fig. 21 verdeutlicht als ein erstes Beispiel, wie der QTC, der der Zahl "7" entspricht, in den Matrixspeicher abgespeichert
wird.
Die Figur zeigt eine Darstellung der Zahl, und die an dieser Zahl angebrachten Zahlenwerte zeigen die Reihenfolge an,
in der die QTC festgestellt werden. Der tatsächliche durch die Zahlerwerte repräsentierte QTC ist folgender:
809820/0761
at?
QTG ffr. |
Amp |
1 | S'v |
2 , | Sv |
3 | S'v |
4 | Sv |
5 | Sa |
6 | Sd |
7 | Sd |
8 | Fh |
9 | Fa |
10 | Cv |
11 | Cd |
12 | Sh |
13 | Fd |
14 |
809820/0761
Diejenigen Stellen in dem Matrixspeicher, in denen die
QTC gespeichert sind, sind durch kleine Kreuzchen gekennzeichnet .
Man sieht, daß der QTC Nr. 1 der Code S'v ist und den
Start eines Segments, nämlich des Segments A anzeigt. Da dies das erste festgestellte Segment ist, wird dieser
Code in den entsprechenden Speicherstellen im Register 1-a abgespeichert. QTC Nr. 2 ist der Code 3γ und wird
in dein Register 1-a gespeichert. QTC Nr. 3 ist ein zweiter Code S1 , und er zeigt (nach Bestätigung durch den
folgenden Code S , den QTC Nr. 4) den Beginn eines separaten
Segments, des Segments B, an und muß daher in dem nächsten zur Verfügung stehenden Register für konvexe
Bereiche, dem Register 1-c abgespeichert werden.
Dieser Vorgang fährt fort, wobei die QTC mit den Nummern
5, 6, 7» 8 und 9 in der dargestellten Weise abgespeichert
werden.
Das Auftreten des QTC Nr. 10, d.h., des Codes Cv zeigt
die Beendigung des unteren Segmentes B an. Dieser QTC, sowie der nachfolgende QTC mit der Nr. 11 (der Code C,)
werden in dem Register für konkave Abschnitte (Register 1-b) zwischen den Registern 1-a und 1-c abgespeichert.
Die Beendigung des Segmentes 3 stellt sicher, daß die verbleibende
QTC mit den Nummern 12, 13 und 14, obschon sie
noch mit dem Segment A in Zusammenhang stehen, in einem unterschiedlichen Register für konvexe Abschnitte, dem
Register 2-b, gespeichert werden, weil die Beendigung des Segmentes B anzeigt, daß das Segment A sich nach rechte
hin fortsetzt.
Am Ende des Abtastvorgangs speichern daher die Register 1-a, 2-b und 1-c Daten, zusammen mit dem Register 1-b
für konkave Abschnitte. Die Buchstaben A und B zeigen an,
809820/0761
at?
v/elclie Segmente der Zeichen in den Registern gespeichert
sind. Es wird deutlich, daß aa Ende des Abtastvorgangs
die aktivierten Speicherregister für konvexe Abschnitte physikalisch derart in Bezug aufeinander angeordnet sind,
daß sich in etwa die Form der Zahl "7" ergeben; in der Zeichnung wurden zur Verdeutlichung dieses Umstandes die
betreffenden Register schraffiert. In einer weiter unten . noch ausführlicher zu erklärenden Weise wird dieser Umstand
als Teil des Gesarat-Erkennungsvorgangs ausgenutzt.
Fig. 22 und 23 zeigen, wie der Matrixspeicher die Zeichen
">'! und ")" abspeichern. Für ^edes Zeichen ist der QTC
derselbe; sie werden wie folgt gekennzeichnet (die Zahlen beziehen sich auf die in den Figuren an den Zeichen angebrachten
Ziffern):
QTC No. |
QTC |
1 2 3 4 5 6 7 8 9 |
B\ Sv ßlv Sv Öa \ Cv Fv |
809820/0761
Wiederum "bilden die aktivierten Speicherregister für konvexe
Abschnitte in den Figuren 22 und 23 eine in Bezug aufeinander den jeweiligen Zeichen ähnelnde Formen.
Jedes Register in dem Matrixspeicher "besitzt ein dazugehöriges
entsprechendes Adressregister (nicht gezeigt), und jedes Adressregister besitzt eine Speicherstelle, die
einem speziellen Speicherplatz in dem zugehörigen Matrixspeicher-Register
entspricht. Wenn ein QTC in den entsprechenden Speicherplatz in einem der Register des Matrixspeichers
gespeichert wird, so wird seine Adresse (d.h. die Koordinaten, die seine Position in der Matrix der Abtast-Fotozellen
kennzeichnen) automatisch in der entsprechenden Stelle des Adressregisters gespeichert.
In den oben betrachteten Beispielen war die Gestalt oder Form jedes Zeichens, z.B. der Zahl "7" (Fig. 21) derart,
daß das jeweilige obere Segment, das Segment A, eher abgetastet wurde als das untere Segment, das Segment B,
und aus diesem Grund wurden die QTC der Segmente in Registern für konvexe Abschnitte gespeichert, deren relative
Position richtig war (d.h. richtig in Bezug aufeinander gemäß der Gestalt des Zeichens).
In vielen Fällen kann die Form des Zeichens derart sein,
daß ein unteres Segment zuerst abgetastet wird, und daher rau3 das System so ausgelegt sein, daß dies festgestellt
wird, und es muß sichergestellt werden, daß am Ende des Speichervorgangs die Segmente in die richtigen Register
gelangt sind.
So z.B. hat die Zahl "2" von Fig. 2OA eine derartige Gestalt,
daß ihr oberes Segment A vor dem Abtasten des unteren Segments 3 durch den Abtastvorgang festgestellt wird,
und die Segmente werden somit zu Beginn in die richtigen Register für konvexe Abschnitte innerhalb der Speicher-
809820/0761
matrix gespeichert.
Hat jedoch die "2" die in Fig. 2OB gezeigte Gestalt, so
wird das untere Segment, das Segment B, durch den Abtastvorgang vor dem Feststellen des oberen Segments A
erkannt. Um dieser Situation gerecht zu werden, enthält das System eine in den Figuren 24-A und 24-B gezeigte
logische Anordnung, die aus einem FIFO-Speicher (FIFO, Speicherprinzip: first in - first out) 80 mit Ausgangsregistsrn
82 und 84-, sowie einem Eingangsregister 86 besteht. Im folgenden soll in Zusammenhang mit den Fig.
24-A, 24-3 und 25 (letztere zeigt eine Darstellung des
Matrixspeichers) der Vorgang beschrieben werden, der beim Speichern der QTC, die die "2" gemäß Fig. 2OB repräsentieren,
stattfindet.
Die logische Anordnung gemäß den Fig. 24-A und 24-B wird
durch die QTC selbst gesteuert, insbesondere durch die QTC S' und 3 .
V ν
Wenn der Abtastvorgang zum Abtasten der Zahl "2" gemäß Fig. 2OB beginnt, wird zu Beginn das Segment B festgestellt,
und die QTC hierfür v/erden in das erste Register für konvexe Abschnitte, das Register 1-a (Fig. 25) gebracht,
wie es durch die gepunktete Darstellung des Buchstaben "3" angedeutet ist. Gleichzeitig wird ein Code,
der dieses Gegrient B identifiziert, in den Fli'O-opeicher
80 durch das Eingangsregister 85 eingegeben, und wird automatisch diirch die Register 80 und 82 in das End-Ausgangsregister
84- geschaltet, wie in Fig. 24-A zu sehen ist.
Beim Fortgang des Abtastvorgangs wird der erste Teil des
oberen Segmentes A festgestellt. Das obere Segment A wird durch das Auftreten seiner QTC 3' und 3 entdeckt, und
da das System (welches am Ende jeder Abtastzeile zurückgesetzt wird) diese Codes vor irgendeinem anderen QTC in
809820/0761
der Abtastzeile feststellt, erkennt das System daher, daß das Segment A oberhalb des Segmentes B liegt. Daher wird
ein Code, der das Segment A identifiziert, durch das Eingangsregister S5 in den PI?O-Speicher 80 eingegeben,
und der Code wird automatisch durch die Register 80 und 82 in das abschließende Ausgangsregister 84· geschaltet,
wobei aus diesem Register der Code, der das Segment B repräsentiert, entfernt wird; diese entfernte Code wird
automatisch in das Register 86 zurückgeführt und läuft durch den FIFO-Speicher 80 in das Register 82. Die Codes
nehmen schließlich eine Position ein, wie sie in Fig. 24-B
verdeutlicht ist, d.h., der das Segment A repräsentierende Code befindet sich im Register 84- und somit über dem das
Segment B repräsentierenden Code, der schließlich in das Register 82 gelangt. Diese Abwärtsverschiebung des das
Segment B repräsentierenden Codes veranlaßt automatisch die QTC in dem Register 1-a des Watrixspeichers, daß sie
in das Register 1-c verschoben werden, wie es in der Zeichnung durch den Pfeil I angedeutet ist; ferner wird
hierdurch sichergestellt, daß die QTC, die das Segment A repräsentieren, in das Register 1-a gespeichert werden.
Aus diesem Grund sind die Segmente in ihren richtigen relativen Positionen innerhalb des Matrixspeichers gespeichert.
Beim Fortfahren des Abtastvorganges wird der Code C auf
die in Fig.25 dargestellte Weise festgestellt und zeigt
somit das Ende des Segments B an. In der Art und Weise, die oben in Zusammenhang mit Fig. 4· erläutert wurde, werden
weitere QTC für das Segment A in dem nächsten Register, dem Register 2-b, auf der rechten Seite gespeichert,
weil der Code Cv anzeigt, daß das Segment A sich noch
weiter nach rechts hin erstreckt.
809820/0761
Auf ähnliche Weise zeigt die Feststellung des Codes O r das
Ende des Segments B und den Beginn eines neuen Segments, des Segr-errjs C an, welches auf die rechte Seite des Segmentes
3 verschoben v/erden muß. Der QTC für das Segment C wird somit in dem Register 2-d gespeichert.
Man erkennt, daß während des οDigen Vorgangs die QTG für .
die konkaven Bereiche X und Y (siehe Fig. 25) in den Registern für konkave Abschnitte 1-b, bzw. 2-c gespeichert
v/erden.
Am Ende des Abtastvorgangs speichern somit die Register
für konvexe Abschnitte 1-a, 1-c, 2-b und 2-d die QTC, wie
es durch schräge Linien angedeutet ist, wobei die relativen Positionen in dem Matrixspeicher näherungsweise die Gestalt
der Zahl "2" aufweisen.
Wenn die logische Anordnung, die in den Fig. 24A und 24-B
gezeigt ist, feststellt, daß eine Verschiebung der QTC-Daten von einem Register für konvexe Abschnitte innerhalb
des Matrixspeichers zu einem anderen Register in der beschriebenen Weise notwendig ist, so stellt die logische
Anordnung automatisch sicher, daß die Adressdaten in den zugehörigen Adresspeichern entsprechend verschoben werden.
Die obige Diskussion zeigt, wie eine logische Folge von binären Entscheidungen durchlaufen werden kann, um einen
vollständigen Zeichenerkennungsvorgang zu bilden.
Zu Beginn wird das Zeichen in der beschriebenen Weise gelesen, am Ende des Lesevorgangs werden die Zeichensegmente
in ihren entsprechenden relativen Positionen innerhalb des Matrixspeichers abgespeichert, und die Koordinaten
adressen der QTC werden in entsprechenden Adressregistern
809820/0761
abgespeichert. In anderen Worten: die gesamten QTC (quasitopologischen
Codes) für die Zeichen sind zusanmenidt ihren
relativen Koordinatenpositionen bekannt.
Der erste Schritt ira Erkennungsvorgang besteht aus der Inspizierung des Matrixspeichers und in der Betrachtung
der relativen Positionen der Register, in denen Segmente gespeichert sind. Dieeer Vorgang resultiert wahrscheinlich
nicht in einer vollständigen Erkennung des Zeichens. So z.B. zeigen die Fig. 21 bis 23, daß die Register innerhalb
des Matrixspeicher, die Segmente speichern, im Pail von drei verschiedenen Zeichen ("7", ">" und ")") identisch
sind, obwohl es sich tun unterschiedliche Zeichen handelt. Jedoch wird wenigstens dieser Teil der Erkennungsabfolge eine große Anzahl in Frage könnender Zeichen eliminieren.
Der nächste Schritt bei der Erkennungsabfolge besteht darin, die tatsächlichen QTC zu inspizieren. Selbst wenn
die aktuellen Register, die Zeichensegnente in dem Matrixspeicher speichern, es nicht ermöglichen, zwischen zwei
Zeichen (z.B. "7", ">" und ")") zu unterscheiden, so
kann es jedoch sein, daß der aktuelle QTC (gespeichert innerhalb des Hatrixspeichers) ein spezielles Zeichen
exklusiv kennzeichnet. Dies hängt bis zu einem gewissen Maß von dem Bereich der Zeichen ab, welche das System
zu behandeln vermag; je größer dieser Bereich ist, je geringer ist die Wahrscheinlichkeit, daß die tatsächliche
Identität der QTC eine exklusive Zeichenerkennung erlaubt. So z.B. besitzen die Symbole M>" und H)M die selben QTC
und belegen die selben Register für konvexe Abschnitte innerhalb des Matrixspeichers. Andererseits unterscheidet
sich der QTC von "711 etwas von dem QTC der Zeichen ">"
und Ό11» weil die beiden letzteren Zeichen nicht den QTC
Cj aufweisen; dies ist der Fall, obschon die Zeichen "7"
">" und ")" dieselben Register ifür konvexe Abschnitte innerhalb
des Matrixspe^gaj J^yJf1
-ry-
Der dritte und abschließende Schritt des Srkennungsvorgangs
zum unterscheiden zwischen den Zeichen, die dieselben
!Register für konvexe Abschnitte innerhalb des Hatrixspeichers
belegen und ferner die selben QTC aufweisen, besteht in den Durchführen der metrischen Tests, wie sie
oben in Zusammenhang mit den Fig. 12, 13 und 14- beschrieben
wurden. Das System identifiziert hierbei durch spezielle Tests, UI2 auf der Grundlage derjenigen Information weiterzuarbeiten,
die aus den vorhergehenden Polgen des Erkennungsvorgangs
erhalten vmrden. In anderen Worten: in diesem Stadium des Erkennungsvorgangs hat das System die meisten
Möglichkeiten eliminiert und weiß, daß das Zeichen eines aus einer beschränkten Gruppe sein muß; daher weiß das
System, welche metrischen Tests ausgeführt v/erden müssen.
In der in Zusammenhang mit den Fig. 12, 13 und 14 beschriebenen
Weise wählt daher das System gemäß dem speziellen metrischen Tes+ oder den auszuführenden Tests die
entsprechenden QTC aus, ruft deren Koordinaten aus den Adressregistern ab und führt daran anschließend die notwendigen
Berechnungen durch, um den Test oder die Tests durchzuführen. Dies ermöglicht eine abschließende Erkennung
des Zeichens.
809820/0761
Claims (1)
- PatentansprücheVerfahren zum Identifizieren von Zeichen durch deren Gestalt, bei dem ein vorbestimmter Bereich, der eine Darstellung des zu identifizierenden Zeichens heinhaltet, einer Mehrzahl von Rahnenabtastungen unterworfen wird, dadurch gekennzeichnet, daß die Abtastungen mindestens drei Abtastvorgänge in jeweils eine unterschiedliche Richtung umfassen, daß bei jedem Abtastvorgang festgestellt wird, ob jedes in dem Bereich liegende, abgetastete Element einen Teil der Zeichendarstellung enthält oder nicht, daß jeder Abtastvorgang keinen, oder einen oder mehrere Codes gemäß den folgenden Bedingungen in Abhängigkeit von der Gestalt der Zeichendarstellung erzeugt:Beginn des Zeichens (8), Ende des Zeichens (F), Öffnung des Zeichens (0), Schließen des Zeichens (C),daß diese Codes ausgewertet werden, um die Zeichendarstellung in Segmente zu unterteilen, von denen jedes wenigstens teilweise eine Einbuchtung umschließt, daß diejenigen Codes jedes Segments, welche konvexen Formen entsprechen, in einem zu dem Segment gehörigen Teil der Speichereinrichtung gespeichert werden, und daß ein Identifizierungsvorgang dadurch809820/0761<oa») aaaaeoTELEX ΟΒ-9β3·ΟTELEeRAMME MONAPATTELEKORtERCRbegonnen --.-ird, da'; die funktioneilen Positionen in der Speichereinrichtung der· Teile der Speichereinrichtung, in denen die Codes gespeichert sind, verglichen werden.2. Verfahren T-3.o':i Anspruch 1 . dadurch ge kennzeich· net, daf: diejenigen Codes jedes Segmentes, die konkaven Formen entsprechen, in einen Teil der Speichereinrichtung gespeichert v/erden, der zu diesem Segment gehört und sich von dem Teil unterscheidet, der zu demselben Segment gehört und zum Speichern jener Codes dient, die sich auf konvexe Formen beziehen.3· Verfahren nach Anspruch 2, dadurch gekennseich· net, dai3 die konvexen Formen entsprechenden Codes von zwei Bereichen eines bestimmten Segmentes, die jeweils auf gegenüberliegenden Seiten einer Verbindungslinie zwischen diesem und einem weiteren Segment liegen (oder auf gegenüberliegenden Seiten einer geradlinigen Verlängerung dieser Linie), in unterschiedlichen Teilen der Speichereinrichtung gespeichert v/erden, welche jedoch beide zu dem bestimmten Segment gehören.4-, Verfahren nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der Beginn eines Segmentes durch die Feststellung entweder eines Codes "BEGIIiIT" (S) oder "ÖFFNUNG" (O) während einer speziellen Rahmenabtastung erkannt wird, und daß das Ende eines Segments durch Feststellen eines Codes "GCTILIZSSSN" (C) oder "ΞΉΠ" (?) während derselben Rahinenabtastung erkannt wird.5· Verfahren zum Identifizieren von Zeichen durch deren Gestalt, bei dem mehrere Rahmenabtastungen über einem Bereich, durchgeführt werden, auf dem eine Darstellung des Zeichens gegeben ist, so daß unterschieden wird zwischen. Elementen des Bereichs, die einen Teil der Zeichendarstellung enthalten und Elementen, die keinen solchen Teil ent-80982Π/0761halten, dadurch ge kennzeichnet, daß die Rahmensbtastungen in wenigstens drei verschiedene Richtungen erfolgen, dai? bei ^eder: Abtastvorgang in Abhängigkeit von der Zeichendarstellung keine, oder eine oder mehrere der folgenden Codes erzeugt v/erden:Beginn des Zeichens (S),Ende des Zeichens (1?),öffnung des Zeichens (0),Schließen des Zeichens (C),wobei sich diese Codes auf wenigstens einen Teil des betreffenden Zeichens beziehen, und daß die Abstände zwischen ausgewählten Paaren der sich auf eine Zeichendarstellung beziehenden Codes verglichen werden, wodurch wenigstens teilweise das Zeichen identifiziert wird.6. Verfahren nach Anspruch 5i dadurch gekennzeichnet, daß die Koordinatenposition jedes Codes bezüglich eines festen Bezugspunktes in dem Bereich gespeichert werden, und daß die Abstände zwischen den Paaren der Codes dadurch verglichen werden, daß die Koordinaten der Codepaare verglichen v/erden.7· Verfahren zum Identifizieren von Zeichen durch deren Gestalt, dadurch gekennzeichnet, daß eines der Verfahren nach den Ansprüchen 1 bis 4 mit einem der Verfahren gemäß den Ansprüchen 5 und 6 kombiniert wird, und daß die Ergebnisse dar beiden Verfahren kombiniert v/erden, um das Zeichen besser zu identifizieren.8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß vier Abtastungen durchgeführt werden, daß zwei erste Abtastrichtungen lotrecht zueinander verlaufen und daß die Richtungen der zwei anderen Abtastungen jeweils schräg zu den Richtungen der beiden ersten Abtastungen und zu sich selbst lotrecht verlaufen.809820/07619· Verfahren nach wenigstens einan der Ansprüche 1 bis 7■> dadurch gekennzeichnet, daß drei Abtastungen durchgeführt werden, deren Richtungen .jeweils um 120 versetzt sind.10. Verfahren nach wenigstens einen der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß die Identitäten aller für eine bestimmte Zeichendarstellung erzeugten Codes mit einem vorbestimmten Satz von Codegruppen verglichen v/erden, wobei jede Gruppe sich auf ein unterschiedliches Zeichen aus einer Folge von Zeichen vorbestinnter Gestalt bezieht und aus einer Liste von diesem Zeichen entsprechenden Codes besteht, wodurch wenigstens teilweise die Zeichendarstellung identifiziert wird.11. Vorrichtung sun Identifizieren von Zeichen durch deren Gestalt, zum Durchführen des Verfahrens nach Anspruch 1, nit einem Bereich zum Sapfangen einer Darstellung des zu identifizierenden Zeichens, einen Abtastgerät, nit dem der Bereich nehrfachen Rahnenabtastungen unterv/orfen werden kann, dadurch gekennzeichnet, daß die Abtastungen in wenigstens drei verschiedene Richtungen erfolgen können,daß durch eine Detektoreinrichtung (20) während jeder Abtastung feststellbar ist, ob jedes Elenent in dem Bereich einen Teil der Zeichendarstellung enthält oder nicht, daß durch logische Einrichtungen (38-4-4-) aus den Abtastun-den Codes in Abhängigkeit von der Gestalt der Zeichendarstellung erzeugbar sind:Beginn des Zeichens (S),Ende des Zeichens (F),öffnung des Zeichens (0),Schließen des Zeichens (C),daß eine Einrichtung (46) zun Auswerten der Codes vorgesehen ist, um die Zeichendarstellung in Segnente zu unterteilen, von denen jedes wenigstens teilweise eine Einbuchtung des Zeichens ungibt, daß ein Codespeicher (Fig.15-17) vorge-809820/0761sehen ist, daß eine Eingabeeinrichtung ε;τα Speichern .jener Codes ,jedes Segmentes, da3 konvexen ?ornea entspricht, in einen Teil des Ccdespeichers (z.B. 1-a, 2-b, 1-c, ... Fig. 21), welcher zu diesen Segnent gehört,vorgesehen ist, und daß ein Vergleiche? zun Vergleichen der funktioneilen Positionen in den Codespeicher von feilen (1-a, 2"b, 1-c,) des Codespeichers vorgesehen ist, v/elche die Codes speichern, wodurch wenigstens teilweise das Zeichen identifiziert wird.12. Vorrichtung nach Anspruch 11, dadurch gekennzeichnet, daß eine Eingabeeinrichtung zum Speichern jener Codes ,jedes Segments, welche konkaven Formen entsprechen, in einem Teil (z.B.1-b, Fig. 21) des Codespeichers vorgesehen ist, welcher zu diesem Segment gehört und sich von dein Teil (1-a, 2-b, 1-c, Fig. 21) unterscheidet, der zu dem selben Segnent gehört und zum Speichern jener Codes dient, die sich auf konvexe Formen beziehen.13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet, daß eine Eingabeeinrichtung zun Speichern jener sich auf konvexe Formen beziehenden Codes von den zv/ei Bereichen eines bestimmten Segments vorgesehen ist, Vielehe auf gegenüberliegenden Seiten einsr Verbindungslinie zwischen diesem Segment und einem anderen Segment (oder auf gegenüberliegenden Seiten einer geradlinigen Verlängerung dieser Linie) liegen, wobei diese Codes in unterschiedlichen Teilen (z.B. 1-a, 2-b, Fig. 21) des Codespeichers abgespeichert warden, und beide Teile dem bestimmten oegnent zugeordnet sind.1zi-. Vorrichtung nach Anspruch 12 oder 13, dadurch gekennzeichnet, daß die Einrichtung zum Auswerten eine Einrichtung umfaßt, die dan Beginn eines Segments durch Feststellen entweder des Codes "BEGINN" oder des Codes "GFFITUTiG" während einer der Rahmenabtastungen erkennt und die das Ende das Segments durch die Feststellung eines809820/0 7 61Codes :<60:iLIZS5Z::;" oder eines Codes "EITDE=1 v;ährend derselben Abtastung entdeckt.15· Vorrichtung "un Identifizieren von Zeichen durch dereni T:i C *~ ^ ! -^ ~T~ """Ϊ ■ : T * "1^ Λ ^ " " ^ """^ w '■"> ^i ti ^ ι / O T"* ""* 53 "1^ """^ O "Λ C* Ύ~1 Ci C* "^ j "^ ""* Ό """"M 1Λ Vi Wg e k e η η ζ 3 i c h net durch einen Bereich zus Aufnehmen einer Darstellung des zu identifizierenden Zeichens, ein Abtastgerät (26) zun Ausführen mehrerer Rahmenabtastur,-gen über den Bereich,, un so zv/ischen Eleaenten des Bereichs zu unterscheiden, die einen Teil der Zeichendarstellung enthalten und Sienenten, die keinen derartigen Teil enthalten,*.^· "bei die Rahmenabtastungen in wenigstens drei verschiedener Richtungen erfolgen, durch logische Einrichtungen (33-4-^-;, die aus jeder Abtastung in Abhängigkeit von der Gestalt der Zeichendarstellung keinen, oder einen oder mehrere der folgenden Codes erzeugen:Beginn des Zeichens (S),Ende des Zeichens (F),öffnung des Zeichens (O)1Schließen des Zeichens (C),wobei sich diese Cedes auf das ganze Zeichen oder einen Teil davon beziehen, und eine Vergleicheranordnung zu~n Vergleichen der Abstände zwischen Paaren der Codes, die sich auf eine Zeichendarstellung beziehen, wodurch wenigstens teilweise dieses Zeichen identifiziert wird.^-^ Vo ^"^2 O^ tu^iC~ τλz*'2~~ \'^ ^oruch ^ ~) dadurch ^ e k ~* ? ^zeichnet, daß ein Speicher zum Speichern der Koordinatenpositionen jedes Codes bezüglich eines festen Bezugspunktes innerhalb des Bereichs vorgesehen ist, und daß die Vergleichereinrichtung eine Einrichtung zum Vergleichen der Koordinaten der Codepaare aufweist.17· Vorrichtung zun Ausführen des Verfahrens nach Anspruch 7, dadurch gekennze ichnet, daß eine Vorrichtung nach einen der Ansprüche 1 bis 11 mit einer Vorrichtung809820/0761nach einen der Ansprüche 15 "eis 16 kombiniert ist, und daß eine Tergleicnereinrichtung zun Vergleichen der durch die jeweiligen Vorrichtungen erzeugten Identifikationsergebnisse vorgesehen ist, un das Zeichen besser zu identifiziere:18. Vorrichtung nach, einem der Ansprüche 11 bis 1?, dadurch gekennzeichnet, daß vier Abtastungen vorgesehen sind. da3 zwei erste Äbtastrichtungen lotrecht zueinander verlaufen und daß die Sichtungen der zwei anderen Abtastungen jeweils schräg zu den Sichtungen der beiden ersten Abtastungen und zu sich selbst lotrecht verlaufen.19- Vorrichtung nach, einem der Ansprüche 11 bis 1?i dadurch gekennz eichnet, daß drei Abtastungen vorgesehen sind, deren Richtungen jeweils um 120° versetzt sind.20. Vorrichtung nach einen der Ansprüche 12 bis 19, dadurch gekennzeichnet, daß ein Speicher sun Speichern eines vorbestimmten Satzes von Codegruppen vorgesehen ist, wobei jede Gruppe tich auf unterschiedliche Folgen von Zeichen vorbestinnter Gestalt bezieht und auf eine Liste von Codes besteht, Vielehe diesen Zeichen entsprechen, und daß ein Vsrgleicher vorgesehen ist, mit den die Identitäten aller für eine bestimmte Zeichendarstellung erzeugter Codes nit den vorbestinnten Satz von Codegruppen verglichen werden, wodurch wenigstens teilweise das Zeichen identifiziert wird.809820/0761
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB45872/76A GB1587613A (en) | 1976-11-04 | 1976-11-04 | Character identification |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2749222A1 true DE2749222A1 (de) | 1978-05-18 |
Family
ID=10438932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19772749222 Withdrawn DE2749222A1 (de) | 1976-11-04 | 1977-11-03 | Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen |
Country Status (5)
Country | Link |
---|---|
US (1) | US4163213A (de) |
JP (1) | JPS5357927A (de) |
DE (1) | DE2749222A1 (de) |
FR (1) | FR2370325A1 (de) |
GB (1) | GB1587613A (de) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0106354A2 (de) * | 1982-10-19 | 1984-04-25 | Siemens Aktiengesellschaft | Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
EP0107789A2 (de) * | 1982-09-30 | 1984-05-09 | Siemens Aktiengesellschaft | Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5242028A (en) * | 1975-09-29 | 1977-04-01 | Fujitsu Ltd | Letter recognition system |
US4177448A (en) * | 1978-06-26 | 1979-12-04 | International Business Machines Corporation | Character recognition system and method multi-bit curve vector processing |
DE3005206C2 (de) * | 1980-02-12 | 1983-01-05 | Computer Gesellschaft Konstanz Mbh, 7750 Konstanz | Verfahren zur automatischen Zeichenerkennung |
JPS57113185A (en) * | 1980-12-29 | 1982-07-14 | Comput Basic Mach Technol Res Assoc | Character recognition system |
DE3280036D1 (en) * | 1981-04-25 | 1989-12-28 | Image Processing Tech | Device for the automatic segmentation of a scanned image in an image pattern recognition system |
US4827531A (en) * | 1983-04-11 | 1989-05-02 | Magnetic Peripherals Inc. | Method and device for reading a document character |
US4596037A (en) * | 1984-03-09 | 1986-06-17 | International Business Machines Corporation | Video measuring system for defining location orthogonally |
EP0405400A3 (en) * | 1989-06-30 | 1992-09-02 | Mita Industrial Co., Ltd. | Image distinguishing device |
JPH0743764B2 (ja) * | 1990-08-08 | 1995-05-15 | 富士ゼロックス株式会社 | 線図形折線化処理装置 |
US5357581A (en) * | 1991-11-01 | 1994-10-18 | Eastman Kodak Company | Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition |
EP0539854B1 (de) * | 1991-11-01 | 1999-03-17 | Eastman Kodak Company | Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung |
EP0609474A1 (de) * | 1993-02-03 | 1994-08-10 | International Business Machines Corporation | Verfahren und Vorrichtung zum Umsetzen eines Bildes zur Klassifizierung oder Mustererkennung |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3503043A (en) * | 1960-11-17 | 1970-03-24 | Bell Telephone Labor Inc | Apparatus for interrogating alpha-numeric characters |
US3178688A (en) * | 1962-12-20 | 1965-04-13 | Control Data Corp | Character recognition by feature selection |
US3290650A (en) * | 1963-05-13 | 1966-12-06 | Rca Corp | Character reader utilizing stroke and cavity detection for recognition of characters |
GB1180290A (en) * | 1966-10-31 | 1970-02-04 | Tokyo Shibaura Electric Co | Apparatus for Recognising a Pattern |
US3992697A (en) * | 1974-12-27 | 1976-11-16 | Scan-Data Corporation | Character recognition system utilizing feature extraction |
-
1976
- 1976-11-04 GB GB45872/76A patent/GB1587613A/en not_active Expired
-
1977
- 1977-11-02 JP JP13211577A patent/JPS5357927A/ja active Pending
- 1977-11-02 US US05/847,894 patent/US4163213A/en not_active Expired - Lifetime
- 1977-11-03 DE DE19772749222 patent/DE2749222A1/de not_active Withdrawn
- 1977-11-04 FR FR7733294A patent/FR2370325A1/fr active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0107789A2 (de) * | 1982-09-30 | 1984-05-09 | Siemens Aktiengesellschaft | Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
EP0107789A3 (de) * | 1982-09-30 | 1986-05-28 | Siemens Aktiengesellschaft | Verfahren zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
EP0106354A2 (de) * | 1982-10-19 | 1984-04-25 | Siemens Aktiengesellschaft | Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
EP0106354A3 (de) * | 1982-10-19 | 1984-10-17 | Siemens Aktiengesellschaft | Verfahren zur Extraktion von Deskriptoren, vorzugsweise zur Darstellung von Druckvorlagen in Form von grössen- und drehlagenunabhängigen Bogenstrukturen zum Zwecke einer Dokumentenanalyse, insbesondere zur Schriftzeichenerkennung |
Also Published As
Publication number | Publication date |
---|---|
FR2370325A1 (fr) | 1978-06-02 |
US4163213A (en) | 1979-07-31 |
JPS5357927A (en) | 1978-05-25 |
GB1587613A (en) | 1981-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69230631T2 (de) | Verfahren zum Vergleichen von Wortgestalten | |
DE69230633T2 (de) | Verfahren zur Ermittlung von Wortformen zum folgenden Vergleich | |
DE69131216T2 (de) | Lagebestimmung von Strichkodierungen | |
DE3633743C2 (de) | ||
DE69728482T2 (de) | Zweidimensionaler Codeleser | |
DE69131006T2 (de) | Gerät und Verfahren zur optischen Zeichenerkennung | |
DE3879254T2 (de) | Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben. | |
DE69600461T2 (de) | System und Verfahren zur Bewertung der Abbildung eines Formulars | |
DE3751612T2 (de) | Gerät zum lesen eines nummernschildes. | |
DE3716787C2 (de) | ||
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE2431451C3 (de) | Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens | |
DE2432129C3 (de) | Verfahren zum maschinellen Lesen von Zeichen und Vorrichtung zur Durchführung des Verfahrens | |
DE2749222A1 (de) | Verfahren und vorrichtung zum automatischen erkennen oder lesen von zeichen | |
DE2858688C2 (de) | ||
DE2330181B2 (de) | Verfahren und Vorrichtung zum Lesen von Datenmarkierungen | |
DE3722444A1 (de) | Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten | |
DE2943749A1 (de) | Lernende anordnung zum erkennen von mustern digitaler signale | |
DE3783974T2 (de) | Optischer buchstabenleser. | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE2410306C3 (de) | Anordnung zur Einstellung eines Abtastrasters oder einer Erkennungslogik auf die Schräglage von abzutastenden bzw. zu erkennenden Zeichen | |
DE1946861A1 (de) | Geraet zur automatischen Ermittlung der Mittelpunkte von jeweils eine Vielzahl von Hautleisten aufweisenden Fingerabdruecken | |
DE2461651C3 (de) | Zählvorrichtung zum Zählen von Mustern | |
DE3303841C2 (de) | Musterprüfeinrichtung und Verfahren zum Prüfen eines Musters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |