DE2227016C3 - Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen - Google Patents

Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen

Info

Publication number
DE2227016C3
DE2227016C3 DE19722227016 DE2227016A DE2227016C3 DE 2227016 C3 DE2227016 C3 DE 2227016C3 DE 19722227016 DE19722227016 DE 19722227016 DE 2227016 A DE2227016 A DE 2227016A DE 2227016 C3 DE2227016 C3 DE 2227016C3
Authority
DE
Germany
Prior art keywords
characters
counter
image
product
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
DE19722227016
Other languages
English (en)
Other versions
DE2227016B2 (de
DE2227016A1 (de
Inventor
Kousuke Tokio Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP46038802A external-priority patent/JPS5114409B1/ja
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Publication of DE2227016A1 publication Critical patent/DE2227016A1/de
Publication of DE2227016B2 publication Critical patent/DE2227016B2/de
Application granted granted Critical
Publication of DE2227016C3 publication Critical patent/DE2227016C3/de
Expired legal-status Critical Current

Links

Description

Die Erfindung bezieht sich auf eine Bildklassifikationseinrichtung zur Wiedererkenhung geometrischer Zeichen, insbesondere Schriftzeichen, bei der ein Bildfeld rasterförmig abgetastet wird, bei der ein den Bildpunkten bzw. Untergrundpunkten zugeordnetes digitales Ausgangszeitfolgesignal (z. B. x, = »1«; x, = »0«) mit Gewichtungsfaktoren multipliziert wird und das Produkt zur Bestimmung bzw. Wiedererkennung des Ähnlichkeitsgrades zwischen den zu erkennenden Zeichen und Vergleichszeichen in einer Zähleinrichtung aufsummiert wird.
Schriftzeichen, Symbole, Figuren, menschliche Stimmen stellen Kennzeichnungsmerkmale dar. Hierfür ist ohne eine Beschränkung nachfolgend der kürzere Ausdruck »Bild« gewählt. Die Lesbarkeit von Schriftzeichen zum Beispiel entspricht der Wiedererkennungsfähigkeit einer Kategorie zu welcher ein besonderes Bild (Muster) gehört.
Die hierbei erforderliche Klassifizierungsarbeit ist für einen Menschen leicht auszuführen. Sie ist aber sehr schwierig und aufwendig von Rechenmaschinen durchzuführen.
Es sind bereits optische Bildwiedererkennungsanlagen für besondere Zwecke bereits entwickelt und unter der Abkürzung OCR-Anlagen (Optical Character Recognition) bekanntgeworden. Bei diesen OCR-Anlagen ist die Anzahl der Klassen oder Kategorien, die klassifiziert werden können jedoch auf etwa ein Dutzend begrenzt. Die Erweiterung solcher OCR-Anlagen, mit denen einige tausend Schriftzeichen wiedererkennbar wären, würde zu einem außerordentlich großen, nicht mehr vertretbaren Aufwand führen. Die Lösung der hiermit zusammenhängenden Probleme ist von großer Bedeutung für OCR-Anlagen, die in naher Zukunft für die Wiedererkennung von chinesischen Schriftzeichen zu entwickeln sind.
Aus der US-PS 32 75 986 ist zwar eine beliehig erweiterbare Bildwiedererkennungsanlage vorgeschlagen worden, bei der ein Bild rasterförmig abgefragt wird. Für jede Klasse, der ein Bild angehören kann, ist eine Gruppe von Bauelementen vorgesehen. Jede dieser Gruppen enthält wiedetum für jedes Bildraster einen Speicher, in dem c>n gewichtetes Vergleichszeichen des in dem Raster erwarteten Merkmals bei Vorliegen der entsprechenden Gruppe gespeichert ist. ίο
Hat z. B. ein Bildfeld 7 Raster (z. B. zur Erkennung der im 7-Segment-Code dargestellten Ziffern O bis 9) und sollen 10 Klassen erkannt werden, so sind bereits 7 - 10 = 70 Speicher vorgesehen. Jeweils die einer Klasse zugehörigen Speicher sind über logische Gatter mit jeweils einer Zähleinrichtung pro Klasse verbunden. Ein Zeichen gilt als zu der Klasse zugehörig, dessen Zähler den höchsten Betrag aufsummiert enthält. Da diese Bilderkennungsanlag<~ im »Parallelbetrieb« arbeitet ist zwar die Arbeitsgeschwindigkeit sehr hoch, jedoch der Aufwand steigt in unvertretbarem Maße (so sind bei einem Rasterfeld mit 32 Rastern und einem alphanumerischem Code mit 25 Buchstaben, 10 Ziffern und 10 Sonderzeichen bereits 1440 Speicher und 32 Zähler erforderlich).
Allgemein lassen sich OCR-Anlagen in folgende vier Hauptbestandteile zergliedern
1. Dokument-Eingabe,
2. optische Beobachtungseinrichtung.
3. Wiedererkennungseinrichtung.
4. Steuereinrichtung.
Die Dokumenteingabe bringt jedes Dokumentoder Schriftblatt in eine bestimmte Position innerhalb der Reichweite der Beobachtungseinrichtung. Die Schriftzeichen, die an bezeichneten Stellen auf dem Dokument gedruckt sind, werden eines nach dem anderen durch die Beobachtungseinrichtung optisch abgetastet. Die abgetasteten Schriftzeichen werden in betreffende Bilder auf Netzwerken umgewandelt. Die Wiedererkennungseinrichtung vergleicht die Bilder auf dem Netzwerk mit einem Vergleichsbild und gibt einen Ausgang entsprechend der Klassenbezeichnung des Vergleichsbildes ab, welches zu dem wirkliehen Bild paßt. Die Steuereinrichtung steuert dabei die Eingabe, die optische Beobachtungseinrichtung und die Wiedererkennungseinrichtung.
In den derzeitigen OCR-Anlagen sind die Dokumenteingabe (1), die optischen Beobachtungseinrichtungen (2), die Wiedererkennungseinrichtungen (3) und die Steuereinrichtungen (4) in ihren Herstellungskosten zueinander gut ausgewogen. Mit der Zunahme der Anzahl der Eingangsmerkmale mit der Anzahl der Vermaschungen entfällt jedoch auf die Einrichtungen (2) und (3) der weitaus größere Anteil der Kosten. Die Erfindung befaßt sich daher vor allem mit der Einrichtung (3). Bevor auf Einzelheiten der Erfindung näher eingegangen wird, werden zum besseren Verständnis einige Grundlagen von Bildklassifikationseinrichtungen an Hand von schematischen Zeichnungen näher erläutert und Nachteile bekannter Technologien zur Verdeutlichung der Erfindungsaufgabe herausgestellt. In den Zeichnungen zeigt
Fig. I eine weitgehend vereinfachte schematische Darstellung einer Beobachtungseinrichtung,
F i g. 2 einen Schaltplan einer Wiedererkennungseinrichtung und
F i g. 3 ein Blockschaltbild einer Bildklassifizierungsanlage,
F i g. 1 zeigt eine stark vereinfachte schematische Darstellung einer optischen Beobachtung- oder Wahrnehmungseinrichtung Ein Teil 2, mit einem Eingangsbild (Muster), ist in neun Raster (Felder) aufgeteilt. Die Helligkeit jedes Rasters wird eines nach dem anderen mittels der optischen Einrichtung 1 in ein elektrisches Signal umgewandelt. Das elektrische Signal wird in ein binäres elektrisches Signal (.V1. x2 ... und X9) überführt, das davon abhängig ist. ob die Helligkeit die durchschnittliche Helligkeit übersteigt oder nicht. Die binären elektrischen Signale werden an ein Schieberegister 3 weitergegeben. Eine Folge von elektrischen Signalen x,,X2-- und V4 als Ausgang der optischen Einrichtung ί mit aufeinanderfolgenden vorbestimmten Zeitintervallen bildet ein 9dimensionales Zeitfolgebild, das an die Flip-Flops 4 des Registers 3 gelangt. Auf diese Weise ist ein Eingangsbild X = {x,,x: ... xj an das Register 3 gelegt. Das einfachste Wiedererkennungsverfahren für das Eingangsbild X besteht darin, als erstes eine Anzahl von Rasterbildern zu bilden, die Bildsorten oder -klassen darstellen, und dann zu bestimmen, welche der Rasterbilder mit dem Eingangsbild A' übereinstimmen. Die Rasterbilder entsprechen schwarzen Teilen, und solche, die weißen Teilen entsprechen, werden separat gebildet. Außerdem wird der Grad der Übereinstimmung der schwarzen und weißen Teile separat vorgenommen. Die Ergebnisse dieser Ermittlung werden zusammengefaßt. D'ie zustandsabhängige Variable oder der Bewertungskoeffizient für jede Komponente des Rasterbildes ist ein binärer Wert 1 oder 0, oder — in anderen Worten - ein durch die Zustandsabhängigkcit erhaltener Wert, der variabel für jede Komponente des Eingangsbildes λ" ist. Im Ergebnis kann die Ermittlung der Übereinstimmung erhalten werden bei Verwendung einfacher logischer Schaltungen, wie UND- oder ODER-Schaltungen usw.
In jüngsten weiterentwickelten Wiedererkennungsverfahren auf der Basis der vorstehenden Grundlagen wird die statistische Verarbeitungsmethode wegen der Unvollständigkeit der Eingangsbilder und der Lichtflecken und Leerstellen der Zeichen gewählt. Mit anderen Worten wird in dem Erkennungsverfahren die Ähnlichkeit an Stelle der Gleichheit bestimmt. Da die Zustandsabhängigkeit, variabel für jede Komponente des Rasterbildes, einen Wert zwischen »0« und »1« aufweist, wird das resultierende Rasterbild auf den »Bewertungsvektor« (Gewichtsvektor) zurückbezogen. Im allgemeinen sollte d-;r Bewertungskoeffizient \\\j für die /-te Komponente des Bewertungsvektors Wj der y-ten Klasse derart gesetzt sein, daß die Antreffwahrscheinlichkeit für den Fall angezeigt wird, wo die Zustandsabhängigkeit bei variablen x, für die i'-te Komponente des Eingangsbildes X, das zur j-ten Klasse gehört »1« ist. Für den Fall, daß die Zustandsabhängigkeit bei variablen x, für die /-te Komponente des Eingangsbildes X, das zu der j-ten Klasse gehört, »0« ist, betragt die AntrefFwahrscheinlichkcit daher (1 — \\\j).
Der Bewertungsvektor, der zur /-ten Klasse gehört, kann in einen »positiven« Bewertungsvektor Wj. der die Komponenten wtJ aufweist, und in einen »negativen« Bewertungsvektor (1- W,) geteilt werden, der die Komponenten (1-H0) aufweist, wobei 1 eine ganze Zahl von I bis /1 und / eine ganze Zahl von 1 bis
m bedeutet, während alle Komponenten des Vektors 1 gleich »1« sind. Weiterhin bezeichnet /ι die Zahl der Komponenten für das Eingangsbild A' (Maßzahl) und m die Zahl der Bewertungsvektoren oder Klassen. Um die Klasse zu bestimmen, zu welcher das Eingangsbild X gehört, wird der Grad der Ähnlichkeit, der beim Berechnen des Innenproduktes des Eingangsbildes X und des Bewertungsvektors erhalten wird, von den Bewertungsvektoren und der Klassen-Entsprechend ist das inverse zweite Eingangsbild
einzuführen.
aus
bezeichnung Für den Bewertungsvektor des größten io Das Innenprodukt von A", und (1- M^) ergibt sich erhaltenen Ähnlichkeitsgrades hergeleitet. Außerdem ist festzustellen, daß die Ähnlichkeit nicht allein von dem Innenprodukt des Eingangsbildes X und des Bewertungsvektors W1 hergeleitet werden kann.
Angenommen, daß der positive Vektor W} bestimmt 15 sich aus
0,7 ■ 1 + 0,2 ■ 0 + 0,9 · 1 + 0,1 ■ 0 + 0,8 ■ 1 = 2.4, und das Innenprodukt von X1 und (H- W}) ergibt
ist durch
W, =
0,3
0,8
0,1
0,9
0,2
und ein erstes Eingangsbild A", bestimmt ist durch
dann ergibt sich das Innenprodukt von W} und Xx aus
0.03 · 0 + 0,8 ■ 1 + 0.1 · 0 + 0,9 ■ 1 + 0.2 ■ 0 = 1.7
Andererseits, wenn ein zweites Eingangsbild X2 bestimmt ist durch
0,7 ■ 0 + 0,2 · 0 + 0,9 · 0 + 0,1 · 0 + 0,8 · 0 = 0.
In diesem Falle ist 2,4 offensichtlich größer als 0. Hieraus folgt, daß das Bild X1 näher an dem charakteristischen Eingangsbild der j-ten Klasse ist als das Bild X2.
Die Rechenergebnisse für die positiven und negativen Bewertungsvektoren werden zusammengefaßt. Im einzelnen ist die Summe der ersten Eingangsbilder 1,7 und 2,4 gleich 4,1. Die Summe der beiden Innenprodukte der zweiten Eingangsbilder 2,3 und 0 ist gleich 2,3. Bei Vergleich der beiden Summen 4,1 und 2,3 ergibt sich, daß das erste Eingangsbild ähnlicher dem ./-ten Rasterbild ist als das zweite Eingangsbild.
Diese Entscheidung ist ohne Widerspruch mit einer visuellen Prüfung.
Im Ergebnis ergibt sich die Ähnlichkeit zwischen dem Eingangsbild X und dem charakteristischen Bild der y-ten Klasse aus der Gleichung
(X* Wj) +[A" Ml-
X7 =
ist das Innenprodukt von W1 und X2 bei entsprechender Berechnung 2,3. Na'ch dieser Berechnung ist 2,3 größer als 1,7. Daher ergibt sich, daß das Eingangsbild X2 das ähnlichste der charakteristischen Eingangsbilder der ;-ten Klasse ist. Aus diesem Grunde ist einzusehen, daß der negative Bewertungsvektor (3L— Wj) berücksichtigt werden sollte. Der negative Bewertungsvektor ist bestimmt durch
1L- Wj =
Bei entsprechender Berechnung muß der inverse Bewertungsvektor X1 eingeführt werden, der ausgedrückt wird durch
1,0 0,3 1 = 0,7)
1,0 0,8 0,2
1,0 0,1 0,9
1,0 0,9 0,1
UoJ 0,2 0,8 j
wobei der Stern * das Operationszeichen für das I nnenprodukt darstellt.
Es wurden bereits die verschiedensten Methoden vorgeschlagen, den Wertigkeitskoeffizienten für jede Komponente des positiven oder negativen Vektors von jeder Klasse zu bestimmen. Zum Beispiel ist eine Methode zum Bestimmen der Bewertungskoeffizienten durch Lernvorgänge von einer Anzahl von Ubungsbildern (Trainingsbildern) in dem Buch »Learning Machines« von Niles J. Nil son, McGraw-Hill Book Comp. 1965, weiterentwickelt. Ferner ist in dem Artikel von George N a g y »State of the Art in Pattern Recognition«, veröffentlicht in Proceedings of the JEEE, Vol. 56, Nr. 5, 1968, S. 836 bis 862 diskutiert, wie die Bewertungsfaktoren für den günstigsten Bildklassifikationsbetrieb bewertet werden können.
In jedem Fall können die Bewertungskoeffizienten von einem Rechner unter Verwendung der Formeln leicht ermittelt werden, selbst wenn nur ein Teil der statistischen Besonderheiten der Bilder bekannt sind, die der OCR-Anlage aufgegeben sind.
Fig. 2 zeigt ein Schaltdiagramm in einer herkömmlichen OCR-Anlage. Die Schaltung selbst kann als Bildklassüzierungsanlage anders als die OCR-Anlage verwendet werden.
In F i g. 2 wird ein zeitlich aufeinanderfolgendes
Eingangsbild X von der Beobachtungseinrichtung 1 an ein Schieberegister 3 gelegt, wobei die i-te Komponente Xj des Eingangsbildes X entweder »1« oder »0« ist. Die Flip-Flops 4 des Registers 3 speichern
die zustandsabhängigen Variablen für die Komponenten der Bilder X.
Die Widerstände 5 in Verbindung mit den F'lip-Flops 4 besitzen Widerstandswerte entsprechend den Bewertungskoeffizienten. Ein Funktionsveistärker 7 und ein Widerstand 6 sind vorgesehen, um die Betriebsfunktion derart zu erhöhen, daß das Signal
+ Λ,
Ri
am Ausgang 8 des Verstärkers erscheint.
Wenn «·,, dem Wert -—'- entspricht, kann das
Innenprodukt von X und Wj errechnet werden. Dabei kann das Innenprodukt eines inversen Eingangsbildes X und ein negativer Beweriungsvektor (H- Wj) in demselben Kreis nach Fi g. 2 ermittelt werden.
Ein solcher Kreis ist in der herkömmlichen OCR-Anlage verwendet, da der Kreis eine einfache Struktur aufweist und als integrierter Kreis aufgebaut werden kann. Jn einem solchen Kreis sind die folgenden Schwierigkeiten jedoch nicht zu umgehen: Erstens ist es unmöglich, den Bewertungsvektor zu ändern. Weiterhin ist die Arbeitsweise des Kreises ungenau und die Verdrahtung des Kreises wird komplizierter mit dem Anwachsen der Zahl der Komponenten des Eingangsbildes.
Um dieses Problem zu lösen, ist vorgeschlagen worden, an Stelle des Widerstandskreises ein Digitalspeicher zu verwenden, der das Gelesene nur speichert. Hierbei wird jede Komponente w^ des Bewertungsvektors diskret gespeichert. Daher wird ein ganzzahliger Wert ws größer als 1 an Stelle von I verwendet, d. h., n·, wird als Vektor 1 verwendet. Hierdurch kann die Berechnungsgenauigkeit wesentlich verbessert werden.
In Fällen, in denen eine große Anzahl von Bildern oder Klassen, wie die chinesischen Schriftzeichen, klassifiziert werden sollen, sind zusätzlich zu dem digitalen Speicher die verschiedensten Speicher erforderlich.
Einige Probleme beim Wiedererkennen von chinesischen Zeichen sind in dem Artikel »Recognition of Printed Chinese Characters« in der Zeitschrift IEEE Transactions on Electronic Computers, Vol. 15, Nr. 1, Februar 1966, aufgezeigt.
F i g. 3 zeigt einen Schaltkreis einer vorgeschlagenen Bildklassifizieranlage. Hierbei handelt es sich um kleinmaßstäbige Anlagen, die sich in Wiedererkennungseinrichtungen einsetzen lassen.
• In F i g. 3 werden alle Bewertungsvektoren in einem digitalen Speieher 9 mit beliebigem oder wahlweisem Zugriff gespeichert. Eine oder zwei Bewertungskoeffizienten pro Wort werden in dem Speicher 9 gespeichert. Auf Grund eines Steuersignals vom Steuerkreis 13 werden Komponenten positiver und negativer Bewertungsvektoren von jeder Klasse an ein Schieberegister 10 für den positiven Bewertungsfaktor und an ein Schieberegister 11 für den negativen Bewertungsfaktor nacheinander gegeben. Sobald die Eingangsbilder in das Schieberegister 3 gelangen, wird der Grad der Ähnlichkeit für jede Komponente bestimmt. Dabei werden die Werte ϊ, · w,7 und .χ, · (wx - Wy) bezüglich der f-ten Komponente Xf (1 oder 0) des Eingangsbildes X bestimmt ind die Summe dieser Produkte wird in dem Register 12 für jede Komponente gespeichert. Das Ergebnis an allen Komponenten wird auf das Register I gegeben und in einem Addierer 16 aufsummiert. Di Summe entspricht dem Rechenergebnis
und wird normalerweise als Bewertungssumme be zeichnet. Die Bewertungssumme wird durch einer Umwandler 17 in ein binäres Signal übergeführt
ίο das dem Steuerkreis 13 aufgegeben wird.
Wenn der Grad der Ähnlichkeit größer und die Bewertungssumme einen gewissen Schwellwert übersteigt, ist der Ausgang des Umwandlers 17 gleich »I«, wohingegen der Ausgang »0« ist, wenn die Bewer-
is tungssumme unterhalb des Schwellwertes bleibt.
Der Steuerkreis 13 speichert den Ausgang des Umwandlers 17. und die Adresse wird in dem Speicher 9 in eindeutiger Übereinstimmung ausgewählt.
Bewertungsfaktoren Wj und Ws - W) PJr jedes Ein-
gangsbild entsprechend verschiedenen Klassen werden aufeinanderfolgend von dem Speicher 9 ausgelesen. Die Bewertungssumme wird berechnet und in »I« oder »0« durch den Umformer 17 umgewandelt. Der Ausgang des Umformers wird in dem Steuerkreis 13 gespeichert. Die Benennung einer Klasse oder Kategorie, zu der das Eingangsbild gehört, kann abhängig von einer Folge »1« und »0« am Ausgang des Umformers 17 entschieden werden. Die Entscheidung der Klassenzuordnung für das Eingangsbild wird an den Ausgang 14 abgegeben. Sofort nach der Entscheidung bewirkt der Steuerkreis 13, daß der Lesekreis 1 und der digitale Speicher 9 in die Ausgangsstellung zurückgesetzt werden und gibt ein Steuersignal ab. das die Annahme eines neuen Eingangsbildes erlaubt. Die Schieberegister 10. 11 und 12 werden jedesmal zurückgesetzt, wenn die Bildung des Bewertungsvektors Wj vom Speicher 9 abgeschlossen ist. Anschließend werden die Schieberegister bei Eintreffen eines neuen Bewertungsvektors Wj gestellt.
Eine derartige bekannte OCR-Anlage weist folgende Nachteile auf: (1) Wenn die Zahl der Bewertungsvektoren Wj oder die Dimensionen η des Eingangsbiides erhöht sind, wird sowohl die Speicherkapazität des Kernspeichers 9 als auch das Zeitintervall, das zum Abtasten sämtlicher Adressen erforderlich ist, außerordentlich groß. (2) Mit dem Anwachsen der Anzahl der Bits jedes Bewertungskoeffizienten wtj wird eine entsprechend vergrößerte Speicherkapa-
zität der Schieberegister 10, 11 und 12 erforderlich. Zum Beispiel in einer OCR-Anlage, die in der Lage ist 3000 geordnete chinesische Schriftzeichen zu lesen, müßte der digitale Speicher sogar, wenn verschiedene Vorkehrungen zur Begrenzung der Anzahl der Bewertungsvektoren W? (Rasterbilder) auf 104, der Anzahl der Dimensionen auf 103 und der Anzahl der Bits jedes Bewertungskoeffizienten weniger als 4 getroffen worden sind, eine Speicherkapazität von 8 · 107 Bits aufweisen. Außerdem sind drei Sätze von 4 · 103 Schieberegistern und ein weiterer Satz von 103 Schieberegistern erforderlich. Angenommen der Zeitzyklus beträgt 1 Millisekunde, so beträgt das Zeitintervall, das zum Lesen sämtlicher Wörter in dem Speicher 9 erforderlich ist, 10 Sekunden. Da auch die Herstellungskosten pro Bit der Schieberegister 10, 11 und 12 und des Speichers 9 gegenwärtig sehr hoch sind, ist eine Anlage nach Fig. 3 sehr aufwendig, kostspielig in der Herstellung.
609 642/169
Wie sich aus dem Vorstehenden ergibt, weist eine OCR-Anlage mit der vorgeschlagenen Bildklassifikationsanlage zur Wiedererkennung von chinesischen Zeichen erhebliche Nachteile bezüglich der notwendig hohen Kosten und der relativ langen Lesezeit auf.
Aufgabe der Erfindung ist es daher bei einer Bildklassifikationseinrichtung der eingangs genannten Art sowohl die vom Zeichen selbst als auch die vom Untergrund stammenden Informationen mit gewichteten Werten von Vergleichszeichen zu korrelieren und in schaltungstechnisch einfacher Weise das abgetastete Zeichen zu erkennen. Insbesondere soll auch eine Zwischenspeicherung des Zeichens entbehrlich sein.
Eine erste erfindungsgemäße Lösung dieser Aufgabe ergibt sich aus dem Kennzeichen des Anspruchs 1.
Eine weitere erfindungsgemäße Lösung der Aufgabe folgt aus dem Kennzeichen des Anspruchs 2.
Vorteilhafte Ausführungen der ersten und zweiten Lösung sind den Merkmalen des Anspruchs 3 zu entnehmen.
Mit der Erfindung werden folgende Vorteile erzielt:
1. Es sind keine Schieberegister für die zeitweise Speicherung des Eingangsbildes erforderlich. Außerdem kann die Bewertungssumme für das Eingangsbild innerhalb des Zeitintervalls kleiner als die Speicherzeit erhalten werden.
2. Da ein geringe Kosten verursachender Speicher mit aufeinanderfolgendem Zugang verwendet wird, ist eine OCR-Anlage mit einer Bildklassifikationseinrichtung nach der Erfindung mit geringeren Kosten herzustellen als bekannte vergleichbare OCR-Anlagen, die Speicher vom Magnetkerntyp mit beliebigen oder wahlweisen Zugriff aufweisen müssen.
3. Weil die Bewertungskoeffizienten als ein Verhältnis der Ziffern »I« und »0« gespeichert werden, kann ein Ein-Bit-Speicherfehler fast nicht bewirkt werden.
Außerdem werden die positiven und negativen Bewertungsvektoren in Paaren gespeichert, und Fehleranzeigen lassen sich dadurch ausführen, daß die Summe der Gewichtskoeffizienten von jeder Komponente stets konstant ist. Die Zuverlässigkeit der erfindungsgemäßen Anlage kann dadurch wesentlich verbessert werden.
4. Bei Verwendung von blasenförmigen Magnetbezirken als Speicher mit aufeinanderfolgendem Zugang lassen sich die parallele Berechnung der Bewertungssummen leicht bewerkstelligen. Hieraus resultiert eine große Kostenersparnis bei der Herstellung von OCR-Anlagen, und gleichzeitig wird eine Erhöhung der Verarbeitungszeit erreicht.
5. Ein weiterer wesentlicher Vorteil der Erfindung besteht darin, daß das Innenprodukt aus dem positiven und negativen Bewertungsvektor, die in dem Speicher 20 (mit aufeinanderfolgendem Zugriff) gespeichert sind, erhalten werden kann, ohne das Eingangsbild X (Zeitfolgebild) selbst einmal zu speichern, welches über die Beobachtungseinheit vom Abtasttyp in das Schieberegister gegeben wird. Hierdurch wird die Schwierigkeit vermieden, daß die Herstellungskosten als auch die Verarbeitungszeit mit dem Anwachsen der Zahl der Dimensionen oder Rasterbilder des Eingangsbildes stark ansteigen.
In den weiteren Zeichnungen Fig. 4 bis 6 sind Ausführungsbeispiele nach der Erfindung schematisch dargestellt. Hierin zeigt
F i g. 4 ein Blockschaltbild für ein erstes Aus führungsbeispiel nach der Erfindung,
Fig. 5 ein Blockschaltbild für ein zweites Aus führungsbeispiel nach der Erfindung,
F i g. 6 wie ein Eingangsbild X durch die Anlag« nach F i g. 5 verarbeitet wird.
In Fi g. 4, in der ein Blockschaltbild eines erster
Ausführungsbeispieles nach der Erfindung darge stellt ist, umfaßt die Bildklassifizierungsanlage einer
ίο Speicher 20 mit aufeinanderfolgendem Zugang zui Speicherung der Bewertungsvektoren
W\ = Iu11. H12 .. . und wns) und
7, - IV1) = [w\ - W11, w_, - H21 . . . und η-, - H·,,,!
in analoger Form jeweils in einem der zwei Speicherabschnitte 27 a und 27 b. Außerdem sind Schalter 21a und 21 h vorgesehen, die jeweils mit einen" der Leseanschlüsse 29a und 29b der entsprechenden Speicherabschnitte 27 a und 27b in Verbindung stehen. Weiterhin ist eine Zähleinrichtung 22 vorgesehen, die an die Verbindung der Ausgänge dei Schalter 21 α und 21 b angeschlossen ist. Der Zähler 22 ist mit einem Komparator 23 verbunden. Ferner isl ein Polaritätsdetektor 24, ein logischer Verarbeitungskreis 25, eine Bildabta-.tvorrichtung 1 und ein Zeitsteuerkreis 26 vorhanden. Der Zeitsteuerkreis 26 liefert Zeitsteuersignale zur Synchronisierung, die an die Abtastvorrichtung 1 abgegeben werden. Der Speieher 20, der Zähler 22 und der Polaritätsdetektor 24 sind durch Signalleitungen 26a, 26d\ 26b und 26e mit dem Zeitsteuerkreis 26 verbunden.
In Fällen, in denen der Speicher 20 Informationen nur digital speichern kann (z. B. Magnettrommeln
oder Einrichtungen mit blasenförmigen Magnetbezirken), werden binäre Speicherbits den Komponenten H11 und H5 - H11 (/ = 1, 2 ... und n) der Bewertungsvektoren W1 und W5 - W1 in den Speicherabschnitten 27 a und 27b zugeteilt, und analoge Werte ent-
40. sprechend diesen Komponenten werden in dem Speicher 20 als die Summe der Ziffern »1« gespeichert Die Summe der Ziffern »1« der /-ten Komponente de? positiven Bewertungsvektors und die Summe dei j-ten Komponente des negativen Bewertungsvektors
wird jeweils »vs, was in der einfachen Verrichtung dei Speicherfehler-Kontrolle begründet ist.
Die Schalter 21a und *~21b werden in Fig. 4 nach unten geschaltet, wenn jede Komponente (x,, i = 1, 2 ... und n) des Eingangsbildes »1« ist
und werden nach oben geschaltet wenn sie »0« ist Wenn daher die Komponente des Eingangsbildes »1« ist. wird die /-te Komponente wn des Bewertungsvektors W1 = Uvn, w21 ... und w„,} in dem Speicherabschnitt 27 a an den Zähler 22 abgegeben, und wenn
die Komponente des Eingangsbildes »0« ist, wird die /-te Komponente des Bewertungsvektors Ws - W1 = iw,~wiu W1-W21... und ws-wn,} in dem Speicherabschnitt 27b an den Zähler 22 weitergegeben. Der Ausgang des Zählers 22 wird gleich dem
Innen produkt
[X* W1-] + [J* (W5-H/,)]
das die Ähnlichkeit angibt zu der Zeit, bei der die Endkomponente xn des Eingangsbildes X = {x,. x2... und x„] in den Schaltkreis 21a oder 21b gelangt ist. Ob die Ähnlichkeit einen bestimmten Wert übersteigt oder nicht, kann durch den Komparator 23
3
bestimmt werden, der den Ausgang des Zählers 22 mit einem bestimmten Schwellwert vergleicht, der am Eingang 28 angelegt ist. Wenn das Ergebnis des Vergleichs am Komparator 23 positiv ist. nimmt der Ausgang des Detektors 24 den Wert »1« an. Nachdem das Eingangsbild verarbeitet ist. gibt der Steuerkreis ein Signal ab. um über die Signalleitung 26b den Zähler 22 zurückzustellen.
Es ist besonders zweckdienlich, den Schwellwerl
am Einnanti 28 uleich der Hälfte , η ■ n\ des
maximalen Betrages zu wählen, welcher das Innenprodukt bilden kann, das ist der Wert η der Anzahl der Komponenten des Eingangsbildes multipliziert mit dem Sättigungswert w\. Der Wechsel der Bewertungsvektoren
W1 = Iu11. W21 . .. und iv,,,! und
W1) = jiv4 - Un. ut - iv,, ... und iv4 - iv„
wird in der Praxis selten vorliegen. Es ist daher kein schwieriges Problem, wenn die Einschreibperiode mehrere 10 Minuten erfordert. Sogar wenn der Wechsel der Bewertungsvektoren W1 oder H4W\ mehrfach erscheint, ist es nicht schwierig derart zu verfahren, weil großzählige Rechner zur Zeit auf Zeitanteilbasis benutzt werden können.
Wenn einige Einheiten aus den Elementen 27«. 27b, 21a. 2\b, 22, 23 und 24 parallel geschaltet sind, kann ein kompliziertes Eingangsbild X in mehrere Klassen klassifiziert werden. In solch einem Falle werden die Bewertungsvektoren, mehreren Klassen entsprechend, in dem Speicher 20 gespeichert, und Ausgänge von mehreren Polungsdetektoren 24 werden in dem Kreis 25 zusammengefaßt, wobei die Klassifikation in die gewünschte Klasse erreicht ist.
In F i g. 5, die ein Blockdiagramm eines zweiten Ausführungsbeispieles nach der Erfindung darstellt, sind Elemente, die Elementen in F i g. 4 entsprechen, mit den gleichen Bezugszeichen versehen. Der einzige Unterschied gegenüber der Ausführung nach F i g. 4 besteht in der Verwendung von zwei Zählern 22 α und 22 b an Stelle eines einzigen Zählers 22 nach F i g. 4.
Die Funktionsweise der in F i g. 5 dargestellten Ausführungsform der Erfindung sei im folgenden beschrieben.
Im Speicher 27a sind gewichtete Werte von Bildpunkten der Vergleichszeichen (iv,) gespeichert, im Speicher 27/) demgegenüber gewichtete Werte von Untergrundpunkten (iv, — n·,) bei den genannten Vergleichszeichen. Die beiden Schalter 21 a. 21 b werden von den Abtastsignalen der Abtastvorrichtung 1 wie folgt gesteuert: Bei Auftreten eines vom Zeichen stammenden Signals (x,) liegt der Ausgang des Speichers27a über den Schalter 21 α am Eingang des Zählers 22 α, der Ausgang des Speichers 27 b über den Schalter 21 b am Eingang des Zählers 22b.
Beim Auftreten eines vom Untergrund stammenden Signals vertauscht sich die Zuordnung vom Speicher zum Zähler. Damit werden im Zähler 22 α die gewichteten Werte von Abtastpunkten summiert, wenn gleiche Bereiche (also Zeichenbereich oder Untergrundbereich) vom abgetasteten Zeichen und von Vergleichszeichen korreliert werden. Im Zähler 22h hingegen werden die gewich teten Werte von Abtastpunkten aufsummiert, wenn ungleiche Bereiche, also Bildpunkt des abgetasteten Zeichens mit Untergrundpunkt des Vergleichszeichens und umgekehrt korreliert werden. Am Ausgang des Zählers 22 a erscheint also die Summe
[X* W1] + [X MW4 -W1)-]
sobald das Eingangsbild X aufgegeben worden ist. wohingegen am Ausgang des Zählers 22b die Summe
[X* W1] + [X* (W^-W1)]
erscheint. Daher ist der Ausdruck am Komparator 23 [λ'* H1J-[J* VV1] + [.?*(Η; - W1)] - [A-1MW/- W1)].
In Fig. 6. in der die Verarbeitungsoperation des Eingangsbildes mit fünf Komponenten durch die Anlage nach F i g. 5 verdeutlicht ist, ist angenommen, daß der positive Bewertungsvektor VV1 und der negative Bewertungsvektor (W5 — W1) jeweils von den Speicherabschnitten 27 a und 27 b des Speichers 20 in Form von Impulsketlen 31, 32 abgegeben werden. Jede dieser Impulsketten wird mit Zeitimpulsen 30 synchronisiert. Angenommen, daß das Eingangsbildla mal Folgebild), welches an den Schaltkreisen 21 α und 21 b synchron mit den Zeitimpulsen 30 ist. eine Impulskette 33 annimmt, ergeben sich an den Ausgängen der Schaltkreise 21a und 21b Impulsketten 34, 35, 36 und 37, wie in F i g. 6 gezeigt ist. Die Impulskette 34 ist das Ergebnis der UND-Operation der Impulsketten 31 und 33. Die Impulskette 35 ist das Ergebnis der UND-Operation der Impulskette 31 und der inversen Impulskette 33. Die Impulskette 36 ist das Ergebnis der UND-Operation der Impulsketten 32 und 33 Die Impulskette 37 ist das Ergebnis der UND-Operation der Impulskette 32 und der inversen Impulskette 33. Die Impulskette 38 ist das Ergebnis der verdrahteten OR-Operation der Impulsketten 34 und 37, welche an einen Eingang des Zählers 22 a gelangt, während die Impulskette 37 das Ergebnis der verdrahteten OR-Operation der Impulsketten 35 und 36 ist. welche an den Eingang des Zählers 22 b gelangt.
Unter diesen Umständen enthält der Ausgang des ersten Zählers 22a im vorliegenden Falle 15 Impulse, und der Ausgang des zweiten Zählers 22b enthält 10 Impulse. Am Ausgang des Komparators 23 befinden sich dann 5 Impulse, und der Ausgang des Polungsdetektors 24 ist »1«.
Wenn der Eingang des Komparators 23. der nach Fig. 5 mit dem Zähler 22 b verbunden ist. entsprechend F i g. 4 zur Entgegennahme eines Schwellwertes " · w5 (0,5 · 5 ■ 5 = 12,5) dient, ergibt sich am
Ausgang des Komparators 23 der Wert + 2,5. Obgleich dieser Wert die Hälfte desjenigen ist, bei dem der Ausgang des zweiten Zählers 22 b benutzt wurde, ist der Ausgang identisch mit dem Wert soweit es den Ausgang des Detektors 24 betrifft.
Jede der Ziffern, die durch die Impulse der Impulsketten angegeben sind, stellt die Summe der Impulse für »1« in jeder Zeitperiode dar. Jede Ziffei entspricht dem analogen Wert für jede Komponent< der positiven und negativen Beweitunesvektoren W: und (W5-W1).
ftfti
Jede Ziffer, die durch die Impulskeite33 angegeben ist, zeigt den Zustand j;der Komponente des Eingangsbildes, das mit der Zeitimpulsketie 30 synchronisiert ist.
Der Speicher 20 in Fig. 4 und 5 kann blasenförmiae Magnetbezirke als Speiche? aufweisen. Wenn die Magnetbezirke verwendet sind, ist die ßildklassifikationsanlage noch wirkungsvoller und läßt sich noch rationeller gestalten.
Hier/u 5 Mlatt Zeichnungen

Claims (3)

Patentansprüche:
1. Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen, bei der ein Bildfeld rasterförmig abgetastet wird, bei der ein den Bildpunkten bzw. Untergrundpunkten zugeordnetes digitales Ausgangszeitfolgesignal (z.B. x, = »1«: .χ, = »0«) mit Gewichtungsfaktoren multipliziert wird und das Produkt zur Bestimmung bzw. Wiedereerkennung des Ähnlichkeitsgrades zwischen den zu erkennenden Zeichen und Vergleichszeichen in einer Zähleinrichtung aufsummiert wird, dadurch gekennzeichnet, daß die Steuereingänge zweier Schalter (21a, 216) mit einer Abtastvorrichtung (1) verbunden sind, zur Steuerung der Schalter in Abhängigkeit von den Ausf angszeitfolgesignalen, daß jeweils einer von zwei Leseanschlüssen (29 a, 296) eines die Gewichtungsfaktoren enthaltenden Speichers (20) über jeweils einen von zwei Schaltern (21a, 216) alternativ mit einer Zähleinrichtung (22) verbunden ist, wodurch das Produkt aus Bildpunkten (x,) und gewichteten Bildpunkten eines Vergleichszeichens bzw. aus Untergrundpunkten (Xj und gewichteten Untergrundpunkten eines Vergleichszeichens iw* ~ wi) gebildet wird und in der Zähleinrichtung flufsummiert wird, daß die Zähleinrichtung (22), die die Summe der einzelnen Produkte enthält, mit dem einen Eingang eines !Comparators (23) verbunden ist, der die Produktsumme mit einem vorgegebenen, an seinem anderen Eingang (28) angelegten Wert vergleicht, wobei ein Zeichen als erkannt gilt, wenn die Produktsumme größer als der vorgegebene Wert ist, und daß nach Durchführung dieser Klassifikation ein neuer Abtastrykius für ein abgetastete Zeichen eingeleitet wird.
2. Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen, bei der ein Bildfeld rasterförmig abgetastet wird, bei der ein den Bildpunkten bzw. Untergrundpunkten zugeordnetes digitales Ausgangszeitfolgesignal (z.B. x, = »1«; x, = »0«) mit Gewichtungsfaktoren multipliziert wird und das Produkt zur Bestimmung bzw. Wiedererkenliung des Ähnlichkeitsgrades zwischen den zu erkennenden Zeichen und Vergleichszeichen in einer Zähleinrichtung aufsummiert wird, dadurch gekennzeichnet, daß die Steuereingänge zweier Schalter (21a, 216) mit einer Abtastvorrichtung verbunden sind, zur Steuerung der Schalter in Abhängigkeit von den Ausgangszeitfolgesignalen, daß ein erster und ein zweiter Leseanschluß (29a. $96) eines die Gewichtungsfaktoren enthaltenden Speichers (20) über zwei umschaltbare Schalter \2\a, 216) mit einer ersten und einer zweiten Zähleinrichtung (22a, 226) bzw. im umgeschalteten Zustand der Schalter mit der zweiten und ersten Zähleinrichtung (226. 22a) verbunden ist. wodurch bei Vorliegen eines von den Bildpunkten stammenden Ausgangszeitfolgesignals (x,) das Produkt aus Bildpunkt und gewichtetem Bildpunkt eines Vergleichszeichens gebildet und der ersten Zähleinrichtung (22a) zugeführt als auch das Produkt aus Bildpunkt und gewichtetem Untergrundpunkt des Vergleichszeichens gebildet und der zweiten Zähleinrichtung (226) zugeführt wird und wodurch bei Vorliegen eines von den Untergrundpunkten stammenden Ausgangszeilfolgesignals das Produkt aus Untergrundpunkt und gewichtetem Untergrundpunkt des Vergleichszeichens gebildet und der ersten Zähleinrichtung (22a) zugeführt wird als auch das Produkt aus Untergrundpunkt und gewichtetem Bildpunkt des Vergleichszeichens gebildet und der zweiten Zähleinrichtung (226) zugeführt wird, daß die erste und die zweite Zähleinrichtung (22a, 21b\\n denen die einzelnen Produkte aufsummiert werden, mit je einem Eingang eines !Comparators (23) verbunden sind, der die von beiden Zähleinrichtungen stammenden Produktsummen miteinander vergleicht, wobei ein Zeichen dann als erkannt gilt, wenn der Zählerstand der ersten Zähleinrichtung (22 a) größer ist als der Zählerstand der zweiten Zähleinrichtung (226), und daß nach Durchführung dieser Klassifikation für ein abgetastetes Zeichen ein neuer Abtastzyklus eingeleitet wird.
3. Einrichtung nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Abtastvorrichtung (1), der Speicher (20) und die Zähleinrichtung (22 bzw. 22 a, 226) von einem Zeitsteuerkreis (26) gesteuert werden.
DE19722227016 1971-06-02 1972-06-02 Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen Expired DE2227016C3 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP46038802A JPS5114409B1 (de) 1971-06-02 1971-06-02
JP3880271 1971-06-02

Publications (3)

Publication Number Publication Date
DE2227016A1 DE2227016A1 (de) 1973-01-04
DE2227016B2 DE2227016B2 (de) 1976-02-19
DE2227016C3 true DE2227016C3 (de) 1976-10-14

Family

ID=

Similar Documents

Publication Publication Date Title
DE2935261C2 (de) Anordnung zur Mustererkennung
DE1225426B (de) Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Zeichen
DE3544863A1 (de) Verfahren zur bewegungskorrektur digitaler bilder
DE2746969C2 (de) Einrichtung zum Vergleichen von Mustern
DE1774314B1 (de) Einrichtung zur maschinellen zeichenerkennung
AT223668B (de) Verfahren und Schaltungsanordnung zur automatischen Erkennung von Schriftzeichen
DE2461651C3 (de) Zählvorrichtung zum Zählen von Mustern
DE4115902C2 (de) Halbton-Bildverarbeitungsschaltung
DE2148152A1 (de) Verfahren und schaltungsanordnung zum automatischen erkennen von schriftzeichen mit hilfe einer translationsinvarianten klassifikationsmatrix
DE1946861A1 (de) Geraet zur automatischen Ermittlung der Mittelpunkte von jeweils eine Vielzahl von Hautleisten aufweisenden Fingerabdruecken
DE2227016C3 (de) Bildklassifikationseinrichtung zur Wiedererkennung geometrischer Zeichen, insbesondere Schriftzeichen
DE2823679C2 (de)
DE1816291A1 (de) Hochgeschwindigkeitsumsetzung analoger in digitale Werte
DE1524409B2 (de) Zeichenerkennungsgeraet
DE2918710C2 (de) Bildsignalempfänger/Aufzeichner
DE1811420C3 (de)
DE2253064A1 (de) Verfahren und vorrichtung zur verminderung von verzerrungen
DE1284127B (de) Funktionsgenerator fuer spezielle Autokorrelationsfunktionen
DE2446034C3 (de) Szintigramm-Aufnahme- und Wiedergabegerät mit einem Komparator, der ein Anzeigegerät mittels zwei Helligkeitswerten der Darstellung zugeordneten Signalen steuert
DE2340110C3 (de) Anordnung zum Digitalisieren eines analogen Bildsignals mit einer Hadamard-Matrix
DE2227016B2 (de) Bildklassifikationseinrichtung zur wiedererkennung geometrischer zeichen, insbesondere schriftzeichen
DE2453086B2 (de) Anordnung zum Erkennen gedruckter chinesischer Schriftzeichen
DE2237873A1 (de) Anordnung zur zeichenerkennung
DE1774314C (de) Einrichtung zur maschinellen Zeichen erkennung
EP0978089B1 (de) Verfahren und anordnung zur transformation einer eingangsvariablen