CH617026A5 - - Google Patents

Download PDF

Info

Publication number
CH617026A5
CH617026A5 CH496477A CH496477A CH617026A5 CH 617026 A5 CH617026 A5 CH 617026A5 CH 496477 A CH496477 A CH 496477A CH 496477 A CH496477 A CH 496477A CH 617026 A5 CH617026 A5 CH 617026A5
Authority
CH
Switzerland
Prior art keywords
voltage
type
voltages
linear combinations
point differential
Prior art date
Application number
CH496477A
Other languages
English (en)
Inventor
Arthur Klemt
Original Assignee
Transitus Ets
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Transitus Ets filed Critical Transitus Ets
Publication of CH617026A5 publication Critical patent/CH617026A5/de

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/195Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references using a resistor matrix
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)

Description

Die Erfindung betrifft ein Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Differenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zu identifizierende Klasse massgebenden Grenzen liegt.
Die Darstellung der Schriftzeichen auf dem in gedachte Rasterpunkte unterteilten Schriftfeld erfolgt in der Regel als Schwärzung auf hellem Untergrund. Es sind aber auch andere Darstellungen der Schriftzeichen, wie helle Schriftzeichen auf dunklem Untergrund oder Schriftzeichen auf lichtdurchlässigem Untergrund, z.B. Film, möglich.
Bei der maschinellen Klassifizierung von Schriftzeichen sind in der Regel keine Standard-Schriftzeichen mit gleicher Form, gleicher Strichstärke und gleicher Schwärzung zu identifizieren, sondern Schriftzeichen, die auf unterschiedlichem Untergrund von Schnelldruckern, Schreibmaschinen oder Mosaikdruckern ausgedruckt oder mit der Hand mit unterschiedlichem Schreibgerät geschrieben sind, also Schriftzeichen, die sich in Form, Strichstärke und Schwärzung von den Standard-Schriftzeichen erheblich unterscheiden können und deren Merkmale beträchtlich schwanken. Grosse Schwankungen der Merkmale ergeben sich durch Kontrastunterschiede.
Kontrastunterschiede können auftreten, wenn die Schwärzung der Repräsentanten einer Schriftzeichenklasse gleich bleibt, sich jedoch die Helligkeit oder Farbe des Untergrundes ändert, oder wenn bei gleichbleibender Helligkeit oder Farbe des Untergrundes sich die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändert, oder wenn sich sowohl die Helligkeit oder Farbe des Untergrundes als auch die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändern.
Auch der Schriftzug eines einzelnen Schriftzeichens kann Kontrastunterschiede aufweisen. So kann bei Schriftzeichen, welche von Schreibmaschinen oder Schnelldruckern gedruckt sind, z.B. der obere oder der rechte Bereich stärker oder schwächer geschwärzt sein als der untere oder der linke Bereich. Besonders grosse Kontrastunterschiede innerhalb eines einzelnen Schriftzeichens sind bei den Mosaikschriften vorhanden,
2
5
10
15
20
25
30
35
40
45
50
55
60
65
3
617 026
deren Schriftzug nur aus Punkten besteht, welche sich berühren oder auch einen Abstand bis zum zweifachen Durchmesser eines Punktes haben können, wodurch der Schriftzug sogar mehrfach unterbrochen ist. Auch kann die Schwärzung der einzelnen Punkte verschieden sein.
Zur Klassifizierung von Schriftzeichen werden bei den Verfahren und Schaltungen, welche von einer rasterförmigen Abtastung des Schriftfeldes ausgehen, die aus den Rasterpunkten abgeleiteten Spannungen miteinander kombiniert. Hierzu haben sich bei dem heutigen Stand der Technik lineare Funktionselemente als zweckmässig erwiesen, insbesondere lineare Widerstandsnetzwerke, in welchen die aus den Rasterpunkten abgeleiteten Spannungen analog verarbeitet werden, oder Rechner mit den Grundrechnungsarten Addition und Multiplikation, welche die aus den Rasterpunkten abgeleiteten Spannungen - nach erfolgter Digitalisierung - digital verarbeiten. Beide Verarbeitungsmöglichkeiten werden nachstehend als «Bildung von Linearkombinationen» bezeichnet. Im Prinzip speichert jede Linearkombination Merkmale von Standard-Schriftzeichen und vergleicht diese mit den entsprechenden Merkmalen der zu klassifizierenden Schriftzeichen.
Bei einigen bekannten Verfahren und Schaltungen (z.B. die USA-Patentschrift 3 271 576 oder «Internationale Elektronische Rundschau» 1968, Seiten 19-21) müssten für die Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen in den Linearkombinationen die Merkmale sämtlicher in Betracht kommenden Repräsentanten unterschiedlicher Ausführungsformen der zu klassifizierenden Schriftzeichen gespeichert werden. Bei Vorlage eines unbekannten Schriftzeichens müssten dann alle gespeicherten Werte der Merkmale der verschiedenen Repräsentanten sämtlicher Klassen mit den Merkmalen des unbekannten Schriftzeichens verglichen werden. Für die Klassifizierung von Schriftzeichen mit stark schwankenden Merkmalen wären bis zu etwa 1000 Linearkombinationen pro Klasse erforderlich.
Es ist auch bekannt, um diesen untragbaren Aufwand zu verringern, in den Linearkombinationen anstelle der Merkmale einzelner Repräsentanten die Merkmale von Gruppen von Repräsentanten zu speichern, deren Merkmale Abweichungen nur innerhalb bestimmter Grenzen aufweisen. Diese Grenzen müssen jedoch eng bemessen sein, da anderenfalls die Trennsicherheit gegenüber anderen Klassen stark abnimmt, so dass immer noch sehr viele Linearkombinationen erforderlich sind und der technische Aufwand noch recht gross ist.
Letzteres gilt auch für Verfahren, die von der sogenannten Optimierung Gebrauch machen. Hierbei geht man davon aus, dass es bei den verschiedenen Repräsentanten einer Schriftzeichenklasse Rasterpunkte gibt, die immer weiss sind, und solche, die immer schwarz sind, und verwendet für die Bildung von Linearkombinationen nur diese. Rasterpunkte, die für die verschiedenen Repräsentanten einer Klasse einmal schwarz und einmal weiss sind, werden für die Bildung von Linearkombinationen nicht verwendet. Durch die Weglassung dieser Rasterpunkte verschenkt man jedoch für die Erkennung wichtige Merkmale. Die Anzahl der Linearkombinationen wird zwar vermindert, andererseits entsteht für die Optimierung zusätzlicher technischer Aufwand. Ausserdem wird die Trennsicherheit gegenüber Schriftzeichen anderer Klassen wesentlich vermindert.
Weiterhin sind Verfahren und Schaltungen bekannt, welche mit einer wesentlich geringeren Anzahl von Linearkombinationen auskommen. Gemäss der deutschen Patentschrift 18 11 420 wird dies durch Widerstandsnetzwerke erreicht, bei welchen die zur Bildung der Linearkombinationen vorgesehenen Widerstände für jede Klasse nach Massgabe einer Bestimmung der Eigenvektoren der Kovarianzmatrix der Merkmale bemessen sind. Diese Methode der Bemessung der Widerstände zur Bildung von Linearkombinationen setzt zwar die Anzahl der Linearkombinationen bzw. der Widerstandsnetzwerke im Vergleich zu den erstgenannten Verfahren und Schaltungen um ein Vielfaches herab, berücksichtigt aber nicht Repräsentanten von 5 Schriftzeichen konkurrierender Klassen, wodurch die Trennsicherheit gegen Schriftzeichen konkurrierender Klassen, insbesondere bei Klassifizierung von Schriftzeichen mit stark unterschiedlichem Kontrast, nicht ausreichend ist. Ferner müssen die aus allen Rasterpunkten abgeleiteten und den Widerstandsnetz-io werken zugeführten Spannungen notwendigerweise sowohl positive als auch negative Polarität haben, wodurch ein beträchtlicher technischer Aufwand entsteht.
Dies gilt auch für das Verfahren der deutschen Offenlegungsschrift 20 26 033, d.h. alle aus den Rasterpunkten abgelei-i5 teten Spannungen müssen sowohl positive als auch negative Polarität haben. Bei diesem Verfahren werden in den Widerstandsnetzwerken einer Klasse die Spannungen aus solchen Rasterpunkten miteinander kombiniert, welche zusammenge-fasst drei Arten charakteristischer Formteile von Schriftzeichen 2d dieser Klasse entsprechen. Die dadurch gebildeten Linearkombinationen erlauben nur eine Klassifizierung von Schriftzeichen mit geringen Kontrastunterschieden.
Ein gemeinsamer Nachteil aller genannten Verfahren und Schaltungen ist demnach, dass deren Linearkombinationen bei 25 erträglichem technischen Aufwand nicht geeignet sind, Schriftzeichen mit starken Kontrastunterschieden und dadurch bedingten Formverfälschungen und Unterbrechungen des Schriftzuges mit hinreichender Trennsicherheit zu klassifizieren. Hierzu wäre es bei den bekannten Verfahren und Schaltungen erforderlich, .io die Anzahl der Linearkombinationen wesentlich zu vergrössern, was den technischen Aufwand erhöhen würde.
Zur Verminderung des Einflusses von Kontrastunterschieden auf die Klassifizierung von Schriftzeichen sind mehrere Verfahren und Schaltungen bekannt. Gemäss der deutschen .15 Patentschrift 18 11 420 wird den Widerstandsnetzwerken, die die Linearkombinationen realisieren, eine zusätzliche Spannung zugeführt, wodurch die Ausgangsspannungen der Widerstandsnetzwerke bei Vorliegen eines Repräsentanten der zu identifizierenden Klasse nahe bei Null liegen. Diese zusätzliche Span-4(i nung wird von allen Rasterpunkten abgeleitet. Da sich mit einer gemeinsamen Änderung der aus den Rasterpunkten abgeleiteten und den Widerstandsnetzwerken einzeln zugeführten Spannungen, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen, auch die zusätzliche 45 Spannung ändert, tritt eine Kompensationswirkung ein.
Gemäss der deutschen Offenlegungsschrift 20 26 033 wird die Ausgangsspannung eines jeden Widerstandsnetzwerkes mit einer Spannung verglichen, die proportional der Summe aller aus den Rasterpunkten abgeleiteten Spannungen ist, um festzu-50 stellen, ob die Äusgangsspannungen innerhalb der für die zu identifizierende Klasse massgebenden Grenzen liegen. Bei Änderungen der Ausgangsspannungen der Widerstandsnetzwerke, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen, ändert sich auch die 55 Vergleichsspannung, wodurch der Einfluss von Kontraständerungen vermindert wird.
Durch diese Massnahmen, im ersten Falle die Zuführung einer zusätzlichen von allen Rasterpunkten abgeleiteten Span-60 nung in die Widerstandsnetzwerke und im zweiten Falle die Verwendung einer ebenfalls aus allen Rasterpunkten abgeleiteten Vergleichsspannung, kann der Einfluss von Kontrastunterschieden nur in beschränktem Masse vermindert werden, da der von einem Schriftzeichen geschwärzte Anteil des Schriftfeldes 65 nur einen Bruchteil seiner Gesamtfläche ausmacht (ca. 15 bis 35 %), die zusätzliche Spannung bzw. die Vergleichsspannung somit in überwiegendem Masse von den nicht geschwärzten Bereichen des Schriftfeldes bestimmt wird, und daher bei einer
617 026
Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen sich die zusätzliche Spannung bzw. die Vergleichsspannung wesentlich weniger ändert als der Schwärzungsgrad.
Es ist auch ein Verfahren zur Verringerung des Einflusses von Unterschieden des Kontrastes und der Untergrundhelligkeit bekannt (deutsche Auslegeschrift 20 44 795), bei welchem aus einer von nicht durch Schriftzeichen geschwärzten Stellen des Untergrundes abgeleiteten Bezugsspannung und den aus den Rasterpunkten abgeleiteten Spannungen für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird und diese Rasterpunkt-Differenzspannungen sowohl einzeln als auch als Summe anstelle der aus den Rasterpunkten direkt abgeleiteten Spannungen Widerstandsnetzwerken zugeführt werden und die Vergleichsspannung aus der Summe aller Rasterpunkt-Differenzspannungen gebildet wird. Dieses Verfahren gibt zwar eine Möglichkeit an, den Einfluss von Unterschieden des Kontrastes und der Untergrundhelligkeit bei vorgegebenen Widerstandsnetzwerken zu vermindern, macht jedoch weder eine Aussage über die Art und Bemessung der zur Klassifizierung von Schriftzeichen erforderlichen Widerstandsnetzwerke bzw. Linearkombinationen noch Angaben über die Grösse der Vergleichsspannungen durch welche festgestellt wird, ob die Ausgansspannungen der Linearkombinationen innerhalb der für die zu identifizierende Klasse massgebenden Grenzen liegen.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur maschinellen Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen zu schaffen, das mit einem wesentlich geringeren technischen Aufwand als die bisher bekannten Verfahren auskommt, insbesondere mit weniger und einfacheren Linearkombinationen, denen nur Spannungen einer Polarität zugeführt werden müssen, eine grosse Sicherheit gegenüber Schriftzeichen anderer Klassen gewährleistet und unempfindlich gegenüber Kontraständerungen jeglicher Art ist, nämlich unempflindlich gegenüber Unterschieden der Helligkeit des Untergrundes, der Schwärzung der zu klassifizierenden Schriftzeichen und der Schwärzung innerhalb eines Schriftzeichens.
Zur Lösung dieser Aufgabe ist Gegenstand der Erfindung ein Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspan-nung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Dif-ferenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zu identifizierende Klasse massgebenden Grenzen liegt, welches erfindungsgemäss dadurch gekennzeichnet ist, dass man unter Zugrundelegung eines Schriftfeldes, das in mindestens 9 und höchstens 60 gedachte Rasterpunkte unterteilt ist,
I) für das Standard-Schriftzeichen der zu identifizierenden Klasse die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
II) aus diesen Spannungen zwei Arten von Linearkombinationen bildet, wobei a) die Linearkombinationen der ersten Art als Differenz aus jeweils zwei Spannungsarten gebildet werden, von denen die erste Spannungsart für jeweils eine Linearkombination
A) aus nur einer Rasterpunkt-Differenzspannung besteht, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2% und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5% der
5 Summen-Rasterpunkt-Differenzspannung beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 % und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes minili destens 4% der Summen-Rasterpunktdifferenzspannung beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet wird, dass sie denselben Betrag aber entgegengesetzte i 5 Polarität wie die erste Spannungsart hat, und b) die Linearkombinationen der zweiten Art aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5% und im Falle eines in 30 20 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3,0% der Summen-Rasterpunktdifferenzspannung beträgt,
III) für das zu klassifizierende Schriftzeichen die Raster-punkt-Differenzspannungenund die Summen-Rasterpunktdifferenzspannung ermittelt,
25 IV) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und V) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ± 30% vom Wert der zweiten
30 Spannungsart abweicht, und b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des
35 Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen gemäss Abschnitt IIb die Linearkombinationen der zweiten Art gebildet worden sind.
Zur Bildung der Linearkombinationen können sowohl einzelne als auch mehrere Rasterpunkt-Differenzspannungen her-40 angezogen werden. Für die Klassifizierung von Schriftzeichen mit geringen Unterschieden der Schwärzung innerhalb des Schriftzeichens und wenig unterschiedlicher Form jedoch stark unterschiedlichem Kontrast, bezogen auf das Standard-Schriftzeichen, kann die erste Spannungsart jeweils einer Linearkom-45 bination der ersten Art aus nur einer einzigen Rasterpunkt-Differenzspannung bestehen, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2%, vorzugsweise mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %, vor-50 zugsweise mindestens 2 %, der Summen-Rasterpunktdifferenz-spannung beträgt.
Weisen die zu klassifizierenden Schriftzeichen auch innerhalb des Schriftzeichens unterschiedliche Schwärzungen und/ 55 oder stark unterschiedliche Form, bezogen auf das Standard-Schriftzeichen, auf, so wird die erste Spannungsart der Linearkombinationen der ersten Art vorzugsweise aus mehreren Rasterpunkt-Differenzspannungen gebildet, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes 60 mindestens 7%, vorzugsweise mindestens 10%, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4%, vorzugsweise mindestens 6%, der Summen-Rasterpunktdifferenzspannung beträgt. Dabei sollte der Gesamtwert in beiden Fällen höchstens 60% der Summen-Rasterpunktdiffe-65 renzspannung betragen.
Die Linearkombinationen der zweiten Art können entweder aus mehreren Rasterpunkt-Differenzspannungen gebildet werden, oder nur aus einer Rasterpunkt-Differenzspannung beste
617 026
hen. Der Gesamtwert muss im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3,0%, vorzugsweise höchstens 2,0%, der Summen-Rasterpunktdifferenzspannung betragen. Ob die Linearkombinationen der zweiten Art aus nur einer oder aus mehreren Rasterpunkt-Differenzspannungen gebildet werden, hängt im wesentlichen von den technischen Gegebenheiten bei der Durchführung des Verfahrens ab, z.B. von der Konstanz der Schriftfeldbeleuchtung, den photoelektrischen Wandlern, den optischen Einrichtungen usw. Vorzugsweise bestehen die Linearkombinationen der zweiten Art nur aus einer einzigen Rasterpunkt-Differenzspannung, da in diesem Fall die technischen Gegebenheiten weniger Einfluss auf die Erkennungssicherheit haben als bei Bildung der Linearkombinationen aus mehreren Rasterpunkt-Differenzspannungen. Im letzteren Fall ist jedoch die Anzahl der Linearkombinationen kleiner, was auch oft von praktischer Bedeutung ist.
Zur Feststellung, ob die Abweichungen der Merkmale der zu identifizierenden Schriftzeichen von den in den Linearkombinationen gespeicherten Merkmalen des Standard-Schriftzei-chens innerhalb der für die Klassifizierung massgebenden Grenzen liegen, wird die Ausgangsspannung einer jeden Linearkombination herangezogen und geprüft, (a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ± 30% vom Wert der zweiten Spannungsart abweicht, und (b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen die Linearkombinationen der zweiten Art gebildet worden sind (siehe hierzu das spätere Beispiel 1).
Die angegebenen Grenzen von ±30% für die Ausgangsspannungen der Linearkombinationen der ersten Art gewährleisten eine ausreichende Trennsicherheit der zu identifizierenden Schriftzeichen gegenüber Schriftzeichen konkurrierender Klassen. Wird eine über das übliche Mass hinausgehende Trennsicherheit gefordert oder sind Schriftzeichen zu identifizieren, die trotz Zugehörigkeit zu verschiedenen Klassen nur wenig voneinander verschieden sind, wie es z.B. bei handschriftlich geschriebenen Schriftzeichen der Fall sein kann, so können die Grenzen der Ausgangsspannungen eingeengt werden, z.B. von ±30% auf ±20%.
Es werden grundsätzlich nicht mehr Linearkombinationen gebildet, wie Rasterpunkte vorhanden sind, da sonst die über die Anzahl der Rasterpunkte hinausgehenden Linearkombinationen von bereits gebildeten Linearkombinationen abhängig sind. Jedoch werden für schwieriger zu erkennende Schriftzeichen, z.B. den Buchstaben K, zweckmässig so viele Linearkombinationen gebildet, wie Rasterpunkte vorhanden sind. Dagegen sind für die Klassifizierung leicht zu erkennender Schriftzeichen, z.B. die Ziffer 1, nicht alle möglichen Linearkombinationen erforderlich. Vorzugsweise beträgt die Anzahl der Linearkombinationen für eine Schriftzeichenklasse mindestens 60% der Anzahl der Rasterpunkte.
Es gibt Schriftzeichen, z.B. solche mit breiter Strichstärke, bei denen die beschriebenen Bedingungen für die Bildung der Linearkombinationen der zweiten Art nicht erfüllbar sind. Zur Identifizierung derartiger Schriftzeichen werden nur Linearkombinationen der ersten Art gebildet.
Bei den heutigen technischen Gegebenheiten erfolgt die Durchführung des Verfahrens der Erfindung vorzugsweise entweder in analoger Technik, indem die aus den Rasterpunkten und aus der Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, abgeleiteten Spannungen Additionsschaltungen (zur Bildung der Rasterpunkt-Differenzspannungen und der Summen-Rasterpunktdifferenzspannung), linearen Widerstandsnetzwerken (zur Bildung der Linearkombinationen) und Grenzwertschaltungen (zum Vergleich der Ausgangsspannungen der 5 Widerstandsnetzwerke mit der Vergleichsspannung) zugeführt werden, oder in digitaler Technik, indem die analogen Spannungen in digitale Werte umgewandelt und diese entsprechend den Bedingungen der Linearkombinationen in Digitalrechnern verarbeitet io werden.
Das Verfahren der Erfindung wird nachstehend am Beispiel der Klassifizierung von Repräsentanten der Ziffer 3 in Verbindung mit den anliegenden Zeichnungen weiter erläutert. Es zeigen:
i ? Fig. 1 ein Schriftfeld für die Klassifizierung von Schriftzeichen;
Fig. 2a bis 2c verschiedene Ausführungsformen der Ziffer 3 im Schriftfeld der Fig. 1 ;
Fig. 3 eine Schaltung zur Durchführung des Verfahrens. 20 Gemäss Fig. 1 ist das Schriftfeld in die Rasterpunkte 1 .. .15 aufgeteilt und ausserhalb des Schriftfeldes befindet sich eine nie geschwärzte Stelle F. In ein derartiges Schriftfeld ist gemäss Fig. 2a ein Standard-Schriftzeichen der Ziffer 3 mit der Soll-Schwär-zung, der Soll-Strichbreite und der Soll-Form eingetragen. 25 Gemäss Fig. 2b ist ein Repräsentant der Ziffer 3 mit anderer Form und etwa halbem Schwärzungsgrad, bezogen auf das Standard-Schriftzeichen, dargestellt durch den gestrichelten Schriftzug, eingetragen. Gemäss Fig. 2c ist ein aus Punkten bestehender Re; tentant der Ziffer 3, wie er praktisch bei m einer Mosaikschrift mit einer Matrix von 5X7 Punkten vorkommen kann, eingetragen. Die Repräsentanten der Fig. 2b und 2c, welche gegenüber dem Standard-Schriftzeichen der Fig. 2a erhebliche Unterschiede hinsichtlich Schwärzung, Strichbreiten, Form und Unterbrechungen des Schriftzuges aufweisen, sollen 35 nach dem Verfahren der Erfindung klassifiziert werden.
Hierzu werden in bekannter Weise, z.B. durch Phototransistoren, aus jedem Rasterpunkt 1.. .15 und aus der nie geschwärzten Stelle F elektrische Spannungen erzeugt, und aus diesen z.B. durch Invertier- und Addierschaltungen folgende 40 Spannungen gebildet:
a) aus den Rasterpunkten 1 .. .15 die zu den Helligkeitswerten dieser Rasterpunkte proportionalen Spannungen -Ul, -U2...-U15;
b) aus der nie geschwärzten Stelle F die Spannung +UF; 45 c) durch Addition jeder der Spannungen -Ul, -U2 ...
-U15 zu der Spannung +UF die den Schwärzungswerten der Rasterpunkte 1.. .15 proportionalen Rasterpunkt-Differenzspannungen +U'l, +U'2 .. .+U'15;
d) durch Addition der Spannungen +U'l, +U'2 ...
so +U'15 die Summen-Rasterpunktdifferenzspannung +US';
e) durch Invertierung der Spannung +US' die Summen-Rasterpunktdifferenzspannung —US'.
Aus den so erzeugten Rasterpunkt-Differenzspannungen +U'l, +U'2 .. .+U'15 und den Summen-Rasterpunktdiffe-55 renzspannungen —US' und +US' werden die Linearkombinationen und die Grenzen für die Ausgangsspannungen der Linearkombinationen ermittelt. Dabei wird davon ausgegangen,
dass bei nicht geschwärztem Schriftfeld jede aus den Rasterpunkten 1 .. .15 und aus der nicht durch Schriftzeichen 60 geschwärzten Stelle F des Untergrundes abgeleitete Spannung denselben Betrag hat.
Beispiel 1
65 Erfindungsgemäss können die erste Spannungsart der Linearkombinationen der ersten Art und die Linearkombinationen der zweiten Art aus nur einer einzigen Rasterpunkt-Differenzspannung bestehen, wobei die Rasterpunkt-Differenzspannun-
617 026
6
gen U' 1, U'2 .. .U' 15 verwendet werden. Dies wird durch die in der Tabelle 1 dargestellten Linearkombinationen zur Klassifizierung des in Fig. 2b dargestellten Repräsentanten der Ziffer 3 veranschaulicht, welcher im Vergleich zu dem in Fig. 2a dargestellten Standard-Schriftzeichen sich durch geringere Schwärzung und andere Form unterscheidet.
Tabelle 1 Nr.
Linearkombinationen der ersten Art
1
2
3
4
5
6
7
8
9 10
erste
Spannungsart lU'l
IU'2
IU'3
IU'6
IU'8
IU'9
IU'12
IU'13
IU'14
IU'15
zweite
Spannungsart -0,07 US'I -0,10 US'I -0,11 US'I -0,10 US'I -0,10 US'I -0,12 US'I -0,10 US'I -0,07 US'I -0,10 US'I -0,11 US'I
Grenzen der
Ausgangs
Spannung
<0,021 US' <0,030 US' <0,033 US' <0,030 US' <0,030 US' <0,036 US' <0,030 US' <0,021 US' <0,030 US' <0,033 US'
Grenzen der Ausgangs
Nr. Linearkombinationen der zweiten Art Spannung
11
12
13
14
15
U'4
U'5
U'10
U'll
U'7
<0,01 US' <0,01 US' <0,01 US' <0,01 US' <0,03 US'
Da die aus den Rasterpunkten abgeleiteten Rasterpunkt-Differenzspannungen proportional zu den Schwärzungswerten der Rasterpunkte sind, können die zur Bildung der Linearkombinationen notwendigen Rasterpunkt-Differenzspannungen direkt aus den Schwärzungswerten der Rasterpunkte ermittelt werden. So können die Linearkombinationen 1,2.. .10 der ersten Art unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens der Ziffer 3 dadurch gebildet werden, dass man - durch Addition der durch das Standard-Schriftzeichen nach Fig. 2a geschwärzten Flächen der einzelnen Rasterpunkte 1,2,3,6,8,9,12,13,14,15 —die gesamte geschwärzte Fläche dieser Rasterpunkte und daraus anteilig die geschwärzte Fläche für jeden einzelnen dieser Rasterpunkte ermittelt. Beispielsweise beträgt die geschwärzte Fläche des Rasterpunktes 1, aus welchem die Rasterpunkt-Differenzspannung U'l der Linearkombination 1 der Tabelle 1 gebildet wird, 7 % der durch diese Rasterpunkte insgesamt geschwärzten Fläche. Die aus dem Rasterpunkt 1 abgeleitete Rasterpunkt-Differenzspannung U'l der Linearkombination 1 hat somit einen Wert von 7% der Summen-Rasterpunktdifferenzspannung-US', d.h. —0,07 US'.
In analoger Weise ergeben sich die Linearkombinationen 11 .. .15 der zweiten Art für das Standard-Schriftzeichen gemäss Fig. 2a und die Linearkombinationen 1.. .15 für den Repräsentanten gemäss Fig. 2b.
Die in der Spalte «Grenzen der Ausgangsspannung» der Tabelle 1 angegebenen Werte geben als Anteile der zweiten Spannungsart für die Linearkombinationen der ersten Art die für die zu identifizierende Klasse massgebende Ausgangsspannung an, welche bis zu ± 30% vom Wert der zweiten Spannungsart betragen kann. So muss z.B. bei der Linearkombination 1 die Ausgangsspannung kleiner als 0,07 • (30/100) • US' = 0,021 US' sein, damit eine Klassifizierung des vorgelegten Schriftzeichens in die Klasse 3 erfolgen kann.
Die für eine Klassifizierung des vorgelegten Repräsentanten nach Fig. 2b in die Klasse 3 massgebenden Ausgangsspannungen der Linearkombinationen 11,12,13,14 der zweiten Art liegen unter 1 % des Wertes der Summen-Rasterpunktdifferenz-5 Spannung US'. Diese Ausgangsspannungen, welche mit den Rasterpunkt-Differenzspannungen U'4, U'5, U'10, U'll identisch sind, haben theoretisch den Wert Null, da diese Rasterpunkt-Differenzspannungen aus nicht geschwärzten Rasterpunkten abgeleitet sind, jedoch ist die Grenze dieser Ausgangs-l0 Spannungen wegen den technischen Gegebenheiten auf 1 % der Summen-Rasterpunktdifferenzspannung US' festgelegt. Die Grenze der Ausgangsspannung der Linearkombination 15 beträgt 3% der Summen-Rasterpunktdifferenzspannung US', da die mit der Ausgangsspannung identische Rasterpunkt-Dif-i5 ferenzspannung U'7 aus dem Rasterpunkt 7 abgeleitet ist, welcher durch das Standard-Schriftzeichen der Fig. 2a eine Schwärzung von 2% der Gesamtschwärzung aller Rasterpunkte aufweist.
Die in der Tabelle 1 genannten Linearkombinationen und 20 Grenzen der Ausgangsspannungen können zur Durchführung des Verfahrens durch elektrische Schaltungen, etwa gemäss der in Fig. 3 dargestellten Schaltung, oder nach Umwandlung der Rasterpunkt-Differenzspannungen in digitale Werte durch Rechenoperationen realisiert werden.
25 Dadurch, dass die Ausgangsspannungen der Linearkombinationen der ersten Art aus jeweils zwei Spannungsarten gebildet werden, von denen jede von den Rasterpunkten abgeleitet ist, und durch die Bildung der Rasterpunkt-Differenzspannun-gen ändern sich bei Kontraständerungen alle beiden Spannungsarten dieser Linearkombinationen um denselben Faktor. Haben die Ausgangsspannungen dieser Linearkombinationen, z.B. bei Vorlage von Schriftzeichen mit denselben Merkmalen wie das Standard-Schriftzeichen, den Wert Null, und werden z'.B. Schriftzeichen derselben Form jedoch mit unterschiedlicher 35 Schwärzung und unterschiedlicher Untergrundhelligkeit zur Identifizierung vorgelegt, so behalten die Ausgangsspannungen den Wert Null. Sind jedoch die Ausgangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt werden, deren Form und/oder deren Schwärzung vom 40 Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen um höchstens denselben Faktor, um welchen die Schwärzungen der zu identifizierenden Schriftzeichen von der Schwärzung des Standard-Schriftzeichens abweichen. Bei bekannten Verfahren und Schaltungen ändern sich die Aus-45 gangsspannungen um ein Vielfaches, sowohl wenn diese den Wert Null hatten, als auch wenn diese von Null verschieden waren.
Auch bei den Linearkombinationen der zweiten Art haben Abweichungen der Untergrundhelligkeit und der Schwärzungen so der zu identifizierenden Schriftzeichen von den Schwärzungen des Standard-Schriftzeichens keinen Einfluss auf die Ausgangsspannungen, wenn die zu identifizierenden Schriftzeichen dieselbe Form haben wie das Standard-Schriftzeichen, und somit die Ausgangsspannungen den Wert Null haben. Sind die Aus-55 gangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt werden, deren Form und Schwärzung vom Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen, wie bei den Linearkombinationen der ersten Art, auch nur um denselben Faktor, wie die so Schwärzungen der zu identifizierenden Schriftzeichen von den Schwärzungen der Standard-Schriftzeichen abweichen.
Die Ausgangsspannungen der Linearkombinationen werden erfindungsgemäss mit Anteilen der Summen-Rasterpunktdiffe-renzspannung verglichen. Letztere ändert sich bei Abweichun-65 gen der Schwärzungen der zu identifizierenden Schriftzeichen von der Schwärzung des Standard-Schriftzeichens um denselben Faktor wie die von Null abweichenden Ausgangsspannungen der Linearkombinationen. Dadurch bleiben die für die zu iden-
7
617 026
tifizierende Klasse massgebenden Grenzen, innerhalb welcher die Ausgangsspannungen der Linearkombinationen liegen müssen, konstant, und das Klassifizierungsergebnis bleibt von Unterschieden der Schwärzungen der Schriftzeichen und der Untergrundhelligkeit völlig unbeeinflusst.
Bei dem vorliegenden Verfahren werden auch die nicht geschwärzten Bereiche des Schriftfeldes - ebenso wie die geschwärzten Bereiche des Schriftfeldes - quantitativ zur Erkennung herangezogen, wodurch die Trennsicherheit wesentlich grösser ist, als bei bekannten Verfahren. Dies wird dadurch erreicht, dass das Klassifizierungsergebnis der Linearkombinationen der zweiten Art, welche eine Aussage über die nicht geschwärzten Bereiche des Schriftfeldes machen, völlig unabhängig von der Untergrundhelligkeit und den technischen Gegebenheiten ist, z.B. Änderungen der Betriebsspannungen und der Beleuchtung des Schriftfeldes.
Die zweite Spannungsart der Linearkombinationen der ersten Art wird für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet, dass sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat. Zur Bildung der Summen-Rasterpunktdifferenzspannung werden alle Rasterpunkt-Differenzspannungen herangezogen. Für die Bildung der zweiten Spannungsart können jedoch gegebenenfalls in der Summen-Rasterpunktdifferenzspannung einige Rasterpunkt-Differenzspannungen weggelassen werden, so dass die zweite Spannungsart nicht aus der Summen-Rasterpunktdifferenzspannung sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat. Die Bildung der zweiten Spannungsart aus einer oder mehreren Rasterpunkt-Differenzspannungen ist vorteilhaft für solche Linearkombinationen der ersten Art, in denen Symmetriemerkmale von Schriftzeichen mit symmetrischen Formen, z.B. der Ziffern 8 und 0, gespeichert werden, da hierdurch die Anzahl der erforderlichen Linearkombinationen vermindert werden kann.
Das Verfahren der Erfindung benötigt durch das Zusammenwirken der zwei Arten von Linearkombinationen, bei welchen die für die Klassifizierung massgebenden Grenzen der Ausgangsspannung jeder Linearkombination getrennt festge-s legt werden, zur Klassifizierung von Schriftzeichen mit stark unterschiedlichen Merkmalen nur eine geringe Anzahl von Linearkombinationen, da durch die Eliminierung der Kontrastunterschiede die Anzahl der zur Identifizierung der Schriftzeichen erforderlichen Merkmale sehr stark eingeschränkt wird, in Dementsprechend ist auch die Anzahl der Rasterpunkte gering. Durch die geringe Anzahl der Rasterpunkte kann die Fläche eines Rasterpunktes relativ gross gemacht werden. Da von jedem Rasterpunkt zur Bildung der Linearkombinationen nur eine Spannung abgeleitet wird, ist diese Spannung ein Mass für i5 den Mittelwert der Schwärzung eines Rasterpunktes. Es können daher innerhalb der Fläche eines Rasterpunktes grosse Schwärzungsunterschiede, z.B. Konturenunterbrechungen, vorhanden sein. Dadurch lassen sich auch Schriftzeichen klassifizieren, deren Schriftzug unterbrochen ist oder sogar nur aus einzelnen zu unzusammenhängende Punkten verschiedener Schwärzungen besteht, wie es praktisch bei Schriftzeichen der Fall ist, welche mit Mosaikdruckern gedruckt sind. Das folgende Beispiel soll dies näher veranschaulichen.
25
Beispiel 2
Es ist der in Fig. 2c dargestellte, nur aus Punkten mit verschiedenen Schwärzungen und ungleichem Abstand bestehende Repräsentant als Ziffer 3 zu klassifizieren. Hierzu werden m unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens der Klasse 3 und der in der Spalte «zweite Spannungsart» der Tabelle 1 genannten - den Rasterpunkt-Differenzspannungen U'l, U'2, U'3, U'6, U'8, U'9, U'12, U'13, U'14, U'15 entsprechenden - Anteile der Summen-35 Rasterpunktdifferenzspannung US' die Linearkombinationen 1 .. .7 der ersten Art gemäss der Tabelle 2 gebildet.
Tabelle 2
Widerstands- Nr. Linearkombinationen der ersten Art Netzwerke
Grenzen der Ausgangsspannung
Nl,
Nl2
ni3 ni4
Nls
Nl«
Nl,
erste zweite
Spannungsart Spannungsart
1 IU'6 + U'9 + U'12 -0,32 US'I <0,096 US'
2 lU'l + U'2 + U'3 -0,28 US'I <0,084 US'
3 IU'13 + U'14 + U'15 -0,28 US'I <0,084 US'
4 IU'8 -0,10 US'I <0,030 US'
5 IU'2 + U'6 + U'12 + U'14 -0,40 US'I <0,120 US'
6 IU'3 + U'15 -0,22 US'I <0,066 US'
7 lU'l + U'8 + U'13 -0,24 US'I <0,072 US'
N2t N22 N23
Linearkombinationen der zweiten Art
8 U'4 + U'5
9 U'10 + U'll 10 U'7
<0,01 US' <0,01 US' <0,03 US'
Die Auswahl der Rasterpunkte zur Bildung der Linearkombinationen der ersten Art erfolgt unter Zugrundelegung des Standard-Schriftzeichens der Fig. 2a und unter Berücksichtigung der Merkmale der Mosaikschrift, nämlich dass die Schwärzung und die Lage der einzelnen Punkte verschieden sind, wie in Fig. 2c dargestellt. Zur Bildung jeweils einer Linearkombination der ersten Art werden nicht nur einzelne Rasterpunkt-Differenzspannungen sondern in der Mehrzahl mehrere Raster-punkt-Differenzspannungen verwendet, um eine Mittelwertsbildung der Schwärzungen von möglichst vielen Rasterpunkten zu erhalten. Hierdurch werden Unterschiede der Lage und der
Schwärzung der einzelnen Punkte des Mosaikschriftzeichens so weit ausgeglichen, dass die Ausgangsspannungen der gleichen 60 Linearkombinationen, welche unter Zugrundelegung des Repräsentanten nach Fig. 2c gebildet werden, innerhalb der für die Klassifizierung massgebenden Grenzen liegen.
Die Linearkombinationen 8,9,10 der zweiten Art für das Standard-Schriftzeichen gemäss Fig. 2a und den Repräsentan-65 ten gemäss Fig. 2c werden in analoger Weise gebildet.
Wie sich durch Einsetzen der Schwärzungswerte der einzelnen Rasterpunkte der Fig. 2c, anstelle der aus den Rasterpunkten abgeleiteten Rasterpunkt-Differenzspannungen, in die
617 026 8
Linearkombinationen der Tabelle 2 ermitteln lässt, werden netzwerke einer Schriftzeichenklasse nur eine Vergleichsspan-
durch den in Fig. 2c dargestellten Repräsentanten der Ziffer 3, nung erforderlich ist.
welcher nur aus unzusammenhängenden Punkten verschiedener Die Vergleichsschaltungen zur Feststellung, ob die positiven Schwärzung und abweichender Lage besteht, die für die zu oder negativen Ausgangsspannungen der Widerstandsnetz-identifizierende Klasse massgebenden Grenzen, innerhalb wel- 5 werke innerhalb der für die zu identifizierende Klasse massge-cher die Ausgangsspannungen der Linearkombinationen bei bende Grenzen liegen, bestehen aus ICI 1 und IC12 und der Vorlage der zu identifizierenden Schriftzeichen liegen müssen, Logik L. Die ICI 1 und IC12 sind Grenzwertschalter, denen als nicht überschritten. Selbstverständlich gilt dies auch für Reprä- Vergleichsspannung die Summen-Rasterpunktdifferenzspan-sentanten, deren Merkmale den Merkmalen des in Fig. 2a nung zugeführt wird und die feststellen, ob die positiven und dargestellten Standard-Schriftzeichens oder des in Fig. 2b dar- 10 negativen Ausgangsspannungen der Widerstandsnetzwerke gestellten Repräsentanten gleich oder ähnlich sind. Anderer- innerhalb der für die zu identifizierende Klasse massgebenden seits werden durch Repräsentanten anderer Ziffern-Schriftzei- Grenzen liegen. Die Dioden D1 .. .D17 dienen zur Entkoppchenklassen von den in den Linearkombinationen der Tabelle 2 lung, und es wird jeweils nur die grösste Ausgangsspannung den angegebenen Bedingungen jeweils nur etwa die Hälfte erfüllt. Vergleichsschaltungen zugeführt.
Dies bedeutet eine grosse Trennsicherheit gegenüber anderen 15 Zur Klassifizierung von Schriftzeichen der beschriebenen
Schriftzeichenklassen, da bereits eine einzige nicht erfüllte Art genügt die Unterteilung des Schriftfeldes in eine relativ
Bedingung einer Linearkombination verhindert, dass Repräsen- geringe Anzahl von Rasterpunkten, z.B. in 15 Rasterpunkte,
tanten anderer konkurrierender Ziffern-Schriftzeichenklassen wie die Ausführungsbeispiele zeigen. Voraussetzung für diese als Ziffer 3 identifiziert werden. relativ geringe Anzahl von Rasterpunkten ist, dass alle Schrift-
Eine Schaltung zur Realisierung der Linearkombinationen 20 Zeichenmerkmale zur Bildung der Linearkombinationen heran-
durch Widerstandsnetzwerke und zur Feststellung der Grenzen gezogen werden. Dies ist der Fall, wenn die Abtastung des der Ausgangsspannungen der Tabelle 2 zeigt die Fig. 3. Ent- Schriftfeldes lückenlos erfolgt und somit keine Schrifizeichenin-
sprechend den zwei Arten von Linearkombinationen besteht die formationen verloren gehen.
Schaltung aus zwei Arten von Widerstandsnetzwerken. Diese Da eine lückenlose Abtastung wegen der technischen Gege-sind mit Nl und N2 bezeichnet. Zur Klassifizierung des in Fig. 25 benheiten der photoelektrischen Wandler nur unter Verwen-2c dargestellten Repräsentanten sind von der ersten Art die dung von zusätzlichen optischen Vorrichtungen möglich ist, hat Widerstandsnetzwerke Nl,, Nl2, Nl3, Nl4, Nl5, Nl6, Nl7 und man bei vielen Abtastvorrichtungen das Schriftfeld in eine von der zweiten Art die Widerstandsnetzwerke N2X, N22, N23 grosse Anzahl von z.B. einigen Hundert Rasterpunkten untererforderlich. teilt, wodurch eine ebenso grosse Anzahl von photoelektrischen
Die Widerstandsnetzwerke bestehen aus den Widerständen 30 Wandlern erforderlich ist. Auch für diesen Fall lässt sich das
RI, R2 .. .R31, welche entsprechend der Art der Widerstands- vorliegende Verfahren vorteilhaft anwenden, indem man, aus-
netzwerke in Brückenschaltung geschaltet sind und denen die gehend von einer Unterteilung des Schriftfeldes in eine geringe
Rasterpunkt-Differenzspannungen +U'l, +U'2 .. .+U'15 Anzahl von gedachten Rasterpunkten, z.B. 15 Rasterpunkte und die jeweiligen Anteile der Summen-Rasterpunktdifferenz- gemäss Fig. 2, die Linearkombinationen ermittelt und von
Spannung —US' zugeführt werden. Zu den Widerstandsnetz- 35 jedem Rasterpunkt des ursprünglichen Schriftfeldes mit der werken gehören noch die integrierten Schaltkreise ICI.. .ICI 0 grossen Anzahl von Rasterpunkten die Rasterpunkt-Differenz-
mit den Widerständen R32 . . .R41. Mit ICI . . .IC10 werden Spannung ableitet, diese Rasterpunkt-Differenzspannungen die Ausgangsspannungen der Widerstandsnetzwerke verstärkt. entsprechend der Unterteilung des Schriftfeldes in die geringe
Mit den Widerständen R32 .. .R41 kann die Verstärkung eines Anzahl von Rasterpunkten zusammenfasst und mit diesen jeden IC und somit die Ausgangsspannung eines jeden Wider- 4» zusammengefassten Rasterpunkt-Differenzspannungen fest-
standsnetzwerkes so eingestellt werden, dass die für die zu stellt, ob die Ausgangsspannungen der Linearkombinationen identifizierende Klasse massgebenden Grenzen für jedes Wider- innerhalb der für die Klassifizierung massgebenden Grenzen standsnetzwerk dieselben sind, wodurch für die Widerstands- liegen.
C
2 Blatt Zeichnungen

Claims (4)

617 026 PATENTANSPRÜCHE
1. Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Raster-punkt-Differenzspannung gebildet wird, diese Rasterpunkt-Dif-ferenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zuidentifizierende Klasse massgebenden Grenzen liegt, dadurch gekennzeichnet, dass man unter Zugrundelegung eines Schriftfeldes, das in mindestens 9 und höchstens 60 gedachte Rasterpunkte unterteilt ist,
I) für das Standard-Schriftzeichen der zu identifizierenden Klasse die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
II) aus diesen Spannungen zwei Arten von Linearkombinationen bildet, wobei a) die Linearkombinationen der ersten Art als Differenz aus jeweils zwei Spannungsarten gebildet werden, von denen die erste Spannungsart für jeweils eine Linearkombination
A) aus nur einer Rasterpunkt-Differenzspannung besteht, deren Wert im Falle eines in 9 bis 20 Rasterpunkte unterteilten Schriftfeldes mindestens 2% und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5% der Summen-Rasterpunktdifferenzspannung beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 % und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4% der Summen-Rasterpunktdifferenzspannung beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet wird, dass sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat, und b) die Linearkombinationen der zweiten Art aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5 % und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3% der Summen-Rasterpunktdifferenzspannung beträgt,
III) für das zu klassifizierende Schriftzeichen die Raster-punkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
IV) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und
V) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ± 30% vom Wert der zweiten Spannungsart abweicht, und b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen gemäss Abschnitt IIb die Linearkombinationen der zweiten Art gebildet worden sind.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die erste Spannungsart für jeweils eine Linearkombination der ersten Art aus mehreren Rasterpunkt-Differenzspannungen bildet, deren Gesamtwert höchstens 60% der Summen-Rasterpunktdifferenzspannung beträgt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass man für jede Schriftzeichenklasse mindestens so viele Linearkombinationen, wie 60% der Anzahl der Rasterpunkte entspricht, und höchstens so viele Linearkombinationen, wie Rasterpunkte vorhanden sind, bildet.
4. Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, dass man die zweite Spannungsart für jeweils eine Linearkombination der ersten Art nicht aus der Summen-Rasterpunktdifferenzspannung sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen bildet, deren Gesamtwert denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat.
CH496477A 1976-04-30 1977-04-21 CH617026A5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19762619245 DE2619245A1 (de) 1976-04-30 1976-04-30 Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen

Publications (1)

Publication Number Publication Date
CH617026A5 true CH617026A5 (de) 1980-04-30

Family

ID=5976819

Family Applications (1)

Application Number Title Priority Date Filing Date
CH496477A CH617026A5 (de) 1976-04-30 1977-04-21

Country Status (4)

Country Link
US (1) US4134021A (de)
CH (1) CH617026A5 (de)
DE (1) DE2619245A1 (de)
FR (1) FR2349893A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5911152B2 (ja) * 1976-10-19 1984-03-13 肇産業株式会社 パタ−ンマツチング方法及びその実施装置
US4290049A (en) * 1979-09-10 1981-09-15 Environmental Research Institute Of Michigan Dynamic data correction generator for an image analyzer system
US4464788A (en) * 1979-09-10 1984-08-07 Environmental Research Institute Of Michigan Dynamic data correction generator for an image analyzer system
US4490850A (en) * 1981-12-17 1984-12-25 Ncr Corporation Matrix character recognition
US4616333A (en) * 1984-06-05 1986-10-07 Elscint, Ltd. Data correlation system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3432673A (en) * 1967-10-06 1969-03-11 Control Data Corp Line tracking reading machine having means to positionally normalize the character-video signals
DE1811420B2 (de) * 1968-11-28 1974-05-30 Matth. Hohner Ag, 7218 Trossingen Schaltung zur Klassifizierung von Repräsentanten mit stark unterschiedlichen Merkmalen
DE2026033C3 (de) * 1970-05-27 1979-05-03 Matth. Hohner Ag, 7218 Trossingen Rasterverfahren zur Klassifizierung von Schriftzeichen

Also Published As

Publication number Publication date
US4134021A (en) 1979-01-09
DE2619245A1 (de) 1977-11-10
FR2349893B1 (de) 1984-01-27
FR2349893A1 (fr) 1977-11-25

Similar Documents

Publication Publication Date Title
DE3786472T2 (de) Vorrichtung für optische Zeichenerkennung.
DE3689416T2 (de) Mustermerkmalextraktion.
DE3485953T2 (de) Verfahren und anlage zur on-line-erkennung handgeschriebener muster.
DE1196410C2 (de) Lernfaehige Unterscheidungsmatrix fuer Gruppen von analogen Signalen
DE68918603T2 (de) Gerät zur Optimalbildqualitätsselektion.
DE4334765A1 (de) Proportionierverfahren
DE3339498A1 (de) Schnelle logische schaltung
DE69816713T2 (de) Zweidimensionaler magnetischer Positionssensor, insbesondere für Kraftfahrzeuganwendungen
WO2008074477A1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild
DE69031245T2 (de) Nichtlinearer Analog-/Digitalwandler
CH617026A5 (de)
DE1138571B (de) Zeichen-Erkennungsvorrichtung
DE2635224C2 (de) Schaltanordnung zur Bildung eines einzelnen Ausgangssignals in Abhängigkeit einer Mehrzahl von zugeführten Meßsignalen
DE3417407C2 (de) Kreisgenerator für eine graphische Anzeigeeinheit
DE1197656B (de) Verfahren zur maschinellen Zeichenerkennung
DE2000255A1 (de) Spannungsvergleichseinrichtung
DE1811420C3 (de)
DE2026033C3 (de) Rasterverfahren zur Klassifizierung von Schriftzeichen
DE1524409B2 (de) Zeichenerkennungsgeraet
DE19716445A1 (de) Verfahren zur Verbreiterung von Zeichen
DE2333202A1 (de) Zeichenerkennungsanordnung
DE19522394C2 (de) Verfahren und Vorrichtung zur Bestimmung der Teilung bei Schriften mit fester Teilung
DE1524344A1 (de) Schriftzeichenableseeinrichtung
DE2113264C3 (de) Verfahren zum automatischen Erkennen zweidimensionaler Muster mit Hilfe von Momenten zweiter Ordnung
EP0760144B1 (de) Verfahren zur verbesserung der erkennung von maschinenschriften mit fester schriftteilung

Legal Events

Date Code Title Description
PL Patent ceased