DE2619245A1 - Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen - Google Patents

Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen

Info

Publication number
DE2619245A1
DE2619245A1 DE19762619245 DE2619245A DE2619245A1 DE 2619245 A1 DE2619245 A1 DE 2619245A1 DE 19762619245 DE19762619245 DE 19762619245 DE 2619245 A DE2619245 A DE 2619245A DE 2619245 A1 DE2619245 A1 DE 2619245A1
Authority
DE
Germany
Prior art keywords
voltage
grid point
voltages
type
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19762619245
Other languages
English (en)
Inventor
Arthur Klemt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TRANSITUS ETS
Original Assignee
TRANSITUS ETS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TRANSITUS ETS filed Critical TRANSITUS ETS
Priority to DE19762619245 priority Critical patent/DE2619245A1/de
Priority to CH496477A priority patent/CH617026A5/de
Priority to US05/789,365 priority patent/US4134021A/en
Priority to FR7713247A priority patent/FR2349893A1/fr
Publication of DE2619245A1 publication Critical patent/DE2619245A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/195Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references using a resistor matrix
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)

Description

Dr. E. VORWERK PATENTANWALT
SiBt QBDBENZELLyMONCHEK Mozartstraße 9
29. April 19 76
K 892/76
Transitus Establishment, Vaduz, Liechtenstein
Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen
Die Erfindung betrifft ein Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Differenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegt.
709845/0457
Die Darstellung der Schriftzeichen auf dem in gedachte Rasterpunkte unterteilten Schriftfeld erfolgt in der Regel als Schwärzung auf hellem Untergrund. Nachstehend sind unter "Schwärzung auf hellem Untergrund" aber sinngemäß auch andere Darstellungen der Schriftzeichen, wie helle Schriftzeichen auf dunklem Untergrund oder Schriftzeichen auf lichtdurchlässigem Untergrund, z.B. Film, zu verstehen.
Bei der maschinellen Klassifizierung von Schriftzeichen sind in der Regel keine Standard-Schriftzeichen mit gleicher Form, gleicher Strichstärke und gleicher Schwärzung zu identifizieren, sondern Schriftzeichen, die auf unterschiedlichem Untergrund von Schnelldruckern, Schreibmaschinen oder Mosaikdruckern ausgedruckt oder mit der Hand mit unterschiedlichem Schreibgerät geschrieben sind, also Schriftzeichen, die sich in Form, Strichstärke und Schwärzung von den Standard-Schriftzeichen erheblich unterscheiden können und deren Merkmale beträchtlich schwanken. Große Schwankungen der Merkmale ergeben sich durch Kontrastunterschiede.
Kontrastunterschiede können auftreten, wenn die Schwärzung der Repräsentanten einer Schriftzeichenklasse gleich bleibt, sich jedoch die Helligkeit oder Farbe des Untergrundes ändert, oder wenn bei gleichbleibender Helligkeit oder Farbe des Untergrundes sich die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändert, oder wenn sich sowohl die Helligkeit oder Farbe des Untergrundes als auch die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändern.
Auch der Schriftzug eines einzelnen Schriftzeichens kann Kontrastunterschiede aufweisen. So kann bei Schriftzeichen, welche von Schreibmaschinen oder Schnelldruckern gedruckt sind, z.B. der obere oder der rechte Bereich stärker oder schwächer geschwärzt sein als der untere oder der linke Bereich. Besonders große Kontrastunterschiede innerhalb eines einzelnen Schrift-
709845/0457
zeichens sind bei den Mosaikschriften vorhanden, deren Schriftzug nur aus Punkten besteht, welche sich berühren oder auch einen Abstand bis zum zweifachen Durchmesser eines Punktes haben können, v;odurch der Schriftzug sogar mehrfach unterbrochen ist. Auch kann die Schwärzung der einzelnen Punkte verschieden sein.
Zur Klassifizierung von Schriftzeichen werden bei
den Verfahren und Schaltungen, welche von einer rasterförmigen Abtastung des Schriftfeldes ausgehen, die aus den Rasterpunkten abgeleiteten Spannungen miteinander kombiniert. Hierzu haben sich bei dem heutigen Stand der Technik lineare Funktionselemente als zweckmäßig erwiesen, insbesondere lineare Widerstandsnetzwerke, in welchen die aus den Rasterpunkten abgeleiteten Spannungen analog verarbeitet werden, oder Rechner mit den Grundrechnungsarten Addition und Multiplikation, welche die aus den Rasterpunkten abgeleiteten Spannungen - nach erfolgter Digitalisierung - digital verarbeiten. Beide Verarbeitungsmöglichkeiten werden nachstehend als "Bildung von Linearkombinationen" bezeichnet. Im Prinzip speichert jede Linearkombination Merkmale von-Standard-Schriftzeichen und vergleicht diese mit den entsprechenden Merkmalen der zu klassifizierenden Schriftzeichen.
Bei einigen bekannten Verfahren und Schaltungen (z.B. die USA-Patentschrift 3 271 576 oder "Internationale Elektronische Rundschau" 1968, Seiten 19- 21) müßten für die Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen in den Linearkombinationen die Merkmale sämtlicher in Betracht kommenden Repräsentanten unterschiedlicher Ausführungsformen der zu klassifizierenden Schriftzeichen gespeichert werden. Bei Vorlage eines unbekannten Schriftzeichens müßten dann alle gespeicherten Werte der Merkmale der verschiedenen Repräsentanten sämtlicher Klassen mit den Merkmalen des unbekannten Schriftzeichens verglichen werden. Für die Klassifizierung von Schriftzeichen mit stark schwankenden Merkmalen wären bis zu etwa 1000 Linearkombinationen pro Klasse erforderlich.
70984 5/0457
Es ist auch bekannt, um diesen untragbaren Aufwand zu verringern, in den Linearkonibinationen anstelle der Merkmale einzelner Repräsentanten die Merkmale von Gruppen von Repräsentanten zu speichern, deren Merkmale Abweichungen nur innerhalb bestimmter Grenzen aufweisen. Diese Grenzen müssen jedoch eng bemessen sein, da anderenfalls die Trennsipherheit gegenüber anderen Klassen stark abnimmt, so daß immer noch sehr viele Linearkombinationen erforderlich sind und der technische Aufwand noch recht groß ist.
Letzteres gilt auch für Verfahren, die von der sogenannten Optimierung Gebrauch machen. Hierbei geht man davon aus, daß es bei den verschiedenen Repräsentanten einer Schriftzeichenklasse Rasterpunkte gibt, die immer weiß sind, und solche, die immer schwarz sind, und verwendet für die Bildung von Linearkombinationen nur diese. Rasterpunkte, die für die verschiedenen Repräsentanten einer Klasse einmal schwarz und einmal weiß sind, werden für die Bildung von Linearkombinationen nicht verwendet. Durch die Weglassung dieser Rasterpunkte verschenkt man jedoch für die Erkennung wichtige Merkmale. Die Anzahl der Linearkombinationen wird zwar vermindert, andererseits entsteht für die Optimierung zusätzlicher technischer Aufwand. Außerdem wird die Trennsicherheit gegenüber Schriftzeichen anderer Klassen wesentlich vermindert.
Weiterhin sind Verfahren und Schaltungen bekannt, welche mit einer wesentlich geringeren Anzahl von Linearkombinationen auskommen. Gemäß der deutschen Patentschrift 18 11 420 wird dies durch Widerstandsnetzwerke erreicht, bei welchen die zur Bildung der Linearkombinationen vorgesehenen Widerstände tür jede Klasse nach Maßgabe einer Bestimmung der Eigenvektoren der Kovarianzmatrix der Merkmale bemessen sind. Diese Methode der Bemessung der Widerstände zur Bildung von Linearkombinationen setzt zwar die Anzahl der Linearkombinationen bzw. der Widerstandsnetzwerke im Vergleich zu den erstgenannten Verfahren und
709845/0457
Schaltungen um ein Vielfaches herab, berücksichtigt aber nicht Repräsentanten von Schriftzeichen konkurrierender Klassen, wodurch die Trennsicherheit gegen Schriftzeichen konkurrierender Klassen, insbesondere bei Klassifizierung von Schriftzeichen mit stark unterschiedlichem Kontrast, nicht ausreichend ist. Ferner müssen die aus allen Rasterpunkten abgeleiteten und den Widerstandsnetzwerken zugeführten Spannungen notwendigerweise sowohl positive als auch negative Polarität haben, wodurch ein beträchtlicher technischer Aufwand entsteht.
Dies gilt auch für das Verfahren der deutschen Offenlegungsschrift 20 26 033, d.h, alle aus den Rasterpunkten abgeleiteten Spannungen müssen sowohl positive als auch negative Polarität haben. Bei diesem Verfahren werden in den Widerstandsnetzwerken einer Klasse die Spannungen aus solchen Rasterpunkten miteinander kombiniert, welche zusammengefaßt drei Arten charakteristischer Formteile von Schriftzeichen dieser Klasse entsprechen. Die dadurch gebildeten Linearkombinationen erlauben nur eine Klassifizierung von Schriftzeichen mit geringen Kontrastunterschieden.
Ein gemeinsamer Nachteil aller genannten Verfahren und Schaltungen ist demnach, daß deren Linearkombinationen bei erträglichem technischen Aufwand nicht geeignet sind, Schriftzeichen mit starken Kontrastunterschieden und dadurch bedingten Formverfälschungen und Unterbrechungen des Schriftzuges mit hinreichender Trennsicherheit zu klassifizieren. Hierzu wäre es bei den bekannten Verfahren und Schaltungen erforderlich, die Anzahl der Linearkombinationen wesentlich zu vergrößern, was den technischen Aufwand erhöhen würde.
Zur Verminderung des Einflusses von Kontrastunterschieden auf die "Klassifizierung von Schriftzeichen sind mehrere Verfahren und Schaltungen bekannt. Gemäß der deutschen Patent-
709845/0457
schrift 18 11 420 wird den Widerstandsnetzwerken, die die Linearkombinationen realisieren, eine zusätzliche Spannung zugeführt, wodurch die Ausgangsspannungen der Widerstandsnetzwerke bei Vorliegen eines Repräsentanten der zu identifizierenden Klasse nahe bei Null liegen. Diese zusätzliche Spannung wird von allen Rasterpunkten abgeleitet. Da sich mit einer gemeinsamen Änderung der aus den Rasterpunkten abgeleiteten und den Widerstandsnetzwerken einzeln zugeführten Spannungen, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen, auch die zusätzliche Spannung ändert, tritt eine Kompensationswirkung ein.
Gemäß der deutschen Offenlegungsschrift 20 26 033 wird die Ausgangsspannung eines jeden Widerstandsnetzwerkes mit einer Spannung verglichen, die proportional der Summe aller aus den Rasterpunkten abgeleiteten Spannungen ist, um festzustellen, ob die Ausgangsspannungen innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen. Bei Änderungen der Ausgangsspannungen der Widerstandsnetzwerke, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen, ändert sich auch die Vergleichsspannung, wodurch der Einfluß von Kontraständerungen vermindert wird.
Durch diese Maßnahmen, im ersten Falle die Zuführung einer zusätzlichen von allen Rasterpunkten abgeleiteten Spannung in die Widerstandsnetzwerke und im zweiten Falle die Verwendung einer ebenfalls aus allen Rasterpunkten abgeleiteten Vergleichsspannung, kann der Einfluß von Kontrastunterschieden nur in beschränktem Maße vermindert werden, da der von einem Schriftzeichen geschwärzte Anteil des Schriftfeldes nur einen Bruchteil seiner Gesamtfläche ausmacht (ca. 15 bis 35 %), die zusätzliche Spannung bzw. die Vergleichsspannung somit in überwiegendem Maße von den nicht geschwärzten Bereichen des Schriftfeldes bestimmt wird, und daher bei einer Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen
709845/0457
sich die zusätzliche Spannung bzw. die Vergleichsspannung wesentlich weniger ändert als der Schwärzungsgrad.
Es ist auch ein Verfahren zur Verringerung des Einflusses von Unterschieden des Kontrastes und der Untergrundhelligkeit bekannt (deutsche Auslegeschrift 20 44 795), bei welchem aus einer von nicht durch Schriftzeichen geschwärzten Stellendes Untergrundes abgeleiteten Bezugsspannung und den aus den Rasterpunkten abgeleiteten Spannungen für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird und diese Rasterpunkt-Differenzspannungen sowohl einzeln als auch als Summe anstelle der aus den Rasterpunkten direkt abgeleiteten Spannungen Widerstandsnetzwerken zugeführt werden und die Vergleichsspannung aus der Summe aller Rasterpunkt-Differenzspannungen gebildet wird. Dieses Verfahren gibt zwar eine Möglichkeit an, den Einfluß von Unterschieden des Kontrastes und der üntergrundhelligkeit bei vorgegebenen Widerstandsnetzwerken zu vermindern, macht jedoch weder eine Aussage über die Art und Bemessung der zur Klassifizierung von Schriftzeichen erforderlichen Widerstandsnetzwerke bzw. Linearkombinationen noch Angaben über die Größe der Vergleichsspannungen, durch welche festgestellt wird, ob die Ausgangsspannungen der Linearkombinationen innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur maschinellen Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen zu schaffen, das mit einem wesentlich geringeren technischen Aufwand als die bisher bekannten Verfahren auskommt, insbesondere mit weniger und einfacheren Linearkombinationen, denen nur Spannungen einer Polarität zugeführt werden müssen, eine große Sicherheit gegenüber Schriftzeichen anderer Klassen gewährleistet und unempfindlich gegenüber Kontraständerungen
709845/0457
jeglicher Art ist, nämlich unempfindlich gegenüber Unterschieden der Helligkeit des Untergrundes, der Schwärzung der zu klassifizierenden Schriftzeichen und der Schwärzung innerhalb eines Schriftzeichens.
Zur Lösung dieser Aufgabe ist Gegenstand der Erfindung ein Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Differenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegt, welches erfindungsgemäß dadurch gekennzeichnet ist, daß man unter Zugrundelegung eines Schriftfeldes, das in mindestens 9 und höchstens 60 gedachte Rasterpunkte unterteilt ist,
1) für das Standard-Schriftzeichen der zu identifizierenden
die.
Klasse die Rasterpunkt-Differenzspannungen und'Summen-Rasterpunktdifferenzspannung ermittelt,
2) aus diesen Spannungen zwei Arten von Linearkombinationen bildet, wobei
a) die Linearkombinationen der ersten Art als Differenz aus jeweils zwei Spannungsarten gebildet werden, von denen die erste Spannungsart für jeweils eine Linearkombination
709845/0457
-η-
A) aus nur einer Rasterpunkt-Differenzspanhung besteht, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2 %f vorzugsweise mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %, vorzugsweise mindestens 2 %, der Summen-Rasterpunktdifferenzspannung beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 %, vorzugsvrt'.ise mindestens 10 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4 %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenzspannung beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet wird, daß sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat, und b) die Linearkombinationen der zweiten Art aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3,0 %, vorzugsweise höchstens 2,0 %, der Summen-Rasterpunktdifferenzspannung beträgt,
3) für das zu klassifizierende Schriftzeichen die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
4) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und
5) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ± 30 % vom Wert der zweiten Spannungsart abweicht, und
709845/0457
4Il
b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Suiranen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen gemäß Abschnitt 2b die Linearkombinationen der zweiten Art gebildet worden sind.
Zur Bildung der Linearkombinationen können sowohl einzelne als auch mehrere Rasterpunkt-Differenzspannungen herangezogen werden. Für die Klassifizierung von Schriftzeichen mit geringen Unterschieden der Schwärzung innerhalb des Schriftzeichens und wenig unterschiedlicher Form jedoch stark unterschiedlichem Kontrast, bezogen auf das Standard-Schriftzeichen, kann die erste Spannungsart jeweils einer Linearkombination der ersten Art aus nur einer einzigen Rasterpunkt-Differenzspannung bestehen, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2 %, vorzugsweise mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %, vorzugsweise mindestens 2 %, der Summen-Rasterpunktdifferenzspannung beträgt.
Weisen die zu klassifizierenden Schriftzeichen auch innerhalb des Schriftzeichens unterschiedliche Schwärzungen und/oder stark unterschiedliche Form, bezogen auf das Standard-Schrift zeichen, auf, so wird die erste Spännungsart der Linearkombinationen der ersten Art vorzugsweise aus mehreren Rasterpunkt-Differenzspannungen gebildet, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 %, vorzugsweise mindestens 10 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4 %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenzspannung beträgt. Dabei sollte der Gesamtwert in beiden Fällen höchstens 60 % der Summen-Rasterpunktdifferenzspannung betragen.
709845/0457
Die Linearkombinationen der zweiten Art können entweder aus mehreren Rasterpunkt-Differenzspannungen gebildet werden, oder nur aus einer Rasterpunkt-Differenzspannung bestehen. Der Gesamtwert muß im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3,0 %, vorzugsweise höchstens 2»,0 %, der Summen-Rasterpunktdifferenzspannung betragen. Ob die Linearkombinationen der zweiten Art aus nur einer oder aus mehreren Rasterpunkt-Differenzspannungen gebildet werden, hängt im wesentlichen von den technischen Gegebenheiten bei der Durchführung des Verfahrens ab, z.B. von der Konstanz der Schriftfeldbeleuchtung, den photoelektrischen Wandlern, den optischen Einrichtungen usw. Vorzugsweise bestehen die Linearkombinationen der zweiten Art nur aus einer einzigen Rasterpunkt-Differenzspannung, da in diesem Fall die technischen Gegebenheiten weniger Einfluß auf die Erkennungssicherheit haben als bei Bildung der Linearkombinationen aus mehreren Rasterpunkt-Differenzspann-'ungen. Im letzteren Fall ist jedoch die Anzahl der Linearkombinationen kleiner, was auch oft von praktischer Bedeutung ist.
Zur Feststellung, ob die Abweichungen der Merkmale der zu identifizierenden Schriftzeichen von den in den Linearkombinationen gespeicherten Merkmalen des Standard-Schriftzeichens innerhalb der für die Klassifizierung maßgebenden Grenzen liegen, wird die Ausgangsspannung einer jeden Linearkombination herangezogen und geprüft, (a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ί 30 % vom Wert der zweiten Spannungsart abweicht, und (b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen die Linearkombination' der zweiten Art gebildet worden sind (siehe hierzu das spätere Beispiel 1).
709845/CK57
Die angegebenen Grenzen von + 30 % für die Ausgangsspannungen der Linearkoitibinationen der ersten Art gewährleisten eine ausreichende Trennsicherheit der zu identifizierenden Schriftzeichen gegenüber Schriftzeichen konkurrierender Klassen. Wird eine über das übliche Maß hinausgehende Trennsicherheit gefordert oder sind Schriftzeichen zu identifizieren, die trotz Zugehörigkeit zu verschiedenen Klassen nur wenig voneinander verschieden sind, wie es z.B. bei handschriftlich geschriebenen Schriftzeichen der Fall sein kann, so können die Grenzen der Ausgangsspannungen eingeengt werden, z.B. von + 30 % auf + 20 %.
Es werden grundsätzlich nicht mehr Linearkombinationen gebildet, wie Rasterpunkte vorhanden sind, da sonst die über die Anzahl der Rasterpunkte hinausgehenden Linearkombinationen von bereits gebildeten Linearkombinationen abhängig sind. Jedoch werden für schwieriger zu erkennende Schriftzeichen, z.B. den Buchstaben K, zweckmäßig so viele Linearkombinationen gebildet, wie Rasterpunkte vorhanden sind. Dagegen sind für die Klassifizierung leicht zu erkennender Schriftzeichen, z.B. die Ziffer 1, nicht alle möglichen Linearkombinationen erforderlich. Vorzugsweise beträgt die Anzahl der Linearkombinationen für eine Schriftzeichenklasse mindestens 60 % der Anzahl der Rasterpunkte.
Es gibt Schriftzeichen, z.B. solche mit breiter Strichstärke, bei denen die beschriebenen Bedingungen für die Bildung der Linearkombinationen der zweiten Art nicht erfüllbar sind. Zur Identifizierung derartiger Schriftzeichen werden nur Linearkombinationen der ersten Art gebildet.
Bei den heutigen technischen Gegebenheiten erfolgt die Durchführung des Verfahrens der Erfindung vorzugsweise entweder
in analoger Technik, indem die aus den Rasterpunkten und aus der Stelle des Untergrundes, wo sich kein Schriftzeichen be-
709845/0457
findet, abgeleiteten Spannungen Additionsschaltungen (zur Bildung der Rasterpunkt-Differenzspannungen und der Summen-Rasterpunktdifferenzspannung), linearen Widerstandsnetzwerken (zur Bildung der Linearkoinbinationen) und Grenzwertschaltungen (zum Vergleich der Ausgangsspannungen der Widerstandsnetzwerke mit der Vergleichsspannung) zugeführt werden, oder
in digitaler Technik, indem die analogen Spannungen in digitale Werte umgewandelt und diese entsprechend den Bedingungen der Linearkombinationen in Digitalrechnern verarbeitet werden.
Das Verfahren der Erfindung wird nachstehend am
Beispiel der Klassifizierung von Repräsentanten der Ziffer 3 in
Verbindung mit den anliegenden Zeichnungen weiter erläutert. Es zeigen:
Fig. 1 ein Schriftfeld für die Klassifizierung von Schriftzeichen;
Fig. 2a bis 2c verschiedene Ausführungsformen der Ziffer 3 im Schriftfeld der Fig. 1;
Fig. 3 eine Schaltung zur Durchführung des Verfahrens.
Gemäß Fig. 1 ist das Schriftfeld in die Rasterpunkte 1 ... 15 aufgeteilt und außerhalb des Schriftfeldes befindet sich eine nie geschwärzte Stelle F. In ein derartiges Schriftfeld ist gemäß Fig. 2a ein Standard-Schriftzeichen der Ziffer 3 mit der Soll-Schwärzung, der Soll-Strichbreite und der Soll-Form eingetragen. Gemäß Fig. 2b ist ein Repräsentant der Ziffer 3 mit anderer Form und etwa halbem Schwärzungsgrad, bezogen auf das Standard-Schriftzeichen, dargestellt durch den gestrichelten Schriftzug, eingetragen. Gemäß Fig. 2c ist ein aus Punkten bestehender Repräsentant der Ziffer 3, wie er praktisch bei einer Mosaikschrift mit einer Matrix von 5x7 Punkten vorkommen kann, eingetragen. Die Repräsentanten der Fig. 2b und 2c,
98A5/0AS7
welche gegenüber dem Standard-Schriftzeichen der Fig. 2a erhebliche Unterschiede hinsichtlich Schwärzung, Strichbreiten, Form und Unterbrechungen des Schriftzuges aufweisen, sollen nach dem Verfahren der Erfindung klassifiziert werden.
Hierzu werden in bekannter Weise, z.B. durch
Phototransistoren, aus jedem Rasterpunkt 1 ... 15 und aus der nie geschwärzten Stelle F elektrische Spannungen erzeugt, und aus diesen z.B. durch Invertier- und Addierschaltungen folgende Spannungen gebildet:
a) aus den Rasterpunkten 1 ... 15 die zu den Helligkeitswerten dieser Rasterpunkte proportionalen Spannungen -U1, -U2 ... -U15;
b) aus der nie geschwärzten Stelle F die Spannung +UF;
c) durch Addition jeder der Spannungen -U1, -U2. ... -U15 zu der Spannung +UF die den Schwärzungswerten der Rasterpunkte 1 ... 15 proportionalen Rasterpunkt-Differenzspannungen +U'1, +U'2 ... +U115;
d) durch Addition der Spannungen +U'1, +U'2 ... +U115 die Summen-Rasterpunktdifferenzspannung +US';
e) durch Invertierung der Spannung +US' die Summen-Rasterpunktdifferenzspannung -US1.
Aus den so erzeugten Rasterpunkt-Differenzspannungen +U'1, +U"2 ... +U115 und den Summen-Rasterpunktdifferenzspannungen -US* und +US1 werden die Linearkombinationen und die Grenzen für die Ausgangsspannungen der Linearkombinationen ermittelt. Dabei wird davon ausgegangen, daß bei nicht geschwärztem Untergrund des Schriftfeldes jede aus den Rasterpunkten 1 ... 15 und aus der nicht durch Schriftzeichen geschwärzten Stelle F des Untergrundes abgeleitete Spannung denselben Betrag hat.
709845/0467
- It -
Beispiel
Erfindungsgemäß können die erste Spannungsart
der Linearkoinbinationen der ersten Art und die Linearkombinationen der zweiten Art aus nur einer einzigen Rasterpunkt-Differenzspannung bestehen, wobei die Rasterpunkt-Differenzspannungen U'1, U'2 ... U'15 verwendet werden. Dies wird durch die in der Tabelle 1 dargestellten Linearkoinbinationen zur Klassifizierung des in Fig. 2b dargestellten Repräsentanten der Ziffer 3 veranschaulicht, welcher im Vergleich zu dem in Fig. 2a dargestellten Standard-Schriftzeichen sich durch geringere Schwärzung und andere Form unterscheidet.
1 2 3 4 5 6 7 8 9 10
•1 Tabelle 1
'2
Linearkombinationen '3 der ersten Art
erste '6 .zweite
Spannungsart ■8 Spannungsart
IU '9 -0,07 US1
IU •12 -0,10 US'
IU •13 -0,11 US'
IU Ί4 -0,10 US1
IU •15 -0,10 US'
IU -0,12 US'
IU -0,10 US1
IU -0,07 US'
IU -0,10 US'
Iu -0,11 US1
Grenzen der
Ausgangsspannung
<0,021 US1 <0,030 US1 <O,O33 US1 <0,030 US' <0,030 US' <O,O36 US' <0,030 US' <0,021 US1 <0,030 US' <O,O33 US1
(Fortsetzung Tabelle 1)
709845/04S7
1*
(Fortsetzung Tabelle 1)
Grenzen der
Nr. Linearkombinationen der zweiten Art Ausgangs spannung
11 UM <O,O1 US'
12 U'5 <0,01 US1
13 U'10 <0,01 US1
14 U111 <0,01 US1
15 U'7 <0,03 US1
Da die aus den Rasterpunkten abgeleiteten Rasterpunkt-Differenzspannungen proportional zu den Schwärzungswerten der Rasterpunkte sind, können die zur Bildung der Linearkombinationen notwendigen Rasterpunkt-Differenzspannungen direkt aus den Schwärzungswerten der Rasterpunkte ermittelt werden. So können die Linearkombinationen 1, 2 ... 10 der ersten Art unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens der Ziffer 3 dadurch gebildet werden, daß man - durch Addition der durch das Standard-Schriftzeichen nach Fig. 2a geschwärzten Flächen der einzelnen Rasterpunkte 1, 2, 3, 6, 8, 9, 12, 13, 14, 15- die gesamte geschwärzte Fläche dieser Rasterpunkte und daraus anteilig die geschwärzte Fläche für jeden einzelnen dieser Rasterpunkte ermittelt. Beispielsweise beträgt die geschwärzte Fläche des Rasterpunktes 1, aus welchem die Rasterpunkt-Differenzspannung U'1 der Linearkombination 1 der Tabelle 1 gebildet wird, 7 % der durch diese Rasterpunkte insgesamt geschwärzten Fläche. Die aus dem Rasterpunkt 1 abgeleitete Rasterpunkt-Differenzspannung U'1 der Linearkombination 1 hat somit einen Wert von 7 % der Summen-Rasterpunktdifferenzspannung -US1, d.h. -0,07 US'.
In analoger Weise ergeben sich die Linearkombinationen 11 ... 15 der zweiten Art für das Standard-Schriftzeichen gemäß Fig. 2a und die Linearkombinationen 1 ... 15 für
709845/0457
den Repräsentanten gemäß Fig. 2b.
Die in der Spalte "Grenzen der Ausgangsspannung" der Tabelle 1 angegebenen Werte geben als Anteile der zweiten Spannungsart für die Linearkombinationen der ersten Art die für die zu identifizierende Klasse maßgebende Ausgangsspannung an, welche bis zu + 30 % vom Wert der zweiten Spannungsart betragen kann. So muß z.B. bei der Linearkombination 1 die Ausgangsspannung kleiner als 0,07 · (30/100) · US1 = 0,021 US1 sein, damit eine Klassifizierung des vorgelegten Schriftzeichens in die Klasse 3 erfolgen kann.
Die für eine Klassifizierung des vorgelegten Repräsentanten nach Fig. 2b in die Klasse 3 maßgebenden Ausgangsspannungen der Linearkombinationen 11, 12, 13, 14 der zweiten Art liegen unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung US*. Diese Ausgangsspannungen, welche mit den Rasterpunkt-Differenzspannungen U14, U'5, U'10, U'11 identisch sind, haben theoretisch den Wert Null, da diese Rasterpunkt-Differenzspannungen aus nicht geschwärzten Rasterpunkten abgeleitet sind, jedoch ist die Grenze dieser Ausgangsspannungen wegen den technischen Gegebenheiten auf 1 % der Summenr-Rasterpunktdifferenzspannung US1 festgelegt. Die Grenze der Ausgangsspannung der Linearkombination 15 beträgt 3 % der Summen-Ra'sterpunktdifferenzspannung US', da die mit der Ausgangsspannung identische Rasterpunkt-Differenzspannung U17 aus dem Rasterpunkt 7 abgeleitet ist, welcher durch das Standard-Schriftzeichen der Fig. 2a eine Schwärzung von 2 % der GesamtSchwärzung aller Rasterpunkte aufweist.
Die in der Tabelle 1 genannten Linearkombinationen und Grenzen der Ausgangsspannungen können zur Durchführung des Verfahrens durch elektrische Schaltungen, etwa gemäß der in Fig. 3 dargestellten Schaltung, oder nach Umwandlung der Rasterpunkt-Differenzspannungen in digitale Werte durch Rechenoperationen realisiert werden.
709845/0457
Dadurch, daß die Ausgangsspannungen der Linearkombinationen der ersten Art aus jeweils zwei Spannungsarten gebildet werden, von denen jede von den Rasterpunkten abgeleitet ist, und durch die Bildung der Rasterpunkt-Differenzspannungen ändern sich bei Kontraständerungen alle beiden Spannungsarten dieser Linearkombinationen um denselben Faktor. Haben die Ausgangsspannungen dieser Linearkombinationen, z.B. bei Vorlage von Schriftzeichen mit denselben Merkmalen wie das Standard-Schriftzeichen, den Wert Null, und werden z.B. Schriftzeichen derselben Form jedoch mit unterschiedlicher Schwärzung und unterschiedlicher Untergrundhelligkeit zur Identifizierung vorgelegt, so behalten die Ausgangsspannungen den Wert Null. Sind jedoch die Ausgangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt werden, deren Form und/oder deren Schwärzung vom Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen um höchstens denselben Faktor, um welchen die Schwärzungen der zu identifizierenden Schriftzeichen von der Schwärzung des Standard-Schriftzeichens abweichen. Bei bekannten Verfahren und Schaltungen ändern sich die Ausgangsspannungen um ein Vielfaches, sowohl wenn diese den Wert Null hatten, als auch wenn diese von Null verschieden waren.
Auch bei den Linearkombinationen der zweiten Art haben Abweichungen der Untergrundhelligkeit und der Schwärzungen der zu identifizierenden Schriftzeichen von den Schwärzungen des Standard-Schriftzeichens keinen Einfluß auf die Ausgangsspannungen, wenn die zu identifizierenden Schriftzeichen dieselbe Form haben wie das Standard-Schriftzeichen, und somit die Ausgangsspannungen den Wert Null haben. Sind die Ausgangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt werden, deren Form und Schwärzung vom Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen, wie bei den Linearkombinationen der ersten Art, auch nur um denselben
709845/0487
Faktor, wie die Schwärzungen der zu identifizierenden Schriftzeichen von den Schwärzungen der Standard-Schriftzeichen abweichen.
Die Ausgangs spannungen der Linearkoinbinationen werden erfindungsgemäß mit Anteilen der Summen-Rasterpunktdifferenzspannung verglichen. Letztere ändert sich bei Abweichungen der Schwärzungen der zu identifizierenden Schriftzeichen von der Schwärzung des Standard-Schriftzeichens um denselben Faktor wie die von Null abweichenden Ausgangsspannungen der Linearkoinbinationen. Dadurch bleiben die für die zu identifizierende Klasse maßgebenden Grenzen, innerhalb welcher die Ausgangsspannungen der Linearkombinationen liegen müssen, konstant, und das Klassifizierungsergebnis bleibt von Unterschieden der Schwärzungen der Schriftzeichen und der Untergrundhelligkeit völlig unbeeinflußt.
Bei dem vorliegenden Verfahren werden auch die nicht geschwärzten Bereiche des Schriftfeldes - ebenso wie die geschwärzten Bereiche des Schriftfeldes - quantitativ zur Erkennung herangezogen, wodurch die Trennsicherheit wesentlich größer ist, als bei bekannten Verfahren. Dies wird dadurch erreicht, daß das Klassifizierungsergebnis der Linearkombinationen der zweiten Art, welche eine Aussage über die nicht geschwärzten Bereiche des Schriftfeldes machen, völlig unabhängig von der Untergrundhelligkeit und den technischen Gegebenheiten ist, z.B. Änderungen der Betriebsspannungen und der Beleuchtung des Schriftfeldes.
Die zweite Spannunjsart der Linearkombinationen der ersten Art wird für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet, daß sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat. Zur Bildung der Summen-Rasterpunktdifferenzspannung werden alle Rasterpunkt-Differenzspannungen herange-
709845/04S7
IS
zogen. Für die Bildung der zweiten Spannungsart können jedoch gegebenenfalls in der Suiranen-Rasterpunktdifferenzspannung einige Rasterpunkt-Differenzspannungen weggelassen werden, so daß die zweite Spannungsart nicht aus der Summen-Rasterpunktdifferenzspannung sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat. Die Bildung der zweiten Spannungsart aus einer oder mehreren Rasterpunkt-Differenzspannungen ist vorteilhaft für solche Linearkombinationen der ersten Art, in denen Symmetriemerkmale von Schriftzeichen mit symmetrischen Formen, z.B. der Ziffern 8 und 0, gespeichert werden, da hierdurch die Anzahl der erforderlichen Linearkombinationen vermindert werden kann.
Das Verfahren der Erfindung benötigt durch das
Zusammenwirken der zwei Arten von Linearkombinationen, bei welchen die für die Klassifizierung maßgebenden Grenzen der Ausgangsspannung jeder Linearkombination getrennt festgelegt werden, zur Klassifizierung von Schriftzeichen mit stark unterschiedlichen Merkmalen nur eine geringe Anzahl von Linearkombinationen, da durch die Eliminierung der Kontrastunterschiede die Anzahl der zur Identifizierung der Schriftzeichen erforderlichen Merkmale sehr stark eingeschränkt wird. Dementsprechend ist auch die Anzahl der Rasterpunkte gering. Durch die geringe Anzahl der Rasterpunkte kann die Fläche eines Rasterpunktes relativ groß gemacht werden. Da von jedem Rasterpunkt zur Bildung der Linearkombinationen nur eine Spannung abgeleitet wird, ist diese Spannung ein Maß für den Mittelwert der Schwärzung eines Rasterpunktes. Es können daher innerhalb der Fläche eines Rasterpunktes große SchwärzungsunterscKiede, z.B. Konturenunterbrechungen, vorhanden sein. Dadurch lassen sich auch Schriftzeichen klassifizieren, deren Schriftzug unterbrochen ist oder sogar nur aus einzelnen unζusammenhängenden Punkten verschiedener Schwärzungen besteht, wie es praktisch bei Schriftzeichen
709845/ÖU7
der Fall ist, welche mit Mosaikdruckern gedruckt sind. Das folgende Beispiel soll dies näher veranschaulichen.
Beispiel 2
Es ist der in Fig. 2c dargestellte, nur aus
Punkten mit verschiedenen Schwärzungen und ungleichem Abstand bestehende Repräsentant als Ziffer 3 zu klassifizieren. Hierzu werden unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens der Klasse 3 und der in der Spalte "zweite Spannungsart" der Tabelle 1 genannten - den Rasterpunkt-Differenzspannungen U'1, U'2, U'3, U'6f U'8, ϋ'9, U112, U113, U114, U115 entsprechenden - Anteile der Summen-Rasterpunktdifferenzspannung' US1 die Linearkombinationen 1 ... 7 der ersten Art gemäß der Tabelle 2 gebildet.
709845/045?
Tabelle 2
Widerstands- Netzwerke Nr.
1 2
3 4 5 6 7
Linearkombinationen der ersten Art
erste Spannungsart
|U'6+U'9+U'12 |U'1+U'2+U'3 |U'13+U'14+U'15 IU'8
|U'3+U'15 |υ·1+υ'8+υ·13
zv/ei te
Spannungsart
-0,32 US1I -0,28 US1I -0,28 US1I -0,10 US1I 14 -0,40 US1I -0,22 US'I -0,24 US1I
Linearkombinationen der zweiten Art
UM+U'5
U1ICH-U'11 U'7
Grenzen der Ausgangsspannung
<O,O96 US1 <O,O84 US1 <O,O84 US' <0,030 US1 <0,120 US' <O,O66 US' <O,O72 US'
<0,01 US' <0,01 US1 <0,03 US'
Die Auswahl der Rasterpunkte zur Bildung der
Linearkombinationen der ersten Art erfolgt unter Zugrundelegung des Standard-Schriftzeichens der Fig. 2a und unter Berücksichtigung der Merkmale der Mosaikschrift, nämlich daß die Schwärzung und die Lage der einzelnen Punkte verschieden sind, wie in Fig. 2c dargestellt. Zur Bildung jeweils einer Linearkombination der ersten Art werden nicht nur einzelne Rasterpunkt-Differenzspannungen sondern in der Mehrzahl mehrere Rasterpunkt-Differenzspannungen verwendet, um eine Mittelwertsbildung der Schwärzungen von möglichst vielen Rasterpunkten zu erhalten. Hierdurch v/erden Unterschiede der Lage und der Schwärzung der einzelnen Punkte des Mosaikschriftzeichens so weit ausgeglichen,
709845/0457
daß die Ausgangsspannungen der gleichen Linearkombinationen, welche unter Zugrundelegung des Repräsentanten nach Fig. 2c gebildet werden, innerhalb der für die Klassifizierung maßgebenden Grenzen liegen.
Die Linearkombinationen 8, 9, 10 der zweiten
Art für das Standard-Schriftzeichen gemäß Fig. 2a und den Repräsentanten gemäß Fig. 2c werden in analoger Weise gebildet.
Wie sich durch Einsetzen der Schwärzungswerte der einzelnen Rasterpunkte der Fig. 2c, anstelle der aus den Rasterpunkten abgeleiteten Rasterpunkt-Differenzspannungen, in die Linearkombinationen der Tabelle 2 ermitteln läßt, werden durch den in Fig. 2c dargestellten Repräsentanten der Ziffer 3, welcher nur aus unzusammenhängenden Punkten verschiedener Schwärzung und abweichender Lage besteht, die für die zu identifizierende Klasse maßgebenden Grenzen, innerhalb welcher die Ausgangsspannungen der Linearkombinationen bei Vorlage der zu identifizierenden Schriftzeichen liegen müssen, nicht überschritten. Selbstverständlich gilt dies auch für Repräsentanten, deren Merkmale den Merkmalen des in Fig. 2a dargestellten Standard-Schriftzeichens oder des in Fig. 2b dargestellten Repräsentanten gleich oder ähnlich sind. Andererseits werden durch Repräsentanten anderer Ziffern-Schriftzeichenklassen von den in den Linearkombinationen der Tabelle 2 angegebenen Bedingungen jeweils nur etwa die Hälfte erfüllt. Dies bedeutet eine große Trennsicherheit gegenüber anderen Schriftzeichenklassen, da bereits eine einzige nicht erfüllte Bedingung einer Linearkombination ver-* hindert, daß Repräsentanten anderer konkurrierender Ziffern-Schriftzeichenklassen als Ziffer 3 identifiziert werden.
Eine Schaltung zur Realisierung der Linearkombinationen durch Widerstandsnetzwerke und zur Feststellung der
7Ö98A5/Ö45?
Grenzen der Ausgangsspannungen der Tabelle 2 zeigt die Fig. 3. Entsprechend den zwei Arten von Linearkombinationen besteht die Schaltung aus zwei Arten von Widerstandsnetzwerken. Diese sind mit N1 und N2 bezeichnet. Zur Klassifizierung des in Fig. 2c dargestellten Repräsentanten sind von der ersten Art die Widerstandsnetzwerke NI1, NI2, Ni3, Ni4, NI5, Nig, H1? und von der zweiten Art die Widerstandsnetzwerke N2.., N2?, N2, erforderlich.
Die Widerstandsnetzwerke bestehen aus den Widerständen R1, R2 ... R31, welche entsprechend der Art der Widerstandsnetzwerke in Brückenschaltung geschaltet sind und denen die Rasterpunkt-Differenzspannungen +U'1, +U'2 ... +U'15 und die jeweiligen Anteile der Summen-Rasterpunktdifferenzspannung -US1 zugeführt werden. Zu den Widerstandsnetzwerken gehören noch die integrierten Schaltkreise IC1 ... IC10 mit den Widerständen R32 ... R41. Mit IC1 ... IC1O werden die Ausgangsspannungen der Widerstandsnetzwerke verstärkt. Mit den Widerständen R32 ... R41 kann die Verstärkung eines jeden IC und somit die Ausgangsspannung eines jeden Widerstandsnetzwerkes so eingestellt werden, daß die für die zu identifizierende Klasse maßgebenden Grenzen für jedes Widerstandsnetzwerk dieselben sind, wodurch für die Widerstandsnetzwerke einer Schriftzeichenklasse nur eine Vergleichsspannung erforderlich ist.
Die Vergleichsschaltungen zur Feststellung, ob
die positiven oder negativen Ausgangsspannungen der Widerstandsnetzwerke innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen, bestehen aus IC11 und IC12 und der Logik L. Die IC11 und IC12 sind Grenzwertschalter, denen als Vergleichsspannung die Summen-Rasterpunktdifferenzspannung zugeführt wird und die feststellen, ob die positiven und negativen Ausgangsspannungen der Widerstandsnetzwerke innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen. Die Dioden D1 ... D17 dienen zur Entkopplung, und es wird jeweils nur die größte Ausgangsspannung den Vergleichsschaltungen zugeführt. 709845/0457
Zur Klassifizierung von Schriftzeichen der beschriebenen Art genügt die Unterteilung des Schriftfeldes in eine relativ geringe Anzahl von Rasterpunkten, z.B. in 15 Rasterpunkte, wie die Ausführungsbeispiele zeigen. Voraussetzung für diese relativ geringe Anzahl von Rasterpunkten ist, daß alle Schriftzeichenmerkmale zur Bildung der Linearkombinationen herangezogen werden. Dies ist der Fall, wenn die Abtastung des Schriftfeldes lückenlos erfolgt und somit keine Schriftzeicheninformationen verloren gehen.
Da eine lückenlose Abtastung wegen der technischen Gegebenheiten der photoelektrischen Wandler nur unter Verwendung von zusätzlichen optischen Vorrichtungen möglich ist, hat man bei vielen Abtastvorrichtungen das Schriftfeld in eine große Anzahl von z.B. einigen Hundert Rasterpunkten unterteilt, wodurch eine ebenso große Anzahl von photoelektrischen Wandlern erforderlich ist. Auch für diesen Fall läßt sich das vorliegende Verfahren vorteilhaft anwenden, indem man, ausgehend von einer Unterteilung des Schriftfeldes in eine geringe Anzahl von gedachten Rasterpunkten, z.B. 15 Rasterpunkte gemäß Fig. 2, die Linearkombinationen ermittelt und von jedem Rasterpunkt des ursprünglichen Schriftfeldes mit der großen Anzahl von Rasterpunkten die Rasterpunkt-Differenzspannung ableitet, diese Rasterpunkt-Differenzspannungen entsprechend der Unterteilung des Schriftfeldes in die geringe Anzahl von Rasterpunkten zusammen^ faßt und mit diesen zusammengefaßten Rasterpunkt-Differenzspannungen feststellt, ob die Ausgangsspannungen der Linearkombinationen innerhalb der für die Klassifizierung maßgebenden Grenzen liegen.
709845/0^57
Leerseite

Claims (4)

29. April 1976 K 892/76 Patentansprüche /1.)Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Differenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegt, dadurch gekennzeichnet, daß man unter Zugrundelegung eines Schriftfeldes, das in mindestens 9 und höchstens 60 gedachte Rasterpunkte unterteilt ist,
1) für das Standard-Schriftzeichen der zu identifizierenden Klasse die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
2) aus diesen Spannungen zwei Arten von Linearkombinationen bildet, wobei
a) die Linearkombinationen der ersten Art als Differenz aus jeweils zwei Spannungsarten gebildet werden, von denen die erste Spannungsart für jeweils eine Linearkombination
709845/0457
A) aus nur einer Rasterpunkt-Differenzspannung besteht, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2 %, vorzugsweise mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %, vorzugsweise mindestens 2 %, der Summen-Rasterpunktdifferenzspannung beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 %, vorzugsweise mindestens 10 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4. %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenz spannung beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet wird, daß sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat, und
b) die Linearkombinationen der zweiten Art aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes höchstens 3 %, vorzugsweise höchstens 2 %, der Summen-Rasterpunktdifferenzspannung beträgt,
3) für das zu klassifizierende Schriftzeichen die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
4) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und
5) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als + 30 % vom Wert der zweiten Spannungsart abweicht, und
709845/0457
b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen gemäß Abschnitt 2b die Linearkombinationen der zweiten Art gebildet worden sind.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die erste Spannungsart für jeweils eine Linearkombination der ersten Art aus mehreren Rasterpunkt-Differenzspannungen bildet, deren Gesamtwert höchstens 60 % der Summen-Rasterpunktdifferenzspannung beträgt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn-
zeichnet, daß man für jede Schriftzeichenklasse mindestens so viele Linearkombinationen, wie 60 % der Anzahl der Rasterpunkte entspricht, und höchstens so viela Linearkombinationen, wie Rasterpunkte vorhanden sind, bildet.
4. Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, daß man die zweite Spannungsart für jeweils eine Linearkombination der ersten Art nicht aus der Summen-Rasterpunktdifferenzspannung sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen bildet, deren Gesamtwert denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat.
709845/0457
DE19762619245 1976-04-30 1976-04-30 Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen Withdrawn DE2619245A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE19762619245 DE2619245A1 (de) 1976-04-30 1976-04-30 Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen
CH496477A CH617026A5 (de) 1976-04-30 1977-04-21
US05/789,365 US4134021A (en) 1976-04-30 1977-04-21 Method of classifying characters having characteristics that differ greatly from standard characters
FR7713247A FR2349893A1 (fr) 1976-04-30 1977-05-02 Procede pour la classification de signes d'ecriture de caracteristiques fortement differentes des signes d'ecriture standard

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19762619245 DE2619245A1 (de) 1976-04-30 1976-04-30 Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen

Publications (1)

Publication Number Publication Date
DE2619245A1 true DE2619245A1 (de) 1977-11-10

Family

ID=5976819

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762619245 Withdrawn DE2619245A1 (de) 1976-04-30 1976-04-30 Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen

Country Status (4)

Country Link
US (1) US4134021A (de)
CH (1) CH617026A5 (de)
DE (1) DE2619245A1 (de)
FR (1) FR2349893A1 (de)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5911152B2 (ja) * 1976-10-19 1984-03-13 肇産業株式会社 パタ−ンマツチング方法及びその実施装置
US4290049A (en) * 1979-09-10 1981-09-15 Environmental Research Institute Of Michigan Dynamic data correction generator for an image analyzer system
US4464788A (en) * 1979-09-10 1984-08-07 Environmental Research Institute Of Michigan Dynamic data correction generator for an image analyzer system
US4490850A (en) * 1981-12-17 1984-12-25 Ncr Corporation Matrix character recognition
US4616333A (en) * 1984-06-05 1986-10-07 Elscint, Ltd. Data correlation system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3432673A (en) * 1967-10-06 1969-03-11 Control Data Corp Line tracking reading machine having means to positionally normalize the character-video signals
DE1811420B2 (de) * 1968-11-28 1974-05-30 Matth. Hohner Ag, 7218 Trossingen Schaltung zur Klassifizierung von Repräsentanten mit stark unterschiedlichen Merkmalen
DE2026033C3 (de) * 1970-05-27 1979-05-03 Matth. Hohner Ag, 7218 Trossingen Rasterverfahren zur Klassifizierung von Schriftzeichen

Also Published As

Publication number Publication date
FR2349893A1 (fr) 1977-11-25
US4134021A (en) 1979-01-09
CH617026A5 (de) 1980-04-30
FR2349893B1 (de) 1984-01-27

Similar Documents

Publication Publication Date Title
DE2164765C2 (de) Einrichtung zur Erkennung von Schriftzeichensymbolen
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE69433395T2 (de) Sicherheitsdokument mit variierender Tönung
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE2657631A1 (de) Verfahren zur codierten darstellung einer information, insbesondere von chinesischen zeichen
EP0654778A1 (de) Verfahren zur Textdarstellung auf Bildschirmgeräten
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE2619245A1 (de) Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen
DE2635224C2 (de) Schaltanordnung zur Bildung eines einzelnen Ausgangssignals in Abhängigkeit einer Mehrzahl von zugeführten Meßsignalen
DE3417407C2 (de) Kreisgenerator für eine graphische Anzeigeeinheit
DE3836789A1 (de) Vorrichtung zur erzeugung von helligkeitsstufen auf einem anzeigeschirm
DE1524409B2 (de) Zeichenerkennungsgeraet
DE2026033C3 (de) Rasterverfahren zur Klassifizierung von Schriftzeichen
DE1811420C3 (de)
DE19716445A1 (de) Verfahren zur Verbreiterung von Zeichen
DE1524344A1 (de) Schriftzeichenableseeinrichtung
DE2020013C3 (de) Verfahren zum Übertragen von Markierungen eines Formulars auf einen Datenträger
EP1606763B1 (de) Verfahren und einrichtung zum verarbeiten der farbinformation einer mit st rzeichen und nutzzeichen versehenen vorlage
DE1922373A1 (de) Bezugsspannungsgenerator fuer einen opto-elektrischen Zeichenabtaster
EP0760144B1 (de) Verfahren zur verbesserung der erkennung von maschinenschriften mit fester schriftteilung
WO2021074203A1 (de) &#34;signaturschein für handschriftliche unterschrift&#34;
DE2461837C2 (de) Digitale Anzeigevorrichtung mit einer Punktmatrix
DE1214451B (de) Einrichtung zur Abtastung von optisch feststellbaren Markierungen
DE1524409C (de) Zeichenerkennungsgerat
DE1549691A1 (de) System zur automatischen Erkennung von Schriftzeichen

Legal Events

Date Code Title Description
8110 Request for examination paragraph 44
8130 Withdrawal