DE2619245A1 - Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen - Google Patents
Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalenInfo
- Publication number
- DE2619245A1 DE2619245A1 DE19762619245 DE2619245A DE2619245A1 DE 2619245 A1 DE2619245 A1 DE 2619245A1 DE 19762619245 DE19762619245 DE 19762619245 DE 2619245 A DE2619245 A DE 2619245A DE 2619245 A1 DE2619245 A1 DE 2619245A1
- Authority
- DE
- Germany
- Prior art keywords
- voltage
- grid point
- voltages
- type
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/195—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references using a resistor matrix
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Input (AREA)
Description
SiBt QBDBENZELLyMONCHEK
Mozartstraße 9
29. April 19 76
K 892/76
Transitus Establishment, Vaduz, Liechtenstein
Verfahren zur Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen
stark unterschiedlichen Merkmalen
Die Erfindung betrifft ein Verfahren zur Klassifizierung
von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf
einem in gedachte Rasterpunkte unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt
eine Rasterpunktspannung und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung
erzeugt wird, jede Rasterpunktspannung jeweils von der Bezugsspannung
subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird, diese Rasterpunkt-Differenzspannungen
durch Bildung von Linearkombinationen zu Ausgangsspannungen verarbeitet werden, und durch Vergleich der
Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen
durch Summation erzeugten Summen-Rasterpunktdifferenzspannung
festgestellt wird, ob die Ausgangsspannung einer jeden Linearkombination
innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegt.
709845/0457
Die Darstellung der Schriftzeichen auf dem in gedachte
Rasterpunkte unterteilten Schriftfeld erfolgt in der Regel als Schwärzung auf hellem Untergrund. Nachstehend sind unter
"Schwärzung auf hellem Untergrund" aber sinngemäß auch andere
Darstellungen der Schriftzeichen, wie helle Schriftzeichen auf dunklem Untergrund oder Schriftzeichen auf lichtdurchlässigem
Untergrund, z.B. Film, zu verstehen.
Bei der maschinellen Klassifizierung von Schriftzeichen sind in der Regel keine Standard-Schriftzeichen mit gleicher
Form, gleicher Strichstärke und gleicher Schwärzung zu identifizieren, sondern Schriftzeichen, die auf unterschiedlichem Untergrund
von Schnelldruckern, Schreibmaschinen oder Mosaikdruckern ausgedruckt oder mit der Hand mit unterschiedlichem Schreibgerät
geschrieben sind, also Schriftzeichen, die sich in Form, Strichstärke
und Schwärzung von den Standard-Schriftzeichen erheblich unterscheiden können und deren Merkmale beträchtlich schwanken.
Große Schwankungen der Merkmale ergeben sich durch Kontrastunterschiede.
Kontrastunterschiede können auftreten, wenn die Schwärzung der Repräsentanten einer Schriftzeichenklasse gleich
bleibt, sich jedoch die Helligkeit oder Farbe des Untergrundes ändert, oder wenn bei gleichbleibender Helligkeit oder Farbe des
Untergrundes sich die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändert, oder wenn sich sowohl die Helligkeit oder
Farbe des Untergrundes als auch die Schwärzung der Repräsentanten einer Schriftzeichenklasse ändern.
Auch der Schriftzug eines einzelnen Schriftzeichens kann Kontrastunterschiede aufweisen. So kann bei Schriftzeichen,
welche von Schreibmaschinen oder Schnelldruckern gedruckt sind,
z.B. der obere oder der rechte Bereich stärker oder schwächer geschwärzt sein als der untere oder der linke Bereich. Besonders
große Kontrastunterschiede innerhalb eines einzelnen Schrift-
709845/0457
zeichens sind bei den Mosaikschriften vorhanden, deren Schriftzug nur aus Punkten besteht, welche sich berühren oder auch einen
Abstand bis zum zweifachen Durchmesser eines Punktes haben können, v;odurch der Schriftzug sogar mehrfach unterbrochen ist. Auch kann
die Schwärzung der einzelnen Punkte verschieden sein.
Zur Klassifizierung von Schriftzeichen werden bei
den Verfahren und Schaltungen, welche von einer rasterförmigen Abtastung
des Schriftfeldes ausgehen, die aus den Rasterpunkten abgeleiteten Spannungen miteinander kombiniert. Hierzu haben sich
bei dem heutigen Stand der Technik lineare Funktionselemente als zweckmäßig erwiesen, insbesondere lineare Widerstandsnetzwerke,
in welchen die aus den Rasterpunkten abgeleiteten Spannungen analog verarbeitet werden, oder Rechner mit den Grundrechnungsarten
Addition und Multiplikation, welche die aus den Rasterpunkten abgeleiteten Spannungen - nach erfolgter Digitalisierung - digital
verarbeiten. Beide Verarbeitungsmöglichkeiten werden nachstehend als "Bildung von Linearkombinationen" bezeichnet. Im Prinzip speichert
jede Linearkombination Merkmale von-Standard-Schriftzeichen
und vergleicht diese mit den entsprechenden Merkmalen der zu klassifizierenden Schriftzeichen.
Bei einigen bekannten Verfahren und Schaltungen (z.B. die USA-Patentschrift 3 271 576 oder "Internationale Elektronische
Rundschau" 1968, Seiten 19- 21) müßten für die Klassifizierung von Schriftzeichen mit von Standard-Schriftzeichen stark unterschiedlichen
Merkmalen in den Linearkombinationen die Merkmale sämtlicher in Betracht kommenden Repräsentanten unterschiedlicher
Ausführungsformen der zu klassifizierenden Schriftzeichen gespeichert
werden. Bei Vorlage eines unbekannten Schriftzeichens müßten
dann alle gespeicherten Werte der Merkmale der verschiedenen Repräsentanten sämtlicher Klassen mit den Merkmalen des unbekannten
Schriftzeichens verglichen werden. Für die Klassifizierung von Schriftzeichen mit stark schwankenden Merkmalen wären bis zu
etwa 1000 Linearkombinationen pro Klasse erforderlich.
70984 5/0457
Es ist auch bekannt, um diesen untragbaren Aufwand zu verringern, in den Linearkonibinationen anstelle der Merkmale
einzelner Repräsentanten die Merkmale von Gruppen von Repräsentanten zu speichern, deren Merkmale Abweichungen nur innerhalb
bestimmter Grenzen aufweisen. Diese Grenzen müssen jedoch eng bemessen sein, da anderenfalls die Trennsipherheit gegenüber anderen
Klassen stark abnimmt, so daß immer noch sehr viele Linearkombinationen erforderlich sind und der technische Aufwand noch
recht groß ist.
Letzteres gilt auch für Verfahren, die von der sogenannten Optimierung Gebrauch machen. Hierbei geht man davon aus,
daß es bei den verschiedenen Repräsentanten einer Schriftzeichenklasse Rasterpunkte gibt, die immer weiß sind, und solche, die immer
schwarz sind, und verwendet für die Bildung von Linearkombinationen nur diese. Rasterpunkte, die für die verschiedenen Repräsentanten
einer Klasse einmal schwarz und einmal weiß sind, werden für die Bildung von Linearkombinationen nicht verwendet.
Durch die Weglassung dieser Rasterpunkte verschenkt man jedoch für die Erkennung wichtige Merkmale. Die Anzahl der Linearkombinationen
wird zwar vermindert, andererseits entsteht für die Optimierung zusätzlicher technischer Aufwand. Außerdem wird die
Trennsicherheit gegenüber Schriftzeichen anderer Klassen wesentlich vermindert.
Weiterhin sind Verfahren und Schaltungen bekannt, welche mit einer wesentlich geringeren Anzahl von Linearkombinationen
auskommen. Gemäß der deutschen Patentschrift 18 11 420
wird dies durch Widerstandsnetzwerke erreicht, bei welchen die zur Bildung der Linearkombinationen vorgesehenen Widerstände tür
jede Klasse nach Maßgabe einer Bestimmung der Eigenvektoren der Kovarianzmatrix der Merkmale bemessen sind. Diese Methode der
Bemessung der Widerstände zur Bildung von Linearkombinationen setzt zwar die Anzahl der Linearkombinationen bzw. der Widerstandsnetzwerke
im Vergleich zu den erstgenannten Verfahren und
709845/0457
Schaltungen um ein Vielfaches herab, berücksichtigt aber nicht Repräsentanten von Schriftzeichen konkurrierender Klassen, wodurch
die Trennsicherheit gegen Schriftzeichen konkurrierender
Klassen, insbesondere bei Klassifizierung von Schriftzeichen
mit stark unterschiedlichem Kontrast, nicht ausreichend ist. Ferner müssen die aus allen Rasterpunkten abgeleiteten und den
Widerstandsnetzwerken zugeführten Spannungen notwendigerweise sowohl positive als auch negative Polarität haben, wodurch ein
beträchtlicher technischer Aufwand entsteht.
Dies gilt auch für das Verfahren der deutschen Offenlegungsschrift
20 26 033, d.h, alle aus den Rasterpunkten abgeleiteten Spannungen müssen sowohl positive als auch negative
Polarität haben. Bei diesem Verfahren werden in den Widerstandsnetzwerken einer Klasse die Spannungen aus solchen Rasterpunkten
miteinander kombiniert, welche zusammengefaßt drei Arten charakteristischer Formteile von Schriftzeichen dieser Klasse
entsprechen. Die dadurch gebildeten Linearkombinationen erlauben nur eine Klassifizierung von Schriftzeichen mit geringen
Kontrastunterschieden.
Ein gemeinsamer Nachteil aller genannten Verfahren und Schaltungen ist demnach, daß deren Linearkombinationen bei
erträglichem technischen Aufwand nicht geeignet sind, Schriftzeichen mit starken Kontrastunterschieden und dadurch bedingten
Formverfälschungen und Unterbrechungen des Schriftzuges mit hinreichender Trennsicherheit zu klassifizieren. Hierzu wäre
es bei den bekannten Verfahren und Schaltungen erforderlich, die Anzahl der Linearkombinationen wesentlich zu vergrößern,
was den technischen Aufwand erhöhen würde.
Zur Verminderung des Einflusses von Kontrastunterschieden auf die "Klassifizierung von Schriftzeichen sind mehrere
Verfahren und Schaltungen bekannt. Gemäß der deutschen Patent-
709845/0457
schrift 18 11 420 wird den Widerstandsnetzwerken, die die Linearkombinationen
realisieren, eine zusätzliche Spannung zugeführt, wodurch die Ausgangsspannungen der Widerstandsnetzwerke
bei Vorliegen eines Repräsentanten der zu identifizierenden Klasse nahe bei Null liegen. Diese zusätzliche Spannung wird
von allen Rasterpunkten abgeleitet. Da sich mit einer gemeinsamen Änderung der aus den Rasterpunkten abgeleiteten und den
Widerstandsnetzwerken einzeln zugeführten Spannungen, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung
vorgelegten Schriftzeichen, auch die zusätzliche Spannung ändert, tritt eine Kompensationswirkung ein.
Gemäß der deutschen Offenlegungsschrift 20 26 033 wird die Ausgangsspannung eines jeden Widerstandsnetzwerkes
mit einer Spannung verglichen, die proportional der Summe aller aus den Rasterpunkten abgeleiteten Spannungen ist, um festzustellen,
ob die Ausgangsspannungen innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen. Bei Änderungen
der Ausgangsspannungen der Widerstandsnetzwerke, z.B. durch Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten
Schriftzeichen, ändert sich auch die Vergleichsspannung, wodurch der Einfluß von Kontraständerungen vermindert wird.
Durch diese Maßnahmen, im ersten Falle die Zuführung einer zusätzlichen von allen Rasterpunkten abgeleiteten Spannung
in die Widerstandsnetzwerke und im zweiten Falle die Verwendung einer ebenfalls aus allen Rasterpunkten abgeleiteten
Vergleichsspannung, kann der Einfluß von Kontrastunterschieden nur in beschränktem Maße vermindert werden, da der von einem
Schriftzeichen geschwärzte Anteil des Schriftfeldes nur einen Bruchteil seiner Gesamtfläche ausmacht (ca. 15 bis 35 %), die
zusätzliche Spannung bzw. die Vergleichsspannung somit in überwiegendem Maße von den nicht geschwärzten Bereichen des Schriftfeldes
bestimmt wird, und daher bei einer Änderung des Schwärzungsgrades der zur Klassifizierung vorgelegten Schriftzeichen
709845/0457
sich die zusätzliche Spannung bzw. die Vergleichsspannung wesentlich
weniger ändert als der Schwärzungsgrad.
Es ist auch ein Verfahren zur Verringerung des Einflusses
von Unterschieden des Kontrastes und der Untergrundhelligkeit bekannt (deutsche Auslegeschrift 20 44 795), bei
welchem aus einer von nicht durch Schriftzeichen geschwärzten Stellendes Untergrundes abgeleiteten Bezugsspannung und den
aus den Rasterpunkten abgeleiteten Spannungen für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung gebildet wird und
diese Rasterpunkt-Differenzspannungen sowohl einzeln als auch als Summe anstelle der aus den Rasterpunkten direkt abgeleiteten
Spannungen Widerstandsnetzwerken zugeführt werden und die Vergleichsspannung aus der Summe aller Rasterpunkt-Differenzspannungen
gebildet wird. Dieses Verfahren gibt zwar eine Möglichkeit an, den Einfluß von Unterschieden des Kontrastes
und der üntergrundhelligkeit bei vorgegebenen Widerstandsnetzwerken zu vermindern, macht jedoch weder eine Aussage über die
Art und Bemessung der zur Klassifizierung von Schriftzeichen erforderlichen Widerstandsnetzwerke bzw. Linearkombinationen
noch Angaben über die Größe der Vergleichsspannungen, durch welche festgestellt wird, ob die Ausgangsspannungen der Linearkombinationen
innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen.
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur maschinellen Klassifizierung von Schriftzeichen mit
von Standard-Schriftzeichen stark unterschiedlichen Merkmalen zu schaffen, das mit einem wesentlich geringeren technischen
Aufwand als die bisher bekannten Verfahren auskommt, insbesondere mit weniger und einfacheren Linearkombinationen, denen
nur Spannungen einer Polarität zugeführt werden müssen, eine große Sicherheit gegenüber Schriftzeichen anderer Klassen
gewährleistet und unempfindlich gegenüber Kontraständerungen
709845/0457
jeglicher Art ist, nämlich unempfindlich gegenüber Unterschieden der Helligkeit des Untergrundes, der Schwärzung der zu
klassifizierenden Schriftzeichen und der Schwärzung innerhalb eines Schriftzeichens.
Zur Lösung dieser Aufgabe ist Gegenstand der Erfindung ein Verfahren zur Klassifizierung von Schriftzeichen mit
von Standard-Schriftzeichen stark unterschiedlichen Merkmalen, bei dem die Schriftzeichen auf einem in gedachte Rasterpunkte
unterteilten Schriftfeld abgebildet werden, mittels photoelektrischen Wandlern aus jedem Rasterpunkt eine Rasterpunktspannung
und an einer Stelle des Untergrundes, wo sich kein Schriftzeichen befindet, eine Bezugsspannung erzeugt wird,
jede Rasterpunktspannung jeweils von der Bezugsspannung subtrahiert wird und hierdurch für jeden Rasterpunkt eine Rasterpunkt-Differenzspannung
gebildet wird, diese Rasterpunkt-Differenzspannungen durch Bildung von Linearkombinationen zu Ausgangsspannungen
verarbeitet werden, und durch Vergleich der Ausgangsspannungen mit einer aus den Rasterpunkt-Differenzspannungen
durch Summation erzeugten Summen-Rasterpunktdifferenzspannung festgestellt wird, ob die Ausgangsspannung einer
jeden Linearkombination innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegt, welches erfindungsgemäß dadurch gekennzeichnet ist, daß man
unter Zugrundelegung eines Schriftfeldes, das in mindestens 9 und höchstens 60 gedachte Rasterpunkte unterteilt ist,
1) für das Standard-Schriftzeichen der zu identifizierenden
die.
Klasse die Rasterpunkt-Differenzspannungen und'Summen-Rasterpunktdifferenzspannung
ermittelt,
2) aus diesen Spannungen zwei Arten von Linearkombinationen bildet, wobei
a) die Linearkombinationen der ersten Art als Differenz aus jeweils zwei Spannungsarten gebildet werden, von denen
die erste Spannungsart für jeweils eine Linearkombination
709845/0457
-η-
A) aus nur einer Rasterpunkt-Differenzspanhung besteht,
deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2 %f vorzugsweise
mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %,
vorzugsweise mindestens 2 %, der Summen-Rasterpunktdifferenzspannung
beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte
unterteilten Schriftfeldes mindestens 7 %, vorzugsvrt'.ise
mindestens 10 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens
4 %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenzspannung
beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination
aus der Summen-Rasterpunktdifferenzspannung so gebildet wird, daß sie denselben Betrag aber entgegengesetzte
Polarität wie die erste Spannungsart hat, und b) die Linearkombinationen der zweiten Art aus einer oder
mehreren Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte
unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte
unterteilten Schriftfeldes höchstens 3,0 %, vorzugsweise höchstens 2,0 %, der Summen-Rasterpunktdifferenzspannung
beträgt,
3) für das zu klassifizierende Schriftzeichen die Rasterpunkt-Differenzspannungen
und die Summen-Rasterpunktdifferenzspannung ermittelt,
4) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und
5) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten
Art um nicht mehr als ± 30 % vom Wert der zweiten Spannungsart abweicht, und
709845/0457
4Il
b) ob die Ausgangsspannung jeder Linearkombination der zweiten
Art unter 1 % des Wertes der Suiranen-Rasterpunktdifferenzspannung
liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung
bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus
denen gemäß Abschnitt 2b die Linearkombinationen der zweiten Art gebildet worden sind.
Zur Bildung der Linearkombinationen können sowohl einzelne als auch mehrere Rasterpunkt-Differenzspannungen herangezogen
werden. Für die Klassifizierung von Schriftzeichen mit geringen Unterschieden der Schwärzung innerhalb des Schriftzeichens
und wenig unterschiedlicher Form jedoch stark unterschiedlichem Kontrast, bezogen auf das Standard-Schriftzeichen,
kann die erste Spannungsart jeweils einer Linearkombination der ersten Art aus nur einer einzigen Rasterpunkt-Differenzspannung
bestehen, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 2 %, vorzugsweise mindestens
3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 1,5 %, vorzugsweise mindestens
2 %, der Summen-Rasterpunktdifferenzspannung beträgt.
Weisen die zu klassifizierenden Schriftzeichen auch innerhalb des Schriftzeichens unterschiedliche Schwärzungen
und/oder stark unterschiedliche Form, bezogen auf das Standard-Schrift zeichen, auf, so wird die erste Spännungsart der Linearkombinationen
der ersten Art vorzugsweise aus mehreren Rasterpunkt-Differenzspannungen gebildet, deren Gesamtwert im Falle
eines in 9 bis 30 Rasterpunkte unterteilten Schriftfeldes mindestens 7 %, vorzugsweise mindestens 10 %, und im Falle eines
in 30 bis 60 Rasterpunkte unterteilten Schriftfeldes mindestens 4 %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenzspannung
beträgt. Dabei sollte der Gesamtwert in beiden Fällen höchstens 60 % der Summen-Rasterpunktdifferenzspannung
betragen.
709845/0457
Die Linearkombinationen der zweiten Art können entweder aus mehreren Rasterpunkt-Differenzspannungen gebildet
werden, oder nur aus einer Rasterpunkt-Differenzspannung bestehen. Der Gesamtwert muß im Falle eines in 9 bis 30 Rasterpunkte
unterteilten Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten
Schriftfeldes höchstens 3,0 %, vorzugsweise höchstens 2»,0 %,
der Summen-Rasterpunktdifferenzspannung betragen. Ob die Linearkombinationen
der zweiten Art aus nur einer oder aus mehreren Rasterpunkt-Differenzspannungen gebildet werden, hängt im wesentlichen
von den technischen Gegebenheiten bei der Durchführung des Verfahrens ab, z.B. von der Konstanz der Schriftfeldbeleuchtung,
den photoelektrischen Wandlern, den optischen Einrichtungen usw. Vorzugsweise bestehen die Linearkombinationen
der zweiten Art nur aus einer einzigen Rasterpunkt-Differenzspannung,
da in diesem Fall die technischen Gegebenheiten weniger Einfluß auf die Erkennungssicherheit haben als bei Bildung
der Linearkombinationen aus mehreren Rasterpunkt-Differenzspann-'ungen.
Im letzteren Fall ist jedoch die Anzahl der Linearkombinationen kleiner, was auch oft von praktischer Bedeutung
ist.
Zur Feststellung, ob die Abweichungen der Merkmale der zu identifizierenden Schriftzeichen von den in den Linearkombinationen
gespeicherten Merkmalen des Standard-Schriftzeichens innerhalb der für die Klassifizierung maßgebenden Grenzen
liegen, wird die Ausgangsspannung einer jeden Linearkombination
herangezogen und geprüft, (a) ob die Ausgangsspannung jeder Linearkombination der ersten Art um nicht mehr als ί 30 % vom
Wert der zweiten Spannungsart abweicht, und (b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des
Wertes der Summen-Rasterpunktdifferenzspannung liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung bezogenen
Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen die Linearkombination' der zweiten Art gebildet
worden sind (siehe hierzu das spätere Beispiel 1).
709845/CK57
Die angegebenen Grenzen von + 30 % für die Ausgangsspannungen
der Linearkoitibinationen der ersten Art gewährleisten
eine ausreichende Trennsicherheit der zu identifizierenden Schriftzeichen gegenüber Schriftzeichen konkurrierender Klassen.
Wird eine über das übliche Maß hinausgehende Trennsicherheit gefordert oder sind Schriftzeichen zu identifizieren, die trotz
Zugehörigkeit zu verschiedenen Klassen nur wenig voneinander verschieden sind, wie es z.B. bei handschriftlich geschriebenen
Schriftzeichen der Fall sein kann, so können die Grenzen der Ausgangsspannungen
eingeengt werden, z.B. von + 30 % auf + 20 %.
Es werden grundsätzlich nicht mehr Linearkombinationen gebildet, wie Rasterpunkte vorhanden sind, da sonst die
über die Anzahl der Rasterpunkte hinausgehenden Linearkombinationen von bereits gebildeten Linearkombinationen abhängig sind. Jedoch
werden für schwieriger zu erkennende Schriftzeichen, z.B. den Buchstaben K, zweckmäßig so viele Linearkombinationen gebildet,
wie Rasterpunkte vorhanden sind. Dagegen sind für die Klassifizierung leicht zu erkennender Schriftzeichen, z.B. die Ziffer 1,
nicht alle möglichen Linearkombinationen erforderlich. Vorzugsweise
beträgt die Anzahl der Linearkombinationen für eine Schriftzeichenklasse mindestens 60 % der Anzahl der Rasterpunkte.
Es gibt Schriftzeichen, z.B. solche mit breiter
Strichstärke, bei denen die beschriebenen Bedingungen für die Bildung der Linearkombinationen der zweiten Art nicht erfüllbar
sind. Zur Identifizierung derartiger Schriftzeichen werden nur Linearkombinationen der ersten Art gebildet.
Bei den heutigen technischen Gegebenheiten erfolgt die Durchführung des Verfahrens der Erfindung vorzugsweise
entweder
in analoger Technik, indem die aus den Rasterpunkten und aus der Stelle des Untergrundes, wo sich kein Schriftzeichen be-
709845/0457
findet, abgeleiteten Spannungen Additionsschaltungen (zur Bildung der Rasterpunkt-Differenzspannungen und der Summen-Rasterpunktdifferenzspannung),
linearen Widerstandsnetzwerken (zur Bildung der Linearkoinbinationen) und Grenzwertschaltungen
(zum Vergleich der Ausgangsspannungen der Widerstandsnetzwerke mit der Vergleichsspannung) zugeführt werden, oder
in digitaler Technik, indem die analogen Spannungen in digitale Werte umgewandelt und diese entsprechend den Bedingungen
der Linearkombinationen in Digitalrechnern verarbeitet werden.
Das Verfahren der Erfindung wird nachstehend am
Beispiel der Klassifizierung von Repräsentanten der Ziffer 3 in
Verbindung mit den anliegenden Zeichnungen weiter erläutert. Es zeigen:
Fig. 1 ein Schriftfeld für die Klassifizierung von Schriftzeichen;
Fig. 2a bis 2c verschiedene Ausführungsformen der
Ziffer 3 im Schriftfeld der Fig. 1;
Fig. 3 eine Schaltung zur Durchführung des Verfahrens.
Gemäß Fig. 1 ist das Schriftfeld in die Rasterpunkte 1 ... 15 aufgeteilt und außerhalb des Schriftfeldes befindet
sich eine nie geschwärzte Stelle F. In ein derartiges Schriftfeld ist gemäß Fig. 2a ein Standard-Schriftzeichen der
Ziffer 3 mit der Soll-Schwärzung, der Soll-Strichbreite und der Soll-Form eingetragen. Gemäß Fig. 2b ist ein Repräsentant der
Ziffer 3 mit anderer Form und etwa halbem Schwärzungsgrad, bezogen auf das Standard-Schriftzeichen, dargestellt durch den gestrichelten
Schriftzug, eingetragen. Gemäß Fig. 2c ist ein aus Punkten bestehender Repräsentant der Ziffer 3, wie er praktisch
bei einer Mosaikschrift mit einer Matrix von 5x7 Punkten vorkommen
kann, eingetragen. Die Repräsentanten der Fig. 2b und 2c,
98A5/0AS7
welche gegenüber dem Standard-Schriftzeichen der Fig. 2a erhebliche
Unterschiede hinsichtlich Schwärzung, Strichbreiten, Form und Unterbrechungen des Schriftzuges aufweisen, sollen
nach dem Verfahren der Erfindung klassifiziert werden.
Hierzu werden in bekannter Weise, z.B. durch
Phototransistoren, aus jedem Rasterpunkt 1 ... 15 und aus der nie geschwärzten Stelle F elektrische Spannungen erzeugt, und
aus diesen z.B. durch Invertier- und Addierschaltungen folgende Spannungen gebildet:
a) aus den Rasterpunkten 1 ... 15 die zu den Helligkeitswerten dieser Rasterpunkte proportionalen Spannungen -U1, -U2 ... -U15;
b) aus der nie geschwärzten Stelle F die Spannung +UF;
c) durch Addition jeder der Spannungen -U1, -U2. ... -U15 zu der
Spannung +UF die den Schwärzungswerten der Rasterpunkte 1 ... 15 proportionalen Rasterpunkt-Differenzspannungen
+U'1, +U'2 ... +U115;
d) durch Addition der Spannungen +U'1, +U'2 ... +U115 die Summen-Rasterpunktdifferenzspannung
+US';
e) durch Invertierung der Spannung +US' die Summen-Rasterpunktdifferenzspannung
-US1.
Aus den so erzeugten Rasterpunkt-Differenzspannungen
+U'1, +U"2 ... +U115 und den Summen-Rasterpunktdifferenzspannungen
-US* und +US1 werden die Linearkombinationen und die
Grenzen für die Ausgangsspannungen der Linearkombinationen ermittelt. Dabei wird davon ausgegangen, daß bei nicht geschwärztem
Untergrund des Schriftfeldes jede aus den Rasterpunkten 1 ... 15 und aus der nicht durch Schriftzeichen geschwärzten Stelle F des
Untergrundes abgeleitete Spannung denselben Betrag hat.
709845/0467
- It -
Erfindungsgemäß können die erste Spannungsart
der Linearkoinbinationen der ersten Art und die Linearkombinationen
der zweiten Art aus nur einer einzigen Rasterpunkt-Differenzspannung
bestehen, wobei die Rasterpunkt-Differenzspannungen U'1, U'2 ... U'15 verwendet werden. Dies wird durch die in der
Tabelle 1 dargestellten Linearkoinbinationen zur Klassifizierung des in Fig. 2b dargestellten Repräsentanten der Ziffer 3 veranschaulicht,
welcher im Vergleich zu dem in Fig. 2a dargestellten Standard-Schriftzeichen sich durch geringere Schwärzung und andere
Form unterscheidet.
1 2 3 4 5 6 7 8 9 10
•1 | Tabelle 1 | |
'2 | ||
Linearkombinationen | '3 | der ersten Art |
erste | '6 | .zweite |
Spannungsart | ■8 | Spannungsart |
IU | '9 | -0,07 US1 |
IU | •12 | -0,10 US' |
IU | •13 | -0,11 US' |
IU | Ί4 | -0,10 US1 |
IU | •15 | -0,10 US' |
IU | -0,12 US' | |
IU | -0,10 US1 | |
IU | -0,07 US' | |
IU | -0,10 US' | |
Iu | -0,11 US1 | |
Grenzen der
Ausgangsspannung
Ausgangsspannung
<0,021 US1
<0,030 US1 <O,O33 US1
<0,030 US' <0,030 US' <O,O36 US'
<0,030 US' <0,021 US1 <0,030 US'
<O,O33 US1
(Fortsetzung Tabelle 1)
709845/04S7
1*
(Fortsetzung Tabelle 1)
Grenzen der
11 UM <O,O1 US'
12 U'5 <0,01 US1
13 U'10 <0,01 US1
14 U111 <0,01 US1
15 U'7 <0,03 US1
Da die aus den Rasterpunkten abgeleiteten Rasterpunkt-Differenzspannungen
proportional zu den Schwärzungswerten der Rasterpunkte sind, können die zur Bildung der Linearkombinationen
notwendigen Rasterpunkt-Differenzspannungen direkt aus den Schwärzungswerten der Rasterpunkte ermittelt werden. So
können die Linearkombinationen 1, 2 ... 10 der ersten Art unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens
der Ziffer 3 dadurch gebildet werden, daß man - durch Addition der durch das Standard-Schriftzeichen nach Fig. 2a geschwärzten
Flächen der einzelnen Rasterpunkte 1, 2, 3, 6, 8, 9, 12, 13, 14, 15- die gesamte geschwärzte Fläche dieser Rasterpunkte
und daraus anteilig die geschwärzte Fläche für jeden einzelnen dieser Rasterpunkte ermittelt. Beispielsweise beträgt
die geschwärzte Fläche des Rasterpunktes 1, aus welchem die Rasterpunkt-Differenzspannung U'1 der Linearkombination 1 der
Tabelle 1 gebildet wird, 7 % der durch diese Rasterpunkte insgesamt geschwärzten Fläche. Die aus dem Rasterpunkt 1 abgeleitete
Rasterpunkt-Differenzspannung U'1 der Linearkombination 1
hat somit einen Wert von 7 % der Summen-Rasterpunktdifferenzspannung -US1, d.h. -0,07 US'.
In analoger Weise ergeben sich die Linearkombinationen 11 ... 15 der zweiten Art für das Standard-Schriftzeichen
gemäß Fig. 2a und die Linearkombinationen 1 ... 15 für
709845/0457
den Repräsentanten gemäß Fig. 2b.
Die in der Spalte "Grenzen der Ausgangsspannung"
der Tabelle 1 angegebenen Werte geben als Anteile der zweiten Spannungsart für die Linearkombinationen der ersten Art die
für die zu identifizierende Klasse maßgebende Ausgangsspannung an, welche bis zu + 30 % vom Wert der zweiten Spannungsart betragen
kann. So muß z.B. bei der Linearkombination 1 die Ausgangsspannung kleiner als 0,07 · (30/100) · US1 = 0,021 US1 sein,
damit eine Klassifizierung des vorgelegten Schriftzeichens in die Klasse 3 erfolgen kann.
Die für eine Klassifizierung des vorgelegten Repräsentanten nach Fig. 2b in die Klasse 3 maßgebenden Ausgangsspannungen
der Linearkombinationen 11, 12, 13, 14 der zweiten Art liegen unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung
US*. Diese Ausgangsspannungen, welche mit den Rasterpunkt-Differenzspannungen
U14, U'5, U'10, U'11 identisch sind,
haben theoretisch den Wert Null, da diese Rasterpunkt-Differenzspannungen
aus nicht geschwärzten Rasterpunkten abgeleitet sind, jedoch ist die Grenze dieser Ausgangsspannungen wegen den technischen
Gegebenheiten auf 1 % der Summenr-Rasterpunktdifferenzspannung
US1 festgelegt. Die Grenze der Ausgangsspannung der Linearkombination 15 beträgt 3 % der Summen-Ra'sterpunktdifferenzspannung
US', da die mit der Ausgangsspannung identische Rasterpunkt-Differenzspannung
U17 aus dem Rasterpunkt 7 abgeleitet ist,
welcher durch das Standard-Schriftzeichen der Fig. 2a eine Schwärzung von 2 % der GesamtSchwärzung aller Rasterpunkte aufweist.
Die in der Tabelle 1 genannten Linearkombinationen und Grenzen der Ausgangsspannungen können zur Durchführung
des Verfahrens durch elektrische Schaltungen, etwa gemäß der in Fig. 3 dargestellten Schaltung, oder nach Umwandlung der Rasterpunkt-Differenzspannungen
in digitale Werte durch Rechenoperationen realisiert werden.
709845/0457
Dadurch, daß die Ausgangsspannungen der Linearkombinationen der ersten Art aus jeweils zwei Spannungsarten gebildet
werden, von denen jede von den Rasterpunkten abgeleitet ist, und durch die Bildung der Rasterpunkt-Differenzspannungen
ändern sich bei Kontraständerungen alle beiden Spannungsarten dieser Linearkombinationen um denselben Faktor.
Haben die Ausgangsspannungen dieser Linearkombinationen, z.B. bei Vorlage von Schriftzeichen mit denselben Merkmalen wie das
Standard-Schriftzeichen, den Wert Null, und werden z.B. Schriftzeichen derselben Form jedoch mit unterschiedlicher Schwärzung
und unterschiedlicher Untergrundhelligkeit zur Identifizierung vorgelegt, so behalten die Ausgangsspannungen den Wert Null.
Sind jedoch die Ausgangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt werden, deren
Form und/oder deren Schwärzung vom Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen um höchstens denselben
Faktor, um welchen die Schwärzungen der zu identifizierenden Schriftzeichen von der Schwärzung des Standard-Schriftzeichens
abweichen. Bei bekannten Verfahren und Schaltungen ändern sich die Ausgangsspannungen um ein Vielfaches, sowohl wenn
diese den Wert Null hatten, als auch wenn diese von Null verschieden waren.
Auch bei den Linearkombinationen der zweiten Art haben Abweichungen der Untergrundhelligkeit und der Schwärzungen
der zu identifizierenden Schriftzeichen von den Schwärzungen des Standard-Schriftzeichens keinen Einfluß auf die Ausgangsspannungen,
wenn die zu identifizierenden Schriftzeichen dieselbe Form haben wie das Standard-Schriftzeichen, und somit die Ausgangsspannungen
den Wert Null haben. Sind die Ausgangsspannungen von Null verschieden, z.B. wenn Schriftzeichen zur Identifizierung vorgelegt
werden, deren Form und Schwärzung vom Standard-Schriftzeichen abweichen, so ändern sich die Ausgangsspannungen, wie bei
den Linearkombinationen der ersten Art, auch nur um denselben
709845/0487
Faktor, wie die Schwärzungen der zu identifizierenden Schriftzeichen
von den Schwärzungen der Standard-Schriftzeichen abweichen.
Die Ausgangs spannungen der Linearkoinbinationen werden erfindungsgemäß mit Anteilen der Summen-Rasterpunktdifferenzspannung
verglichen. Letztere ändert sich bei Abweichungen der Schwärzungen der zu identifizierenden Schriftzeichen von
der Schwärzung des Standard-Schriftzeichens um denselben Faktor wie die von Null abweichenden Ausgangsspannungen der Linearkoinbinationen.
Dadurch bleiben die für die zu identifizierende Klasse maßgebenden Grenzen, innerhalb welcher die Ausgangsspannungen
der Linearkombinationen liegen müssen, konstant, und das Klassifizierungsergebnis bleibt von Unterschieden der Schwärzungen
der Schriftzeichen und der Untergrundhelligkeit völlig unbeeinflußt.
Bei dem vorliegenden Verfahren werden auch die nicht geschwärzten Bereiche des Schriftfeldes - ebenso wie die
geschwärzten Bereiche des Schriftfeldes - quantitativ zur Erkennung herangezogen, wodurch die Trennsicherheit wesentlich
größer ist, als bei bekannten Verfahren. Dies wird dadurch erreicht, daß das Klassifizierungsergebnis der Linearkombinationen
der zweiten Art, welche eine Aussage über die nicht geschwärzten Bereiche des Schriftfeldes machen, völlig unabhängig von der
Untergrundhelligkeit und den technischen Gegebenheiten ist, z.B. Änderungen der Betriebsspannungen und der Beleuchtung des
Schriftfeldes.
Die zweite Spannunjsart der Linearkombinationen der ersten Art wird für jeweils eine Linearkombination aus der
Summen-Rasterpunktdifferenzspannung so gebildet, daß sie denselben Betrag aber entgegengesetzte Polarität wie die erste
Spannungsart hat. Zur Bildung der Summen-Rasterpunktdifferenzspannung
werden alle Rasterpunkt-Differenzspannungen herange-
709845/04S7
IS
zogen. Für die Bildung der zweiten Spannungsart können jedoch gegebenenfalls in der Suiranen-Rasterpunktdifferenzspannung
einige Rasterpunkt-Differenzspannungen weggelassen werden, so daß die zweite Spannungsart nicht aus der Summen-Rasterpunktdifferenzspannung
sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert denselben
Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat. Die Bildung der zweiten Spannungsart aus einer oder
mehreren Rasterpunkt-Differenzspannungen ist vorteilhaft für
solche Linearkombinationen der ersten Art, in denen Symmetriemerkmale von Schriftzeichen mit symmetrischen Formen, z.B. der
Ziffern 8 und 0, gespeichert werden, da hierdurch die Anzahl der erforderlichen Linearkombinationen vermindert werden kann.
Das Verfahren der Erfindung benötigt durch das
Zusammenwirken der zwei Arten von Linearkombinationen, bei welchen
die für die Klassifizierung maßgebenden Grenzen der Ausgangsspannung jeder Linearkombination getrennt festgelegt werden,
zur Klassifizierung von Schriftzeichen mit stark unterschiedlichen
Merkmalen nur eine geringe Anzahl von Linearkombinationen, da durch die Eliminierung der Kontrastunterschiede
die Anzahl der zur Identifizierung der Schriftzeichen erforderlichen Merkmale sehr stark eingeschränkt wird. Dementsprechend
ist auch die Anzahl der Rasterpunkte gering. Durch die geringe Anzahl der Rasterpunkte kann die Fläche eines Rasterpunktes
relativ groß gemacht werden. Da von jedem Rasterpunkt zur Bildung der Linearkombinationen nur eine Spannung abgeleitet wird,
ist diese Spannung ein Maß für den Mittelwert der Schwärzung eines Rasterpunktes. Es können daher innerhalb der Fläche eines
Rasterpunktes große SchwärzungsunterscKiede, z.B. Konturenunterbrechungen,
vorhanden sein. Dadurch lassen sich auch Schriftzeichen klassifizieren, deren Schriftzug unterbrochen ist oder
sogar nur aus einzelnen unζusammenhängenden Punkten verschiedener
Schwärzungen besteht, wie es praktisch bei Schriftzeichen
709845/ÖU7
der Fall ist, welche mit Mosaikdruckern gedruckt sind. Das folgende Beispiel soll dies näher veranschaulichen.
Es ist der in Fig. 2c dargestellte, nur aus
Punkten mit verschiedenen Schwärzungen und ungleichem Abstand bestehende Repräsentant als Ziffer 3 zu klassifizieren. Hierzu
werden unter Zugrundelegung des in Fig. 2a dargestellten Standard-Schriftzeichens der Klasse 3 und der in der Spalte
"zweite Spannungsart" der Tabelle 1 genannten - den Rasterpunkt-Differenzspannungen
U'1, U'2, U'3, U'6f U'8, ϋ'9, U112, U113,
U114, U115 entsprechenden - Anteile der Summen-Rasterpunktdifferenzspannung'
US1 die Linearkombinationen 1 ... 7 der ersten
Art gemäß der Tabelle 2 gebildet.
709845/045?
Widerstands- Netzwerke Nr.
1 2
3 4 5 6 7
Linearkombinationen der ersten Art
erste Spannungsart
|U'6+U'9+U'12 |U'1+U'2+U'3
|U'13+U'14+U'15 IU'8
|U'3+U'15 |υ·1+υ'8+υ·13
zv/ei te
Spannungsart
Spannungsart
-0,32 US1I -0,28 US1I
-0,28 US1I -0,10 US1I 14 -0,40 US1I
-0,22 US'I -0,24 US1I
UM+U'5
U1ICH-U'11 U'7
U1ICH-U'11 U'7
Grenzen der Ausgangsspannung
<O,O96 US1
<O,O84 US1 <O,O84 US'
<0,030 US1 <0,120 US'
<O,O66 US' <O,O72 US'
<0,01 US' <0,01 US1
<0,03 US'
Die Auswahl der Rasterpunkte zur Bildung der
Linearkombinationen der ersten Art erfolgt unter Zugrundelegung
des Standard-Schriftzeichens der Fig. 2a und unter Berücksichtigung
der Merkmale der Mosaikschrift, nämlich daß die Schwärzung und die Lage der einzelnen Punkte verschieden sind, wie
in Fig. 2c dargestellt. Zur Bildung jeweils einer Linearkombination der ersten Art werden nicht nur einzelne Rasterpunkt-Differenzspannungen
sondern in der Mehrzahl mehrere Rasterpunkt-Differenzspannungen verwendet, um eine Mittelwertsbildung der
Schwärzungen von möglichst vielen Rasterpunkten zu erhalten. Hierdurch v/erden Unterschiede der Lage und der Schwärzung der
einzelnen Punkte des Mosaikschriftzeichens so weit ausgeglichen,
709845/0457
daß die Ausgangsspannungen der gleichen Linearkombinationen, welche unter Zugrundelegung des Repräsentanten nach Fig. 2c
gebildet werden, innerhalb der für die Klassifizierung maßgebenden Grenzen liegen.
Die Linearkombinationen 8, 9, 10 der zweiten
Art für das Standard-Schriftzeichen gemäß Fig. 2a und den Repräsentanten
gemäß Fig. 2c werden in analoger Weise gebildet.
Wie sich durch Einsetzen der Schwärzungswerte der einzelnen Rasterpunkte der Fig. 2c, anstelle der aus den Rasterpunkten
abgeleiteten Rasterpunkt-Differenzspannungen, in die
Linearkombinationen der Tabelle 2 ermitteln läßt, werden durch den in Fig. 2c dargestellten Repräsentanten der Ziffer 3, welcher
nur aus unzusammenhängenden Punkten verschiedener Schwärzung
und abweichender Lage besteht, die für die zu identifizierende Klasse maßgebenden Grenzen, innerhalb welcher die Ausgangsspannungen
der Linearkombinationen bei Vorlage der zu identifizierenden Schriftzeichen liegen müssen, nicht überschritten.
Selbstverständlich gilt dies auch für Repräsentanten, deren Merkmale den Merkmalen des in Fig. 2a dargestellten Standard-Schriftzeichens
oder des in Fig. 2b dargestellten Repräsentanten gleich oder ähnlich sind. Andererseits werden durch Repräsentanten
anderer Ziffern-Schriftzeichenklassen von den in den Linearkombinationen der Tabelle 2 angegebenen Bedingungen jeweils nur
etwa die Hälfte erfüllt. Dies bedeutet eine große Trennsicherheit gegenüber anderen Schriftzeichenklassen, da bereits eine
einzige nicht erfüllte Bedingung einer Linearkombination ver-*
hindert, daß Repräsentanten anderer konkurrierender Ziffern-Schriftzeichenklassen
als Ziffer 3 identifiziert werden.
Eine Schaltung zur Realisierung der Linearkombinationen durch Widerstandsnetzwerke und zur Feststellung der
7Ö98A5/Ö45?
Grenzen der Ausgangsspannungen der Tabelle 2 zeigt die Fig. 3. Entsprechend den zwei Arten von Linearkombinationen besteht
die Schaltung aus zwei Arten von Widerstandsnetzwerken. Diese sind mit N1 und N2 bezeichnet. Zur Klassifizierung des in Fig. 2c
dargestellten Repräsentanten sind von der ersten Art die Widerstandsnetzwerke NI1, NI2, Ni3, Ni4, NI5, Nig, H1? und von der
zweiten Art die Widerstandsnetzwerke N2.., N2?, N2, erforderlich.
Die Widerstandsnetzwerke bestehen aus den Widerständen R1, R2 ... R31, welche entsprechend der Art der Widerstandsnetzwerke
in Brückenschaltung geschaltet sind und denen die Rasterpunkt-Differenzspannungen +U'1, +U'2 ... +U'15 und die
jeweiligen Anteile der Summen-Rasterpunktdifferenzspannung -US1
zugeführt werden. Zu den Widerstandsnetzwerken gehören noch die integrierten Schaltkreise IC1 ... IC10 mit den Widerständen
R32 ... R41. Mit IC1 ... IC1O werden die Ausgangsspannungen der Widerstandsnetzwerke verstärkt. Mit den Widerständen R32 ... R41
kann die Verstärkung eines jeden IC und somit die Ausgangsspannung
eines jeden Widerstandsnetzwerkes so eingestellt werden, daß die für die zu identifizierende Klasse maßgebenden Grenzen für jedes
Widerstandsnetzwerk dieselben sind, wodurch für die Widerstandsnetzwerke einer Schriftzeichenklasse nur eine Vergleichsspannung
erforderlich ist.
Die Vergleichsschaltungen zur Feststellung, ob
die positiven oder negativen Ausgangsspannungen der Widerstandsnetzwerke
innerhalb der für die zu identifizierende Klasse maßgebenden Grenzen liegen, bestehen aus IC11 und IC12 und der
Logik L. Die IC11 und IC12 sind Grenzwertschalter, denen als Vergleichsspannung
die Summen-Rasterpunktdifferenzspannung zugeführt wird und die feststellen, ob die positiven und negativen
Ausgangsspannungen der Widerstandsnetzwerke innerhalb der für
die zu identifizierende Klasse maßgebenden Grenzen liegen. Die Dioden D1 ... D17 dienen zur Entkopplung, und es wird jeweils
nur die größte Ausgangsspannung den Vergleichsschaltungen zugeführt.
709845/0457
Zur Klassifizierung von Schriftzeichen der beschriebenen Art genügt die Unterteilung des Schriftfeldes in
eine relativ geringe Anzahl von Rasterpunkten, z.B. in 15 Rasterpunkte,
wie die Ausführungsbeispiele zeigen. Voraussetzung für diese relativ geringe Anzahl von Rasterpunkten ist, daß
alle Schriftzeichenmerkmale zur Bildung der Linearkombinationen herangezogen werden. Dies ist der Fall, wenn die Abtastung des
Schriftfeldes lückenlos erfolgt und somit keine Schriftzeicheninformationen
verloren gehen.
Da eine lückenlose Abtastung wegen der technischen Gegebenheiten der photoelektrischen Wandler nur unter Verwendung
von zusätzlichen optischen Vorrichtungen möglich ist, hat man bei vielen Abtastvorrichtungen das Schriftfeld in eine große
Anzahl von z.B. einigen Hundert Rasterpunkten unterteilt, wodurch eine ebenso große Anzahl von photoelektrischen Wandlern
erforderlich ist. Auch für diesen Fall läßt sich das vorliegende Verfahren vorteilhaft anwenden, indem man, ausgehend von einer
Unterteilung des Schriftfeldes in eine geringe Anzahl von gedachten Rasterpunkten, z.B. 15 Rasterpunkte gemäß Fig. 2, die
Linearkombinationen ermittelt und von jedem Rasterpunkt des ursprünglichen Schriftfeldes mit der großen Anzahl von Rasterpunkten
die Rasterpunkt-Differenzspannung ableitet, diese Rasterpunkt-Differenzspannungen
entsprechend der Unterteilung des Schriftfeldes in die geringe Anzahl von Rasterpunkten zusammen^
faßt und mit diesen zusammengefaßten Rasterpunkt-Differenzspannungen feststellt, ob die Ausgangsspannungen der Linearkombinationen
innerhalb der für die Klassifizierung maßgebenden Grenzen liegen.
709845/0^57
Leerseite
Claims (4)
1) für das Standard-Schriftzeichen der zu identifizierenden Klasse
die Rasterpunkt-Differenzspannungen und die Summen-Rasterpunktdifferenzspannung ermittelt,
2) aus diesen Spannungen zwei Arten von Linearkombinationen bildet,
wobei
a) die Linearkombinationen der ersten Art als Differenz aus jeweils
zwei Spannungsarten gebildet werden, von denen die erste
Spannungsart für jeweils eine Linearkombination
709845/0457
A) aus nur einer Rasterpunkt-Differenzspannung besteht, deren Wert im Falle eines in 9 bis 30 Rasterpunkte unterteilten
Schriftfeldes mindestens 2 %, vorzugsweise mindestens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte
unterteilten Schriftfeldes mindestens 1,5 %, vorzugsweise mindestens 2 %, der Summen-Rasterpunktdifferenzspannung
beträgt, oder
B) aus mehreren Rasterpunkt-Differenzspannungen gebildet wird, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte
unterteilten Schriftfeldes mindestens 7 %, vorzugsweise mindestens 10 %, und im Falle eines in 30 bis 60
Rasterpunkte unterteilten Schriftfeldes mindestens 4. %, vorzugsweise mindestens 6 %, der Summen-Rasterpunktdifferenz
spannung beträgt,
und die zweite Spannungsart für jeweils eine Linearkombination aus der Summen-Rasterpunktdifferenzspannung so gebildet
wird, daß sie denselben Betrag aber entgegengesetzte Polarität wie die erste Spannungsart hat, und
b) die Linearkombinationen der zweiten Art aus einer oder mehreren
Rasterpunkt-Differenzspannungen gebildet werden, deren Gesamtwert im Falle eines in 9 bis 30 Rasterpunkte unterteilten
Schriftfeldes höchstens 5 %, vorzugsweise höchstens 3 %, und im Falle eines in 30 bis 60 Rasterpunkte unterteilten
Schriftfeldes höchstens 3 %, vorzugsweise höchstens 2 %,
der Summen-Rasterpunktdifferenzspannung beträgt,
3) für das zu klassifizierende Schriftzeichen die Rasterpunkt-Differenzspannungen
und die Summen-Rasterpunktdifferenzspannung ermittelt,
4) aus diesen Spannungen die gleichen Linearkombinationen wie für das Standard-Schriftzeichen bildet, und
5) feststellt,
a) ob die Ausgangsspannung jeder Linearkombination der ersten
Art um nicht mehr als + 30 % vom Wert der zweiten Spannungsart abweicht, und
709845/0457
b) ob die Ausgangsspannung jeder Linearkombination der zweiten Art unter 1 % des Wertes der Summen-Rasterpunktdifferenzspannung
liegt, vermehrt um den auf die Summen-Rasterpunktdifferenzspannung
bezogenen Prozentbetrag des Gesamtwertes derjenigen Rasterpunkt-Differenzspannungen, aus denen
gemäß Abschnitt 2b die Linearkombinationen der zweiten Art gebildet worden sind.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die erste Spannungsart für jeweils eine Linearkombination
der ersten Art aus mehreren Rasterpunkt-Differenzspannungen bildet,
deren Gesamtwert höchstens 60 % der Summen-Rasterpunktdifferenzspannung beträgt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekenn-
zeichnet, daß man für jede Schriftzeichenklasse mindestens so viele
Linearkombinationen, wie 60 % der Anzahl der Rasterpunkte entspricht, und höchstens so viela Linearkombinationen, wie Rasterpunkte vorhanden sind, bildet.
4. Verfahren nach einem der Ansprüche 1-3, dadurch gekennzeichnet, daß man die zweite Spannungsart für jeweils eine
Linearkombination der ersten Art nicht aus der Summen-Rasterpunktdifferenzspannung
sondern aus einer oder mehreren Rasterpunkt-Differenzspannungen bildet, deren Gesamtwert denselben Betrag
aber entgegengesetzte Polarität wie die erste Spannungsart hat.
709845/0457
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19762619245 DE2619245A1 (de) | 1976-04-30 | 1976-04-30 | Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen |
CH496477A CH617026A5 (de) | 1976-04-30 | 1977-04-21 | |
US05/789,365 US4134021A (en) | 1976-04-30 | 1977-04-21 | Method of classifying characters having characteristics that differ greatly from standard characters |
FR7713247A FR2349893A1 (fr) | 1976-04-30 | 1977-05-02 | Procede pour la classification de signes d'ecriture de caracteristiques fortement differentes des signes d'ecriture standard |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19762619245 DE2619245A1 (de) | 1976-04-30 | 1976-04-30 | Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2619245A1 true DE2619245A1 (de) | 1977-11-10 |
Family
ID=5976819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19762619245 Withdrawn DE2619245A1 (de) | 1976-04-30 | 1976-04-30 | Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen |
Country Status (4)
Country | Link |
---|---|
US (1) | US4134021A (de) |
CH (1) | CH617026A5 (de) |
DE (1) | DE2619245A1 (de) |
FR (1) | FR2349893A1 (de) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5911152B2 (ja) * | 1976-10-19 | 1984-03-13 | 肇産業株式会社 | パタ−ンマツチング方法及びその実施装置 |
US4290049A (en) * | 1979-09-10 | 1981-09-15 | Environmental Research Institute Of Michigan | Dynamic data correction generator for an image analyzer system |
US4464788A (en) * | 1979-09-10 | 1984-08-07 | Environmental Research Institute Of Michigan | Dynamic data correction generator for an image analyzer system |
US4490850A (en) * | 1981-12-17 | 1984-12-25 | Ncr Corporation | Matrix character recognition |
US4616333A (en) * | 1984-06-05 | 1986-10-07 | Elscint, Ltd. | Data correlation system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3432673A (en) * | 1967-10-06 | 1969-03-11 | Control Data Corp | Line tracking reading machine having means to positionally normalize the character-video signals |
DE1811420B2 (de) * | 1968-11-28 | 1974-05-30 | Matth. Hohner Ag, 7218 Trossingen | Schaltung zur Klassifizierung von Repräsentanten mit stark unterschiedlichen Merkmalen |
DE2026033C3 (de) * | 1970-05-27 | 1979-05-03 | Matth. Hohner Ag, 7218 Trossingen | Rasterverfahren zur Klassifizierung von Schriftzeichen |
-
1976
- 1976-04-30 DE DE19762619245 patent/DE2619245A1/de not_active Withdrawn
-
1977
- 1977-04-21 US US05/789,365 patent/US4134021A/en not_active Expired - Lifetime
- 1977-04-21 CH CH496477A patent/CH617026A5/de not_active IP Right Cessation
- 1977-05-02 FR FR7713247A patent/FR2349893A1/fr active Granted
Also Published As
Publication number | Publication date |
---|---|
FR2349893A1 (fr) | 1977-11-25 |
US4134021A (en) | 1979-01-09 |
CH617026A5 (de) | 1980-04-30 |
FR2349893B1 (de) | 1984-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2164765C2 (de) | Einrichtung zur Erkennung von Schriftzeichensymbolen | |
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE69433395T2 (de) | Sicherheitsdokument mit variierender Tönung | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE2657631A1 (de) | Verfahren zur codierten darstellung einer information, insbesondere von chinesischen zeichen | |
EP0654778A1 (de) | Verfahren zur Textdarstellung auf Bildschirmgeräten | |
DE102008013789A1 (de) | Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen | |
DE2619245A1 (de) | Verfahren zur klassifizierung von schriftzeichen mit von standard-schriftzeichen stark unterschiedlichen merkmalen | |
DE2635224C2 (de) | Schaltanordnung zur Bildung eines einzelnen Ausgangssignals in Abhängigkeit einer Mehrzahl von zugeführten Meßsignalen | |
DE3417407C2 (de) | Kreisgenerator für eine graphische Anzeigeeinheit | |
DE3836789A1 (de) | Vorrichtung zur erzeugung von helligkeitsstufen auf einem anzeigeschirm | |
DE1524409B2 (de) | Zeichenerkennungsgeraet | |
DE2026033C3 (de) | Rasterverfahren zur Klassifizierung von Schriftzeichen | |
DE1811420C3 (de) | ||
DE19716445A1 (de) | Verfahren zur Verbreiterung von Zeichen | |
DE1524344A1 (de) | Schriftzeichenableseeinrichtung | |
DE2020013C3 (de) | Verfahren zum Übertragen von Markierungen eines Formulars auf einen Datenträger | |
EP1606763B1 (de) | Verfahren und einrichtung zum verarbeiten der farbinformation einer mit st rzeichen und nutzzeichen versehenen vorlage | |
DE1922373A1 (de) | Bezugsspannungsgenerator fuer einen opto-elektrischen Zeichenabtaster | |
EP0760144B1 (de) | Verfahren zur verbesserung der erkennung von maschinenschriften mit fester schriftteilung | |
WO2021074203A1 (de) | "signaturschein für handschriftliche unterschrift" | |
DE2461837C2 (de) | Digitale Anzeigevorrichtung mit einer Punktmatrix | |
DE1214451B (de) | Einrichtung zur Abtastung von optisch feststellbaren Markierungen | |
DE1524409C (de) | Zeichenerkennungsgerat | |
DE1549691A1 (de) | System zur automatischen Erkennung von Schriftzeichen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8110 | Request for examination paragraph 44 | ||
8130 | Withdrawal |