DE2740105A1

DE2740105A1 - Optische zeichenerkennungseinrichtung

Info

Publication number: DE2740105A1
Application number: DE19772740105
Authority: DE
Inventors: Michael E Wilmer
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1976-10-01
Filing date: 1977-09-06
Publication date: 1978-04-06
Also published as: SU648144A3; JPS5344128A; FR2366639B1; NL7710705A; BE859252A; US4034343A; GB1584096A; CA1098210A; FR2366639A1

Description

Die Erfindung betrifft optische Zeichenerkennungseinrichtungen, insbesondere Faksiirile-Übertragunssysteme, die zusätzlich eine Zeichenerkennungslogik zum Interpretieren gedruckten Textes und zum Reduzieren solchen Textes in einen Standardcode aufweisen.

Die Übertragung von Faksimile-Signalen geschieht in den meisten Fallen über Telefonleitungen und aus diesem Grund muß zusätzlich zu den Einrichtungskosten mit den anteilmäßigen Kosten für eine Übertragung aber weite Entfernungen gerechnet werden. TTm die Kosten des verwendeten Nachrichtennetzes zu reduzieren wurden bisher verschiedene Kompressionstechniken erfunden, um die Faksimile-Daten auf einen minimalen Datenbetrag, der notwendig ist, ein graphisches Bild zu übermitteln, zu komprimieren.

Typischerweise wurde eine derartige Kompression dadurch erreicht, daß entweder die Lauflängen oder die Redundanz schwarzer und weißer Abtastsignale komprimiert wurde, und zwar ungeachtet

8098U/0590

(OSO) aageea

MONAPAT

des speziellen abgetasteten Zeichensymbols. Gleichzeitig mit dieser Entwicklung gab es andere parallele Entwicklungen, bei denen optische Zeichenerkennungssysteme geschaffen wurden, die zum automatischen Lesen einer Eingangsgröße für digitale Computer verwendet wurden. Obschon es noch viele Bereiche einer möglichen Verbesserung bezüglich des Kompressionsbetrages gibt, welche bei der direkten, kontinuierlichen Faksimile-Übertragung Anwendung finden, so sind doch die wichtigsten Bereiche bezüglich der Redundanz ausgenutzt, und die meisten noch zu verzeichnenden Durchbrüche auf diesem Gebiet haben keine wesentliche Auswirkung auf die Gesamtübertragungszeit. Da die meisten als Faksimile zu übertragenden Dokumente gedruckten Text aufweisen, verspricht eine Zeichenerkennung großen Erfolg "beim Vermindern der Ubertragungszeit. Somit scheint der meistversprechendste Weg beim Erhöhen der Übertragungsgeschwindigkeit im Bereich der Kodierung oder im Komprimieren mittels optischer Zeichenerkennung zu liegen. Dieses letztgenannte Verfahren weist in Zusammenhang mit Faksimile-Systeme zusätzliche Vorteile auf, da in dem Fall, daß bestimmte Bereiche des Dokuments nicht durch das System erkannt werden können, auf einen normalen Faksimile-Betrieb zurückgeschaltet werden kann. Da die Zeichenerkennung somit dem Faksimile-Betrieb überlagert ist, benötigt das Erkennungssystem keine absolute Genauigkeit.

In den meisten Anwendungsfällen stellt gedruckter Text den am meisten signifikanten Inhalt des Hauptanteils der Faksimile-Übertragung dar. Gedruckter Text jedoch ist bisher niemals zufriedenstellend standardisiert worden und es gibt derzeit verschiedene verwendete Typensätze, die bei der Darstellung der Zeichen Verwendung finden. Bisher wurden schon Schrifttypensätze wie der OCR-B-Typensatζ entwickelt, jedoch aufgrund der Tatsache, daß dieser keine universelle Anwendung findet, ist eine Erkennung auch anderer Schrifttypen erforderlich, und jedes automatische Erkennungssystem

8098U/0590

sollte einfachen Modifikationen zugänglich sein, um einigen anderen vorherrschenden Schrifttypen Rechnung zu tragen.

Dem Problem verschiedener Schrifttypensätze übergeordnet ist das Problem, daß für jede spezielle Druckereinrichtung oder jede Schreibmaschine, mit der ein spezieller Typensatz ausgedruckt wird, eine veränderliche Genauigkeit gegeben ist. Betrachtet man beispielsweise den mittels einer herkömmlichen Schreibmaschine gedruckten Text, so existieren neben den Änderungen des Schrifttypen-Stils die Veränderungen aufgrund der Herstellungstoleranzen der Typen selbst, Schwankungen aufgrund von Farbaufhäufungen in den Zwischenräumen der Zeichen, Schwankungen in der Qualität des verwendeten Papiers, Beeinflußungen durch Schmutz oder auf dem Papier vorhandene Markierungen und aufgrund der Genauigkeit, mit der ein Zeichen auf das Papier übertragen wird. Diese zuletztgenannten Schwankungen werden oft auch als "Druckqualität" bezeichnet.

Herkömmliche Zeichenerkennungssysteme verwenden in Wirklichkeit eine Zeichenschablone, wobei derartige Schablonen durch einen digitalen Code gebildet werden; wenn eine spezielle, digitalisierte Abtastung eines Zeichens mit der Schablone übereinstimmt, so wird eine Zeichenerkennung angezeigt. Dieses Schablonenverfahren benötigt jedoch einen umfangreichen, punktweisen Datentest und besitzt darüberhinaus nicht die gewünschte Flexibilität, um die oben erwähnten Probleme der Druckqualität zu berücksichtigen. Aus diesen Gründen wurde versucht, das Problem mit verschiedenen statistischen Korrelationstechniken zu lösen, um somit den Hauschabstand des Zeichens selbst zu verbessern. Weitere Arbeiten auf dem Gebiet der Schablonenkorrelation haben zu dem Schluß geführt, daß viele Zeichen, wenn nicht sogar alle Zeichen in einem Alphabet, die in den gebräuchlichsten Schrifttypen gedruckt sind, nicht eine vollständige Schablonen-Ablesung benötigen,

8098U/0590

um eine Übereinstimmung zu erhalten. Insbesondere wurde herausgefunden, daß nur bestimmte Bereiche eines Zeichens positiv identifiziert zu werden brauchen, um einen Schluß auf die Identität des Zeichens zu ermöglichen.

Die Identifizierung solcher ausgewählter Erkennungsmerkmale, wie sie oben beschrieben wurde, wird typischerweise in Ausdrücken auf der Basis einer Schwarz-Weiß-Unterscheidung eines Faksimile-Systemes ausgeführt. Da sich bei einem Faksimile-System normalerweise Grenzen der Auflösung sowohl bezüglich des Abtastrasters als auch der digitalisierten Inkremente entlang der Abtastrichtung ergeben, was allgemein als Bildzellen oder Bildelemente (Pixels) bezeichnet wird, so bedeutet die Ausrichtung des Abtastrasters oder der Bildelemente bezüglich des Zeichens eine weitere Fehlerquelle. Dies wird allgemein als "Deckungsfehler" bezeichnet.

Die meisten herkömmlichen Systeme, die die oben beschriebenen Muster-Erkennungstechniken verwenden, um einen solchen Deckungsfehler zu vermeiden, wählen innerhalb der Zeichenumhüllung zentrierte Zeichen-Mustersegmente aus, die zur Identifikation der Zeichen verwendet werden. Hieraus resultiert ein zusätzliches Problem: Gewisse kleine Bereiche, die äußerlich ähnliche Zeichen voneinander unterscheiden, werden durch diese Muster-Erkennungstechniken nicht berücksichtigt. Beispielsweise erscheint ein derartiges Detail zwischen der Ziffer "1" und dem Buchstaben "I" in den meisten Fällen als kleiner Vorsprung in der rechten oberen Ecke des Zeichens "I". Der Verlust dieser Daten bei der Verwendung genau zentrierter Daten-Erkennungspunkte führt zu Verwechslungen zwischen der Ziffer "1" und dem Buchstaben "I". Auf ähnliche Weise kann die Ziffer "2" leicht mit dem Buchstaben "Z" verwechselt werden, da bei bestimmten Schrifttypen nur die obere rechte Kurve der "2" den Unterschied bezüglich des Buchstabens "Z"

8098U/0590

ausmacht. Wiederum erscheint dieser Abschnitt des Zeichens in vielen Typen als dünnes Segment, und aus diesem Grunde muß entweder die Dichte des Abtasterrasters erhöht werden, oder es müssen fehlerhafte Ausgabegrößen akzeptiert werden.

Das Abtastraster oder die Bildelementdichte stellen normalerweise einen Hauptkostenfaktor in jedem Faksimile-System dar; es wurden schon Abtastsysteme entwickelt, bei denen die Elementdichte aufgrund des Zeichenabstandes und der Schrifttypenhöhe ausgewählt wurden. Um die Kosten niedrig zu halten sollte jedes Zeichenerkennungssystem derartige standardisierte Abtasteinrichtungen verwenden, woraus sich eine Begrenzung auf diese Detail-Dichte ergibt. Darüberhinaus ergibt sich ein Anwachsen der Kosten durch die Abtastdichte, die neben den durch die Standardisierung entstehenden Kosten zu berücksichtigen ist; denn sowohl die Datenrate als auch der Umfang müssen vergrößert werden.

Aus diesem Grund is ¹^ es eine allgemeine Aufgabe und ein allgemeines Ziel der vorliegenden Erfindung, ein logisches System anzugeben, daß zur Verwendung in einem Faksimile-Gerät geeignet ist und durch das gedruckte Zeichen abgetastet, erkannt und anschließend in irgendeinen standardisierten Zeichencode zur Übertragung oder Speicherung umgewandelt werden.

Weitere Ziele der Erfindung liegen darin, ein optisches Zeichenerkennungssystem anzugeben, daß gemäß Boole'schen Diskriminatoren Zeichen lediglich durch Auswertung gewisser Bereiche des Zeichens identifiziert.

Ein weiteres Ziel der Erfindung liegt darin, ein Zeichenerkennungssystem anzugeben, bei dem sich kleine Deckungsfehler nicht auswirken.

Diese und weitere Ziele werden gemäß der vorliegenden Erfindung durch die Verbindung eines otischen Erkennungssystems

8098U/0590

- jfr - ΛΛ

neuartigen Aufbaus mit einem Faksimile-Abbildungssystem erreicht. Das Faksimile-System selbst ist bezüglich der Aufnahmeeinrichtungen herkömmlich ausgebildet, und es enthält eine Einrichtung zum Abtasten eines für die Übertragung bestimmten Dokuments oder Bildes in einem speziellen Raster, zum Digitalisieren jeder Abtastung in eine feste Anzahl von Abtast-Inkrementen, und zum Vergleichen jedes Inkrements mit einem voreingestellten Schwellenwert, um zu bestimmen, ob das Reflexionsvermögen des diesem Inkrement entsprechenden Dokumentbereichs im Durchschnitt schwarz oder weiß ist.

Innerhalb des Erkennungsabschnittes ist eine erfindungsgemäße Einrichtung enthalten, die einen ausgewählten Bereich der abgetasteten Daten, die eine m χ η - Matrix von Bildelementen umfassen, zur Lokalisierung eines Zeichens untersucht. Dies wird bewerkstelligt durch eine Suche nach zwei leeren Reihen oder Spalten, die von schwarzen Elementen getrennt sind. Wenn auf diese Weise das Vorhandensein eines Zeichens festgestellt ist, so wird der begrenzte Bereich registriert, und zwar gemäß einer zentralen Position zwischen diesen weißen Spaltenbereichen, die die Zeichen voneinander trennen, sowie den weißen Reihenbereichen zwischen den Zeilen. In diesen registrierten Koordinaten werden dann bestimmte Schwarz-Weiß-Bildelemente ausgewählt und mit einer fortlaufenden Liste von Zeichen-Unterscheidungsmerkmalen verglichen, die in einem Festspeicher (ROM) gespeichert sind. Jedes Zeichen-Unterscheidungsmerkmal (Zeichendiskriminante) ist eine Boole'sehe Funktion, die als Ergebnisse die Werte wahr oder falsch liefert als Antwort auf einen speziellen Bildelementbereich. Diese Funktionen gehören zu der Klasse der Produktsummen und bestehen aus der ODER-Verknüpfung eines oder mehrerer Ausdrücke. Jeder Ausdruck besteht aus verschiedenen Boole'sehen Bedingungen, die miteinander UND-verknüpft werden. Diese Boole'sehen Bedingungen können dreierlei Art

8098U/0590

sein; natürliche Variable, die es erfordern, daß ein Bildelement den Wert wahr (schwarz) hat; komplementäre Variable, die es erfordern, daß ein Bildelement den Wert falsch (weiß) hat, und "ODER"-Tests, die es erforderlich machen, daß ein Satz von drei aneinandergrenzenden Bildelementen (entweder in vertikaler, horizontaler oder diagonaler Richtung) wenigstens ein wahres.Element enthalten. Diese letztgenannte Bedingung ermöglicht es, daß die Logik relativ unempfindlich bezüglich der durch Kantenstörungen oder leichte Fehlregistrierungen des abgetasteten Zeichens verursachten Fehlern ist.

Somit liefert das erfindungsgemäße Zeichenerkennungssystem zwei Arten festgestellter Fehler. Die erste Fehlerart tritt auf, wenn alle Boole'sehen Zeichendiskriminanten für das abgetastete Eingabebild ausgewertet sind und keine Übereinstimmung gefunden wurde; die zweite Fehlerart tritt auf, wenn mehr als eine Übereinstimmung zwischen dem abgetasteten Zeichen und den verschiedenen, in dem Speicher abgespeicherten Zeichenmustern auftreten. Bei jedem festgestellten Auftreten eines Fehlers kann das System veranlaßt werden, in eine normale direkte Faksimile-Übertragungsart überzugehen, in der das Zeichen Bildelement für Bildelement übertragen wird.

Unentdeckte Fehler treten auf, wenn der in Frage stehende Bildelementbereich repräsentativ ist für ein bestimmtes Muster (z.B. "I"), die Logik dies jedoch unkorrekt als ein anderes Muster (z.B. "1") identifiziert. Diese Klasse von Fehlern wird für gewöhnlich als Substitutionsfehler oder Vertauschungsfehler bezeichnet.

Im folgenden wird die Erfindung anhand eines Ausführungsbeispiels unter Bezugnahme auf die Zeichnung näher erläutert. Es zeigen:

Fig. 1 Eine Seitenansicht einer vereinfachten Darstellung eines Abtast-Transportsystems, daß in Zusammenhang mit der vorliegenden Erfindung zweckmäßiger Weise 8098U/0590

verwendet werden kann,

Fig. 2 eine Draufsicht des in Fig. 1 gezeigten Systems,

Fig. 3 einen Abtastbereich eines Dokuments ohne Bezug gemäß der vorliegenden Erfindung,

Fig. 4- einen begrenzten Bereich eines eingeordneten Abtastbildes eines Zeichens, entwickelt gemäß der vorliegenden Erfindung

Fig. 5 eine verallgemeinerte logische Implementierung gemäß der vorliegenden Erfindung,

Fig. 6 ein Zeichenmuster eines Zeichens, daß die Bereiche der größten Unterscheidung verdeutlicht,

Fig. 7 eine erfindungsgemäß verwendete Speicherfeldanordnung,

Fig. 8 eine detailierte Implementierung eines Zeichen-Erkennungs-Untersystems gemäß der vorliegenden Erfindung,

Fig. 9 ein Zeichen-Bildelementmuster, das in Konkurrenz zu dem in Fig. 6 gezeigten Zeichen steht,

Fig.10 ein Zeichen-Bildelementmuster, das aus einer UND-Verknüpfung einer statistischen Probe der Varianten des in Fig. 6 gezeigten Zeichens entstanden ist,

Fig.11 ein Zeichen-Bildelementmuster einer ODER-Verknüpfung einer statistischen Probe der Varianten des in Fig. 6 gezeigten Zeichens,

Fig.12 ein Zustandsdiagramm zur Verdeutlichung der vorliegenden Erfindung,

Fig.13 eine datailierte Implementierung einer in der Beschreibund erläuterten logischen Einrichtung und

Fig.14 eine detailierte Implementierung einer weiteren logischen Anordnung.

Die nun folgende Beschreibung eines erfindungsgemäßen Zeichenerkennungssystems stellt nur eine mögliche Ausführungsform dar. Es sei insbesondere darauf hingewiesen, daß ebensogut eine Implementierung mit größeren Chips oder auf einer höheren Integrationsstufe erfolgen kann.

8098U/0590

Allgemeine Funktionsweise

Das in Fig. 1 dargestellte erfindungsgemäße OCR-System (optisches Zeichenerkennungssystem) ist allgemein mit dem Bezugszeichen 50 versehen. Es ist mit einem herkömmlichen Abtaster-T^ansportsystem 10 verbunden, welches ( inen Führungsmechanismus 11 umfaßt, auf dem ein Stapel von Dokumenten D angeordnet ist. Ein Dokument D. wird auf die Abtastanordnung 12 übertragen. Über dem Dokument D. ist eine Lichtquelle 13 angeordnet, die von einer elektrischen Spannungsquelle E betrieben wird, um einen Lichtstrahl L durch eine Zylinderlinse 14 auf die Oberfläche des Dokuments D_-. zu lenken. Das Licht L wird dann durch eine weitere Zylinderlinse 16 auf eine Fotodiodenanordnung 20 gelenkt; von der Diodenanordnung 20 führt eine Signalabζweigung zu dem erfindungsgemäßen und nun zu beschreibenden optischen Zeichenerkennungssystem 50. Nach Abschluß einer vollständigen Abtastung des Dokumente D. wird dieses durch mehrere gegenüberliegend angeordnete Rollen 21 in ein Aufnahmefach 22, daß auf der oberen Fläche eines Stapelmechanismus¹ 25 vorgesehen ist, geleitet. Mit dem Ausgang des Systems 50 ist ein Ubertragungsgerät 150 verbunden, das über einen Koppler mit einem Telefonnetz 152 oder direkt mit einem Computer oder einer anderen Daten-Sammelanlage (nicht gezeigt) verbunden ist.

In dieser Konfiguration ist eine gewöhnliche Transporteinrichtung vorgesehen; eine derartige Einrichtung wird beispielsweise ausführlicher beschrieben in den Benutzer- und Werkshandbüchern für das Papiertransportsystem RIT 200 der Firma Input Business Machines, Inc. beschrieben. Aus diesem Grund wurde die obige Beschreibung auch auf die wesentlichen Elemente beschränkt, und bezüglich detailierterer Information sei auf die oben genannten Literaturstellen verwiesen.

Die oben erwähnte Fotodiodenanordnung 20 ist als lineares

8098U/0590

Feld von Sensoren ausgebildet, wie sie beispielsweise durch die Firma Ret icon Company unter der Modell-Nummer RL 32 vertrieben werden. Ein derartiges Feld enthält mehrere nebener.nander angeordnete fotoempfindliche Elemente und weiso Taktgeber- und Selbstrasterungseinrichtungen auf, die so angeordnet sind, daß für jedes fotoempfindliche Element etwa eine Abtastauflösung entsprechend einer öffnung von 0,0322 cm erreicht wird. Die Implementierung der Fotodiodenanordnung 20 ist darüberhinaus so getroffen, daß für die jenigen Bereiche, in denen das durchschnittliche, durch die darunterbefindliche öffnung gelangende reflektierte Licht des Dokuments D^ unterhalb eines bestimmten Schwellenwertes liegt, das bedeutet, daß das Dokument dort schwarz ist, eine logische Ausgangsgröße der Fotozelle erhalten wird, die einem binären Wert "High" oder plus eins (+1) entspricht, während wenn das Papier in demselben Öffnungsbereich weiß ist, der logische Pegel "low" oder null (0) ist.

Die selbe Implementierung ist als Draufsicht in Fig. 2 gezeigt. Es versteht sich, daß die hier gezeigte Implementierung lediglich beispielhaft ist, und daß andere Einrichtungen zum Vorrücken und Abtasten eines Dokuments in Zusammenhang mit dem zu beschreibenden System verwendet werden können. In Fig. 2 werden die selben Dokumente oben von dem Stapel D in Richtung der Pfeile A auf die Oberfläche der Abtastanordnung 12 geleitet. In dieser Darstellung erscheint die Fotodiodenanordnung 20 als lineares Feld, das quer zu der Richtung der Pfeile ausgerichtet ist und mehrere Fotozellen 3O/.-3O aufweist. Wird somit das Dokument D. durch die Rollen 21 vorwärts "bewegt, so schaltet jeder Taktzyklus diesen Bereich 20 schrittweise fort, welcher aus diesem Grund einen neuen binären Code annimmt, indem die BIT-Positionen 1 bis η jeweils einen neuen binären Wert annehmen, und zwar entsprechend den Reflexionseigenschaften des nun unter der Anordnung 20 befindlichen Doku-

8098U/0590

- -vr -&

mentbereichs. Dieser binäre Code, der als parallele Signalverzweigung B angedeutet ist, wird dem erfindungsgemäßen optischen Zeichenerkennungssystem 50 zugeleitet, und somit wird dem System Abschnitt für Abschnitt ein digital quantisiertes Schwarz-Weiß-Bild eines Abschnittes des Dokuments D^ zugeführt.

Durch Auswahl eines hinreichend breiten Abtastbereiches 20 (m BIT breit) und eine Abtastzykluszahl von η Zyklen kann in dem hier beschriebenen System ein m χ η - Feld verwendet werden..Ein derartiges Feld ist in Fig. 3 gezeigt. Aus Gründen der Vereinfachung wird im folgenden jede unterschiedliche Öffnung als Bildzelle oder Bildelement (Pixel) P bezeichnet; dieses umfaßt in horizontaler Richtung eine Abtastzyklus-Periode, die durch einen Abtast-Taktgeber 20 in dem selbst-rasternden Fotodiodenbereich 20 abgeleitet wird, und es umfaßt in vertikaler Richtung die Längsabmessung einer einzelnen Fotozelle 30,, bis 30 . In dieser Darstellung sind mehrere Bildelemente P gezeigt, von denen einige schwarz sind und Pg bezeichnet sind, und von denen einige weiß sind und mit Py gekennzeichnet sind. Es soll hier festgehalten werden, daß im normalen oder optimierten Fall dieser binäre m χ η - Bereich insgesamt 2^{m x n} möglichen unterschiedlichen Codeworten oder Untergruppen entspricht. Darüberhinaus liegen zu Beginn die Feld- oder Bereichskoordinaten willkürlich bezüglich des Dokuments, was zur Folge hat, daß ein Zeichen mit unverständlichen Abschnitten angrenzender Zeichen innerhalb des m χ η - Bereichs liegen kann. Es ist dieser relativ große und willkürlich angesprochene Bereich, auf den sich die vorliegende Erfindung in der Hauptsache bezieht; dies geschiet durch logische Zentrierung des Zeichens und durch Auswahl der günstigsten Untergruppen der MxN- Elemente oder Bildpunkte P, wodurch die richtige Zeichenerkennung mit hoher Wahrscheinlichkeit erfolgt.

Um diese Erkennung zu erreichen, ist es notwendig, daß zuerst

80 9 8U /0 590

- Mt -1>

27A0105

ein Zeichen getrennt und zentriert und daß daraufhin eine logisch ausgewählte minimale Anzahl von Bildelementen innerhalb des Zeichens untersucht werden, wobei gemäß der Polarität der Bildelemente unmittelbar eine Identifizierung mit einem gewünschten- Wahrscheinlichkeitsgrad geliefert wird. Da jedes Bild notwendigerweise entsprechend der Anzahl der Bildelemente P oder der Auflösung der Abtasteinrichtung quantisiert wird, ist nur eine Approximation der Zeichenkanten möglich. In Fig. 4- ist ein bezüglich eines Koordinatenzentrums C zentrierter Buchstabe A in einem Feld mit MxN diskreten Bildelementen P gezeigt. Innerhalb dieses Feldes sind mehrere mit O gekennzeichnete Testpunkte ausgewählt,um zu verifizieren, ob die örtlichen Bildelemente weiß (Py) sind, und es sind mit X gekennzeichnete schwarze Testpunkte ausgewählt, um das Vorhandensein von schwarzen Bildelementen (Pg) zu verfizieren. Mittels einer ent scheidungswirksamen Auswahl der Testpunkte X und O ist es möglich, eine schnelle Bestimmung des Zeichens A zu erhalten.

Zuerst ist jedoch erforderlich, daß das Zeichen bezüglich einem Koordinaten.z ent rum C zentriert wird, da jede Art von Fehlern aufgrund von Fehlregistrierungen beispielsweise durch eine Abwärtsverschiebung des Zeichens, unmittelbar ein fehlerhaftes Lesen wenigsten zwei der musterhaften Testpunkte X zur Folge hat. Wie weiter unten noch gezeigt werden wird, wird diese Registrierung dadurch erreicht, daß im oberen Bereich eines m χ η - Feldes begonnen wird und die erste Reihe gefunden wird, in der nicht alle Elemente weiß sind, und indem im unteren Bereich des Feldes begonnen wird und die erste Reihe gefunden wird, in der nicht alle Elemente weiß sind; sind diese Reihen einmal gefunden, so wird daraus geschloßen, daß das Zentrum des Zeichens in vertikaler Richtung in der Mitte dieser Zeilen liegt. Auf ähnliche Weise werden in horizontaler Richtung die Abmessungen des Zeichens bestimmt, in dem die erste und letzte Spalte bestimmt werden, in denen nicht alle Elemente weiß sind.

8 098U/0590

27AO105

Wie in der Zeile S gezeigt ist, sind die Kanten des Buchstabens A nur näherungsweise durch die entsprechenden Bildelemente P-g als Folge der Abtast-Quantisierung der Bildelemente P in diskrete schwarze und weiße (Pg und Py) Elemente beschrieben. Darüberhinaus hängt der Bildelement-Schwellenwert in jedem Fall von der durchschnittlichen Reflexionseigenschaft des Ausschnitts dss Dokuments D. ab und ist somit abhängig von der Druckgenaiigkeit der Zeichenkante. Somit wird das gesamte Zeichen A quantisiert, und entlang seinen Kanten hängt der Zustand der Bildelemente sowohl von der Kantengenauigkeit des Zeichens als auch von der Registrierung oder Deckung ab. Somit kumulieren sich sowohl der Deckungsfehler als auch der Fehler, der aufgrund des Effekts der Kantengenauigkeit entsteht, woraus sich ein kumulativer Fehler ergibt, der durch die noch zu beschreibende logische ODER-Anordnung akkommodiert wird. Wird somit der Testpunkt X bei M = 8 und N = 15 in vertikaler Richtung einer ODER-Kombination unterworfen, wie es durch die Phantom-Koordinate Z angedeutet ist, so werden sowohl die Effekte der Kantengenauigkeit als auch der Registrierung, bzw. Deckung in einfacher Weise ausgeschaltet. In anderen dargestellten Beispielen kann sowohl eine vertikale als auch eine horizontale ODER-Verknüpfung ausgeführt werden, oder aber auch eine diagonale ODER-Verknüpfung. Auf diese Weise werden jegliche Deckungsfehler, Kantenstörungen oder Störeffekte aufgrund der Druckqualität durch einfache ODER-Logik ausgeschaltet, wobei das einzige durch das System $0 zu lösende Problem darin liegt, die Registrierung und die Bestimmung der Wahrscheinlichkeit durchzuführen, mit der diese vier Testpunkte X in Kombination mit den Testpunkten innerhalb des selben Rahmens ein Zeichen A mit einem hinreichenden Grad an Zuverlässigkeit repräsentieren.

Das Registrierungssystem

Wie in Fig. 5 gezeigt ist, liefert die Abtasteinrichtung eine serielle Ausgangsgröße B an einen Vergleicher 51 mit

8098 U/0590

- ψ - 15

einer Taktrate, die durch den Abtast-Taktgeber 2Oq bestimmt wird. Der Ausgang des Vergleichers 51 liefert dann - entsprechend der Taktrate des Taktgebers 2Oq - die Eingangsgrößen an das System 50. Genauer gesagt wird der Ausgang des Vergleichers 51 der Datenklemme IN eines großen Schreib-/ Lese-Speichers (RAM) 55 zugeführt, und zwar unter einer Adresse, die Bit für Bit den Abtastkoordinaten des Dokuments entspricht.

Die Adresskoordinaten wiederum werden durch zwei Adresszähler hergeleitet, d.h., durch einen Spaltenzähler 57, der die aufeinanderfolgenden Taktimpulse des Taktgebers 20^ zählt und der somit das Dokument D. in diskrete Reihen unterteilt und durch einen Reihenzähler 56, der das höchstwertige Bit des Zählers 57 aufaddiert. Die Zähler 56 und 57 werden gesammelt als ein Adresseingang an einen Multiplexer (MUX) 58 geleitet, der den Adresseingang (ADDR)für den Speicher (RAM) 55 darstellt. Die Zähler 56 und 57 stellen somit zwei Ursprungsadresszähler dar.

In dieser Konfiguration bilden die Inhalte des Schreib-/ Lese-Speichers (RAM) 55 das Ursprungs-m χ η-Feld, das Bit für Bit und Reihe für Reihe dem Bild auf dem Dokument D. entspricht. Wie in Fig. 3 zu sehen ist, wird in dem RAM ein Feld mit einer Größe gespeichert, die wesentlich über die Größe eines vorgegebenen Buchstabens hinausgeht. Sei nun wiederum Fig. 5 "betrachtet. Jedes Zeichen innerhalb des Feldes ist ohne Bezugspunkt, es ist willkürlich gemäß dem Zählerstand der Reihen- und Spaltenzähler 56 und 57 angeordnet. Um die oberen und unteren Begrenzungen eines Zeichens zu unterscheiden, werden die weißen oder leeren Reihen herausgesucht, die zwei in vertikaler Richtung aneinandergrenzende Zeichen oder zwei Textzeilen voneinander trennen. Dies wird dadurch bewirkt, daß der serielle Ausgang des Vergleichers 51 zu einem Eingang eines ODER-Gliedes 60 geführt wird, welches an seinem Ausgang den seriellen Eingang

8098U/0590

eines Schieberregisters 61 bildet oder treibt. Das Register 61 wird durch den selben Taktgeber 2Oq getaaktet und schreitet somit synchron mit der Abtasteinrichtung 20 voran. Das Schieberegister 61 ist weiterhin so ausgelegt, daß es eine Anzahl von Bits aufnimmt, die der Bit-Breite der Abtasteinrichtung 20 entspricht. Der serielle Ausgang des Schieberegisters 61 wird an den anderen Eingang der Verknüpfungsschaltung 60 zurückgeführt, um eine zyklische Schleife zu bilden, durch die die Abtastsequenz in vertikaler Richtung komprimiert wird. Die parallelen Ausgänge des Schieberegisters 51 werden am Eingang eines NOR-Gliedes 62 gesammelt; dieses Verknüpfungsglied 62 treibt ein Flipflop 63, das eine Teilung durch zwei bewirkt, und zwar jedesmal dann, wenn alle Ausgangsgrößen des Schieberegisters 61 "low" sind. Das Flipflop 63 schaltet mit seinem Ausgang Q ein Zählregister 64 "oben weiß", um in dieses Register den laufenden Inhalt des Reihenzählers 56 einzugeben. Der Ausgang φ des Flipflops 63 wiederum schaltet ein weiteres Register 65, welches den Zählerwert für die nächstfolgende leere Reihe speichert, und zwar wiederum vom Zähler 56. Die Zähler 64 und 65 wiederum sind mit einem Differenz-Schaltkreis 70 verbunden, der die beiden Zählerstände subtrahiert und die Differenz der Werte festhält. Diese Zählerstanddifferenz wird dann durch einen Schaltkreis 71 halbiert, um den tatsächlichen Abstand des Reihenzentrums in dem Schreib-/Lese-Speicher (RAM) zu liefern.

Auf ähnliche Weise werden die horizontalen Begrenzungen des Zeichens für die Zeichenbreite untersucht. Im Gegensatz zur Reihenbegrenzungs-Schaltung jedoch erfordern die Spaltenbegrenzungen eine zusätzliche Implementierung. Um dieses zu erreichen, verknüpft eine verallgemeinert dargestellte Begrenzungsschaltung 75 die Ausgänge des Vergleichers 51» des Reihenzählers 56 und des Spaltenzählers 57 mit dem Taktgeber 2Oq. In einer noch zu beschreibenden Weise übernimmt der Schaltkreis 75 die entsprechenden Spalten-Zählerstände aus

8098U/0590

-⁰LA

dem Spaltenzähler 57, und zwar an den Stellen, an jeweils ein vollständig leere Spalte das erste und zweite Mal erscheint. Diese Zählerstände wiederum werden von einem weiteren Diffenz-Schaltkreis 80 übernommen, der wiederum über eine Teilerschaltung 81 das virtuelle Zentrum des Zeichens liefert. Ein zusätzlicher Ausgang R vom Schaltkreis 75, der beim zweiten Auftreten einer Leerspalte erscheint, setzt den Zeichen-Erkennungszyklus in Gang. Die Zeichenerkennung selbst wird durch eine allgemein mit dem Bezugszeichen 100 versehene Schaltung ausgeführt. Die Schaltung 100 liefert einen sequentiellen Adressausgang von Testpunkten, die mit den Ausgangsgrößen der Schaltungen 71 und 81 in entsprechenden Addierern 101 und 102 verknüpft werden, um die auf das Zentrum des Zeichens bezogene Adresse als eine weitere Eingangsgröße an den Multiplexer 58 zu liefern.

Der Erkennungs-Algorithmus

Bevor mit der Beschreibung der Einzelheiten der Implementierung des vorliegenden Systems fortgefahren wird, soll zunächst die für die Erkennung der Zeichenmuster entwickelte Technik erläutert werden. Anstatt einen herkömmlichen Schablonentest zu verwenden, verwendet die vorliegende Erfindung Boole'sehe Diskriminaten oder Unterscheidungsgrößen, um ein Zeichen zu erkennen. Genauer gesagt wird, nachdem das Zeichen zentriert ist, eine logische Auswahl von Testpunkt-Koordinaten aus dem System 100 ausgelesen, und dann wird jede Testpunkt-Koordinatinate mit den entsprechenden Inhalten des Speichers 55 verglichen.

Dies sei anhand von Fig. 8 näher erläutert. Diese genannten Koordinaten werden in verschiedenen Feldern eines Festspeichers (ROM) 115 gespeichert, zusammen mit dazugehörigen Bits für jedes Feld, welche die gewünschte Polarität oder binären Wert der T«stpunkte kennzeichnen. Mittels dieses Polaritätsfeldes

8098U/0590

werden die oben erwähnten Testpunkte wahr, falsch und "ODER" gesetzt.

ROM 115 kann beispielsweise eine vollständige Liste der Testpunkte enthalten, die notwendig sind, um die Zeichen eines oder mehrerer Typensätze zu identifiziere 1. Eines der Merkmale der vorliegenden Erfindung besteht in der Technik der Auswahl solcher Testpunkte. Diese Testpunkte werden in einem grundlegenden Boole'sehen Test verwendet, um zu entscheiden, welches Zeichen abgetastet wurde. Durch statistische Auswertung von annähernd 200 - 1000 Wiedergabemöglichkeiten desselben Typensatzes wird eine Boole'sehe Punktion für jede Kategorie (Zeichen) in dem Typensatz gemäß einem Optimierungs-Algorithmus entworfen. Dieser Algorithmus kann etwa durch die folgenden Schritte beschrieben werden:

1. Auffinden all^r Testpunkte, die die Wahrscheinlichkeit eines falschen Treffers in der speziellen Zeichenkategorie vermindern, d.h., Testpunkte, die eine Herabsetzung der Wahrscheinlichkeit bewirken, daß die Funktion bei nicht korrekten Zeichen eine Antwort 'Wahr" ergibt;

2. Innerhalb der im Schritt 1 ausgewählten Untergruppe nur jene Testpunkte auswählen, bei denen eine minimale Wahrscheinlichkeit besteht, daß Zeichen aus derjenigen Kategorie, für die die Funktion entworfen wurde, verfehlt werden;

3. Herausgreifen des Testpunktes aus der im Schritt 2 entwickelten Untergruppe, der mit der geringsten Wahrscheinlichkeit einen falschen Treffer liefert;

. 4. Einfügen der ausgewählten Variablen in die Funktion. Wenn die Wahrscheinlichkeit eines falschen Treffers null ist, so ist der Ausdruck vollständig. Wenn die Wahrscheinlichkeit eines Verfehlens ebenfalls null

8098U/0590

ist, dann ist die Funktion vollständig. 5. Wenn die Funktion nicht vollständig ist, werden die "Übung·sdaten" untersucht, die Wahrscheinlichkeitsabsciatzungen modifiziert, und es werden die Schritte 1-4 wiederholt, bis die Funktion vollständig ist.

Dann werden die Testpunkte gemäß der folgenden Funktion verknüpft:

Ausdruck 1

Ausdruck 2

wobei der Ausdruck 1 vollständig ist, wann immer die nächste Variable V_x. . . eine Wahrscheinlichkeit von O- für das Auftreten eines falschen Treffers liefert. Auf ähnliche Weise ist die Funktion, die in diesem Fall den Ausdruck 2 enthält, vollständig, wenn die Wahrscheinlichkeit für ein Verfehlen = O ist. Demnach arbeitet die Funktion in zwei Richtungen; eine Richtung dient zum Trennen der Zeichenkategorie von anderen,zum Verwechseln ännlichenKategorien, die zweite Richtung dient zum Herausgreifen eines Textpunktes aus jenen trennenden Testpunkten, welche die geringste Chance eines Verfehlens bietet. Die Funktion f. ist weiterhin erweitert, um die oben erwähnte ODER-Verknüpfung mittels der Testpunkte T^, T₁- und T.g zu umfassen, um einen Ausgleich, bzw. eine Akkommodierung der Kanten- und Registrierungsprobleme zu erreichen.

Mit Hilfe dieser Technik kann ein Satz von Testpunkten

8098U/059Q

X und O in den Festspeicher (ROM) 115 eingeschrieben werden, welcher in der schnellstmöglichen Abfolge ein Zeichen identifiziert. Eine beispielhafte Auflistung der Testpunkte für ein "o" ist unten angegeben, wobei gleichzeitig Bezug genommen wird auf Fig. 6, in der dieses Zeichen in einem MxN- Feld graphisch dargestellt ist (gezeigt ist das Bildelementmuster eines OCR-B-Zeichens, Amerikanische Version).

DEFINITIONEN:	ausgewählt	Klasse 3 =	Vertikal	OR	Kl.=3,	falsche	Tr.=2846,	M=O
	ausgewählt	Klasse 2 =		Horizontal OR	Kl.=2,	falsche	Tr.=1036,	M=O
	ausgewählt	Klasse 1 =	Komplementär	Kl.=1,	falsche	Tr.=420 ,	M=O
	ausgewählt	Klasse O =	Natürlich	Kl.=3,	falsche	Tr.=178 ,	M=O
	ausgewählt	: Sp.=13,	Zeile=i5,	Kl.=1,	falsche	Tr.=78 ,	M=O
V	ausgewählt	: Sp.= 7,	Zeile=2i,	Kl.=1,	falsche	Tr.=15 ,	M=O
V	ausgewählt	: Sp.= 7,	Zeile=i6,	Kl.=1,	falsche	Tr.=7	M=O
V	ausgewählt	: Sp*= 6,	Zeile=1O,	Kl.=1,	falsche	Tr.=3 ,	M=O
V	ausgewählt	: Sp.= 9,	Zeile=i5,	Kl.=1,	falsche	Tr.=1 ,	M=O
V	ausgewählt	: Sp.= 6,	Zeile=23,	Kl.=2,	falsche	Tr.=0 ,	M=O
V		: Sp.= 1,	Zeile=2i,
V	: Sp.= 7,	Zeile=i8,
V	: Sp.= 8,	Zeile=7 ,
, V	: Sp.= 1,	Zeile=15,
V

wobei M = Verfehlen.

Unter Bezugnahme auf oben stehende Tabelle erkennt man, daß jede nachfolgende Variable V so ausgewählt wird, daß die Anzahl von falschen Treffern minimiert wird. In entsprechender Notation werden die in Fig. 6 gezeigten Testpunkte X und ausgewählt für die Prüfung bezüglich der transformierten Elemente in Speicher 55 in der oben angegebenen Folge. Auf ähnliche Weise ist das in Fig. 9 dargestellte, konkurierende Zeichen "e" durch einen einzelnen Testpunkt 0 in Reihe 15,

8098U/0590

Spalte 9 unterscheidbar. Gemäß der oben angegebenen Tabelle wird dieser Test wesentlich oberhalb des Testendes ausgeführt und ist aus diesem Grund wesentlich nützlicher als die oben erwähnte einzelne Unterscheidung.

Um die Effizienz des vorliegenden Algorithmus¹ hervorzuheben, sollten die Fig. 10 und 11 betrachtet werden. In Fig. 10 sind alle getesteten Störvarianten eines einzelnen Schriftzeichens "o" durch eine logische ODER-Verknüpfung kombiniert. Auf ähnliche Weise sind in Fig. 11 dieselben Störvarianten mittels einer logischen UTiD-V erknüpf ung kombiniert. Die meisten herkömmlichen Systeme dieser Art betrachten entweder die logische ODER-Verknüpfung (Korrelation) oder die UND-Verknüpfung (Schablone). Der vorliegende Algurithmus verwendet nicht einmal eine der UND-Koordinaten, ausgehend von der Tatsache, daß eine solche die Wahrscheinlichkeit von falschen Treffern nicht hinreichend verbessert.

Das arithmetische Äquivalent dieses Algorithmus' kann wie folgt angegeben werden:

DNFH/_DNGH * MAX NEGATIV und P Verfehlen 4 0

wobei DNFH die Änderung der Zahl falscher Treffer bedeutet und DNGH die Veränderung der Anzahl richtiger Treffer für jede neue Variable V bedeutet.

Dieser Algorithmus in seiner parellen Form kann sequentiell implementiert werden, um die Verarbeitungszeit zu optimieren. In dieser Implementierung wird eine Testfolge entsprechend dem in Fig. 12 gezeigten Zustandsdiagramm eingeführt. Wie aus dieser Fig. hervorgeht, beginnt der erste Schritt S^ mit dem ersten Zeichen in einem Schriftzeichensatz und fährt fort, im zweiten Schritt S~ die erste Variabel V zu testen. Bei Fehlschlagen des Tests wird in der Folge unmittelbar zu

8098U/0590

einem neuen Zeichen fortgeschritten, wie es durch den Schritt S angedeutet ist. Auf ähnliche Weise verzweigen alle anderen Tests (S^ und S^) zum Schritt S_n bei einem Fehlschlag. Somit wird mit minimalem Hardware-Aufwand eine Folge von Schritten abgearbeitet, die entweder tatsächlich ein erkanntes Zeichen findet oder fehlschlägt.

Wie in Fig. 7 gezeigt ist, ist der Festspeicher (ROM) 115 in verschiedene Felder unterteilt, wobei jedes Feld für sich gemäß herkömmlichen Techniken adressierbar ist. Hierzu sei ein Beispiel angegeben: Ist ein Test erfolgreich, so wird die Adresse auf das nächste Feld erhöht, welches einen Adresszeiger auf die nächste zu testende Testpunkt-Koordinate enthält. Wenn der die Test die anfängliche Adresse verfehlt, so beginnt die nächste Adresse mit der Untersuchung eines nachfolgenden Zeichens. Dies wird dargestellt in Ausdrücken der Felder F^, F^, ... Nächster ^{von denen} <3^edes für sich durch die Eingangs&iresse ausgewählt ist und von denen jedes ein Ausgangssignal erzeugt. Innerhalb jedes Feldes F_x., F^,... gibt es aus diesem Grunde einen Abschnitt SA, der in einem binären Code die Reihen- und Spaltenkoordinaten der Testvariablen V, die oben in dezimaler Form gezeigt wurde, enthält. Die letzten zwei Bits, die in der Zeichnung mit OP (Operation) und TE (Test) bezeichnet sind, bedeuten die vier oben beschriebenen Klassenzustände.

Somit enthält der Festspeicher 115 Wörter zweierlei Typs; Wörter "nächste Adresse" und logische Kodierwörter. Das Wort "nächste Adresse" tritt am Beginn eines jeden neuen Ausdrucks auf und zeigt auf den nächsten neuen Ausdruck (der ein Ausdruck derselben logischen Funktion oder der erste Ausdruck der nächsten logischen Funktion sein kann). Darüberhinaus enthält dieses Wort zwei Statusbits EOT und EOF. Wenn EOT den Wert "wahr" hat, so bedeutet dies, daß dieser Ausdruck der letzte Ausdruck des gesamten Logiksatzes

8098U/0590

- 22 -

27AO105

ist, und wenn er fehlschlägt, ist der Test beendet. Wenn EOF den Wert "wahr" hat, so bedeutet dies, daß der nächste Ausdruck den Anfang der nächsten Funktion darstellt.

Die logischen Kodierwörter enthalten die für das Abmessen des Status' der Boole'sehen Variablen benötigte Information, die in den verschiedenen Ausdrücken der verschiedenen Funktionen benötigt wird. Die enthaltenden Felder sind: Reihe, Spalte, Type, EOT und EOF.

Implementierung der Erkennungslogik

Das als Beispiel dienende, oben beschriebene Zustandsdiagramm ist in dem oben erwähnten Festspeicher (ROM) 115 implementiert, welcher in einer in Fig. 8 gezeigten Schaltung enthalten ist.

Die Erkennungslogik 100 weist den Festspeicher (ROM) 115 auf, der einen Ausgang mit einer Breite von η Bit hat; ein Abschnitt dieses Ausgangs ist mit SA bezeichnet und ste.llt die Adresseneingangsgrößen dar, die zu den Zentrums-Koordinaten in den Addierern 101 und 102 addiert werden. Die übrigen zwei Bits bilden den Befehls- oder Instruktionscode.Um die Erkennungslogik zu erläutern, soll an dieser Stelle eine vereinfachte Implementierung besprochen werden. Der Festspeicher 115 liefert η - Bits-Ausgangsgrößen, von denen das mit SA gekennzeichnete Feld mit einem Ausgabepuffer 155» einem Eingangs-Auswahlpuffer 160 und einem Adressregister 170 verbunden ist. Zwei Bits B.. und B^₂ stellen den Befehlscode dar, der oben als Klasse bezeichnet wurde. Die Bits B^_x. und B^p werden durch entsprechende Negatoren 172 und 174- an komplementierenden NAND-Gliedern 171 und 175 gesammelt. Das Verknüpfungsglied 171 steuert das Laden des Registers 170, während das Verknüpfungsglied 175 den Ausgangspuffer 155 steuert. Das Adressenfeld SA wird somit geladen, um entweder

8098U/0S90

eine Ausgangsgröße zu erzeugen, oder als nächste Adressinstruktion zu wirken. Das Register 170 wiederum ist über einen Adresspuffer 165 ^mit den Adresseingängen des Festspeichers 115 verbunden. Der Puffer 165 erhöht (inkrementiert) oder lädt gemäß der Polarität eines EXKLUSIV-ODER-Gliedes 162, an dessen Eingang daß dem Bildelement im Schreib-/Lesespeicher 55 entsprechende Bit und das Bit B.ρ zusammengeführt werden. Es sind somit das Bit B^ und das Bildelement-Bit gleich, so wird eine neue Adresse in den Puffer geladen. Im anderen Fall erfolgt im Adresspuffer eine Inkrementierung.

Die Auswahl der Bitkoordinaten wird durch einen Eingang-Auswahlpuffer 160 ausgeführt, der die Reihen- und Spaltenkoordinaten den Addierern 101 und 102 zuführt, damit sie gemäß der Zentrierungsverschiebung, die oben beschrieben wurde, transponiert werden.

Auf diese Weise kann das System fortschreiten, bis ein Code "Ende der Funktion" (EOF, end of function) beim Ausgangspuffer 155 erzeugt ist. Dies identifiziert eine Zeichenerkennung. Da es jedoch manchmal möglich ist, daß zwei oder mehrere Zeichenidentifikationen für ein Bildelement-Muster vorliegen, ist eine zusätzliche Logik vorhanden, mit der alle Zeichen geprüft werden, und eine Erkennung wird nur dann registriert, wenn ein Zeichen identifiziert ist.

Diese zusätzliche Logik umfaßt ein Register 301 für das "laufende Zeichen"; dieses Register empfängt vom Puffer eine Eingangsgröße NCHAR, die angibt, welches Zeichen im Augenblick getestet wird. Der Inhalt dieses Registers wird, wenn der Code EOF "Ende der Funktion", durch den Puffer abgeleitet ist, in ein Register 302 "erkanntes Zeichen" geladen.

8098U/0590

Gleichzeitig akkumuliert ein Zähler 303 die aufeinanderfolgenden Signale EOF, Vielehe dann mittels eines Vergleichers 3O^ verglichen werden, um zu sehen-, ob mehr als eine Zeichenerkennung vorliegt. Ist dies der Fall, so gibt es zwei konkurrierende Zeichen, und am Ausgang eines UND-Gliedes 305 wird eine Zurückweisung angezeigt. Wenn lediglich ein Zeichen erkannt wurde, so wird eine Sperrschaltung 306 aktiviert, um die Identifikationszahl dieses Zeichens zu registrieren. In der obigen Sequenz werden die zuvor beschriebenen ODER-Tests durch einen Code angegeben. Die nachstehend angegebene beispielhafte Codesequenz zeigt diese Funktion, bei der ein Code der Bits B^. und B^p folgender Art verwendet wird:

^B11 ^B12

0 0 Horizontales ODER

0 1 Vertikales,ODER

1 0 Natürlich

1 1 = Komplementär

CODE-SEQUENZ

Linkes Bit 1 = EINGANG 0 = Aus9-Nächster ^ Eingang = Zustand

Ausgang ^ Nächster = 1 Laden Adr Φ Nächster = 0 Stelle Inhalt Forts.

0 Laden ADR 0 0 0 0 110

1 INTBT 001110100

2 INTBT 001100100

3 INTBT 010000100

* 4 Laden ADR Nächster Ausdruck

8098U/0590

Stelle

5 6

7 8

Inhalt

INTBT Laden	ADR	11111 Nächster	1	ö	1	1	1111 Ausdruck	1	O	O
INTBT		O	1	1	O	O	1	)	1	1
INTBT		O	1

n+1 n+2

Laden ADR "Nächstes Verfehlen" INTBF (23) (12)

Laden ADR "Nächster Treffer" (Adresse)

Implementierung des Systems

Wie in Fig. 13 gezeigt ist, und wie auch schon oben geschildert wurde, ist der Ausgang des Vergleichers 51 niit dem ODER-Glied 60 verbunden.. An dem zweiten Eingang empfängt das Verknüpfungsglied 60 den seriellen Ausgang eines allgemeinen Schieberegisters 61, daß in dieser Fig. in Form von mehreren Vierfach-D-Flipflop 61^ - 61 dargestellt ist; diese als Chips ausgebildeten Flipflops können beispielsweise solche sein, wie sie von der Fa. Texas Instruments unter Modellbezeichnung SN 74-175 angeboten werden. Die Ausgänge Q jedes Flipflops sind mit dem nächsten D-Eingang in Kaskade geschaltet, wodurch ein Schieberegister mit einer Anzahl von Bits entsteht, welche gleich einer Abtast-Bitzählung der Abtasteinrichtung 20 ist. Um dieses Register mit dem Abtaster zu synchronisieren, wird jedes Chip 61^ - 6i_n durch den Abtast-Taktgeber 20_c getaktet. Die entsprechenden Ausgänge (J der Chips 61^- 6i_n wiederum werden zwei parallelen Sätzen von "8 -Leitung-Zu-3-Leitung"

- Prioritätscodierern 64^ _ und

_ _n

(z.B. Kodierer

T. I. SN 74-148) zugeführt, welche die oben erwähnten Register 64 und 65 bilden. Zusätzlich liefert diese duale Anordnung

8098U/0590

- 26 -3

der Prioritätskodierer das funktionstnäßige Äquivalent des Flipflops 63. Die Anordnung der Kaskadeverbindung und der Eingangsreihenfolge der Kodierer 64 _ und 65^, _ _n ist entgegengesetzt, so daß die Kodierer 64. _ die Zählung für das obere erste schwarze Bildelement liefern, während die Kodierer 6S. _ den Zähler für den unteren Bereich darstellen. Der Prioritäts-Flag-Ausgang des Dekoders 64. wird zusammen mit dem Ausgang des Dekoders 64p den invertierenden Eingängen eines ODER-Gliedes 63^ zugeführt, während eine ähnliche Verknüpfung der Ausgänge der Kodierer 64p und 64_n dem anderen ODER-Glied 63p zugeführt wird. Zusätzlich verknüpfen mehrer NOR-Glieder 63?· - 63_ die verschiedenen Code-Ausgänge. Die Verknüpfungsglieder 63,i - 63 bilden in bekannter Weise den binären Code für die Zählung des oberen schwarzen Bildelements in Form des Signalzweigs OBEN. In einer ähnlichen Konfiguration bilden mehrere ODER- und NOR-Glieder 66^ - 66_n in Eine-Komplement-Darstellung einen Zähler UNTEN für den unteren Bereich. Die Zweige OBEN und UNTEN werden dann den Eingängen A und B einer Adüeranordnung zugeführt, die aus mehreren(SN 74283)-Addierern bestehen und in der Fig. als Addierer 69,, - 69 in Kaskade geschaltet sind, um auf diese Weise einen Differenz-Zählwert DIF an eine Sperrschaltung 7O^ (SN 74174) zu liefern. Diese Sperrschaltung bildet in Kombination mit den zuvor erwähnten Addierern die Funktion der Differenzsperre 70. Es sei festgehalten, daß diese Anordnung der Bezeichnungen OBEN und UNTEN willkürlich ist und auf den Abtast-Zählerstand bezogen ist. Das System kann daher bezüglich des Dokuments D. willkürlich orientiert sein. Die einzige notwendige Bedingung besteht darin, daß die Spalten-Erkennungslogik, wie oben beschrieben wurde, auf die Abtastsequenz bezogen ist.

In einer ähnlichen Anorndung ist die Suche nach einer ersten und zweiten Leerreihe implementiert. Die Einzelheiten der Implementation jedoch weichen etwas ab, und aus diesem Grund

8098U/0S90

- 3? -?><L 27A01

sei an dieser Stelle auf Fig. 14 verwiesen. Wie in dieser Fig. zu sehen ist, ist der Ausgang des Vergleichers 51 mit der J-Klemme eines J-K-Flipflops 275 verbunden, welches an seiner K-Klemme geerdet ist. Dies Flipflop wird durch den Taktgeber 20 getaktet, wobei dieser Takt durch einen Negator 276 invertiert wird; der Takt wird daher bei der nächsten nach dem ersten Auftreten eines schwarzen Bildelements folgenden Taktperiode "high". Auf ähnliche Weise ist ein Fliflop 277 verschaltet. Das Flipflop 275 wird bei jedem neuen Abtastzyklus durch ein Signal SCAN gelöscht, und das Flipflop 277 wird durch das "Ende der Reihe"-Inkrementsignal ROM gelöscht, welches durch einen Negator 181 invertiert wird und vom höchstwertigen Bit des Spaltenzählers 57 stammt. Der Ausgang Q des Flipflops 275 und der Ausgang Q des Flipflops 277 werden zusammen einem UND-Glied 278 zugeführt, welches ein D-Flipflop 279 ansteuert, welches wiederum durch das Signal ROW getaktet wird. Die Ausgänge Q und Q des Flipflops 279 steuern jeweils die "Chip-Freigabe" -Klemmen der zwei sperrenden Register 285 und 286 an; diese Register sperren oder halten jeweils den Zählerstand der laufenden Spalte vom Zähler 57. Die Ausgänge der Sperren 285 und 286 liefern dann die Eingangsgrößen A und B eines Addierers 288; hierbei wird der Ausgang der Sperre 286 durch einen verallgemeinert dargestellten Negator 289 in komplementäre Form umgewandelt. Der Ausgang des Addierers 288 wird dann in eine Sperre 80 eingegeben. Die Signale SCAN und RÜCKSETZEN stellen die Umsehaltsignale zwischen Speicher-Lesen und Speicher-Schreiben dar, was zuvor allgemein als Signal R bezeichnet wurde. Es soll festgestellt werden, daß die Chipauswahl in Fig. 14 an die Auswahllogik gemäß Fig. 13 anschließt. Aus diesem Grund sollte für die verschiedenen Chipnummern Bezug genommen werden auf den obigen Text.

Nun sollten viele Fortteile der vorliegenden Erfindung klar sein. Die Erfindung liefert sowohl die Zentrierung eines

8098U/0590

- 28 -l'i

Zeichens in einem fortlaufenden Text, als auch eine sequentielle Testfolge zum Identifizieren dieses Zeichens. Die sequentielle Form des Identifikationstests und die aufgrund von Wahrscheinlichkeitsaussagen optimierten Testpunkte ermöglichen es, sehr früh viele Zeichen auszuschließen und aus diesem Grund -auf statistischer Basis- die Verarbeitungszeit bei der Zeichenerkennung zu reduzieren. Somit schafft die Erfindung ein leicht aufzubauendes System, welches zum großen Teil mit Festkörperbauelementen realisierbar ist und aus diesem Grund bei der Verwendung äußerst zuverlässig ist.

809814/0590

L e e r s e i t e

Claims

PATENTANWÄLTE Λ. GR'JNtCKER

DtPL ING

H. KINKELDEY

DR-ING

Π / η -ι O Γ ^W- STOCKMAlR

I η U ι U b "* ^iNG '^<^cAi-^jecM

K. SCHUMANN

DR RER NAT DIPU-PHYS

P. H. JAKOB

D(PL-ING

G. BEZOLD

DRBERNAT OPL-OtM.

8 MÜNCHEN

MAXIMILIANSTRASSE 43

β. Sept. 1377 P 11 764-57/or

Patentansprüche

/ίο Mustererkennungseinrichtung, die für die Erkennung von Zeichen geeignet ist, mit einer Abtasteinrichtung, die so angeordnet ist, daß sie relativ zu einem Dokument "bewegbar ist und die einen seriellen, digitalen Datenstrom erzeugt, der repräsentativ ist für die Reflexionseigenschaften des Dokuments an den entsprechenden, darunterliegenden Stellen, dadurch gekennzeichnet , daß ein Speicher (55) so angeordnet und verschaltet ist, daß mit ihm der serielle, digitale Datenstrom (B) empfangbar ist, um diesen an entsprechenden addresierbaren Speicherstellen aufzuzeichnen, daß ein Adressgenerator (56, 57) so mit der Abtasteinrichtung (20) verbunden ist, daß mit ihm ein erster Adresscode gemäß dem Dokument (D^) erzeugbar ist, daß ein Multiplexer (58) vorgesehen ist, der den Adresscode in einem ersten

8098U/0590

<oe») aaaaea telsx oe-aeseo telbqramme monapat telekopiercr

ORIGINAL INSPECTED

Zustand und einen zweiten Adresscode in einem zweiten Zustand empfängt, um die adressierbaren Speicherstellen in dem Speicher (55) auszuwählen, daß eine Begrenzungs-Diskriminatoreinrichtung (60, 61, 65, 64, 65, 70, 71; 75, 80) vorgesehen ist, mit der der serielle Datenstrom (B) parallel zum Speicher (55) empfangbar ist und mit der lie vertikalen und horizontalen Begrenzungen eines Zeichens auf dem Dokument (D.) feststellbar und die Koordinaten der Begrenzung aufzeichenbar sind, daß eine Erkennungseinrichtung (100, 115) vorgesehen ist, die ausgewählte Mustercodes einer Mehrzahl von Zeichen enthält, und daß eine Verknüpfungseinrichtung (101, 102) vorgesehen ist, mit der die Mustercodesund die Begrenzungskoordinaten empfangbar sind und die nach Maßgabe einer bestimmten Kombination der empfangenen Daten die zweiten Adresskoordinaten erzeugt.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet , daß die Erkennungseinrichtung (100) einen Vergleicher aufweist zum Vergleichen der Testmuster bei den zweiten Adresskoordinaten mit einer entsprechenden ersten Adresskoordinate in dem Speicher (55).
3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet , daß die Testpunkte in jedem der Testmuster so ausgewählt sind, daß die Trefferzahl für ein Zeichen möglichst groß und die Trefferzahl für alle übrigen Zeichen möglichst klein ist.
4. Einrichtung nach Anspruch 3» dadurch gekennzeichnet , daß die Testpunkte (X, 0) eines Testmusters nacheinander mit dem Inhalt des Speichers

8098U/0590

ORIGINAL INSPECTED

(55) verglichen werden.
5. Zeichenerkennungssystem zum automatischen Erkennen alphanumerischer Zeichen auf einem Dokument, dadurch gekennzeichnet, daß eine Dokument-Abtasteinrichtung (20) vorgesehen ist, mit der das wesentliche Reflexionsvermögen des Dokuments (D.) abtastbar ist und mit der mehrere für dieses Reflexionsvermögen repräsentative Signale erzeugbar sind, daß mit der Abtasteinrichtung (20) ein Speicher (55) verbunden ist, der zum Speichern der Reflexionssignale in einer Matrix gemäß den Koordinatenstellen des Dokuments (D.) dient, daß eine Zeichen-Trennungseinrichtung (56, 57» 61, 64, 65, 70, 71) mit der Abtasteinrichtung (20) zum Unterscheiden der vertikalen und horizontalen Begrenzungskoordinaten eines Zeichens auf dem Dokument (D.) und zum Speichern einer hierzu entsprechenden Zeichenzentrumsadresse verbunden ist, und daß eine Erkennungseinrichtung (100) vorgesehen ist, in der eine Mehrzahl von Testmustern gemäß einem Satz alphanumerischer Zeichen enthalten ist und der mit dem Speicher (55) und der Trennungseinrichtung (56, 57, 61, 64, 65, 70, 71) zum Transponieren der Testmuster um die Zentrumsadresse und zum Vergleichen des transponierten Testmusters mit den entsprechenden Reflexionssignalen in dem Speicher (55) verbunden ist.
6. Einrichtung nach Anspruch 5, dadurch gekennzeichnet , daß das Testmuster eine Mehrzahl von Testpunktkoordinaten (X, 0) enthält, die so ausgewählt sind, daß mit ihnen für ein Zeichen eine maximale Trefferzahl errreichbar ist, und daß für alle anderen Zeichen eine minimale Anzahl von Treffern erreicht wird.

8098U/0590
7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet , daß bestimmte, ausgewählte Testpunkte durch eine logische ODER-Verknüpfung kombiniert werden.
8. Einrichtung nach Anspruch 7, dadurch gekennzeichnet , daß die Abtasteinrichtung (20) eine seriellarbeitende Ablaufsteuerung (20 ) aufweist zum anordnen der Reflexionssignale in einen binären Datenstrom (B), und daß die Trennungseinrichtung (56, 57 > 61, 64, 65, 70, 71) eine seriell arbeitende Prüfeinrichtung (61, 63, 64, 65, 70, 71, 75, 80) aufweist, mit der der binäre Datenstrom (B) empfangbar ist zum Prüfen ausgewählter Abschnitte des Datenstroms (B) und zum Erzeugen eines ersten und zweiten horizontalen und eines ersten und zweiten vertikalen Satzes von Begrenzungssignalen bei Nichtvorhandensein einer Zeichenreflexion oder -Wiedergabe in den ausgewählten Abschnitten.
9. Einrichtung nach Anspruch 8, dadurch gekennzeichnet , daß die Testpunkte (X, 0) eines Testmusters solange nacheinander für eine Transponierung und einen Vergleich mit einem entsprechenden Reflexionssignal ausgewählt werden, solange jeder Vergleich erfolgreich ist.
10. Zeichenerkennungssystem zur Verwendung in einer Faksimile-Abtastvorrichtung zum Abtasten der Reflexionskraft eines Dokuments, dadurch gekennzeichnet , daß mit der Abtasteinrichtung (20) ein Speicher (55) verbunden ist zum speichern der abgetasteten Reflexionssignale auf dem Dokument (D.) an entsprechenden Adressteilen, daß eine Trennungseinrichtung (56, 57, 61, 64, 70, 75, 80) mit der Abtasteinrichtung (20) verbunden ist, um in deren Ausgangsgrößen die Koordinaten eines Zeichens auf dem

8098U/0590

Doment (D.) zu trennen, bzw. zu isolieren, und daß eine Mustererzeugungseinrichtung (100) vorgesehen ist, um ausgewählte Reflexionssignale in dem Speicher (55) mit einem vorbestimmten Satz von Zeichenmustern» die um die durch die Trennungseinrichtung(56, 57» 61, 64, 70, 75» 80) gewonnenen Zeichenkoordinaten transponiert sind, zu vergleichen, wobei die Erzeugungseinrichtung (100) ausgewählte Testpunkte in dem Satz von Mustern enthält, die gemäß einer logischen ODER-Verknüpfung kombiniert sind, um statistische Abweichungen in dem isolierten Zeichen akkommodieren.
11. Einrichtung nach Anspruch 10, dadurch gekennzeichnet , daß der Satz von Zeichenmustern mehrere Untergruppen enthält, von denen jede einem speziellen alphanumerischen Zeichen entspricht, und daß die Testpunkte in jeder Untergruppe so ausgewählt sind, daß die Anzahl der Treffer für ein isoliertes Zeichen im wesentlichen maximal wird, und die Anzahl der Treffer für alle übrigen Zeichen im wesentlichen minimiert wird.
12. Einrichtung nach Anspruch 11, dadurch gekennzeichnet , daß die Testpunkte in einer Untergruppe nacheinander mit den Inhalten des Speichers (55) verglichen werden, und daß beim ersten Auftreten einer Nichtübereinstimmung die nächste Untergruppe verwendet wird.

8098U/0590