DE2740105A1 - Optische zeichenerkennungseinrichtung - Google Patents
Optische zeichenerkennungseinrichtungInfo
- Publication number
- DE2740105A1 DE2740105A1 DE19772740105 DE2740105A DE2740105A1 DE 2740105 A1 DE2740105 A1 DE 2740105A1 DE 19772740105 DE19772740105 DE 19772740105 DE 2740105 A DE2740105 A DE 2740105A DE 2740105 A1 DE2740105 A1 DE 2740105A1
- Authority
- DE
- Germany
- Prior art keywords
- character
- document
- memory
- test
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Description
Die Erfindung betrifft optische Zeichenerkennungseinrichtungen, insbesondere Faksiirile-Übertragunssysteme, die zusätzlich
eine Zeichenerkennungslogik zum Interpretieren gedruckten Textes und zum Reduzieren solchen Textes in einen Standardcode
aufweisen.
Die Übertragung von Faksimile-Signalen geschieht in den meisten Fallen über Telefonleitungen und aus diesem Grund muß zusätzlich
zu den Einrichtungskosten mit den anteilmäßigen Kosten für eine Übertragung aber weite Entfernungen gerechnet werden.
TTm die Kosten des verwendeten Nachrichtennetzes zu reduzieren wurden bisher verschiedene Kompressionstechniken erfunden, um
die Faksimile-Daten auf einen minimalen Datenbetrag, der notwendig ist, ein graphisches Bild zu übermitteln, zu komprimieren.
Typischerweise wurde eine derartige Kompression dadurch erreicht, daß entweder die Lauflängen oder die Redundanz schwarzer
und weißer Abtastsignale komprimiert wurde, und zwar ungeachtet
8098U/0590
(OSO) aageea
MONAPAT
des speziellen abgetasteten Zeichensymbols. Gleichzeitig
mit dieser Entwicklung gab es andere parallele Entwicklungen, bei denen optische Zeichenerkennungssysteme geschaffen
wurden, die zum automatischen Lesen einer Eingangsgröße für digitale Computer verwendet wurden. Obschon es
noch viele Bereiche einer möglichen Verbesserung bezüglich des Kompressionsbetrages gibt, welche bei der direkten,
kontinuierlichen Faksimile-Übertragung Anwendung finden, so sind doch die wichtigsten Bereiche bezüglich der Redundanz
ausgenutzt, und die meisten noch zu verzeichnenden Durchbrüche auf diesem Gebiet haben keine wesentliche
Auswirkung auf die Gesamtübertragungszeit. Da die meisten als Faksimile zu übertragenden Dokumente gedruckten Text
aufweisen, verspricht eine Zeichenerkennung großen Erfolg "beim Vermindern der Ubertragungszeit. Somit scheint der
meistversprechendste Weg beim Erhöhen der Übertragungsgeschwindigkeit
im Bereich der Kodierung oder im Komprimieren mittels optischer Zeichenerkennung zu liegen. Dieses letztgenannte
Verfahren weist in Zusammenhang mit Faksimile-Systeme zusätzliche Vorteile auf, da in dem Fall, daß
bestimmte Bereiche des Dokuments nicht durch das System erkannt werden können, auf einen normalen Faksimile-Betrieb
zurückgeschaltet werden kann. Da die Zeichenerkennung somit dem Faksimile-Betrieb überlagert ist, benötigt das Erkennungssystem keine absolute Genauigkeit.
In den meisten Anwendungsfällen stellt gedruckter Text den
am meisten signifikanten Inhalt des Hauptanteils der Faksimile-Übertragung
dar. Gedruckter Text jedoch ist bisher niemals zufriedenstellend standardisiert worden und es gibt
derzeit verschiedene verwendete Typensätze, die bei der Darstellung der Zeichen Verwendung finden. Bisher wurden
schon Schrifttypensätze wie der OCR-B-Typensatζ entwickelt,
jedoch aufgrund der Tatsache, daß dieser keine universelle Anwendung findet, ist eine Erkennung auch anderer Schrifttypen
erforderlich, und jedes automatische Erkennungssystem
8098U/0590
sollte einfachen Modifikationen zugänglich sein, um einigen anderen vorherrschenden Schrifttypen Rechnung zu tragen.
Dem Problem verschiedener Schrifttypensätze übergeordnet ist das Problem, daß für jede spezielle Druckereinrichtung oder
jede Schreibmaschine, mit der ein spezieller Typensatz ausgedruckt wird, eine veränderliche Genauigkeit gegeben ist.
Betrachtet man beispielsweise den mittels einer herkömmlichen Schreibmaschine gedruckten Text, so existieren neben
den Änderungen des Schrifttypen-Stils die Veränderungen aufgrund der Herstellungstoleranzen der Typen selbst, Schwankungen
aufgrund von Farbaufhäufungen in den Zwischenräumen der Zeichen, Schwankungen in der Qualität des verwendeten Papiers,
Beeinflußungen durch Schmutz oder auf dem Papier vorhandene Markierungen und aufgrund der Genauigkeit, mit der ein Zeichen
auf das Papier übertragen wird. Diese zuletztgenannten
Schwankungen werden oft auch als "Druckqualität" bezeichnet.
Herkömmliche Zeichenerkennungssysteme verwenden in Wirklichkeit eine Zeichenschablone, wobei derartige Schablonen durch
einen digitalen Code gebildet werden; wenn eine spezielle, digitalisierte Abtastung eines Zeichens mit der Schablone
übereinstimmt, so wird eine Zeichenerkennung angezeigt. Dieses Schablonenverfahren benötigt jedoch einen umfangreichen,
punktweisen Datentest und besitzt darüberhinaus nicht die gewünschte Flexibilität, um die oben erwähnten Probleme der
Druckqualität zu berücksichtigen. Aus diesen Gründen wurde versucht, das Problem mit verschiedenen statistischen Korrelationstechniken
zu lösen, um somit den Hauschabstand des Zeichens selbst zu verbessern. Weitere Arbeiten auf dem Gebiet
der Schablonenkorrelation haben zu dem Schluß geführt, daß viele Zeichen, wenn nicht sogar alle Zeichen in einem
Alphabet, die in den gebräuchlichsten Schrifttypen gedruckt sind, nicht eine vollständige Schablonen-Ablesung benötigen,
8098U/0590
um eine Übereinstimmung zu erhalten. Insbesondere wurde
herausgefunden, daß nur bestimmte Bereiche eines Zeichens positiv identifiziert zu werden brauchen, um einen Schluß
auf die Identität des Zeichens zu ermöglichen.
Die Identifizierung solcher ausgewählter Erkennungsmerkmale,
wie sie oben beschrieben wurde, wird typischerweise in Ausdrücken auf der Basis einer Schwarz-Weiß-Unterscheidung
eines Faksimile-Systemes ausgeführt. Da sich bei einem Faksimile-System normalerweise Grenzen der Auflösung sowohl
bezüglich des Abtastrasters als auch der digitalisierten Inkremente entlang der Abtastrichtung ergeben, was allgemein
als Bildzellen oder Bildelemente (Pixels) bezeichnet wird, so bedeutet die Ausrichtung des Abtastrasters oder
der Bildelemente bezüglich des Zeichens eine weitere Fehlerquelle. Dies wird allgemein als "Deckungsfehler" bezeichnet.
Die meisten herkömmlichen Systeme, die die oben beschriebenen Muster-Erkennungstechniken verwenden, um einen solchen Deckungsfehler
zu vermeiden, wählen innerhalb der Zeichenumhüllung zentrierte Zeichen-Mustersegmente aus, die zur Identifikation
der Zeichen verwendet werden. Hieraus resultiert ein zusätzliches Problem: Gewisse kleine Bereiche, die äußerlich ähnliche
Zeichen voneinander unterscheiden, werden durch diese Muster-Erkennungstechniken nicht berücksichtigt. Beispielsweise
erscheint ein derartiges Detail zwischen der Ziffer "1" und dem Buchstaben "I" in den meisten Fällen als kleiner
Vorsprung in der rechten oberen Ecke des Zeichens "I". Der Verlust dieser Daten bei der Verwendung genau zentrierter
Daten-Erkennungspunkte führt zu Verwechslungen zwischen der Ziffer "1" und dem Buchstaben "I". Auf ähnliche Weise kann
die Ziffer "2" leicht mit dem Buchstaben "Z" verwechselt werden, da bei bestimmten Schrifttypen nur die obere rechte
Kurve der "2" den Unterschied bezüglich des Buchstabens "Z"
8098U/0590
ausmacht. Wiederum erscheint dieser Abschnitt des Zeichens in vielen Typen als dünnes Segment, und aus diesem Grunde
muß entweder die Dichte des Abtasterrasters erhöht werden, oder es müssen fehlerhafte Ausgabegrößen akzeptiert werden.
Das Abtastraster oder die Bildelementdichte stellen normalerweise einen Hauptkostenfaktor in jedem Faksimile-System dar;
es wurden schon Abtastsysteme entwickelt, bei denen die Elementdichte aufgrund des Zeichenabstandes und der Schrifttypenhöhe
ausgewählt wurden. Um die Kosten niedrig zu halten sollte jedes Zeichenerkennungssystem derartige standardisierte
Abtasteinrichtungen verwenden, woraus sich eine Begrenzung auf diese Detail-Dichte ergibt. Darüberhinaus ergibt sich
ein Anwachsen der Kosten durch die Abtastdichte, die neben den durch die Standardisierung entstehenden Kosten zu berücksichtigen
ist; denn sowohl die Datenrate als auch der Umfang müssen vergrößert werden.
Aus diesem Grund is 1^ es eine allgemeine Aufgabe und ein
allgemeines Ziel der vorliegenden Erfindung, ein logisches System anzugeben, daß zur Verwendung in einem Faksimile-Gerät
geeignet ist und durch das gedruckte Zeichen abgetastet, erkannt und anschließend in irgendeinen standardisierten Zeichencode
zur Übertragung oder Speicherung umgewandelt werden.
Weitere Ziele der Erfindung liegen darin, ein optisches
Zeichenerkennungssystem anzugeben, daß gemäß Boole'schen
Diskriminatoren Zeichen lediglich durch Auswertung gewisser Bereiche des Zeichens identifiziert.
Ein weiteres Ziel der Erfindung liegt darin, ein Zeichenerkennungssystem anzugeben, bei dem sich kleine Deckungsfehler
nicht auswirken.
Diese und weitere Ziele werden gemäß der vorliegenden Erfindung durch die Verbindung eines otischen Erkennungssystems
8098U/0590
- jfr - ΛΛ
neuartigen Aufbaus mit einem Faksimile-Abbildungssystem erreicht. Das Faksimile-System selbst ist bezüglich der
Aufnahmeeinrichtungen herkömmlich ausgebildet, und es enthält eine Einrichtung zum Abtasten eines für die Übertragung
bestimmten Dokuments oder Bildes in einem speziellen Raster, zum Digitalisieren jeder Abtastung in eine feste
Anzahl von Abtast-Inkrementen, und zum Vergleichen jedes
Inkrements mit einem voreingestellten Schwellenwert, um
zu bestimmen, ob das Reflexionsvermögen des diesem Inkrement entsprechenden Dokumentbereichs im Durchschnitt schwarz oder
weiß ist.
Innerhalb des Erkennungsabschnittes ist eine erfindungsgemäße Einrichtung enthalten, die einen ausgewählten Bereich
der abgetasteten Daten, die eine m χ η - Matrix von Bildelementen umfassen, zur Lokalisierung eines Zeichens untersucht.
Dies wird bewerkstelligt durch eine Suche nach zwei leeren Reihen oder Spalten, die von schwarzen Elementen
getrennt sind. Wenn auf diese Weise das Vorhandensein eines Zeichens festgestellt ist, so wird der begrenzte Bereich
registriert, und zwar gemäß einer zentralen Position zwischen diesen weißen Spaltenbereichen, die die Zeichen voneinander
trennen, sowie den weißen Reihenbereichen zwischen den Zeilen. In diesen registrierten Koordinaten werden dann bestimmte
Schwarz-Weiß-Bildelemente ausgewählt und mit einer fortlaufenden Liste von Zeichen-Unterscheidungsmerkmalen verglichen,
die in einem Festspeicher (ROM) gespeichert sind. Jedes Zeichen-Unterscheidungsmerkmal (Zeichendiskriminante) ist
eine Boole'sehe Funktion, die als Ergebnisse die Werte wahr
oder falsch liefert als Antwort auf einen speziellen Bildelementbereich.
Diese Funktionen gehören zu der Klasse der Produktsummen und bestehen aus der ODER-Verknüpfung eines
oder mehrerer Ausdrücke. Jeder Ausdruck besteht aus verschiedenen Boole'sehen Bedingungen, die miteinander UND-verknüpft
werden. Diese Boole'sehen Bedingungen können dreierlei Art
8098U/0590
sein; natürliche Variable, die es erfordern, daß ein Bildelement den Wert wahr (schwarz) hat; komplementäre Variable,
die es erfordern, daß ein Bildelement den Wert falsch (weiß) hat, und "ODER"-Tests, die es erforderlich machen, daß ein
Satz von drei aneinandergrenzenden Bildelementen (entweder in vertikaler, horizontaler oder diagonaler Richtung) wenigstens
ein wahres.Element enthalten. Diese letztgenannte Bedingung ermöglicht es, daß die Logik relativ unempfindlich
bezüglich der durch Kantenstörungen oder leichte Fehlregistrierungen des abgetasteten Zeichens verursachten Fehlern
ist.
Somit liefert das erfindungsgemäße Zeichenerkennungssystem zwei Arten festgestellter Fehler. Die erste Fehlerart tritt
auf, wenn alle Boole'sehen Zeichendiskriminanten für das
abgetastete Eingabebild ausgewertet sind und keine Übereinstimmung gefunden wurde; die zweite Fehlerart tritt auf,
wenn mehr als eine Übereinstimmung zwischen dem abgetasteten Zeichen und den verschiedenen, in dem Speicher abgespeicherten
Zeichenmustern auftreten. Bei jedem festgestellten Auftreten eines Fehlers kann das System veranlaßt werden,
in eine normale direkte Faksimile-Übertragungsart überzugehen, in der das Zeichen Bildelement für Bildelement übertragen wird.
Unentdeckte Fehler treten auf, wenn der in Frage stehende
Bildelementbereich repräsentativ ist für ein bestimmtes Muster (z.B. "I"), die Logik dies jedoch unkorrekt als ein
anderes Muster (z.B. "1") identifiziert. Diese Klasse von Fehlern wird für gewöhnlich als Substitutionsfehler oder
Vertauschungsfehler bezeichnet.
Im folgenden wird die Erfindung anhand eines Ausführungsbeispiels unter Bezugnahme auf die Zeichnung näher erläutert.
Es zeigen:
Fig. 1 Eine Seitenansicht einer vereinfachten Darstellung eines Abtast-Transportsystems, daß in Zusammenhang
mit der vorliegenden Erfindung zweckmäßiger Weise 8098U/0590
verwendet werden kann,
Fig. 2 eine Draufsicht des in Fig. 1 gezeigten Systems,
Fig. 3 einen Abtastbereich eines Dokuments ohne Bezug
gemäß der vorliegenden Erfindung,
Fig. 4- einen begrenzten Bereich eines eingeordneten Abtastbildes
eines Zeichens, entwickelt gemäß der vorliegenden Erfindung
Fig. 5 eine verallgemeinerte logische Implementierung gemäß
der vorliegenden Erfindung,
Fig. 6 ein Zeichenmuster eines Zeichens, daß die Bereiche der größten Unterscheidung verdeutlicht,
Fig. 7 eine erfindungsgemäß verwendete Speicherfeldanordnung,
Fig. 8 eine detailierte Implementierung eines Zeichen-Erkennungs-Untersystems
gemäß der vorliegenden Erfindung,
Fig. 9 ein Zeichen-Bildelementmuster, das in Konkurrenz zu
dem in Fig. 6 gezeigten Zeichen steht,
Fig.10 ein Zeichen-Bildelementmuster, das aus einer UND-Verknüpfung
einer statistischen Probe der Varianten des in Fig. 6 gezeigten Zeichens entstanden ist,
Fig.11 ein Zeichen-Bildelementmuster einer ODER-Verknüpfung
einer statistischen Probe der Varianten des in Fig. 6 gezeigten Zeichens,
Fig.12 ein Zustandsdiagramm zur Verdeutlichung der vorliegenden
Erfindung,
Fig.13 eine datailierte Implementierung einer in der Beschreibund
erläuterten logischen Einrichtung und
Fig.14 eine detailierte Implementierung einer weiteren logischen
Anordnung.
Die nun folgende Beschreibung eines erfindungsgemäßen Zeichenerkennungssystems
stellt nur eine mögliche Ausführungsform dar. Es sei insbesondere darauf hingewiesen, daß ebensogut eine
Implementierung mit größeren Chips oder auf einer höheren Integrationsstufe erfolgen kann.
8098U/0590
Allgemeine Funktionsweise
Das in Fig. 1 dargestellte erfindungsgemäße OCR-System (optisches Zeichenerkennungssystem) ist allgemein mit dem
Bezugszeichen 50 versehen. Es ist mit einem herkömmlichen Abtaster-T^ansportsystem 10 verbunden, welches ( inen Führungsmechanismus 11 umfaßt, auf dem ein Stapel von Dokumenten
D angeordnet ist. Ein Dokument D. wird auf die Abtastanordnung
12 übertragen. Über dem Dokument D. ist eine Lichtquelle
13 angeordnet, die von einer elektrischen Spannungsquelle E betrieben wird, um einen Lichtstrahl L durch eine
Zylinderlinse 14 auf die Oberfläche des Dokuments D-. zu
lenken. Das Licht L wird dann durch eine weitere Zylinderlinse 16 auf eine Fotodiodenanordnung 20 gelenkt; von der
Diodenanordnung 20 führt eine Signalabζweigung zu dem erfindungsgemäßen
und nun zu beschreibenden optischen Zeichenerkennungssystem 50. Nach Abschluß einer vollständigen Abtastung
des Dokumente D. wird dieses durch mehrere gegenüberliegend
angeordnete Rollen 21 in ein Aufnahmefach 22, daß auf der oberen Fläche eines Stapelmechanismus1 25 vorgesehen
ist, geleitet. Mit dem Ausgang des Systems 50 ist ein Ubertragungsgerät 150 verbunden, das über einen Koppler
mit einem Telefonnetz 152 oder direkt mit einem Computer oder
einer anderen Daten-Sammelanlage (nicht gezeigt) verbunden ist.
In dieser Konfiguration ist eine gewöhnliche Transporteinrichtung vorgesehen; eine derartige Einrichtung wird beispielsweise
ausführlicher beschrieben in den Benutzer- und Werkshandbüchern für das Papiertransportsystem RIT 200 der
Firma Input Business Machines, Inc. beschrieben. Aus diesem Grund wurde die obige Beschreibung auch auf die wesentlichen
Elemente beschränkt, und bezüglich detailierterer Information sei auf die oben genannten Literaturstellen verwiesen.
Die oben erwähnte Fotodiodenanordnung 20 ist als lineares
8098U/0590
Feld von Sensoren ausgebildet, wie sie beispielsweise durch die Firma Ret icon Company unter der Modell-Nummer
RL 32 vertrieben werden. Ein derartiges Feld enthält
mehrere nebener.nander angeordnete fotoempfindliche Elemente
und weiso Taktgeber- und Selbstrasterungseinrichtungen auf, die so angeordnet sind, daß für jedes fotoempfindliche
Element etwa eine Abtastauflösung entsprechend einer öffnung von 0,0322 cm erreicht wird.
Die Implementierung der Fotodiodenanordnung 20 ist darüberhinaus so getroffen, daß für die jenigen Bereiche, in
denen das durchschnittliche, durch die darunterbefindliche
öffnung gelangende reflektierte Licht des Dokuments D^ unterhalb eines bestimmten Schwellenwertes liegt, das
bedeutet, daß das Dokument dort schwarz ist, eine logische Ausgangsgröße der Fotozelle erhalten wird, die einem
binären Wert "High" oder plus eins (+1) entspricht, während wenn das Papier in demselben Öffnungsbereich weiß ist,
der logische Pegel "low" oder null (0) ist.
Die selbe Implementierung ist als Draufsicht in Fig. 2
gezeigt. Es versteht sich, daß die hier gezeigte Implementierung lediglich beispielhaft ist, und daß andere Einrichtungen
zum Vorrücken und Abtasten eines Dokuments in Zusammenhang mit dem zu beschreibenden System verwendet
werden können. In Fig. 2 werden die selben Dokumente oben von dem Stapel D in Richtung der Pfeile A auf die Oberfläche
der Abtastanordnung 12 geleitet. In dieser Darstellung erscheint die Fotodiodenanordnung 20 als lineares
Feld, das quer zu der Richtung der Pfeile ausgerichtet ist und mehrere Fotozellen 3O/.-3O aufweist. Wird somit das
Dokument D. durch die Rollen 21 vorwärts "bewegt, so schaltet
jeder Taktzyklus diesen Bereich 20 schrittweise fort, welcher aus diesem Grund einen neuen binären Code annimmt,
indem die BIT-Positionen 1 bis η jeweils einen neuen binären
Wert annehmen, und zwar entsprechend den Reflexionseigenschaften des nun unter der Anordnung 20 befindlichen Doku-
8098U/0590
- -vr -&
mentbereichs. Dieser binäre Code, der als parallele Signalverzweigung
B angedeutet ist, wird dem erfindungsgemäßen optischen Zeichenerkennungssystem 50 zugeleitet, und somit
wird dem System Abschnitt für Abschnitt ein digital quantisiertes
Schwarz-Weiß-Bild eines Abschnittes des Dokuments D^
zugeführt.
Durch Auswahl eines hinreichend breiten Abtastbereiches 20 (m BIT breit) und eine Abtastzykluszahl von η Zyklen kann
in dem hier beschriebenen System ein m χ η - Feld verwendet werden..Ein derartiges Feld ist in Fig. 3 gezeigt. Aus
Gründen der Vereinfachung wird im folgenden jede unterschiedliche Öffnung als Bildzelle oder Bildelement (Pixel)
P bezeichnet; dieses umfaßt in horizontaler Richtung eine Abtastzyklus-Periode, die durch einen Abtast-Taktgeber 20
in dem selbst-rasternden Fotodiodenbereich 20 abgeleitet wird, und es umfaßt in vertikaler Richtung die Längsabmessung
einer einzelnen Fotozelle 30,, bis 30 . In dieser
Darstellung sind mehrere Bildelemente P gezeigt, von denen einige schwarz sind und Pg bezeichnet sind, und von denen
einige weiß sind und mit Py gekennzeichnet sind. Es soll
hier festgehalten werden, daß im normalen oder optimierten Fall dieser binäre m χ η - Bereich insgesamt 2m x n möglichen
unterschiedlichen Codeworten oder Untergruppen entspricht. Darüberhinaus liegen zu Beginn die Feld- oder
Bereichskoordinaten willkürlich bezüglich des Dokuments, was zur Folge hat, daß ein Zeichen mit unverständlichen
Abschnitten angrenzender Zeichen innerhalb des m χ η - Bereichs liegen kann. Es ist dieser relativ große und willkürlich angesprochene
Bereich, auf den sich die vorliegende Erfindung in der Hauptsache bezieht; dies geschiet durch logische
Zentrierung des Zeichens und durch Auswahl der günstigsten Untergruppen der MxN- Elemente oder Bildpunkte P, wodurch
die richtige Zeichenerkennung mit hoher Wahrscheinlichkeit erfolgt.
Um diese Erkennung zu erreichen, ist es notwendig, daß zuerst
80 9 8U /0 590
- Mt -1>
27A0105
ein Zeichen getrennt und zentriert und daß daraufhin eine logisch ausgewählte minimale Anzahl von Bildelementen innerhalb
des Zeichens untersucht werden, wobei gemäß der Polarität
der Bildelemente unmittelbar eine Identifizierung mit einem
gewünschten- Wahrscheinlichkeitsgrad geliefert wird. Da jedes
Bild notwendigerweise entsprechend der Anzahl der Bildelemente P oder der Auflösung der Abtasteinrichtung quantisiert
wird, ist nur eine Approximation der Zeichenkanten möglich. In Fig. 4- ist ein bezüglich eines Koordinatenzentrums C
zentrierter Buchstabe A in einem Feld mit MxN diskreten
Bildelementen P gezeigt. Innerhalb dieses Feldes sind mehrere mit O gekennzeichnete Testpunkte ausgewählt,um zu verifizieren,
ob die örtlichen Bildelemente weiß (Py) sind, und es sind mit
X gekennzeichnete schwarze Testpunkte ausgewählt, um das Vorhandensein von schwarzen Bildelementen (Pg) zu verfizieren.
Mittels einer ent scheidungswirksamen Auswahl der Testpunkte X
und O ist es möglich, eine schnelle Bestimmung des Zeichens A zu erhalten.
Zuerst ist jedoch erforderlich, daß das Zeichen bezüglich einem Koordinaten.z ent rum C zentriert wird, da jede Art von
Fehlern aufgrund von Fehlregistrierungen beispielsweise durch eine Abwärtsverschiebung des Zeichens, unmittelbar ein
fehlerhaftes Lesen wenigsten zwei der musterhaften Testpunkte X zur Folge hat. Wie weiter unten noch gezeigt werden wird,
wird diese Registrierung dadurch erreicht, daß im oberen Bereich eines m χ η - Feldes begonnen wird und die erste
Reihe gefunden wird, in der nicht alle Elemente weiß sind, und indem im unteren Bereich des Feldes begonnen wird und
die erste Reihe gefunden wird, in der nicht alle Elemente weiß sind; sind diese Reihen einmal gefunden, so wird daraus
geschloßen, daß das Zentrum des Zeichens in vertikaler Richtung in der Mitte dieser Zeilen liegt. Auf ähnliche Weise
werden in horizontaler Richtung die Abmessungen des Zeichens bestimmt, in dem die erste und letzte Spalte bestimmt werden,
in denen nicht alle Elemente weiß sind.
8 098U/0590
27AO105
Wie in der Zeile S gezeigt ist, sind die Kanten des Buchstabens A nur näherungsweise durch die entsprechenden
Bildelemente P-g als Folge der Abtast-Quantisierung
der Bildelemente P in diskrete schwarze und weiße (Pg und Py) Elemente beschrieben. Darüberhinaus hängt der Bildelement-Schwellenwert
in jedem Fall von der durchschnittlichen Reflexionseigenschaft des Ausschnitts dss Dokuments
D. ab und ist somit abhängig von der Druckgenaiigkeit der
Zeichenkante. Somit wird das gesamte Zeichen A quantisiert, und entlang seinen Kanten hängt der Zustand der Bildelemente
sowohl von der Kantengenauigkeit des Zeichens als auch von
der Registrierung oder Deckung ab. Somit kumulieren sich sowohl der Deckungsfehler als auch der Fehler, der aufgrund
des Effekts der Kantengenauigkeit entsteht, woraus sich ein kumulativer Fehler ergibt, der durch die noch zu beschreibende
logische ODER-Anordnung akkommodiert wird. Wird somit der Testpunkt X bei M = 8 und N = 15 in vertikaler Richtung
einer ODER-Kombination unterworfen, wie es durch die Phantom-Koordinate Z angedeutet ist, so werden sowohl
die Effekte der Kantengenauigkeit als auch der Registrierung, bzw. Deckung in einfacher Weise ausgeschaltet. In anderen
dargestellten Beispielen kann sowohl eine vertikale als auch eine horizontale ODER-Verknüpfung ausgeführt werden,
oder aber auch eine diagonale ODER-Verknüpfung. Auf diese
Weise werden jegliche Deckungsfehler, Kantenstörungen oder Störeffekte aufgrund der Druckqualität durch einfache ODER-Logik
ausgeschaltet, wobei das einzige durch das System $0 zu lösende Problem darin liegt, die Registrierung und die
Bestimmung der Wahrscheinlichkeit durchzuführen, mit der diese vier Testpunkte X in Kombination mit den Testpunkten
innerhalb des selben Rahmens ein Zeichen A mit einem hinreichenden Grad an Zuverlässigkeit repräsentieren.
Das Registrierungssystem
Wie in Fig. 5 gezeigt ist, liefert die Abtasteinrichtung
eine serielle Ausgangsgröße B an einen Vergleicher 51 mit
8098 U/0590
- ψ - 15
einer Taktrate, die durch den Abtast-Taktgeber 2Oq bestimmt
wird. Der Ausgang des Vergleichers 51 liefert dann - entsprechend der Taktrate des Taktgebers 2Oq - die Eingangsgrößen
an das System 50. Genauer gesagt wird der Ausgang
des Vergleichers 51 der Datenklemme IN eines großen Schreib-/
Lese-Speichers (RAM) 55 zugeführt, und zwar unter einer Adresse, die Bit für Bit den Abtastkoordinaten des Dokuments
entspricht.
Die Adresskoordinaten wiederum werden durch zwei Adresszähler hergeleitet, d.h., durch einen Spaltenzähler 57, der die
aufeinanderfolgenden Taktimpulse des Taktgebers 20^ zählt
und der somit das Dokument D. in diskrete Reihen unterteilt
und durch einen Reihenzähler 56, der das höchstwertige Bit
des Zählers 57 aufaddiert. Die Zähler 56 und 57 werden gesammelt
als ein Adresseingang an einen Multiplexer (MUX) 58 geleitet, der den Adresseingang (ADDR)für den Speicher (RAM)
55 darstellt. Die Zähler 56 und 57 stellen somit zwei Ursprungsadresszähler
dar.
In dieser Konfiguration bilden die Inhalte des Schreib-/ Lese-Speichers (RAM) 55 das Ursprungs-m χ η-Feld, das Bit
für Bit und Reihe für Reihe dem Bild auf dem Dokument D.
entspricht. Wie in Fig. 3 zu sehen ist, wird in dem RAM
ein Feld mit einer Größe gespeichert, die wesentlich über die Größe eines vorgegebenen Buchstabens hinausgeht. Sei nun
wiederum Fig. 5 "betrachtet. Jedes Zeichen innerhalb des
Feldes ist ohne Bezugspunkt, es ist willkürlich gemäß dem Zählerstand der Reihen- und Spaltenzähler 56 und 57 angeordnet.
Um die oberen und unteren Begrenzungen eines Zeichens zu unterscheiden, werden die weißen oder leeren Reihen
herausgesucht, die zwei in vertikaler Richtung aneinandergrenzende
Zeichen oder zwei Textzeilen voneinander trennen. Dies wird dadurch bewirkt, daß der serielle Ausgang des
Vergleichers 51 zu einem Eingang eines ODER-Gliedes 60 geführt
wird, welches an seinem Ausgang den seriellen Eingang
8098U/0590
eines Schieberregisters 61 bildet oder treibt. Das Register
61 wird durch den selben Taktgeber 2Oq getaaktet und schreitet
somit synchron mit der Abtasteinrichtung 20 voran. Das Schieberegister 61 ist weiterhin so ausgelegt, daß es eine Anzahl
von Bits aufnimmt, die der Bit-Breite der Abtasteinrichtung 20 entspricht. Der serielle Ausgang des Schieberegisters 61
wird an den anderen Eingang der Verknüpfungsschaltung 60 zurückgeführt, um eine zyklische Schleife zu bilden, durch
die die Abtastsequenz in vertikaler Richtung komprimiert wird. Die parallelen Ausgänge des Schieberegisters 51 werden
am Eingang eines NOR-Gliedes 62 gesammelt; dieses Verknüpfungsglied 62 treibt ein Flipflop 63, das eine Teilung durch
zwei bewirkt, und zwar jedesmal dann, wenn alle Ausgangsgrößen des Schieberegisters 61 "low" sind. Das Flipflop 63
schaltet mit seinem Ausgang Q ein Zählregister 64 "oben weiß", um in dieses Register den laufenden Inhalt des Reihenzählers 56
einzugeben. Der Ausgang φ des Flipflops 63 wiederum schaltet
ein weiteres Register 65, welches den Zählerwert für die nächstfolgende leere Reihe speichert, und zwar wiederum vom
Zähler 56. Die Zähler 64 und 65 wiederum sind mit einem Differenz-Schaltkreis 70 verbunden, der die beiden Zählerstände
subtrahiert und die Differenz der Werte festhält. Diese Zählerstanddifferenz wird dann durch einen Schaltkreis
71 halbiert, um den tatsächlichen Abstand des Reihenzentrums
in dem Schreib-/Lese-Speicher (RAM) zu liefern.
Auf ähnliche Weise werden die horizontalen Begrenzungen des Zeichens für die Zeichenbreite untersucht. Im Gegensatz zur
Reihenbegrenzungs-Schaltung jedoch erfordern die Spaltenbegrenzungen eine zusätzliche Implementierung. Um dieses zu
erreichen, verknüpft eine verallgemeinert dargestellte Begrenzungsschaltung 75 die Ausgänge des Vergleichers 51» des
Reihenzählers 56 und des Spaltenzählers 57 mit dem Taktgeber
2Oq. In einer noch zu beschreibenden Weise übernimmt der Schaltkreis 75 die entsprechenden Spalten-Zählerstände aus
8098U/0590
-0LA
dem Spaltenzähler 57, und zwar an den Stellen, an
jeweils ein vollständig leere Spalte das erste und zweite Mal erscheint. Diese Zählerstände wiederum werden von einem
weiteren Diffenz-Schaltkreis 80 übernommen, der wiederum über eine Teilerschaltung 81 das virtuelle Zentrum des
Zeichens liefert. Ein zusätzlicher Ausgang R vom Schaltkreis 75, der beim zweiten Auftreten einer Leerspalte erscheint,
setzt den Zeichen-Erkennungszyklus in Gang. Die Zeichenerkennung selbst wird durch eine allgemein mit dem
Bezugszeichen 100 versehene Schaltung ausgeführt. Die Schaltung 100 liefert einen sequentiellen Adressausgang
von Testpunkten, die mit den Ausgangsgrößen der Schaltungen 71 und 81 in entsprechenden Addierern 101 und 102 verknüpft
werden, um die auf das Zentrum des Zeichens bezogene Adresse als eine weitere Eingangsgröße an den Multiplexer
58 zu liefern.
Der Erkennungs-Algorithmus
Bevor mit der Beschreibung der Einzelheiten der Implementierung
des vorliegenden Systems fortgefahren wird, soll zunächst die für die Erkennung der Zeichenmuster entwickelte Technik
erläutert werden. Anstatt einen herkömmlichen Schablonentest zu verwenden, verwendet die vorliegende Erfindung
Boole'sehe Diskriminaten oder Unterscheidungsgrößen, um
ein Zeichen zu erkennen. Genauer gesagt wird, nachdem das Zeichen zentriert ist, eine logische Auswahl von Testpunkt-Koordinaten aus dem System 100 ausgelesen, und dann wird
jede Testpunkt-Koordinatinate mit den entsprechenden Inhalten
des Speichers 55 verglichen.
Dies sei anhand von Fig. 8 näher erläutert. Diese genannten Koordinaten werden in verschiedenen Feldern eines Festspeichers
(ROM) 115 gespeichert, zusammen mit dazugehörigen Bits für jedes Feld, welche die gewünschte Polarität oder binären Wert
der T«stpunkte kennzeichnen. Mittels dieses Polaritätsfeldes
8098U/0590
werden die oben erwähnten Testpunkte wahr, falsch und "ODER" gesetzt.
ROM 115 kann beispielsweise eine vollständige Liste der
Testpunkte enthalten, die notwendig sind, um die Zeichen eines oder mehrerer Typensätze zu identifiziere 1. Eines
der Merkmale der vorliegenden Erfindung besteht in der Technik der Auswahl solcher Testpunkte. Diese Testpunkte
werden in einem grundlegenden Boole'sehen Test verwendet,
um zu entscheiden, welches Zeichen abgetastet wurde. Durch statistische Auswertung von annähernd 200 - 1000 Wiedergabemöglichkeiten
desselben Typensatzes wird eine Boole'sehe
Punktion für jede Kategorie (Zeichen) in dem Typensatz
gemäß einem Optimierungs-Algorithmus entworfen. Dieser Algorithmus kann etwa durch die folgenden Schritte beschrieben
werden:
1. Auffinden all^r Testpunkte, die die Wahrscheinlichkeit
eines falschen Treffers in der speziellen Zeichenkategorie vermindern, d.h., Testpunkte, die
eine Herabsetzung der Wahrscheinlichkeit bewirken, daß die Funktion bei nicht korrekten Zeichen eine
Antwort 'Wahr" ergibt;
2. Innerhalb der im Schritt 1 ausgewählten Untergruppe nur jene Testpunkte auswählen, bei denen eine minimale
Wahrscheinlichkeit besteht, daß Zeichen aus derjenigen Kategorie, für die die Funktion entworfen
wurde, verfehlt werden;
3. Herausgreifen des Testpunktes aus der im Schritt 2 entwickelten Untergruppe, der mit der geringsten
Wahrscheinlichkeit einen falschen Treffer liefert;
. 4. Einfügen der ausgewählten Variablen in die Funktion.
Wenn die Wahrscheinlichkeit eines falschen Treffers null ist, so ist der Ausdruck vollständig. Wenn die
Wahrscheinlichkeit eines Verfehlens ebenfalls null
8098U/0590
ist, dann ist die Funktion vollständig. 5. Wenn die Funktion nicht vollständig ist, werden
die "Übung·sdaten" untersucht, die Wahrscheinlichkeitsabsciatzungen
modifiziert, und es werden die Schritte 1-4 wiederholt, bis die Funktion vollständig
ist.
Dann werden die Testpunkte gemäß der folgenden Funktion verknüpft:
Ausdruck 1
Ausdruck 2
wobei der Ausdruck 1 vollständig ist, wann immer die nächste Variable Vx. . . eine Wahrscheinlichkeit von O- für das Auftreten
eines falschen Treffers liefert. Auf ähnliche Weise ist die Funktion, die in diesem Fall den Ausdruck 2 enthält,
vollständig, wenn die Wahrscheinlichkeit für ein Verfehlen = O ist. Demnach arbeitet die Funktion in zwei
Richtungen; eine Richtung dient zum Trennen der Zeichenkategorie von anderen,zum Verwechseln ännlichenKategorien,
die zweite Richtung dient zum Herausgreifen eines Textpunktes aus jenen trennenden Testpunkten, welche die geringste
Chance eines Verfehlens bietet. Die Funktion f. ist weiterhin erweitert, um die oben erwähnte ODER-Verknüpfung
mittels der Testpunkte T^, T1- und T.g zu umfassen,
um einen Ausgleich, bzw. eine Akkommodierung der Kanten- und Registrierungsprobleme zu erreichen.
Mit Hilfe dieser Technik kann ein Satz von Testpunkten
8098U/059Q
X und O in den Festspeicher (ROM) 115 eingeschrieben
werden, welcher in der schnellstmöglichen Abfolge ein Zeichen identifiziert. Eine beispielhafte Auflistung
der Testpunkte für ein "o" ist unten angegeben, wobei gleichzeitig Bezug genommen wird auf Fig. 6, in der
dieses Zeichen in einem MxN- Feld graphisch dargestellt
ist (gezeigt ist das Bildelementmuster eines OCR-B-Zeichens, Amerikanische Version).
DEFINITIONEN: | ausgewählt | Klasse 3 = | Vertikal | OR | Kl.=3, | falsche | Tr.=2846, | M=O |
ausgewählt | Klasse 2 = | Horizontal OR | Kl.=2, | falsche | Tr.=1036, | M=O | ||
ausgewählt | Klasse 1 = | Komplementär | Kl.=1, | falsche | Tr.=420 , | M=O | ||
ausgewählt | Klasse O = | Natürlich | Kl.=3, | falsche | Tr.=178 , | M=O | ||
ausgewählt | : Sp.=13, | Zeile=i5, | Kl.=1, | falsche | Tr.=78 , | M=O | ||
V | ausgewählt | : Sp.= 7, | Zeile=2i, | Kl.=1, | falsche | Tr.=15 , | M=O | |
V | ausgewählt | : Sp.= 7, | Zeile=i6, | Kl.=1, | falsche | Tr.=7 | M=O | |
V | ausgewählt | : Sp*= 6, | Zeile=1O, | Kl.=1, | falsche | Tr.=3 , | M=O | |
V | ausgewählt | : Sp.= 9, | Zeile=i5, | Kl.=1, | falsche | Tr.=1 , | M=O | |
V | ausgewählt | : Sp.= 6, | Zeile=23, | Kl.=2, | falsche | Tr.=0 , | M=O | |
V | : Sp.= 1, | Zeile=2i, | ||||||
V | : Sp.= 7, | Zeile=i8, | ||||||
V | : Sp.= 8, | Zeile=7 , | ||||||
, V | : Sp.= 1, | Zeile=15, | ||||||
V | ||||||||
wobei M = Verfehlen.
Unter Bezugnahme auf oben stehende Tabelle erkennt man, daß jede nachfolgende Variable V so ausgewählt wird, daß die
Anzahl von falschen Treffern minimiert wird. In entsprechender Notation werden die in Fig. 6 gezeigten Testpunkte X und
ausgewählt für die Prüfung bezüglich der transformierten Elemente in Speicher 55 in der oben angegebenen Folge. Auf ähnliche
Weise ist das in Fig. 9 dargestellte, konkurierende Zeichen "e" durch einen einzelnen Testpunkt 0 in Reihe 15,
8098U/0590
Spalte 9 unterscheidbar. Gemäß der oben angegebenen Tabelle wird dieser Test wesentlich oberhalb des Testendes ausgeführt
und ist aus diesem Grund wesentlich nützlicher als die oben erwähnte einzelne Unterscheidung.
Um die Effizienz des vorliegenden Algorithmus1 hervorzuheben,
sollten die Fig. 10 und 11 betrachtet werden. In Fig. 10 sind alle getesteten Störvarianten eines einzelnen
Schriftzeichens "o" durch eine logische ODER-Verknüpfung
kombiniert. Auf ähnliche Weise sind in Fig. 11 dieselben Störvarianten mittels einer logischen UTiD-V erknüpf ung
kombiniert. Die meisten herkömmlichen Systeme dieser Art betrachten entweder die logische ODER-Verknüpfung (Korrelation)
oder die UND-Verknüpfung (Schablone). Der vorliegende Algurithmus verwendet nicht einmal eine der UND-Koordinaten,
ausgehend von der Tatsache, daß eine solche die Wahrscheinlichkeit von falschen Treffern nicht hinreichend verbessert.
Das arithmetische Äquivalent dieses Algorithmus' kann wie
folgt angegeben werden:
DNFH/DNGH * MAX NEGATIV
und P Verfehlen 4 0
wobei DNFH die Änderung der Zahl falscher Treffer bedeutet und DNGH die Veränderung der Anzahl richtiger Treffer für
jede neue Variable V bedeutet.
Dieser Algorithmus in seiner parellen Form kann sequentiell implementiert werden, um die Verarbeitungszeit zu optimieren.
In dieser Implementierung wird eine Testfolge entsprechend
dem in Fig. 12 gezeigten Zustandsdiagramm eingeführt. Wie aus dieser Fig. hervorgeht, beginnt der erste Schritt S^
mit dem ersten Zeichen in einem Schriftzeichensatz und fährt
fort, im zweiten Schritt S~ die erste Variabel V zu testen.
Bei Fehlschlagen des Tests wird in der Folge unmittelbar zu
8098U/0590
einem neuen Zeichen fortgeschritten, wie es durch den Schritt S angedeutet ist. Auf ähnliche Weise verzweigen
alle anderen Tests (S^ und S^) zum Schritt Sn bei einem
Fehlschlag. Somit wird mit minimalem Hardware-Aufwand eine Folge von Schritten abgearbeitet, die entweder tatsächlich
ein erkanntes Zeichen findet oder fehlschlägt.
Wie in Fig. 7 gezeigt ist, ist der Festspeicher (ROM) 115 in verschiedene Felder unterteilt, wobei jedes Feld für
sich gemäß herkömmlichen Techniken adressierbar ist. Hierzu sei ein Beispiel angegeben: Ist ein Test erfolgreich, so
wird die Adresse auf das nächste Feld erhöht, welches einen Adresszeiger auf die nächste zu testende Testpunkt-Koordinate
enthält. Wenn der die Test die anfängliche Adresse verfehlt, so beginnt die nächste Adresse mit der Untersuchung eines
nachfolgenden Zeichens. Dies wird dargestellt in Ausdrücken der Felder F^, F^, ... Nächster von denen <3edes für sich
durch die Eingangs&iresse ausgewählt ist und von denen jedes
ein Ausgangssignal erzeugt. Innerhalb jedes Feldes Fx., F^,...
gibt es aus diesem Grunde einen Abschnitt SA, der in einem binären Code die Reihen- und Spaltenkoordinaten der Testvariablen
V, die oben in dezimaler Form gezeigt wurde, enthält. Die letzten zwei Bits, die in der Zeichnung mit OP
(Operation) und TE (Test) bezeichnet sind, bedeuten die vier oben beschriebenen Klassenzustände.
Somit enthält der Festspeicher 115 Wörter zweierlei Typs; Wörter "nächste Adresse" und logische Kodierwörter. Das
Wort "nächste Adresse" tritt am Beginn eines jeden neuen Ausdrucks auf und zeigt auf den nächsten neuen Ausdruck
(der ein Ausdruck derselben logischen Funktion oder der erste Ausdruck der nächsten logischen Funktion sein kann).
Darüberhinaus enthält dieses Wort zwei Statusbits EOT und EOF. Wenn EOT den Wert "wahr" hat, so bedeutet dies, daß
dieser Ausdruck der letzte Ausdruck des gesamten Logiksatzes
8098U/0590
- 22 -
27AO105
ist, und wenn er fehlschlägt, ist der Test beendet. Wenn EOF den Wert "wahr" hat, so bedeutet dies, daß der nächste
Ausdruck den Anfang der nächsten Funktion darstellt.
Die logischen Kodierwörter enthalten die für das Abmessen des Status' der Boole'sehen Variablen benötigte Information,
die in den verschiedenen Ausdrücken der verschiedenen Funktionen benötigt wird. Die enthaltenden Felder sind: Reihe, Spalte,
Type, EOT und EOF.
Implementierung der Erkennungslogik
Das als Beispiel dienende, oben beschriebene Zustandsdiagramm ist in dem oben erwähnten Festspeicher (ROM) 115 implementiert,
welcher in einer in Fig. 8 gezeigten Schaltung enthalten ist.
Die Erkennungslogik 100 weist den Festspeicher (ROM) 115 auf, der einen Ausgang mit einer Breite von η Bit hat; ein Abschnitt
dieses Ausgangs ist mit SA bezeichnet und ste.llt die Adresseneingangsgrößen dar, die zu den Zentrums-Koordinaten in den
Addierern 101 und 102 addiert werden. Die übrigen zwei Bits bilden den Befehls- oder Instruktionscode.Um die Erkennungslogik zu erläutern, soll an dieser Stelle eine vereinfachte
Implementierung besprochen werden. Der Festspeicher 115 liefert η - Bits-Ausgangsgrößen, von denen das mit SA gekennzeichnete
Feld mit einem Ausgabepuffer 155» einem Eingangs-Auswahlpuffer
160 und einem Adressregister 170 verbunden ist. Zwei Bits B.. und B^2 stellen den Befehlscode
dar, der oben als Klasse bezeichnet wurde. Die Bits B^x. und
B^p werden durch entsprechende Negatoren 172 und 174- an
komplementierenden NAND-Gliedern 171 und 175 gesammelt. Das Verknüpfungsglied 171 steuert das Laden des Registers 170,
während das Verknüpfungsglied 175 den Ausgangspuffer 155 steuert. Das Adressenfeld SA wird somit geladen, um entweder
8098U/0S90
eine Ausgangsgröße zu erzeugen, oder als nächste Adressinstruktion
zu wirken. Das Register 170 wiederum ist über einen Adresspuffer 165 mit den Adresseingängen des Festspeichers
115 verbunden. Der Puffer 165 erhöht (inkrementiert) oder lädt gemäß der Polarität eines EXKLUSIV-ODER-Gliedes 162,
an dessen Eingang daß dem Bildelement im Schreib-/Lesespeicher 55 entsprechende Bit und das Bit B.ρ zusammengeführt
werden. Es sind somit das Bit B^ und das Bildelement-Bit
gleich, so wird eine neue Adresse in den Puffer geladen. Im anderen Fall erfolgt im Adresspuffer eine
Inkrementierung.
Die Auswahl der Bitkoordinaten wird durch einen Eingang-Auswahlpuffer
160 ausgeführt, der die Reihen- und Spaltenkoordinaten den Addierern 101 und 102 zuführt, damit sie
gemäß der Zentrierungsverschiebung, die oben beschrieben
wurde, transponiert werden.
Auf diese Weise kann das System fortschreiten, bis ein Code "Ende der Funktion" (EOF, end of function) beim Ausgangspuffer
155 erzeugt ist. Dies identifiziert eine Zeichenerkennung. Da es jedoch manchmal möglich ist, daß zwei
oder mehrere Zeichenidentifikationen für ein Bildelement-Muster vorliegen, ist eine zusätzliche Logik vorhanden,
mit der alle Zeichen geprüft werden, und eine Erkennung wird nur dann registriert, wenn ein Zeichen identifiziert
ist.
Diese zusätzliche Logik umfaßt ein Register 301 für das "laufende Zeichen"; dieses Register empfängt vom Puffer
eine Eingangsgröße NCHAR, die angibt, welches Zeichen im Augenblick getestet wird. Der Inhalt dieses Registers wird,
wenn der Code EOF "Ende der Funktion", durch den Puffer abgeleitet ist, in ein Register 302 "erkanntes Zeichen"
geladen.
8098U/0590
Gleichzeitig akkumuliert ein Zähler 303 die aufeinanderfolgenden
Signale EOF, Vielehe dann mittels eines Vergleichers 3O^ verglichen
werden, um zu sehen-, ob mehr als eine Zeichenerkennung vorliegt. Ist dies der Fall, so gibt es zwei konkurrierende
Zeichen, und am Ausgang eines UND-Gliedes 305 wird eine
Zurückweisung angezeigt. Wenn lediglich ein Zeichen erkannt wurde, so wird eine Sperrschaltung 306 aktiviert,
um die Identifikationszahl dieses Zeichens zu registrieren. In der obigen Sequenz werden die zuvor beschriebenen ODER-Tests
durch einen Code angegeben. Die nachstehend angegebene beispielhafte Codesequenz zeigt diese Funktion, bei der
ein Code der Bits B^. und B^p folgender Art verwendet wird:
B11 B12
0 0 Horizontales ODER
0 1 Vertikales,ODER
1 0 Natürlich
1 1 = Komplementär
Linkes Bit 1 = EINGANG 0 = Aus9-Nächster ^ Eingang = Zustand
0 Laden ADR 0 0 0 0 110
1 INTBT 001110100
2 INTBT 001100100
3 INTBT 010000100
* 4 Laden ADR Nächster Ausdruck
8098U/0590
Stelle
5 6
7 8
Inhalt
INTBT Laden |
ADR | 11111 Nächster |
1 | ö | 1 | 1 | 1111 Ausdruck |
1 | O | O |
INTBT | O | 1 | 1 | O | O | 1 | ) | 1 | 1 | |
INTBT | O | 1 |
n+1 n+2
Laden ADR "Nächstes Verfehlen" INTBF (23) (12)
Laden ADR "Nächster Treffer" (Adresse)
Implementierung des Systems
Wie in Fig. 13 gezeigt ist, und wie auch schon oben geschildert
wurde, ist der Ausgang des Vergleichers 51 niit
dem ODER-Glied 60 verbunden.. An dem zweiten Eingang empfängt das Verknüpfungsglied 60 den seriellen Ausgang eines allgemeinen
Schieberegisters 61, daß in dieser Fig. in Form von mehreren Vierfach-D-Flipflop 61^ - 61 dargestellt ist;
diese als Chips ausgebildeten Flipflops können beispielsweise solche sein, wie sie von der Fa. Texas Instruments
unter Modellbezeichnung SN 74-175 angeboten werden. Die
Ausgänge Q jedes Flipflops sind mit dem nächsten D-Eingang
in Kaskade geschaltet, wodurch ein Schieberegister mit einer Anzahl von Bits entsteht, welche gleich einer Abtast-Bitzählung
der Abtasteinrichtung 20 ist. Um dieses Register mit dem Abtaster zu synchronisieren, wird jedes Chip
61^ - 6in durch den Abtast-Taktgeber 20c getaktet. Die entsprechenden
Ausgänge (J der Chips 61^- 6in wiederum werden
zwei parallelen Sätzen von "8 -Leitung-Zu-3-Leitung"
- Prioritätscodierern 64^ _ und
_ n
(z.B. Kodierer
T. I. SN 74-148) zugeführt, welche die oben erwähnten Register
64 und 65 bilden. Zusätzlich liefert diese duale Anordnung
8098U/0590
- 26 -3
der Prioritätskodierer das funktionstnäßige Äquivalent des
Flipflops 63. Die Anordnung der Kaskadeverbindung und der
Eingangsreihenfolge der Kodierer 64 _ und 65^, _ n ist
entgegengesetzt, so daß die Kodierer 64. _ die Zählung
für das obere erste schwarze Bildelement liefern, während die Kodierer 6S. _ den Zähler für den unteren Bereich
darstellen. Der Prioritäts-Flag-Ausgang des Dekoders 64.
wird zusammen mit dem Ausgang des Dekoders 64p den invertierenden
Eingängen eines ODER-Gliedes 63^ zugeführt, während eine ähnliche Verknüpfung der Ausgänge der Kodierer
64p und 64n dem anderen ODER-Glied 63p zugeführt wird.
Zusätzlich verknüpfen mehrer NOR-Glieder 63?· - 63_ die
verschiedenen Code-Ausgänge. Die Verknüpfungsglieder 63,i - 63 bilden in bekannter Weise den binären Code für
die Zählung des oberen schwarzen Bildelements in Form des Signalzweigs OBEN. In einer ähnlichen Konfiguration bilden
mehrere ODER- und NOR-Glieder 66^ - 66n in Eine-Komplement-Darstellung
einen Zähler UNTEN für den unteren Bereich. Die Zweige OBEN und UNTEN werden dann den Eingängen A und B
einer Adüeranordnung zugeführt, die aus mehreren(SN 74283)-Addierern
bestehen und in der Fig. als Addierer 69,, - 69
in Kaskade geschaltet sind, um auf diese Weise einen Differenz-Zählwert DIF an eine Sperrschaltung 7O^ (SN 74174)
zu liefern. Diese Sperrschaltung bildet in Kombination mit den zuvor erwähnten Addierern die Funktion der Differenzsperre
70. Es sei festgehalten, daß diese Anordnung der Bezeichnungen OBEN und UNTEN willkürlich ist und auf den
Abtast-Zählerstand bezogen ist. Das System kann daher bezüglich des Dokuments D. willkürlich orientiert sein. Die einzige
notwendige Bedingung besteht darin, daß die Spalten-Erkennungslogik, wie oben beschrieben wurde, auf die Abtastsequenz
bezogen ist.
In einer ähnlichen Anorndung ist die Suche nach einer ersten und zweiten Leerreihe implementiert. Die Einzelheiten der
Implementation jedoch weichen etwas ab, und aus diesem Grund
8098U/0S90
- 3? -?><L 27A01
sei an dieser Stelle auf Fig. 14 verwiesen. Wie in dieser Fig. zu sehen ist, ist der Ausgang des Vergleichers 51 mit
der J-Klemme eines J-K-Flipflops 275 verbunden, welches an
seiner K-Klemme geerdet ist. Dies Flipflop wird durch den
Taktgeber 20 getaktet, wobei dieser Takt durch einen Negator 276 invertiert wird; der Takt wird daher bei der
nächsten nach dem ersten Auftreten eines schwarzen Bildelements folgenden Taktperiode "high". Auf ähnliche Weise
ist ein Fliflop 277 verschaltet. Das Flipflop 275 wird bei jedem neuen Abtastzyklus durch ein Signal SCAN gelöscht,
und das Flipflop 277 wird durch das "Ende der Reihe"-Inkrementsignal
ROM gelöscht, welches durch einen Negator 181 invertiert wird und vom höchstwertigen Bit des Spaltenzählers
57 stammt. Der Ausgang Q des Flipflops 275 und der Ausgang Q des Flipflops 277 werden zusammen einem UND-Glied
278 zugeführt, welches ein D-Flipflop 279 ansteuert, welches wiederum durch das Signal ROW getaktet wird. Die
Ausgänge Q und Q des Flipflops 279 steuern jeweils die "Chip-Freigabe" -Klemmen der zwei sperrenden Register 285
und 286 an; diese Register sperren oder halten jeweils den Zählerstand der laufenden Spalte vom Zähler 57. Die Ausgänge
der Sperren 285 und 286 liefern dann die Eingangsgrößen A und B eines Addierers 288; hierbei wird der Ausgang der
Sperre 286 durch einen verallgemeinert dargestellten Negator 289 in komplementäre Form umgewandelt. Der Ausgang des
Addierers 288 wird dann in eine Sperre 80 eingegeben. Die Signale SCAN und RÜCKSETZEN stellen die Umsehaltsignale
zwischen Speicher-Lesen und Speicher-Schreiben dar, was zuvor allgemein als Signal R bezeichnet wurde. Es soll festgestellt
werden, daß die Chipauswahl in Fig. 14 an die Auswahllogik gemäß Fig. 13 anschließt. Aus diesem Grund sollte
für die verschiedenen Chipnummern Bezug genommen werden auf den obigen Text.
Nun sollten viele Fortteile der vorliegenden Erfindung klar sein. Die Erfindung liefert sowohl die Zentrierung eines
8098U/0590
- 28 -l'i
Zeichens in einem fortlaufenden Text, als auch eine sequentielle Testfolge zum Identifizieren dieses Zeichens.
Die sequentielle Form des Identifikationstests und die aufgrund
von Wahrscheinlichkeitsaussagen optimierten Testpunkte ermöglichen es, sehr früh viele Zeichen auszuschließen und
aus diesem Grund -auf statistischer Basis- die Verarbeitungszeit bei der Zeichenerkennung zu reduzieren. Somit schafft
die Erfindung ein leicht aufzubauendes System, welches zum
großen Teil mit Festkörperbauelementen realisierbar ist und aus diesem Grund bei der Verwendung äußerst zuverlässig
ist.
809814/0590
L e e r s e i t e
Claims (12)
- PATENTANWÄLTE Λ. GR'JNtCKERDtPL INGH. KINKELDEYDR-INGΠ / η -ι O Γ W- STOCKMAlRI η U ι U b "* iNG '^<cAi-jecMK. SCHUMANNDR RER NAT DIPU-PHYSP. H. JAKOBD(PL-INGG. BEZOLDDRBERNAT OPL-OtM.8 MÜNCHENMAXIMILIANSTRASSE 43β. Sept. 1377 P 11 764-57/orPatentansprüche/ίο Mustererkennungseinrichtung, die für die Erkennung von Zeichen geeignet ist, mit einer Abtasteinrichtung, die so angeordnet ist, daß sie relativ zu einem Dokument "bewegbar ist und die einen seriellen, digitalen Datenstrom erzeugt, der repräsentativ ist für die Reflexionseigenschaften des Dokuments an den entsprechenden, darunterliegenden Stellen, dadurch gekennzeichnet , daß ein Speicher (55) so angeordnet und verschaltet ist, daß mit ihm der serielle, digitale Datenstrom (B) empfangbar ist, um diesen an entsprechenden addresierbaren Speicherstellen aufzuzeichnen, daß ein Adressgenerator (56, 57) so mit der Abtasteinrichtung (20) verbunden ist, daß mit ihm ein erster Adresscode gemäß dem Dokument (D^) erzeugbar ist, daß ein Multiplexer (58) vorgesehen ist, der den Adresscode in einem ersten8098U/0590<oe») aaaaea telsx oe-aeseo telbqramme monapat telekopiercrORIGINAL INSPECTEDZustand und einen zweiten Adresscode in einem zweiten Zustand empfängt, um die adressierbaren Speicherstellen in dem Speicher (55) auszuwählen, daß eine Begrenzungs-Diskriminatoreinrichtung (60, 61, 65, 64, 65, 70, 71; 75, 80) vorgesehen ist, mit der der serielle Datenstrom (B) parallel zum Speicher (55) empfangbar ist und mit der lie vertikalen und horizontalen Begrenzungen eines Zeichens auf dem Dokument (D.) feststellbar und die Koordinaten der Begrenzung aufzeichenbar sind, daß eine Erkennungseinrichtung (100, 115) vorgesehen ist, die ausgewählte Mustercodes einer Mehrzahl von Zeichen enthält, und daß eine Verknüpfungseinrichtung (101, 102) vorgesehen ist, mit der die Mustercodesund die Begrenzungskoordinaten empfangbar sind und die nach Maßgabe einer bestimmten Kombination der empfangenen Daten die zweiten Adresskoordinaten erzeugt.
- 2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet , daß die Erkennungseinrichtung (100) einen Vergleicher aufweist zum Vergleichen der Testmuster bei den zweiten Adresskoordinaten mit einer entsprechenden ersten Adresskoordinate in dem Speicher (55).
- 3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet , daß die Testpunkte in jedem der Testmuster so ausgewählt sind, daß die Trefferzahl für ein Zeichen möglichst groß und die Trefferzahl für alle übrigen Zeichen möglichst klein ist.
- 4. Einrichtung nach Anspruch 3» dadurch gekennzeichnet , daß die Testpunkte (X, 0) eines Testmusters nacheinander mit dem Inhalt des Speichers8098U/0590ORIGINAL INSPECTED(55) verglichen werden.
- 5. Zeichenerkennungssystem zum automatischen Erkennen alphanumerischer Zeichen auf einem Dokument, dadurch gekennzeichnet, daß eine Dokument-Abtasteinrichtung (20) vorgesehen ist, mit der das wesentliche Reflexionsvermögen des Dokuments (D.) abtastbar ist und mit der mehrere für dieses Reflexionsvermögen repräsentative Signale erzeugbar sind, daß mit der Abtasteinrichtung (20) ein Speicher (55) verbunden ist, der zum Speichern der Reflexionssignale in einer Matrix gemäß den Koordinatenstellen des Dokuments (D.) dient, daß eine Zeichen-Trennungseinrichtung (56, 57» 61, 64, 65, 70, 71) mit der Abtasteinrichtung (20) zum Unterscheiden der vertikalen und horizontalen Begrenzungskoordinaten eines Zeichens auf dem Dokument (D.) und zum Speichern einer hierzu entsprechenden Zeichenzentrumsadresse verbunden ist, und daß eine Erkennungseinrichtung (100) vorgesehen ist, in der eine Mehrzahl von Testmustern gemäß einem Satz alphanumerischer Zeichen enthalten ist und der mit dem Speicher (55) und der Trennungseinrichtung (56, 57, 61, 64, 65, 70, 71) zum Transponieren der Testmuster um die Zentrumsadresse und zum Vergleichen des transponierten Testmusters mit den entsprechenden Reflexionssignalen in dem Speicher (55) verbunden ist.
- 6. Einrichtung nach Anspruch 5, dadurch gekennzeichnet , daß das Testmuster eine Mehrzahl von Testpunktkoordinaten (X, 0) enthält, die so ausgewählt sind, daß mit ihnen für ein Zeichen eine maximale Trefferzahl errreichbar ist, und daß für alle anderen Zeichen eine minimale Anzahl von Treffern erreicht wird.8098U/0590
- 7. Einrichtung nach Anspruch 6, dadurch gekennzeichnet , daß bestimmte, ausgewählte Testpunkte durch eine logische ODER-Verknüpfung kombiniert werden.
- 8. Einrichtung nach Anspruch 7, dadurch gekennzeichnet , daß die Abtasteinrichtung (20) eine seriellarbeitende Ablaufsteuerung (20 ) aufweist zum anordnen der Reflexionssignale in einen binären Datenstrom (B), und daß die Trennungseinrichtung (56, 57 > 61, 64, 65, 70, 71) eine seriell arbeitende Prüfeinrichtung (61, 63, 64, 65, 70, 71, 75, 80) aufweist, mit der der binäre Datenstrom (B) empfangbar ist zum Prüfen ausgewählter Abschnitte des Datenstroms (B) und zum Erzeugen eines ersten und zweiten horizontalen und eines ersten und zweiten vertikalen Satzes von Begrenzungssignalen bei Nichtvorhandensein einer Zeichenreflexion oder -Wiedergabe in den ausgewählten Abschnitten.
- 9. Einrichtung nach Anspruch 8, dadurch gekennzeichnet , daß die Testpunkte (X, 0) eines Testmusters solange nacheinander für eine Transponierung und einen Vergleich mit einem entsprechenden Reflexionssignal ausgewählt werden, solange jeder Vergleich erfolgreich ist.
- 10. Zeichenerkennungssystem zur Verwendung in einer Faksimile-Abtastvorrichtung zum Abtasten der Reflexionskraft eines Dokuments, dadurch gekennzeichnet , daß mit der Abtasteinrichtung (20) ein Speicher (55) verbunden ist zum speichern der abgetasteten Reflexionssignale auf dem Dokument (D.) an entsprechenden Adressteilen, daß eine Trennungseinrichtung (56, 57, 61, 64, 70, 75, 80) mit der Abtasteinrichtung (20) verbunden ist, um in deren Ausgangsgrößen die Koordinaten eines Zeichens auf dem8098U/0590Doment (D.) zu trennen, bzw. zu isolieren, und daß eine Mustererzeugungseinrichtung (100) vorgesehen ist, um ausgewählte Reflexionssignale in dem Speicher (55) mit einem vorbestimmten Satz von Zeichenmustern» die um die durch die Trennungseinrichtung(56, 57» 61, 64, 70, 75» 80) gewonnenen Zeichenkoordinaten transponiert sind, zu vergleichen, wobei die Erzeugungseinrichtung (100) ausgewählte Testpunkte in dem Satz von Mustern enthält, die gemäß einer logischen ODER-Verknüpfung kombiniert sind, um statistische Abweichungen in dem isolierten Zeichen akkommodieren.
- 11. Einrichtung nach Anspruch 10, dadurch gekennzeichnet , daß der Satz von Zeichenmustern mehrere Untergruppen enthält, von denen jede einem speziellen alphanumerischen Zeichen entspricht, und daß die Testpunkte in jeder Untergruppe so ausgewählt sind, daß die Anzahl der Treffer für ein isoliertes Zeichen im wesentlichen maximal wird, und die Anzahl der Treffer für alle übrigen Zeichen im wesentlichen minimiert wird.
- 12. Einrichtung nach Anspruch 11, dadurch gekennzeichnet , daß die Testpunkte in einer Untergruppe nacheinander mit den Inhalten des Speichers (55) verglichen werden, und daß beim ersten Auftreten einer Nichtübereinstimmung die nächste Untergruppe verwendet wird.8098U/0590
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US05/728,666 US4034343A (en) | 1976-10-01 | 1976-10-01 | Optical character recognition system |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2740105A1 true DE2740105A1 (de) | 1978-04-06 |
Family
ID=24927807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19772740105 Withdrawn DE2740105A1 (de) | 1976-10-01 | 1977-09-06 | Optische zeichenerkennungseinrichtung |
Country Status (9)
Country | Link |
---|---|
US (1) | US4034343A (de) |
JP (1) | JPS5344128A (de) |
BE (1) | BE859252A (de) |
CA (1) | CA1098210A (de) |
DE (1) | DE2740105A1 (de) |
FR (1) | FR2366639A1 (de) |
GB (1) | GB1584096A (de) |
NL (1) | NL7710705A (de) |
SU (1) | SU648144A3 (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2936667A1 (de) * | 1978-09-12 | 1980-03-20 | Canon Kk | Kopiergeraet |
EP0014758A1 (de) * | 1979-01-16 | 1980-09-03 | International Business Machines Corporation | Vorrichtung zum optischen Lesen von Buchstaben |
EP0184682A2 (de) * | 1981-10-01 | 1986-06-18 | BancTec, Inc. | Digitales Abtastgerät |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4122443A (en) * | 1977-06-24 | 1978-10-24 | Scan Optics, Inc. | Character position detector |
US4163212A (en) * | 1977-09-08 | 1979-07-31 | Excellon Industries | Pattern recognition system |
US4135148A (en) * | 1978-06-07 | 1979-01-16 | Recognition Equipment Incorporated | Character presence detector |
US4204193A (en) * | 1978-11-03 | 1980-05-20 | International Business Machines Corporation | Adaptive alignment for pattern recognition system |
EP0020832A1 (de) * | 1979-06-26 | 1981-01-07 | Excellon Industries | Mustererkennungssystem und Verfahren zu seiner Anwendung |
US4376932A (en) * | 1980-06-30 | 1983-03-15 | International Business Machines Corporation | Multi-registration in character recognition |
US4377803A (en) * | 1980-07-02 | 1983-03-22 | International Business Machines Corporation | Algorithm for the segmentation of printed fixed pitch documents |
JPS57191784A (en) * | 1981-05-20 | 1982-11-25 | Toshiba Corp | Picture data processing system |
FR2513779B1 (fr) * | 1981-09-25 | 1986-07-25 | Sopelem | Dispositif automatique d'analyse statistique d'un objet |
US4499595A (en) * | 1981-10-01 | 1985-02-12 | General Electric Co. | System and method for pattern recognition |
EP0078708B1 (de) * | 1981-11-03 | 1987-03-18 | De La Rue Systems Limited | Einrichtung zur Sortierung von Blättern entsprechend ihren Mustern |
US4541115A (en) * | 1983-02-08 | 1985-09-10 | Pattern Processing Technologies, Inc. | Pattern processing system |
CA1318977C (en) * | 1987-07-22 | 1993-06-08 | Kazuhito Hori | Image recognition system |
JP2659807B2 (ja) * | 1989-01-26 | 1997-09-30 | 万鎔工業株式会社 | 直接製錬方法 |
US5119441A (en) * | 1989-03-28 | 1992-06-02 | Ricoh Company, Ltd. | Optical character recognition apparatus and method using masks operation |
US5274474A (en) * | 1991-01-23 | 1993-12-28 | Randolph-Rand Corporation | Integrated telefacsimile and character communication system with standard and high speed modes |
US6683697B1 (en) * | 1991-03-20 | 2004-01-27 | Millenium L.P. | Information processing methodology |
US5258855A (en) * | 1991-03-20 | 1993-11-02 | System X, L. P. | Information processing methodology |
US5488719A (en) * | 1991-12-30 | 1996-01-30 | Xerox Corporation | System for categorizing character strings using acceptability and category information contained in ending substrings |
US5465156A (en) * | 1992-03-30 | 1995-11-07 | Ricoh Company, Ltd. | Facsimile machine having printer unit and interface |
DK0638187T3 (da) * | 1993-02-23 | 2001-09-24 | Xerox Corp | Kategorisering af strenge ved tegngenkendelse |
US5801842A (en) * | 1994-12-27 | 1998-09-01 | International Patent Holdings Ltd. | Telefacsimile module connectable to telefacsimile machines for transmitting data in standard or high speed modes |
US6023534A (en) * | 1997-08-04 | 2000-02-08 | Xerox Corporation | Method of extracting image data from an area generated with a halftone pattern |
US20090091530A1 (en) * | 2006-03-10 | 2009-04-09 | Kenji Yoshida | System for input to information processing device |
US9152617B2 (en) * | 2010-03-11 | 2015-10-06 | A2iA S.A. | System and method for processing objects |
CN103530598B (zh) * | 2013-03-08 | 2017-02-08 | Tcl集团股份有限公司 | 一种台标识别方法及*** |
US9245181B2 (en) | 2013-07-22 | 2016-01-26 | Xerox Corporation | Method and system for resolution conversion of textual content or magnetic ink character recognition (MICR) content |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3496542A (en) * | 1966-10-27 | 1970-02-17 | Control Data Corp | Multifont character reading machine |
US3947817A (en) * | 1974-01-07 | 1976-03-30 | Recognition Equipment Incorporated | Hand operated optical character recognition wand |
US3992697A (en) * | 1974-12-27 | 1976-11-16 | Scan-Data Corporation | Character recognition system utilizing feature extraction |
-
1976
- 1976-10-01 US US05/728,666 patent/US4034343A/en not_active Expired - Lifetime
-
1977
- 1977-08-09 CA CA284,629A patent/CA1098210A/en not_active Expired
- 1977-09-06 DE DE19772740105 patent/DE2740105A1/de not_active Withdrawn
- 1977-09-26 JP JP11547277A patent/JPS5344128A/ja active Pending
- 1977-09-28 FR FR7729189A patent/FR2366639A1/fr active Granted
- 1977-09-30 SU SU772529646A patent/SU648144A3/ru active
- 1977-09-30 NL NL7710705A patent/NL7710705A/xx not_active Application Discontinuation
- 1977-09-30 BE BE181350A patent/BE859252A/xx not_active IP Right Cessation
- 1977-09-30 GB GB40731/77A patent/GB1584096A/en not_active Expired
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2936667A1 (de) * | 1978-09-12 | 1980-03-20 | Canon Kk | Kopiergeraet |
EP0014758A1 (de) * | 1979-01-16 | 1980-09-03 | International Business Machines Corporation | Vorrichtung zum optischen Lesen von Buchstaben |
EP0184682A2 (de) * | 1981-10-01 | 1986-06-18 | BancTec, Inc. | Digitales Abtastgerät |
EP0184682A3 (de) * | 1981-10-01 | 1986-10-08 | BancTec, Inc. | Digitales Abtastgerät |
Also Published As
Publication number | Publication date |
---|---|
SU648144A3 (ru) | 1979-02-15 |
JPS5344128A (en) | 1978-04-20 |
FR2366639B1 (de) | 1984-01-13 |
NL7710705A (nl) | 1978-04-04 |
BE859252A (fr) | 1978-01-16 |
US4034343A (en) | 1977-07-05 |
GB1584096A (en) | 1981-02-04 |
CA1098210A (en) | 1981-03-24 |
FR2366639A1 (fr) | 1978-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2740105A1 (de) | Optische zeichenerkennungseinrichtung | |
DE3248928C2 (de) | ||
EP1665132B1 (de) | Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten | |
DE2616753C3 (de) | Vorrichtung zum Lesen von strichkodierten Informationen | |
DE2541204C3 (de) | Einrichtung zur Fehlerkorrektur | |
DE3415470A1 (de) | Geraet und verfahren zum codieren und speichern von rasterabtastbildern | |
DE1225426B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Zeichen | |
DE1121864B (de) | Verfahren und Anordnung zum maschinellen Erkennen von Zeichen | |
DE2557553A1 (de) | Verfahren und anordnung zur bilddatenverdichtung und -reexpansion | |
DE3809025A1 (de) | Bereichserkennungseinrichtung | |
DE3612233A1 (de) | Musterpruefverfahren | |
DE2215088A1 (de) | Verfahren und anordnung zur zeichenerkennung | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
DE19530829A1 (de) | Verfahren zum elektronischen Wiederauffinden von einem Dokument hinzugefügter Informationen | |
DE2829808A1 (de) | Verfahren und vorrichtung zum lesen von zeichen | |
DE2321701A1 (de) | Kartenleser mit mehreren lesekanaelen | |
DE102018115158A1 (de) | NC-Programm-Umwandlungseinrichtung | |
DE2435889A1 (de) | Verfahren und einrichtung zum unterscheiden von zeichengruppen | |
DE2146497C3 (de) | Segmentierungs-Vorrichtung für optische Zeichenleser | |
AT223668B (de) | Verfahren und Schaltungsanordnung zur automatischen Erkennung von Schriftzeichen | |
DE1474163A1 (de) | Anordnung zur Fehlerermittlung mit Korrektureinrichtung fuer Schriftzeichenlesegeraete u.dgl. | |
DE3414455C2 (de) | Verfahren und Vorrichtung zum Lesen und Verarbeiten von Information, die aus dekodierbarer Schriftinformation und/oder nichtdekodierbarer Graphikinformation besteht | |
DE2222350B2 (de) | Fehlerdiagnoseeinrichtung fuer eine zeichenerkennungsmaschine und verfahren zu deren betrieb | |
DE2823679C2 (de) | ||
EP0206214B1 (de) | Verfahren zur einheitlichen symbolischen Beschreibung von Dokumentenmustern in Form von Datenstrukturen in einem Automaten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8141 | Disposal/no request for examination |