DE68915950T2 - Verfahren zum Trennen von Zeichen. - Google Patents

Verfahren zum Trennen von Zeichen.

Info

Publication number
DE68915950T2
DE68915950T2 DE68915950T DE68915950T DE68915950T2 DE 68915950 T2 DE68915950 T2 DE 68915950T2 DE 68915950 T DE68915950 T DE 68915950T DE 68915950 T DE68915950 T DE 68915950T DE 68915950 T2 DE68915950 T2 DE 68915950T2
Authority
DE
Germany
Prior art keywords
character
pixel
window
binary
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68915950T
Other languages
English (en)
Other versions
DE68915950D1 (de
Inventor
Oleg Feldgajer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NCR International Inc
Original Assignee
NCR Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NCR Corp filed Critical NCR Corp
Application granted granted Critical
Publication of DE68915950D1 publication Critical patent/DE68915950D1/de
Publication of DE68915950T2 publication Critical patent/DE68915950T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

  • Diese Erfindung bezieht sich auf eine Methode zur Segmentierung von Zeichenabbildern, einschließlich des Schritts der Darstellung einer Matrix von Abbilddaten, wobei die Matrix aus Zeilen und Spalten binärer Bildelemente besteht, die einem Beleg zugeordnet sind, auf welchem sich mindestens ein Zeichenfeld befindet.
  • In den letzten Jahren hat sich ein Trend abgezeichnet, Abbilder von Belegen zu erstellen und, wo immer möglich, die Abbilder der Belege beim Verarbeiten der Information über die Belege zu verwenden. So können z. B. Belege wie Schecks und Einzahlungsscheine dadurch abgebildet werden, daß die Belege an einem Scanner vorbei bewegt werden, der jeden Beleg scannt und von jedem Beleg eine Matrix von "Pixel"-Daten (Bildelementdaten) erstellt. Ein Pixel oder Pel ist als ein Bildelement definiert, das sich auf einen kleinen Bereich des Belegs bezieht, der gescannt wird. Es können sich z. B. 600 oder 900 Bildelemente in einer Scanzeile oder einer vom Scanner erstellten Spalte befinden. Wenn der Beleg beim Abbilden am Scanner vorbei bewegt wird, erstellt der Scanner eine Aufeinanderfolge von Bildelement-Scanzeilen, um für jeden Beleg eine Matrix von Bildelementen zu erstellen.
  • Die Bildelementmatrix vom Scanner wird zum Beispiel durch Schwellenwertbildungen verarbeitet, um jedes Bildelement auf eine binäre "1" oder eine binäre "0" zu reduzieren, wobei die binäre 1 die Anwesenheit von Daten und eine binäre 0 die Abwesenheit von Daten darstellt. Durch diese Technik wird eine Bildelementmatrix für jeden Beleg erlangt, wobei die Bildelementmatrix mit dem Abbild des Belegs korrespondiert. Die einem Beleg zugeordnete Bildelementmatrix kann beispielsweise in einem Arbeitsspeicher gespeichert oder auf einem CRT-Bildschirm abgebildet werden, um von einem Bediener bei der Ausführung von abschließender Datenverarbeitung beispielsweise in einem Bankumfeld eingesehen zu werden.
  • Wie bereits oben erwähnt, enthält die einem Beleg zugeordnete Bildelementmatrix Abbilddaten über diesen Beleg. Wenn es sich bei den zu bearbeitenden Belegen um Bankbelege wie z. B. Schecks handelt, gibt es bestimmte Felder auf dem Scheck, die von Maschinen gelesen werden. Die zu lesenden Felder enthalten Zeichendaten, die in bestimmten Schriftarten wie z. B. E13B und CMC7 gedruckt sind. Bei einer Auflösung von beispielsweise circa 200 Bildelementen pro Zoll (25, 4 mm) auf der Scanzeile ist es möglich, bei der Verwendung der Bildelementmatrix die Zeichen in den Feldern mittels optischer Zeichenerkennungstechniken mit der Maschine zu lesen.
  • Ein Problem beim Arbeiten mit einer Bildelementmatrix ist, daß es nach dem Auffinden des das Zeichen enthaltenden Felds notwendig ist, die Bildelementmatrix in diesem bestimmten Feld zu segmentieren, um die einem Zeichen zugeordneten Bildelemente von den restlichen Zeichen in dem Feld zu trennen. Wenn die jedem Zeichen zugeordneten Bildelemente von dem zugeordneten Feld segmentiert werden, können sie Zeichenerkennungstechniken unterzogen werden. Zu solchen Techniken können beispielsweise gegenverbreitende Neuronalnetze oder andere Netze gehören, die zur Zeichenerkennung verwendet werden können.
  • JP-A-57 50 076 lehrt die Überlagerung aller Zeichen des Schriftartsatzes entlang einer Zeile (bei bekannter Zeichendichte) zur Bildung eines Zeichenfolgeprofils, das zur Identifizierung von Segmentierungslücken in einer Zeichenfolge verwendet wird, während FR-A-2 475 257 die aufeinanderfolgenden Korrelationen einer Bildelementmatrix lehrt, die ein unbekanntes Zeichen mit den Bildelementmatrizes der jeweiligen Bezugszeichen darstellt, um eine Erkennungsentscheidung zu treffen.
  • Es ist ein Gegenstand der vorliegenden Erfindung, eine Methode zur Segmentierung von Zeichenabbildern zu erstellen, die für verschiedene Zeichensätze oder Schriftarten verwendet werden kann.
  • Daher wird laut der vorliegenden Erfindung eine Methode zur Segmentierung von Zeichenabbildern der dargelegten Art erstellt, die durch folgende Schritte charakterisiert wird: (a) Wahl eines Prüffensters, dessen Größe eine vorbestimmte Anzahl von Zeilen und Spalten mit den Bildelementen umfaßt, die einem Zeichen in den Abbilddaten zugeordnet sind; (b) Errechnen einer Wahrscheinlichkeitsdichte für jedes Bildelement innerhalb des Prüffensters für jedes Zeichen in einem zu segmentierenden Zeichensatz, um eine zusammengesetzte Wahrscheinlichkeitsdichte für jedes Bildelement innerhalb des Prüffensters zu erstellen; (c) Positionieren des Prüffensters über einem Teil eines solchen Felds; (d) Erlangen eines Gesamtwerts für das Prüffenster durch Verwendung jedes Bildelements mit binären Einsen im Prüffenster und seiner zugeordneten zusammengesetzten Wahrscheinlichkeitsdichte; (e) Bewegen besagten Prüffensters in bezug auf besagtes Feld und Wiederholung von Schritt (d), um einen maximalen Gesamtwert für das Prüffenster zu erlangen; (f) Verwendung des besagten, durch Schritt (e) erlangten Gesamtwerts als ein Anzeichen dafür, daß das Prüffenster Bilddaten enthält, die einem Zeichen in dem Zeichensatz zugeordnet sind, und (g) Wiederholen der Schritte (c) bis (f) für die verbleibenden Bilddaten, die besagtem Feld zugeordnet sind.
  • Nunmehr wird ein Ausführungsbeispiel der vorliegenden Erfindung anhand eines Beispiels mit Bezug auf die begleitenden Zeichnungen beschrieben, wobei:
  • Abb. 1 ein generelles schematisches Diagramm ist, das eine Vorrichtung zeigt, die zur Ausführung dieser Erfindung verwendet werden kann;
  • Abb. 2 ein schematisches Diagramm ist, das eine Datenmatrix zeigt;
  • Abb. 3 ein schematisches Diagramm ist, das ein "Überlagerungsfenster" zeigt, welches bei der Ausführung dieser Erfindung verwendet wird;
  • Abb. 4 ein schematisches Diagramm ist, das die Wahrscheinlichkeitsdichte für jedes der Bildelemente in einem Prüffenster für einen Satz von Zeichen in einem bestimmten Schrifttyp oder einer bestimmten Schriftart zeigt, wobei die Größe des schwarzen Quadrats (falls vorhanden) innerhalb eines Bildelements die Wahrscheinlichkeitsdichte dieses Bildelements darstellt;
  • Abb. 5 ein Flußdiagramm ist, das einen Prozeß zum Lokalisieren von Datenfeldern beim Prüfen der Zeilen mit Bildelementdaten in einer Datenmatrix für einen Beleg zeigt;
  • Abb. 6 ein schematisches Diagramm ist, das eine Matrix aus Binärdaten zeigt, die einem Beleg zugeordnet sind;
  • Abb. 7 eine Tabelle ist, welche die Anfangs- und Endzeilen und die Anfangs- und Endspalten zeigt, die bestimmten Feldern der in Abb. 6 gezeigten Datenmatrix zugeordnet sind, wie in einem idealen Umfeld festgelegt;
  • Abb. 8 eine Tabelle ähnlich der in Abb. 7 ist, in der die gezeigten Werte jedoch dem entsprechen, was in einem störungsreichen Umfeld zu erwarten ist;
  • Abb. 9 ein Flußdiagramm ist, das einen Prozeß zum Lokalisieren von Datenfeldern beim Prüfen der Datenspalten in einer Datenmatrix für einen Beleg zeigt, und
  • Abb. 10 ein schematisches Diagramm ist, welches ein Überlagerungsfenster zeigt, das über einem Teil des in der Datenmatrix enthaltenen Zeichenfelds positioniert ist.
  • Nunmehr wird ein Prozeß zur Segmentierung von Bildelementdaten beschrieben, die einem Zeichen aus einer Bildelementmatrix in einem optischen Abbildsystem mit Mehrfachzeichensatz zugeordnet sind, um es den einem Zeichen zugeordneten Bildelementdaten zu gestatten, ein Zeichen zur Verwendung in nachfolgenden Arbeitsvorgängen wie z. B. der Zeichenerkennung auszuwählen. Zur Beschreibung des Prozesses ist es hilfreich, auf Abb. 1 Bezug zu nehmen, in welcher die Vorrichtung 10 gezeigt wird, die zur Ausführung der Erfindung verwendet werden kann.
  • Die Vorrichtung 10 beinhaltet eine Artikelbeförderung 12, die einen Artikel, wie z. B. einen Beleg 14 auf eine Scannerzeile 16 zu bewegt, wo der Beleg 14 auf konventionelle Weise von einem Scanner 18 abgebildet wird. Der Scanner 18 produziert beim Vorbeibewegen des Artikels 14 in einer Ablesebeziehung zum Scanner 18 eine Aufeinanderfolge von Scanzeilen oder Spalten von Bildelementdaten oder Bildelementen. Der Scanner 18 könnte beispielsweise ebenso ein Handscanner sein, der zum Zweck des Ablesens über einen stationären Beleg bewegt wird. Vom Scanner 18 wird die Aufeinanderfolge von Bildelementspalten verarbeitet, um die mit den Bildelementen verbundenen Störungen zu minimieren und die Bildelemente durch Schwellenwerte in eine binäre "1" zu verarbeiten, die die Anwesenheit von Daten darstellen kann, und eine binäre "0", welche die Abwesenheit von Daten darstellt. Diese Verarbeitung wird durch konventionelle Schaltlogik bewirkt, die lediglich als Verarbeitungsschaltlogik 20 gezeigt ist. Die Ausgabe der Verarbeitungsschaltlogik 20 ist eine Matrix 22 von (unverdichteten) Binärdaten oder Bildelementen, die mit dem Abbild des zugeordneten Belegs 14 korrespondiert. Die Datenmatrix 22 kann beispielsweise circa 900 Bildelemente pro Spalte mit einer Auflösung von 200 Bildelementen pro Zoll (25,4 mm) enthalten. Natürlich hängt die Gesamtgröße der Datenmatrix 22 von einer bestimmten Anwendung ab, jedoch ist die bestimmte Größe weder für ein Verständnis dieser Erfindung noch für ihren Betrieb von Wichtigkeit. Der Scanner 18 und die Artikelbeförderung 12 können beispielsweise durch einen separaten Regler 24 geregelt werden oder aber durch einen Regler 26, der dazu verwendet wird, die Daten- oder Bildelementmatrix 22 zu verarbeiten.
  • Der Regler 26 (Abb. 1) ist ein konventioneller Regler, der dazu verwendet werden kann, die Bildelementmatrix 22 laut dieser Erfindung zu verarbeiten. Der Regler 26 beinhaltet einen Nur-Lese- Speicher (ROM 28), einen Arbeitsspeicher (RAM 30), eine Tastatur (32), eine Anzeige 34, Schnittstellen 36 und 38 und Schnittstellen- und Schaltlogik 40, die zum konventionellen Verbinden aller abgebildeten Bauteile verwendet wird. Die Form des abgebildeten Reglers 26 wird einfach nur dazu verwendet, eine Diskussion der Arbeitsweise des Reglers 26 zu ermöglichen.
  • Bevor die einzelnen Schritte des dieser Erfindung entsprechenden Segmentierprozesses von Bildelementdaten, denen ein Zeichen zugeordnet ist, im Detail diskutiert werden, ist es nützlich, einige Betriebsgrundsätze des Prozesses zu diskutieren, der im folgenden generell als Prozeß 42 bezeichnet wird.
  • Wenn man eine Bildelementmatrix hat, die mit dem Abbild eines Belegs wie beispielsweise Beleg 14 korrespondiert, so ist es mitunter schwierig
  • herauszufinden, an welcher genauen Stelle sich die bestimmte Information oder die gesuchten Daten in der Matrix befinden. Man nehme z. B. an, daß die in Abb. 2 gezeigte Bildelementmatrix 44 (ähnlich der in Abb. 1 gezeigten Datenmatrix 22) mit dem Abbild eines Belegs 14 korrespondiert. Man nehme ebenfalls an, daß sich die gesuchten Abbilddaten oder Bildelemente in Feld #1 und Feld #2 befinden. Das gesamte in Abb. 2 gezeigte Abbild kann als eine Anzahl von Datenspalten und eine Anzahl von Daten- oder Bildelementzeilen ausgedrückt werden, die in dem beschriebenen Beispiel entweder binäre Einsen oder Nullen sind. So kann z. B. Spalte 0 auf der rechten Seite des Belegs 14 beginnen, während Spalte 600 auf die linke Seite des Belegs 14 zugeht. Entsprechend erscheint Zeile 1 am oberen Ende des Belegs 14, während Zeile 500 auf das untere Ende des Belegs 14 zugeht. Dementsprechend korrespondiert die obere rechte Ecke der Matrix 44 (Abb. 2) mit der oberen rechten Ecke des in Abb. 1 gezeigten Belegs 14. Natürlich können die Spalten und Zeilen auch umgekehrt sein, z. B. in Abhängigkeit des Vorgehens beim Scannen der Belege.
  • Der erste generelle Schritt beim Prozeß des Lokalisierens der in Abb. 2 gezeigten Felder #1 und #2 ist das vertikale und horizontale Verarbeiten der Bildelemente in der Matrix 44. Durch Prüfen der Bildelemente in der Matrix 44 wird festgestellt werden, daß die dem Feld #1 zugeordneten schwarzen Bildelemente oder Bildelemente mit binärer 1 in dem beschriebenen Beispiel bei Spalte 75 beginnen und in Spalte 175 enden. Beim Prüfen der Bildelemente in entgegengesetzter oder Zeilenrichtung kann festgestellt werden, daß Feld #1 bei Zeile 400 beginnt und bei Zeile 430 endet. Entsprechend wird man feststellen, daß Feld #2 bei Spalte 325 beginnt und bei Spalte 525 endet, und man wird ebenfalls feststellen, daß sich dieses Feld zwischen Zeile 450 und Zeile 480 erstreckt. Diese Prüfung kann von einem Regler 26 in Zusammenwirkung mit einem geeigneten Softwareprogramm ausgeführt werden, das im zugeordneten ROM 28 oder RAM 30 resident ist.
  • Das in bezug auf Abb. 2 diskutierte Konzept der Felder #1 und #2 wird dazu verwendet, die Verarbeitung der in einer Bildelementmatrix 44 enthaltenen Bildelemente zu beschleunigen. Wenn man beispielsweise die Breite von Feld #1 kennt, so kann man nach Auffinden der ganz rechts liegenden Kante (wie in Abb. 2 zu sehen) dieses Felds die für das Feld geeignete Anzahl von Bildelementspalten extrahieren. In dem beschriebenen Beispiel erstreckt sich die Breite von Feld #1 zwischen Spalte 75 und Spalte 175. Natürlich würde die für das Feld geeignete Anzahl von Bildelementzeilen ebenfalls extrahiert werden. In dem beschriebenen Beispiel erstreckt sich Feld #1 zwischen Zeile 400 und 430. Ein weiterer, hierin hervorzuhebender Punkt ist, daß obschon die bestimmten Zahlen, die in den Feldern #1 und #2 gezeigt sind, in deutlicher Druckschrift gezeigt sind, um eine Demonstration zu erleichtern, würden die Zahlen tatsächlich in den verschiedenen Schriftarten erscheinen, die hier an früherer Stelle erwähnt wurden.
  • Ein weiteres Konzept, das bei dem Prozeß 42 verwendet wird, ist ein Prüffenster, das als "Überlagerungsfenster" bezeichnet ist. Das Überlagerungsfenster ist dazu ausgelegt, die einem individuellen Zeichen zugeordneten Bildelemente zum Zweck der Prüfung einer bestimmten Schriftart zu bedecken oder zu umfassen. Wenn z. B. Zeichen in der hier an früherer Stelle erwähnten Schriftart E13B gedruckt sind, ist die Zeichendichte für diese Schriftart 0,125 Zoll (3,2 mm). Die Dichte wird als die Distanz von der Führungskante des einen Zeichens zur Führungskante des nächsten, benachbarten Zeichens definiert. Setzt man voraus, daß die Auflösung des zugeordneten Scanners 18 (Abb. 1) 200 Bildelemente pro Zoll (25,4 mm) ist, so hätte das sich daraus ergebende Überlagerungsfenster eine Breite von 25 Bildelementen (0,125·200). Die tatsächliche Höhe eines in der E13B-Schriftart gedruckten Zeichens beträgt 0,117 Zoll (2,97 mm); demnach beläuft sich die Anzahl der in der Höhe des Überlagerungsfensters beinhalteten Bildelemente auf 24. Natürlich hängt die Anzahl der im Überlagerungsfenster beinhalteten Bildelemente von einer bestimmten gewählten Schriftart und von der Auflösung des zugeordneten Scanners 18 ab, der verwendet wird. Außerdem können mit dieser Erfindung zusätzlich auch andere, nicht erwähnte Schriftarten verwendet werden. Mit anderen Worten, jede verwendete Schriftart hat ihr eigenes, bestimmtes Überlagerungsfenster.
  • Ein Prüffenster oder Überlagerungsfenster 46 ist allgemein in Abb. 3 gezeigt, wobei die vertikalen Spalten mit der in Abb. 1 gezeigten Scannerzeile 16 korrespondieren und wobei die Quadrate 48 und 50 mit durch Schwellenbildung verarbeiteten Binärdaten korrespondieren, die in einer Scannerzeile 16 Bildelemente darstellen.
  • Ein Merkmal dieser Erfindung ist, daß Neuronalnetztechnologie oder konventionelle Techniken verwendet werden können, um eine statistisch gleichmäßig verteilte Wahrscheinlichkeitsdichte für jedes im Überlagerungsfenster 46 befindliche Bildelement für einen gesamten Zeichensatz zu erhalten, der in einer bestimmten ausgewählten Schriftart enthalten ist. Die Bedeutung der vorstehenden Aussage wird durch ein Beispiel mehr Klarheit erlangen, das seine Herleitung erklärt.
  • Um ein Beispiel zu geben, muß das Überlagerungsfenster 46 "trainiert" werden, um es dem Prozeß 42 zu ermöglichen, die Segmentierung auszuführen, auf die hier an früherer Stelle verwiesen wurde. Der Trainingsprozeß kann damit beginnen, daß ein bekanntes Zeichen der Prüfung des Überlagerungsfensters 46 unterzogen wird. Diesbezüglich kann die Zahl 1 dem Fenster 46 präsentiert werden, wie in Abb. 3 gezeigt. Zur Vereinfachung der Diskussion nehme man an, daß die Zahl 1 dadurch einfach gestaltet ist, daß sie sich nur über 2 Spalten erstreckt, nämlich über die Spalten X und Y. Natürlich kann sich die Zahl 1, wenn sie in der bestimmten gewählten Schriftart gedruckt ist, über mehr als die beiden erwähnten Spalten erstrecken. Die binären Bildelementdaten würden für dieses Beispiel binäre Einsen in den Spalten X und Y enthalten, wobei bei sämtlichen restlichen Spalten im Überlagerungsfenster 46 binäre Nullen vorliegen. In Abb. 3 sind nur die binären Einsen gezeigt, um deren Demonstration zu vereinfachen. Der Regler 26 registriert oder zählt dann mittels der ihm zugeordneten und beispielsweise im RAM 30 gespeicherten Software die in jeder der Zeilen- und Spaltenpositionen des Überlagerungsfensters 46 vorhandenen binären Einsen.
  • In Fortsetzung des erwähnten Trainingsprozesses wird dem Überlagerungsfenster 46 ein zweiter Abtastwert der Zahl 1 präsentiert. Wiederum werden alle binären Einsen registriert oder gezählt, die im Überlagerungsfenster 46 für die darin enthaltenen diversen Zeilen- und Spaltenpositionen vorhanden sind. Man nehme wiederum an, daß alle binären Einsen in den Spalten X und Y erscheinen, was zu dem Ergebnis führt, daß in jeder der Zeilenpositionen der X- und Y-Spalten eine Summe von 2 enthalten ist. Man nehme an, daß derselbe Prozeß für acht weitere Abtastwerte wiederholt wird, was eine Summe von 10 Abtastwerten ergäbe. Das bedeutet, daß jede der Zeilenpositionen für die Spalten X und Y in sich einen Additionswert von 10 hätte. Diese erwähnten Additionswerte werden im RAM 30 des Reglers 26 in Positionen gespeichert, welche die zugeordneten Zeilen- und Spaltenpositionen für alle Bildelemente im Überlagerungsfenster 46 anzeigen. Um das Erlangte in eine verkürzte Ausdrucksweise zu fassen, kann man sagen, daß eine zweidimensionale Wertefeldgruppe von Werten für die Zahl 1 in der bestimmten Schriftart erlangt wurde.
  • Der im vorangehenden Absatz beschriebene Prozeß wird für alle Zeichen in der bestimmten Schriftart wiederholt. Mit anderen Worten, es werden 10 Abtastwerte für die Ziffer "2", Ziffer "3" usw. für alle Zeichen in dem Zeichensatz erlangt, der einer Segmentierung unterzogen werden soll. Es wird praktisch für jedes Zeichen der Schriftart seine eigene zweidimensionale Wertefeldgruppe (durch Zählen von binären Einsen) errechnet. Dann werden sämtliche errechneten Wertefeldgruppen für jedes Zeichen in dem Satz nach Zeilen- und Spaltenposition addiert, um zu zusammengesetzten Summen für jede Biidelementposition im Überlagerungsfenster 46 zu gelangen. Die zusammengesetzten Summen könnten auch als ein gewichteter Gesamtwert betrachtet werden. Wenn z. B. das Bildelement 52 in der linken oberen Ecke des Überlagerungsfensters 46 für keines der in der bestimmten diskutierten Schriftart enthaltenen Zeichen eine binäre 1 beinhaltet, dann ist die Wahrscheinlichkeit, daß diese Bildelementposition durch ein E13B-Zeichen auf eine binäre 1 gestellt wird gleich Null. Je höher der Wert oder Additionswert für eine bestimmte Bildelementposition ist, desto höher ist die Wahrscheinlichkeit, daß dieses bestimmte Bildelement auf eine binäre 1 gestellt wird, wenn ein Zeichen von einer zugeordneten Schriftart im Überlagerungsfenster 46 vorhanden ist. Bei einem Ausführungsbeispiel hat das Überlagerungsfenster eine Größe von 20 Bildelementen Breite mal 24 Bildelementen Höhe (wie in Abb. 3 zu sehen), was eine Matrix von 480 Bildelementen ergibt.
  • Abb. 4 zeigt ein anderes Ausführungsbeispiel, in dem das Überlagerungsfenster 48 eine Größe von 16 Bildelementen Breite und 22 Bildelementen Höhe hat, wobei die Werte für die einzelnen Bildelemente für den gesamten Zeichensatz gezeigt werden. Die Werte sind durch die jeweilige Größe der schwarzen Quadrate (falls vorhanden) innerhalb der Bildelementbereiche gezeigt. So bedeutet z. B. die Tatsache, daß Bildelement 50 völlig weiß ist, daß die Wahrscheinlichkeitsdichte für dieses Bildelement Null ist. Das völlig schwarze Bildelement 52 repräsentiert eine sehr hohe Wahrscheinlichkeitsdichte für dieses Bildelement für die bestimmte Schriftart, welches durch den in bezug auf Abb. 3 diskutierten Prozeß erlangt wurde. Das Bildelement 54 repräsentiert eine geringe, aber vorhandene Wahrscheinlichkeitsdichte.
  • Nachdem das Überlagerungsfenster 46, wie beschriebene trainiert ist, können zusätzliche Schritte im Prozeß 42 genutzt werden. Die Datenmatrix 22 (Abb. 1) für einen bestimmten Beleg 14 kann im RAM 30 des Reglers 26 gespeichert werden, wie bereits zuvor beschrieben. Wenn an der Datenmatrix 22 für einen bestimmten Beleg 14 gearbeitet werden soll, wird sie vom RAM 30 abgerufen und geprüft, um die Felder #1 und #2 aufzufinden, wie bereits zuvor allgemein beschrieben.
  • Abb. 6 zeigt eine Datenmatrix für einen Beleg, wobei die Matrix mit 56 bezeichnet ist und wobei die Daten aus binären Einsen und Nullen bestehen, wie bereits zuvor beschrieben. In Abb. 6 sind nur die Daten in bezug auf die Felder #1 und #2 gezeigt, um die Zeichnung zu vereinfachen; wie bereits zuvor diskutiert, ist jedoch nicht genau bekannt, wo sich die Datenfelder befinden. Für diese Datenmatrix 56 erscheinen die Anfangsdatenzeilen am unteren Ende des Belegs statt an dessen oberem Ende, wie in bezug auf Abb. 2 diskutiert.
  • Ein Teil des Prozesses 42 beinhaltet das Scannen oder Prüfen der Datenmatrix 56 (Abb. 6) durch den in Abb. 5 gezeigten Prozeß, um bestimmte Datenfelder oder -bereiche auf dem Beleg zu lokalisieren. So kann beispielsweise Feld #1 der Geldbetrag des Belegs sein, während sich Feld #2 beispielsweise auf bestimmte Bank- oder Kundenkontencodes bezieht. Es sollte beachtet werden, daß beispielsweise in den USA die Felder in magnetischer Druckfarbe in der E13B-Schriftart auf dem Beleg selbst gedruckt sind; jedoch beziehen sich die hierin erwähnten Abbild- und Zeichenerkennungstechniken auf optische Datenverarbeitung.
  • Um die Verarbeitung der Daten, die den in Abb. 6 gezeigten Abbilddaten zugeordnet sind, fortzusetzen, beinhaltet der Prozeß 42 das Scannen der Abbilddaten in einer horizontalen Richtung, wie in Abb. 5 gezeigt. Wie bereits zuvor dargelegt, wird die Abbilddatenmatrix 56 im RAM 30 des Reglers 26 gespeichert, und es kann beispielsweise eine im RAM 30 gespeicherte Softwareroutine dazu verwendet werden, die Daten wie in Abb. 5 gezeigt zu verarbeiten.
  • Das Verarbeiten oder Scannen der Datenmatrix 56 wird ausgeführt, um die Begrenzungen oder die Anfangszeile und die Endzeile der den in Abb. 6 gezeigten Felder #1 und #2 zugeordneten Daten festzulegen. Diesbezüglich umfaßt der Prozeß 42 (Abb. 5) den von Block 58 gezeigten Anfangsschritt. Im Prinzip scannt der Prozeß 42 die Datenmatrix 56, indem er immer eine Zeile durch Suchen nach einer binären "1" in dieser Zeile prüft; dies ist durch Block 60 gezeigt. Eine Leerzeile ist eine Zeile, in der sich keine binäre 1 befindet. Wenn die Zeile leer ist (Block 62), holt sich der Prozeß die nächste Datenzeile (Block 64) und sucht wiederum nach einer binären 1 in dieser Zeile. In dem beschriebenen Prozeß wird das Scannen von der in Abb. 6 gezeigten untersten Zeile ausgehend vorgenommen und nach oben in Richtung der obersten Zeile (in Abb. 6 gezeigt) fortgesetzt. Wenn in einer bestimmten Zeile eine binäre 1 gefunden ist, wird diese Zeile als die Anfangszeile des Felds markiert (durch Block 66 repräsentiert). Diese Anfangszeile ist auch in einer in Abb. 7 gezeigten Tabelle 68 verzeichnet, wobei die Tabelle 68 auch im RAM 30 gespeichert ist. Aus Gründen der Veranschaulichung nehme man an, daß das Feld #1 bei Zeile 8 beginnt.
  • Der Prozeß 42 (Abb. 5) fährt mit dem Prüfen der nächsten Zeile fort, wie durch Block 70 dargestellt. Aller Wahrscheinlichkeit nach enthält diese nächste Zeile eine binäre 1, weshalb diese Zeile nicht "leer" ist, wie durch Block 72 dargestellt. An diesem Punkt ist es äußerst wahrscheinlich, daß die Höhe mindestens eines Zeichens angetroffen wird. Folgerichtig wird die nächste Zeile erlangt (Block 74), und dieser Prozeß wird wiederholt, bis eine Zeile ohne eine binäre 1 gefunden wird, womit angezeigt wird, daß diese Zeile leer ist (Block 72) und daß das Feldende erreicht ist, wie durch Block 76 dargestellt. Das Feldende oder die Endzeile wird dann in der Tabelle 68 vermerkt; man nehme an, die Endzeile sei 28, wie in Abb. 7 gezeigt. Wenn diese Zeile 28 beispielsweise nicht die letzte Zeile im Puffer oder RAM 30 für die zugeordnete Datenmatrix 56 ist, wie bei Block 78 abgefragt, wird der Prozeß mit dem Beginn bei dem als Block 60 abgebildeten Prüfschritt wiederholt. Wenn die Zeile 28 die letzte Zeile in der Datenmatrix 56 ist, wird der Prozeß beendet, wie in Block 80 angezeigt.
  • Eine logische Frage bezieht sich an diesem Punkt darauf, wie Anfangs- und Endzeilen für verschiedene Felder festgelegt werden, bei denen in bestimmten Zeilen überlappende Stücke vorliegen. Wenn mehr als ein Datenfeld auf einem wie in Abb. 6 gezeigten Beleg erwartet wird, ist es diesbezüglich besser, nach den Anfangs- und Endspalten der Felder #1 und #2 zu suchen, bevor man nach den zugeordneten Anfangs- und Endzeilen dieser Felder sucht. Dadurch, daß die Anfangs- und Endspalten beispielsweise für Feld #1 bekannt sind, können nur Rohdaten, die sich zwischen diesen Anfangs- und Endspalten befinden, zur Festlegung der Anfangs- und Endzeilen für dieses Feld in Betracht kommen.
  • Das Suchen nach Daten, die den in Abb. 6 gezeigten Feldern zugeordnet sind, ist beim Suchen in einer vertikalen Richtung durch den in Abb. 9 gezeigten Prozeß 42-1 gezeigt. Der Prozeß 42-1 zum Suchen in einer vertikalen Richtung ist mit dem bereits beschriebenen Prozeß 42 zum Suchen in einer horizontalen Richtung identisch. Folgerichtig sind die einzelnen in Abb. 9 gezeigten Schritte durch einzelne Blocks dargestellt, deren Nummern mit den in Abb. 5 gezeigten Blocks korrespondieren, wobei die in Abb. 9 gezeigten Blocks jedoch den Zusatz (-1) haben. So korrespondiert z. B. der Prüfschritt für Zeilen, der in Abb. 5 durch Block 60 dargestellt ist, mit dem Prüfschritt für Spalten, der durch Schritt 60-1 in Abb. 9 dargestellt ist.
  • Die aus dem Ablauf des Prozesses 42-1 (Abb. 9) erhaltenen Werte werden in der in Abb. 7 gezeigten Tabelle 68 gespeichert. Aus Gründen der Veranschaulichung nehme man an, die Anfangsspalte für Feld #1 sei 20 und die Endspalte für dieses Feld sei 120. Entsprechend sei die Anfangszeile und Endzeile für Feld #2 Zeile 4 bzw. 22, wobei die Anfangs- und Endspalten 200 und 600 seien. Die in Tabelle 68 gezeigten Werte sind einfach nur Werte zur Veranschaulichung in einem idealen Umfeld, das beispielsweise störungsfrei ist.
  • Abb. 8 ist eine Tabelle, die einige veranschaulichende Werte für Feld #1 zeigt, wenn die Werte für die Anfangs- und Endzeilen in einem störungsreichen Umfeld erlangt wurden. "Störungen" können beispielsweise von Tintenspritzern oder Hintergrunddaten auf dem Scheck 14 herrühren. Man beachte bei Tabelle 82, daß sich dort bei Zeile 1 eine Anfangszeile und bei Zeile 2 eine Endzeile befindet sowie eine zweite Gruppierung von Anfangs- und Endzeilen bei Zeile 8 bzw. 28. Das Steuerteil 26 weiß, wie die zu erwartenden Höhen der Felder #1 und #2 sind und wird dementsprechend die den Zeilen 1 und 2 zugeordneten Anfangs- und Enddaten als Störung zurückweisen und die Anfangs- und Endzeilen 8 und 28 als gültige Daten akzeptieren. Dasselbe Zurückweisen von Daten als Störung gilt auch beim Scannen der Spalten, da der Regler auch die Breite der zu erwartenden Felder kennt.
  • Nachdem die Extrema der Anfangs- und Endzeilen und Anfangs- und Endspalten für die diversen Felder, wie beschrieben, in einer bestimmten Datenmatrix 56 erlangt sind, ist der nächste Schritt im Prozeß 42 das Verwenden des Überlagerungsfensters 46, das bereits in bezug auf Abb. 3 diskutiert wurde. Wie bereits zuvor erwähnt, reflektiert die Größe des Überlagerungsfensters 46 die Auflösung des Scanners 18 und die tatsächliche Größe der Dichte und der Höhe eines Zeichens in der in einem Feld geprüften Schriftart. Das Feld #1, das bereits in bezug auf Abb. 6, 7 und 8 diskutiert wurde, ist in Abb. 10 in vergrößerter Form gezeigt. Der Regler 26 hat die dem Feld #1 zugeordneten Anfangs- und Endzeilen und Anfangs- und Endspalten in seinem RAM 30, und diese Abbilddaten werden extrahiert, um in bezug auf das Überlagerungsfenster 46 verarbeitet zu werden
  • Das Überlagerungsfenster 46 ist in Beziehung zum in Abb. 10 gezeigten Feld #1 positioniert, so daß der vertikale Mittelpunkt des Prüf- oder Überlagerungsfensters 46 einige Spalten vor dem Mittelpunkt der Dichte für das Zeichen positioniert ist, wenn in einer Prüfungsrichtung vorgegangen wird oder von der rechten Seite des Felds in Richtung auf die linke Seite, wie in Abb. 10 zu sehen. Man nehme beispielsweise an, daß das Überlagerungsfenster 46 eine Größe von 20 Bildelementen Breite und 24 Bildelementen Höhe hat und die Zeichendichte der zu segmentierenden Schriftart 20 eine Breite von 20 Bildelementen hat. In diesem Beispiel befindet sich der vertikale Mittelpunkt des Überlagerungsfensters 46 in Spalte 28, welche sich 8 Spalten von der Anfangsspalte befindet, wie in Abb. 10 gezeigt.
  • Bei einer wie in Abb. 10 gezeigten Position des Überlagerungsfensters 46 addiert der Regler 24 den Informationsinhalt des Überlagerungsfensters 46, um zu einer Summe für diese Fensterposition zu gelangen. Mit anderen Worten, es befinden sich in dem beschriebenen Beispiel 20·24 oder 480 Bildelemente in dem Überlagerungsfenster. Man erinnere sich daran, daß jedes der Bildelemente im Überlagerungsfenster 46 seine zugeordnete Wahrscheinlichkeitsdichte hat, die an früherer Stelle erlangt wurde, wie beim Training des Überlagerungsfensters 46 beschrieben. Jedes der 480 Bildelemente wird geprüft, um zu ermitteln, ob es eine binäre Eins oder Null ist. Für jedes Bildelement, das eine binäre 1 ist, addiert der Regler dessen zugeordnete Wahrscheinlichkeitsdichte, um einen Fenstergesamtwert oder eine Fenstersumme für diese bestimmte Fensterposition zu erhalten, die in dem beschriebenen Beispiel Zeile 28 ist. Andererseits kann der Fenstergesamtwert auch durch die Multiplikation einer im Überlagerungsfenster 46 gefundenen binären 1 mit ihrer zusammengesetzten oder zugeordneten Wahrscheinlichkeitsdichte und dem Addieren der sich daraus ergebenden Werte erlangt werden. Zur Veranschaulichung nehme man an, daß die in dem Beispiel beschriebene Fenstersumme 280 sei. Der Regler 26 bewegt dann das Überlagerungsfenster 46, um die Fenstersumme zu erlangen, wenn sich das Überlagerungsfenster 46 bei Spalte 29 befindet; in dieser Position sei die Fenstersumme 330. Entsprechend sei die Fenstersumme 310, wenn das Überlagerungsfenster 46 zur Spalte 30 bewegt wird. Man beachte, daß das Maximum oder die Fensterhöchstsumme erlangt wurde, als sich das Überlagerungsfenster 46 in dem beschriebenen Beispiel bei Spalte 29 befand. Das bedeutet, daß das Überlagerungsfenster 46 am genauesten in Beziehung zum ersten Zeichen im Feld #1 positioniert ist, wenn der vertikale Mittelpunkt des Prüffensters 46 sich bei Spalte 29 befand.
  • Nach dem Auffinden der Abbilddaten, die in dem beschriebenen Beispiel dem ersten Zeichen in Feld #1 zugeordnet sind, extrahiert der Regler 26 die Bildelemente, die im Überlagerungsfenster 46 enthalten waren, als dieses Fenster bei Spalte 29 vertikal zentriert war; diese Bildelemente innerhalb des Überlagerungsfensters 46 umfassen eine erste Zeichenbildelementmatrix. Diese erste Zeichenbildelementmatrix, die gerade zuvor vom Feld #1 segmentiert wurde, wird dann im RAM 30 gespeichert, um später Zeichenerkennungstechniken unterzogen zu werden, oder sie kann zur Zeichenerkennung zur "Dialogverarbeitung" verarbeitet werden.
  • Die Position der dem zweiten Zeichen im Feld #1 (Abb. 10) in dem beschriebenen Beispiel zugeordneten Abbilddaten ist wie folgt. Da sich der vertikale Mittelpunkt der ersten Zeichenbildelementmatrix bei Spalte 29 befindet, und weil die Zeichendichte der diskutierten Schriftart 20 ist, bewegt der Regler 26 dann das Überlagerungsfenster 46 in Position oder zentriert es bei Spalte 48. Die Position bei Spalte 48 wird dadurch hergeleitet, daß die Zeichendichte (20 Spalten) und die Position des vertikalen Mittelpunkts des vorigen Zeichens (Spalte 29) addiert und um eine Spalte (- 1 Spalte) zurückgestellt wird, um es dem Regler 26 zu ermöglichen, wie schon bei der Auffindung des vertikalen Mittelpunkts der ersten Zeichendatenmatrix, nach einer Höchstsumme zu suchen. Bei einer Positionierung des Mittelpunkts des Überlagerungsfensters 46 bei Spalte 48 errechnet der Regler 26 dann eine Summe der in diesem Fenster enthaltenen Bildelemente. Wenn ein Höchstwert gefunden ist, indem das Überlagerungsfenster 46, wie bereits zuvor erwähnte nach links verschoben wird, werden die in dem Fenster enthaltenen Bildelemente als Repräsentation der Bildelementmatrix für das zweite Zeichen in Feld #1 extrahiert. Dieser Prozeß wird für die verbleibenden Zeichen in Feld #2 wiederholt. Man sollte beachten, daß zu dem Zeitpunkt, wenn sich das Überlagerungsfenster 46 in zentrierter Position über der Bildelementmatrix befindet, die ein Zeichen darstellt, die tatsächliche Identifikation des Zeichens nicht bekannt ist; es wird einfach von seinem zugeordneten Feld segmentiert, um eine Zeichenerkennung zu ermöglichen.

Claims (8)

1. Eine Methode zur Segmentierung von Zeichenabbildern, einschließlich des Schritts der Darstellung einer Matrix von Abbilddaten, wobei die Matrix aus Zeilen und Spalten binärer Bildelemente besteht, die einem Beleg zugeordnet sind, auf welchem sich mindestens ein Zeichenfeld befindet, wobei diese Methode aus folgenden Schritten besteht: (a) Wahl eines Prüffensters (46), dessen Größe eine vorbestimmte Anzahl von Zeilen und Spalten mit den Bildelementen umfaßt, die einem Zeichen in den Abbilddaten zugeordnet sind; (b) Errechnen einer Wahrscheinlichkeitsdichte für jedes Bildelement innerhalb des Prüffensters (46) für jedes Zeichen in einem Bezugszeichensatz, aus welchem die zu segmentierenden Zeichen entnommen sind, um eine zusammengesetzte Wahrscheinlichkeitsdichte für jedes Bildelement innerhalb des Prüffensters (46) zu erstellen; (c) Positionieren des Prüffensters (46) über einem Teil dieses Felds; (d) Erlangen eines Gesamtwerts für das Prüffenster (46) durch Verwendung jedes Bildelements mit binären Einsen im Prüffenster (46) und seiner zugeordneten zusammengesetzten Wahrscheinlichkeitsdichte; (e) Bewegen besagten Prüffensters (46) in bezug auf besagtes Feld und Wiederholung von Schritt (d), um einen maximalen Gesamtwert für das Prüffenster (46) zu erlangen; (f) Verwendung des durch Schritt (e) erlangten Gesamtwerts als ein Anzeichen dafür, daß das Prüffenster (46) Bilddaten enthält, die einem Zeichen im Bezugszeichensatz zugeordnet sind, und (g) Wiederholen der Schritte (c) bis (f) für die verbleibenden Bilddaten, die besagtem Feld zugeordnet sind.
2. Eine Methode laut Patentanspruch 1, die durch folgende Schritte charakterisiert wird: (h) Extrahieren der binären Bildelementdaten, die dem in Schritt (f) erwähnten Prüffenster zugeordnet sind, und (i) Speichern der extrahierten Bildelementdaten.
3. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Bewegungsschritt (e) dazu verwendet wird, die Abbilddaten im wesentlichen zu zentrieren, die einem Zeichen innerhalb des Prüffensters (46) zugeordnet sind.
4. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Wahlschritt (a) durch die Verwendung der Dichte des Zeichensatzes bewirkt wird.
5. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Positionierungsschritt (c) durch die Verwendung der Dichte der Zeichenreihe bewirkt wird.
6. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Erlangungsschritt (d) durch die Addition der zugeordneten zusammengesetzten Wahrscheinlichkeitsdichte für jedes Bildelement mit binärer Eins im Prüffenster (46) bewirkt wird.
7. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Errechnungsschritt (b) bewirkt wird durch: die Sichtbarmachung gegenüber dem Prüffenster (46) von Abbilddaten für ein bekanntes Zeichen in einem Zeichensatz, wobei ein Bildelement mit binärer Eins die Anwesenheit von Daten und ein Bildelement mit binärer Null die Abwesenheit von Daten darstellt; die Speicherung der Bildelemente mit binären Einsen und Nullen in einem Speicher entsprechend der Zeilen- und Spaltenpositionen im Prüffenster für das vom Sichtbarmachungsschritt bekannte Zeichen; die Wiederholung mit festgelegter Häufigkeit des Sichtbarmachungsschritts und des Speicherschritts für dasselbe bekannte Zeichen, um eine Wahrscheinlichkeitsdichte für jedes Bildelement im Prüffenster für das präsentierte Zeichen zu erlangen; das Erlangen und Speichern der Wahrscheinlichkeitsdichten für jedes Bildelement im Prüffenster für die verbleibenden Zeichen in einem zu segmentierenden Zeichensatz, und das Summieren der Wahrscheinlichkeitsdichten für jedes Bildelement im Prüffenster für alle Zeichen im Zeichensatz, um zu einem gewichteten Gesamtwert für jedes Bildelement im Prüffenster für die Zeichenreihe zu gelangen.
8. Eine Methode laut Patentanspruch 1, die dadurch charakterisiert wird, daß besagter Positionierungsschritt (c) dadurch bewirkt wird, daß zuerst nach den Zeilen und Spalten gesucht wird, in denen sich besagtes Feld befindet, um die Position besagten Felds innerhalb besagter Abbilddatenmatrix zu erstellen.
DE68915950T 1988-11-16 1989-11-15 Verfahren zum Trennen von Zeichen. Expired - Fee Related DE68915950T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/271,982 US4932065A (en) 1988-11-16 1988-11-16 Universal character segmentation scheme for multifont OCR images

Publications (2)

Publication Number Publication Date
DE68915950D1 DE68915950D1 (de) 1994-07-14
DE68915950T2 true DE68915950T2 (de) 1995-02-02

Family

ID=23037914

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68915950T Expired - Fee Related DE68915950T2 (de) 1988-11-16 1989-11-15 Verfahren zum Trennen von Zeichen.

Country Status (5)

Country Link
US (1) US4932065A (de)
EP (1) EP0369761B1 (de)
JP (1) JP3035309B2 (de)
CA (1) CA1316606C (de)
DE (1) DE68915950T2 (de)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2822189B2 (ja) * 1988-05-19 1998-11-11 ソニー株式会社 文字認識装置及び方法
GB2224906B (en) * 1988-10-21 1993-05-19 Ricoh Kk Dot region discriminating method
US6067379A (en) * 1988-12-09 2000-05-23 Cognex Corporation Method and apparatus for locating patterns in an optical image
US5050221A (en) * 1989-02-13 1991-09-17 Ricoh Company, Ltd. Image generating apparatus
JP2940936B2 (ja) * 1989-06-06 1999-08-25 株式会社リコー 表領域識別方法
US5048095A (en) * 1990-03-30 1991-09-10 Honeywell Inc. Adaptive image segmentation system
JPH04315272A (ja) * 1991-04-12 1992-11-06 Eastman Kodak Japan Kk 図形認識装置
US5500905A (en) * 1991-06-12 1996-03-19 Microelectronics And Computer Technology Corporation Pattern recognition neural network with saccade-like operation
US5237621A (en) * 1991-08-08 1993-08-17 Philip Morris Incorporated Product appearance inspection methods and apparatus employing low variance filter
US5150425A (en) * 1991-08-30 1992-09-22 Eastman Kodak Company Character recognition method using correlation search
US5553162A (en) * 1991-09-23 1996-09-03 Eastman Kodak Company Method for detecting ink jet or dot matrix printing
US5299269A (en) * 1991-12-20 1994-03-29 Eastman Kodak Company Character segmentation using an associative memory for optical character recognition
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US5337370A (en) * 1992-02-28 1994-08-09 Environmental Research Institute Of Michigan Character recognition method employing non-character recognizer
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
US5341438A (en) * 1992-07-22 1994-08-23 Eastman Kodak Company Method and apparatus for segmenting and classifying unconstrained handwritten characters
US5859923A (en) * 1992-12-29 1999-01-12 Cognex Corporation Mark quality inspection apparatus and method
US5305392A (en) * 1993-01-11 1994-04-19 Philip Morris Incorporated High speed, high resolution web inspection system
JPH06348800A (ja) * 1993-06-02 1994-12-22 Canon Inc 画像処理方法及び装置
US5748780A (en) * 1994-04-07 1998-05-05 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression
US6026176A (en) 1995-07-25 2000-02-15 Cognex Corporation Machine vision methods and articles of manufacture for ball grid array inspection
US5764824A (en) * 1995-08-25 1998-06-09 International Business Machines Corporation Clustering mechanism for identifying and grouping of classes in manufacturing process behavior
US5872870A (en) * 1996-02-16 1999-02-16 Cognex Corporation Machine vision methods for identifying extrema of objects in rotated reference frames
US5909504A (en) * 1996-03-15 1999-06-01 Cognex Corporation Method of testing a machine vision inspection system
US6259827B1 (en) 1996-03-21 2001-07-10 Cognex Corporation Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images
US6298149B1 (en) 1996-03-21 2001-10-02 Cognex Corporation Semiconductor device image inspection with contrast enhancement
US5978502A (en) * 1996-04-01 1999-11-02 Cognex Corporation Machine vision methods for determining characteristics of three-dimensional objects
US6137893A (en) * 1996-10-07 2000-10-24 Cognex Corporation Machine vision calibration targets and methods of determining their location and orientation in an image
US5960125A (en) 1996-11-21 1999-09-28 Cognex Corporation Nonfeedback-based machine vision method for determining a calibration relationship between a camera and a moveable object
US5953130A (en) * 1997-01-06 1999-09-14 Cognex Corporation Machine vision methods and apparatus for machine vision illumination of an object
US6075881A (en) * 1997-03-18 2000-06-13 Cognex Corporation Machine vision methods for identifying collinear sets of points from an image
US5974169A (en) * 1997-03-20 1999-10-26 Cognex Corporation Machine vision methods for determining characteristics of an object using boundary points and bounding regions
US6141033A (en) * 1997-05-15 2000-10-31 Cognex Corporation Bandwidth reduction of multichannel images for machine vision
US6608647B1 (en) 1997-06-24 2003-08-19 Cognex Corporation Methods and apparatus for charge coupled device image acquisition with independent integration and readout
US5978080A (en) * 1997-09-25 1999-11-02 Cognex Corporation Machine vision methods using feedback to determine an orientation, pixel width and pixel height of a field of view
US6025854A (en) * 1997-12-31 2000-02-15 Cognex Corporation Method and apparatus for high speed image acquisition
US6282328B1 (en) 1998-01-28 2001-08-28 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with non-uniform offsets
US6236769B1 (en) 1998-01-28 2001-05-22 Cognex Corporation Machine vision systems and methods for morphological transformation of an image with zero or other uniform offsets
US6215915B1 (en) 1998-02-20 2001-04-10 Cognex Corporation Image processing methods and apparatus for separable, general affine transformation of an image
US6381375B1 (en) 1998-02-20 2002-04-30 Cognex Corporation Methods and apparatus for generating a projection of an image
US6687402B1 (en) 1998-12-18 2004-02-03 Cognex Corporation Machine vision methods and systems for boundary feature comparison of patterns and images
US6381366B1 (en) 1998-12-18 2002-04-30 Cognex Corporation Machine vision methods and system for boundary point-based comparison of patterns and images
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6684402B1 (en) 1999-12-01 2004-01-27 Cognex Technology And Investment Corporation Control methods and apparatus for coupling multiple image acquisition devices to a digital data processor
US6748104B1 (en) 2000-03-24 2004-06-08 Cognex Corporation Methods and apparatus for machine vision inspection using single and multiple templates or patterns
US7006669B1 (en) 2000-12-31 2006-02-28 Cognex Corporation Machine vision method and apparatus for thresholding images of non-uniform materials
US7386160B2 (en) * 2004-12-02 2008-06-10 International Business Machines Corporation System and method for determining image resolution using MICR characters
US7639861B2 (en) 2005-09-14 2009-12-29 Cognex Technology And Investment Corporation Method and apparatus for backlighting a wafer during alignment
US8111904B2 (en) 2005-10-07 2012-02-07 Cognex Technology And Investment Corp. Methods and apparatus for practical 3D vision system
US8162584B2 (en) 2006-08-23 2012-04-24 Cognex Corporation Method and apparatus for semiconductor wafer alignment
US20080310721A1 (en) * 2007-06-14 2008-12-18 John Jinhwan Yang Method And Apparatus For Recognizing Characters In A Document Image
ITBA20110038A1 (it) 2011-07-12 2013-01-13 D A Bi Mus Srl Metodo e apparato per riconoscere testo in immagini digitali raffiguranti pagine di un documento antico
US9195908B2 (en) 2013-05-22 2015-11-24 Xerox Corporation Snow classifier context window reduction using class t-scores and mean differences
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3519990A (en) * 1966-09-15 1970-07-07 Control Data Corp Recognition system for reading machine
GB1233459A (de) * 1968-07-15 1971-05-26
US4308523A (en) * 1980-02-04 1981-12-29 Compuscan, Incorporated Apparatus and method for character recognition
JPS5750076A (en) * 1980-09-10 1982-03-24 Toshiba Corp Character reader
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
US4680803A (en) * 1984-12-17 1987-07-14 Ncr Corporation Method and apparatus for isolating image data for character recognition

Also Published As

Publication number Publication date
EP0369761A3 (de) 1991-12-18
EP0369761A2 (de) 1990-05-23
JP3035309B2 (ja) 2000-04-24
JPH02165392A (ja) 1990-06-26
US4932065A (en) 1990-06-05
EP0369761B1 (de) 1994-06-08
DE68915950D1 (de) 1994-07-14
CA1316606C (en) 1993-04-20

Similar Documents

Publication Publication Date Title
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE3716787C2 (de)
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE3879254T2 (de) Unterscheidungsvorrichtung für handgeschriebene und maschinengedruckte Buchstaben.
DE3689416T2 (de) Mustermerkmalextraktion.
DE2215088A1 (de) Verfahren und anordnung zur zeichenerkennung
DE3875451T2 (de) Verfahren zum optischen lesen von strichcodes.
DE3881392T2 (de) System und Verfahren für automatische Segmentierung.
DE3633743A1 (de) Zeichenerkennungssystem
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
DE3322443C2 (de)
DE2234109C3 (de) Leseapparat
DE146351T1 (de) Vorlageverarbeitungseinrichtung und -verfahren.
DE3786472T2 (de) Vorrichtung für optische Zeichenerkennung.
DE19960555A1 (de) Verfahren zum Auffinden und Lesen eines zweidimensionalen Strichcodes
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE69728724T2 (de) Bildbereichs-Erkennungsverfahren und Bildverarbeitungsvorrichtung
DE3783974T2 (de) Optischer buchstabenleser.
DE2829808A1 (de) Verfahren und vorrichtung zum lesen von zeichen
EP0402868B1 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE3241673C2 (de) Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen
DE60024535T2 (de) Verfahren zur Zeichentrennung
DE3787206T2 (de) Gerät und Verfahren zur Ermittlung von Zeichenteilen auf einem gedruckten Dokument.
DE3787865T2 (de) Verfahren zur Faksimile-Übertragung und -Kompression.
DE69813416T2 (de) Vorrichtungen zur Linienrichtungsbestimmung, Bildschrägeerfassung und Bildschrägekorrektur.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: AT&T GLOBAL INFORMATION SOLUTIONS INTERNATIONAL IN

8327 Change in the person/name/address of the patent owner

Owner name: NCR INTERNATIONAL, INC. (N.D.GES.D.STAATES DELAWAR

8328 Change in the person/name/address of the agent

Free format text: V. BEZOLD & SOZIEN, 80799 MUENCHEN

8339 Ceased/non-payment of the annual fee