DE68925312T2 - Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik - Google Patents

Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik

Info

Publication number
DE68925312T2
DE68925312T2 DE68925312T DE68925312T DE68925312T2 DE 68925312 T2 DE68925312 T2 DE 68925312T2 DE 68925312 T DE68925312 T DE 68925312T DE 68925312 T DE68925312 T DE 68925312T DE 68925312 T2 DE68925312 T2 DE 68925312T2
Authority
DE
Germany
Prior art keywords
pixel
neighborhood
pixels
character
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE68925312T
Other languages
English (en)
Other versions
DE68925312D1 (de
Inventor
Richard George Casey
Kottappuram Mohameda Mohiuddin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE68925312D1 publication Critical patent/DE68925312D1/de
Publication of DE68925312T2 publication Critical patent/DE68925312T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Analysis (AREA)

Description

  • Die vorliegende Erfindung betrifft die Erzeugung von Entscheidungsbäumen für Vorrichtungen zur optischen Zeichenerkennung und speziell die für die Erzeugung von Entscheidungsbäumen nützliche Berechnung von Wahrscheinlichkeiten, daß ein bestimmtes Pixel eine vorgegebene Farbe aufweist.
  • Ein Entscheidungsbaum ist der Teil des Steuerungssystems eines OCR-Geräts, der bestimmt, wie das Gerät Bildelementdaten (Pixeldaten) von einem mit dem Scanner eingelesenen Dokument interpretiert.
  • Ein Verfahren zur Zeichenerkennung besteht darin, einen Entscheidungsbaum zu erzeugen, in dem verschiedene Pixel nacheinander betrachtet werden, wobei jeweils Verzweigungen entstehen, die davon abhängen, ob das Pixel schwarz oder weiß ist. Solche Entscheidungsbäume entsprechen dem Stand der Technik.
  • Eine OCR-Vorrichtung kann in der Regel nur Zeichen einer Schrift erkennen, auf die sie trainiert wurde. Im typischen Fall ist eine OCR-Vorrichtung vom Hersteller so programmiert, daß sie nur wenige häufig vorkommende Schriften erkennen kann. Nachdem nun Laserdrucker und Möglichkeiten zur Erstellung zahlreicher Schriften weit verbreitet sind, wünschen viele Benutzer, daß ihre OCR-Vorrichtungen Zeichen in einer neuen Schrift, die sich von allen vom Hersteller vorgesehenen Schriften unterscheidet, erkennen können.
  • Zur Erzeugung eines Entscheidungsbaums, mit dem eine OCR-Vorrichtung Zeichen einer bestimmten Schrift erkennt, muß die Wahrscheinlichkeit, daß ein bestimmtes Pixel aus einer Gruppe von Pixeln, welche das betreffende Zeichen darstellt, schwarz ist, bekannt sein, um die Pixel zu identifizieren, die benötigt werden, um dieses Zeichen von anderen zu unterscheiden. Ein Ansatz zur Entwicklung von Entscheidungsbäumen ist in Casey et al., "Decision Tree Design Using a Probabilistic Model", IEEE Transactions on Information Theory, Bd. IT-30, Nr. 1, 5. 93-99 (1984) beschrieben.
  • (Das Wort "Zeichen" bezeichnet hier das gedruckte oder geschriebene Symbol, das von der OCR-Vorrichtung erkannt werden soll. Typische Zeichen sind Buchstaben, Ziffern oder sonstige Symbole. "Zeichen kann auch eine Klasse von Symbolen bezeichnen, wenn zwei Symbole sehr ähnlich aussehen und die Entscheidungslogik der OCR-Vorrichtung sie nicht unbedingt unterscheiden können muß, z.B. die Ziffer "1" und der Kleinbuchstabe "1" in manchen Schriften. In der nachstehenden Beschreibung wird von schwarzen und weißen Pixeln ausgegangen, es sind aber auch andere Kombinationen unterscheidbarer Farben möglich. Ferner basieren in der Beschreibung die Verfahren und Vorrichtungen im Zusammenhang mit schwarzen und weißen Pixeln auf schwarzen Pixeln und auf der Wahrscheinlichkeit, daß das jeweilige Pixel schwarz ist. Die Entscheidungsbaumlogik kann aber auch auf weißen Pixeln und der Wahrscheinlichkeit, daß sie weiß sind, basieren.)
  • Um für jedes Pixel in allen Zeichen die Wahrscheinlichkeit zu berechnen, daß es schwarz ist, müssen mehrere hundert Exemplare jedes Zeichens in der zu erkennenden Schrift untersucht werden. Das Sammeln und Identifizieren der Zeichenexemplare ist zeitraubend und teuer. Oft sind gar nicht so viele Exemplare vorhanden.
  • Deshalb besteht ein Bedarf an einem Verfahren zur Erzeugung von OCR-Entscheidungsbäumen mit sehr wenigen (im Idealfall nur einem einzigen) Exemplaren von jedem Zeichen.
  • Ein konventioneller Prozeß zur Erzeugung eines Entscheidungsbaums ist in Fig. 1 dargestellt. Es werden zahlreiche Zeichenexemplare in der zu erkennenden Schrift gedruckt. Diese Zeichenexemplare werden mit einem Scanner eingelesen, um eine Pixelmatrix zu erzeugen. Für jedes zu erkennende Zeichen oder jede zu erkennende Zeichenklasse werden alle Exemplare dieses Zeichens überlagert, und die Wahrscheinlichkeit, daß ein bestimmtes Pixel schwarz ist, wird berechnet, indem gezählt wird, wie oft das Pixel in den Zeichenexemplaren schwarz ist, und diese Zahl dann durch die Anzahl der Zeichenexemplare dividiert wird. Mit Hilfe dieser Wahrscheinlichkeiten können bestimmte Pixel ausgewählt werden, die dann bei der Erzeugung eines Entscheidungsbaums für die Erkennung von Zeichen dieser Schrift verwendet werden. Diese Prozedur erfordert in der Regel eine sehr große Anzahl von Exemplaren von jedem Zeichen oder jeder Zeichenklasse, typischerweise in der Größenordnung von 100 bis 200 Exemplaren, um eine korrekte Zeichenerkennung zu erreichen.
  • In der Patentschrift EP-A-0343786 wird ein Verfahren zum Betrieb einer Zeichenerkennungsvorrichtung beschrieben, bei dem mehrere Gruppen von Entscheidungsbäumen für die Zeichenerkennung in einem Speicher abgelegt sind. Daraus wird eine Gruppe von Entscheidungsbäumen ausgewählt, die das kleinste Verhältnis von nicht identifizierten (nicht akzeptierten) zu identifizierten Zeichen aufweist, und diese Entscheidungsbäume werden als Antwort auf Signale modifiziert, die ein Benutzer bei Erkennung der Zeichen, die von der Vorrichtung nicht automatisch (oder nicht richtig) erkannt wurden, eingibt.
  • Die vorliegende Erfindung liefert eine Vorrichtung und ein Verfahren zur zuverlässigen Abschätzung der Farbwahrscheinlichkeit eines Pixels in einem Zeichen, ohne daß eine große Zahl von Zeichenexemplaren geprüft werden muß. Das erfindungsgemäße Verfahren nutzt die überraschende experimentelle Beobachtung, daß die Farbwahrscheinlichkeiten von Pixeln zuverlässig als Funktion ihrer Nachbarschaftsstatus berechnet werden kann, wobei der Nachbarschaftsstatus eines bestimmten Pixels eine gewichtete Summe der Werte der unmittelbar an das zu betrachtende Pixel angrenzenden Pixel ist.
  • Ein Aspekt der Erfindung betrifft ein Verfahren zum Betrieb von Vorrichtungen zur optischen Zeichenerkennung (und die Vorrichtungen selber), bei denen ein Entscheidungsbaum zur Erkennung von Zeichen in einer ersten Schrift verwendet wird, wobei die Vorrichtung einen Speicher besitzt, in dem eine Wahrscheinlichkeitstabelle gespeichert ist, welche die Wahrscheinlichkeit angibt, daß bei einer von der ersten Schrift verschiedenen zweiten Schrift ein Pixel als Funktion eines Nachbarschaftsstatus eine erste unterscheidbare Farbe aufweist, und wobei das Verfahren aus folgenden Schritten besteht: (i) Einlesen eines Dokuments mit Zeichen in der ersten Schrift zur Erzeugung einer Pixelmatrix, in der jedes Pixel einen Nachbarschaftsstatus besitzt; (ii) Identifikation eines Pixelmusters in der Matrix, das ein Zeichen darstellt; (iii) Auswählen eines Pixels aus dem Muster; (iv) Bestimmung des Nachbarschaftsstatus des Pixels auf genau die gleiche Weise wie der Nachbarschaftsstatus jedes Pixels in der zweiten Schrift bestimmt wurde; (v) Adressierung des Speichers mit dem Nachbarschaftsstatus des ausgewählten Pixels; (vi) Auslesen der Wahrscheinlichkeit, daß das ausgewählte Pixel die seinem Nachbarschaftsstatus zugeordnete unterscheidbare Farbe aufweist, aus dem Speicher und Zuweisung dieser Wahrscheinlichkeit an das ausgewählte Pixel; (vii) Wiederholen der Schritte (iii) bis (vi) für weitere ausgewählte Pixel des Musters; (viii) Generieren eines neuen Entscheidungsbaums für die erste Schrift anhand der Wahrscheinlichkeiten der unterscheidbaren Farbe ohne Zuhilfenahme bereits vorhandener Entscheidungsbäume; sowie (ix) Verwendung des neuen Entscheidungsbaums für die Interpretation der Pixel bei der Zeichenerkennung.
  • Das erfindungsgemäße Verfahren, um eine Vorrichtung zur Zeichenerkennung automatisch so zu steuern, daß Zeichen in einer unbekannten Schrift erkannt werden, umfaßt das Scannen eines in der unbekannten Schrift gedruckten Dokuments, damit eine Pixelmatrix erstellt werden kann. Dann wird die unmittelbare Nachbarschaft jedes Pixels in der Matrix analysiert, um einen sogenannten Nachbarschaftsstatus des Pixels zu berechnen. Nun wird ein Block von Pixeln, der ein Zeichen bildet, identifiziert. In dem Block wird ein Pixel ausgewählt, und ein Speicher wird mit dem Nachbarschaftsstatus des ausgewählten Pixels adressiert. In dem Speicher befindet sich eine Wahrscheinlichkeitstabelle, in der die vom Nachbarschaftsstatus abhängigen Wahrscheinlichkeiten aufgelistet sind, daß bei einer von der ersten unbekannten Schrift verschiedenen zweiten Schrift das Pixel schwarz ist. Die dem Nachbarschaftsstatus des Pixels zugeordnete Wahrscheinlichkeit, daß es schwarz ist, wird aus dem Speicher ausgelesen und dem ausgewählten Pixel zugeordnet. Dann wird anhand der Schwarzwahrscheinlichkeit der Entscheidungsbaum für die unbekannte Schrift generiert.
  • Der Nachbarschaftsstatus eines Pixels wird Vorzugsweise dadurch bestimmt, daß eine vorher ausgewählte Matrix von Nachbarpixeln als Nachbarschaft des Pixels identifiziert und untersucht wird.
  • Ein zweiter Aspekt der vorliegenden Erfindung liefert ein Verfahren zur Erkennung von Zeichen in einer unbekannten Schrift mittels einer Vorrichtung zur optischen Zeichenerkennung, die mit einem Entscheidungsbaum zur Interpretation von Pixeln arbeitet. Die Erstellung des Entscheidungsbaums umfaßt folgende Schritte: zur Erzeugung einer Pixelmatrix ein Dokument in einer ersten Schrift einlesen; für jedes Pixel der Matrix eine zuvor ausgewählte Matix von benachbarten Pixeln als Nachbarschaft des Pixels angeben; anhand der Pixelmatrix die Wahrscheinlichkeit bestimmen, daß ein ausgewähltes Pixel bei einem bestimmten Nachbarschaftsstatus eine erste unterscheidbare Farbe aufweist; eine Wahrscheinlichkeitstabelle speichern, in der für jeden Nachbarschaftsstatus eines Pixels die Wahrscheinlichkeit aufgeführt ist, daß das ausgewählte Pixel die unterscheidbare Farbe aufweist; ein Dokument in einer unbekannten Schrift einlesen, um eine zweite Pixelmatrix zu erzeugen; in der Matrix mehrere Pixelmuster identifizieren, die jeweils ein Zeichen darstellen; für jedes Pixel in jedem Muster die vorher ausgewählte Matrix von Nachbarpixeln als Nachbarschaft des Pixels auswählen und so anhand der Nachbarschaft des Pixels seinen Nachbarschaftsstatus bestimmen, indem die Tabelle anhand des Nachbarschaftsstatus des betreffenden Pixels adressiert wird und die Wahrscheinlichkeit, daß das Pixel die unterscheidbare Farbe besitzt, aus der Tabelle abgelesen wird; mit Hilfe der für ausgewählte Pixel aus der Tabelle ausgelesenen Wahrscheinlichkeiten einen neuen Entscheidungsbaum für die unbekannte Schrift erzeugen, ohne daß auf bereits vorhandene Entscheidungsbäume zurückgegriffen wird.
  • Ein dritter Aspekt der vorliegenden Erfindung ist ein Verfahren zur Steuerung einer OCR-Vorrichtung zur Erkennung von Zeichen einer unbekannten Schrift mit Hilfe eines Entscheidungsbaums zur Interpretation von Pixeln für die Zeichenerkennung, wobei der Entscheidungsbaum anhand der Wahrscheinlichkeiten, daß Pixel eine erste unterscheidbare Farbe aufweisen, erzeugt wird, und den Pixeln die Wahrscheinlichkeiten durch ein Verfahren mit folgenden Schritten zugewiesen werden:
  • (a) Einlesen eines Referenzdokuments in einer ersten Schrift und Konvertierung des eingelesenen Referenzdokuments in ein Pixelmuster, wobei
  • (i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt; und
  • (ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Anzahl von Nachbarpixeln der konvertierten Pixel besitzt; und
  • (iii) die Nachbarschaft einen durch die Farben der Nachbarpixels bestimmten Nachbarschaftsstatus besitzt;
  • (b) Bestimmung der Farbe jedes Pixels des eingelesenen Referenzdokuments;
  • (c) Bestimmung des Nachbarschaftsstatus jedes Pixels des eingelesenen Referenzdokuments;
  • (d) Division der Häufigkeit, mit der ein Pixel in einer Nachbarschaft mit einem ersten Nachbarschaftsstatus die erste Farbe aufweist, durch die Häufigkeit, mit der im eingelesenen Dokument der erste Nachbarschaftsstatus im Referenzdokument vorkommt, um die Wahrscheinlichkeit zu ermitteln, daß ein Pixel die erste Farbe aufweist, wenn seine Nachbarschaft den ersten Nachbarschaftsstatus besitzt;
  • (e) Wiederholung von Schritt (d) für jeden möglichen Nachbarschaftsstatus zur Berechnung einer Wahrscheinlichkeitstabelle, in der alle möglichen Nachbarschaftsstatus und die zugehörigen Wahrscheinlichkeiten jedes ausgewählten Pixels in der ersten Farbe aufgelistet sind;
  • (f) Speichern der Wahrscheinlichkeitstabelle in der OCR-Vorrichtung; und
  • (g) Einlesen eines zweiten Dokuments in einer unbekannten zweiten Schrift und Konvertierung dieses zweiten Dokuments in eine Pixelmatrix, wobei:
  • (i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt;
  • (ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Zahl von Nachbarpixeln der konvertierten Pixel besitzt, wobei die Nachbarschaft Nachbarpixel enthält, die dem Nachbarschaftsstatus der Pixel des Referenzdokuments entsprechen; und
  • (iii) die Nachbarschaft einen durch die Farben der Nachbarpixel bestimmten Nachbarschaftsstatus besitzt;
  • (h) Bestimmung des Nachbarschaftsstatus von jedem von mehreren ausgewählten konvertierten Pixeln in dem Muster; und
  • (i) für jedes ausgewählte konvertierte Pixel Ablesen des Nachbarschaftsstatus aus der gespeicherten Wahrscheinlichkeitstabelle und Auslesen der Wahrscheinlichkeit, daß das Pixel die erste Farbe besitzt, aus der Wahrscheinlichkeitstabelle.
  • Zum besseren Verständnis wird die vorliegende Erfindung im folgenden anhand der beigefügten Zeichnungen exemplarisch beschrieben.
  • Fig. 1 ist ein Flußdiagramm eines herkömmlichen Verfahrens zur Erzeugung eines Entscheidungsbaums.
  • Fig. 2A, 2B und 2C zeigen verschiedene Nachbarschaften eines Pixels.
  • In Fig. 3 ist ein Schema zur Numerierung der Nachbarpixel für die Ermittlung des Nachbarschaftsstatus dargestellt.
  • Fig. 4 ist ein Blockdiagramm einer Vorrichtung, die sich für die Erstellung von Pixelfarbwahrscheinlichkeitstabellen eignet.
  • Fig. 5 ist ein Blockdiagramm einer Vorrichtung, die sich für die Generierung einer neuen erfindungsgemäßen OCR-Entscheidungslogik eignet.
  • Fig. 6 zeigt einen Block oder ein Muster von Pixeln, die ein Zeichen darstellen.
  • Fig. 7 ist ein Flußdiagramm der Generierung eines OCR-Entscheidungsbaums mit Hilfe der Vorliegenden Erfindung.
  • Die Farbe eines Pixels in einem Pixelblock hängt von der Zeichenklasse ab, der das Pixel angehört. Die Antragsteller haben festgestellt, daß die Farbe der Pixel unerwarteterweise ausschließlich als Funktion des Nachbarschaftsstatus des Pixels vorhersehbar ist. Die Zeichenklasse, der das Pixel angehört, muß dabei nicht bekannt sein.
  • In einer vorgegebenen Schrift kann die Farbe eines Pixels in einem binären Pixelmuster anhand der Farben der benachbarten Pixel vorhergesagt werden, wie z.B. in Fig. 2 zu sehen ist. In Fig. 2A ist ein Pixel mit unbekannter Farbe, umgeben von seinen acht unmittelbaren Nachbarpixeln, dargestellt. Diese haben jeweils einen Wert 0 (der für die Weiß steht). Das Pixel X in der Mitte ist höchstwahrscheinlich weiß (Wert 0). Die Wahrscheinlichkeit beträgt nicht genau 1,00, denn schließlich kann an dieser Stelle ein versehentlich gesetzter schwarzer Punkt stehen. Entsprechend ist in Fig. 2B das mittlere Pixel X der dargestellten Nachbarschaft mit hoher Wahrscheinlichkeit schwarz (Wert 1), da alle acht unmittelbar benachbarten Pixel schwarz sind.
  • Ein Beispiel für ein Pixel X mit einer Nachbarschaft, die zur Hälfte schwarz und zur Hälfte weiß ist, ist in Fig. 2C dargestellt. Die Wahrscheinlichkeit, das daß mittlere Pixel dieser Nachbarschaft den Wert 1 besitzt, kann statistisch durch die Betrachtung einer großen Anzahl solcher Muster bestimmt werden. Die Möglichkeit, die Farbe eines Pixels anhand der Farben der benachbarten Pixel vorherzusagen, ist in Mohiuddin et al., "Lossless Binary Image Compression Based on Pattern Matching", International Conference on Computers, Systems & Signal Processing, Bangalore, Indien (9.-12. Dezember 1984), beschrieben worden.
  • Die Nachbarschaft eines Pixels besteht aus einer vorgegebenen Anzahl angrenzender Nachbarpixel in horizontaler und vertikaler Richtung. Das Pixel und seine Nachbarschaft bilden also ein Gitter oder eine Matrix von Pixeln. Im abgebildeten Ausführungsbeispiel der Erfindung besteht die Nachbarschaft aus den acht angrenzenden Pixeln, so daß ein aus 3 x 3 Pixeln bestehendes Gitter entsteht. Es sind jedoch auch andere Anordnungen möglich, und die Nachbarschaften müssen nicht quadratisch sein.
  • Der Status eines Pixels kann als gewichtete Summe der Elemente in seiner Nachbarschaft definiert werden. Die Nachbarpixel werden beispielsweise willkürlich vom westlichen Nachbarpixel aus im Uhrzeigersinn durchnumeriert wie in Fig. 3. Dem westlichen Nachbarpixel wird der Wert 2º(=1) zugewiesen, dem nordwestlichen der Wert 2¹(=2) usw. Das südwestliche Nachbarpixel erhält dann den Wert 2&sup7;(=128). Die Numerierung an sich ist nicht entscheidend, da sie nur zur eindeutigen Unterscheidung aller möglichen Nachbarschaftsstatus dient. Da die Nachbarschaft aus acht Pixeln besteht, sind insgesamt 256 verschiedene Status möglich.
  • Der Nachbarschaftsstatus wird berechnet, indem die Werte der schwarzen Nachbarpixel aufsummiert werden. Die Nachbarschaft in Fig. 2A hat bei dem in Fig. 3 dargestellten Numerierungssystem also den Nachbarschaftsstatus oder Wert 0, während die Nachbarschaft in Fig. 2B den Nachbarschaftsstatuswert 255 hat. Die Nachbarschaft in Fig. 2C hat einen Statuswert von 30, nämlich der Summe aus 2¹ + 2² + 2³ + 2&sup4;.
  • Aus einem eingelesenen Dokument kann ermittelt werden, wie oft jeder Nachbarschaftsstatus vorkommt und wie oft dabei das mittlere Pixel schwarz ist. Die Wahrscheinlichkeit, daß das mittlere Pixel bei einem bestimmten Nachbarschaftsstatus schwarz ist, kann so bestimmt werden. Dazu wird die Zahl, wie oft die Pixel bei einem bestimmten Nachbarschaftsstatus schwarz sind, durch die Häufigkeit des betreffenden Nachbarschaftsstatus dividiert. Aus diesen Quotienten kann eine Tabelle erstellt werden, die für jeden der 256 möglichen Nachbarschaftsstatus eine Eintragung der Schwarzwahrscheinlichkeit enthält.
  • Fig. 4 ist ein Blockdiagramm einer Vorrichtung zur Generierung und Speicherung einer solchen Wahrscheinlichkeitstabelle. Der Scanner 11 liest ein Referenzdokument ein, von dem die Statistik erstellt werden soll, und übergibt die Binärpixelmatrix an die Schaltung 13, die den Nachbarschaftsstatus und die Wahrscheinlichkeit berechnet. Für jedes Pixel der Matrix summiert die Schaltung 13 die zugeordneten Werte für alle schwarzen Nachbarpixels auf; diese Summe ergibt den Nachbarschaftsstatuswert des Pixels. Auch die Farbe des gerade betrachteten Pixels wird ermittelt. Wenn diese Statistiken aufgestellt sind, kann leicht für jeden Nachbarschaftsstatuswert die prozentuale Häufigkeit, daß das mittlere Pixel schwarz ist, bestimmt werden. Dieser Prozentsatz gibt die Schwarzwahrscheinlichkeit bei diesem Nachbarschaftsstatuswert an. Die Schaltung 13 besitzt deshalb einen Speicher für die vorübergehende Speicherung verschiedener Zählerwerte beim Durcharbeiten der Pixelmatrizen. Die berechnete Schwarzwahrscheinlichkeit als Funktion der Nachbarschaftsstatus (Wahrscheinlichkeitstabelle) wird für eine spätere Verwendung in einen Speicher 15 geschrieben.
  • Gemäß der vorliegenden Erfindung haben die Antragsteller herausgefunden, daß die nach dem oben beschriebenen Verfahren erstellte Wahrscheinlichkeitstabelle, in der die Schwarzwahrscheinlichkeit eines Pixels in Abhängigkeit von seinem Nachbarschaftsstatus aufgelistet ist, überraschenderweise weitgehend invariant ist, gleichgültig, welcher Zeichenklasse das Pixel angehört. Die Wahrscheinlichkeitstabelle ist also auch nicht von der zu erkennenden Schrift abhängig. Selbst bei sehr unterschiedlichen Schriften oder sogar bei Schriften verschiedener Sprachen bleibt die Wahrscheinlichkeitstabelle also im wesentlichen konstant. Die zuvor für eine Schrift generierten und gespeicherten Wahrscheinlichkeitstabellen können daher auch für die Steuerung der OCR-Vorrichtung zum Erkennen der neuen Schrift eingesetzt werden.
  • Bei der Generierung eines Entscheidungsbaums für eine neue Schrift, die von der zur Erstellung der Wahrscheinlichkeitstabelle verwendeten Schrift verschieden ist, kann also die für eine Schrift erstellte Wahrscheinlichkeitstabelle verwendet werden, um den Zeitaufwand und die Anzahl der Symbol- oder Zeichenexemplare, die zur Erstellung der von der OCR-Vorrichtung zum Lernen einer neuen Schrift und zur Generierung eines entsprechenden Entscheidungsbaums benötigten Statistiken notwendig sind, erheblich zu reduzieren. Es kann auch vorkommen, daß einige Zeichen der neuen Schrift nicht mehrfach vorkommen, so daß die Farbwahrscheinlichkeiten für Pixel mit den herkömmlichen Verfahren nicht abgeschätzt werden können. Aus diesem Grund ist eine optische Zeichenerkennung der neuen Schrift mit herkömmlichen Mitteln in diesem Fall nicht möglich.
  • Fig. 5 ist ein Blockdiagramm einer Vorrichtung zur Generierung einer neuen OCR-Entscheidungslogik. Die in Fig. 5 abgebildete Vorrichtung zur Generierung einer neuen OCR-Entscheidungslogik kann mit der in Fig. 4 zur Erstellung der Wahrscheinlichkeitstabelle verwendeten Logik identisch sein. Auch der Scanner 21 kann der gleiche sein wie der Scanner 11 in dem System von Fig. 4. Der Teil der Logik 25, der die Berechnung des Nachbarschaftsstatus übernimmt, kann ebenfalls mit der Logik 13 zur Ermittlung des Nachbarschaftsstatus und der Wahrscheinlichkeiten in Fig. 4 identisch sein. Der Speicher 15, in dem die Wahrscheinlichkeitstabelle gespeichert wird, kann der gleiche sein wie der Speicher, in dem die Wahrscheinlichkeitstabelle in Fig. 4 ursprünglich gespeichert wurde. Um die OCR-Entscheidungsbaumlogik zu erzeugen, ist ein wechselseitiger Datenaustausch zwischen dem Speicher 15 und der Logik 25, die den Nachbarschaftsstatus berechnet und den Entscheidungsbaum generiert, erforderlich; bei dem System in Fig. 4 hingegen muß die Logik zur Ermittlung des Nachbarschaftsstatus und zur Berechnung der Wahrscheinlichkeiten nur Daten in den Speicher 15 einlesen, aber keine Daten aus dem Speicher auslesen können.
  • Der Scanner 21 liest ein Lerndokument in der von der Vorrichtung zu erkennenden unbekannten Schrift ein und konvertiert dieses Dokument auf die herkömmliche Weise in eine Pixelmatrix. Jedes Pixel ist entweder schwarz oder weiß. Ferner besitzt jedes Pixel eine Nachbarschaft der gleichen Art wie bei der Erstellung der im Speicher befindlichen Wahrscheinlichkeitstabelle. Die Nachbarschaft jedes Pixels ist die gleiche wie bei der Erstellung der Wahrscheinlichkeitstabelle, und den entsprechenden Nachbarpixeln wird der gleiche Wert zugewiesen. Ein Pixel im Lerndokument und ein Pixel in dem zur Erstellung der Wahrscheinlichkeitstabelle verwendeten Referenzdokument, die an den gleichen Positionen von Pixeln der gleichen Farbe umgeben sind, haben also den gleichen Nachbarschaftsstatuswert. Nach dem Numenerungsschema von Fig. 3 werden die acht Pixel, die unmittelbar an das zu betrachtende Pixel angrenzen, die Nachbarschaft des Pixels. Den Nachbarpixeln werden die bei Fig. 3 angegebenen Werte zugewiesen. Das westliche Nachbarpixel erhält den Wert 2º=1, das nordwestliche Nachbarpixel den Wert 2¹=2, usw., und das südwestliche Nachbarpixel erhält den Wert 2&sup7;=128.
  • In der Pixelmatrix, die die eingelesene Seite darstellt, können Pixelblicke oder -muster identifiziert werden. Ein exemplansches Pixelmuster des Großbuchstaben "A" (stark vergrößert) ist in Fig. 6 abgebildet. Ein solches Muster kann ein Quadrat mit einer Seitenlänge von 20 Pixeln sein, so daß das Muster für das Zeichen aus insgesamt 400 Pixeln besteht.
  • Ein zu betrachtendes Pixel wird aus dem Zeichenmuster ausgewählt. Der Teil der Logik 25, der den Nachbarschaftsstatus berechnet, ermittelt diesen Nachbarschaftsstatuswert nach dem gleichen Verfahren der Wertezuweisung wie bei der Erstellung der im Speicher 15 gespeicherten Wahrscheinlichkeitstabelle. Wenn der Nachbarschaftsstatuswert ermittelt ist, wird er zur Adressierung der zuvor im Speicher 15 gespeicherten Wahrscheinlichkeitstabelle verwendet. Die für diesen Nachbarschaftsstatus gespeicherte Wahrscheinlichkeit wird aus dem Speicher ausgelesen. Die aus der gespeicherten Wahrscheinlichkeitstabelle ausgelesene Wahrscheinlichkeit wird dann dem ausgewählten Pixel im Zeichenblock für das betreffende Zeichen der neuen Schrift zugewiesen. Diese zugewiesene Wahrscheinlichkeit dient dann als Schwarzwahrscheinlichkeit dieses Pixels bei der Generierung eines Entscheidungsbaums für die neue Schrift nach einem bekannten Verfahren.
  • Die Entscheidungsbaumlogik bestimmt anhand der unterschiedlichen Schwarzwahrscheinlichkeiten für mehrere Pixel in den verschiedenen Zeichenpixeiblöcken, welche Pixel betrachtet werden sollen, wenn sie in einem neuen Dokument in der neuen Schrift vorkommen. Dies hat den Zweck, die Pixel herauszufinden, die bei der Unterscheidung verschiedener zu erkennender Zeichen wichtig sind. Ein geeignetes Verfahren zur Erzeugung eines Entscheidungsbaums mit einer solchen Wahrscheinlichkeitsstatistik wird in Casey und Nagy, "Decision Tree Design Using a Probabilistic Model", IEEE Transactions on Information Theory, Bd. IT-30, Nr. 1, 5. 93-99, Jan. 1984, beschrieben.
  • Enthält das Lerndokument von einem Zeichen mehr als ein Exemplar und sind diese Exemplare nicht identisch, wird ein durchschnittliches oder ideales Zeichenexemplar oder ein durchschnittlicher oder idealer Pixelblock, der das Zeichen darstellt, zur Bestimmung der Farbe der Nachbarpixel verwendet, welche an der Berechnung des Nachbarschaftsstatus beteiligt sind.
  • Bei der Bildung eines Durchschnittszeichens werden die verschiedenen Zeichenexemplare verglichen, und es wird für jedes Pixel im Zeichenblock festgestellt, ob es häufiger schwarz als weiß ist oder umgekehrt. Für jedes Pixel, das häufiger schwarz ist (mindestens 50%), wird festgelegt, daß es in seiner Eigenschaft als Nachbarpixel zur Ermittlung der Nachbarschaftsstatus der Pixel im Block als schwarz gilt. Entsprechend gilt jedes Pixel, das in mehr als 50% der Exemplare weiß ist, bei der Ermittlung des Nachbarschaftsstatuswerts als weiß. Auf diese Weise wird für jede Zeichenklasse ein "typischerer" Vertreter erzeugt.
  • Fig. 7 ist ein Flußdiagramm des Vorgangs, bei dem eine OCR-Vorrichtung eine neue Schrift nach dem erfindungsgemäßen Verfahren erkennen lernt. In der Beschreibung dieses Flußdiagramms wird die bisherige Beschreibung des bevorzugten Ausführungsbeispiels zusammengefaßt.
  • Zuerst wird ein Referenztext in einer beliebigen Schrift eingelesen (70). Dann wird gezählt, wie oft ein Pixel bei einem bestimmten Nachbarschaftsstatus schwarz ist. Anhand dieses Wertes wird dann eine Wahrscheinlichkeitstabelle erstellt, die die Schwarzwahrscheinlichkeit des Pixels in Abhängigkeit vom Nachbarschaftsstatus angibt (71). Diese Funktion zur Erstellung der Wahrscheinlichkeitstabelle (72) muß nur ein einziges Mal ausgeführt werden und braucht nicht jedesmal wiederholt zu werden, wenn ein Dokument in einer neuen Schrift erkannt werden soll.
  • Wenn die Entscheidungsbaumlogik für eine neue Schrift generiert werden soll, wird ein in dieser neuen Schrift gedrucktes Dokument eingelesen (73). Dann werden die Pixelmuster oder -blöcke oder die Zeichenmuster, die verschiedene Zeichen oder Zeichenklassen darstellen, identifiziert (74). Werden von einem Zeichen mehrere Exemplare identifiziert, wird daraus ein repräsentatives Durchschnittszeichen gebildet.
  • Mit Hilfe dieses repräsentativen Durchschnittszeichens werden die Pixelwahrscheinlichkeiten für die Pixel in jedem Zeichenblock berechnet (75). Aus diesen Wahrscheinlichkeiten kann die Baubberechnungslogik eine geeignete OCR-Entscheidungsbaumlogik erzeugen (76).
  • Bei dem erfindungsgemäßen Verfahren kann die Erstellung der Wahrscheinlichkeitstabelle (in Fig. 7 der Teil links von der gestrichelten Linie) in einem anderen Gerät erfolgen als die Generierung des Zeichenerkennungsbaums (in Fig. 7 der Teil rechts von der gestrichelten Linie). Der Hersteller der OCR-Vorrichtung kann also mit Hilfe der vorliegenden Erfindung die Wahrscheinlichkeitstabelle im Speicher der Vorrichtung speichern. In vielen Fällen kann er auch einige Entscheidungsbäume für die Zeichenerkennung in der Vorrichtung speichern. Außerdem wird vom Hersteller die Software in der OCR-Vorrichtung gespeichert, die es der Vorrichtung ermöglicht, aus den Wahrscheinlichkeitsstatistiken für das Pixel einen Entscheidungsbaum zur Zeichenerkennung zu erzeugen. Wenn der Benutzer dann wünscht, daß die OCR-Vorrichtung eine neue Schrift erkennt, die nicht mit einer der Schriften identisch ist, für die vom Hersteller Entscheidungsbäume gespeichert wurden, kann er die OCR-Vorrichtung einen neuen Entscheidungsbaum für die neue Schrift generieren lassen.
  • Ein detaillierteres bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung ist ein Verfahren zur Steuerung einer OCR-Vorrichtung, so daß sie Zeichen in einer Schrift erkennt, deren Erkennung bisher nicht vorgesehen war, indem einem Pixel eine Wahrscheinlichkeit zugeordnet wird, daß es eine erste Farbe besitzt, und das folgende Schritte umfaßt: (a) Einlesen eines Referenzdokuments in einer ersten Schrift und Konvertierung des eingelesenen Referenzdokuments in ein Pixelmuster, wobei (i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt; und (ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Anzahl von Nachbarpixeln der konvertierten Pixel besitzt; und (iii) die Nachbarschaft einen durch die Farben der Nachbarpixel bestimmten Nachbarschaftsstatus besitzt; (b) Bestimmung der Farbe jedes Pixels des eingelesenen Referenzdokuments; (c) Bestimmung des Nachbarschaftsstatus jedes Pixels des eingelesenen Referenzdokuments; (d) Division der Häufigkeit, mit der ein Pixel in einer Nachbarschaft mit einem ersten Nachbarschaftsstatus die erste Farbe aufweist, durch die Häufigkeit, mit der im eingelesenen Dokument der erste Nachbarschaftsstatus im Referenzdokument vorkommt, um die Wahrscheinlichkeit zu ermitteln, daß ein Pixel die erste Farbe aufweist, wenn seine Nachbarschaft den ersten Nachbarschaftsstatus besitzt; (e) Wiederholung von Schritt (d) für jeden möglichen Nachbarschaftsstatus zur Berechnung einer Wahrscheinlichkeitstabelle, in der alle möglichen Nachbarschaftsstatus und die zugehörige Wahrscheinlichkeit, daß das mittlere Pixel die ersten Farbe aufweist, aufgelistet sind; (f) Speichern der Wahrscheinlichkeitstabelle in der OCR-Vorrichtung; und (g) Einlesen eines zweiten Dokuments in einer unbekannten zweiten Schrift und Konvertierung dieses zweiten Dokuments in eine Pixelmatrix, wobei: (i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt; (ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Zahl von Nachbarpixeln der konvertierten Pixel besitzt, wobei die Nachbarschaft Nachbarpixel enthält, die dem Nachbarschaftsstatus der Pixel des Referenzdokuments entsprechen; und (iii) die Nachbarschaft einen durch die Farben der Nachbarpixel bestimmten Nachbarschaftsstatus besitzt; (h) Bestimmung des Nachbarschaftsstatus von jedem von mehreren konvertierten Pixeln in dem Muster; und (i) für jedes ausgewählte konvertierte Pixel Ablesen des Nachbarschaftsstatus aus der gespeicherten Wahrscheinlichkeitstabelle und Auslesen der Wahrscheinlichkeit, daß das Pixel die erste Farbe besitzt, aus der Wahrscheinlichkeitstabelle.
  • Das Verfahren enthält in dem Schritt, in dem das zweiten Dokument eingelesen wird, außerdem einen Teilschritt, in dem das erste Zeichen dieses zweiten Dokuments identifiziert und durch die Pixel in einem Pixelmuster definiert wird, einen Teilschritt, in dem festgestellt wird, ob dieses erste Zeichen mehr als einmal im zweiten Dokument vorkommt, sowie gegebenenfalls einen Teilschritt, in dem aus den verschiedenen Exemplaren dieses ersten Zeichens ein durchschnittliches erstes Zeichen ermittelt wird. Vorzugsweise enthält der Schritt der Durchschnittszeichenbildung einen Teilschritt, in dem die verschiedenen Exemplare des ersten Zeichens verglichen werden; einen Teilschritt, in dem für jedes Pixel im Zeichenfenster für das erste Zeichen geprüft wird, ob das Pixel die erste Farbe häufiger aufweist als die zweite Farbe; einen Teilschritt, in dem für jedes Pixel, das die erste Farbe öfter als die zweite Farbe aufweist, festgelegt wird, daß es im durchschnittlichen ersten Zeichen die erste Farbe besitzt; sowie einen Teilschritt, in dem für jedes Pixel, das die zweite Farbe häufiger aufweist als die erste, festgelegt wird, daß es im durchschnittlichen ersten Zeichen die zweite Farbe besitzt.
  • Es ist zu erkennen, daß bei der vorliegenden Erfindung nur ein Exemplar von jedem Zeichen einer neuen Schrift benötigt wird. Aus diesem Einzelexemplar kann die OCR-Vorrichtung die Pixelfarbwahrscheinlichkeiten berechnen, die die Entscheidungsbaumerzeugungslogik braucht, um einen Entscheidungsbaum für die neue Schrift zu erzeugen. Dadurch wird die Erzeugung neuer Entscheidungsbäume zur Erkennung neuer Schriften wesentlich vereinfacht.

Claims (14)

1. Ein Verfahren zum Betrieb einer Vorrichtung zur optischen Zeichenerkennung, unter Verwendung eines Entscheidungsbaums zur Erkennung der Zeichen in einer ersten Schrift, wobei die Vorrichtung einen Speicher besitzt, in dem eine Wahrscheinlichkeitstabelle gespeichert ist, welche die Wahrscheinlichkeit angibt, daß bei einer von der ersten Schrift verschiedenen zweiten Schrift ein Pixel als Funktion eines Nachbarschaftsstatus eine erste unterscheidbare Farbe aufweist, und wobei das Verfahren aus folgenden Schritten besteht:
(i) Einlesen eines Dokuments mit Zeichen in der ersten Schrift zur Erzeugung einer Pixelmatrix, in der jedes Pixel einen Nachbarschaftsstatus besitzt;
(ii) Identifikation eines Pixelmusters in der Matrix, das ein Zeichen darstellt;
(iii) Auswählen eines Pixels aus dem Muster;
(iv) Bestimmung des Nachbarschaftsstatus des Pixels auf genau die gleiche Weise wie der Nachbarschaftsstatus jedes Pixels in der zweiten Schrift bestimmt wurde;
(v) Adressierung des Speichers mit dem Nachbarschaftsstatus des ausgewählten Pixels;
(vi) Auslesen der Wahrscheinlichkeit, daß das ausgewählte Pixel die seinem Nachbarschaftsstatus zugeordnete unterscheidbare Farbe aufweist, aus dem Speicher und Zuweisung dieser Wahrscheinlichkeit an das ausgewählte Pixel;
(vii) Wiederholen der Schritte (iii) bis (vi) für weitere ausgewählte Pixel des Musters;
(viii) Generieren eines neuen Entscheidungsbaums für die erste Schrift anhand der Wahrscheinlichkeiten der unterscheidbaren Farbe ohne Zuhilfenahme bereits vorhandener Entscheidungsbäume; sowie
(ix) Verwendung des neuen Entscheidungsbaums für die Interpretation der Pixel bei der Zeichenerkennung.
2. Ein Verfahren gemäß Anspruch 1, bei dem der Nachbarschaftsstatus jedes Pixels bestimmt wird, indem eine Matrix untersucht wird, die aus einer vorgegebenen Anzahl von Pixeln um das in Frage stehende Pixel besteht.
3. Ein Verfahren gemäß Anspruch 2, bei dem der Nachbarschaftsstatus jedes Pixels eine gewichtete Summe der Werte enthält, die den Pixeln der Matrix aufgrund ihrer Position in der Matrix zugeordnet sind.
4. Ein Verfahren gemäß Anspruch 2 oder 3, bei dem die Matrix die acht Pixel umfaßt, welche dem in Frage stehenden Pixel unmittelbar benachbart sind.
5. Ein Verfahren gemäß Anspruch 1 bis 4, das außerdem einen Schritt umfaßt, in dem mehrere zusätzliche Pixelmuster, die jeweils ein Zeichen darstellen, identifiziert werden.
6. Ein Verfahren gemäß Anspruch 5, das außerdem einen Schritt umfaßt, in dem Muster, die das gleiche Zeichen darstellen, verglichen werden, und in dem zur Bestimmung des Nachbarschaftsstatus von Pixeln ein Durchschnittsmuster für das betreffende Zeichen gebildet wird.
7. Ein Verfahren gemäß Anspruch 6, bei dem der Schritt der Bildung eines Durchschnittsmusters einen Teilsahritt enthält, in dem jedem Pixel die unterscheidbare Farbe zugewiesen wird, wenn das betreffende Pixel in mindestens der Hälfte der verglichenen Blöcke diese unterscheidbare Farbe aufweist.
8. Eine Vorrichtung zur optischen Zeichenerkennung, die Mittel zur Erzeugung eines Entscheidungsbaums für die Interpretation von Pixeln zur Erkennung von Zeichen in einer ersten Schrift besitzt und einen Speicher enthält, in dem eine Wahrscheinlichkeitstabelle gespeichert ist, in der aufgelistet ist, wie hoch die Wahrscheinlichkeit ist, daß ein Pixel in einer von der ersten Schrift verschiedenen zweiten Schrift als Funktion seines Nachbarschaftsstatus eine erste unterscheidbare Farbe aufweist, wobei das Mittel zur Erzeugung des Entscheidungsbaums folgende Schritte ausführt:
(i) Einlesen eines Dokuments mit Buchstaben in der ersten Schrift zur Erzeugung einer Pixelmatrix, in der jedes Pixel einen Nachbarschaftsstatus besitzt;
(ii) Identifikation eines Pixelmusters in der Matrix, das ein Zeichen darstellt;
(iii) Auswählen eines Pixels aus dem Muster;
(iv) Bestimmung des Nachbarschaftsstatus des Pixels auf genau die gleiche Weise wie der Nachbarschaftsstatus jedes Pixels in der zweiten Schrift bestimmt wurde;
(v) Adressierung des Speichers mit dem Nachbarschaftsstatus des ausgewählten Pixels;
(vi) Auslesen der Wahrscheinlichkeit, daß das ausgewählte Pixel die seinem Nachbarschaftsstatus zugeordnete unterscheidbare Farbe aufweist, aus dem Speicher und Zuweisung dieser Wahrscheinlichkeit an das ausgewählte Pixel;
(vii) Wiederholen der Schritte (iii) bis (vi) für weitere ausgewählte Pixel des Musters;
(viii) Generieren eines neuen Entscheidungsbaums für die erste Schrift anhand der Wahrscheinlichkeiten der unterscheidbaren Farbe ohne Zuhilfenahme bereits vorhandener Entscheidungsbäume.
9. Ein Verfahren zur Erkennung von Zeichen einer unbekannten Schrift durch eine Vorrichtung zur optischen Zeichenerkennung mit einem Entscheidungsbaum zur Interpretation von Pixeln, der nach dem aus folgenden Schritten bestehenden Verfahren erstellt wurde:
zur Erzeugung einer Pixelmatrix ein Dokument in einer ersten Schrift einlesen;
für jedes Pixel eine zuvor ausgewählte Matix von benachbarten Pixeln als Nachbarschaft des Pixels angeben;
anhand der Pixelmatrix die Wahrscheinlichkeit bestimmen, daß ein ausgewähltes Pixel bei einem bestimmten Nachbarschaftsstatus eine erste unterscheidbare Farbe aufweist;
eine Wahrscheinlichkeitstabelle speichern, in der für jeden Nachbarschaftsstatus eines Pixels die Wahrscheinlichkeit aufgeführt ist, daß das ausgewählte Pixel die unterscheidbare Farbe aufweist;
ein Dokument in einer unbekannten Schrift einlesen, um eine zweite Pixelmatrix zu erzeugen;
in der Matrix mehrere Pixelmuster identifizieren, die jeweils ein Zeichen darstellen;
für jedes Pixel in jedem Muster die vorher ausgewählte Matrix von Nachbarpixeln als Nachbarschaft des Pixels auswählen und so anhand der Nachbarschaft des Pixels seinen Nachbarschaftsstatus bestimmen, und anschließend die Tabelle anhand des Nachbarschaftsstatus des betreffenden Pixels adressieren und in der Tabelle die Wahrscheinlichkeit, daß das Pixel die unterscheidbare Farbe besitzt, ablesen;
mit Hilfe der für ausgewählte Pixel aus der Tabelle ausgelesenen Wahrscheinlichkeiten einen neuen Entscheidungsbaum für die unbekannte Schrift erzeugen, ohne daß auf bereits vorhandene Entscheidungsbäume zurückgegriffen wird.
10. Das Verfahren gemäß Anspruch 9, wobei der Nachbarschaftsstatus jedes Pixels eine gewichtete Summe der Werte enthält, die den Pixeln in der Matrix aufgrund ihrer Position in der Matrix zugewiesen sind.
11. Ein Verfahren gemäß Anspruch 9 oder 10, das ferner folgende Schritte umfaßt:
Vergleichen mehrerer Muster, die das gleiche gedruckte Zeichen darstellen; und
Erzeugung eines Durchschnittsmusters, indem jedem Pixel im Durchschnittsmuster die unterscheidbare Farbe zugewiesen wird, wenn das betreffende Pixel in mindestens der Hälfte der verglichenen Blöcke die unterscheidbare Farbe besitzt.
12. Ein Verfahren zur Steuerung einer OCR-Vorrichtung zur Erkennung von Zeichen einer unbekannten Schrift mit Hilfe eines Entscheidungsbaums zur Interpretation von Pixeln für die Zeichenerkennung, wobei der Entscheidungsbaum anhand der Wahrscheinlichkeiten, daß Pixel eine erste unterscheidbare Farbe aufweisen, erzeugt wird, und den Pixeln die Wahrscheinlichkeiten durch ein Verfahren mit folgenden Schritten zugewiesen werden:
(a) Einlesen eines Referenzdokuments in einer ersten Schrift und Konvertierung des eingelesenen Referenzdokuments in ein Pixelmuster, wobei
(i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt; und
(ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Anzahl von Nachbarpixeln der konvertierten Pixel besitzt; und
(iii) die Nachbarschaft einen durch die Farben der Nachbarpixels bestimmten Nachbarschaftsstatus besitzt;
(b) Bestimmung der Farbe jedes Pixels des eingelesenen Referenzdokuments;
(c) Bestimmung des Nachbarschaftsstatus jedes Pixels des eingelesenen Referenzdokuments;
(d) Division der Häufigkeit, mit der ein Pixel in einer Nachbarschaft mit einem ersten Nachbarschaftsstatus die erste Farbe aufweist, durch die Häufigkeit, mit der im eingelesenen Dokument der erste Nachbarschaftsstatus im Referenzdokument vorkommt, um die Wahrscheinlichkeit zu ermitteln, daß ein Pixel die erste Farbe aufweist, wenn seine Nachbarschaft den ersten Nachbarschaftsstatus besitzt;
(e) Wiederholung von Schritt (d) für jeden möglichen Nachbarschaftsstatus zur Berechnung einer Wahrscheinlichkeitstabelle, in der alle möglichen Nachbarschaftsstatus und die zugehörigen Wahrscheinlichkeiten jedes ausgewählten Pixels in der ersten Farbe aufgelistet sind;
(f) Speichern der Wahrscheinlichkeitstabelle in der OCR-Vorrichtung; und
(g) Einlesen eines zweiten Dokuments in einer unbekannten zweiten Schrift und Konvertierung dieses zweiten Dokuments in eine Pixelmatrix, wobei:
(i) jedes konvertierte Pixel entweder eine erste oder eine zweite Farbe besitzt;
(ii) jedes konvertierte Pixel eine Nachbarschaft aus einer vorgegebenen Zahl von Nachbarpixeln der konvertierten Pixel besitzt, wobei die Nachbarschaft Nachbarpixel enthält, die dem Nachbarschaftsstatus der Pixel des Referenzdokuments entsprechen; und
(iii) die Nachbarschaft einen durch die Farben der Nachbarpixel bestimmten Nachbarschaftsstatus besitzt.
(h) Bestimmung des Nachbarschaftsstatus von jedem von mehreren konvertierten Pixeln in dem Muster; und
(i) für jedes ausgewählte konvertierte Pixel Ablesen des Nachbarschaftsstatus aus der gespeicherten Wahrscheinlichkeitstabelle und Auslesen der Wahrscheinlichkeit,
daß das Pixel die erste Farbe besitzt, aus der Wahrscheinlichkeitstabelle.
13. Ein Verfahren gemäß Anspruch 12, bei dem der Schritt des Einlesens des zweiten Dokuments folgende Schritte umfaßt:
Identifikation eines ersten durch die Pixel in einem Pixelmuster definierten Zeichens im zweiten Dokument;
Ermitteln, ob das erste Zeichen mehr als einmal im zweiten Dokument vorkommt; und
falls das erste Zeichen mehr als einmal im zweiten Dokument vorkommt, Erzeugung eines durchschnittlichen ersten Zeichens aus mehreren Vorkommen des ersten Zeichens.
14. Ein Verfahren gemäß Anspruch 13, bei dem der Schritt der Durchschnittsbildung des ersten Zeichens folgende Teilschritte umfaßt:
die verschiedenen Vorkommen des ersten Zeichens vergleichen;
für jedes Pixel im Zeichenfenster für das erste Zeichen ermitteln, ob das Pixel die erste Farbe öfter aufweist als die zweite Farbe;
für jedes Pixel, das die erste Farbe öfter als die zweite aufweist, wird festgelegt, daß es im durchschnittlichen ersten Zeichen die erste Farbe besitzt; und
für jedes Pixel, das die zweite Farbe öfter als die erste aufweist, wird festgelegt, daß es im durchschnittlichen ersten Zeichen die zweite Farbe besitzt.
DE68925312T 1988-07-19 1989-07-12 Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik Expired - Fee Related DE68925312T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/221,164 US4831657A (en) 1988-07-19 1988-07-19 Method and apparatus for establishing pixel color probabilities for use in OCR logic

Publications (2)

Publication Number Publication Date
DE68925312D1 DE68925312D1 (de) 1996-02-15
DE68925312T2 true DE68925312T2 (de) 1996-07-11

Family

ID=22826628

Family Applications (1)

Application Number Title Priority Date Filing Date
DE68925312T Expired - Fee Related DE68925312T2 (de) 1988-07-19 1989-07-12 Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik

Country Status (5)

Country Link
US (1) US4831657A (de)
EP (1) EP0352011B1 (de)
JP (1) JPH0682401B2 (de)
CA (1) CA1313266C (de)
DE (1) DE68925312T2 (de)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5067088A (en) * 1990-02-16 1991-11-19 Johnson & Quin, Inc. Apparatus and method for assembling mass mail items
US5020121A (en) * 1990-08-16 1991-05-28 Hewlett-Packard Company Neighborhood block prediction bit compression
WO1992008198A1 (en) * 1990-11-05 1992-05-14 Johnson & Quin, Inc. Document control and audit apparatus and method
US5253307A (en) * 1991-07-30 1993-10-12 Xerox Corporation Image analysis to obtain typeface information
US5406640A (en) * 1991-12-20 1995-04-11 International Business Machines Corporation Method of and apparatus for producing predominate and non-predominate color coded characters for optical character recognition
US5396564A (en) * 1991-12-20 1995-03-07 International Business Machines Corporation Method of and apparatus for recognizing predominate and non-predominate color code characters for optical character recognition
US5875261A (en) * 1991-12-20 1999-02-23 International Business Machines Corporation Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing
FR2685795B1 (fr) * 1991-12-26 1994-02-25 Thomson Csf Procede de segmentation polytomique.
JP3106021B2 (ja) * 1992-11-30 2000-11-06 キヤノン株式会社 パターンデータの圧縮方法及び装置と出力方法及び装置
IL172678A0 (en) * 2005-12-19 2006-04-10 Aharon Topper Method, system and computer program for encoding and decoding a pixelized target graphic symbol
US20130039589A1 (en) * 2011-08-11 2013-02-14 I. R. I. S. Pattern recognition process, computer program product and mobile terminal
RU2598300C2 (ru) 2015-01-27 2016-09-20 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы автоматического распознавания символов с использованием дерева решений

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3839702A (en) * 1973-10-25 1974-10-01 Ibm Bayesian online numeric discriminant
US3964591A (en) * 1975-06-10 1976-06-22 International Business Machines Corporation Font selection system
US4274079A (en) * 1979-07-12 1981-06-16 Burroughs Corporation Apparatus and method for dynamic font switching
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4589142A (en) * 1983-12-28 1986-05-13 International Business Machines Corp. (Ibm) Method and apparatus for character recognition based upon the frequency of occurrence of said characters
JPS60262290A (ja) * 1984-06-08 1985-12-25 Hitachi Ltd 情報認識システム
JPH0727543B2 (ja) * 1988-04-28 1995-03-29 インターナシヨナル・ビジネス・マシーンズ・コーポレーション 文字認識装置

Also Published As

Publication number Publication date
US4831657A (en) 1989-05-16
EP0352011A2 (de) 1990-01-24
EP0352011A3 (de) 1992-02-05
DE68925312D1 (de) 1996-02-15
CA1313266C (en) 1993-01-26
JPH0682401B2 (ja) 1994-10-19
JPH0239389A (ja) 1990-02-08
EP0352011B1 (de) 1996-01-03

Similar Documents

Publication Publication Date Title
DE3689416T2 (de) Mustermerkmalextraktion.
DE3633743C2 (de)
DE69421255T2 (de) Dokumentkopierabwehrverfahren
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE3486272T2 (de) Verfahren und Anlage zur auf der Häufigkeit des Vorkommens der Zeichen gegründeten Zeichenerkennung.
DE3716787C2 (de)
DE68915950T2 (de) Verfahren zum Trennen von Zeichen.
DE69329380T2 (de) Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
DE3786472T2 (de) Vorrichtung für optische Zeichenerkennung.
DE2247942A1 (de) Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen
DE68925312T2 (de) Verfahren zur Pixelfarbenwahrscheinlichkeitsbestimmung zur Verwendung in OCR-Logik
DE2640537A1 (de) Verfahren und vorrichtung zum unterscheiden zwischen n groesser als 2 alphabeten angehoerenden zeichen
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE3113555A1 (de) Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
DE3036711C2 (de) Verfahren zum Verkleinern von grafischen Mustern
DE1102450B (de) Daten verarbeitende Einrichtung
DE4119091C2 (de) Verfahren zum Erkennen von Zeichen, insbesondere Schriftzeichen und Einrichtung zur Durchführung des Verfahrens
DE3241673C2 (de) Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen
DE69127887T2 (de) Punktmatrixbildverbesserung für optische zeichenerkennung
DE2836725A1 (de) Zeichenerkennungseinheit
DE2435982A1 (de) Verfahren und vorrichtung zur verarbeitung von durch abtastung eines mehrfarbigen musters erhaltenen informationen
DE69529015T2 (de) Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition
DE2435889B2 (de) Verfahren und einrichtung zur unterscheidung von zeichengruppen
DE60035092T2 (de) Bildumwandlungsvorrichtung, Speichermedium, und Bildumwandlungsverfahren
DE69421369T2 (de) Automatische Schwellwertbestimmung für numerische Abtaster

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee