DE3887665T2 - Verfahren und Gerät für Zeichenerkennungssysteme. - Google Patents

Verfahren und Gerät für Zeichenerkennungssysteme.

Info

Publication number
DE3887665T2
DE3887665T2 DE3887665T DE3887665T DE3887665T2 DE 3887665 T2 DE3887665 T2 DE 3887665T2 DE 3887665 T DE3887665 T DE 3887665T DE 3887665 T DE3887665 T DE 3887665T DE 3887665 T2 DE3887665 T2 DE 3887665T2
Authority
DE
Germany
Prior art keywords
character
logic
rejection
probability
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE3887665T
Other languages
English (en)
Other versions
DE3887665D1 (de
Inventor
William Carl Martin
Gene Dale Rohrer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Application granted granted Critical
Publication of DE3887665D1 publication Critical patent/DE3887665D1/de
Publication of DE3887665T2 publication Critical patent/DE3887665T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/809Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)

Description

  • Diese Erfindung befaßt sich mit dem Gebiet der Zeichenerkennung und läßt sich insbesondere auf Magnetschrifterkennungssysteme (MICR-Systeme) zum Lesen von Schriftstücken anwenden, die mit Zeichen aus Magnettinte gedruckt sind.
  • Bei der Bearbeitung von Schriftstücken, die mit Zeichen zur Magnetschrifterkennung (MICR) kodiert sind, hat man erkannt, daß es zur Erhöhung der Bearbeitungseffizienz wünschenswert ist, die Ablehnungsrate, d. h. die Häufigkeit, mit der der Lesekopf und die zugehörige Erkennungslogik ein Zeichen nicht mehr als gültigen Teil eines Zeichensatzes erkennen können, so weit wie möglich zu senken. Die Bearbeitung abgelehnter Zeichen erfordert manuelles Eingreifen, was die Betriebseffizienz verringert und die Kosten für die Bearbeitung des Schriftstücks erhöht. Um die Ablehnungsrate zu senken, wurde vorgeschlagen, Doppel-Lesesysteme zu verwenden, die üblicherweise zwei verschiedene Lesekopf typen mit unterschiedlichen Eigenschaften und Fähigkeiten bezüglich des Lesens von Zeichen einsetzen, so daß, falls der erste Kopf ein Zeichen nicht erkennen kann, die Erkennung des Zeichens durch einen zweiten Kopf zu einem erfolgreichen Lesen dieses Schriftstücks führen und somit die Ablehnungsrate senken würde. Ein solches Doppelkopf-Erkennungssystem wurde bisher einmal in der US-Patentschrift 3 938 089 vom 10. Februar 1976 offenbart.
  • Ein Faktor, der von früheren Zeichenerkennungssystemen nicht berücksichtigt wurde, sind die beträchtlichen ökonomischen Folgen von abgelehnten und irrtümlich ersetzten Zeichen. Während die manuelle Bearbeitung von "abgelehnten Zeichen" die Effizienz senkt und die Kosten erhöht, ist es bei weitem kostspieliger, nicht entdeckte "irrtümlich ersetzte Zeichen" (d. h. die Erkennungslogik liest ein Zeichen nicht richtig und das richtige Zeichen wird durch ein falsches Zeichen ersetzt) zu korrigieren. Beispielsweise werden bei der Bearbeitung von Schecks die Schriftstücke, die mit nicht erkannten, irrtümlich ersetzten Zeichen das System durchlaufen, möglicherweise erst viel später entdeckt, zum Beispiel, nachdem der Scheck zu einer anderen Bank geschickt oder falsch auf ein Kundenkonto verbucht wurde. Zu diesem späteren Zeitpunkt ist eine Korrektur des Fehlers weitaus teurer. Es kann 50 bis 100 mal so teuer sein, ein irrtümlich ersetztes Zeichen von Hand zu korrigieren, als ein abgelehntes Zeichen zu korrigieren. Allerdings tritt das irrtümliche Ersetzen von Zeichen wesentlich seltener als Ablehnungen von Zeichen auf. Die vorliegende Erfindung beruht auf einer Betrachtung der ökonomischen Auswirkungen von irrtümlich ersetzten Zeichen und abgelehnten Zeichen, um eine größere Gesamteffizienz des Betriebs des Lesesystems für Schriftstücke zu gewähren. Wie aus der folgenden Erläuterung offensichtlich wird, verwendet die vorliegende Erfindung darüber hinaus einen neuartigen und etwas ungewöhnlichen Lösungsansatz, um diese Verbesserung der Gesamteffizienz zu erreichen.
  • Die vorliegende Erfindung verwendet anspruchsgemäß ein Verfahren zur Auswahl zwischen den Ausgaben verschiedener Zeichenerkennungssysteme, um die Quote, mit der Zeichen erkannt werden, zu erhöhen, ohne dabei die Anzahl unerkannter Fehler (irrtümlich ersetzte Zeichen) wesentlich zu erhöhen. Falls das erste System ein Zeichen nicht erkennen kann, entscheidet ein Zufallsgenerator, ob die Ausgabe des zweiten Erkennungssystem verwendet wird oder ob statt dessen das Zeichen abgelehnt wird.
  • Beispielsweise besitzt ein Magnetzeichen-Lesekopf mit mehreren Spalten, der durch Wechselstrom magnetisierte Zeichen liest, beim Lesen qualitativ hochwertig gedruckter Magnetzeichen eine sehr hohe Erkennungsquote, wobei das Wechselstromsystem jedoch manchmal das Zeichen nicht erkennen kann und anstelle des nicht erkannten Zeichens ein Ablehnungszeichen erzeugt. Falls die gleichen Zeichen durch ein Gleichstromfeld magnetisiert und von einem Ein-Spalt-Lesekopf gelesen werden, werden möglicherweise einige der abgelehnten Zeichen erkannt, wodurch vermieden wird, das Zeichen von Hand zu identifizieren. Das Gleichstromsystem kann zum Beispiel mit einem Zellophanstreifen oder dergleichen bedeckte Zeichen besser lesen. Falls das Wechselstromsystem ein Zeichen nicht erkennen kann und das Gleichstromsystem das Zeichen erkennt, besteht jedoch die Gefahr, daß sich das Gleichstromsystem in Wirklichkeit irrt und daß die Entscheidung für die Ausgabe des Gleichstromsystems zu einem nicht entdeckten Fehler durch ein irrtümlich ersetztes Zeichen führt. Die vorliegende Erfindung berücksichtigt die Möglichkeit, daß die Entscheidung für die Ausgabe des Gleichstromsystems anstelle eines vom Wechselstromsystem erzeugten Ablehnungszeichens zu einer Anzahl von nicht entdeckten Fehlern durch irrtümlich ersetzte Zeichen führt. Es kann 50 bis 100 mal so teuer sein, einen Fehler durch ein irrtümlich ersetztes Zeichen zu beheben, als für das abgelehnte Zeichen das richtige Zeichen zu finden. Somit kann es teurer sein, diese nicht entdeckten Fehler durch irrtümlich ersetzte Zeichen zu korrigieren, als selbst eine größere Anzahl vom Wechselstromsystem allein erzeugter, abgelehnter Zeichen zu berichtigen. Wenn das Wechselstromsystem bei guter Druckqualität der Zeichen ein Zeichen ablehnt, ist es wahrscheinlicher, daß eine nicht abgelehnte Ausgabe des Gleichstromsystems richtig ist. Bei schlechter Druckqualität andererseits sinkt die Wahrscheinlichkeit, daß die Gleichstromausgabe richtig ist, und da es sehr teuer ist, nicht entdeckte Fehler durch irrtümlich ersetzte Zeichen zu beheben, wäre in diesem Fall die Verwendung der Gleichstromausgabe sehr teuer. Das Verfahren der vorliegenden Erfindung wird diesen Faktoren dadurch gerecht, indem es ausschließlich die Ausgabe des Gleichstromsystems mit einer Wahrscheinlichkeit p verwendet, die von der Druckqualität und den Kosten für die Behebung von nicht entdeckten Fehlern durch irrtümliche ersetzte Zeichen abhängt. Die Wahrscheinlichkeit p kann im voraus festgelegt oder dynamisch aus der Ablehnungsquote eines oder beider Erkennungssysteme ermittelt werden. Die Verwendung einer Wahrscheinlichkeit relativiert sowohl die guten Ergebnisse, die man erhielte, wenn die Ausgabe des Gleichstromsystems bei gleichzeitiger Ablehnung durch das Wechselstromsystem tatsächlich richtig wäre, als auch die katastrophalen Ergebnisse, die sich ergeben, wenn eine größere Anzahl vom Wechselstromsystem abgelehnter Zeichen durch falsche Zeichen ersetzt werden.
  • Entsprechend dem unabhängigen Anspruch 1 für das Gerät und seinen breitgefächerten Gesichtspunkten, besteht die Dokumenten- Lesemaschine der vorliegenden Erfindung aus
  • einem ersten Zeichenlesesystem zum Lesen von Zeichen auf Schriftstücken;
  • einem zweiten Zeichenlesesystem, das ebenfalls zum Lesen der Zeichen auf den Schriftstücken dient;
  • einer ersten Zeichenerkennungslogik zur Erkennung von durch das erste System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die erste Logik in regelmäßigen Abständen einen ersten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
  • einer zweiten Zeichenerkennungslogik zur Erkennung von durch das zweite System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die zweite Logik in regelmäßigen Abständen einen zweiten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
  • gekennzeichnet durch
  • eine Entscheidungslogik zur Auswahl einer der folgenden Möglichkeiten: ein Zeichen, das durch die erste Logik erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das durch die zweite Logik als das Zeichen erkannt wurde, das einem Zeichen auf dem Schriftstück am genauesten entspricht; und wobei die Entscheidungslogik eine Vorrichtung enthält, mit der im wesentlichen zufällig die von der zweiten Logik erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt werden, wenn die erste Logik das Ablehnungszeichen erzeugt, wobei p eine Wahrscheinlichkeit mit einem Wertebereich zwischen 0 und 1 ist; und
  • eine Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit p.
  • Kurzbeschreibung der Zeichnungen
  • Nachdem einige der Möglichkeiten und Vorteile der Erfindung aufgeführt wurden, werden andere mit Fortschreiten der Beschreibung in Verbindung mit den begleitenden Zeichnungen offensichtlich, von denen
  • Fig. 1 eine schematische Darstellung der Abfolge logischer Operationen in einem erfindungsgemäßen System zur Bearbeitung von Schecks ist;
  • Fig. 2 ein Schaubild ist, das die Beziehung zwischen den Kosten fehlerhafter Lesevorgänge und den Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, veranschaulicht;
  • Fig. 3 ein Schaubild ist, das die Auswirkung von Änderungen der Ablehnungsquote auf die Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, ist.
  • Die der vorliegenden Erfindung zugrundeliegende Theorie und deren praktischer wirtschaftlicher Wert wird aus der folgenden, näheren Beschreibung vollständiger verständlich, die erstens eine Erläuterung der Entwicklung der Vergleichskostenanalyse und Vergleichskostengleichung und zweitens ein Beispiel für die Anwendung dieser Prinzipien auf tatsächliche Daten aus einem Vorgang zur Bearbeitung von Schriftstücken enthält.
  • Die in der vorliegenden Erfindung beteiligten logischen Operationen werden in Fig. 1 veranschaulicht. Die zu bearbeitenden Schriftstücke, bezeichnet als D, werden zuerst von einem ersten Zeichenlesesystem, bezeichnet als 10, und dessen zugehöriger Zeichenerkennungslogik, bezeichnet als 11, bearbeitet. Ein Wechselstromlesesystem wird aufgrund seiner unter den meisten Umständen größeren Gesamtgenauigkeit als erstes Lesesystem bevorzugt. Schriftstücke, deren Magnetzeichen erfolgreich erkannt wurden, werden durch den Pfeil 20 dargestellt und als "gute Schriftstücke" bezeichnet, während Schriftstücke, die aufgrund vom ersten Lesesystem nicht erkannter Zeichen abgelehnte Zeichen enthalten, durch den Pfeil 22 dargestellt und als "Ablehnungen" bezeichnet werden. Die vom ersten Lesesystem ausgehenden Ablehnungen werden von einer Entscheidungslogik 30 bearbeitet, die darüber entscheidet, ob das Schriftstück durch ein zweites Lesesystem 40 bearbeitet wird oder ob das Schriftstück als Ablehnung eingestuft wird, wie es Pfeil 31 anzeigt, und in einen Behälter 33 für abgelehnte Schriftstücke geleitet wird. Diese als Ablehnung eingestuften und im Behälter 33 für abgelehnte Schriftstücke abgelegten Schriftstücke machen für die Erkennung der gedruckten Zeichen eine Bearbeitung von Hand erforderlich.
  • Jene Schriftstücke, die mit der Nummer 32 bezeichnet sind und die für die Bearbeitung durch das zweite Lesesystem akzeptiert wurden, werden dann vom zweiten Lesesystem 40 und dessen zugehöriger Erkennungslogik 41 gelesen. Wenn die Zeichen des Schriftstücks erfolgreich erkannt werden, wird es als "gutes Schriftstück" eingestuft und zum Behälter 18 für gute Schriftstücke weitergeleitet, was durch den Pfeil 42 angedeutet wird. Jene Schriftstücke, die das zweite Lesesystem 40 nicht erfolgreich erkennt, werden als Ablehnung eingestuft und in den Behälter 33 für abgelehnte Schriftstücke weitergeleitet, wie dies Pfeil 43 anzeigt, damit sie dort von Hand bearbeitet werden.
  • Während des Betriebs der Entscheidungslogik 30 wird die Entscheidung, ob das Schriftstück sofort als Ablehnung eingestuft wird oder ob es für die weitere Bearbeitung durch ein zweites Lesesystem 40 akzeptiert wird, im wesentlichen durch die zufällige Entscheidung eines Zufallsgenerators bestimmt. Der Wahrscheinlichkeitsparameter p steht für die Wahrscheinlichkeit, mit der ein Schriftstück akzeptiert wird, wobei p eine Zahl zwischen 0 und 1 ist. Bei einer Wahrscheinlichkeit von 0 werden keine Schriftstücke über den Pfeil 32 für die Bearbeitung durch das zweite Lesesystem 40 akzeptiert, und alle durch die Entscheidungslogik 30 bearbeiteten Schriftstücke 22 würden als Ablehnungen 31 eingestuft werden. Bei einer Wahrscheinlichkeit von eins würden andererseits alle Schriftstücke 22 über den Pfeil 32 durch das zweite Lesesystem 40 bearbeitet werden, und kein Schriftstück würde als Ablehnung bei Pfeil 31 eingestuft werden.
  • Dabei wird in Kauf genommen, daß sich unter denen Schriftstücken, die über Pfeil 20 das Magazin 18 für gute Schriftstücke erreichen, nicht nur richtig identifizierte Schriftstücke befinden, sondern daß darunter auch eine gewisse Anzahl von Schriftstücken mit nicht entdeckten Fehlern durch irrtümliche Ersetzung ist, die vom ersten Lesesystem herrühren. In ähnlicher Weise werden jene mit 42 bezeichneten Schriftstücke, die vom zweiten Lesesystem erfolgreich gelesen wurden, nicht nur gute Schriftstücke enthalten, sondern auch eine gewisse Anzahl von Schriftstücken mit nicht entdeckten Fehlern durch irrtümliche Ersetzung, die vom zweiten Lesesystem herrühren. Da das zweite Lesesystem nur Schriftstücke schlechter Qualität liest, die das erste Lesesystem 10 nicht lesen konnte, besteht eine höhere Wahrscheinlichkeit dafür, daß nicht entdeckte Fehler durch irrtümliche Ersetzung vom zweiten Lesesystem 40 herrühren als vom ersten Lesesystem.
  • Eine Gleichung für die Gesamtkosten, ausgedrückt als Zahl der Ablehnungen, kann folgendermaßen abgeleitet werden, wobei D die Gesamtzahl der Schriftstücke ist;
  • RRx die Ablehnungsquote des Lesesystem x ist;
  • SRx die Ersetzungsquote des Lesesystem x ist;
  • Rx die Gesamtzahl der Ablehnungen des Systems x ist;
  • Sx die Gesamtzahl der Ersetzungen des Systems x ist; und
  • p die Wahrscheinlichkeit dafür ist, daß ein Schriftstück akzeptiert wird.
  • Die Anzahl der Ablehnungen durch das System 1 (R&sub1;), die die Entscheidungslogik 30 erreichen, kann durch die Beziehung
  • R&sub1; = D · RR&sub1;
  • wiedergegeben werden. Die Gesamtzahl der Ablehnungen Rt kann durch die Summe der vom zweiten Lesesystem 40 erzeugten Ablehnungen (Pfeil 43) und der von der Entscheidungslogik als Ablehnung eingestuften Schriftstücke (Pfeil 31) ermittelt werden. Dies kann wie folgt wiedergegeben werden:
  • Rt = p (R&sub1; · RR&sub2;) + (1-p) R&sub1;
  • Die Gesamtzahl der Ersetzungen St kann folgendermaßen definiert werden:
  • S&sub1; = D · SR&sub1;
  • St = S&sub1; + p (R&sub1; · SR&sub2;)
  • Wenn man das Kostenverhältnis falscher Lesevorgänge kennt, können dann die Gesamtkosten der falschen Lesevorgänge ermittelt werden. Das Kostenverhältnis F falscher Lesevorgänge gibt das Verhältnis zwischen den Kosten einer irrtümlichen Ersetzung und den Kosten einer Ablehnung wieder. Damit können die Gesamtkosten (ausgedrückt als Zahl der Ablehnungen) wie folgt definiert werden:
  • Kosten = Rt + F · St
  • Fig. 2 zeigt grafisch die Anwendung dieser Gleichung auf die Grenzfälle mit p gleich 0 und p gleich 1 sowie einen Fall dazwischen, wo p gleich 0,5 ist. In diesem Beispiel wurden folgende Konstanten verwendet: D = 1 000 000; RR&sub1; = 0,01; SR&sub1; = 0,000005; RR&sub2; = 0,25 und SR&sub2; = 0,01. Dieser Kurve läßt sich entnehmen, daß die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 1 auftreten, wenn das Kostenverhältnis F falscher Lesevorgänge von 0 auf 75 steigt. Oberhalb eines Kostenverhältnisses falscher Lesevorgänge von 75 ergeben sich die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 0.
  • Beispiel
  • Das folgende Beispiel veranschaulicht die wirtschaftlichen Auswirkungen der Anwendung der Prinzipien aus vorliegender Erfindung auf eine spezielle Situation. Die nachfolgende Tabelle l zeigt die Verteilung der Ablehnungsquoten und Ersetzungsquoten, die sich aus einem tatsächlich durchgeführten Testlauf für eine Million Schriftstücken ergaben. Im Bereich der aufgetretenen Ablehnungsquoten stellt die Zahl der Schriftstücke im wesentlichen eine Normalverteilungskurve dar. Tabelle 1
  • Die Kosten, ausgedrückt als Zahl der Ablehnungen, wurde mit Hilfe der oben abgeleiteten Gleichung über den Wertebereich der aufgetretenen Ablehnungsquoten berechnet, wobei für Beispielzwecke ein Kostenverhältnis (F) falscher Lesevorgänge von 50 verwendet wurde. Fig. 3 ist ein Schaubild der Daten aus Tabelle 1, das die Beziehung der Kosten, ausgedrückt als Zahl der Ablehnungen, zur Ablehnungsquote (RR&sub1;) des ersten Lesesystems bei Wahrscheinlichkeiten von P = 0, 0,5 und 1 zeigt. Es ist zu erkennen, daß sich die drei Kurven bei einer Ablehnungsquote von etwa 0,013 schneiden. Wenn sich die Ablehnungsrate unterhalb dieses Werts befindet, erhält man die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 1, d. h. wenn alle Ablehnungen des Systems 1 akzeptiert werden. Bei einer Ablehnungsquote über ungefähr 0,013 erhält man die geringsten Kosten, ausgedrückt als Zahl der Ablehnungen, für p gleich 0, d. h. wenn das zweite Lesesystem keines der vom System 1 abgelehnten Schriftstücke liest und alle als Ablehnungen einstuft. Offensichtlich ändert sich die in Fig. 3 gezeigte spezielle Beziehung, wenn sich das Kostenverhältnis F falscher Lesevorgänge und die spezielle Ablehnungsquote bei gegebenen Bedingungen ändert. Beispielsweise kann sich die Ablehnungsquote in Abhängigkeit von Faktoren wie der geographischen Herkunft der Schriftstücke, dem speziellen Industriezweig, aus dem die Schriftstücke stammen, der speziellen Art des bearbeiteten Schriftstücks (z. B. Travellerschecks, privat ausgestellte Schecks, geschäftlich ausgestellte Schecks usw.) und sogar in Abhängigkeit von Änderungen der Jahreszeit oder des Wetters ändern. Daher kann die optimale Wahrscheinlichkeit p für ein gegebenes System stark schwanken.
  • In einem vergleichsweise einfachen und unkomplizierten Anwendungsbeispiel für die vorliegende Erfindung kann die Wahrscheinlichkeit p von Hand festgelegt und korrigiert werden, wenn eine Änderung der Bedingungen dies erfordert. Bei einer ausgeklügelteren Anwendung der vorliegende Erfindung wird die Ablehnungsquote überwacht, und der Wert der Wahrscheinlichkeit p wird in Abhängigkeit von den Änderungen der aufgetretenen Ablehnungsquote angepaßt. Bezugnehmend auf die Zeichnung in Fig. 3 kann es daher zum Beispiel wünschenswert sein, die Wahrscheinlichkeit anfangs gleich 1 zu setzen und diesen Wert so lange beizubehalten, bis die Ablehnungsquote des Systems einen ersten, vorgegebenen Wert überschreitet. Unter besonderer Berücksichtigung der Fig. 3 könnte man für diesen vorgegebenen Wert zum Beispiel eine Ablehnungsquote von 0,012 wählen. Wenn dann die Ablehnungsquote weiter steigt, würde der Wert für die Wahrscheinlichkeit p so lange erniedrigt werden, bis die Ablehnungsquote einen zweiten, vorgegebenen Wert erreicht (z. B. 0,014 in unserem Beispiel aus Fig. 3), an dem die Wahrscheinlichkeit dann auf 0 gesetzt werden würde. Der für die Wahrscheinlichkeit p gesetzte Wert kann auch von anderen Variablen oder Faktoren abhängig gemacht werden, zum Beispiel von der Ablehnungsquote des zweiten Lesesystems.

Claims (10)

1. Dokumenten-Lesegerät mit
einem ersten Zeichenlesesystem zum Lesen von Zeichen auf einem Schriftstück;
einem zweiten Zeichenlesesystem, das ebenfalls zum Lesen der Zeichen auf den Schriftstücken dient;
einer ersten Zeichenerkennungslogik zur Erkennung von durch das erste System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die erste Logik in regelmäßigen Abständen einen ersten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
einer zweiten Zeichenerkennungslogik zur Erkennung von durch das zweite System gelesenen Zeichen und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die zweite Logik in regelmäßigen Abständen einen zweiten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
gekennzeichnet durch
eine Entscheidungslogik zur Auswahl einer der folgenden Möglichkeiten: ein Zeichen, das durch die erste Logik erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das durch die zweite Logik als das Zeichen erkannt wurde, das einem Zeichen auf dem Schriftstück am genauesten entspricht; und wobei die Entscheidungslogik eine Vorrichtung enthält, mit der im wesentlichen zufällig die von der zweiten Logik erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt werden, wenn die erste Logik das Ablehnungszeichen erzeugt, wobei p eine Wahrscheinlichkeit mit einem Wertebereich zwischen 0 und 1 ist; und
eine Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit p.
2. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit eine Vorrichtung zur manuellen Eingabe eines Werts für die Wahrscheinlichkeit p enthält.
3. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit eine Regeleinheit enthält, die auf eine Veränderung der Ablehnungsquote der ersten oder zweiten Erkennungslogik reagiert, um den Wert der Wahrscheinlichkeit p zu ändern.
4. Dokumenten-Lesegerät nach Anspruch 1, wobei die Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit eine Regeleinheit enthält, die während des Lesens der Zeichen in den Schriftstücken die Quote überwacht, mit der Ablehnungszeichen vom ersten System erzeugt werden, und die die Wahrscheinlichkeit p in Abhängigkeit von einem vorgegebenen Anstieg der Quote erniedrigt.
5. Dokumenten-Lesegerät nach Anspruch 4, wobei die Regeleinheit die Wahrscheinlichkeit p anfangs auf eins setzt und die Wahrscheinlichkeit p erst dann erniedrigt, wenn die Quote einen ersten, vorgegebenen Wert überschritten hat.
6. Dokumenten-Lesegerät nach Anspruch 5, wobei die Regeleinheit die Wahrscheinlichkeit p auf Null setzt, wenn die Quote einen zweiten, vorgegebenen Wert überschritten hat.
7. Dokumenten-Lesegerät, bestehend aus
einer Dokumenten-Transportvorrichtung, die eine Vielzahl von Schriftstücken, die mit Magnetschrift kodiert sind, von einem Dokumenten-Magazin zu einem Dokumenten-Ablagefach befördert,
einem ersten Zeichenlesesystem, das einen Wechselstrom- Magnetschrift-Lesekopf enthält, der neben der Transportvorrichtung angebracht ist und die Magnetschrift auf den Schriftstücken liest, die durch die Transportvorrichtung befördert werden,
einem zweiten Zeichenlesesystem, das einen Gleichstrom- Magnetschrift-Lesekopf enthält, der neben der Transportvorrichtung zwischen dem ersten System und dem Ablagefach angebracht ist und ebenfalls die Magnetschrift auf den Schriftstücken liest,
einer ersten Zeichenerkennungslogik zur Erkennung von durch das erste System gelesener Magnetschrift und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die erste Logik in regelmäßigen Abständen einen ersten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
einer zweiten Zeichenerkennungslogik zur Erkennung von durch das zweite System gelesener Magnetschrift und zur Erzeugung eines Ablehnungszeichens, wenn ein Zeichen nicht erkannt werden kann, wobei die zweite Logik in regelmäßigen Abständen einen zweiten, nicht erkannten Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt;
gekennzeichnet durch
eine Entscheidungslogik zur Auswahl einer der folgenden Möglichkeiten: ein Zeichen, das durch die erste Logik erkannt wurde, ein Ablehnungszeichen oder ein Zeichen, das durch die zweite Logik als das Zeichen erkannt wurde, das einem Zeichen auf dem Schriftstück am genauesten entspricht; und wobei die Entscheidungslogik eine Vorrichtung enthält, mit der im wesentlichen zufällig die von der zweiten Logik erzeugten Zeichen mit einer Wahrscheinlichkeit p ausgewählt werden, wenn die erste Logik das Ablehnungszeichen erzeugt, wobei p eine Wahrscheinlichkeit mit einem Wertebereich zwischen 0 und 1 ist; und
eine Vorrichtung zur Festsetzung des Werts der Wahrscheinlichkeit p.
8. Dokumenten-Lesegerät nach Anspruch 7, wobei die Vorrichtung zur Festsetzung des Wertes für die Wahrscheinlichkeit eine Regeleinheit enthält, die auf eine Veränderung der Ablehnungsquote der ersten oder zweiten Erkennungslogik reagiert, um den Wert der Wahrscheinlichkeit p zu ändern.
9. Verfahren zum Lesen von Zeichen auf Schriftstücken, in dem die Zeichen von einem ersten und zweiten Lesesystem gelesen werden, zu denen jeweils ein erstes und zweites Erkennungssystem gehört, die entweder ein Zeichen erkennen oder ein Ablehnungszeichen erzeugen, wenn ein Zeichen nicht erkannt werden kann, und in denen in regelmäßigen Abständen ein nicht erkannter Fehler durch irrtümliches Erkennen eines Zeichens anstelle der Erzeugung eines Ablehnungszeichens erzeugt wird, dadurch gekennzeichnet, daß sie das Zeichen, das dem Zeichen auf dem Schriftstück am genauesten entspricht, im wesentlichen zufällig auswählen, wobei dieses Zeichen durch das zweite Erkennungssystem erzeugt wird, wenn das erste Erkennungssystem ein Ablehnungszeichen erzeugt.
10. Anwendung nach Anspruch 9 mit einer Stufe zur Veränderung der Wahrscheinlichkeit dafür, daß als Reaktion auf eine Veränderung der Ablehnungsquote des ersten Erkennungssystem zufällig das vom zweiten Erkennungssystem erzeugte Zeichen gewählt wird.
DE3887665T 1987-12-18 1988-11-22 Verfahren und Gerät für Zeichenerkennungssysteme. Expired - Fee Related DE3887665T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/134,729 US4876735A (en) 1987-12-18 1987-12-18 Method and apparatus for character recognition systems

Publications (2)

Publication Number Publication Date
DE3887665D1 DE3887665D1 (de) 1994-03-17
DE3887665T2 true DE3887665T2 (de) 1994-08-18

Family

ID=22464719

Family Applications (1)

Application Number Title Priority Date Filing Date
DE3887665T Expired - Fee Related DE3887665T2 (de) 1987-12-18 1988-11-22 Verfahren und Gerät für Zeichenerkennungssysteme.

Country Status (4)

Country Link
US (1) US4876735A (de)
EP (1) EP0320663B1 (de)
JP (1) JPH07120383B2 (de)
DE (1) DE3887665T2 (de)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265174A (en) * 1989-03-03 1993-11-23 Canon Kabushiki Kaisha Pattern recognition apparatus
US5257323A (en) * 1991-05-29 1993-10-26 Canon Kabushiki Kaisha Selection agent for a symbol determination system with multiple character recognition processors
US6179484B1 (en) 1991-07-18 2001-01-30 International Business Machines Corp. Two-pass document image processing method and system
US5875261A (en) * 1991-12-20 1999-02-23 International Business Machines Corporation Method of and apparatus for optical character recognition based on geometric and color attribute hypothesis testing
TW222337B (de) * 1992-09-02 1994-04-11 Motorola Inc
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
US6181837B1 (en) 1994-11-18 2001-01-30 The Chase Manhattan Bank, N.A. Electronic check image storage and retrieval system
US6091952A (en) * 1996-08-30 2000-07-18 Nortel Networks Corporation Distributed subscriber data management in wireless networks from a central perspective
US5881172A (en) * 1996-12-09 1999-03-09 Mitek Systems, Inc. Hierarchical character recognition system
US6243504B1 (en) * 1998-08-19 2001-06-05 International Business Machines Corporation Integrated magnetic ink character recognition system and method therefor
DE10034629A1 (de) * 1999-08-11 2001-03-22 Ibm Verfahren und System zum Verzahnen von OCR und ABL zur automatischen Postsortierung
US6654487B1 (en) * 2000-03-03 2003-11-25 Charles H. Downs, Jr. Character recognition, including method and system for processing checks with invalidated MICR lines
US7120302B1 (en) 2000-07-31 2006-10-10 Raf Technology, Inc. Method for improving the accuracy of character recognition processes
US7295694B2 (en) * 2002-02-22 2007-11-13 International Business Machines Corporation MICR-based optical character recognition system and method
US20050144189A1 (en) * 2002-07-19 2005-06-30 Keay Edwards Electronic item management and archival system and method of operating the same
US7379978B2 (en) * 2002-07-19 2008-05-27 Fiserv Incorporated Electronic item management and archival system and method of operating the same
US20050094861A1 (en) * 2003-10-31 2005-05-05 International Business Machines Corporation Positional synchronization in a multivoting character recognition environment
US7480403B2 (en) 2004-11-16 2009-01-20 International Business Machines Corporation Apparatus, system, and method for fraud detection using multiple scan technologies
US20070133859A1 (en) * 2005-10-28 2007-06-14 Imaging Business Machines, Llc Methods and systems for reading magnetic ink character recognition information
US8023718B1 (en) * 2007-01-16 2011-09-20 Burroughs Payment Systems, Inc. Method and system for linking front and rear images in a document reader/imager
US8023717B1 (en) * 2007-01-16 2011-09-20 Burroughs Payment Systems, Inc. Method and system for processing backwards documents in a document reader/imager
US8055104B2 (en) 2007-03-02 2011-11-08 Adi, Llc Process performance evaluation for Enterprise data systems
WO2010032335A1 (ja) * 2008-09-22 2010-03-25 グローリー株式会社 紙葉類管理装置、紙葉類管理方法及び紙葉類管理プログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US31692A (en) * 1861-03-12 Improvement in mowing-machines
US3641495A (en) * 1966-08-31 1972-02-08 Nippon Electric Co Character recognition system having a rejected character recognition capability
US3496543A (en) * 1967-01-27 1970-02-17 Singer General Precision On-line read/copy data processing system accepting printed and graphic material
USRE31692E (en) 1972-05-02 1984-10-02 Optical Recognition Systems, Inc. Combined magnetic optical character reader
US3764978A (en) * 1972-05-02 1973-10-09 Optical Recognition Systems Combined magnetic optical character reader
US4032887A (en) * 1973-06-28 1977-06-28 International Business Machines Corporation Pattern-recognition systems having selectively alterable reject/substitution characteristics
US3876981A (en) * 1973-08-28 1975-04-08 Optical Recognition Systems Method and system for combining magnetically and optically derived signals to recognize characters
US3938089A (en) * 1974-02-25 1976-02-10 Burroughs Corporation Double read system for character recognition systems

Also Published As

Publication number Publication date
DE3887665D1 (de) 1994-03-17
EP0320663B1 (de) 1994-02-02
EP0320663A2 (de) 1989-06-21
JPH07120383B2 (ja) 1995-12-20
US4876735A (en) 1989-10-24
EP0320663A3 (de) 1991-10-23
JPH01171081A (ja) 1989-07-06

Similar Documents

Publication Publication Date Title
DE3887665T2 (de) Verfahren und Gerät für Zeichenerkennungssysteme.
DE2541204C3 (de) Einrichtung zur Fehlerkorrektur
DE3851867T2 (de) Zeichenerkennungsgerät.
DE69022784T2 (de) Verfahren und Systeme zur Unterschriftprüfung mit Optimierung statischer Parameter.
DE2523112C2 (de) Vorrichtung zum Bearbeitung von Daten tragenden Schriftstücken
DE3322663A1 (de) Verfahren zur blatterkennung
DE3486241T2 (de) Gerät und Verfahren zur Zeichenabstandsbestimmung für optische Zeichenerkennungssysteme.
EP0067244A2 (de) Verfahren zum automatischen Erkennen von Weissblöcken sowie Text-, Graphik- und/oder Graubildbereichen auf Druckvorlagen
EP0762944B1 (de) Verfahren zur steuerung der eingabestation für eine briefsortieranlage
DE69926280T2 (de) Verfahren zur Erkennung von Adressen und Briefverarbeitungsvorrichtung
DE3322443A1 (de) Mustererkennungsvorrichtung
DE69029417T2 (de) Erkennungssystem für Zeichen mit magnetischer Tinte
DE2435889A1 (de) Verfahren und einrichtung zum unterscheiden von zeichengruppen
WO2000010113A1 (de) Verfahren und vorrichtung zum bearbeiten von an den absender zurückzuschickenden sendungen
EP2097182B1 (de) Verfahren und vorrichtung zur steuerung des transports von gegenständen sowie anordnung zum transport mehrerer gegenstände
DE4407998C2 (de) Verfahren und Vorrichtung zur Erkennung eines Musters auf einem Beleg
DE19820353C2 (de) Verfahren und Vorrichtung zur Erkennung eines Musters auf einer Vorlage
WO2002023492A2 (de) Verfahren zur klassifizierung von dokumenten
WO2003079273A2 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
EP0707279B1 (de) Mustererkennungsverfahren mit Kalibrierung der Lernfähigkeit
EP0618544B1 (de) Verfahren und Vorrichtung zum automatischen Erfassen und Erkennen von Schriften
DE2026033B2 (de) Rasterverfahren zur Klassifizierung von Schriftzeichen
EP4258160A1 (de) Lesen von optischen codes
DE4437203A1 (de) Verfahren zur Ermittlung von Morsezeichen
DE3226385A1 (de) Verfahren zum lesen von strichcodes

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee