DE102011051934A1 - Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera - Google Patents
Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera Download PDFInfo
- Publication number
- DE102011051934A1 DE102011051934A1 DE102011051934A DE102011051934A DE102011051934A1 DE 102011051934 A1 DE102011051934 A1 DE 102011051934A1 DE 102011051934 A DE102011051934 A DE 102011051934A DE 102011051934 A DE102011051934 A DE 102011051934A DE 102011051934 A1 DE102011051934 A1 DE 102011051934A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- value
- document area
- value document
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 239000011159 matrix material Substances 0.000 title claims abstract description 12
- 238000001514 detection method Methods 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 abstract description 3
- 238000005286 illumination Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/147—Determination of region of interest
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18067—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur OCR-Erfassung von Wertdokumenten in einem Geldautomaten, bei dem ein Bild des Wertdokuments mittels einer digitalen Video- oder Matrixkamera erfasst wird. Mittels einer Hough-Transformation werden Randlinien des Wertdokuments errechnet und daraus ein Drehwinkel errechnet, sodass die Ränder des Wertdokuments an den Bildrändern ausgerichtet sind. Zur Kompensation eines inhomogenen Bildhintergrunds wird das erfasste Bild homogenisiert. Abschließend erfolgt eine OCR-Erfassung von alphanumerischer Information auf dem Wertdokument.
Description
- Gebiet der Erfindung
- Die vorliegende Erfindung betrifft allgemein die Erfassung von Wertdokumenten, wie beispielsweise Schecks oder Banknoten, in Selbstbedienungsautomaten, insbesondere Geld- oder Bankautomaten, und betrifft insbesondere die Erfassung von digitalen Bildern von Wertdokumenten mittels einer Video- oder Matrixkamera und deren Vorverarbeitung in Selbstbedienungsautomaten, insbesondere Geldautomaten.
- Hintergrund der Erfindung
- Die Erfassung von Wertdokumenten in Geldautomaten erfolgt üblicherweise mittels Zeilenkameras, die in der Art eines Flachbettscanners Wertdokumente zeilenweise einscannen. Bei derartigen Erfassungsmodulen ist eine exakte Ausrichtung der Wertdokumente relativ zur Zeilenrichtung des Bildsensors notwendig. Diese lässt sich deshalb leicht mittels mechanischer Führungs- und Zentrierungshilfen realisieren, weil diese außerhalb des vergleichsweise schmalen Erfassungsbereichs zum Erfassen einer Scanzeile angeordnet sein können.
- Derartige Bildsensoren sind jedoch vergleichsweise kostspielig, weshalb eine Bilderfassung mittels üblicher Video- oder Matrixkameras wünschenswert wäre, weil diese kostengünstig erhältlich sind.
-
DE 100 10 621 B4 offenbart ein Verfahren zum schnellen Lokalisieren von Adressblöcken in Graustufenbildern, dem die Erkenntnis zu Grunde liegt, dass Text allgemein sowohl horizontal dominante, als auch vertikal dominante Punkte in ungefähr gleichen Werten enthält. Bei dem Verfahren werden Textkernel gekennzeichnet, die eine Gruppe von Ausgangspunkten in festgelegter gegenseitiger Nähe umfassen, wobei es für jeden Ausgangspunkt mindestens einen horizontal dominanten Punkt und mindestens einen vertikal dominanten Punkt gibt. Anhand dieser Textkernel wird dann eine OCR-Erfassung vorgenommen. Bei diesem Verfahren wird das Graustufenbild mittels einer Zeilenkamera erfasst. -
DE 195 32 342 C1 offenbart ein Bildaufnahmesystem zur automatischen Adresserkennung auf Großbriefen und Paketen, mit einer hochauflösenden Grauwertkamera und einer niedrigauflösenden Farbkamera. Beide Kameras sind auf einen Lichtspalt ausgerichtet, an dem das zu bearbeitende Objekt vorbeigeführt wird. Die Farbkamera wird in einem speziellen Modus betrieben, der es erlaubt, mit nur einem gemeinsamen Lichtspalt auszukommen, wobei für beide Kameras eine ausreichende Lichtintensität bereit steht. Das Signal der Vielzahl von Elementen einer Farbbildzeile wird zeitlich integriert und nach der Belichtung elektronisch gemittelt. Dieser Aufbau ist jedoch vergleichsweise aufwendig. -
DE 10 2004 020 034 A1 offenbart einen Scanner zum digitalen Einlesen einer Zeitung, die auf einem Vorlagentische abgelegt ist. Ein Kameramodul weist zwei auf den Vorlagentisch gerichtete Sensoren auf, auf die jeweils über eine Optik ein Bereich des Vorlagentisches abgebildet wird. Ferner ist ein Beleuchtungsmodul vorgesehen, das mindestens zwei Beleuchtungseinheiten aufweist, die parallel zu einer Verbindungslinie der Sensoren auf gegenüberliegenden Seiten von dem Kameramodul angeordnet und auf den Vorlagetisch gerichtet sind. Damit soll eine homogene Ausleuchtung der Zeitungsvorlage realisiert werden. Um die Beleuchtung weiter zu homogenisieren, sind Kamera- und Beleuchtungsmodul in einer Neben-Abtastrichtung parallel zu der Oberfläche des Vorlagentisches verfahrbar, wobei die auf den Sensoren abgebildeten Bereiche mindestens einen vorbestimmten Bereich auf dem Vorlagentisch überstreichen. Aufgrund der Verwendung eines Vorlagentisches mit wohldefinierten Rändern, sowie einer Anlagekante ist eine exakte Ausrichtung der Vorlage möglich. - Zusammenfassung der Erfindung
- Aufgabe der vorliegenden Erfindung ist es, ein Verfahren und eine Vorrichtung zur OCR-Erfassung von Wertdokumenten in einem Selbstbedienungsautomaten, insbesondere einem Geld- oder Bankautomaten, bereitzustellen, womit sich Wertdokumente, wie beispielsweise Schecks oder auch Banknoten, mittels einer Video- oder Matrixkamera in einfacher und kostengünstiger Weise zuverlässig erfassen lassen.
- Diese Aufgabe wird gemäß der vorliegenden Erfindung durch ein Verfahren mit den Merkmalen nach Anspruch 1 sowie eine Vorrichtung mit den Merkmalen nach Anspruch 8 gelöst. Weitere vorteilhafte Ausführungsformen sind Gegenstand der rückbezogenen Unteransprüche.
- Gemäß der vorliegenden Erfindung lässt sich insbesondere kompensieren, dass der Hintergrund eines mittels einer Video- oder Matrixkamera aufgenommenen Bildes eines Wertdokuments von der Ausleuchtung abhängig und daher inhomogen ist, dass das Objekt nicht immer gerade ausgerichtet unter der Kamera liegt und sich je nach Kameraposition auch perspektivische und/oder radiale Verzerrungen ergeben, und dass die Auflösung des erfassten Bildes zum Rand hin abnimmt.
- Figurenübersicht
- Nachfolgend wird die Erfindung in beispielhafter Weise und unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, woraus sich weitere Merkmale, Vorteile und zu lösende Aufgaben ergeben werden. Es zeigen:
-
1 in einer schematischen Darstellung die Erfassung eines auf einer Ablageplatte abgelegten Wertdokuments mittels einer Video- oder Matrixkamera in einem Wertdokument-Erfassungsmodul gemäß der vorliegenden Erfindung; -
2 in einem schematischen Blockdiagramm ein Bildauswertungsmodul eines erfindungsgemäßen Wertdokument-Erfassungsmoduls; -
3 in einem Flussdiagramm die grundlegenden Schritte eines erfindungsgemäßen Verfahrens zur OCR-Erfassung von Wertdokumenten in einem Geldautomaten; -
4 schematisch in einem Flussdiagramm die Schritte einer automatischen Feinrotation zum automatischen Ausrichten und Zuschneiden eines rechteckigen Ausschnitts als Wertdokumentbereich in dem erfassten Bild; -
5 in einem schematischen Flussdiagramm die wichtigsten Schritte einer Homogenisierung bei einem erfindungsgemäßen Verfahren in Vorbereitung einer Bildbinarisierung; und -
6a –6l Ergebnisse diverser Verfahrensschritte nach der vorliegenden Erfindung anhand eines Beispiels beim Erfassen eines Schecks im sogenannten Bolletini-Scheckformat. - Ausführliche Beschreibung eines bevorzugten Ausführungsbeispiels
- Gemäß der
1 erfasst die oberhalb oder unterhalb der Ablageplatte3 angeordnete Matrix- bzw. Videokamera2 das auf der Ablageplatte3 abgelegte Wertdokument4 , wobei das Gesichtsfeld5 der Kamera2 sich bis zu den Rändern derselben erstreckt und größer ist als übliche zu erfassende Wertdokumente4 . Diese sind üblicherweise nicht exakt zu den Rändern der Ablageplatte3 ausgerichtet, sondern vielmehr verkippt, dem Rechnung getragen werden muss. Der Hintergrund eines solchen mit der Kamera2 erfassten Bilds ist von der Ausleuchtung abhängig und inhomogen. Je nach Kameraposition treten ausserdem perspektivische und radiale Verzerrungen im erfassten Bild auf. Außerdem nimmt die Auflösung des Bildes zum Rand hin ab. - Die Kamera
2 mit ihrem Bildsensor13 entspricht einem Bildsignalgenerator11 des in der2 gezeigten Bildauswertungsmodul10 . Der Bildsensor3 erfasst ein digitales Bild des Wertdokuments mit einer vorbestimmten Auflösung. Die damit erfassten digitalen Bilder werden zunächst in dem Speicher15 zwischengespeichert und anschließend in einem Bildverarbeitungsabschnitt16 weiterverarbeitet. Der Datenverarbeitungsabschnitt12 des Bildauswertungsmoduls10 umfasst weiterhin eine zentrale Steuereinrichtung (CPU)14 , die mit einem Programmcodespeicher18 , in welchem Programmcode-Anweisungen zum Ausführen des erfindungsgemäßen Verfahrens abgespeichert sind, einem Bedienabschnitt19 , beispielsweise zum Voreinstellen des Bildauswertungsmoduls10 , dem Bildverarbeitungsabschnitt16 , dem Speicher15 und einer Bildausgabeeinrichtung17 verbunden ist. - Bei einem Verfahren zur OCR-Erfassung von Wertdokumenten wird gemäß der
3 zunächst in dem Schritt S301 ein digitales Bild von dem Wertdokument erfasst, das bei Bedarf in dem Schritt S302 anhand der physikalischen Eigenschaften des Kameraobjektivs (Brennweite, Verzerrung etc.) radial entzerrt wird. Ausserdem kann auch eine perspektivische Entzerrung des Bildes anhand der Kameraposition gegenüber den Kanten der Ablageplatte erfolgen, was insbesondere von dem Abstand der Kamera zu der Ablageplatte und der verwendeten Brennweite abhängig ist, jedoch nicht zwingend erforderlich ist. - Anschließend erfolgt im Schritt S303 eine Identifikation und Lagebestimmung des Wertdokuments zum Identifizieren eines Wertdokumentbereichs, also von Pixeln, die dem auf der Ablageplatte abgelegten Wertdokument entsprechen. In dem Schritt S304 erfolgt dann eine Feinrotation, sodass die Ränder des dann gedrehten Wertdokumentbereichs bezüglich der Bildränder ausgerichtet sind, sich also im Wesentlichen parallel dazu erstrecken. Anschließend erfolgt in dem Schritt S305 ein Zuschneiden eines rechteckförmigen Bereichs aus dem erfassten Bild, welcher dem Wertdokumentbereich entspricht, in welchem später die OCR-Erfassung ausgeführt werden soll.
- Anschließend erfolgt in dem Schritt S306 eine Homogenisierung des Bildhintergrunds und anschließend ein Abspeichern des Bildes für die spätere OCR-Analyse in dem Schritt S307. Die OCR-Analyse kann mittels üblicher OCR-Algorithmen ausgeführt werden, die hinreichend bekannt sind und auf die deshalb nicht weiter eingegangen zu werden braucht.
- Nachfolgend werden anhand der
4 zunächst die Schritte einer automatischen Feinrotation zur Ausrichtung des erfassten Wertdokumentbereichs erläutert. Um eine Feinrotation durchzuführen, muss das Wertdokument zuerst identifiziert und seine Lage bestimmt werden. Hierzu ist es von Vorteil, an einem verkleinerten Bild zu arbeiten, da dadurch eine höhere Verarbeitungsgeschwindigkeit erzielt werden kann. Ausserdem ist es von Vorteil, an einem verkleinerten Bild zu arbeiten, in welchem störende bzw. überflüssige Details, wie beispielsweise alphanumerische Zeichen, graphische Informationen, aber auch Staubfäden und störende Linien, entfernt sind. Denn zur Bestimmung der Ränder und Lage des Wertdokuments sind solche Detailinformationen nicht notwendig. Zum Entfernen solcher Details können geeignete Filter verwendet werden, beispielsweise auch der dem Schritt S402 zugrundegelegte Median-Filter, bei dem der Grauwert des aktuellen Pixels ersetzt wird durch den Median der Grauwerte der aktuellen Umgebung, wobei die Größe der Umgebung variabel vorgeben werden kann, beispielsweise über den Bedienabschnitt19 . - Der Wertdokumentbereich wird dann in dem Schritt S403 durch eine automatische Schwellenwertbildung identifiziert. Beispielsweise bestimmt der Bildverarbeitungsabschnitt, ob ein Pixelwert größer als ein vorbestimmter Schwellenwert ist oder nicht, um so ein Kantenbild zu binarisieren. Bei dem Schwellenwert kann es sich um einen festen Wert oder um eine Variable handeln, die beispielsweise mit einem variablen Schwellenwertverfahren erhalten wird. Selbstverständlich können zu diesem Zweck auch beliebige andere Algorithmen zur Kantenidentifizierung eingesetzt werden.
- Im nächsten Schritt S404 werden dann die Randpixel des Wertdokumentbereichs berechnet. Anschließend werden in dem Schritt S405 mittels einer Hough-Transformation die dominanten Linien in dem Bild detektiert. Bei dem aus dem
US-Patent 3,069,654 bekannten Hough-Verfahren wird zur Erkennung von geometrischen Objekten ein Dualraum erschaffen, in den für jeden Punkt im Bild, der auf einer Kante liegt, alle möglichen Parameter der zu findenden geometrischen Figur im Dualraum eingetragen werden. Jeder Punkt im Dualraum entspricht damit einem geometrischen Objekt im Bildraum. Bei der Erkennung von Geraden mittels der Hough-Transformation muss man zuerst geeignete Parameter für eine Gerade finden, beispielsweise Steigung und y-Achsenabschnitt oder bevorzugt eine Charakterisierung einer Geraden durch ihre Hessesche Normalform. Hierbei kommt zugute, dass in dem Schritt S404 zunächst die Kanten in dem Ausgangsbild bestimmt wurden. Bei der Hough-Transformation wird für jeden Pixel bestimmt, welche Linie (beispielsweise bestimmt durch Winkel und Abstand zur linken, oberen Bildecke) durch ihn verläuft. Ist der betrachtete Pixel ein Randpixel, so wird die Bewertung der Linie erhöht. Die am höchsten bewerteten Linien entsprechen dann den dominanten Linien in dem Bildbereich. - Anhand dieser dominanten Linien kann dann in dem Schritt S406 leicht der Winkel bestimmt werden, um den der Wertdokumentbereich gedreht werden muss, um dessen Schieflage zu korrigieren, diesen als parallel zu den Rändern des Gesichtsfeldes bzw. Bildrändern bzw. der Ablageplatte auszurichten. Anschließend wird das Bild des Wertdokumentbereichs dann in dem Schritt S407 um diesen bestimmten Drehwinkel gedreht. Abschließend erfolgt in dem Schritt S408 ein Ausschneiden eines rechteckigen Bildbereichs, der den Wertdokumentbereich enthält. Aufgrund der zuvor erfolgten Drehung sind die alphanumerischen Zeichen in diesem Bereich bei zugrundegelegtem rechteckigem Vorlagenformat fluchtend zu den Bildrändern ausgerichtet, jedenfalls wenn zuvor eine entsprechende Bildentzerrung ausgeführt wird. Gerade bei kleineren Bildformaten, wie diese bei üblichen Wertdokumenten vorliegen, sind jedoch solche Bildverzerrungen nicht so störend, als dass diese zwingend kompensiert werden müssten. Vielmehr kann erfindungsgemäß eine OCR-Erfassung von alphanumerischen Zeichen auch dann zuverlässig ausgeführt werden, wenn die alphanumerischen Zeichen nach dem Schritt S407 nicht exakt fluchtend zu den Bildrändern ausgerichtet sind.
- Die
6a –6l fassen die Ergebnisse der vorgenannten Verfahrensschritte anhand des praktischen Beispiels der Erfassung eines Schecks im sogenannten Bolletini-Scheckformat zusammen. Gemäß der6a enthält das von der Ablageplatte erfasste Bild des Schecks den schwarzen Randbereich60 ohne jegliche Information und den eigentlichen Wertdokumentbereich61 , der graphische Bildinformation62 , Buchstaben63 , Ziffern64 und einen Barcode65 enthält. Erkennbar sind eine inhomogen Ausleuchtung des Bildbereichs und eine Reflektion etwa in der Bildmitte, die von Reflektionen von der Oberfläche der Ablageplatte herrühren. - Zur schnellen Identifikation und Lagebestimmung des Wertdokuments wird bevorzugt an einem verkleinerten Bild gearbeitet, auf dem die Details, wie Schrift, Staubfäden und Linien auf dem Scheck selbst, durch Anwendung eines Median-Filters entfernt wurden, wie in der
6b gezeigt. Erkennbar sind verschwommene Details66 und weiterhin signifikante Bildanteile in den Bereichen67 , die von dem Barcode und dem graphischen Symbol auf dem Scheck (vgl.6a ) herrühren. - Der Scheck wird dann durch eine automatische Schwellenwertbildung identifiziert (vgl.
6c ) und durch Anlegen eines Kantenfilters werden die Ränder dominanter Bereiche bestimmt, wie in der6d gezeigt, nämlich die Ränder68 des Wertdokuments sowie die Ränder69 von weiterhin markanten Details, insbesondere herrührend von dem vorgenannten Barcode. Anschließend werden die Ränder mittels einer Hough-Transformation berechnet. Diese sind in der6e mit den Linien70 angedeutet. Erkennbar verlaufen diese nicht parallel zu den Bildrändern. Allerdings lässt sich der Drehwinkel hierzu leicht aus dem Kantenbild gemäß der6e errechnen. - Mit dem so bestimmten Drehwinkel wird das erfasste Bild, wie in der
6a gezeigt, also mit der vollen Bildauflösung, gedreht und anschließend die Bereiche außerhalb der errechneten Randlinien (vgl.6e ) abgeschnitten, was in dem in der6f gezeigten rechteckförmigen Bildbereich resultiert, der den eigentlichen Wertdokumentbereich61 enthält, zusätzlich jedoch aufgrund unvermeidlicher Bildverzerrungen, beispielsweise herrührend von dem Kameraobjektiv, auch Randbereiche60 . Es hat sich jedoch gezeigt, dass eine OCR-Erfassung auch an so aufbereiteten Bildvorlagen zuverlässig ausgeführt werden kann. - Eine einfache Bildbinarisierung aufgrund der Bildinformation gemäß der
6f würde jedoch zu dem in der6g gezeigten Ergebnis führen, worin beispielsweise die Textinformation aufgrund von Reflektionen in der Bildmitte im Bereich der Kamera fehlen, jedenfalls nur noch undeutlich erkennbar sind. - Zur Homogenisierung wird eine Helligkeitskarte des Bildhintergrunds erstellt und diese dann im Prinzip von dem Originalbild gemäß der
6f subtrahiert. Zur weiteren Prozessbeschleunigung kann hierzu jedoch erneut das Bild verkleinert werden, beispielsweise auf 1/8 der Originalgröße. Das Ergebnis ist in der6h gezeigt. Dann wird ein Median-Filter angewendet, der die Details aus dem Bild entfernt. Das so resultierende Hintergrundbild nach der Median-Filterung ist in der6i . Bei einem Median-Filter wird für jeden Pixel einer Liste der Wert aller Nachbarpixel erstellt, diese sortiert und der Originalpixel durch den in der Mitte stehenden Wert in der Liste ersetzt. Die Größe des Filters regelt dabei die Größe dieser Nachbarschaft. Der Filter hat die Eigenschaft, dass grobe Strukturen erhalten bleiben, wobei kleine Strukturen geglättet werden. Das erzeugte Bild enthält hier relativ pixelgenau immer noch die grobe Helligkeitsverteilung auf dem Scheckhintergrund. Dieser Bildhintergrund wird von dem Originalbild gemäß der6f subtrahiert, was in dem Bild gemäß der6j resultiert. Dieses Bild wird invertiert, was in dem Bild gemäß der6k resultiert. Erkennbar ist, dass in diesem Bild beispielsweise die Textinformation in der Bildmitte deutlich besser lesbar und auswertbar ist. Dieses Bild wird dann binarisiert, also in Helligkeitswerte 1 oder 0 übersetzt. Das resultierende Ausgangsbild für die OCR-Erfassung ist in der6l gezeigt. Der Text kann segmentiert werden und für die anschließende OCR-Software verfügbar gemacht werden. - Zusammengefasst kann mit dem erfindungsgemäßen Verfahren eine OCR-Erfassung mittels einer Matrix- oder Videokamera zuverlässig ausgeführt werden. Es sei ausdrücklich darauf hingewiesen, dass die Erfindung bei beliebigen Selbstbedienungsautomaten eingesetzt werden kann, insbesondere bei Bank- oder Geldautomaten mit der Funktion einer automatengestützten Einreichung von Wertdokumenten, wie beispielsweise Schecks.
- Bezugszeichenliste
-
- 1
- Wertdokument-Erfassungsmodul
- 2
- Videokamera/Matrixkamera
- 3
- Ablageplatte
- 4
- Wertdokument
- 5
- Gesichtsfeld der Kamera
2 - 6
- Wertdokumentbereich
- 10
- Bildauswertungsmodul
- 11
- Bildsignalgenerator
- 12
- Datenverarbeitungsabschnitt
- 13
- Bildsensor
- 14
- CPU
- 15
- Speicher
- 16
- Bildverarbeitungsabschnitt
- 17
- Bildausgabeeinrichtung
- 18
- Programmcodespeicher
- 19
- Bedienabschnitt
- 60
- Randbereich
- 61
- Wertdokumentbereich
- 62
- graphische Information
- 63
- Buchstaben
- 64
- Ziffern
- 65
- Barcode
- 66
- verschwommene Details
- 67
- weitere markante Details
- 68
- Rand von Wertdokument
- 69
- Rand von weiteren markanten Details
- 70
- berechnete Randlinien
- 71
- Bereich höherer Helligkeit
- ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Patentliteratur
-
- DE 10010621 B4 [0004]
- DE 19532342 C1 [0005]
- DE 102004020034 A1 [0006]
- US 3069654 [0024]
Claims (12)
- Verfahren zur OCR-Erfassung von Wertdokumenten in einem Selbstbedienungsautomaten, insbesondere einem Bank- oder Geldautomaten, mit den Schritten: a) Erfassen eines Bildes eines Wertdokuments (
4 ) mittels einer digitalen Video- oder Matrixkamera (2 ); b) Bestimmen der Lage eines dem Wertdokument entsprechenden Wertdokumentbereichs (6 ) und dessen Randpixel in dem Bild; c) Detektieren von geraden Randlinien des Wertdokumentbereichs (6 ) anhand der bestimmten Randpixel unter Verwendung einer Hough-Transformation; d) Bestimmen eines Drehwinkels, um welchen der Wertdokumentbereich (6 ) in dem Bild zur Ausrichtung an Rändern eines Erfassungsbereichs (5 ) der Kamera gedreht werden muss, und Drehen des Wertdokumentbereichs (6 ) um diesen Drehwinkel; e) Entfernen von kleineren Details durch Filtern des Wertdokumentbereichs; f) Binarisieren des Wertdokumentbereichs, um alphanumerische Zeicheninformationen zu segmentieren; und g) OCR-Erfassung der alphanumerischen Zeicheninformation. - Verfahren nach Anspruch 1, wobei in dem Schritt c) ein Kantenfilter verwendet wird, welcher ein binäres Kantenbild des Wertdokumentbereichs ausgibt (
6b ). - Verfahren nach Anspruch 2, wobei die Hough-Transformation anhand des binären Kantenbilds ausgeführt wird.
- Verfahren nach Anspruch 3, wobei bei der Hough-Transformation für jeden Pixel bestimmt wird, welche Linie durch diesen verläuft und die Bewertung der Linie erhöht wird, wenn der Pixel ein Randpixel ist, wobei die geraden Linien den am höchsten bewerteten Linien entsprechen.
- Verfahren nach einem der vorhergehenden Ansprüche, wobei der Schritt e) ausserdem umfasst: Erstellen einer Helligkeitskarte eines Hintergrunds des erfassten Bildes; und Subtrahieren der Helligkeitskarte von dem erfassten Bild.
- Verfahren nach Anspruch 5, wobei der Schritt e) weiterhin umfasst: Verkleinern des erfassten Bildes; und Anwenden eines Median-Filters, um die kleineren Details zu entfernen; um die Helligkeitskarte mit einer gröberen Auflösung zu erhalten.
- Vorrichtung zur OCR-Erfassung von Wertdokumenten in einem Selbstbedienungsautomaten, insbesondere einem Bank- oder Geldautomaten, insbesondere ausgebildet als Wertdokument-Erfassungsmodul, umfassend: eine digitale Video- oder Matrixkamera (
2 ), um ein Bild eines Wertdokuments (4 ) zu erfassen; und einen Bildverarbeitungsabschnitt, welcher ausgelegt ist, um eine Lage eines dem Wertdokument entsprechenden Wertdokumentbereichs (6 ) und dessen Randpixel in dem erfassten Bild zu bestimmen, gerade Randlinien des Wertdokumentbereichs (6 ) anhand der bestimmten Randpixel unter Verwendung einer Hough-Transformation zu detektieren, einen Drehwinkel zu bestimmen, um welchen der Wertdokumentbereich (6 ) in dem Bild zur Ausrichtung an Rändern eines Erfassungsbereichs (5 ) der Kamera gedreht werden muss, und um den Wertdokumentbereich (6 ) um diesen Drehwinkel zu drehen, kleinere Details durch Filtern des Wertdokumentbereichs zu entfernen, und den Wertdokumentbereich zu binarisieren, um alphanumerische Zeicheninformationen in dem Wertdokumentbereich durch OCR-Erfassung zu erfassen. - Vorrichtung nach Anspruch 7, wobei der Bildverarbeitungsabschnitt weiterhin ausgelegt ist, um einen Kantenfilter anzuwenden, welcher ein binäres Kantenbild des Wertdokumentbereichs ausgibt (
6d ). - Vorrichtung nach Anspruch 8, wobei die Hough-Transformation anhand des binären Kantenbilds ausgeführt wird.
- Vorrichtung nach Anspruch 9, wobei bei der Hough-Transformation für jeden Pixel bestimmt wird, welche Linie durch diesen verläuft, und die Bewertung der Linie erhöht wird, wenn der Pixel ein Randpixel ist, wobei die geraden Linien den am höchsten bewerteten Linien entsprechen
- Vorrichtung nach einem der Ansprüche 7 bis 10, wobei der Bildverarbeitungsabschnitt ferner ausgelegt ist, um eine Helligkeitskarte eines Hintergrunds des erfassten Bildes zu erstellen und diese von dem erfassten Bild zu subtrahieren.
- Vorrichtung nach Anspruch 11, wobei der Bildverarbeitungsabschnitt weiterhin ausgelegt ist, um das erfasste Bild zu verkleinern und einen Median-Filter anzuwenden, um kleinere Details zu entfernen, um die Helligkeitskarte mit einer gröberen Auflösung zu erhalten.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011051934A DE102011051934A1 (de) | 2011-07-19 | 2011-07-19 | Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera |
PCT/EP2012/063976 WO2013011013A2 (de) | 2011-07-19 | 2012-07-17 | Verfahren und vorrichtung zur ocr-erfassung von wertdokumenten mittels einer matrixkamera |
US14/233,982 US9773187B2 (en) | 2011-07-19 | 2012-07-17 | Method and apparatus for OCR detection of valuable documents by means of a matrix camera |
US15/716,473 US10068150B2 (en) | 2011-07-19 | 2017-09-26 | Method and apparatus for OCR detection of valuable documents by means of a matrix camera |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102011051934A DE102011051934A1 (de) | 2011-07-19 | 2011-07-19 | Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102011051934A1 true DE102011051934A1 (de) | 2013-01-24 |
Family
ID=46634115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102011051934A Pending DE102011051934A1 (de) | 2011-07-19 | 2011-07-19 | Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera |
Country Status (3)
Country | Link |
---|---|
US (2) | US9773187B2 (de) |
DE (1) | DE102011051934A1 (de) |
WO (1) | WO2013011013A2 (de) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104252620A (zh) * | 2014-09-25 | 2014-12-31 | 同程网络科技股份有限公司 | 字符粘连的图形验证码识别方法 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103606221B (zh) * | 2013-12-04 | 2016-01-20 | 广州广电运通金融电子股份有限公司 | 清分机故障自动诊断方法以及装置 |
CN105989366A (zh) * | 2015-01-30 | 2016-10-05 | 深圳市思路飞扬信息技术有限责任公司 | 文本图像的倾斜角矫正、版面分析方法和助视装置、*** |
CN104680642B (zh) * | 2015-03-04 | 2017-08-25 | 广州广电运通金融电子股份有限公司 | 票据绵软识别方法和装置 |
US10417489B2 (en) * | 2015-11-19 | 2019-09-17 | Captricity, Inc. | Aligning grid lines of a table in an image of a filled-out paper form with grid lines of a reference table in an image of a template of the filled-out paper form |
DE202017106224U1 (de) * | 2016-10-13 | 2018-02-22 | Life Technologies Holdings Pte Limited | Systeme und Vorrichtung zum Optimieren eines Sichtbereichs |
CN107463931A (zh) * | 2017-07-06 | 2017-12-12 | 国家电网公司 | 一种基于arm平台的实时指针仪表识读方法及装置 |
CN107680246B (zh) * | 2017-10-24 | 2020-01-14 | 深圳怡化电脑股份有限公司 | 一种纸币图案中的曲线边界定位方法及设备 |
CN109858324B (zh) * | 2018-12-10 | 2022-10-21 | 西南石油大学 | 语言图文识别***及其实现方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3069654A (en) | 1960-03-25 | 1962-12-18 | Paul V C Hough | Method and means for recognizing complex patterns |
US5506918A (en) * | 1991-12-26 | 1996-04-09 | Kabushiki Kaisha Toshiba | Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions |
US6178270B1 (en) * | 1997-05-28 | 2001-01-23 | Xerox Corporation | Method and apparatus for selecting text and image data from video images |
US20020037097A1 (en) * | 2000-05-15 | 2002-03-28 | Hector Hoyos | Coupon recognition system |
DE102004020034A1 (de) | 2004-04-21 | 2005-11-17 | Infosys Gmbh | Scanner |
DE10010621B4 (de) | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Schnelles Lokalisieren von Adressblöcken in Graustufenbildern |
US20100195918A1 (en) * | 2007-09-07 | 2010-08-05 | Glory Ltd. | Paper sheet recognition apparatus and paper sheet recognition method |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4907156A (en) * | 1987-06-30 | 1990-03-06 | University Of Chicago | Method and system for enhancement and detection of abnormal anatomic regions in a digital image |
US6118886A (en) * | 1993-03-30 | 2000-09-12 | The United States Of America As Represented By The United States Department Of Energy | Automatic target recognition apparatus and method |
US5740271A (en) * | 1994-07-27 | 1998-04-14 | On-Track Management System | Expenditure monitoring system |
KR0147606B1 (ko) | 1994-11-25 | 1998-09-15 | 김광호 | 프로젝터용 스크린 |
US8162125B1 (en) * | 1996-05-29 | 2012-04-24 | Cummins-Allison Corp. | Apparatus and system for imaging currency bills and financial documents and method for using the same |
US6301386B1 (en) * | 1998-12-09 | 2001-10-09 | Ncr Corporation | Methods and apparatus for gray image based text identification |
US7494052B1 (en) * | 1999-11-30 | 2009-02-24 | Diebold Self-Service Systems Division Of Diebold, Incorporated | Method of evaluating checks deposited into a cash dispensing automated banking machine |
JP2002077625A (ja) * | 2000-08-30 | 2002-03-15 | Minolta Co Ltd | 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体 |
SE0201894D0 (sv) * | 2002-06-19 | 2002-06-19 | Ludesi Ab | Method for digital image processing |
KR100584320B1 (ko) * | 2003-07-30 | 2006-05-26 | 삼성전자주식회사 | 휴대 단말기의 손금 인식방법 |
US7672507B2 (en) | 2004-01-30 | 2010-03-02 | Hewlett-Packard Development Company, L.P. | Image processing methods and systems |
JP2005267457A (ja) * | 2004-03-19 | 2005-09-29 | Casio Comput Co Ltd | 画像処理装置、撮影装置、画像処理方法及びプログラム |
GB0413650D0 (en) * | 2004-06-18 | 2004-07-21 | Rolls Royce Plc | An apparatus and method for bulge testing an article |
US8086050B2 (en) * | 2004-08-25 | 2011-12-27 | Ricoh Co., Ltd. | Multi-resolution segmentation and fill |
US7801385B2 (en) * | 2005-05-10 | 2010-09-21 | Intel Corporation | Perceptual filter support techniques |
JP2007074578A (ja) * | 2005-09-08 | 2007-03-22 | Casio Comput Co Ltd | 画像処理装置、撮影装置、及びプログラム |
US7817854B2 (en) | 2006-07-11 | 2010-10-19 | Pegasus Imaging Corporation | Method and apparatus for identifying the rotation angle and bounding rectangle of a digitized form |
JP5066977B2 (ja) * | 2007-03-29 | 2012-11-07 | 富士ゼロックス株式会社 | 画像処理装置、画像形成装置、及びプログラム |
US8064729B2 (en) * | 2008-04-03 | 2011-11-22 | Seiko Epson Corporation | Image skew detection apparatus and methods |
KR101023389B1 (ko) * | 2009-02-23 | 2011-03-18 | 삼성전자주식회사 | 문자 인식 성능을 향상시키기 위한 장치 및 방법 |
KR101058726B1 (ko) * | 2009-11-11 | 2011-08-22 | 삼성전자주식회사 | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 |
KR101733539B1 (ko) * | 2009-11-24 | 2017-05-10 | 삼성전자주식회사 | 문자인식장치 및 그 제어방법 |
US9129340B1 (en) * | 2010-06-08 | 2015-09-08 | United Services Automobile Association (Usaa) | Apparatuses, methods and systems for remote deposit capture with enhanced image detection |
US20120087537A1 (en) * | 2010-10-12 | 2012-04-12 | Lisong Liu | System and methods for reading and managing business card information |
-
2011
- 2011-07-19 DE DE102011051934A patent/DE102011051934A1/de active Pending
-
2012
- 2012-07-17 WO PCT/EP2012/063976 patent/WO2013011013A2/de active Application Filing
- 2012-07-17 US US14/233,982 patent/US9773187B2/en active Active
-
2017
- 2017-09-26 US US15/716,473 patent/US10068150B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3069654A (en) | 1960-03-25 | 1962-12-18 | Paul V C Hough | Method and means for recognizing complex patterns |
US5506918A (en) * | 1991-12-26 | 1996-04-09 | Kabushiki Kaisha Toshiba | Document skew detection/control system for printed document images containing a mixture of pure text lines and non-text portions |
US6178270B1 (en) * | 1997-05-28 | 2001-01-23 | Xerox Corporation | Method and apparatus for selecting text and image data from video images |
DE10010621B4 (de) | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Schnelles Lokalisieren von Adressblöcken in Graustufenbildern |
US20020037097A1 (en) * | 2000-05-15 | 2002-03-28 | Hector Hoyos | Coupon recognition system |
DE102004020034A1 (de) | 2004-04-21 | 2005-11-17 | Infosys Gmbh | Scanner |
US20100195918A1 (en) * | 2007-09-07 | 2010-08-05 | Glory Ltd. | Paper sheet recognition apparatus and paper sheet recognition method |
Non-Patent Citations (2)
Title |
---|
Rashid, A.; Prati, A.; Cucchiara, R.: A real-time embedded solution for skew correction in banknote analysis. In: Computer Vision and Pattern Recognition Workshops (CVPRW), 20-25 June 2011, Pages: 42 - 49. [IEEE Computer Society Conference on] * |
Zhang Junyou: A Quickly Skew Correction Algorithm of Bill Image. In: 2010 Third International Conference on Information and Computing, Vol. 4, 2010, 185 - 188. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104252620A (zh) * | 2014-09-25 | 2014-12-31 | 同程网络科技股份有限公司 | 字符粘连的图形验证码识别方法 |
CN104252620B (zh) * | 2014-09-25 | 2017-06-06 | 同程网络科技股份有限公司 | 字符粘连的图形验证码识别方法 |
Also Published As
Publication number | Publication date |
---|---|
US20140219540A1 (en) | 2014-08-07 |
US20180060686A1 (en) | 2018-03-01 |
WO2013011013A2 (de) | 2013-01-24 |
US10068150B2 (en) | 2018-09-04 |
WO2013011013A3 (de) | 2013-04-18 |
US9773187B2 (en) | 2017-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102011051934A1 (de) | Verfahren und Vorrichtung zur OCR-Erfassung von Wertdokumenten mittels einer Matrixkamera | |
DE19814075B4 (de) | Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern | |
DE69926205T2 (de) | Artefaktentfernungstechnik für schiefenkorrigierte bilder | |
DE602005005117T2 (de) | Detektion abweichender Seiten während des Scannens | |
DE102013206009A1 (de) | Robustes Zuschneiden von Nummernschildbildern | |
DE3818659A1 (de) | Verfahren und vorrichtung zur verbesserung der bilderkennung von informationen auf schriftstuecken | |
DE3205726A1 (de) | Verfahren und vorrichtung zur fehlerfeststellung an einer flasche | |
DE102006034206A1 (de) | Bildlese-Einrichtung | |
DE112020006492T5 (de) | Verfahren zum Erzeugen eines Quick-Response-Codes und Druckvorrichtung | |
DE102010055974A1 (de) | Verfahren und Vorrichtung zur Bestimmung eines Klassenreferenzdatensatzes für die Klassifizierung von Wertdokumenten | |
EP2297674B1 (de) | Optische erfassung und klassifizierung von gegenständlichen leergut-objekten in einem leergut-rückgabesystem | |
AT515595A2 (de) | Verfahren zur optischen Erkennung von Zeichen | |
EP2677492A1 (de) | Codeleser und Verfahren zur Online-Verifikation eines Codes | |
WO2009097974A1 (de) | Authentifizierung von objekten | |
EP2677458B1 (de) | Optoelektronische Vorrichtung und Verfahren zur Helligkeitskorrektur | |
EP2710792B1 (de) | Verfahren zur detektion der breite und position von dokumenten anhand von bildinformationen in einem grossformatigen scanner-system | |
WO2003098917A1 (de) | Einrichtung und verfahren zum abtasten einer vorlage | |
DE19700318A1 (de) | Verfahren zur Bestimmung der Geometriedaten von Abtastvorlagen | |
CN111445433B (zh) | 一种电子卷宗的空白页和模糊页的检测方法及装置 | |
DE202012102113U1 (de) | Optoelektronischer Codeleser | |
DE102005040852A1 (de) | Scanner zum optischen und elektrischen Abtasten von Transponder-enthaltenden Dokumenten | |
EP3259703A1 (de) | Mobilgerät zum erfassen eines textbereiches auf einem identifikationsdokument | |
DE102020215415A1 (de) | Verfahren und Vorrichtung zum Detektieren einer Störpflanzenabbildung in einem Kamerarohbild und Bildverarbeitungseinrichtung | |
DE102020129997A1 (de) | Strichcodeleser mit kalibrierung der scanner-bildhelligkeit mit mehreren sichtfeldern von einem einzelnen sensor | |
DE102006027068A1 (de) | Verfahren und Einrichtung zum Prüfen von Gegenständen |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R163 | Identified publications notified | ||
R082 | Change of representative |
Representative=s name: 2K PATENTANWAELTE BLASBERG KEWITZ & REICHEL PA, DE |
|
R012 | Request for examination validly filed |
Effective date: 20140414 |
|
R016 | Response to examination communication | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: G06K0009320000 Ipc: G06V0030146000 |
|
R081 | Change of applicant/patentee |
Owner name: DIEBOLD NIXDORF SYSTEMS GMBH, DE Free format text: FORMER OWNER: WINCOR NIXDORF INTERNATIONAL GMBH, 33106 PADERBORN, DE |