DE69026041T2 - Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes - Google Patents

Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes

Info

Publication number
DE69026041T2
DE69026041T2 DE69026041T DE69026041T DE69026041T2 DE 69026041 T2 DE69026041 T2 DE 69026041T2 DE 69026041 T DE69026041 T DE 69026041T DE 69026041 T DE69026041 T DE 69026041T DE 69026041 T2 DE69026041 T2 DE 69026041T2
Authority
DE
Germany
Prior art keywords
image
halftone
pixels
pixel
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69026041T
Other languages
English (en)
Other versions
DE69026041D1 (de
Inventor
Dan S Bloomberg
William T Crocca
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of DE69026041D1 publication Critical patent/DE69026041D1/de
Application granted granted Critical
Publication of DE69026041T2 publication Critical patent/DE69026041T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40062Discrimination between different image types, e.g. two-tone, continuous tone
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Description

  • Die Erfindung betrifft allgemein die Bildverarbeitung und insbesondere eine Technik zum Unterscheiden zwischen feinstrukturierten Bereichen und anderen Bereichen.
  • Es gibt verschiedene Anwendungen, wo es bedeutend ist, schnell zu bestimmen, ob ein Bild Bereiche mit Feinstruktur, wie Halbtöne und Kornraster enthält.
  • Beispielsweise können schwierigkeiten bei Druckern auftreten, deren Ausgang eine unterschiedliche Auflösung gegenüber der Eingabeabtastvorrichtung ist, da Techniken zum Umwandeln der Auflösung in bezug auf Strukturen empfindlich sind. Eine Technik, die bei Text gut arbeitet, tut es im allgemeinen schlecht bei Halbtönen oder Kornrastern und umgekehrt. Wenn die Halbtonbereiche erkannt worden sind und wenn die Frequenz und der Rasterwinkel bekannt sind, dann können geeignete Techniken für unterschiedliche Bereiche des Bildes ausgewählt werden, und die Halbtonbereiche können auf lösungsmäßig mit einem annehmbar niederen Anteil von Pseudoerzeugnissen umgewandelt werden.
  • Schwierigkeiten treten auch bei Abtastvorrichtungen auf. Wenn ein binäres Halbtonbild abgetastet wird, kann eine schwebung zwischen der Wiederholungsfrequenz in dem Bild und der Größe einer ganzen Zahl abgetasteter Bildelemente auftreten. Das Ergebnis ist ein Pseudoerzeugnis, bei dem ein Moiré-Muster niederer Frequenz in dem abgetasteten Bild beobachtet wird. Um dies zu verhindern, ist es wünschenswert, eine Grauskala-Abtastvorrichtung zu verwenden und Halbton vor der Schwellenverarbeitung zu entfernen. Techniken zum Entfernen von Halbtonmustern arbeiten am besten, wenn die Halbtonfrequenz und der Rasterwinkel bekannt sind.
  • Es ist manchmal notwendig, daß eine grobe Segmentierung auftritt, bevor irgendeine Segmentierungs-Software verwendet wird. Einige Aspekte der Segmentierung können ausgeführt werden, indem eine verbundene Komponentendarstellung des Binärbildes aufgebaut wird, wie eine Graphik angrenzender Linien, und dann diese Datenstruktur verarbeitet wird. Jedoch können, wenn man versuchte, eine Graphik angrenzender Linien von einem feinstrukturiertem Raster geeigneter Größe (sagen wir 2 Quadratzoll oder größer) aufzubauen, die Speicheranforderungen und die Rechenzeit leicht übermäßig sein. Ähnlich ist es bei einer Segmentierung notwendig, daß sie erfolgt, bevor eine Erkennungs-Software verwendet wird. Wenn ein Halbtonbereich eines Binärbildes zu einer OCR oder einer Vektorisierungs-Software für Graphik geschickt würde, könnte das Programm brechen.
  • In Abhängigkeit von der Schwelleneinstellung und der Auflösung der Eingabevorrichtungen und der Qualität des Ausgabedruckers und der Anzahl von Kopieerzeugungen kann eine gedruckte Version des Binärbildes eines gleichförmig strukturierten Bereiches wenige oder keine Einzelheiten der Strukturierung des ursprünglichen Binärbildes zeigen. Wegen der Abtast- und Druckvorgänge ist der Kontrast bei der Größe von 1-5 Zeilenpaaren pro mm häufig stark erhöht, wobei dunkle Strukturen durchgehend schwarz werden und helle Strukturen viel heller oder sogar weiß (vielleicht mit einigem zufälligen Punktuntergrund) werden. Somit kann in vielen Situationen nicht angenommen werden, daß das Auftreten der ursprünglichen Strukturierung in dem zu analysierenden Binärbild beibehalten wird.
  • Es ist eine Zielsetzung der vorliegenden Erfindung, eine Darstellung von Halbtonbereichen eines Binärbildes, das erzeugt werden soll, zu ermöglichen und eine effiziente und wirksame Trennung von strukturierten Bereichen in dem Bild von unstrukturierten Bereichen zu erleichtern.
  • Demgemäß schafft die vorliegende Erfindung ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:
  • Verarbeiten des ursprünglichen Bildes, um ein Keimbild zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es EIN- Bildelemente nur in den Halbtonbereichen enthält und daß es mindestens ein EIN-Bildelement in jedem Halbtonbereich enthält;
  • Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske zu konstruieren, wobei die Ausschneidemaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und
  • Verarbeiten des Keimbildes und der Ausschneidemaske so, daß der Keim wächst und der derart gewachsene Keim mit der Ausschneidemaske ausgeschnitten wird, wodurch eine Darstellung der erwünschten Trennmaske geschaffen wird.
  • Techniken gemäß der Erfindung, die unten beschrieben sind, verwenden Transformationen, wie schwellenmäßige Verkleinerungen und morphologische Operationen, die im einzelnen unten definiert und erörtert werden. Eine schwellenmäßige Verkleinerung beinhaltet eine rechteckförmige Mehrfachanordnung von Bildelementen auf ein einziges Bildelement abzubilden, dessen Wert von der Anzahl von EIN-Bildelementen in der rechteckförmigen Mehrfachanordnung und einem Schwellenwert abhängt. Morphologische Operationen verwenden ein Bildelementmuster, das ein strukturierendes Element genannt wird, um ein Bild abzutragen, offen zu erweitern oder zu schließen.
  • Eine bevorzugte Technik gemäß der Erfindung, um zu bestimmen, ob es Halbtonbereiche gibt, enthält das Unterteilen des Bildes in eine Anzahl von Unterbereichen oder Unterflächen, das Gewinnen und Zählen von Bildelementübergängen in jeder Unterfläche, das Normalisieren der Zählwerte in bezug auf die Unterfläche und das Vergleichen der Werte mit einem Schwellenwert, der Halbtonbereiche von halbtonfreien Bereichen (wie jene, die Text und Liniengraphik enthalten) unterscheidet.
  • Eine bevorzugte Technik gemäß der Erfindung zum Bestimmen der Rastergröße und des Winkels umfaßt vorzugsweise das Auswählen der Unterfläche, die die größte Anzahl von Bildelement-Übergängen hat und Filtern der Unterfläche, wie dadurch, daß sie mit einer Anzahl von strukturierenden Fehltreffer-Elementen abgetragen wird, die als schmale Bandpaßfilter dienen. Die strukturierenden Elemente sind jeweils durch eine lineare Abmessung und einen Winkel gekennzeichnet. Das strukturierende Element, das die meisten EIN-Bildelemente nach dem Abtragen der Unterflächen ergibt, dient dazu, die Größe und den Winkel des Rasters zu kennzeichnen.
  • Das Konstruieren der Trennmaske enthält vorzugsweise, ein Keimbild zu konstruieren, eine Ausschneidemaske zu konstruieren und den Keim zu füllen, während mit der Maske ausgeschnitten wird. Der Keim muß Bildelemente nur in den Halbtonbereichen enthalten und muß wenigstens ein Bildelement in jedem Halbtonbereich enthalten. Die Ausschneidemaske muß alle EIN- Bildelemente in den Halbtonbereichen überdecken. Sie kann auch halbtonfreie Bereiche überdecken, wobei aber kein Teil der Ausschneidemaske, die einen halbtonfreien Bereich überdeckt, einen Teil berühren sollte, der einen Halbtonbereich überdeckt.
  • Der Keim kann konstruiert werden, indem das gesamte Bild mit dem strukturierenden Element abgetragen wird, das gefunden wurde, die beste Anpassung in Verbindung mit dem Bestimmen der Größe und des Winkels des Rasters zu gegeben, wie es oben erwähnt worden ist, indem eine oder mehrere schwellenmäßige Reduktionen ausgeführt werden und eine offene Operation mit einem 3x3 oder 4x4 durchgehenden, strukturierenden Element ausgeführt wird, um Bildelemente außerhalb der Halbtonbereiche zu entfernen. Insbesondere umfaßt gemäß der Erfindung der Schritt, einen Keim zu konstruieren, die Schritte:
  • Bereitstellen einer Gruppe von Raumfiltern;
  • Auswählen des Raumfilters, das am besten zu den Halbtoneigenschaften von mindestens einem Bereich des Bildes paßt;
  • Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;
  • Unterziehen des derart gefilterten Bildes einer Operation aus einer Gruppe von Operationen, die AUS-Bildelemente entfernt, die nahe EIN-Bildelmenten sind; und
  • Unterziehen des sich ergebenden Bildes einer offenen Operation.
  • Die Ausschneidemaske kann konstruiert werden, indem die Halbtonbereiche in durchgehende EIN-Bildelemente umgewandelt werden. Dies wird vorzugsweise ausgeführt, indem das gesamte Bild einer Transformation unterzogen wird, die dazu neigt, AUS- Bildelemente auszuschließen, die sich neben oder nahe bei EIN- Bildelementen befinden derart, daß die Halbtonbereiche im wesentlichen vollständig gefüllt werden, während die halbtonfreien Bereiche (solche wie diejenigen, die Liniengraphik und Text enthalten) dunkler, aber nicht vollständig gefüllt werden. In beispielhafter Weise kann eine solche Transformation eine oder mehrere schwellenmäßige Reduktionen mit allgemeinem Dunklen (niederen Schwellenwert) umfassen, wobei möglicherweise eine Schließoperation folgt. Demgemäß umfaßt der Schritt zum Herstellen einer Ausschneidemaske wenigstens eine schwellenmäßige Reduktion, um strukturierte Bereiche zu verdichten.
  • Das Anfüllen des Keimes, während mit der Maske ausgeschnitten wird, kann durch ein schrittweises Verfahren ausgeführt werden, bei dem der Keim (oder dessen vorliegende Iteration) mit einem 3x3 durchgehenden, strukturierenden Element ausgedehnt und mit der Ausschneidemaske einer UND-Operation ausgesetzt wird, bis sich das Ergebnis nicht ändert.
  • Die vorliegende Erfindung schafft demgemäß ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:
  • Verarbeiten des ursprünglichen Bildes, um ein Keimbild zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es Bildelemente nur in den Halbtonbereichen enthält, und daß es mindestens ein Bildelement in jedem Halbtonbereich enthält;
  • Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske zu bilden, wobei die Ausschneidemaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und
  • Verarbeiten des Keimbildes und der Ausschneidemaske, so daß der Keim wächst und von der Ausschneidemaske ausgeschnitten wird;
  • wodurch der derart gewachsene und ausgeschnittene Keim eine Darstellung der Trennmaske liefert. Der Schritt, einen Keim zu konstruieren, kann die Schritte umfassen:
  • Bereitstellen einer Gruppe von Raumfiltern;
  • Auswählen des Raumfilters, das den Halbtoneigenschaften am besten angepaßt ist;
  • Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;
  • Unterziehen des derart gefilterten Bildes mindestens einer schwellenmäßigen Reduktion; und
  • Unterziehen des sich ergebenden Bildes einer Öffnungsoperation.
  • Nur in beispielhafter Weise werden nun Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die beigefügten zeichnungen beschrieben, in denen:
  • Fig. 1A ein Blockdiagramm eines Bildabtast- und Verarbeitungssystems ist;
  • Fig. 1B ein Flußdiagramm eines hohen Niveaus ist, das das Verfahren zum Identifizieren, Kennzeichnen und Trennen von feinstrukturierten Bereichen in einem Bild zeigt;
  • Figuren 2A - B Flußdiagramme sind, die die Schritte zum Bestimmen darstellen, ob Halbtöne vorhanden sind;
  • Fig. 3 ein Flußdiagramm ist, das die Kennzeichnung der Größe und des Winkels des Halbtonrasters darstellt;
  • Figuren 4A - D, 5A - C, 6A - D, 7A - B und 8A - D strukturierte Fehltreffer-Elemente zeigen, die als schmale Bandpaßfilter verwendet werden, um die Halbtoneigenschaften zu bestimmen;
  • Figuren 9A - D Flußdiagramme sind, die die Erzeugung einer Trennmaske aus einem Keim und einer Ausschneidemaske darstellen;
  • Fig. 10 ein Flußdiagramm ist, das die Verwendung der Maske darstellt, um die Trennung von strukturierten und unstrukturierten Bereichen zu erhalten;
  • Fig. 11 ein Flußdiagramm ist, das eine Alternative darstellt, um die Maske auszudehnen;
  • Fig. 12 ein Flußdiagramm ist, das eine alternative Art darstellt, den Keim zu erzeugen;
  • Figuren 13A - B Flußdiagramme sind, die Alternativen zu den schwellenmäßigen Reduktionen darstellen, die verwendet werden, den Keim und die Ausschneidemaske zu erzeugen;
  • Fig. 14 ein repräsentatives Binärbild zeigt;
  • Fig. 15A eine graphische Darstellung der Filterreaktion auf eine Gruppe von Raumfiltern ist;
  • Figuren 15B - D die Ergebnisse bei unterschiedlichen Stufen des Erzeugens des Keimes zeigen;
  • Figuren 16A - B die Ergebnisse bei unterschiedlichen Stufen des Erzeugens der Ausschneidemaske zeigen;
  • Figuren 17A - B die Ergebnisse zeigen, den Keim und die Ausschneidemaske zu kombinieren, um eine Halbtonmaske zu schaffen;
  • Figuren 18A - B die Halbtontrennung und die Texttrennung zeigen; und
  • Fig. 19 ein Blockdiagramm von Hardware für einen speziellen Zweck zum Ausführen von Bildverkleinerungen und Bildvergrößerungen ist.
  • DEFINITIONEN UND TERMINOLOGIE
  • Die vorliegende Erörterung betrifft Binärbilder. In diesem Zusammenhang bezieht sich der Ausdruck "Bild" auf eine Darstellung einer zweidimensionalen Datenstruktur, die aus Bildelementen zusammengesetzt ist. Ein Binärbild ist ein Bild, in dem ein gegebenes Bildelement entweder "EIN" oder "AUS" ist. Binärbilder werden entsprechend einer Anzahl von Operationen verarbeitet, wobei ein oder mehrere Quellenbilder auf ein Zielbild abgebildet werden. Die Ergebnisse solcher Operationen werden im allgemeinen als Bilder bezeichnet. Das Bild, das der Ausgangspunkt zur Verarbeitung ist, wird manchmal als das ursprüngliche Bild bezeichnet.
  • Bildelemente sind definiert, als daß sie EIN sind, wenn sie schwarz sind, und AUS sind, wenn sie weiß sind. Man beachte, daß die Bezeichnung schwarz als EIN und weiß als AUS die Tatsache wiedergibt, daß die meisten interessierenden Vorlagen einen schwarzen Vordergrund und einen weißen Hintergrund aufweisen. Während die zu beschreibenden Techniken ebenso auf negative Bilder angewendet werden könnten, erfolgt die Erörterung in Größen von schwarz auf weiß.
  • Ein "durchgehender Bereich" eines Bildes bezeichnet einen Bereich, in dem sich viele Bildelemente in beiden Dimensionen erstrecken, innerhalb dessen im wesentlichen alle Bildelemente EIN sind.
  • Ein "strukturierter Bereich" eines Bildes bezeichnet einen Bereich, der ein relativ feinkörniges Muster enthält. Beispiele von strukturierten Bereichen sind halbgetönte oder korngerasterte Bereiche.
  • "Text" bezeichnet Bereiche einer Vorlage oder eines Bildes, die Buchstaben, Zahlen oder andere Symbole einschließlich nichtalphabetischer, linguistischer Zeichen enthalten.
  • "Liniengraphik" bezeichnet Bereiche einer Vorlage oder eines Bildes, die aus von Text unterschiedenen Graphiken, Figuren oder Zeichnungen gebildet sind, die allgemein aus horizontalen, vertikalen und schrägen Linien aufgebaut sind, die eine wesentliche Verlaufsstrecke verglichen mit Text haben. Graphiken können von beispielsweise horizontalen und vertikalen Linien in einem Organisationsplan bis zu komplizierteren horizontalen, vertikalen und schrägen Linien in technischen Zeichnungen reichen.
  • Eine "Maske" bezeichnet ein normalerweise von einem ursprünglichen Bild abgeleitetes Bild, das im wesentlichen durchgehende Bereiche aus EIN-Bildelementen enthält, die interessierenden Bereichen in dem ursprünglichen Bild entsprechen. Die Maske kann auch Bereiche mit EIN-Bildelementen enthalten, die keinem interessierenden Bereichen entsprechen.
  • UND, ODER und EXKLUSIV ODER sind logische Operationen, die zwischen zwei Bildern auf einer Bildelement-zu-Bildelement- Basis durchgeführt werden.
  • NICHT ist eine logische Operation, die an einem einzelnen Bild auf einer Bildelement-zu-Bildelement-Basis durchgeführt wird.
  • "Ausdehnung" ist eine Skalierungsoperation, die durch einen Skalierungsfaktor N gekennzeichnet ist, bei der jedes Bildelement in einem Quellenbild ein NxN Quadrat aus Bildelementen wird, die alle den gleichen Wert wie das ursprüngliche Bildelement haben.
  • "Verkleinerung" ist eine Skalierungsoperation, die durch einen Skalierungsfaktor N und einen Schwellenwert M gekennzeichnet ist. Eine Verkleinerung mit der Skalierung = N führt zum Unterteilen des Quellenbildes in NxN Quadrate von Bildelementen, wobei jedes solches Quadrat in dem Quellenbild auf ein einziges Bildelement in dem Zielbild abgebildet wird. Der Wert des Bildelementes in dem Zielbild wird durch den Schwellenwert M bestimmt, der eine Zahl zwischen 1 und N ist. Wenn die Anzahl der EIN-Bildelemente in dem Quadrat aus Bildelementen größer oder gleich M ist, ist das Zielbildelement EIN, sonst ist es AUS.
  • "Unterabtasten" ist eine Operation, bei der das Quellenbild in kleinere (typischerweise quadratische) Elemente unterteilt wird, und jedes Element in dem Quellenbild wird auf ein kleineres Element in dem Zielbild abgebildet. Die Bildelementwerte von jedem Zielbildelement werden durch eine ausgewählte Untergruppe von Bildelementen in dem Quellenbildelement definiert. Typischerweise führt Unterabtasten dazu, an einzelne Bildelemente anzupassen, wobei der Zielbildelementwert der gleiche wie ein ausgewähltes Bildelement von dem Quellenbildelement ist. Die Auswahl kann vorbestimmt (beispielsweise oberes, linkes Bildelement) oder zufällig sein.
  • Ein "4-Verbindungsbereich" ist eine Gruppe von EIN-Bildelementen, wobei jedes Bildelement in der Gruppe seitlich oder vertikal wenigstens einem anderen Bildelement in der Gruppe benachbart ist.
  • EIN "8-Verbindungsbereich" ist eine Gruppe von EIN-Bildelementen, wobei jedes Bildelement in der Gruppe seitlich, vertikal oder diagonal mindestens einem anderen Bildelement in der Gruppe benachbart ist.
  • Eine Anzahl von morphologischen Operationen bilden ein Quellenbild auf ein gleichgroßes Zielbild gemäß einer Regel ab, die durch ein Bildelementmuster definiert ist, das ein strukturierendes Element genannt wird. Das strukturierende Element ist durch einen Mittelort und eine Anzahl von Bildelementorten definiert, von denen jeder einen definierten Wert (EIN oder AUS) aufweist. Andere Bildelementpositionen, die als "gleichgültig" bezeichnet werden, werden unberücksichtigt gelassen. Die Bildelemente, die das strukturierende Element definieren, müssen nicht zueinander benachbart sein. Der Mittelort muß nicht in der geometrischen Mitte des Musters sein; tatsächlich muß er sogar nicht innerhalb des Musters sein.
  • Ein "durchgehendes", strukturierendes Element bezeichnet ein strukturierendes Element, das einen Umfang aufweist, innerhalb dessen alle Bildelemente EIN sind. Beispielsweise ist ein durchgehendes 2x2 strukturierendes Element ein 2x2 Quadrat aus EIN-Bildelementen. Ein durchgehendes, strukturierendes Element muß nicht rechteckig sein.
  • Ein strukturierendes "Treffer-Fehler"-Element bezeichnet ein strukturierendes Element, das mindestens ein EIN-Bildelement und mindestens ein AUS-Bildelement angibt.
  • "Abtragen" ist eine morphologische Operation, bei der ein bestimmtes Bildelement in dem Zielbild EIN geschaltet wird, wenn und nur wenn das Ergebnis der überlagerung der Mitte des strukturierenden Elementes auf dem entsprechenden Bildelementort in dem Quellenbild eine Anpassung zwischen allen EIN- und AUS-Bildelementen in dem strukturierenden Element und den darunterliegenden Bildelementen in dem Quellenbild ergibt.
  • "Ausdehnung" ist eine morphologische Operation, bei der ein bestimmtes Bildelement in dem Quellenbild, das EIN ist, bewirkt, daß das strukturierende Element in das Zielbild mit der Mitte des strukturierenden Elementes an dem entsprechenden Ort in dem Zielbild geschrieben wird. Die strukturierenden Elemente, die für eine Ausdehnung verwendet werden, weisen typischerweise keine AUS-Bildelemente auf.
  • "Öffnen" ist eine morphologische Operation, die aus einem Abtragen besteht, dem eine Ausdehnung folgt. Das Ergebnis ist, das strukturierende Element in dem Zielbild für jedes Passen in dem Quellenbild zu reproduzieren
  • "Schließen" ist eine morphologische Operation, die aus einer Ausdehnung besteht, der ein Abtragen folgt.
  • Die verschiedenen Operationen, die oben definiert worden sind, werden manchmal in der Form eines Substantivs, eines Adjektivs und eines Verbs bezeichnet. Beispielsweise kann Ausdehnung (Substantivform) mit dem Ausdruck des Ausdehnens des Bildes oder das Bild, das ausgedehnt worden ist (Verbform) oder das Bild, das einer ausdehnenden Operation (Adjektivform) ausgesetzt worden ist, bezeichnet werden. Es ist kein Unterschied in der Bedeutung beabsichtigt.
  • Systemüberblick
  • Fig. 1 ist ein Blockdiagramm eines Bildanalysesystems 1. Die Grundoperation des Systems 1 ist, gewisse kennzeichnende Bereiche einer Vorlage 2 zu gewinnen oder auszuschließen. Hierfür enthält das System eine Abtastvorrichtung 3, die die Vorlage auf der Basis von Bildelementen digitalisiert und eine sich ergebende Datenstruktur liefert, die typischerweise als ein Bild bezeichnet wird. In Abhängigkeit von der Anwendung kann die Abtastvorrichtung ein binäres Bild (ein einziges Bit pro Bildelement) oder ein Grauskalabild (eine Vielzahl von Bit pro Bildelement) schaffen. Das Bild enthält den groben Inhalt der Vorlage gemäß der Genauigkeit der Auflösung der Abtastvorrichtung. Das Bild kann zu einem Speicher 4 geschickt oder als eine Datei in einer Dateispeichereinheit 5 gespeichert werden, die eine Platte oder eine andere Massenspeichereinrichtung sein kann.
  • Ein Prozessor 6 steuert den Datenfluß und führt die Bildverarbeitung aus. Der Prozessor 6 kann ein Universalzweck-Cornputer, ein Computer für einen speziellen Zweck, der für Bildverarbeitungsoperationen optimiert worden ist, oder eine Kombination aus einem Universalzweck-Computer und einer zusätzlichen Hardware für einen bestimmten Zweck sein. Wenn eine Dateispeichereinheit verwendet wird, wird das Bild vor dem Verarbeiten zu einem Speicher 4 übertragen. Der Speicher 4 kann auch verwendet werden, um Zwischendatenstrukturen und möglicherweise eine endgültig verarbeitete Datenstruktur zu speichern.
  • Das Ergebnis des Bildverarbeitens kann ein abgeleitetes Bild, numerische Daten "wie Koordinaten der hervorstehenden Merkmale des Bildes) oder eine Kombination davon sein. Diese Informationen können zu bestimmter Anwendungs-Hardware 8 übertragen werden, die ein Drucker oder eine Anzeigeeinrichtung sein kann, oder sie können erneut in die Dateispeichereinheit 5 geschrieben werden.
  • Überblick über die Trennung von Halbtonbereichen
  • Ein ursprüngliches Binärbild kann Bereiche mit feiner Strukturierung, wie Kornrasterung oder Halbton enthalten. Solche Bereiche werden als Halbtonbereiche bezeichnet. Das Bild kann auch durchgehende, weiße Bereiche, durchgehende, schwarze Bereiche und Bereiche aus Text und Liniengraphik enthalten. Solche Bereiche werden manchmal als halbtonfreie Bereiche oder andere Bereiche bezeichnet.
  • Fig. 1B ist ein Flußdiagramm auf hohem Niveau, das die Hauptschritte bei einem Verfahren zum Identifizieren, Kennzeichnen und Trennen von Halbtonbereichen oder komgerasterten Bereichen in einem ursprünglichen Binärbild zeigt. Kurz gesagt führt die Technik dazu, das ursprüngliche Binärbild einer Reihe von logischen, skalierenden und morphologischen Operation zu unterziehen. Das ursprüngliche Binärbild wird zuerst verarbeitet, um zu bestimmen, ob es Halbtonbereiche (Schritt 10) gibt oder nicht, und die Operation wird beendet, wenn keine vorhanden sind. Unter der Annahme, daß es welche gibt, wird das Bild einem Filterverfahren ausgesetzt, um die kennzeichnende Größe und den Winkel des Halbtonrasters (Schritt 12) zu bestimmen. Das Bild wird dann verarbeitet, um eine Trennmaske zu schaffen, die die Halbtonbereiche und keine anderen Bereiche überdeckt (Schritt 15). Die Maske und das ursprüngliche Binärbild werden dann kombiniert, um die Trennungen der Halbtonbereiche und der halbtonfreien Bereiche zu erzielen, und Koordinaten der Halbtonbereiche werden identifiziert (Schritt 20).
  • Detaillierte Erörterung einer Ausführungsform der Erfindung
  • Fig. 2A ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 10 darstellt (bestimmen, ob es Halbtonbereiche gibt). Das Bild wird zuerst in eine Anzahl von Unterbereichen oder Unterflächen (Schritt 22) unterteilt. Jede Unterfläche muß viele Bildelemente enthalten und sollte in der Größenordnung des kleinsten, erwarteten Halbtonbereiches sein. Insbesondere kann das Bild in Unterflächen von jeweils einer Größe von ungefähr 100x100 Bildelemente bis 250x250 Bildelemente unterteilt werden. Für jede Unterfläche wird eine Zahl erzeugt, die die Anzahl von Bildelementübergänge in dieser Unterfläche (Schritt 25) angibt, und die Unterfläche mit der maximalen Anzahl von Bildelementübergängen wird ausgewählt (Schritt 27).
  • Eine ausgezeichnete Art, um zwischen Halbtonbereichen und halbtonfreien Bereichen zu unterscheiden, ist die Anzahl der Übergangsbildelemente innerhalb eines Bereiches zu zählen und die Anzahl durch die Fläche des Bereiches zu dividieren. Das Normalisieren auf die Fläche des Bereiches berücksichtigt zwei Faktoren, die halbtonfrei von Halbtonbereichen unterscheiden: Strukturgröße für Bildelementübergänge und Füllgrad des strukturierten Musters. Bei beiden Zählungen geben Halbtonbereiche Ergebnisse, die beträchtlich größer als bei halbtonfreien Bereichen sind, selbst bei jenen, die Text enthalten, so daß typischerweise eine leichte Bestimmung möglich ist. Ein bevorzugtes Unterscheidungsmaß ist, die Anzahl von horizontalen Bildelementübergängen (EIN-AUS oder AUS-EIN entlang der Abtastzeile) zu verwenden, und das Verhältnis solcher Bildelementübergänge zu der Anzahl von Wörtern von 16 Bit in der Unterfläche zu nehmen. Ein Textbereich hat typischerweise für dieses Verhältnis einen Wert von weniger als 2,0 und ein Halbtonbereich ist typischerweise größer als 2,5.
  • Demgemäß wird, sobald die Unterfläche mit der maximalen Anzahl ausgewählt worden ist, diese Zahl normalisiert, und eine Bestimmung wird vorgenommen, ob die normalisierte Bildelementübergangszahl eine Schwelle (Schritt 30) überschreitet. Wenn es nicht so ist, wird angenommen, daß es keine Halbtonbereiche gibt, und die Verarbeitung hält an. Wenn die Unterfläche mit der maximalen Anzahl von Bildelementübergängen die Schwelle überschreitet, wird angenommen, daß es Halbtonbereiche gibt und das Verarbeiten wird fortgesetzt.
  • Fig. 2B ist ein Flußdiagramm, das eine bestimmte Technik zum Ausführen des Zählens von horizontalen Bildelementübergängen (Schritt 25) darstellt. Die Operationen in Fig. 2B werden für jede Unterfläche ausgeführt, die sich von dem Schritt 22 ergibt. Die Unterfläche wird kopiert (Schritt 35) und eine Kopie wird bewahrt. Die andere Kopie wird (Schritt 40) mit einem 1x3 horizontalen, strukturierenden Element 37 abgetragen, das seine Mitte an der Mittenposition aufweist, und das Ergebnis wird einer EXKLUSIV ODER-Operation mit der bewahrten Kopie unterzogen (Schritt 42). Diese Operationen haben die Wirkung, Bildelementübergänge auf Randbildelemente abzubilden, d.h. Bildelemente, die einem Bildelement der entgegengesetzten Farbe benachbart sind. Diese Technik kann etwas zuwenig die Bildelementübergänge zählen, aber das ist kein wesentliches Problem. Alternativ könnten die vertikalen Übergänge gezählt werden, indem ein 3x1 vertikales, strukturierendes Element verwendet wird und alle Randbildelemente könnten gezählt werden, wobei ein 3x3 durchgehendes, strukturierendes Element verwendet wird.
  • Während die obige Beschreibung in Größen des Unterteilens des Bildes und dann des Verarbeitens jeder Unterfläche ausgeführt worden ist, könnten die Schritte der Fig. 2B an dem gesamten Bild ausgeführt werden und das Ergebnis des EXKLUSIV ODER- Schrittes 42 könnte unterteilt werden, und die Bildelemente könnten in jeder Unterfläche gezählt werden.
  • Fig. 3 ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 12 (Bestimmen der Größe und des Winkels des Rasters) darstellt. Das Bestimmen der Rastereigenschaften verlangt eine Gruppe von Raumfiltern, die auf eine Halbtonperiodizität empfindlich sind. Diese Filter, die im einzelnen unten beschrieben werden, sind strukturierende Fehler-Treffer- Elemente, von denen jedes ein Muster von EIN- und AUS-Bildelementen festlegt, das durch Abtragen auf das Bild angepaßt wird. Eine Gruppe von N solchen Filtern, die den Frequenz-Winkel-Raum der erwarteten, gedruckten Halbtöne überdecken, werden ausgewählt (Schritt 50), und die Unterfläche, die die meisten Bildelementübergänge aufweist, wie sie beim Schritt 27 bestimmt worden sind, wird N-mal (Schritt 52) kopiert. Jede Kopie wird mit einem entsprechenden Filter (Schritte 55(1) .... 55(N)) abgetragen. Die Anzahl von EIN-Bildelementen, die nach dem Abtragen übrigbleibt, wird für jedes Filter (Schritte 57(1) .... 57(N)) gezählt. Das Filter, das die maximale Anzahl von EIN-Bildelementen ergibt, wird ausgewählt (Schritt 60) und liefert die Rastereigenschaften. Als eine weitere Prüfung für das tatsächliche Vorhandensein von Halbtönen kann die maximale Anzahl mit einer Schwelle verglichen werden, und das Verarbeiten wird angehalten, wenn sie die Schwelle nicht überschreitet (Schritt 62).
  • Die Figuren 4A - D, SA - C, 6A - D, 7A - B und 8A - D zeigen die strukturierenden Fehler-Teffer-Elemente, die als schmale Bandpaßfilter verwendet werden, um die Halbtoneigenschaften zu bestimmen. Jedes Filter besteht aus fünf EIN-Bildelernenten (Treffer) und vier AUS-Bildelementen (Fehler) in einem kreuzförmigen Muster, wobei die EIN-Bildelemente in der Mitte und an den Ecken eines Quadrats sind und die AUS-Bildelemente ungefähr in der Mitte zwischen der Mitte und den Ecken sind. Es hat sich empirisch herausgestellt, daß diese Filter eine Raumperiodenbandbreite von ungefähr 0,1-mal der Periode des sich wiederholenden Musters und eine Winkelbandbreite von ungefähr 15º haben.
  • Fig. 9A ist ein Flußdiagramm, das die Schritte innerhalb des Schrittes 15 (erzeugen der Trennmaske) darstellt. Das Bild wird kopiert (Schritt 65), wobei eine Kopie verwendet wird, einen Halbtonkeim zu erzeugen (Schritt 67) und das andere verwendet wird, eine Ausschneidemaske zu erzeugen (Schritt 70). Der Halbtonkeim muß Bildelemente nur in den Halbtonbereichen enthalten und muß mindestens ein Bildelement in jedem Halbtonbereich enthalten. Die Ausschneidemaske muß dicht alle EIN- Bildelemente in den Halbtonbereichen überdecken. Während sie auch halbtonfreie Bereiche überdecken kann, sollte kein Teil der Ausschneidemaske, die einen halbtonfreien Bereich überdeckt, einen Teil der Ausschneidemaske berühren, die einen Halbtonbereich überdeckt.
  • Der Keim und die Ausschneidemaske werden dann einer Reihe von Operationen unterzogen, die bewirken, daß der Keim in die Ausschneidemaske wächst (Schritt 72). Wie es unten erörtert wird, werden der Keim und die Ausschneidemaske in einem verringerten Maßstab erzeugt. Demgemäß wird, wenn es erwünscht ist, eine direkte Verwendung der Maske vorzunehmen, das Bild, das sich beim Schritt 72 ergibt, zu seinem ursprünglichen Maßstab ausgedehnt (Schritt 75).
  • Fig. 9B ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 67 darstellt (Erzeugen des Halbtonkeimes). Das Bild wird zuerst mit dem besten Filter, der beim Schritt 60 ausgewählt worden ist, abgetragen (Schritt 80), und das Ergebnis wird zweimal mit dem Skalierungsfaktor = 2 und dem Wert = 1 verkleinert (Schritte 82 und 83). Bereiche von Text und Liniengraphik sind, soweit sie das Filtern überlebten, an dieser Stelle fleckförmig, haben im allgemeinen aber eine kleine Raumausdehnung. Das Bild wird dann einer Öffnungs- Operation mit einem 3x3 durchgehenden, strukturierenden Element unterzogen (Schritt 85), das irgendwelche überlebenden Bildelemente von den halbtonfreien Bereichen entfernt. Das Ergebnis ist ein Keim, der aus EIN-Bildelementen nur in Bereichen besteht, die den Halbtonbereichen in dem ursprünglichen Bild entsprechen.
  • Fig. 9C ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 70 darstellt (Erzeugen der Ausschneidemaske). Das ursprüngliche Bild wird einer Gruppe von Operationen unterzogen, die AUS-Bildelemente ausschließen, die nahe EIN-Bildelementen sind. Während Text und Linien verstärkt werden, neigen sie dazu, ihren allgemeinen Charakter beizubehalten. Jedoch laufen sie zusammen, wenn sich kleine Punkte in den strukturierten Bereichen ausdehnen, um große Massen zu bilden und dadurch die vorhergehend strukturierte Fläche verdichten.
  • Insbesondere wird das ursprüngliche Bild zweimal mit dem Skalierungsfaktor = 2 und Wert 1 verkleinert (Schritte 90 und 92), was dazu neigt, die Halbtonbereiche durchgehend zu machen. Das Ergebnis wird dann wahlweise einer Schließoperation mit einem 2x2 durchgehenden, strukturierenden Element unterzogen (Schritt 95). Das Ergebnis ist eine Ausschneidemaske, die alle Halbtonbereiche (und möglicherweise auch andere Bereiche) überdeckt.
  • Fig. 9D ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 72 darstellt (wachsender Keim und Ausschneiden, zu maskieren). Der Keim wird bei der ersten Iteration und danach ein iteriertes Bild kopiert (Schritt 100) und eine Kopie wird zur weiteren Verwendung aufgehoben. Die andere Kopie wird mit einem 3x3 durchgehenden, strukturierenden Element ausgedehnt (Schritt 102), und das Ergebnis wird einer UND-Operation mit der Ausschneidemaske unterzogen (Schritt 105). Die Ausdehnung neigt dazu, den Keim zu füllen, während die UND-Operation sicherstellt, daß der Keim nicht über die Ausschneidemaske hinauswächst. Das Ergebnis der UND-Operation wird einer EXKLUSIV ODER-Operation mit der aufbewahrten Kopie unterzogen, um zu bestimmen, ob es sich seit der letzten Iteration geändert hat (Schritt 107). Dies wird mit einer EXKLU- SIV ODER-Operation gemacht, wobei ein Ergebnis von EXKLUSIV ODER = 0 (keine EIN-Bildelemente) einschließt, daß keine Änderung seit der letzten Iteration aufgetreten ist und der Keim die Maske gefüllt hat.
  • Wenn sich die Bilder unterscheiden, kann der gegenwärtige, teilweise gefüllte Keim beim Schritt 100 kopiert und die Folge fortgesetzt werden, bis die EXKLUSIV ODER-Operation keine EIN- Bildelemente übrig läßt. Alternativ mag es wünschenswert sein, das Verfahren nach irgendeiner Anzahl von Iterationen anzuhalten, sagen wir nach fünf, selbst wenn das Bild nicht aufgehört hat, sich zu ändern. Dies könnte der Fall sein, wo die Füllaktivität ein Leck in einen halbtonfreien Bereich der Ausschneidemaske darstellt, die unbeabsichtigt einen Halbtonbereich berührt
  • Fig. 10 ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 20 (Bildtrennung) darstellt. Mit der derart erzeugten Maske wird die Segmentierung ohne weiteres ausgeführt. Das ursprüngliche Binärbild wird (Schritt 130) kopiert und mit der Maske (Schritt 135) einer UND-Operation unterzogen, um die "Halbtontrennung" (d.h. den strukturierten Teil des Bildes) zu erzeugen. Dies wird kopiert (Schritt 137), und das Ergebnis wird einer EXKLUSIV ODER-Operation (Schritt 140) mit einer Kopie des ursprünglichen Binärbildes unterzogen, um den unstrukturierten Teil des Bildes (Text und Liniengraphik) zu erzeugen. Man beachte, daß die Kopierschritte nicht notwendig sind, wenn das Ergebnis der logischen Operation bei irgendeiner gegebenen Stufe in einem neuen Feld in dem Speicher gespeichert wird, statt daß der Operand überschrieben wird.
  • Diskussion der beispielhaften Alternativen
  • Fig. 11 ist ein Flußdiagramm, das eine Alternative zu der Ausdehnung der durchgehenden Bereiche darstellt, um die Maske zu bilden. Statt die durchgehenden Bereiche auszudehnen, um eine Maske zu bilden, ist es möglich, die Koordinaten der durchgehenden Bereiche (Schritt 160) zu gewinnen und die Koordinaten auf die volle Größe (Schritt 161) maßstabsmäßig umzuwandeln. Dies liefert eine kompakte Darstellung, die ein bequemes Speichern der Maskeninformationen erlaubt.
  • Die Orte der Ecken von jedem durchgehenden, rechteckförmigen Bereich können gewonnen werden, indem Kopien der Maske mit einer Reihe von vier, strukturierenden Elementen 162 (ULC), 162 (URC), 162 (LLC) und 162 (LRC) abgetragen wird. Das strukturierende Element 162 (ULC) nimmt die obere, linke Ecke auf, wenn es verwendet wird, ein Rechteck abzutragen. Die anderen strukturierenden Elemente nehmen die anderen Ecken auf.
  • Bei rechteckförmigen Bereichen ist es zweckmäßig, jedoch nicht notwendig, die Eckenkoordinaten in einer bekannten Reihenfolge zu gewinnen; die Koordinaten allein legen die Zuordnung der Ecken zu rechteckförmigen Bereichen fest. Jedoch müssen bei nichtrechteckförmigen Bereichen, wo es mehr als vier Ecken für jeden verbundenen Bereich der Maske (und es kann Löcher geben) gibt, die Ecken in der Reihenfolge beibehalten werden, in der sie beim Verfolgen um den Umfang herun angetroffen werden. Obgleich möglich, mag dies ausreichend kompliziert sein, so daß bevorzugt wird, die Maske selbst zu verwenden.
  • Fig. 12 ist ein Flußdiagramm, das eine Alternative zu den Techniken der Fig. 9B zum Erzeugen des Halbtonkeimes darstellt. Das ursprüngliche Binärbild wird zweimal mit dem Skalierungsfaktor = 2 und Wert = 1 (Schritte 170 und 172) verkleinert. Das Ergebnis wird einer wahlweisen Schließoperation (Schritt 175) mit einem durchgehenden 2x2 strukturierenden Element unterzogen. Das Ergebnis wird dann zweimal mit dem Skalierungsfaktor = 2 und Wert = 4 (Schritte 177 und 178) verkleinert. Die Ergebnisse werden dann einer Öffnungsoperation mit einem durchgehenden 3x3 strukturierenden Element unterzogen. Man beachte, daß der durch diese Folge von Operationen erzeugte Keim um einen Faktor von 16 verringert wird. Demgemäß muß der Keim um einen Faktor 4 gedehnt werden, um zu dem Maßstab der Ausschneidemaske zu passen, oder die Ausschneidemaske muß um einen Faktor 4 verkleinert werden.
  • Fig. 13A ist ein gedehntes Flußdiagramm, das eine Alternative zu den schwellenwertmäßigen Verkleinerungen mit Wert = 1 darstellt, die verwendet wird, um den Keim und die Ausschneidemaske zu erzeugen. Genauer gesagt wird das Bild mit einem durchgehenden 2x2 strukturierenden Element (Schritt 190) erweitert und das sich ergebende Bild wird unterabgetastet, indem ein Bildelement in jedem 2x2 Quadrat gewählt wird, um ein verkleinertes Bild zu bilden (Schritt 192). Das Unterabtasten kann auf einer Zeilenbasis ausgeführt werden, indem jede zweite Linie entfernt wird, oder auf der Spaltenbasis, indem eine Nachsehtabelle in einer Weise verwendet wird, die ähnlich derjenigen ist, die unten in Verbindung mit dem Durchführen von schnellen, schwellenmäßigen Reduktionen beschrieben wird.
  • Fig. 13B ist ein gedehntes Flußdiagramm, das eine Alternative zu den schwellenmäßigen Reduktionen mit dem Wert = 4 darstellt, die verwendet wird, um den Keim zu erzeugen. Genauer gesagt, wird das Bild mit einem durchgehenden 2x2 struktunerenden Element (Schritt 195) abgetragen, und das sich ergebende Bild wird unterabgetastet, indem ein Bildelement in jedem 2x2 Quadrat gewählt wird, um ein reduziertes Bild zu bilden (Schritt 197).
  • Grundsätzlich könnte man auch eine Reihe von Schließoperationen bei dem Versuch verwenden, um einen fein strukturierten Bereich zu verdichten. Jedoch weist die Verwendung von einer oder mehreren schwellenmäßigen Reduktionen (oder Unterabtastungen) wenigstens zwei Vorteile auf. Erstens, da der Strukturmaßstab nicht von vornherein bekannt ist, kann nicht bestimmt werden, wie groß ein strukturierendes Element ist, das bei einem Schließvorgang zu verwenden ist. Ein strukturierendes Element, das zu klein ist, um benachbarte Teile in dem strukturierten Bereich zu überbrücken, würde das Bild nicht ändern, und die Schließoperation würde versagen. Während somit die Verwendung des Schließens örtlich alles oder nichts wäre, ergibt die Verwendung eine Reduktion mit dem Wert = 1 (oder eine Ausweitung und Unterabtastung) unverändert Ergebnisse beim Dunkeln der Struktur. Zweitens, die Verwendung von Reduktionen vor dem Schließen ermöglicht, daß die Operation bei einem reduzierten Maßstab ausgeführt wird. Vergleichbare Operationen bei vollem Maßstab sind computermäßig viel langsamer als jene bei einem reduzierten Maßstab (grob gesagt um die dritte Potenz des linearen Skalierungsfaktors). Deshalb sind alle nachfolgenden Operationen bei reduziertem Maßstab viel schneller.
  • Eine bestimmte Größe für das strukturierende Element wird auf empirische Grundlage ausgewählt, wobei solche Faktoren wie die Auflösung der Abtastvorrichtung in Betracht gezogen werden. Jedoch neigt die Entscheidung dazu, daß sie ziemlich unmittelbar ist, was eine minimale Größe an Versuchen mit sich bringt.
  • Obgleich die schwellenmäßigen Reduktionen als vorteilhaft zum Erzeugen der Ausschneidemaske betrachtet werden, kann das gleiche Ergebnis ebenso erreicht werden, indem eine Erweiterung mit einem durchgehenden 8x8 strukturierenden Element vorgenommen wird, dem eine 8x8 Unterabtastung folgt. Jedoch braucht die Berechnung wahrscheinlich viel länger.
  • Graphische Darstellung
  • Fig. 14 zeigt ein repräsentatives Binärbild, das mit 300 Bildelementen/Zoll (2,54 cm) abgetastet worden ist, das Text- und Halbtonbereiche aufweist. Gewisse andere Ansichten der Bilder bei Zwischenstufen der Verarbeitung werden in bezug auf Fig. 14 zweimal vergrößert. Bezugnahmen auf die Vergrößerung bei der folgenden Erörterung betreffen die Fig. 14 und sollen nicht mit den Ausdehnungs- und Reduktionsskalierungsoperationen verwechselt werden.
  • Fig. 15A ist eine Auftragung der Filterreaktion (Anzahl von EIN-Bildelementen), die sich aus den Angriffsschritten 55(1) .... 55(N) und den Zählschritten 57(1) .... 57(N) ergeben, die in Fig. 3 dargestellt sind. Wie man aus der Auftragung der Fig. 15A sehen kann, hat die Filternummer 15 die größte Reaktion. Dieses Filter entspricht tatsächlich dem Filter der Fig. 8A, das eine Raumperiode von acht Bildelementen und einen Winkel von 0º hat.
  • Fig. 15B zeigt das Ergebnis (bei 2x Vergrößerung) der Abtragung des ursprünglichen Bildes mit dem Filter, das die maximale Reaktion liefert. Die Figuren 15C und 15D zeigen die Ergebnisse (auch bei 2x Vergrößerung) der zwei nachfolgenden Verkleinerungen mit dem Skalierungsfaktor = 2 und Wert = 1. Das Ergebnis ist der Keim.
  • Die Figuren 16A - B zeigen die Ergebnisse (bei 2x Vergrößerung) der zwei Verkleinerungen mit dem Skalierungsfaktor = 2 und Wert = 1, die an dem Originalbild ausgeführt worden sind. Wie man sehen kann, besteht die Wirkung der Reduktionen darin, kleine Strukturelemente innerhalb des Halbtonbereiches hervorzurufen, um zu vereinigen und zu verdichten, und zu bewirken, daß der Text dicker gemacht wird. Das Ergebnis ist die Ausschneidemaske.
  • Fig. 17A zeigt das Ergebnis (bei 2x Vergrößerung) des Füllens des Keimes zu der Ausschneidemaske. Fig. 17B zeigt die Maske, die zu voller Größe ausgedehnt ist, d.h. mit einem linearen Faktor von vier, der den zwei Verkleinerungen mit jeweils dem Skalierungsfaktor = 2 entspricht. Diese Ansicht ist mit dem gleichen Maßstab wie das ursprüngliche Bild gezeigt.
  • Figuren 18A und 18B zeigen die Halbton- und Texttrennung. Die Halbtontrennung der Fig. 18A ergibt sich aus der logischen UND-Operation der Maske und des ursprünglichen Bildes, währen sich die Texttrennung der Fig. 18B aus dem EXKLUSIVEN ODER der Halbtontrennung und des ursprünglichen Bildes ergibt, wie es in Fig. 10 gezeigt ist.
  • Schnelle, schwellenmäßige Reduktion (und Ausdehnung) von Bildern
  • Eine Anforderung der wirksamen Segmentierung ist, daß die schwellenmäßige Reduktion schnell gemacht werden muß. Angenommen, es sei erwünscht, ein Bild mit einem Faktor von zwei in der vertikalen Richtung zu verkleinern. Eine Möglichkeit, dies zu machen, ist eine Rasteroperation (Bitbit-Bit-Blockübertragung) zu verwenden, um logisch die ungeraden und geraden Zeilen zu kombinieren, wobei eine einzige Zeile des verkleinerten Bildes von jedem Zeilenpaar in dem Original erzeugt wird. Das gleiche Vorgehen kann auf die Spalten des vertikal zusammengedrückten Bildes angewendet werden, was ein um einen Faktor von zwei in beiden Richtungen verkleinertes Bild gibt.
  • Das Ergebnis hängt jedoch von den logischen Operationen der horizontalen und vertikalen Rasteroperationen ab. Ein Ergebnis mit Wert = 1 oder 4 zu erhalten, ist unmittelbar. Wenn ein ODER für beide Ausrichtungen der Rasteroperation verwendet wird, ist das Ergebnis ein EIN-Bildelement, wenn irgendeines der vier Bildelemente innerhalb des entsprechenden 2x2 Quadrats des Originals EIN waren. Dies ist einfach eine Reduktion mit dem Wert = 1. Ebenso ist, wenn eine UND-Operation für beide Ausrichtungen der Rasteroperation verwendet wird, das Ergebnis eine Reduktion mit dem Wert = 4, wo alle vier Bildelemente EIN sein müssen.
  • Eine etwas andere Methode wird verwendet, eine Reduktion mit einem Wert = 2 oder 3 zu erhalten. Das Ergebnis, ein horizon tales ODER mit nachfolgendem vertikalen UND durchzuführen, sei ein reduziertes Bild R1, und es sei das Ergebnis, ein horizontales UND mit nachfolgendem vertikalen ODER durchzuführen, ein reduziertes Bild R2. Eine Reduktion mit Wert = 2 wird durch eine ODER-Operation von R1 mit R2 erhalten, und eine Reduktion mit Wert = 3 wird durch eine UND-Operation von R1 mit R2 erhalten.
  • Das Verfahren mag computermäßig nicht effizient sein, wenn es ausgeführt wird, wie es oben beschrieben worden ist. Bei manchen Computern, wie bei Sun-Arbeitsstationen, werden Rasteroperationen, in der Software durchgeführt. Das Bild wird als ein Block von sequentiellen Daten gespeichert, wobei mit der ersten Zeile des Bildes begonnen wird, wobei sich von links nach rechts bewegt wird, dann mit der zweiten Zeile usw. Infolgedessen sind Rasteroperationen zwischen Zeilen schnell, da 16 oder 32 Bit in zwei Wörtern in einer Operation kombiniert werden können. Um aber eine Rasteroperation zwischen zwei Spalten durchzuführen, müssen die entsprechenden Bit gefunden werden, gleichzeitig zwei Bit (eines für jede Spalte), bevor die logischen Operationen gemacht werden können. Es ergibt sich, daß die Zeit pro Bit-Element, um die vertikalen Rasteroperationen zu machen, wenigstens 25-mal größer als die horizontalen ist. Tatsächlich wird, wenn der Algorithmus vollständig für Rasteroperationen ausgeführt wird, mehr als 90% der Zeit vertikalen Operationen gewidmet.
  • Glücklicherweise gibt es eine einfache und sehr schnelle Möglichkeit, die logischen Operationen zwischen Spalten auszuführen. Statt Spaltenrasteroperationen zu verwenden, nehme man 16 sequentielle Bit, die 16 Spalten in einer Reihe entsprechen. Auf diese 16 Bit kann als eine kurze ganze Zahl zugegriffen werden. Diese 16 Bit werden als ein Index in einem 2¹&sup6;-Eintrittsfeld (d.h. eine Nachsehtabelle) von 8-Bit-Gegenständen verwendet. Die 8-Bit-Inhalte des Feldes geben das Ergebnis der ODER-Operation des ersten Bits des Index mit dem zweiten, des dritten Bits mit dem vierten ... und bis zu dem 15 Bit mit dem 16. Tatsächlich werden zwei Felder benötigt, eines für die ODER-Operation der 8 Gruppen von benachbarten Spalten, und eines für die UND-Operation der Spalten. Man sollte beachten, daß das Zahlenbeispiel nur ein Beispiel ist. Es ist auch möglich, dies als ein 2&sup8;-Eintrittsfeld von 4-Bit-Gegenständen oder als irgendeine einer Anzahl anderer Möglichkeiten auszuführen.
  • Die Verwendung von Nachsehtabellen, um logische Spaltenoperationen auszuführen, ist pro Bildelement ungefähr so schnell, wie Zeilenrasteroperationen bei Sun. Ein 1000x1000 Bildelementbild kann auf einem Sun 3/260 mit einem Wert = 1 oder 4 auf ein 500x500 Bildelementbild in 0,1 5 reduziert werden. Auf einem Sun 4/330 benötigt die Operation ungefähr 0,04 s.
  • Spezielle Hardware-Konfigurationen
  • Wie es oben erörtert worden ist, verlangen 2x2 Reduktionen zuerst eine logische Operation zwischen Zeilen, denen eine zweite, möglicherweise unterschiedliche logische Operation zwischen Spalten folgt. Ferner verlangen einige Schwellenpegel zwei reduzierte Zwischenbilder, die dann kombiniert werden können. Die Technik der Nachsehtabelle für Spaltenoperationen kann mühsam werden, wenn es erwünscht ist, ein sehr weites Bildelementwort zu haben. Entweder wird die Tabelle enorm oder man benötigt spezielle Techniken, Teile des weiten Bildelementwortes in mehreren parallelen Tabellen nachzusehen. Letzteres, während es offensichtlich besser ist, verlangt irgendeine Möglichkeit, um Abschnitte des Datenwortes als Speicheradressen zu verwenden, die sonst nicht notwendig sein mögen.
  • Fig. 19 ist ein logisches Schema einer spezialisierten Hardware zum Ausführen einer logischen Operation zwischen vertikal benachbarten 2Q-Bit Bildelementworten und einer paarweisen Bit-Reduktion des sich ergebenden 2Q-Bit Bildelementwortes (Bit 0 bis 2Q1). Obgleich die Zeichnung ein 16-Bildelementwort zeigt, würden die Vorteile dieser Hardware bei viel längeren Bildelementwörtern manifest werden, wo die Technik der Nachsehtabelle mühsam geworden ist. Ein 512-Bit Bildelementwort wird in Betrachtung gezogen, da eine Bildzeile nur einige wenige Bildelementworte darstellen würde.
  • Die Reduktion von zwei Bildelementworten tritt in zwei Stufen auf, die mit 200 und 202 bezeichnet sind. In der ersten Stufe wird ein vertikal benachbartes Paar von Bildelementworten aus einem ersten Speicher 203 ausgelesen, und die erwünschte, erste, logische Operation wird zwischen ihnen ausgeführt. Die erwünschte, zweite, logische Operation wird dann zwischen dem sich ergebenden Bildelementwort und einer Version des Bildelementwortes ausgeführt, die um ein Bit verschoben worden ist. Dies liefert ein verarbeitetes Bildelementwort, das interessierende Bits (gültige Bits) in jeder zweiten Bitposition aufweist. In der zweiten Stufe werden die gültigen Bits in dem verarbeiteten Bildelementwort gewonnen und komprimiert und das Ergebnis wird in einem zweiten Speicher 204 gespeichert. Der Speicher 203 ist vorzugsweise mit einer Wortgröße organisiert, die der Bildelementwortgröße entspricht. Der Speicher 204 kann in der gleichen Weise organisiert sein.
  • Die bevorzugte Ausführung der Stufe 200 ist ein Feld von Bit- Scheiben-Prozessoren, wie der IDT 40C402-Prozessor, der von der Integrierten Device Technology erhältlich ist. Dieser besondere Prozessor ist eine 16-Bit weite Einrichtung, von denen jede 64 verschiebbare Register enthält. Zweiunddreißig solcher Einrichtungen würden für ein Bildelementwort von 512-Bit geeignet sein. Zur Vereinfachung ist ein 16-Bit-System mit vier Registern 205, 206, 207 und 208 gezeigt. Unter der Operationen der Prozessoren sind jene, die die Inhalte des ersten und zweiten Registers logisch kombinieren und das Ergebnis in dem ersten speichern. Der Prozessor hat einen Datenport 215, der mit einem Datenbus 217 gekoppelt ist.
  • Die zweite Stufe 202 enthält einen ersten und zweiten, verriegelten Senderempfänger 220 und 222, von denen jeder halb so weit wie das Bildelementwort ist. Jeder Senderempfänger hat zwei Anschlüsse, die mit 220a und 220b bei dem Senderempfänger 220 und mit 222a und 222b bei dem Senderempfänger 222 bezeichnet sind. Jeder Senderempfänger ist halb so weit wie das Bildelementwort. Die Anschlüsse 220a und 222a sind jeweils mit den ungeraden Bits des Datenbusses 217 gekoppelt, die den interessierenden Bits entsprechen. Der Port 220b ist mit den Bits von 0 bis (Q-1) des Datenbusses gekoppelt, während der Port 222b mit den Bits Q bis (2Q-1) gekoppelt ist. Die Busleitungen werden durch Widerstände 125 hochgezogen, so daß nichtangesteuerte Leitungen hochgezogen sind.
  • Man betrachtet den Fall einer 2x2-Reduktion mit Wert = 2. Die Abfolge der Operationen verlangt, daß (a) ein vertikal benachbartes Paar von Bildelementworten einer UND-Operation unterzogen wird, um ein einziges 2Q-Bit Bildelementwort zu bilden, wobei benachbarte Paare von Bit einer ODER-Operation unterzogen werden, um ein Q-Bit Bildelementwort zu bilden, und das Ergebnis gespeichert wird; (b) das vertikal benachbarte Paar von Bildelementworten wird einer ODER-Operation unterzogen, benachbarte Bit des sich ergebenden 2Q-Bit Bildelementwort werden einer UND-Operation unterzogen, und das sich ergebende Q-Bit Bildelementwort wird gespeichert; und (c) die zwei Q-Bit Bildelementworte werden einer ODER-Operation unterzogen.
  • Um dieses auszuführen wird ein Paar vertikal benachbarter Bildelementworte aus dem ersten Speicher 203 auf den Datenbus 217 und in die Register 205 und 206 ausgelesen. Die Register 205 und 206 werden einer UND-Operation unterzogen und das Ergebnis wird in den Registern 207 und 208 gespeichert. Der Inhalt des Registers 208 wird um ein Bit nach rechts verschoben, die Register 207 und 208 werden einer ODER-Operation unterzogen und das Ergebnis wird in dem Register 208 gespeichert. Die Register 205 und 206 werden einer ODER-Operation unterzogen und das Ergebnis wird in den Registern 206 und 207 gespeichert. Der Inhalt des Registers 207 wird nach rechts um ein Bit verschoben, die Register 206 und 207 werden einer UND- Operation unterzogen und das Ergebnis wird in dem Register 207 gespeichert.
  • Zu diesem Zeitpunkt enthält das Register 207 das Ergebnis der ODER-Operation der zwei Bildelementworte und der UND-Operation der Paare von benachbarten Bits, während das Register 208 das Ergebnis der UND-Operation der Bildelementworte und der ODER- Operation von Paaren benachbarter Bits enthält. Jedoch enthalten die Register 207 und 208 die gültigen Bits in den 1, 3, ... (2Q-1) Positionen für ungerade Bits. Bei einer Reduktion mit dem Wert = 2 werden die Register 207 und 208 einer ODER- Operation unterzogen und das Ergebnis wird am Prozessordatenport 215 verfügbar, der mit dem Datenbus 217 gekoppelt ist.
  • Die ungeraden Bits des Datenbus werden in dem Senderempfänger 220 durch den Port 220a zwischengespeichert, was ein Bildelementwort von Q-Bit mit den gültigen Bits in benachbarten Positionen ergibt. Obgleich diese Q-Bit-Gesamtheit zurück auf den Bus gelesen und zu dem Speicher 207 übertragen werden könnte, wird es bevorzugt, beide Zwischenspeicher zu verwenden. Somit werden zwei neue Bildelemenworte (horizontal zu den ersten zwei benachbart) bei der Stufe 200 verarbeitet, wie es oben beschrieben worden ist, wobei das Ergebnis an dem Prozessordatenport 215 verfügbar gemacht wird und in dem Senderempfänger 222 über den Port 222a zwischengespeichert wird. Die Inhalte der zwei Senderempfänger werden dann durch die Anschlüsse 220b und 222b auf den Datenbus 217 ausgelesen, um ein 2Q-Bit Bildelementwort zu liefern, das die Reduktion von vier 2Q-Bit Bildelementworten darstellt. Das Ergebnis wird zu einem zweiten Speicher 204 übertragen. Diese Gesamtabfolge fährt fort, bis alle Bildelementworte in dem Zeilenpaar verarbeitet worden sind. Sobald ein Zeilenpaar verarbeitet worden ist, werden nachfolgende Paare ähnlich verarbeitet.
  • Wie es oben erwähnt worden ist, hat jeder Bit-Scheiben-Prozessor 64 Register. Demgemäß ergibt sich, da der Speicherzugriff in einem Blockmodus wirksamer ist, eine schnellere Operation, wenn 8 Paare von Bildelementworten aus dem Speicher 203 in einem Block ausgelesen werden, wie oben erörtert verarbeitet werden, in den Registern des Prozessors gespeichert werden und in einem Block in den Speicher 204 eingeschrieben werden.
  • Eine Bildvergrößerung ist ähnlich, aber die Schritte werden in der umgekehrten Reihenfolge ausgeführt. Zuerst liest der Prozessor ein Bildelementwort und schickt die linke Hälfte durch den Port 220b des Senderempfängers 220. Dies wird auf den Bus durch den Port 220a ausgelesen. Nur jedes zweite Bildelement in dem sich ergebenden Wort auf dem Bus wird anfangs gültig sein, so daß der Prozessor alle die Bildelemente gültig machen muß, die eine Reihenfolge von Verschiebungen und logischen Operationen verwenden. Da Widerstände 225 alle Busleitungen, die nicht angesteuert werden, hochziehen, wird jede nichtangesteuerte Leitung, alle geraden Bit in diesem Fall, 1 sein. Dieses gedehnte Bildelementwort, das 1 mit gültigen Daten abwechselt, wird in zwei Registern gelesen, wobei der Inhalt eines Registers um einen Platz verschoben wird und die Register einer logischen UND-Operation ausgesetzt werden. Überall dort, wo eine 0 in einem ungeraden Bit war, wird eine 00 in einem geraden/ungeraden Paar sein. Keine der anderen Bits werden beeinflußt. Dieses Bildelementwort wird dann in dem gedehnten Bild in zwei vertikal benachbarte Worte geschrieben. Dieser Vorgang wird für die rechte Hälfte des Bildelementwortes wiederholt, wobei der Senderempfänger 222 verwendet wird. Der Prozessor dehnt die gesamte Zeile um ein Bildelementwort zu einer Zeit und das gesamte Bild um eine Zeile zu einer Zeit.
  • Die oben unter Bezugnahme auf die Zeichnungen beschriebenen Techniken liefern eine wirksame und wirkungsvolle Trennung von strukturierten Bereichen von unstrukturierten Bereichen in einem Bild.
  • Sie sind robuste und computermäßig wirksame Techniken, die Transformationen verwenden, wie schwellenmäßige Reduktionsoperationen und morphologische Operationen, um das Vorhandensein von Halbtonbereichen oder korngerasteten Bereichen (gemeinsam als Halbtonbereiche bezeichnet) in einem Binärbild zu bestimmen, solche Bereiche in bezug auf die Rastergröße und den Rasterwinkel zu kennzeichnen und eine Darstellung der Halbtonbereiche zu erzeugen, wie durch Erzeugen einer Trennmaske, die die Halbtonbereiche überdeckt, oder durch Gewinnen der Koordinaten der Halbtonbereichgrenzen. Die in bezug auf die Zeichnungen beschriebenen Techniken sind computermäßig einfach, da die Operationen im wesentlichen örtlich sind. Sie sind auch schnell. Dies ist teilweise deswegen, weil die Operationen wenige Berechnungen pro Bildelement veranlassen, und teilweise weil viele der Operationen an reduzierten Bildern ausgeführt werden, die weniger Bildelemente als das ursprüngliche Bild enthalten, so daß es weniger Bildelemente gibt, die zu verarbeiten sind.
  • Verschiedene Abänderungen der beschriebenen Ausführungsformen sind möglich. Beispielsweise könnten alle oben genannten Operationen an einem Bild gemacht werden, das zuerst verkleinert bzw. reduziert worden ist. Somit würde viel der Bildberechnung bei einem weiter verkleinerten Maßstab auftreten. Ferner ist, während das bestimmte ursprüngliche Bild, das oben dargestellt worden ist, von einer Vorlage abgeleitet worden ist, die mit 300 Bildelementen/Zoll (2,54 cm) abgetastet worden ist, die Offenbarung auf Vorlagen anwendbar, die mit irgendeiner anderen Auflösung abgetastet worden sind.

Claims (14)

1. Ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:
Verarbeiten des ursprünglichen Bildes, um ein Keimbild (67) zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es EIN-Bildelemente nur in den Halbtonbereichen enthält und daß es mindestens ein EIN-Bildelement in jedem Halbtonbereich enthält;
Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske (70) zu konstruieren, wobei die Ausschneidernaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und
Verarbeiten des Keimbildes und der Ausschneidemaske (72) so, daß der Keim wächst und der derart gewachsene Keim mit der Ausschneidemaske ausgeschnitten wird, wodurch eine Darstellung der erwünschten Trennmaske geschaffen wird.
2. Ein Verfahren, wie in Anspruch 1 beansprucht und das ferner den Schritt des Bestimmens der charakteristischen Rastergröße und Rasterwinkel (12) der Halbtonbereiche umfaßt.
3. Ein Verfahren, wie in Anspruch 1 oder Anspruch 2 beansprucht und das ferner die Schritte umfaßt:
Bereitstellen einer Gruppe von Raumfiltern; und
Auswählen des Raumfilters, der am besten zu den Halbtoneigenschaften paßt.
4. Ein Verfahren, wie in Anspruch 3 beansprucht, in dem der genannte Auswähischritt die Schritte umfaßt:
Abtragen von wenigstens einern Bereich des Bildes mit jedem der Filter;
Zählen der EIN-Bildelemente für jede Abtragung; und
Auswählen des Filters, das die größte Anzahl ergibt.
5. Ein Verfahren, wie in Anspruch 3 oder Anspruch 4 beansprucht, in dem der genannte Schritt zum Konstruieren eines Keimes umfaßt:
Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;
Unterziehen des derart gefilterten Bildes mindestens einer schwellenmäßigen Reduzierung bzw. Verkleinerung; und
Unterziehen des sich ergebenden Bildes einer Öffnungsoperation.
6. Ein Verfahren, wie in irgendeinem der Ansprüche 3 bis 5 beansprucht, in dem jeder der Filter ein strukturierendes Treffer-Fehler-Element ist, das ein Muster von fünf EIN-Bildelementen, die sich in der Mitte und an den Ecken eines Quadrats befinden, und vier AUS-Elemente aufweist, die sich allgemein in der Mitte zwischen der Mitte und den Ecken des Quadrats befinden.
7. Ein Verfahren, wie in Anspruch 1 beansprucht, in dem der genannte Schritt des Konstruierens eines Keimes die Schritte umfaßt:
Unterziehen des ursprünglichen Binärbildes mindestens einer schwellenmäßigen Reduktion bei einem niederen Schwellenwert;
Unterziehen des sich ergebenden Bildes mindestens einer schwellenmäßigen Reduktion bei einem hohen Schwellenpegel; und
Unterziehen des sich ergebenden Bildes einer Öffnungs- Operation.
8. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, in dem der genannte Schritt des Konstruierens eine Ausschneidemaske umfaßt, das Bild einer Gruppe von Operationen auszusetzen, die AUS-Bildelemente entfernt, die nahe EIN-Bildelementen sind.
9. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, in dem die genannten Schritte des Wachsens und Ausschneidens umfassen:
bei einem ersten Durchgang Kopieren des Keirnes, um eine gegenwärtige Version festzulegen;
Ausdehnen der gegenwärtigen Version;
Unterziehen der Ausschneidemaske und der gegenwärtigen Version einer UND-Operation, um eine iterierte Version festzulegen;
Vergleichen der Kopie der gegenwärtigen Version mit der iterierten Version; und
(a) wenn sie gleich sind, verlassen, oder
(b) wenn sie ungleich sind, Kopieren der iterierten Version, um die gegenwärtige Version erneut zu definieren, und Wiederholen der obigen Schritte einschließlich dieses einen, wobei bei dem genannten Ausdehnungsschritt begonnen wird.
10. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, und das ferner die Schritte umfaßt, die vor dem genannten Konstruktionsschritt für den Keim ausgeführt werden:
Bestimmen, ob Halbtonbereiche in dem ursprünglichen Binärbild vorhanden sind; und
Verlassen, wenn und nur wenn Halbtonbereiche nicht vorhanden sind.
11. Ein Verfahren, wie in Anspruch 10 beansprucht, in dem der genannte Schritt des Bestimmens, ob Halbtonbereiche vorhanden sind, die Schritte umfaßt:
Unterteilen des Bildes in Unterbereiche;
Bestimmen der ungefähren Anzahl von Bildelementübergängen in jedem Unterbereich;
Aufnehmen des Unterbereiches mit der größten Anzahl von Bildelementübergängen; und
Vergleichen dieser Anzahl mit einer Schwelle, oberhalb der ein Unterbereich betrachtet wird, stark halbgetönt zu sein.
12. Ein Verfahren, wie in Anspruch 11 beansprucht, in dem der genannte Schritt des Bestimmens der ungefähren Anzahl von Bildelementübergängen die Schritte umfaßt:
Abtragen des Unterbereiches mit einem horizontalen, strukturierenden Element von benachbarten EIN-Bildelementen;
Unterziehen des Ergebnisses einer EXKLUSIV ODER- Operation mit dem Unterbereich; und
Zählen der verbleibenden EIN-Bildelemente.
13. Ein Verfahren, wie in Anspruch 4 und Anspruch 11 beansprucht, in dem der Bereich des Bildes, der mit jedem der Filter abgetragen worden ist, der Unterbereich mit der größten Anzahl von Bildelementübergängen ist.
14. Ein Verfahren, zum Trennen von Halbtonbereichen eines Binärbildes, das die Schritte umfaßt, eine Trennmaske mit einem Verfahren zu konstruieren, wie es in irgendeinem der vorhergehenden Ansprüche beansprucht wird, und logisch die Trennmaske und das ursprüngliche Binärbild zu kombinieren, um die Bildtrennungen zu gewinnen.
DE69026041T 1989-12-08 1990-12-07 Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes Expired - Fee Related DE69026041T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US07/448,193 US5131049A (en) 1989-12-08 1989-12-08 Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask

Publications (2)

Publication Number Publication Date
DE69026041D1 DE69026041D1 (de) 1996-04-25
DE69026041T2 true DE69026041T2 (de) 1996-10-02

Family

ID=23779364

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69026041T Expired - Fee Related DE69026041T2 (de) 1989-12-08 1990-12-07 Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes

Country Status (4)

Country Link
US (1) US5131049A (de)
EP (1) EP0431960B1 (de)
JP (1) JP2880572B2 (de)
DE (1) DE69026041T2 (de)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5239596A (en) * 1990-06-08 1993-08-24 Xerox Corporation Labeling pixels of an image based on near neighbor attributes
CA2077274C (en) * 1991-11-19 1997-07-15 M. Margaret Withgott Method and apparatus for summarizing a document without document image decoding
JP3516269B2 (ja) * 1991-11-19 2004-04-05 ゼロックス コーポレイション 文書イメージの処理装置
JPH07504056A (ja) * 1992-02-18 1995-04-27 ネオパス,インク. データ処理技術を使用して物体を識別するための方法
US5467410A (en) * 1992-03-20 1995-11-14 Xerox Corporation Identification of a blank page in an image processing system
US5418865A (en) * 1992-03-20 1995-05-23 Xerox Corporation Mark sensing on a form
US5434953A (en) * 1992-03-20 1995-07-18 Xerox Corporation Use of fast textured reduction for discrimination of document image components
US5651121A (en) * 1992-12-18 1997-07-22 Xerox Corporation Using mask operand obtained from composite operand to perform logic operation in parallel with composite operand
JP3083673B2 (ja) * 1993-03-31 2000-09-04 株式会社東芝 像域識別装置
US5651077A (en) * 1993-12-21 1997-07-22 Hewlett-Packard Company Automatic threshold determination for a digital scanner
US5546474A (en) * 1993-12-21 1996-08-13 Hewlett-Packard Company Detection of photo regions in digital images
US5748798A (en) * 1993-12-28 1998-05-05 Matsushita Wlectric Ind. Method and system for adding effects to gray scale images
JPH0818785A (ja) * 1994-04-28 1996-01-19 Ricoh Co Ltd 画像出力装置
US5566249A (en) * 1994-09-20 1996-10-15 Neopath, Inc. Apparatus for detecting bubbles in coverslip adhesive
US6389163B1 (en) 1994-11-18 2002-05-14 Xerox Corporation Method and apparatus for automatic image segmentation using template matching filters
US5706361A (en) * 1995-01-26 1998-01-06 Autodesk, Inc. Video seed fill over time
US5745596A (en) * 1995-05-01 1998-04-28 Xerox Corporation Method and apparatus for performing text/image segmentation
US5848191A (en) * 1995-12-14 1998-12-08 Xerox Corporation Automatic method of generating thematic summaries from a document image without performing character recognition
US5850476A (en) * 1995-12-14 1998-12-15 Xerox Corporation Automatic method of identifying drop words in a document image without performing character recognition
US5892842A (en) * 1995-12-14 1999-04-06 Xerox Corporation Automatic method of identifying sentence boundaries in a document image
US5761686A (en) * 1996-06-27 1998-06-02 Xerox Corporation Embedding encoded information in an iconic version of a text image
US5901251A (en) * 1997-03-18 1999-05-04 Hewlett-Packard Company Arithmetic coding compressor using a context model that is adaptive to variable length patterns in bi-level image data
US5951055A (en) * 1997-06-11 1999-09-14 The Standard Register Company Security document containing encoded data block
US6023534A (en) * 1997-08-04 2000-02-08 Xerox Corporation Method of extracting image data from an area generated with a halftone pattern
US6160913A (en) * 1998-03-25 2000-12-12 Eastman Kodak Company Method and apparatus for digital halftone dots detection and removal in business documents
US7168036B2 (en) * 1998-11-13 2007-01-23 Xerox Corporation User interface identification and service tags for a document processing system
US6470096B2 (en) 1998-11-13 2002-10-22 Xerox Corporation Method for locating user interface tags in a document processing system
WO2000052642A1 (en) * 1999-02-26 2000-09-08 Koninklijke Philips Electronics N.V. Filtering a collection of samples
US6209923B1 (en) 1999-04-14 2001-04-03 The Standard Register Company Security document and authentication scheme
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
US20030043413A1 (en) * 2001-08-31 2003-03-06 Jia Charles Chi System and method of detecting scanned halftone image and enhancing such image for reproduction
KR100946888B1 (ko) 2003-01-30 2010-03-09 삼성전자주식회사 영상화면 내의 피사체의 기울기 보정 장치 및 방법
US20050052468A1 (en) * 2003-09-05 2005-03-10 Xerox Corporation. Method of detecting half-toned uniform areas in bit-map
US20050281463A1 (en) * 2004-04-22 2005-12-22 Samsung Electronics Co., Ltd. Method and apparatus for processing binary image
US7545997B2 (en) * 2004-09-10 2009-06-09 Xerox Corporation Simulated high resolution using binary sub-sampling
US20060239555A1 (en) * 2005-04-25 2006-10-26 Destiny Technology Corporation System and method for differentiating pictures and texts
US7702154B2 (en) * 2006-01-13 2010-04-20 Adobe Systems, Incorporated Method and apparatus indentifying halftone regions within a digital image
US8228561B2 (en) * 2007-03-30 2012-07-24 Xerox Corporation Method and system for selective bitmap edge smoothing
US8009928B1 (en) * 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
US20090322748A1 (en) * 2008-06-09 2009-12-31 Uti Limited Partnership Methods,systems, and computer program products for GPU-based point radiation for interactive volume sculpting and segmentation
US7991153B1 (en) 2008-08-26 2011-08-02 Nanoglyph, LLC Glyph encryption system and related methods
US8368959B2 (en) 2009-05-18 2013-02-05 Xerox Corporation Method and system for selective smoothing of halftoned objects using bitmap encoding
US8947736B2 (en) 2010-11-15 2015-02-03 Konica Minolta Laboratory U.S.A., Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US9319556B2 (en) * 2011-08-31 2016-04-19 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for authenticating printed documents that contains both dark and halftone text
US9124841B2 (en) * 2013-11-26 2015-09-01 Xerox Corporation Connected component analysis with multi-thresholding to segment halftones
US10049097B1 (en) * 2017-01-27 2018-08-14 Xerox Corporation Systems and methods for creating multi-layered optical character recognition (OCR) documents

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4368463A (en) * 1979-03-21 1983-01-11 Sigma Electronics Limited Graphic display area classification
US4414685A (en) * 1979-09-10 1983-11-08 Sternberg Stanley R Method and apparatus for pattern recognition and detection
JPS57101986A (en) * 1980-12-17 1982-06-24 Toshiba Corp Character detecting and cutting method
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
US4503461A (en) * 1983-02-22 1985-03-05 The Board Of Trustees Of The Leland, Stanford Junior University Multiple measurement noise reducing system using space-variant filters
JPS59156070A (ja) * 1983-02-25 1984-09-05 Canon Inc 画像処理装置
US4674125A (en) * 1983-06-27 1987-06-16 Rca Corporation Real-time hierarchal pyramid signal processing apparatus
US4742558A (en) * 1984-02-14 1988-05-03 Nippon Telegraph & Telephone Public Corporation Image information retrieval/display apparatus
JPS60200379A (ja) * 1984-03-26 1985-10-09 Hitachi Ltd 画像処理用セグメンテ−シヨン装置
GB8411579D0 (en) * 1984-05-05 1984-06-13 Ibm Graphic display systems
US4741046A (en) * 1984-07-27 1988-04-26 Konishiroku Photo Industry Co., Ltd. Method of discriminating pictures
US4754488A (en) * 1984-12-07 1988-06-28 International Business Machines Corporation Method for ascertaining and filling of bounded areas of a colored raster display
DE3686821T2 (de) * 1985-01-10 1993-04-01 Nippon Telegraph & Telephone Halbtonbildverarbeitungseinrichtung.
JPS61225974A (ja) * 1985-03-30 1986-10-07 Ricoh Co Ltd 画像処理方式
US4668995A (en) * 1985-04-12 1987-05-26 International Business Machines Corporation System for reproducing mixed images
GB8520545D0 (en) * 1985-08-16 1985-09-25 British Aerospace Display data memory
US4700400A (en) * 1985-10-10 1987-10-13 The Palantir Corporation Feature extraction technique for use in a pattern recognition system
GB2183118B (en) * 1985-11-19 1989-10-04 Sony Corp Image signal processing
JPS62137974A (ja) * 1985-12-12 1987-06-20 Ricoh Co Ltd 画像処理方式
GB8614214D0 (en) * 1986-06-11 1986-07-16 Kodak Ltd Image processing method
JP2696211B2 (ja) * 1987-04-20 1998-01-14 株式会社日立製作所 濃淡画像からのパターン認識方法及び装置
JPS63261486A (ja) * 1987-04-20 1988-10-28 Nec Corp 書体識別装置
JP2702928B2 (ja) * 1987-06-19 1998-01-26 株式会社日立製作所 画像入力装置
JP2615625B2 (ja) * 1987-06-24 1997-06-04 富士ゼロックス株式会社 画像処理装置
US4827330A (en) * 1987-07-20 1989-05-02 Litton Industrial Automation Systems, Inc. Automatic document image revision
JPS6482286A (en) * 1987-09-25 1989-03-28 Toshiba Corp Image inclination detector
US4811115A (en) * 1987-10-16 1989-03-07 Xerox Corporation Image processing apparatus using approximate auto correlation function to detect the frequency of half-tone image data
US4791679A (en) * 1987-12-26 1988-12-13 Eastman Kodak Company Image character enhancement using a stroke strengthening kernal

Also Published As

Publication number Publication date
JP2880572B2 (ja) 1999-04-12
EP0431960B1 (de) 1996-03-20
DE69026041D1 (de) 1996-04-25
EP0431960A2 (de) 1991-06-12
JPH03233686A (ja) 1991-10-17
US5131049A (en) 1992-07-14
EP0431960A3 (en) 1992-03-25

Similar Documents

Publication Publication Date Title
DE69026041T2 (de) Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes
DE69033484T2 (de) Identifizierung und Segmentierung von feintexturierten und festen binären Bildern
DE69132206T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE69032421T2 (de) Verfahren und Gerät zur Dokumentschräglage-Ermittlung
DE69511507T2 (de) Verfahren und Vorrichtung zur automatischen Bildsegmentierung unter Verwendung von Standardvergleichsmustern
DE69103408T2 (de) Technik zur durchführung einer digitalen bildskalierung durch logisches zusammensetzen oder vervielfältigen von pixeln in blöcken von unterschiedlichen gruppengrössen.
DE69032556T2 (de) Technik zur Bildverkleinerung und -vergrösserung
DE69715076T2 (de) Vorrichtung zur Erzeugung eines Binärbildes
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE68922998T2 (de) Verfahren zur Digitalisierung von in Formblättern eingetragenen Informationen mittels Vergleich mit sehr grossen Symbolen.
DE60129872T2 (de) Verfahren zur Extrahierung von Titeln aus numerischen Bildern
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE3689416T2 (de) Mustermerkmalextraktion.
DE69125587T2 (de) Bildumwandlung
DE69320746T2 (de) Rasterbildverbesserung unter Verwendung eines reduzierten Schablonenspeichers
DE69521448T2 (de) Verfahren zur Bildelementkorrektur und -glättung
DE69121523T2 (de) Beseitigung von fehlerhaften Punkten in einem abgetasteten Bild
DE69133044T2 (de) Punktgrössensteuerverfahren bei digitaler Halbtonrasterung mit mehrzelligen Schwellenmatrix
DE69622961T2 (de) Verfahren und Vorrichtung zur Darstellung von Zeichen
DE69421117T2 (de) Gerät zur Bildinformationsverarbeitung und -wiedergabe
DE69706763T2 (de) Verfahren und Vorrichtung zum selektiven Bearbeiten von abgetasteten Bildvorlagen
DE2948341A1 (de) Verfahren zum verarbeiten von bildelementen und vorrichtung zum verarbeiten einer bilddatenreihe
DE3416565A1 (de) Umrasterung eines gespeicherten, digitalen halbtonbildes
DE69226574T2 (de) Verfahren und Gerät zur Reduktion des benötgten Speicherumfangs in einem digitalen Halbltonrasterungssystem
DE69111660T2 (de) Bildlesevorrichtung und Verfahren zur Verbesserung von Formumrissen.

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee