DE69026041T2

DE69026041T2 - Identifikation, Kennzeichnung und Segmentierung der halbtongerasterten oder punktierten Bereiche eines Binärbildes

Info

Publication number: DE69026041T2
Application number: DE69026041T
Authority: DE
Inventors: Dan S Bloomberg; William T Crocca
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1989-12-08
Filing date: 1990-12-07
Publication date: 1996-10-02
Anticipated expiration: 2010-12-08
Also published as: JP2880572B2; EP0431960B1; DE69026041D1; EP0431960A2; JPH03233686A; US5131049A; EP0431960A3

Description

Die Erfindung betrifft allgemein die Bildverarbeitung und insbesondere eine Technik zum Unterscheiden zwischen feinstrukturierten Bereichen und anderen Bereichen.
Es gibt verschiedene Anwendungen, wo es bedeutend ist, schnell zu bestimmen, ob ein Bild Bereiche mit Feinstruktur, wie Halbtöne und Kornraster enthält.
Beispielsweise können schwierigkeiten bei Druckern auftreten, deren Ausgang eine unterschiedliche Auflösung gegenüber der Eingabeabtastvorrichtung ist, da Techniken zum Umwandeln der Auflösung in bezug auf Strukturen empfindlich sind. Eine Technik, die bei Text gut arbeitet, tut es im allgemeinen schlecht bei Halbtönen oder Kornrastern und umgekehrt. Wenn die Halbtonbereiche erkannt worden sind und wenn die Frequenz und der Rasterwinkel bekannt sind, dann können geeignete Techniken für unterschiedliche Bereiche des Bildes ausgewählt werden, und die Halbtonbereiche können auf lösungsmäßig mit einem annehmbar niederen Anteil von Pseudoerzeugnissen umgewandelt werden.
Schwierigkeiten treten auch bei Abtastvorrichtungen auf. Wenn ein binäres Halbtonbild abgetastet wird, kann eine schwebung zwischen der Wiederholungsfrequenz in dem Bild und der Größe einer ganzen Zahl abgetasteter Bildelemente auftreten. Das Ergebnis ist ein Pseudoerzeugnis, bei dem ein Moiré-Muster niederer Frequenz in dem abgetasteten Bild beobachtet wird. Um dies zu verhindern, ist es wünschenswert, eine Grauskala-Abtastvorrichtung zu verwenden und Halbton vor der Schwellenverarbeitung zu entfernen. Techniken zum Entfernen von Halbtonmustern arbeiten am besten, wenn die Halbtonfrequenz und der Rasterwinkel bekannt sind.
Es ist manchmal notwendig, daß eine grobe Segmentierung auftritt, bevor irgendeine Segmentierungs-Software verwendet wird. Einige Aspekte der Segmentierung können ausgeführt werden, indem eine verbundene Komponentendarstellung des Binärbildes aufgebaut wird, wie eine Graphik angrenzender Linien, und dann diese Datenstruktur verarbeitet wird. Jedoch können, wenn man versuchte, eine Graphik angrenzender Linien von einem feinstrukturiertem Raster geeigneter Größe (sagen wir 2 Quadratzoll oder größer) aufzubauen, die Speicheranforderungen und die Rechenzeit leicht übermäßig sein. Ähnlich ist es bei einer Segmentierung notwendig, daß sie erfolgt, bevor eine Erkennungs-Software verwendet wird. Wenn ein Halbtonbereich eines Binärbildes zu einer OCR oder einer Vektorisierungs-Software für Graphik geschickt würde, könnte das Programm brechen.
In Abhängigkeit von der Schwelleneinstellung und der Auflösung der Eingabevorrichtungen und der Qualität des Ausgabedruckers und der Anzahl von Kopieerzeugungen kann eine gedruckte Version des Binärbildes eines gleichförmig strukturierten Bereiches wenige oder keine Einzelheiten der Strukturierung des ursprünglichen Binärbildes zeigen. Wegen der Abtast- und Druckvorgänge ist der Kontrast bei der Größe von 1-5 Zeilenpaaren pro mm häufig stark erhöht, wobei dunkle Strukturen durchgehend schwarz werden und helle Strukturen viel heller oder sogar weiß (vielleicht mit einigem zufälligen Punktuntergrund) werden. Somit kann in vielen Situationen nicht angenommen werden, daß das Auftreten der ursprünglichen Strukturierung in dem zu analysierenden Binärbild beibehalten wird.
Es ist eine Zielsetzung der vorliegenden Erfindung, eine Darstellung von Halbtonbereichen eines Binärbildes, das erzeugt werden soll, zu ermöglichen und eine effiziente und wirksame Trennung von strukturierten Bereichen in dem Bild von unstrukturierten Bereichen zu erleichtern.
Demgemäß schafft die vorliegende Erfindung ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:
Verarbeiten des ursprünglichen Bildes, um ein Keimbild zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es EIN- Bildelemente nur in den Halbtonbereichen enthält und daß es mindestens ein EIN-Bildelement in jedem Halbtonbereich enthält;
Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske zu konstruieren, wobei die Ausschneidemaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und
Verarbeiten des Keimbildes und der Ausschneidemaske so, daß der Keim wächst und der derart gewachsene Keim mit der Ausschneidemaske ausgeschnitten wird, wodurch eine Darstellung der erwünschten Trennmaske geschaffen wird.
Techniken gemäß der Erfindung, die unten beschrieben sind, verwenden Transformationen, wie schwellenmäßige Verkleinerungen und morphologische Operationen, die im einzelnen unten definiert und erörtert werden. Eine schwellenmäßige Verkleinerung beinhaltet eine rechteckförmige Mehrfachanordnung von Bildelementen auf ein einziges Bildelement abzubilden, dessen Wert von der Anzahl von EIN-Bildelementen in der rechteckförmigen Mehrfachanordnung und einem Schwellenwert abhängt. Morphologische Operationen verwenden ein Bildelementmuster, das ein strukturierendes Element genannt wird, um ein Bild abzutragen, offen zu erweitern oder zu schließen.
Eine bevorzugte Technik gemäß der Erfindung, um zu bestimmen, ob es Halbtonbereiche gibt, enthält das Unterteilen des Bildes in eine Anzahl von Unterbereichen oder Unterflächen, das Gewinnen und Zählen von Bildelementübergängen in jeder Unterfläche, das Normalisieren der Zählwerte in bezug auf die Unterfläche und das Vergleichen der Werte mit einem Schwellenwert, der Halbtonbereiche von halbtonfreien Bereichen (wie jene, die Text und Liniengraphik enthalten) unterscheidet.
Eine bevorzugte Technik gemäß der Erfindung zum Bestimmen der Rastergröße und des Winkels umfaßt vorzugsweise das Auswählen der Unterfläche, die die größte Anzahl von Bildelement-Übergängen hat und Filtern der Unterfläche, wie dadurch, daß sie mit einer Anzahl von strukturierenden Fehltreffer-Elementen abgetragen wird, die als schmale Bandpaßfilter dienen. Die strukturierenden Elemente sind jeweils durch eine lineare Abmessung und einen Winkel gekennzeichnet. Das strukturierende Element, das die meisten EIN-Bildelemente nach dem Abtragen der Unterflächen ergibt, dient dazu, die Größe und den Winkel des Rasters zu kennzeichnen.
Das Konstruieren der Trennmaske enthält vorzugsweise, ein Keimbild zu konstruieren, eine Ausschneidemaske zu konstruieren und den Keim zu füllen, während mit der Maske ausgeschnitten wird. Der Keim muß Bildelemente nur in den Halbtonbereichen enthalten und muß wenigstens ein Bildelement in jedem Halbtonbereich enthalten. Die Ausschneidemaske muß alle EIN- Bildelemente in den Halbtonbereichen überdecken. Sie kann auch halbtonfreie Bereiche überdecken, wobei aber kein Teil der Ausschneidemaske, die einen halbtonfreien Bereich überdeckt, einen Teil berühren sollte, der einen Halbtonbereich überdeckt.
Der Keim kann konstruiert werden, indem das gesamte Bild mit dem strukturierenden Element abgetragen wird, das gefunden wurde, die beste Anpassung in Verbindung mit dem Bestimmen der Größe und des Winkels des Rasters zu gegeben, wie es oben erwähnt worden ist, indem eine oder mehrere schwellenmäßige Reduktionen ausgeführt werden und eine offene Operation mit einem 3x3 oder 4x4 durchgehenden, strukturierenden Element ausgeführt wird, um Bildelemente außerhalb der Halbtonbereiche zu entfernen. Insbesondere umfaßt gemäß der Erfindung der Schritt, einen Keim zu konstruieren, die Schritte:
Bereitstellen einer Gruppe von Raumfiltern;
Auswählen des Raumfilters, das am besten zu den Halbtoneigenschaften von mindestens einem Bereich des Bildes paßt;
Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;
Unterziehen des derart gefilterten Bildes einer Operation aus einer Gruppe von Operationen, die AUS-Bildelemente entfernt, die nahe EIN-Bildelmenten sind; und
Unterziehen des sich ergebenden Bildes einer offenen Operation.
Die Ausschneidemaske kann konstruiert werden, indem die Halbtonbereiche in durchgehende EIN-Bildelemente umgewandelt werden. Dies wird vorzugsweise ausgeführt, indem das gesamte Bild einer Transformation unterzogen wird, die dazu neigt, AUS- Bildelemente auszuschließen, die sich neben oder nahe bei EIN- Bildelementen befinden derart, daß die Halbtonbereiche im wesentlichen vollständig gefüllt werden, während die halbtonfreien Bereiche (solche wie diejenigen, die Liniengraphik und Text enthalten) dunkler, aber nicht vollständig gefüllt werden. In beispielhafter Weise kann eine solche Transformation eine oder mehrere schwellenmäßige Reduktionen mit allgemeinem Dunklen (niederen Schwellenwert) umfassen, wobei möglicherweise eine Schließoperation folgt. Demgemäß umfaßt der Schritt zum Herstellen einer Ausschneidemaske wenigstens eine schwellenmäßige Reduktion, um strukturierte Bereiche zu verdichten.
Das Anfüllen des Keimes, während mit der Maske ausgeschnitten wird, kann durch ein schrittweises Verfahren ausgeführt werden, bei dem der Keim (oder dessen vorliegende Iteration) mit einem 3x3 durchgehenden, strukturierenden Element ausgedehnt und mit der Ausschneidemaske einer UND-Operation ausgesetzt wird, bis sich das Ergebnis nicht ändert.
Die vorliegende Erfindung schafft demgemäß ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:
Verarbeiten des ursprünglichen Bildes, um ein Keimbild zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es Bildelemente nur in den Halbtonbereichen enthält, und daß es mindestens ein Bildelement in jedem Halbtonbereich enthält;
Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske zu bilden, wobei die Ausschneidemaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und
Verarbeiten des Keimbildes und der Ausschneidemaske, so daß der Keim wächst und von der Ausschneidemaske ausgeschnitten wird;
wodurch der derart gewachsene und ausgeschnittene Keim eine Darstellung der Trennmaske liefert. Der Schritt, einen Keim zu konstruieren, kann die Schritte umfassen:
Bereitstellen einer Gruppe von Raumfiltern;
Auswählen des Raumfilters, das den Halbtoneigenschaften am besten angepaßt ist;
Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;
Unterziehen des derart gefilterten Bildes mindestens einer schwellenmäßigen Reduktion; und
Unterziehen des sich ergebenden Bildes einer Öffnungsoperation.
Nur in beispielhafter Weise werden nun Ausführungsformen der vorliegenden Erfindung unter Bezugnahme auf die beigefügten zeichnungen beschrieben, in denen:
Fig. 1A ein Blockdiagramm eines Bildabtast- und Verarbeitungssystems ist;
Fig. 1B ein Flußdiagramm eines hohen Niveaus ist, das das Verfahren zum Identifizieren, Kennzeichnen und Trennen von feinstrukturierten Bereichen in einem Bild zeigt;
Figuren 2A - B Flußdiagramme sind, die die Schritte zum Bestimmen darstellen, ob Halbtöne vorhanden sind;
Fig. 3 ein Flußdiagramm ist, das die Kennzeichnung der Größe und des Winkels des Halbtonrasters darstellt;
Figuren 4A - D, 5A - C, 6A - D, 7A - B und 8A - D strukturierte Fehltreffer-Elemente zeigen, die als schmale Bandpaßfilter verwendet werden, um die Halbtoneigenschaften zu bestimmen;
Figuren 9A - D Flußdiagramme sind, die die Erzeugung einer Trennmaske aus einem Keim und einer Ausschneidemaske darstellen;
Fig. 10 ein Flußdiagramm ist, das die Verwendung der Maske darstellt, um die Trennung von strukturierten und unstrukturierten Bereichen zu erhalten;
Fig. 11 ein Flußdiagramm ist, das eine Alternative darstellt, um die Maske auszudehnen;
Fig. 12 ein Flußdiagramm ist, das eine alternative Art darstellt, den Keim zu erzeugen;
Figuren 13A - B Flußdiagramme sind, die Alternativen zu den schwellenmäßigen Reduktionen darstellen, die verwendet werden, den Keim und die Ausschneidemaske zu erzeugen;
Fig. 14 ein repräsentatives Binärbild zeigt;
Fig. 15A eine graphische Darstellung der Filterreaktion auf eine Gruppe von Raumfiltern ist;
Figuren 15B - D die Ergebnisse bei unterschiedlichen Stufen des Erzeugens des Keimes zeigen;
Figuren 16A - B die Ergebnisse bei unterschiedlichen Stufen des Erzeugens der Ausschneidemaske zeigen;
Figuren 17A - B die Ergebnisse zeigen, den Keim und die Ausschneidemaske zu kombinieren, um eine Halbtonmaske zu schaffen;
Figuren 18A - B die Halbtontrennung und die Texttrennung zeigen; und
Fig. 19 ein Blockdiagramm von Hardware für einen speziellen Zweck zum Ausführen von Bildverkleinerungen und Bildvergrößerungen ist.

DEFINITIONEN UND TERMINOLOGIE

Die vorliegende Erörterung betrifft Binärbilder. In diesem Zusammenhang bezieht sich der Ausdruck "Bild" auf eine Darstellung einer zweidimensionalen Datenstruktur, die aus Bildelementen zusammengesetzt ist. Ein Binärbild ist ein Bild, in dem ein gegebenes Bildelement entweder "EIN" oder "AUS" ist. Binärbilder werden entsprechend einer Anzahl von Operationen verarbeitet, wobei ein oder mehrere Quellenbilder auf ein Zielbild abgebildet werden. Die Ergebnisse solcher Operationen werden im allgemeinen als Bilder bezeichnet. Das Bild, das der Ausgangspunkt zur Verarbeitung ist, wird manchmal als das ursprüngliche Bild bezeichnet.
Bildelemente sind definiert, als daß sie EIN sind, wenn sie schwarz sind, und AUS sind, wenn sie weiß sind. Man beachte, daß die Bezeichnung schwarz als EIN und weiß als AUS die Tatsache wiedergibt, daß die meisten interessierenden Vorlagen einen schwarzen Vordergrund und einen weißen Hintergrund aufweisen. Während die zu beschreibenden Techniken ebenso auf negative Bilder angewendet werden könnten, erfolgt die Erörterung in Größen von schwarz auf weiß.
Ein "durchgehender Bereich" eines Bildes bezeichnet einen Bereich, in dem sich viele Bildelemente in beiden Dimensionen erstrecken, innerhalb dessen im wesentlichen alle Bildelemente EIN sind.
Ein "strukturierter Bereich" eines Bildes bezeichnet einen Bereich, der ein relativ feinkörniges Muster enthält. Beispiele von strukturierten Bereichen sind halbgetönte oder korngerasterte Bereiche.
"Text" bezeichnet Bereiche einer Vorlage oder eines Bildes, die Buchstaben, Zahlen oder andere Symbole einschließlich nichtalphabetischer, linguistischer Zeichen enthalten.
"Liniengraphik" bezeichnet Bereiche einer Vorlage oder eines Bildes, die aus von Text unterschiedenen Graphiken, Figuren oder Zeichnungen gebildet sind, die allgemein aus horizontalen, vertikalen und schrägen Linien aufgebaut sind, die eine wesentliche Verlaufsstrecke verglichen mit Text haben. Graphiken können von beispielsweise horizontalen und vertikalen Linien in einem Organisationsplan bis zu komplizierteren horizontalen, vertikalen und schrägen Linien in technischen Zeichnungen reichen.
Eine "Maske" bezeichnet ein normalerweise von einem ursprünglichen Bild abgeleitetes Bild, das im wesentlichen durchgehende Bereiche aus EIN-Bildelementen enthält, die interessierenden Bereichen in dem ursprünglichen Bild entsprechen. Die Maske kann auch Bereiche mit EIN-Bildelementen enthalten, die keinem interessierenden Bereichen entsprechen.
UND, ODER und EXKLUSIV ODER sind logische Operationen, die zwischen zwei Bildern auf einer Bildelement-zu-Bildelement- Basis durchgeführt werden.
NICHT ist eine logische Operation, die an einem einzelnen Bild auf einer Bildelement-zu-Bildelement-Basis durchgeführt wird.
"Ausdehnung" ist eine Skalierungsoperation, die durch einen Skalierungsfaktor N gekennzeichnet ist, bei der jedes Bildelement in einem Quellenbild ein NxN Quadrat aus Bildelementen wird, die alle den gleichen Wert wie das ursprüngliche Bildelement haben.
"Verkleinerung" ist eine Skalierungsoperation, die durch einen Skalierungsfaktor N und einen Schwellenwert M gekennzeichnet ist. Eine Verkleinerung mit der Skalierung = N führt zum Unterteilen des Quellenbildes in NxN Quadrate von Bildelementen, wobei jedes solches Quadrat in dem Quellenbild auf ein einziges Bildelement in dem Zielbild abgebildet wird. Der Wert des Bildelementes in dem Zielbild wird durch den Schwellenwert M bestimmt, der eine Zahl zwischen 1 und N ist. Wenn die Anzahl der EIN-Bildelemente in dem Quadrat aus Bildelementen größer oder gleich M ist, ist das Zielbildelement EIN, sonst ist es AUS.
"Unterabtasten" ist eine Operation, bei der das Quellenbild in kleinere (typischerweise quadratische) Elemente unterteilt wird, und jedes Element in dem Quellenbild wird auf ein kleineres Element in dem Zielbild abgebildet. Die Bildelementwerte von jedem Zielbildelement werden durch eine ausgewählte Untergruppe von Bildelementen in dem Quellenbildelement definiert. Typischerweise führt Unterabtasten dazu, an einzelne Bildelemente anzupassen, wobei der Zielbildelementwert der gleiche wie ein ausgewähltes Bildelement von dem Quellenbildelement ist. Die Auswahl kann vorbestimmt (beispielsweise oberes, linkes Bildelement) oder zufällig sein.
Ein "4-Verbindungsbereich" ist eine Gruppe von EIN-Bildelementen, wobei jedes Bildelement in der Gruppe seitlich oder vertikal wenigstens einem anderen Bildelement in der Gruppe benachbart ist.
EIN "8-Verbindungsbereich" ist eine Gruppe von EIN-Bildelementen, wobei jedes Bildelement in der Gruppe seitlich, vertikal oder diagonal mindestens einem anderen Bildelement in der Gruppe benachbart ist.
Eine Anzahl von morphologischen Operationen bilden ein Quellenbild auf ein gleichgroßes Zielbild gemäß einer Regel ab, die durch ein Bildelementmuster definiert ist, das ein strukturierendes Element genannt wird. Das strukturierende Element ist durch einen Mittelort und eine Anzahl von Bildelementorten definiert, von denen jeder einen definierten Wert (EIN oder AUS) aufweist. Andere Bildelementpositionen, die als "gleichgültig" bezeichnet werden, werden unberücksichtigt gelassen. Die Bildelemente, die das strukturierende Element definieren, müssen nicht zueinander benachbart sein. Der Mittelort muß nicht in der geometrischen Mitte des Musters sein; tatsächlich muß er sogar nicht innerhalb des Musters sein.
Ein "durchgehendes", strukturierendes Element bezeichnet ein strukturierendes Element, das einen Umfang aufweist, innerhalb dessen alle Bildelemente EIN sind. Beispielsweise ist ein durchgehendes 2x2 strukturierendes Element ein 2x2 Quadrat aus EIN-Bildelementen. Ein durchgehendes, strukturierendes Element muß nicht rechteckig sein.
Ein strukturierendes "Treffer-Fehler"-Element bezeichnet ein strukturierendes Element, das mindestens ein EIN-Bildelement und mindestens ein AUS-Bildelement angibt.
"Abtragen" ist eine morphologische Operation, bei der ein bestimmtes Bildelement in dem Zielbild EIN geschaltet wird, wenn und nur wenn das Ergebnis der überlagerung der Mitte des strukturierenden Elementes auf dem entsprechenden Bildelementort in dem Quellenbild eine Anpassung zwischen allen EIN- und AUS-Bildelementen in dem strukturierenden Element und den darunterliegenden Bildelementen in dem Quellenbild ergibt.
"Ausdehnung" ist eine morphologische Operation, bei der ein bestimmtes Bildelement in dem Quellenbild, das EIN ist, bewirkt, daß das strukturierende Element in das Zielbild mit der Mitte des strukturierenden Elementes an dem entsprechenden Ort in dem Zielbild geschrieben wird. Die strukturierenden Elemente, die für eine Ausdehnung verwendet werden, weisen typischerweise keine AUS-Bildelemente auf.
"Öffnen" ist eine morphologische Operation, die aus einem Abtragen besteht, dem eine Ausdehnung folgt. Das Ergebnis ist, das strukturierende Element in dem Zielbild für jedes Passen in dem Quellenbild zu reproduzieren
"Schließen" ist eine morphologische Operation, die aus einer Ausdehnung besteht, der ein Abtragen folgt.
Die verschiedenen Operationen, die oben definiert worden sind, werden manchmal in der Form eines Substantivs, eines Adjektivs und eines Verbs bezeichnet. Beispielsweise kann Ausdehnung (Substantivform) mit dem Ausdruck des Ausdehnens des Bildes oder das Bild, das ausgedehnt worden ist (Verbform) oder das Bild, das einer ausdehnenden Operation (Adjektivform) ausgesetzt worden ist, bezeichnet werden. Es ist kein Unterschied in der Bedeutung beabsichtigt.

Systemüberblick

Fig. 1 ist ein Blockdiagramm eines Bildanalysesystems 1. Die Grundoperation des Systems 1 ist, gewisse kennzeichnende Bereiche einer Vorlage 2 zu gewinnen oder auszuschließen. Hierfür enthält das System eine Abtastvorrichtung 3, die die Vorlage auf der Basis von Bildelementen digitalisiert und eine sich ergebende Datenstruktur liefert, die typischerweise als ein Bild bezeichnet wird. In Abhängigkeit von der Anwendung kann die Abtastvorrichtung ein binäres Bild (ein einziges Bit pro Bildelement) oder ein Grauskalabild (eine Vielzahl von Bit pro Bildelement) schaffen. Das Bild enthält den groben Inhalt der Vorlage gemäß der Genauigkeit der Auflösung der Abtastvorrichtung. Das Bild kann zu einem Speicher 4 geschickt oder als eine Datei in einer Dateispeichereinheit 5 gespeichert werden, die eine Platte oder eine andere Massenspeichereinrichtung sein kann.
Ein Prozessor 6 steuert den Datenfluß und führt die Bildverarbeitung aus. Der Prozessor 6 kann ein Universalzweck-Cornputer, ein Computer für einen speziellen Zweck, der für Bildverarbeitungsoperationen optimiert worden ist, oder eine Kombination aus einem Universalzweck-Computer und einer zusätzlichen Hardware für einen bestimmten Zweck sein. Wenn eine Dateispeichereinheit verwendet wird, wird das Bild vor dem Verarbeiten zu einem Speicher 4 übertragen. Der Speicher 4 kann auch verwendet werden, um Zwischendatenstrukturen und möglicherweise eine endgültig verarbeitete Datenstruktur zu speichern.
Das Ergebnis des Bildverarbeitens kann ein abgeleitetes Bild, numerische Daten "wie Koordinaten der hervorstehenden Merkmale des Bildes) oder eine Kombination davon sein. Diese Informationen können zu bestimmter Anwendungs-Hardware 8 übertragen werden, die ein Drucker oder eine Anzeigeeinrichtung sein kann, oder sie können erneut in die Dateispeichereinheit 5 geschrieben werden.

Überblick über die Trennung von Halbtonbereichen

Ein ursprüngliches Binärbild kann Bereiche mit feiner Strukturierung, wie Kornrasterung oder Halbton enthalten. Solche Bereiche werden als Halbtonbereiche bezeichnet. Das Bild kann auch durchgehende, weiße Bereiche, durchgehende, schwarze Bereiche und Bereiche aus Text und Liniengraphik enthalten. Solche Bereiche werden manchmal als halbtonfreie Bereiche oder andere Bereiche bezeichnet.
Fig. 1B ist ein Flußdiagramm auf hohem Niveau, das die Hauptschritte bei einem Verfahren zum Identifizieren, Kennzeichnen und Trennen von Halbtonbereichen oder komgerasterten Bereichen in einem ursprünglichen Binärbild zeigt. Kurz gesagt führt die Technik dazu, das ursprüngliche Binärbild einer Reihe von logischen, skalierenden und morphologischen Operation zu unterziehen. Das ursprüngliche Binärbild wird zuerst verarbeitet, um zu bestimmen, ob es Halbtonbereiche (Schritt 10) gibt oder nicht, und die Operation wird beendet, wenn keine vorhanden sind. Unter der Annahme, daß es welche gibt, wird das Bild einem Filterverfahren ausgesetzt, um die kennzeichnende Größe und den Winkel des Halbtonrasters (Schritt 12) zu bestimmen. Das Bild wird dann verarbeitet, um eine Trennmaske zu schaffen, die die Halbtonbereiche und keine anderen Bereiche überdeckt (Schritt 15). Die Maske und das ursprüngliche Binärbild werden dann kombiniert, um die Trennungen der Halbtonbereiche und der halbtonfreien Bereiche zu erzielen, und Koordinaten der Halbtonbereiche werden identifiziert (Schritt 20).

Detaillierte Erörterung einer Ausführungsform der Erfindung

Fig. 2A ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 10 darstellt (bestimmen, ob es Halbtonbereiche gibt). Das Bild wird zuerst in eine Anzahl von Unterbereichen oder Unterflächen (Schritt 22) unterteilt. Jede Unterfläche muß viele Bildelemente enthalten und sollte in der Größenordnung des kleinsten, erwarteten Halbtonbereiches sein. Insbesondere kann das Bild in Unterflächen von jeweils einer Größe von ungefähr 100x100 Bildelemente bis 250x250 Bildelemente unterteilt werden. Für jede Unterfläche wird eine Zahl erzeugt, die die Anzahl von Bildelementübergänge in dieser Unterfläche (Schritt 25) angibt, und die Unterfläche mit der maximalen Anzahl von Bildelementübergängen wird ausgewählt (Schritt 27).
Eine ausgezeichnete Art, um zwischen Halbtonbereichen und halbtonfreien Bereichen zu unterscheiden, ist die Anzahl der Übergangsbildelemente innerhalb eines Bereiches zu zählen und die Anzahl durch die Fläche des Bereiches zu dividieren. Das Normalisieren auf die Fläche des Bereiches berücksichtigt zwei Faktoren, die halbtonfrei von Halbtonbereichen unterscheiden: Strukturgröße für Bildelementübergänge und Füllgrad des strukturierten Musters. Bei beiden Zählungen geben Halbtonbereiche Ergebnisse, die beträchtlich größer als bei halbtonfreien Bereichen sind, selbst bei jenen, die Text enthalten, so daß typischerweise eine leichte Bestimmung möglich ist. Ein bevorzugtes Unterscheidungsmaß ist, die Anzahl von horizontalen Bildelementübergängen (EIN-AUS oder AUS-EIN entlang der Abtastzeile) zu verwenden, und das Verhältnis solcher Bildelementübergänge zu der Anzahl von Wörtern von 16 Bit in der Unterfläche zu nehmen. Ein Textbereich hat typischerweise für dieses Verhältnis einen Wert von weniger als 2,0 und ein Halbtonbereich ist typischerweise größer als 2,5.
Demgemäß wird, sobald die Unterfläche mit der maximalen Anzahl ausgewählt worden ist, diese Zahl normalisiert, und eine Bestimmung wird vorgenommen, ob die normalisierte Bildelementübergangszahl eine Schwelle (Schritt 30) überschreitet. Wenn es nicht so ist, wird angenommen, daß es keine Halbtonbereiche gibt, und die Verarbeitung hält an. Wenn die Unterfläche mit der maximalen Anzahl von Bildelementübergängen die Schwelle überschreitet, wird angenommen, daß es Halbtonbereiche gibt und das Verarbeiten wird fortgesetzt.
Fig. 2B ist ein Flußdiagramm, das eine bestimmte Technik zum Ausführen des Zählens von horizontalen Bildelementübergängen (Schritt 25) darstellt. Die Operationen in Fig. 2B werden für jede Unterfläche ausgeführt, die sich von dem Schritt 22 ergibt. Die Unterfläche wird kopiert (Schritt 35) und eine Kopie wird bewahrt. Die andere Kopie wird (Schritt 40) mit einem 1x3 horizontalen, strukturierenden Element 37 abgetragen, das seine Mitte an der Mittenposition aufweist, und das Ergebnis wird einer EXKLUSIV ODER-Operation mit der bewahrten Kopie unterzogen (Schritt 42). Diese Operationen haben die Wirkung, Bildelementübergänge auf Randbildelemente abzubilden, d.h. Bildelemente, die einem Bildelement der entgegengesetzten Farbe benachbart sind. Diese Technik kann etwas zuwenig die Bildelementübergänge zählen, aber das ist kein wesentliches Problem. Alternativ könnten die vertikalen Übergänge gezählt werden, indem ein 3x1 vertikales, strukturierendes Element verwendet wird und alle Randbildelemente könnten gezählt werden, wobei ein 3x3 durchgehendes, strukturierendes Element verwendet wird.
Während die obige Beschreibung in Größen des Unterteilens des Bildes und dann des Verarbeitens jeder Unterfläche ausgeführt worden ist, könnten die Schritte der Fig. 2B an dem gesamten Bild ausgeführt werden und das Ergebnis des EXKLUSIV ODER- Schrittes 42 könnte unterteilt werden, und die Bildelemente könnten in jeder Unterfläche gezählt werden.
Fig. 3 ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 12 (Bestimmen der Größe und des Winkels des Rasters) darstellt. Das Bestimmen der Rastereigenschaften verlangt eine Gruppe von Raumfiltern, die auf eine Halbtonperiodizität empfindlich sind. Diese Filter, die im einzelnen unten beschrieben werden, sind strukturierende Fehler-Treffer- Elemente, von denen jedes ein Muster von EIN- und AUS-Bildelementen festlegt, das durch Abtragen auf das Bild angepaßt wird. Eine Gruppe von N solchen Filtern, die den Frequenz-Winkel-Raum der erwarteten, gedruckten Halbtöne überdecken, werden ausgewählt (Schritt 50), und die Unterfläche, die die meisten Bildelementübergänge aufweist, wie sie beim Schritt 27 bestimmt worden sind, wird N-mal (Schritt 52) kopiert. Jede Kopie wird mit einem entsprechenden Filter (Schritte 55(1) .... 55(N)) abgetragen. Die Anzahl von EIN-Bildelementen, die nach dem Abtragen übrigbleibt, wird für jedes Filter (Schritte 57(1) .... 57(N)) gezählt. Das Filter, das die maximale Anzahl von EIN-Bildelementen ergibt, wird ausgewählt (Schritt 60) und liefert die Rastereigenschaften. Als eine weitere Prüfung für das tatsächliche Vorhandensein von Halbtönen kann die maximale Anzahl mit einer Schwelle verglichen werden, und das Verarbeiten wird angehalten, wenn sie die Schwelle nicht überschreitet (Schritt 62).
Die Figuren 4A - D, SA - C, 6A - D, 7A - B und 8A - D zeigen die strukturierenden Fehler-Teffer-Elemente, die als schmale Bandpaßfilter verwendet werden, um die Halbtoneigenschaften zu bestimmen. Jedes Filter besteht aus fünf EIN-Bildelernenten (Treffer) und vier AUS-Bildelementen (Fehler) in einem kreuzförmigen Muster, wobei die EIN-Bildelemente in der Mitte und an den Ecken eines Quadrats sind und die AUS-Bildelemente ungefähr in der Mitte zwischen der Mitte und den Ecken sind. Es hat sich empirisch herausgestellt, daß diese Filter eine Raumperiodenbandbreite von ungefähr 0,1-mal der Periode des sich wiederholenden Musters und eine Winkelbandbreite von ungefähr 15º haben.
Fig. 9A ist ein Flußdiagramm, das die Schritte innerhalb des Schrittes 15 (erzeugen der Trennmaske) darstellt. Das Bild wird kopiert (Schritt 65), wobei eine Kopie verwendet wird, einen Halbtonkeim zu erzeugen (Schritt 67) und das andere verwendet wird, eine Ausschneidemaske zu erzeugen (Schritt 70). Der Halbtonkeim muß Bildelemente nur in den Halbtonbereichen enthalten und muß mindestens ein Bildelement in jedem Halbtonbereich enthalten. Die Ausschneidemaske muß dicht alle EIN- Bildelemente in den Halbtonbereichen überdecken. Während sie auch halbtonfreie Bereiche überdecken kann, sollte kein Teil der Ausschneidemaske, die einen halbtonfreien Bereich überdeckt, einen Teil der Ausschneidemaske berühren, die einen Halbtonbereich überdeckt.
Der Keim und die Ausschneidemaske werden dann einer Reihe von Operationen unterzogen, die bewirken, daß der Keim in die Ausschneidemaske wächst (Schritt 72). Wie es unten erörtert wird, werden der Keim und die Ausschneidemaske in einem verringerten Maßstab erzeugt. Demgemäß wird, wenn es erwünscht ist, eine direkte Verwendung der Maske vorzunehmen, das Bild, das sich beim Schritt 72 ergibt, zu seinem ursprünglichen Maßstab ausgedehnt (Schritt 75).
Fig. 9B ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 67 darstellt (Erzeugen des Halbtonkeimes). Das Bild wird zuerst mit dem besten Filter, der beim Schritt 60 ausgewählt worden ist, abgetragen (Schritt 80), und das Ergebnis wird zweimal mit dem Skalierungsfaktor = 2 und dem Wert = 1 verkleinert (Schritte 82 und 83). Bereiche von Text und Liniengraphik sind, soweit sie das Filtern überlebten, an dieser Stelle fleckförmig, haben im allgemeinen aber eine kleine Raumausdehnung. Das Bild wird dann einer Öffnungs- Operation mit einem 3x3 durchgehenden, strukturierenden Element unterzogen (Schritt 85), das irgendwelche überlebenden Bildelemente von den halbtonfreien Bereichen entfernt. Das Ergebnis ist ein Keim, der aus EIN-Bildelementen nur in Bereichen besteht, die den Halbtonbereichen in dem ursprünglichen Bild entsprechen.
Fig. 9C ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 70 darstellt (Erzeugen der Ausschneidemaske). Das ursprüngliche Bild wird einer Gruppe von Operationen unterzogen, die AUS-Bildelemente ausschließen, die nahe EIN-Bildelementen sind. Während Text und Linien verstärkt werden, neigen sie dazu, ihren allgemeinen Charakter beizubehalten. Jedoch laufen sie zusammen, wenn sich kleine Punkte in den strukturierten Bereichen ausdehnen, um große Massen zu bilden und dadurch die vorhergehend strukturierte Fläche verdichten.
Insbesondere wird das ursprüngliche Bild zweimal mit dem Skalierungsfaktor = 2 und Wert 1 verkleinert (Schritte 90 und 92), was dazu neigt, die Halbtonbereiche durchgehend zu machen. Das Ergebnis wird dann wahlweise einer Schließoperation mit einem 2x2 durchgehenden, strukturierenden Element unterzogen (Schritt 95). Das Ergebnis ist eine Ausschneidemaske, die alle Halbtonbereiche (und möglicherweise auch andere Bereiche) überdeckt.
Fig. 9D ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 72 darstellt (wachsender Keim und Ausschneiden, zu maskieren). Der Keim wird bei der ersten Iteration und danach ein iteriertes Bild kopiert (Schritt 100) und eine Kopie wird zur weiteren Verwendung aufgehoben. Die andere Kopie wird mit einem 3x3 durchgehenden, strukturierenden Element ausgedehnt (Schritt 102), und das Ergebnis wird einer UND-Operation mit der Ausschneidemaske unterzogen (Schritt 105). Die Ausdehnung neigt dazu, den Keim zu füllen, während die UND-Operation sicherstellt, daß der Keim nicht über die Ausschneidemaske hinauswächst. Das Ergebnis der UND-Operation wird einer EXKLUSIV ODER-Operation mit der aufbewahrten Kopie unterzogen, um zu bestimmen, ob es sich seit der letzten Iteration geändert hat (Schritt 107). Dies wird mit einer EXKLU- SIV ODER-Operation gemacht, wobei ein Ergebnis von EXKLUSIV ODER = 0 (keine EIN-Bildelemente) einschließt, daß keine Änderung seit der letzten Iteration aufgetreten ist und der Keim die Maske gefüllt hat.
Wenn sich die Bilder unterscheiden, kann der gegenwärtige, teilweise gefüllte Keim beim Schritt 100 kopiert und die Folge fortgesetzt werden, bis die EXKLUSIV ODER-Operation keine EIN- Bildelemente übrig läßt. Alternativ mag es wünschenswert sein, das Verfahren nach irgendeiner Anzahl von Iterationen anzuhalten, sagen wir nach fünf, selbst wenn das Bild nicht aufgehört hat, sich zu ändern. Dies könnte der Fall sein, wo die Füllaktivität ein Leck in einen halbtonfreien Bereich der Ausschneidemaske darstellt, die unbeabsichtigt einen Halbtonbereich berührt
Fig. 10 ist ein gedehntes Flußdiagramm, das die Schritte innerhalb des Schrittes 20 (Bildtrennung) darstellt. Mit der derart erzeugten Maske wird die Segmentierung ohne weiteres ausgeführt. Das ursprüngliche Binärbild wird (Schritt 130) kopiert und mit der Maske (Schritt 135) einer UND-Operation unterzogen, um die "Halbtontrennung" (d.h. den strukturierten Teil des Bildes) zu erzeugen. Dies wird kopiert (Schritt 137), und das Ergebnis wird einer EXKLUSIV ODER-Operation (Schritt 140) mit einer Kopie des ursprünglichen Binärbildes unterzogen, um den unstrukturierten Teil des Bildes (Text und Liniengraphik) zu erzeugen. Man beachte, daß die Kopierschritte nicht notwendig sind, wenn das Ergebnis der logischen Operation bei irgendeiner gegebenen Stufe in einem neuen Feld in dem Speicher gespeichert wird, statt daß der Operand überschrieben wird.

Diskussion der beispielhaften Alternativen

Fig. 11 ist ein Flußdiagramm, das eine Alternative zu der Ausdehnung der durchgehenden Bereiche darstellt, um die Maske zu bilden. Statt die durchgehenden Bereiche auszudehnen, um eine Maske zu bilden, ist es möglich, die Koordinaten der durchgehenden Bereiche (Schritt 160) zu gewinnen und die Koordinaten auf die volle Größe (Schritt 161) maßstabsmäßig umzuwandeln. Dies liefert eine kompakte Darstellung, die ein bequemes Speichern der Maskeninformationen erlaubt.
Die Orte der Ecken von jedem durchgehenden, rechteckförmigen Bereich können gewonnen werden, indem Kopien der Maske mit einer Reihe von vier, strukturierenden Elementen 162 (ULC), 162 (URC), 162 (LLC) und 162 (LRC) abgetragen wird. Das strukturierende Element 162 (ULC) nimmt die obere, linke Ecke auf, wenn es verwendet wird, ein Rechteck abzutragen. Die anderen strukturierenden Elemente nehmen die anderen Ecken auf.
Bei rechteckförmigen Bereichen ist es zweckmäßig, jedoch nicht notwendig, die Eckenkoordinaten in einer bekannten Reihenfolge zu gewinnen; die Koordinaten allein legen die Zuordnung der Ecken zu rechteckförmigen Bereichen fest. Jedoch müssen bei nichtrechteckförmigen Bereichen, wo es mehr als vier Ecken für jeden verbundenen Bereich der Maske (und es kann Löcher geben) gibt, die Ecken in der Reihenfolge beibehalten werden, in der sie beim Verfolgen um den Umfang herun angetroffen werden. Obgleich möglich, mag dies ausreichend kompliziert sein, so daß bevorzugt wird, die Maske selbst zu verwenden.
Fig. 12 ist ein Flußdiagramm, das eine Alternative zu den Techniken der Fig. 9B zum Erzeugen des Halbtonkeimes darstellt. Das ursprüngliche Binärbild wird zweimal mit dem Skalierungsfaktor = 2 und Wert = 1 (Schritte 170 und 172) verkleinert. Das Ergebnis wird einer wahlweisen Schließoperation (Schritt 175) mit einem durchgehenden 2x2 strukturierenden Element unterzogen. Das Ergebnis wird dann zweimal mit dem Skalierungsfaktor = 2 und Wert = 4 (Schritte 177 und 178) verkleinert. Die Ergebnisse werden dann einer Öffnungsoperation mit einem durchgehenden 3x3 strukturierenden Element unterzogen. Man beachte, daß der durch diese Folge von Operationen erzeugte Keim um einen Faktor von 16 verringert wird. Demgemäß muß der Keim um einen Faktor 4 gedehnt werden, um zu dem Maßstab der Ausschneidemaske zu passen, oder die Ausschneidemaske muß um einen Faktor 4 verkleinert werden.
Fig. 13A ist ein gedehntes Flußdiagramm, das eine Alternative zu den schwellenwertmäßigen Verkleinerungen mit Wert = 1 darstellt, die verwendet wird, um den Keim und die Ausschneidemaske zu erzeugen. Genauer gesagt wird das Bild mit einem durchgehenden 2x2 strukturierenden Element (Schritt 190) erweitert und das sich ergebende Bild wird unterabgetastet, indem ein Bildelement in jedem 2x2 Quadrat gewählt wird, um ein verkleinertes Bild zu bilden (Schritt 192). Das Unterabtasten kann auf einer Zeilenbasis ausgeführt werden, indem jede zweite Linie entfernt wird, oder auf der Spaltenbasis, indem eine Nachsehtabelle in einer Weise verwendet wird, die ähnlich derjenigen ist, die unten in Verbindung mit dem Durchführen von schnellen, schwellenmäßigen Reduktionen beschrieben wird.
Fig. 13B ist ein gedehntes Flußdiagramm, das eine Alternative zu den schwellenmäßigen Reduktionen mit dem Wert = 4 darstellt, die verwendet wird, um den Keim zu erzeugen. Genauer gesagt, wird das Bild mit einem durchgehenden 2x2 struktunerenden Element (Schritt 195) abgetragen, und das sich ergebende Bild wird unterabgetastet, indem ein Bildelement in jedem 2x2 Quadrat gewählt wird, um ein reduziertes Bild zu bilden (Schritt 197).
Grundsätzlich könnte man auch eine Reihe von Schließoperationen bei dem Versuch verwenden, um einen fein strukturierten Bereich zu verdichten. Jedoch weist die Verwendung von einer oder mehreren schwellenmäßigen Reduktionen (oder Unterabtastungen) wenigstens zwei Vorteile auf. Erstens, da der Strukturmaßstab nicht von vornherein bekannt ist, kann nicht bestimmt werden, wie groß ein strukturierendes Element ist, das bei einem Schließvorgang zu verwenden ist. Ein strukturierendes Element, das zu klein ist, um benachbarte Teile in dem strukturierten Bereich zu überbrücken, würde das Bild nicht ändern, und die Schließoperation würde versagen. Während somit die Verwendung des Schließens örtlich alles oder nichts wäre, ergibt die Verwendung eine Reduktion mit dem Wert = 1 (oder eine Ausweitung und Unterabtastung) unverändert Ergebnisse beim Dunkeln der Struktur. Zweitens, die Verwendung von Reduktionen vor dem Schließen ermöglicht, daß die Operation bei einem reduzierten Maßstab ausgeführt wird. Vergleichbare Operationen bei vollem Maßstab sind computermäßig viel langsamer als jene bei einem reduzierten Maßstab (grob gesagt um die dritte Potenz des linearen Skalierungsfaktors). Deshalb sind alle nachfolgenden Operationen bei reduziertem Maßstab viel schneller.
Eine bestimmte Größe für das strukturierende Element wird auf empirische Grundlage ausgewählt, wobei solche Faktoren wie die Auflösung der Abtastvorrichtung in Betracht gezogen werden. Jedoch neigt die Entscheidung dazu, daß sie ziemlich unmittelbar ist, was eine minimale Größe an Versuchen mit sich bringt.
Obgleich die schwellenmäßigen Reduktionen als vorteilhaft zum Erzeugen der Ausschneidemaske betrachtet werden, kann das gleiche Ergebnis ebenso erreicht werden, indem eine Erweiterung mit einem durchgehenden 8x8 strukturierenden Element vorgenommen wird, dem eine 8x8 Unterabtastung folgt. Jedoch braucht die Berechnung wahrscheinlich viel länger.

Graphische Darstellung

Fig. 14 zeigt ein repräsentatives Binärbild, das mit 300 Bildelementen/Zoll (2,54 cm) abgetastet worden ist, das Text- und Halbtonbereiche aufweist. Gewisse andere Ansichten der Bilder bei Zwischenstufen der Verarbeitung werden in bezug auf Fig. 14 zweimal vergrößert. Bezugnahmen auf die Vergrößerung bei der folgenden Erörterung betreffen die Fig. 14 und sollen nicht mit den Ausdehnungs- und Reduktionsskalierungsoperationen verwechselt werden.
Fig. 15A ist eine Auftragung der Filterreaktion (Anzahl von EIN-Bildelementen), die sich aus den Angriffsschritten 55(1) .... 55(N) und den Zählschritten 57(1) .... 57(N) ergeben, die in Fig. 3 dargestellt sind. Wie man aus der Auftragung der Fig. 15A sehen kann, hat die Filternummer 15 die größte Reaktion. Dieses Filter entspricht tatsächlich dem Filter der Fig. 8A, das eine Raumperiode von acht Bildelementen und einen Winkel von 0º hat.
Fig. 15B zeigt das Ergebnis (bei 2x Vergrößerung) der Abtragung des ursprünglichen Bildes mit dem Filter, das die maximale Reaktion liefert. Die Figuren 15C und 15D zeigen die Ergebnisse (auch bei 2x Vergrößerung) der zwei nachfolgenden Verkleinerungen mit dem Skalierungsfaktor = 2 und Wert = 1. Das Ergebnis ist der Keim.
Die Figuren 16A - B zeigen die Ergebnisse (bei 2x Vergrößerung) der zwei Verkleinerungen mit dem Skalierungsfaktor = 2 und Wert = 1, die an dem Originalbild ausgeführt worden sind. Wie man sehen kann, besteht die Wirkung der Reduktionen darin, kleine Strukturelemente innerhalb des Halbtonbereiches hervorzurufen, um zu vereinigen und zu verdichten, und zu bewirken, daß der Text dicker gemacht wird. Das Ergebnis ist die Ausschneidemaske.
Fig. 17A zeigt das Ergebnis (bei 2x Vergrößerung) des Füllens des Keimes zu der Ausschneidemaske. Fig. 17B zeigt die Maske, die zu voller Größe ausgedehnt ist, d.h. mit einem linearen Faktor von vier, der den zwei Verkleinerungen mit jeweils dem Skalierungsfaktor = 2 entspricht. Diese Ansicht ist mit dem gleichen Maßstab wie das ursprüngliche Bild gezeigt.
Figuren 18A und 18B zeigen die Halbton- und Texttrennung. Die Halbtontrennung der Fig. 18A ergibt sich aus der logischen UND-Operation der Maske und des ursprünglichen Bildes, währen sich die Texttrennung der Fig. 18B aus dem EXKLUSIVEN ODER der Halbtontrennung und des ursprünglichen Bildes ergibt, wie es in Fig. 10 gezeigt ist.

Schnelle, schwellenmäßige Reduktion (und Ausdehnung) von Bildern

Eine Anforderung der wirksamen Segmentierung ist, daß die schwellenmäßige Reduktion schnell gemacht werden muß. Angenommen, es sei erwünscht, ein Bild mit einem Faktor von zwei in der vertikalen Richtung zu verkleinern. Eine Möglichkeit, dies zu machen, ist eine Rasteroperation (Bitbit-Bit-Blockübertragung) zu verwenden, um logisch die ungeraden und geraden Zeilen zu kombinieren, wobei eine einzige Zeile des verkleinerten Bildes von jedem Zeilenpaar in dem Original erzeugt wird. Das gleiche Vorgehen kann auf die Spalten des vertikal zusammengedrückten Bildes angewendet werden, was ein um einen Faktor von zwei in beiden Richtungen verkleinertes Bild gibt.
Das Ergebnis hängt jedoch von den logischen Operationen der horizontalen und vertikalen Rasteroperationen ab. Ein Ergebnis mit Wert = 1 oder 4 zu erhalten, ist unmittelbar. Wenn ein ODER für beide Ausrichtungen der Rasteroperation verwendet wird, ist das Ergebnis ein EIN-Bildelement, wenn irgendeines der vier Bildelemente innerhalb des entsprechenden 2x2 Quadrats des Originals EIN waren. Dies ist einfach eine Reduktion mit dem Wert = 1. Ebenso ist, wenn eine UND-Operation für beide Ausrichtungen der Rasteroperation verwendet wird, das Ergebnis eine Reduktion mit dem Wert = 4, wo alle vier Bildelemente EIN sein müssen.
Eine etwas andere Methode wird verwendet, eine Reduktion mit einem Wert = 2 oder 3 zu erhalten. Das Ergebnis, ein horizon tales ODER mit nachfolgendem vertikalen UND durchzuführen, sei ein reduziertes Bild R1, und es sei das Ergebnis, ein horizontales UND mit nachfolgendem vertikalen ODER durchzuführen, ein reduziertes Bild R2. Eine Reduktion mit Wert = 2 wird durch eine ODER-Operation von R1 mit R2 erhalten, und eine Reduktion mit Wert = 3 wird durch eine UND-Operation von R1 mit R2 erhalten.
Das Verfahren mag computermäßig nicht effizient sein, wenn es ausgeführt wird, wie es oben beschrieben worden ist. Bei manchen Computern, wie bei Sun-Arbeitsstationen, werden Rasteroperationen, in der Software durchgeführt. Das Bild wird als ein Block von sequentiellen Daten gespeichert, wobei mit der ersten Zeile des Bildes begonnen wird, wobei sich von links nach rechts bewegt wird, dann mit der zweiten Zeile usw. Infolgedessen sind Rasteroperationen zwischen Zeilen schnell, da 16 oder 32 Bit in zwei Wörtern in einer Operation kombiniert werden können. Um aber eine Rasteroperation zwischen zwei Spalten durchzuführen, müssen die entsprechenden Bit gefunden werden, gleichzeitig zwei Bit (eines für jede Spalte), bevor die logischen Operationen gemacht werden können. Es ergibt sich, daß die Zeit pro Bit-Element, um die vertikalen Rasteroperationen zu machen, wenigstens 25-mal größer als die horizontalen ist. Tatsächlich wird, wenn der Algorithmus vollständig für Rasteroperationen ausgeführt wird, mehr als 90% der Zeit vertikalen Operationen gewidmet.
Glücklicherweise gibt es eine einfache und sehr schnelle Möglichkeit, die logischen Operationen zwischen Spalten auszuführen. Statt Spaltenrasteroperationen zu verwenden, nehme man 16 sequentielle Bit, die 16 Spalten in einer Reihe entsprechen. Auf diese 16 Bit kann als eine kurze ganze Zahl zugegriffen werden. Diese 16 Bit werden als ein Index in einem 2¹&sup6;-Eintrittsfeld (d.h. eine Nachsehtabelle) von 8-Bit-Gegenständen verwendet. Die 8-Bit-Inhalte des Feldes geben das Ergebnis der ODER-Operation des ersten Bits des Index mit dem zweiten, des dritten Bits mit dem vierten ... und bis zu dem 15 Bit mit dem 16. Tatsächlich werden zwei Felder benötigt, eines für die ODER-Operation der 8 Gruppen von benachbarten Spalten, und eines für die UND-Operation der Spalten. Man sollte beachten, daß das Zahlenbeispiel nur ein Beispiel ist. Es ist auch möglich, dies als ein 2&sup8;-Eintrittsfeld von 4-Bit-Gegenständen oder als irgendeine einer Anzahl anderer Möglichkeiten auszuführen.
Die Verwendung von Nachsehtabellen, um logische Spaltenoperationen auszuführen, ist pro Bildelement ungefähr so schnell, wie Zeilenrasteroperationen bei Sun. Ein 1000x1000 Bildelementbild kann auf einem Sun 3/260 mit einem Wert = 1 oder 4 auf ein 500x500 Bildelementbild in 0,1 5 reduziert werden. Auf einem Sun 4/330 benötigt die Operation ungefähr 0,04 s.

Spezielle Hardware-Konfigurationen

Wie es oben erörtert worden ist, verlangen 2x2 Reduktionen zuerst eine logische Operation zwischen Zeilen, denen eine zweite, möglicherweise unterschiedliche logische Operation zwischen Spalten folgt. Ferner verlangen einige Schwellenpegel zwei reduzierte Zwischenbilder, die dann kombiniert werden können. Die Technik der Nachsehtabelle für Spaltenoperationen kann mühsam werden, wenn es erwünscht ist, ein sehr weites Bildelementwort zu haben. Entweder wird die Tabelle enorm oder man benötigt spezielle Techniken, Teile des weiten Bildelementwortes in mehreren parallelen Tabellen nachzusehen. Letzteres, während es offensichtlich besser ist, verlangt irgendeine Möglichkeit, um Abschnitte des Datenwortes als Speicheradressen zu verwenden, die sonst nicht notwendig sein mögen.
Fig. 19 ist ein logisches Schema einer spezialisierten Hardware zum Ausführen einer logischen Operation zwischen vertikal benachbarten 2Q-Bit Bildelementworten und einer paarweisen Bit-Reduktion des sich ergebenden 2Q-Bit Bildelementwortes (Bit 0 bis 2Q1). Obgleich die Zeichnung ein 16-Bildelementwort zeigt, würden die Vorteile dieser Hardware bei viel längeren Bildelementwörtern manifest werden, wo die Technik der Nachsehtabelle mühsam geworden ist. Ein 512-Bit Bildelementwort wird in Betrachtung gezogen, da eine Bildzeile nur einige wenige Bildelementworte darstellen würde.
Die Reduktion von zwei Bildelementworten tritt in zwei Stufen auf, die mit 200 und 202 bezeichnet sind. In der ersten Stufe wird ein vertikal benachbartes Paar von Bildelementworten aus einem ersten Speicher 203 ausgelesen, und die erwünschte, erste, logische Operation wird zwischen ihnen ausgeführt. Die erwünschte, zweite, logische Operation wird dann zwischen dem sich ergebenden Bildelementwort und einer Version des Bildelementwortes ausgeführt, die um ein Bit verschoben worden ist. Dies liefert ein verarbeitetes Bildelementwort, das interessierende Bits (gültige Bits) in jeder zweiten Bitposition aufweist. In der zweiten Stufe werden die gültigen Bits in dem verarbeiteten Bildelementwort gewonnen und komprimiert und das Ergebnis wird in einem zweiten Speicher 204 gespeichert. Der Speicher 203 ist vorzugsweise mit einer Wortgröße organisiert, die der Bildelementwortgröße entspricht. Der Speicher 204 kann in der gleichen Weise organisiert sein.
Die bevorzugte Ausführung der Stufe 200 ist ein Feld von Bit- Scheiben-Prozessoren, wie der IDT 40C402-Prozessor, der von der Integrierten Device Technology erhältlich ist. Dieser besondere Prozessor ist eine 16-Bit weite Einrichtung, von denen jede 64 verschiebbare Register enthält. Zweiunddreißig solcher Einrichtungen würden für ein Bildelementwort von 512-Bit geeignet sein. Zur Vereinfachung ist ein 16-Bit-System mit vier Registern 205, 206, 207 und 208 gezeigt. Unter der Operationen der Prozessoren sind jene, die die Inhalte des ersten und zweiten Registers logisch kombinieren und das Ergebnis in dem ersten speichern. Der Prozessor hat einen Datenport 215, der mit einem Datenbus 217 gekoppelt ist.
Die zweite Stufe 202 enthält einen ersten und zweiten, verriegelten Senderempfänger 220 und 222, von denen jeder halb so weit wie das Bildelementwort ist. Jeder Senderempfänger hat zwei Anschlüsse, die mit 220a und 220b bei dem Senderempfänger 220 und mit 222a und 222b bei dem Senderempfänger 222 bezeichnet sind. Jeder Senderempfänger ist halb so weit wie das Bildelementwort. Die Anschlüsse 220a und 222a sind jeweils mit den ungeraden Bits des Datenbusses 217 gekoppelt, die den interessierenden Bits entsprechen. Der Port 220b ist mit den Bits von 0 bis (Q-1) des Datenbusses gekoppelt, während der Port 222b mit den Bits Q bis (2Q-1) gekoppelt ist. Die Busleitungen werden durch Widerstände 125 hochgezogen, so daß nichtangesteuerte Leitungen hochgezogen sind.
Man betrachtet den Fall einer 2x2-Reduktion mit Wert = 2. Die Abfolge der Operationen verlangt, daß (a) ein vertikal benachbartes Paar von Bildelementworten einer UND-Operation unterzogen wird, um ein einziges 2Q-Bit Bildelementwort zu bilden, wobei benachbarte Paare von Bit einer ODER-Operation unterzogen werden, um ein Q-Bit Bildelementwort zu bilden, und das Ergebnis gespeichert wird; (b) das vertikal benachbarte Paar von Bildelementworten wird einer ODER-Operation unterzogen, benachbarte Bit des sich ergebenden 2Q-Bit Bildelementwort werden einer UND-Operation unterzogen, und das sich ergebende Q-Bit Bildelementwort wird gespeichert; und (c) die zwei Q-Bit Bildelementworte werden einer ODER-Operation unterzogen.
Um dieses auszuführen wird ein Paar vertikal benachbarter Bildelementworte aus dem ersten Speicher 203 auf den Datenbus 217 und in die Register 205 und 206 ausgelesen. Die Register 205 und 206 werden einer UND-Operation unterzogen und das Ergebnis wird in den Registern 207 und 208 gespeichert. Der Inhalt des Registers 208 wird um ein Bit nach rechts verschoben, die Register 207 und 208 werden einer ODER-Operation unterzogen und das Ergebnis wird in dem Register 208 gespeichert. Die Register 205 und 206 werden einer ODER-Operation unterzogen und das Ergebnis wird in den Registern 206 und 207 gespeichert. Der Inhalt des Registers 207 wird nach rechts um ein Bit verschoben, die Register 206 und 207 werden einer UND- Operation unterzogen und das Ergebnis wird in dem Register 207 gespeichert.
Zu diesem Zeitpunkt enthält das Register 207 das Ergebnis der ODER-Operation der zwei Bildelementworte und der UND-Operation der Paare von benachbarten Bits, während das Register 208 das Ergebnis der UND-Operation der Bildelementworte und der ODER- Operation von Paaren benachbarter Bits enthält. Jedoch enthalten die Register 207 und 208 die gültigen Bits in den 1, 3, ... (2Q-1) Positionen für ungerade Bits. Bei einer Reduktion mit dem Wert = 2 werden die Register 207 und 208 einer ODER- Operation unterzogen und das Ergebnis wird am Prozessordatenport 215 verfügbar, der mit dem Datenbus 217 gekoppelt ist.
Die ungeraden Bits des Datenbus werden in dem Senderempfänger 220 durch den Port 220a zwischengespeichert, was ein Bildelementwort von Q-Bit mit den gültigen Bits in benachbarten Positionen ergibt. Obgleich diese Q-Bit-Gesamtheit zurück auf den Bus gelesen und zu dem Speicher 207 übertragen werden könnte, wird es bevorzugt, beide Zwischenspeicher zu verwenden. Somit werden zwei neue Bildelemenworte (horizontal zu den ersten zwei benachbart) bei der Stufe 200 verarbeitet, wie es oben beschrieben worden ist, wobei das Ergebnis an dem Prozessordatenport 215 verfügbar gemacht wird und in dem Senderempfänger 222 über den Port 222a zwischengespeichert wird. Die Inhalte der zwei Senderempfänger werden dann durch die Anschlüsse 220b und 222b auf den Datenbus 217 ausgelesen, um ein 2Q-Bit Bildelementwort zu liefern, das die Reduktion von vier 2Q-Bit Bildelementworten darstellt. Das Ergebnis wird zu einem zweiten Speicher 204 übertragen. Diese Gesamtabfolge fährt fort, bis alle Bildelementworte in dem Zeilenpaar verarbeitet worden sind. Sobald ein Zeilenpaar verarbeitet worden ist, werden nachfolgende Paare ähnlich verarbeitet.
Wie es oben erwähnt worden ist, hat jeder Bit-Scheiben-Prozessor 64 Register. Demgemäß ergibt sich, da der Speicherzugriff in einem Blockmodus wirksamer ist, eine schnellere Operation, wenn 8 Paare von Bildelementworten aus dem Speicher 203 in einem Block ausgelesen werden, wie oben erörtert verarbeitet werden, in den Registern des Prozessors gespeichert werden und in einem Block in den Speicher 204 eingeschrieben werden.
Eine Bildvergrößerung ist ähnlich, aber die Schritte werden in der umgekehrten Reihenfolge ausgeführt. Zuerst liest der Prozessor ein Bildelementwort und schickt die linke Hälfte durch den Port 220b des Senderempfängers 220. Dies wird auf den Bus durch den Port 220a ausgelesen. Nur jedes zweite Bildelement in dem sich ergebenden Wort auf dem Bus wird anfangs gültig sein, so daß der Prozessor alle die Bildelemente gültig machen muß, die eine Reihenfolge von Verschiebungen und logischen Operationen verwenden. Da Widerstände 225 alle Busleitungen, die nicht angesteuert werden, hochziehen, wird jede nichtangesteuerte Leitung, alle geraden Bit in diesem Fall, 1 sein. Dieses gedehnte Bildelementwort, das 1 mit gültigen Daten abwechselt, wird in zwei Registern gelesen, wobei der Inhalt eines Registers um einen Platz verschoben wird und die Register einer logischen UND-Operation ausgesetzt werden. Überall dort, wo eine 0 in einem ungeraden Bit war, wird eine 00 in einem geraden/ungeraden Paar sein. Keine der anderen Bits werden beeinflußt. Dieses Bildelementwort wird dann in dem gedehnten Bild in zwei vertikal benachbarte Worte geschrieben. Dieser Vorgang wird für die rechte Hälfte des Bildelementwortes wiederholt, wobei der Senderempfänger 222 verwendet wird. Der Prozessor dehnt die gesamte Zeile um ein Bildelementwort zu einer Zeit und das gesamte Bild um eine Zeile zu einer Zeit.
Die oben unter Bezugnahme auf die Zeichnungen beschriebenen Techniken liefern eine wirksame und wirkungsvolle Trennung von strukturierten Bereichen von unstrukturierten Bereichen in einem Bild.
Sie sind robuste und computermäßig wirksame Techniken, die Transformationen verwenden, wie schwellenmäßige Reduktionsoperationen und morphologische Operationen, um das Vorhandensein von Halbtonbereichen oder korngerasteten Bereichen (gemeinsam als Halbtonbereiche bezeichnet) in einem Binärbild zu bestimmen, solche Bereiche in bezug auf die Rastergröße und den Rasterwinkel zu kennzeichnen und eine Darstellung der Halbtonbereiche zu erzeugen, wie durch Erzeugen einer Trennmaske, die die Halbtonbereiche überdeckt, oder durch Gewinnen der Koordinaten der Halbtonbereichgrenzen. Die in bezug auf die Zeichnungen beschriebenen Techniken sind computermäßig einfach, da die Operationen im wesentlichen örtlich sind. Sie sind auch schnell. Dies ist teilweise deswegen, weil die Operationen wenige Berechnungen pro Bildelement veranlassen, und teilweise weil viele der Operationen an reduzierten Bildern ausgeführt werden, die weniger Bildelemente als das ursprüngliche Bild enthalten, so daß es weniger Bildelemente gibt, die zu verarbeiten sind.
Verschiedene Abänderungen der beschriebenen Ausführungsformen sind möglich. Beispielsweise könnten alle oben genannten Operationen an einem Bild gemacht werden, das zuerst verkleinert bzw. reduziert worden ist. Somit würde viel der Bildberechnung bei einem weiter verkleinerten Maßstab auftreten. Ferner ist, während das bestimmte ursprüngliche Bild, das oben dargestellt worden ist, von einer Vorlage abgeleitet worden ist, die mit 300 Bildelementen/Zoll (2,54 cm) abgetastet worden ist, die Offenbarung auf Vorlagen anwendbar, die mit irgendeiner anderen Auflösung abgetastet worden sind.

Claims

1. Ein Verfahren zum Konstruieren einer Trennmaske für Halbtonbereiche in einem ursprünglichen Binärbild, das die Schritte umfaßt:

Verarbeiten des ursprünglichen Bildes, um ein Keimbild (67) zu konstruieren, wobei das Keimbild die Eigenschaft hat, daß es EIN-Bildelemente nur in den Halbtonbereichen enthält und daß es mindestens ein EIN-Bildelement in jedem Halbtonbereich enthält;

Verarbeiten des ursprünglichen Bildes, um eine Ausschneidemaske (70) zu konstruieren, wobei die Ausschneidernaske die Eigenschaft hat, daß sie alle EIN-Bildelemente in den Halbtonbereichen überdeckt und daß irgendein Teil der Ausschneidemaske, der einen halbtonfreien Bereich überdeckt, nicht einen Teil der Ausschneidemaske berührt, die einen Halbtonbereich überdeckt; und

Verarbeiten des Keimbildes und der Ausschneidemaske (72) so, daß der Keim wächst und der derart gewachsene Keim mit der Ausschneidemaske ausgeschnitten wird, wodurch eine Darstellung der erwünschten Trennmaske geschaffen wird.

2. Ein Verfahren, wie in Anspruch 1 beansprucht und das ferner den Schritt des Bestimmens der charakteristischen Rastergröße und Rasterwinkel (12) der Halbtonbereiche umfaßt.

3. Ein Verfahren, wie in Anspruch 1 oder Anspruch 2 beansprucht und das ferner die Schritte umfaßt:

Bereitstellen einer Gruppe von Raumfiltern; und

Auswählen des Raumfilters, der am besten zu den Halbtoneigenschaften paßt.

4. Ein Verfahren, wie in Anspruch 3 beansprucht, in dem der genannte Auswähischritt die Schritte umfaßt:

Abtragen von wenigstens einern Bereich des Bildes mit jedem der Filter;

Zählen der EIN-Bildelemente für jede Abtragung; und

Auswählen des Filters, das die größte Anzahl ergibt.

5. Ein Verfahren, wie in Anspruch 3 oder Anspruch 4 beansprucht, in dem der genannte Schritt zum Konstruieren eines Keimes umfaßt:

Abtragen des ursprünglichen Binärbildes mit dem ausgewählten Raumfilter;

Unterziehen des derart gefilterten Bildes mindestens einer schwellenmäßigen Reduzierung bzw. Verkleinerung; und

Unterziehen des sich ergebenden Bildes einer Öffnungsoperation.

6. Ein Verfahren, wie in irgendeinem der Ansprüche 3 bis 5 beansprucht, in dem jeder der Filter ein strukturierendes Treffer-Fehler-Element ist, das ein Muster von fünf EIN-Bildelementen, die sich in der Mitte und an den Ecken eines Quadrats befinden, und vier AUS-Elemente aufweist, die sich allgemein in der Mitte zwischen der Mitte und den Ecken des Quadrats befinden.

7. Ein Verfahren, wie in Anspruch 1 beansprucht, in dem der genannte Schritt des Konstruierens eines Keimes die Schritte umfaßt:

Unterziehen des ursprünglichen Binärbildes mindestens einer schwellenmäßigen Reduktion bei einem niederen Schwellenwert;

Unterziehen des sich ergebenden Bildes mindestens einer schwellenmäßigen Reduktion bei einem hohen Schwellenpegel; und

Unterziehen des sich ergebenden Bildes einer Öffnungs- Operation.

8. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, in dem der genannte Schritt des Konstruierens eine Ausschneidemaske umfaßt, das Bild einer Gruppe von Operationen auszusetzen, die AUS-Bildelemente entfernt, die nahe EIN-Bildelementen sind.

9. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, in dem die genannten Schritte des Wachsens und Ausschneidens umfassen:

bei einem ersten Durchgang Kopieren des Keirnes, um eine gegenwärtige Version festzulegen;

Ausdehnen der gegenwärtigen Version;

Unterziehen der Ausschneidemaske und der gegenwärtigen Version einer UND-Operation, um eine iterierte Version festzulegen;

Vergleichen der Kopie der gegenwärtigen Version mit der iterierten Version; und

(a) wenn sie gleich sind, verlassen, oder

(b) wenn sie ungleich sind, Kopieren der iterierten Version, um die gegenwärtige Version erneut zu definieren, und Wiederholen der obigen Schritte einschließlich dieses einen, wobei bei dem genannten Ausdehnungsschritt begonnen wird.

10. Ein Verfahren, wie in irgendeinem der vorhergehenden Ansprüche beansprucht, und das ferner die Schritte umfaßt, die vor dem genannten Konstruktionsschritt für den Keim ausgeführt werden:

Bestimmen, ob Halbtonbereiche in dem ursprünglichen Binärbild vorhanden sind; und

Verlassen, wenn und nur wenn Halbtonbereiche nicht vorhanden sind.

11. Ein Verfahren, wie in Anspruch 10 beansprucht, in dem der genannte Schritt des Bestimmens, ob Halbtonbereiche vorhanden sind, die Schritte umfaßt:

Unterteilen des Bildes in Unterbereiche;

Bestimmen der ungefähren Anzahl von Bildelementübergängen in jedem Unterbereich;

Aufnehmen des Unterbereiches mit der größten Anzahl von Bildelementübergängen; und

Vergleichen dieser Anzahl mit einer Schwelle, oberhalb der ein Unterbereich betrachtet wird, stark halbgetönt zu sein.

12. Ein Verfahren, wie in Anspruch 11 beansprucht, in dem der genannte Schritt des Bestimmens der ungefähren Anzahl von Bildelementübergängen die Schritte umfaßt:

Abtragen des Unterbereiches mit einem horizontalen, strukturierenden Element von benachbarten EIN-Bildelementen;

Unterziehen des Ergebnisses einer EXKLUSIV ODER- Operation mit dem Unterbereich; und

Zählen der verbleibenden EIN-Bildelemente.

13. Ein Verfahren, wie in Anspruch 4 und Anspruch 11 beansprucht, in dem der Bereich des Bildes, der mit jedem der Filter abgetragen worden ist, der Unterbereich mit der größten Anzahl von Bildelementübergängen ist.

14. Ein Verfahren, zum Trennen von Halbtonbereichen eines Binärbildes, das die Schritte umfaßt, eine Trennmaske mit einem Verfahren zu konstruieren, wie es in irgendeinem der vorhergehenden Ansprüche beansprucht wird, und logisch die Trennmaske und das ursprüngliche Binärbild zu kombinieren, um die Bildtrennungen zu gewinnen.