DE69125471T2

DE69125471T2 - Methode zur automatischen Unterscheidung zwischen graphischer Information und Textinformation von Bilddaten

Info

Publication number: DE69125471T2
Application number: DE69125471T
Authority: DE
Inventors: Min Seok Kang
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 1990-12-31
Filing date: 1991-12-31
Publication date: 1997-09-11
Anticipated expiration: 2012-01-01
Also published as: KR920014198A; US5375197A; EP0494026A2; EP0494026B1; DE69125471D1; KR930010845B1; JP2595158B2; EP0494026A3; JPH04296163A

Description

HINTERGRUND DER ERFINDUNG

Gebiet der Erfindung

Die vorliegende Erfindung bezieht sich allgemein auf ein Verfahren zur automatischen Unterscheidung zwischen grafischer Information und Textinformation von Bilddaten und spezieller auf ein Verfahren zur automatischen Unterscheidung zwischen grafischer Information und Textinformation von Bilddaten, das zur Unterscheidung zwischen grafischer Information und Textinformation von Bilddaten fähig ist, die Grafik- und Textinformation mit Grauwerten einschließt, wobei die Bilddaten auf einfache Weise digitalisiert werden, so daß die Grafik und der Text des Bildes klar dargestellt werden.

Beschreibung des Standes der Technik

Aus dem Stand der Technik bekannte Verfahren zur Unterscheidung zwischen grafischer Information und Textinformation von Bilddaten sind in US-A-4 577 235 und US-A- 4 554 593 beschrieben.
Zuerst werden Bilddaten mit Grauwerten, die durch Einscannen einer zu duplizierenden Vorlage erhalten wurden, in angrenzende Bilddatenblöcke (beispielsweise 4 Pixel x 4 Pixel) unterteilt, die verarbeitet werden, um zu bestimmen, ob die durch die Datenblöcke repräsentierten Teile des Eildes einem Text- oder einem Grafikabschnitt des Dokuments entsprechen. Ein mittlerer Grauwert wird für jeden Datenblock bestimmt und als Indexierungsvariable für mindestens eine zusätzliche für den Block bestimmte Eigenschaft genutzt. Zusätzliche Eigenschaften sind die Blockvarianz, ein Blockkantenzählwert, ein Blockübereinstimmungszählwert oder ein Blocktextmittelwert. Es wird eine eindimensionale Gauß-Verteilung erzeugt, um die Datenwerte des zusätzlichen Merkmals für jeden möglichen Grauskalenwert eines Blockes zu verteilen. Der Mittelwert und die Standardabweichung werden für jede Datenverteilung bestimmt, und es wird der Mahalanobis-Abstand für jeden Datenwert des Merkmals bzw. der Eigenschaft ermittelt. Der Mahalanobis-Abstand ist eine repräsentative Wahrscheinlichkeit dafür, ob der Bilddatenblock einem Textabschnitt des Bildes oder einem Grafikabschnitt des Bildes entspricht.
Es werden Gauß-Verteilungen sowohl für Textdaten als auch Grafikdaten erzeugt, so daß die Wahrscheinlichkeiten sowohl für Text als auch für Grafik unabhängig für jeden Bilddatenblock abgeschätzt werden können. Die Textwahrscheinlichkeit wird dann durch Division durch die Summe der beiden Wahrscheinlichkeiten normiert. Die normierte Textwahrscheinlichkeit wird dann benutzt, um zu bestimmen, ob die Datenblöcke Text- oder Grafikteilen des Bildes entsprechen.
Das erwähnte herkömmliche Verfahren zur Unterscheidung zwischen Grafik- und Textabschnitten hat den Nachteil einer Überlastung der Software und somit einer Verringerung der Datenbestimmungsgeschwindigkeit, da die in vier Typen klassifizierte Charakteristik des Blocks für die Unterscheidung zwischen Grafik- und Textabschnitten angewandt wird. Bei der Bildung eines Systems, das ein Eingangssignal in Echtzeit verarbeitet, um die Unterscheidung zwischen Grafik- und Textabschnitten zu bewerkstelligen, tritt das Problem einer Verzögerung der Echtzeit, die neun Blöcken (36 Zeilen) entspricht, auf, da die Umgebung einer kreuzweisen Abtastung (Scannen) unterzogen wird, das eine vertikale Abtastung von maximal neun Blöcken und eine seitliche Abtastung von maximal neun Blöcken einschließt.
Ein Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten gemäß dem Oberbegriff von Anspruch 1 ist aus EP-A-0 404 236 bekannt.

ZUSAMMENFASSUNG DER ERFINDUNG

Es ist daher eine Aufgabe der Erfindung, die dem Stand der Technik innewohnenden erwähnten Nachteile zu beheben und ein Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten bereitzustellen, bei dem die Unterscheidung zwischen Grafik- und Textteilen durch die Fenstereinheit durch Benutzung des Blockmittelwertes erreicht wird und der Fehler bei der Unterscheidung zwischen Grafik- und Textteilen durch die genaue Korrektur der Umgebung korrigiert wird, wobei dies durch Abtastung von Fenstern bis zu einer Maximalzahl von fünf bewerkstelligt wird - wodurch eine Verringerung der Belastung der Software und eine Datenverarbeitung mit hoher Geschwindigkeit erreicht wird. Eine weitere Aufgabe der Erfindung ist es, ein Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten bereitzustellen, das auf die Digitalisierung von Bilddaten angewandt werden kann, so daß der Grafikteil und der Textteil von Bilddaten einer Halbtonbehandlung bzw. einer adaptiven Digitalisierung unterzogen wird, wodurch die Grafik- und Textteile der Bilddaten klar wiedergegeben werden können.
In Übereinstimmung mit der vorliegenden Erfindung wird ein Verfahren zur automatischen Unterscheidung zwischen Grafik-information und Textinformation gemäß Anspruch 1 bereitgestellt.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Die obigen und weitere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der nachfolgenden detaillierten Beschreibung in Zusammenhang mit den begleitenden Zeichnungen klarer verständlich, von denen
Fig. 1 ein Funktionsblockschaltbild eines Systems zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten ist, das gemäß dem Verfahren der vorliegenden Erfindung arbeitet,
Fig. 2 ein Flußdiagramm darstellt, das den Betrieb des in Fig. 1 gezeigten Systems in Übereinstimmung mit der vorliegenden Erfindung zeigt,
Fig. 3 ein Maskenmuster zur Darstellung eines Korrekturbetriebs des in Fig. 1 gezeigten Systems in Übereinstimmung mit der vorliegenden Erfindung ist und
die Figuren 4A bis 4C Darstellungen sind, welche eine Kantenabdünnoperation des in Fig. 1 gezeigten Systems in Übereinstimmung mit der vorliegenden Erfindung darstellen.

BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSFORMEN

Zuerst wird der Aufbau eines Systems zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten, das in Übereinstimmung mit dem Verfahren gemäß der vorliegenden Erfindung arbeitet, unter Bezugnahme auf Fig. 1 beschrieben.
In Fig. 1 ist ein Funktions-Blockschaltbild eines Systems zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten gemäß der vorliegenden Erfindung dargestellt. Wie in dieser Zeichnung gezeigt, weist das System gemäß der vorliegenden Erfindung einen A/D-Wandler 10 zur Umwandlung eines analogen Bildsignals PS, das von einem (nicht gezeigten) Scanner ausgegeben wird, in digitale Bilddaten synchron mit einem Abtastsignal SS, einen Adreßgenerator 20 zum Eingeben eines Zeilenendsignals LS vom Scanner zur Erzeugung einer Adresse synchron mit dem Abtastsignal SS, eine Pufferschaltung 30 zum Speichern der Bilddaten vom A/D-Wandler 10 in Übereinstimmung mit der vom Adreßgenerator 20 angelegten Adresse oder zum Ausgeben der gespeicherten Bilddaten an einen Datenbus in Übereinstimmung mit einer externen Adresse und einen Mikroprozessor 50 zum Eingeben der Bilddaten von der Pufferschaltung 30 zur Unterscheidung zwischen einem Grafikteil und einem Bildteil der Bilddaten und zur Steuerung des gesamten Betriebs des Systems auf.
Die Pufferschaltung 30 enthält einen ersten und einen zweiten Puffer 31 und 32 zur Pufferung der Adressen vom Adreßgenerator 20 und der Bilddaten vom A/D-Wandler 10 im Ansprechen auf Steuersignale CS1 und CS2 vom Mikroprozessor 50, einen ersten und einen zweiten Speicher 41 und 42 zum Speichern der Ausgangsdaten vom ersten und zweiten Puffer 31 und 32 in Übereinstimmung mit den gepufferten Adressen vom ersten und zweiten Puffer 31 und 32 und einen dritten und vierten Puffer 33 und 34 zur Pufferung der vom Mikroprozessor 50 angelegten Adressen zum Anlegen der gepufferten Adressen als Ausgabeadressen an den ersten und zweiten Speicher 41 und 42 und zum Ausgeben der Bilddaten vom ersten und zweiten Speicher 41 und 42 an den Mikroprozessor 50, jeweils im Ansprechen an die Steuersignale CS2 und CS1 vom Mikroprozessor 50.
Die Bezugsziffern 60 und 70 bezeichnen hier einen programmierbaren ROM bzw. einen RAM.
Nachfolgend wird der Betrieb des Systems zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten gemäß dem oben erwähnten Aufbau in Übereinstimmung mit der vorliegenden Erfindung im einzelnen unter Bezugnahme auf die Figuren 2 bis 4 beschrieben.
Nach Einschalten des Systems wird zuerst das durch Einscannen einer Vorlage mit dem Scanner gewonnene analoge Bildsignal PS dem A/D-Wandler 10 zugeführt. Der A/D- Wandler 10 wandelt das eingegebene analoge Bildsignal synchron mit dem Abtastsignal SS in digitale Bilddaten um. Der Adreßgenerator 20 empfängt das Zeilenendsignal LS vom Scanner und erzeugt eine Adresse als Eingabeadresse für den ersten und zweiten Speicher 41 und 42 in Übereinstimmung mit dem eingegebenen Zeilenendsignal LS synchron mit dem Abtastsignal SS.
Der Mikroprozessor 50 gibt die Signale CS1 und CS2 zur Steuerung der Puffer 31 bis 34 aus. Unter dieser Steuerung durch den Mikroprozessor 50 werden der erste und zweite Speicher 41 und 42 mit dem A/D-Wandler 10 und dem Adreßgenerator 20 verbunden, um die Bilddaten vom A/D- Wandler 10 in Übereinstimmung mit der durch den Adreßgenerator 20 angelegten Adresse zu speichern, oder sie werden mit dem Mikroprozessor 50 verbunden, um die gespeicherten Bilddaten auszugeben.
Zuerst, wenn der Mikroprozessor 50 das Steuersignal CS1 als aktives Signal ausgibt, während das Steuersignal CS2 inaktiv gemacht ist, werden der erste und vierte Puffer 31 und 34 aktiviert, während der zweite und dritte Puffer 32 und 33 inaktiv sind. Im Ergebnis werden die Bilddaten vom A/D-Wandler 10 über den aktivierten ersten Puffer 31 in dem durch den Adreßgenerator 20 adressierten Speicherplatz des ersten Speichers 41 gespeichert. Weiterhin werden die im Speicherplatz des zweiten Speichers 42, der durch den Mikroprozessor 50 adressiert wird, gespeicherten Bilddaten über den aktivierten vierten Puffer 34 an den Mikroprozessor 50 ausgegeben.
Dann gibt der Mikroprozessor 50 das Steuersignal CS2 als aktives Signal aus, während das Steuersignal CS1 inaktiv gemacht ist, wodurch der erste und vierte Puffer 31 und 34 deaktiviert sind, während der zweite und dritte Puffer 32 und 33 aktiviert sind. Im Ergebnis werden die im Speicherplatz des ersten Speichers 41, der durch den Mikroprozessor adressiert wird, gespeicherten Bilddaten über den aktivierten dritten Puffer 33 an den Mikroprozessor 50 ausgegeben. Weiterhin werden die Bilddaten vom A/D- Wandler 10 über den aktivierten zweiten Puffer 32 in dem durch den Adreßgenerator 20 adressierten Speicherplatz des zweiten Speichers 42 gespeichert.
Die vom Scanner erhaltenen Bilddaten werden gemäß der Adresse vom Adreßgenerator 20 zeilenweise in den ersten und zweiten Speicher 41 und 42 gespeichert, und die im ersten und zweiten Speicher 41 und 42 gespeicherten Bilddaten werden in einer gewünschten Anzahl von Zeileneinheiten, oder Vier-Zeilen-Einheiten zur Bildung eines Blocks, unter Adreßsteuerung durch den Mikroprozessor 50 auf den Datenbus zum Mikroprozessor 50 ausgegeben. Der Grauskalenwert wird auf der Grundlage der Anzahl der ausgegebenen Bits vom A/D-Wandler 10 für die im ersten und zweiten Speicher 41 und 42 gespeicherten Bilddaten bestimmt. Wenn beispielsweise der A/D-Wandler 10 ein 8-Bit- A/D-Wandler ist, ist der Grauskalenwert für die umgewandelten Bilddaten, die zeilenweise im ersten und zweiten Speicher 41 und 42 zu speichern sind, maximal 256. Die Bilddaten mit dem maximalen Grauskalenwert 256 werden abwechselnd in Vier-Zeilen-Einheiten entsprechend der alternierenden Aktivierung der Steuersignale CS1 und CS2 vom Mikroprozessor 50 in den ersten und zweiten Speicher 41 und 42 eingespeichert bzw. aus diesen ausgegeben.
Entsprechend wird das analoge Bildsignal in digitale Daten mit einem Grauskalenwert von maximal 256 umgewandelt, und die digitalen Daten werden im Schritt S1 in Fig. 2 zeilenweise in den ersten und zweiten Speicher 41 und 42 eingespeichert. Die gespeicherten Bilddaten werden in Vier-Zeilen-Einheiten im Schritt S2 durch den Mikroprozessor 50 ausgelesen. Dann unterteilt der Mikroprozessor 50 die gelesenen Bilddaten in angrenzende Bilddatenblökke, von denen jeder vorzugsweise 4 Pixel x 4 Pixel umfaßt, und ermittelt im Schritt S3 einen Blockmittelwert. Der Blockmittelwert ist im wesentlichen der mittlere Grauskalenwert der durch den Bilddatenblock repräsentierten Pixel, und somit ist der Block-Mittelwert für 4 Pixel x 4 Pixel maximal 256.
Dann wird unter Nutzung des Block-Mittelwertes im Schritt S4 die Hintergrundfarbausleuchtung berechnet bzw. bewertet. Ein Blocksatz wird aus drei Blöcken gebildet. Ein Block-Mittelwert wird für den Blocksatz aus drei Blöcken bestimmt. Die Hintergrundfarbausleuchtung wird durch den größten der Blockmittelwerte der Blocksätze des Bildes bestimmt. Der Blockmittelwert ist größer, wenn die Blöcke hauptsächlich die weiße Farbe einschließen, er ist kleiner, wenn die Blöcke hauptsächlich die schwarze Farbe einschließen. Der Block-Mittelwert ist nämlich proportional zur Helligkeit des Blocks. Die Zusammenfassung von drei Blöcken in einen Blocksatz wirkt als Tiefpaßfilter zur Verringerung der Belastung der Software und der Fehlerwahrscheinlichkeit bei der Beurteilung der Hintergrundfarbausleuchtung bei einer Blockeinheit.
Nachdem die Hintergrundfarbausleuchtung bewertet wurde, wird ein Schritt S5 der Diskriminierung zwischen einem Textabschnitt und einem Grafikabschnitt des Bildes und der Unterscheidung zwischen Textteil und Grafikteil des Bildes in Übereinstimmung mit dem Diskriminierungsergebnis ausgeführt. Der Textabschnitt des Bildes enthält mindestens einen Block derselben Ausleuchtung wie die Hintergrundausleuchtung, da es Abstandsabschnitte zwischen benachbarten Textteilen und benachbarten Textzeilen gibt. Der Textabschnitt des Bildes wird somit durch ein Fenster mit einem Block derselben Ausleuchtung wie die Hintergrundausleuchtung bestimmt.
Im Schritt S5 der Unterscheidung zwischen dem Textabschnitt und dem Grafikabschnitt des Bildes wird die Unterscheidungseinheit als Fenster vorgegeben, von denen jedes bevorzugt 16 angrenzende Blöcke umfaßt. Der Referenzwert wird für den Text- und den Grafikabschnitt des Bildes durch Multiplikation der im Schritt S4 erhaltenen Hintergrundfarbausleuchtung mit einem Fehlerkorrekturwert, bevorzugt 0,8 bis 1, erhalten. Wenn das Fenster mindestens einen Block mit einem größeren Wert als dem Referenzwert enthält, das heißt, wenn das Fenster mindestens einen Block mit der Hintergrundfarbausleuchtung enthält, wird das Fenster als Fenster eines Textabschnitts des Bildes beurteilt. Wenn andererseits das Fenster keinen Block mit einem größeren Wert als dem Referenzwert enthält, wird das Fenster als Fenster eines Grafikabschnitts des Bildes beurteilt. Der Zweck der Multiplikation der Hintergrundfarbausleuchtung mit dem Fehlerkorrekturwert von 0,1 bis 8 zur Bestimmung des Referenzwertes zur Unterscheidung zwischen dem Textabschnitt und dem Grafikabschnitt des Bildes besteht darin, einen Fehler des Aufnahmesensors des Scanners zu korrigieren, mit dem die Vorlage abgetastet wird. Je höher die Leistungsfähigkeit des Aufnahmesensors, desto näher liegt der Korrekturwert bei eins.
Nachdem der Schritt S5 der Diskriminierung zwischen einem Textabschnitt und einem Grafikabschnitt des Bildes und der Unterscheidung zwischen dem Textabschnitt und dem Grafikabschnitt des Bildes in Übereinstimmung mit dem Diskriminierungsergebnis beendet ist, wird ein Schritt S6 der Erkennung und Korrektur eines unkorrekt beurteilten Fensters, das heißt eines Fensters des Textteils, das unkorrekterweise als Fenster eines Grafikabschnitts erkannt und unterschieden wurde, und umgekehrt, ausgeführt.
Im Schritt S6 der Korrektur unkorrekt eingestufter Fenster wird der Korrekturvorgang durch Einscannen einer Umgebung von fünf Fenstern mit einem Maskenmuster ausgeführt, wie in Fig. 3 dargestellt. Hierbei stellt "L" ein Fenster des Textabschnitts und "G" ein Fenster des Grafikabschnitts dar.
Die Fensterkorrektur schließt bevorzugt eine Zentrumskorrektur, eine Horizontalkorrektur und eine Vertikalkorrektur ein, wie in Fig. 3 gezeigt. Bei der Zentrumskorrektur gemäß Fig. 3 wird, wenn das Fenster "L" des Textabschnitts von Fenstern "G" des Grafikabschnitts umgeben ist, das Fenster "L" des Textabschnitts als unkorrektes Fenster erkannt und folglich in ein Fenster "G" des Grafikabschnitts korrigiert, da bei der Vorlage tatsächlich kein Textabschnitt vorliegt, der so klein wäre, daß er nur ein Fenster einschließt. Auf der anderen Seite wird, wenn ein Fenster "G" des Grafikabschnitts von Fenstern "L" des Textabschnitts umgeben ist, der Korrekturvorgang auf dieselbe Weise wie für den Textabschnitt ausgeführt.
Des weiteren werden die Horizontalkorrektur, die Vertikal-Grafikabschnittkorrektur und die Vertikal- Textabschnittkorrektur - wie in Fig. 3 gezeigt - auf dieselbe Weise wie die Zentrumskorrektur ausgeführt. Wenn nämlich beide Kantenfenster benachbarter Fenster (mit einer Anzahl von 3 bis 5) solche desselben Abschnitts sind und mindestens eines der inneren Fenster das eines anderen Abschnitts als des Abschnitts der Kantenfenster ist, wird das Fenster des sich unterscheidenden Abschnitts in ein Fenster desselben Abschnitts wie die Kantenfenster korrigiert. Bei der fensterweisen Korrektur ist die vertikale Breite der Fenster ein Block, und daher bedeutet die vertikale Abtastung von fünf Fenstern die vertikale Abtastung von fünf Blöcken. Daher wird eine Verzögerung des Systembetriebs im Vergleich zu denjenigen, bei dem gemäß dem Stand der Technik neun Blöcke abgetastet werden, vermindert.
Nach der Korrektur der fensterweise unterschiedenen Informationsabschnitte im Schritt S6 wird ein Schritt S7 der Abdünnung von Kanten der Grafik-/Textabschnitte in Blockeinheiten ausgeführt. In der Realität kann die Unterscheidung zwischen Grafik- und Textabschnitten in der Vorlage nicht klar vorgenommen werden. Daher ist es erforderlich, die Kanten zwischen Grafik- und Textabschnitten blockweise abzudünnen, um diese korrekt zu definieren.
Im Schritt S7 wird eine Ausrichtung der Kanten der Grafik- und Textabschnitte erreicht. Das heißt, wenn eine Schwankung in einem Fenster auftritt, wenn nämlich das Fenster aus dem Grafikabschnitt in den Textabschnitt oder vom Textabschnitt in den Grafikabschnitt verändert zugeordnet wird, wird die Kante des verändert zugeordneten Fensters erfaßt und dann abgedünnt. Die Kante wird als derjenige Abschnitt des Fensters erkannt, wo die Ausleuchtung des Fensters plötzlich vergrößert oder plötzlich verringert wird.
Wenn die in Fig. 4A gezeigte tatsächliche Vorlage fensterweise in Grafik- und Textabschnitte unterteilt wird, sind die Kanten zwischen den Grafik- und Textabschnitten der Vorlage andere als diejenigen jedes Fensters. Im Falle einer fensterweisen Unterscheidung zwischen Grafik- und Textabschnitten überlappen sie sich, wie in Fig. 4B dargestellt. Zur korrekten Unterteilung zwischen überlappten Grafik- und Textabschnitten längs der in der tatsächlichen Vorlage definierten Kante wird die Kante jedes Fensters, das einen Überlappungsabschnitt hat, in Blöcke unterteilt, und es wird eine Diskriminierung dahingehend ausgeführt, ob jeder Block eine höhere Ausleuchtung als den Schwellwert hat. Im Falle der linken Kante werden die Blöcke vom ersten Block bis zu dem Block, der eine niedrigere Ausleuchtung als die Schwelle hat, als Textteil erkannt. Die Blöcke von dem Block ab, der dem letztgenannten Block am nächsten ist, bis zum letzten Block werden als Grafikteil erkannt. Im Falle der rechten Kante werden die Blöcke vom ersten Block bis zu dem Block, bei dem die Ausleuchtung höher als der Schwellwert ist, als Grafikabschnitt eingestuft. Die Blöcke von dem dem letztgenannten Block benachbarten Block bis zum letzten Block werden als Textabschnitt eingestuft. Da die Kante der auf Fensterbasis unterschiedenen Grafik- und Textabschnitte auf Blockbasis abgedünnt wird, wie oben erwähnt, können die Grafik- und Textabschnitte sehr ähnlich zur Trennung zwischen den Grafik- und Textabschnitten in der tatsächlichen Vorlage unterschieden werden, wie in Fig. 4C dargestellt.
Danach wird ein Schritt S8 ausgeführt, in dem die Verzögerung gegenüber der Echtzeit korrigiert wird. Damit ist die Unterscheidung zwischen Grafik- und Textabschnitten beendet.
Wie aus der obigen Beschreibung deutlich wird, stellt die vorliegende Erfindung ein Verfahren und ein System zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten dar, das zur Ausführung der Schritte des Nachweises eines Block-Mittelwertes, der Unterscheidung zwischen Grafik- und Textabschnitten anhand jedes Fensters unter Nutzung des Block-Mittelwertes, zur Korrektur des Fehlers bei der Unterscheidung zwischen Grafik- und Textabschnitten, zur Abdünnung der Kanten der Fenster und zur Korrektur der Verzögerung gegenüber der Echtzeit in der Lage ist. Somit wird die Verarbeitungsgeschwindigkeit des Mikroprozessors erhöht, was eine Datenverarbeitung mit hoher Geschwindigkeit ermöglicht. Durch Korrektur des Fehlers bei der Unterscheidung zwischen Grafik- und Textabschnitten kann die Umgebung exakt durch Scannen von nur maximal fünf Fenstern korrigiert werden, was eine Verringerung der Verzögerung gegenüber Echtzeit ermöglicht. Weiterhin kann die gesamte Verarbeitung in einer Zeitspanne nahe Echtzeit ausgeführt werden. Weiterhin kann die Dateneingabe-Hardware einfach sein, was einen einfachen Aufbau des Gesamtsystems ermöglicht. Insbesondere bietet die vorliegende Erfindung Vorteile, wenn sie im Zusammenhang mit der Digitalisierung von Bilddaten angewandt wird. In diesem Fall wird der Grafikteil der Bilddaten einer Halbtonverarbeitung unterzogen, während der Textteil einer adaptiven Digitalisierung unterworfen wird. Im Ergebnis können die Grafik- und Textabschnitte der Bilddaten klar wiedergegeben werden, wobei die Digitalisierung ohne Unterscheidung zwischen Grafik- und Textabschnitten bewerkstelligt wird.
Obgleich bevorzugte Ausführungsformen der vorliegenden Erfindung zum Zwecke der Darstellung beschrieben wurden, wird der Fachmann erkennen, daß verschiedene Abwandlungen, Hinzufügungen und Ersetzungen möglich sind, ohne daß der durch die anhängenden Ansprüche definierte Schutzbereich der Erfindung verlassen würde.

Claims

1. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten, mit den Schritten:

(a) Umwandeln (S1) eines von einem Scanner ausgegebenen analogen Bildsignals in digitale Bilddaten und Speichern der digitalen Bilddaten,

(b) Lesen (S2) der im Schritt (a) gespeicherten Bilddaten,

(c) Unterteilen (S3) der gelesenen Bilddaten in angrenzende Bilddatenblöcke und Bestimmen von jeweiligen Blockmittelwertausleuchtungen,

dadurch gekennzeichnet, daß das Verfahren weiter aufweist:

(d) Bestimmen einer Hintergrundfarbausleuchtung (S4) durch Verarbeiten einer Mehrzahl von Blockmittelwertausleuchtungen, die im Schritt (c) berechnet wurden,

(e) Unterteilen des Bildes in Fenster, von denen jedes eine vorbestimmte Anzahl angrenzender Blöcke enthält, und Unterscheiden (S5) zwischen Textfenstern und Grafikfenstern, wobei ein Textfenster als Fenster definiert ist, das mindestens einen Block mit derselben Ausleuchtung wie die Hintergrundausleuchtung einschließt,

(f) Korrigieren (S6) eines unkorrekt beurteilten Fensters durch Abtasten eines vorbestimmten Musters benachbarter Fenster und Bestimmen dessen, ob die Positionen von Text- und Grafikfenstern innerhalb des Musters korrekt sind, und

(g) Ausführen einer Ausrichtung (S7) der Kanten von Grafik- und Textabschnitten durch Bestimmen dessen, welches Fenster eine Änderung von Text zu Grafik oder umgekehrt einschließt, und Unterteilen dieser Fenster in Blöcke zur genaueren Bestimmung der Kanten.

2. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei der Schritt (d) der Berechnung der Hintergrundfarbausleuchtung (S4) einen Schritt des Zusammenfassens dreier Blöcke in einen Blocksatz, der Berechnung eines Block-Mittelwertes für den Blocksatz aus drei Blökken und der Bestimmung der Hintergrundfarbausleuchtung als des größten Wertes der Blockmittelwerte der Blocksätze einschließt.

3. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei jedes der Fenster im Schritt (c) 16 angrenzende Blöcke enthält.

4. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei der Schritt (e) des Unterscheidens einen Schritt aufweist, bei dem, wenn das Fenster mindestens einen Block mit der Hintergrundfarbausleuchtung einschließt, dieses Fenster als Fenster des Textabschnitts der Bilddaten beurteilt wird, und wenn das Fenster keinen Block mit der Hintergrundfarbausleuchtung einschließt, das Fenster als Fenster des Grafikabschnitts der Bilddaten beurteilt wird.

5. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 4, wobei der Block mit der Hintergrundfarbausleuchtung in einem Blocksatz vorliegt, wenn es in dem Blocksatz einen Block-Mittelwert gibt, der größer als ein durch Multiplikation der Hintergrundfarbausleuchtung mit einem Fehlerkorrekturwert erhaltener Wert ist.

6. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 5, wobei der Fehlerkorrekturwert ein Wert kleiner als, aber nahe bei eins ist.

7. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei der Schritt (f) des Korrigierens des unkorrekt beurteilten Fensters (S6) einen Schritt aufweist, bei dem in einem Zentrumskorrekturfall, bei dem ein Zentrumsfenster des Textabschnitts oder Grafikabschnitts von Fenstern eines anderen Abschnitts umgeben ist, das Zentrumsfenster als Fenster desselben Abschnitts korrigiert wird, zu dem die umgebenden Fenster gehören.

8. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei der Schritt (f) des Korrigierens des unkorrekt beurteilten Fensters (S6) einen Schritt einschließt, bei dem in Vertikal- und Horizontal- Korrekturfällen, in denen beide Kantenfenster von vertikal und horizontal aneinander angrenzenden fünf Fenstern demselben Abschnitt zugehören und mindestens eines der inneren Fenster einem anderen Abschnitt als die beiden Kantenfenster zugehören, das Fenster des anderen Abschnitts in ein Fenster desselben Abschnitts korrigiert wird, dem die Kantenfenster zugehören.

9. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 1, wobei der Schritt (g) des Ausführens der Ausrichtung der Kanten (S7) von Grafik- und Textabschnitten einen Schritt des Abdünnens eines Fensters, das einen Übergang vorn Grafikabschnitt in den Textabschnitt oder vom Textabschnitt in den Grafikabschnitt repräsentiert, zur Ausrichtung der Kante des Fensters aufweist.

10. Verfahren zur automatischen Unterscheidung zwischen Grafikinformation und Textinformation von Bilddaten nach Anspruch 9, wobei der Schritt des Abdünnens einen Schritt des Unterscheidens dessen aufweist, ob jeder Block des den geänderten Informationsabschnitt repräsentierenden Fensters eine Ausleuchtung höher als die Schwelle hat, wobei der Schritt des Unterscheidens mit den linken Endblöcken begonnen wird und die Blöcke als Textabschnitt beurteilt werden, die eine höhere Ausleuchtung als die Schwelle haben.