DE69415469T2 - Verfahren zur Verkleinerung des Bildes eines Dokuments - Google Patents

Verfahren zur Verkleinerung des Bildes eines Dokuments

Info

Publication number
DE69415469T2
DE69415469T2 DE69415469T DE69415469T DE69415469T2 DE 69415469 T2 DE69415469 T2 DE 69415469T2 DE 69415469 T DE69415469 T DE 69415469T DE 69415469 T DE69415469 T DE 69415469T DE 69415469 T2 DE69415469 T2 DE 69415469T2
Authority
DE
Germany
Prior art keywords
information
row
column
pixels
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69415469T
Other languages
English (en)
Other versions
DE69415469D1 (de
Inventor
Lawrence Patrick Madison New Jersey 07940 O'gorman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Application granted granted Critical
Publication of DE69415469D1 publication Critical patent/DE69415469D1/de
Publication of DE69415469T2 publication Critical patent/DE69415469T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • H04N1/3935Enlarging or reducing with modification of image resolution, i.e. determining the values of picture elements at new relative positions

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

  • Die vorliegende Erfindung betrifft Verfahren zur Verkleinerung eines Bildes einer Dokumentenseite.
  • Elektronische Dokumentensysteme werden immer häufiger zur Speicherung von Nachschlagematerialien verwendet. Herkömmliche elektronische Dokumentensysteme umfassen einen Scanner, der ein Dokumentenoriginal scannt, jede Seite des Dokuments digitalisiert und sie in ein Bild konvertiert, das aus Bildelementen oder Bildpunkten besteht; einen Computer zur Verarbeitung der Bildpunkte und zur Durchführung etwaiger Modifikationen des Bildes, wie zum Beispiel u. a. Verkleinerung; und einen Monitor zum Betrachten des gescannten Dokuments. Die gescannten Dokumente werden dann zur späteren Abrufung gespeichert.
  • Elektronische Dokumente können leicht aus dem Speicher eines Dokumentensystems abgerufen und auf einem Monitor betrachtet werden. Die in einer standardmäßigen 8,5 · 11-Zoll-Dokumentenseite enthaltene Datenmenge übersteigt jedoch wesentlich die auf einem typischen Monitor betrachtbare Datenmenge. Insbesondere beträgt eine standardmäßige Bildauflösung für Dokumentenscanner 300 Bildpunkte pro Zoll (wird üblicherweise als Punkte pro Zoll oder dpi bezeichnet). Somit beträgt bei einer 8,5 · 11-Zoll-Dokumentenseite die gescannte Größe 2550 · 3300 Bildpunkte. Die Bildpunktabmessungen des Bildschirms eines herkömmlichen Monitors betragen 1600 · 1280. Auf der Grundlage dieser Maße ist es offensichtlich, daß eine volle Seite nicht vollständig auf einem solchen Monitor angezeigt werden kann.
  • Somit ist wohlbekannt, daß, wenn die gesamte Dokumentenseite auf dem Monitor betrachtet werden soll, die in der Dokumentenseite enthaltene Datenmenge reduziert werden muß. Tatsächlich besteht ein im Stand der Technik bekannter Ansatz darin, das Bild auf eine solche Weise unterabzutasten, daß die Bildpunktabmessungen des unterabgetasteten Bildes an die des Monitors angepaßt werden, auf dem es angezeigt werden soll. Dieser Ansatz kann jedoch zu einem starken Klarheitsverlust, wie zum Beispiel der Randdefinition und einer merklichen Verkleinerung zum Beispiel von Text oder anderen Merkmalen führen. Bei der obigen Illustration gehen zum Beispiel nicht weniger als 38% der Bilddaten verloren.
  • Aus der US-A-4 412 252 ist ein System bekannt, das ein Bild durch Reduktion der in dem Bild enthaltenen Gesamtinformationen verkleinert. Insbesondere enthält das System erste und zweite Reduktionsmittel, die gemäß einem vorbestimmten Verkleinerungsfaktor für das gesamte Bild selektiv Punkte oder Bildpunkte aus jeder Zeile und Spalte eines Bildes löschen. Um in jeder Zeile oder Spalte eine solche Reduktion vorzunehmen, werden zuerst die Punkte gelöscht, die die sogenannten unwesentlichen Informationen darstellen, und wenn das Löschen solcher unwesentlicher Punkte die Zeile oder Spalte nicht um den vorbestimmten Faktor reduziert, dann werden informationsführende oder wesentliche Punkte gelöscht, bis der vorbestimmte Faktor erreicht ist. Folglich kann das System zur Erzielung des vorbestimmten Verkleinerungsfaktors in jeder Zeile und Spalte des Bildes gezwungen sein, in manchen Bereichen eine beträchtliche Menge von wesentlichen Informationen und in anderen Bereichen des Bildes nur einen Teil der unwesentlichen Informationen zu löschen. Somit stellt das System keine effiziente Verkleinerung eines gegebenen Bildes sicher.
  • Um diese Situation zu verbessern, kann die Seite vor dem Unterabtasten so verarbeitet werden, daß sogenannte Bereiche mit geringen Informationen, wie zum Beispiel weiße oder schwarze Leerstellenbereiche, entfernt werden. Da dies zu einer bestimmten Reduktion der Datenmenge in dem Bild führt, das unterabgetastet werden soll, gehen weniger informationsführende Daten verloren, weil der Grad des erforderlichen Unterabtastens vermindert wird. Die Klarheit der Seite ist besser, und die Verkleinerung von Text wird minimiert. Dieses Verfahren wird ausführlicher in L. O'Gorman et al., "Subsampling Text Images", ist Intl. Conf. on Document Analysis and Recognition, St. Malo, Frankreich, Sept. 1991, S. 219-227, beschrieben.
  • Es bleibt jedoch ein Problem. Diese soweit beschriebenen Verfahren zur Reduktion oder Entfernung der geringe Informationen aufweisenden Bereiche einer Seite können in vielen Fällen deren Formatierung verzerren. Der Ausdruck "Formatierung" bedeutet in diesem Zusammenhang die anscheinenden räumlichen und/oder geometrischen Beziehungen zwischen den wesentlichen bildlichen Elementen der Seite, z. B. zwischen Blöcken von Text, den Textzeilen in einem Block, Tabellen und Abbildungen, Spalten von weißen Leerstellen zwischen Blöcken, Kopfteilen usw. - d. h. die besondere visuelle Erscheinung der gesamten Seite.
  • Gemäß einem Aspekt der vorliegenden Erfindung wird ein Verfahren nach Anspruch 1 bereitgestellt.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren nach Anspruch 10 bereitgestellt.
  • Das Problem wird überwunden, indem der Bruchteil eines gegebenen Bereichs geringer Informationen, der aus einer Seite entfernt wird, auf nicht mehr als der Bruchteil begrenzt wird, um den die gesamte Seite verkleinert werden soll.
  • Vorzugsweise werden die geringe Informationen aufweisenden Bereiche einer Seite identifiziert, indem zuerst auf der Grundlage eines Vergleichs jedes Bildpunkts mit Bildpunkten in benachbarten Positionen in den unmittelbar angrenzenden Zeilen (Spalten) ein Zeilen-(Spalten-)Prioritätswert für jeden Bildpunkt in dem Seitenbild bestimmt wird. Für jede Zeile (Spalte) wird eine Informationssumme berechnet, indem die Zeilen-(Spalten-)Prioritätswerte für jeden Bildpunkt in der Zeile (Spalte) aufsummiert werden. Die geringe Informationen aufweisenden Bereiche einer Seite werden als diejenigen definiert, die eine Gruppe angrenzender Zeilen (Spalten) mit Informationssummen von weniger als einem vorbestimmten Schwellenwert umfassen.
  • Kurze Beschreibung der Zeichnungen
  • Fig. 1 ist ein Blockschaltbild eines elektronischen Dokumentensystems, bei dem die vorliegende Erfindung verwendet werden kann;
  • Fig. 2a und 2b zeigen eine dem durch das System von Fig. 1 implementierten Verkleinerungsverfahren unterworfene Dokumentenseite; und
  • Fig. 3 ist ein Flußdiagramm eines Verfahrens zur Unterkompaktierung einer gescannten Dokumentenseite durch ein Verfahren der Erfindung.
  • Ausführliche Beschreibung
  • Mit Bezug auf Fig. 1 ist ein elektronisches Dokumentensystem 100 zur Implementierung eines Verfahrens zur Verkleinerung des Bildes einer Dokumentenseite gezeigt.
  • Ein (nicht gezeigtes) Dokumentenoriginal wird durch einen Scanner 110 gescannt, der das Dokument in digitale Bildsignale umsetzt. Das Dokument besteht als Beispiel hauptsächlich aus alphanumerischem Text. Die digitalen Bildsignale werden an einen Prozessor 120 angelegt, der die Signale für eine Anzeige 130 verarbeitet, bei der es sich als Beispiel um einen Monitor handelt. Der Prozessor 120 kann eine beliebige Art von Computersystem sein, wie zum Beispiel ein PC oder eine Workstation.
  • Der Prozessor 120 ist in der Lage, Zeilen oder Spalten der Dokumentenseite zu identifizieren, die Bereiche geringer Informationen sind, und bis zu einem maximalen Anteil der Bereiche geringer Informationen gemäß einem für die Seite festgesetzten Gesamt- Verkleinerungsprozentsatz adaptiv zu entfernen. Die Dokumentenseite kann dann auf der Anzeige 130 angezeigt und in dem Speicher 140 zur späteren Verwendung gespeichert werden. Außerdem kann dem Prozessor 120 ein Drucker 150 zum Empfangen der durch den Scanner 110 übertragenen Daten zugeordnet sein.
  • Das Verfahren der Entfernung von Daten geringer Informationen aus dem Dokumentenbild ist so ausgelegt, daß es die Formatierung der Originalseite aufrechterhält. Zum Beispiel zeigen Fig. 2a und 2b eine beispielhafte Dokumentenseite 200, die verkleinert wurde. Die Seite 200 umfaßt zwei Textblöcke 220, die von Daten geringer Informationen in der Form überschüssiger weißer Leerstellen umrandet werden, die sich in den Randspalten 205 und Randzeilen 210 befinden. Ein Überschriftsblock 225 und ein Rahmen 215 befinden sich über den Textblöcken 220. Der Rahmen 215 und die überschüssigen weißen Leerstellen werden als Daten geringer Informationen angesehen und können einer größeren Datenreduktion unterworfen werden als Teile der Seite, auf denen sich die Textblöcke 220 oder der Überschriftsblock 225 befinden.
  • Um die Seite zu verkleinern muß ein Teil der Dokumentendaten entfernt werden. Ein erster Gesichtspunkt bei der Entfernung von Dokumentendaten besteht darin, daß die Formatierung der Seite aufrechterhalten werden soll. Ein zweiter Gesichtspunkt besteht darin, daß die Klarheit der informationsführenden Daten bewahrt werden soll.
  • Es ist wünschenswert, die anscheinenden räumlichen Beziehungen und das Layout des Überschriftsblocks 225, der Textblöcke 220, der Randspalten 205 und Randzeilen 210 der Seite 200 zu bewahren, um eine ähnliche ästhetische Erscheinung einer verkleinerten Bildseite 250 beizubehalten. Datenreduktionen, die zu viele Daten mit geringen Informationen beseitigen, können ein Zusammenschließen der Textblöcke 220 oder eine Änderung der gesamten ästhetischen Erscheinung der Bildseite verursachen.
  • Die Dokumentenseite 200 wird gescannt, um Bereiche mit Daten mit geringen Informationen zu identifizieren. Zusätzlich wird ein gewünschter Gesamt- Verkleinerungsprozentsatz für das Dokument bestimmt. Die Menge der Daten mit geringen Informationen aus jedem der verschiedenen Bereiche mit geringen Informationen wird um bis zu dem für die gesamte Seite festgesetzten Verkleinerungsprozentsatz reduziert.
  • Wenn zum Beispiel der Gesamt- Verkleinerungsprozentsatz für die Seite 200 40% beträgt und die Randspalte 205, d. h. ein Bereich mit geringen Informationen, drei Zeilen mit geringen Informationen umfaßt, dann können eine der drei Zeilen mit geringen Informationen oder 33% entfernt werden. Wenn eine zweite Zeile mit geringen Informationen entfernt würde, dann träte eine Reduktion um 66% der Zeilen mit geringen Informationen in diesem Bereich auf, was den für diese Seite festgesetzten Verkleinerungsprozentsatz übersteigen würde. Eine solche Reduktion in einem gegebenen Bereich mit geringen Informationen sollte vermieden werden.
  • Eine ähnliche Analyse wird für jeden Bereich mit geringen Informationen durchgeführt, der auf der Seite 200 identifiziert wird. Durch eine derartige Reduktion der Daten mit geringen Informationen wird die Formatierung der Seite 200 im allgemeinen bewahrt, so wie es in Fig. 2b gezeigt ist, und die anfängliche Reduktion der in der Seite 200 enthaltenen Daten konzentriert sich auf die Daten mit geringen Informationen. Die durch die Reduktion der Daten mit geringen Informationen bewirkte Gesamtreduktion der Daten beträgt typischerweise zwischen 5% und 40%. Zur Erzeugung der gewünschten Gesamt-Datenreduktion und letztlich der Verkleinerung des Dokuments kann dann anschließend ein herkömmliches Unterabtastungsverfahren verwendet werden.
  • Mit Bezug auf Fig. 3 ist ein Flußdiagramm eines Verfahrens der Verkleinerung eines Bildes einer Dokumentenseite innerhalb eines vorbestimmten Schwellenwerts gezeigt. Der vorbestimmte Schwellenwert stellt einen Gesamt-Verkleinerungsprozentsatz des Bildes dar, der auftreten kann, und liegt vorzugsweise im Bereich von 5-50%. Der Prozentsatz der Verkleinerung ist vorzugsweise adaptiv, so daß der gewünschte Grad der Seitenformatierung aufrechterhalten wird. Der Ausdruck "adaptiv" bedeutet die Möglichkeit verschiedene Abschnitte der Dokumentendaten um verschiedene Prozentsätze zu reduzieren, solange der Prozentsatz der Verkleinerung für einen gegebenen Bereich nicht den für die gesamte Seite festgesetzten Verkleinerungsprozentsatz übersteigt. Die Verkleinerung wird erzielt, indem Bereiche mit geringen Informationen in den Zeilen und Spalten der Bildseite verkleinert werden. Zu den Bereichen mit geringen Informationen gehören zum Beispiel u. a. leere Ränder und Leerräume zwischen Zeilen. Es versteht sich, daß bei einer wahllosen Entfernung dieser Bereiche mit geringen Informationen die Formatierung der Seite nicht aufrechterhalten wird. Zu anderen Bereichen, die einer wesentlichen Bildverkleinerung unterworfen werden, gehören zum Beispiel rauschbehaftete Bereiche wie zum Beispiel Grafikelemente, zu denen Randlinien oder Tabellengrenzen gehören können.
  • Um die Bereiche mit geringen Informationen einer gegebenen Bildseite zu identifizieren wird für jede Zeile (Spalte) in der Seite eine Informationssumme berechnet (Schritt 310). Die Informationssumme stellt die Fülle von informationsführenden Daten- oder Textmerkmalen dar, die in einer gegebenen Zeile (Spalte) enthalten sind, und kann verwendet werden, um die Wichtigkeit der Aufrechterhaltung der gegebenen Zeile (Spalte) nach Priorität zu ordnen. Die Informationssumme wird als Beispiel mit einer 1 · 3-Maske berechnet. Mit dieser Maske werden Zeileninformationen gemessen, wobei der gerade untersuchte Bildpunkt der mittlere Bildpunkt X0 ist und die Bildpunkte X1 und X2 Bildpunkte in derselben Position wie X0 in angrenzenden Zeilen auf jeder Seite von X0 darstellen, so wie es nachfolgend gezeigt ist:
  • X1
  • X0
  • X2
  • Der Wert für jeden Bildpunkt in der Maske ist ein Binärwert, d. h. entweder eine 1 oder eine 0. Ein Bildpunkt mit einem Wert von 1 zeigt einen EIN- Bildpunkt oder schwarzen Bildpunkt an, und ein Bildpunkt mit einem Wert von 0 zeigt einen AUS- Bildpunkt oder weißen Bildpunkt an. Genauso wird für jede Spalte eine Informationssumme berechnet, indem als Beispiel eine 3 · 1-Maske verwendet wird (Schritt 315). Mit dieser Maske werden Spalteninformationen gemessen, wobei der mittlere Bildpunkt X0 untersucht wird und die Bildpunkte X1 und X2 Bildpunkte in derselben Position wie X0 in angrenzenden Spalten auf jeder Seite von X0 darstellen, so wie es nachfolgend gezeigt ist:
  • X1 X0 X2
  • Die folgende Tabelle zeigt die Priorität der Informationen in einer gegebenen Zeile (Spalte) auf der Grundlage des Werts der Maske an:
  • Wenn die Bildpunkte X1, X0 und X2 die Werte 010 oder 101 haben, dann wird dem Bildpunkt X0 ein hoher Prioritätswert (10) zugeordnet, um die Getrenntheit aufrechtzuerhalten. Getrenntheit bezieht sich auf die Trennung zwischen verschiedenen Rändern im Text, wie zum Beispiel Zwischenräume zwischen verschiedenen Zeichen oder zur Aufrechterhaltung des Kontrasts in demselben Zeichen, wie zum Beispiel in dem Buchstaben "0". Wenn der Bildpunkt X0 gelöscht wird, dann wären die übrigen Bildpunkte 00 oder 11 und würden den kontrastierenden Bildpunkt nicht mehr enthalten, der eine Trennung zwischen den Bildpunkten X1 und X2 bereitstellt. Als Folge können Zeichen im Text entweder durch Zusammenschluß mit angrenzenden Zeichen oder durch Verlust charakteristischer Merkmale wie zum Beispiel Löcher oder Kurven, wie in den Zeichen "o" oder "g", verzerrt werden.
  • Wenn die Bildpunkte X1, X0 und X2 die Werte 011 oder 110 aufweisen, dann wird eine mittlere Priorität (5) zugewiesen, um anzuzeigen, daß der Einschluß von X0 wichtig ist, um den Rand eines Zeichens aufrechtzuerhalten. Wenn die Zeile mit dem Bildpunkt X0 gelöscht wird, dann kann der Rand des Zeichens deformiert werden.
  • Wenn die Bildpunkte X1, X0 und X2 den Wert 111 aufweisen, dann wird dem Bildpunkt X0 ein Prioritätswert von 2 zugewiesen. Obwohl das Löschen des Bildpunkts X0 zu einem Formverlust führen könnte, ist es unwahrscheinlich, daß der Verlust die Form des Zeichens wesentlich verzerrt und es wird der Aufrechterhaltung des Bildpunkts daher weniger Wichtigkeit zugeteilt.
  • Wenn die Bildpunkte X1, X0 und X2 die Werte 001 oder 100 aufweisen, dann wird dem Bildpunkt X0 ein Prioritätswert von 1 zugeordnet. Das Löschen der Zeile mit dem Bildpunkt X0 bewirkt eine Abnahme der weißen Leerstellen, bewirkt jedoch keinen Verlust des Zusammenhangs, da einer der angrenzenden Bildpunkte ebenfalls einen Wert von Null aufweist. Wenn der angrenzende Bildpunkt mit einem Wert von Null jedoch auch gelöscht wird, dann ist das Vorliegen von X0 wichtig, um den Zusammenhang aufrechtzuerhalten.
  • Wenn Bildpunkte X1, X0 und X2 den Wert 000 aufweisen, dann wird dem Bildpunkt X0 ein Prioritätswert von 0 zugeordnet. Da alle drei Bildpunkte weiße Leerstellen darstellen, führt das Löschen der Zeile mit dem Bildpunkt X0 lediglich zu einer Abnahme der weißen Leerstellen und verursacht keine Verzerrung des Texts.
  • Die Informationssumme für jede Zeile (Spalte) wird bestimmt, indem für jeden Bildpunkt in der Zeile (Spalte) ein Prioritätswert bestimmt wird und die Prioritätswerte zusammenaddiert werden. Wenn die Informationssumme größer als ein erster vorbestimmter Schwellenwert ist (Schritt 320), dann wird bestimmt, daß die schwarzen Bildpunkte schwarze Hintergrundinformationen sind, und nicht Text- Vordergrundinformationen, d. h. weißer Text auf einem schwarzen Hintergrund oder ein schwarzer Grenzrahmen (Schritt 325). Als solche wird die Länge des Laufs von schwarzen Bildpunkten multipliziert mit dem Informationsmaß des schwarzen Hintergrunds von der Informationssumme subtrahiert, d. h. die Zeile (Spalte) wird gelöscht (Schritt 330).
  • Der erste vorbestimmte Schwellenwert basiert auf einer minimalen Länge eines Laufs von schwarzen oder EIN-Bildpunkten (1) entlang einer Zeile (Spalte). Eine Zeile (Spalte) von EIN-Bildpunkten, die diesen ersten Schwellenwert übersteigt, wird als Hintergrundinformationen angesehen und kann stärker als reguläre Textinformationen verkleinert werden. Typischerweise beträgt der erste vorbestimmte Schwellenwert vorzugsweise mindestens 100 aufeinanderfolgende EIN-Bildpunkte.
  • Wenn die Informationssumme einer Zeile (Spalte) über einem zweiten vorbestimmten Schwellenwert liegt, dann wird die Zeile (Spalte) als zu viele Informationen für eine Löschung der Zeile (Spalte) aus dem Bild enthaltend identifiziert (Schritt 335). Wenn die Informationssumme der Zeile (Spalte) unter den zweiten vorbestimmten Schwellenwert fällt, dann wird die Zeile (Spalte) als "entfernbar" gekennzeichnet (Schritt 340). Typischerweise beträgt der zweite vorbestimmte Schwellenwert vorzugsweise mindestens 60 EIN- Bildpunkte.
  • Sobald die Informationssummen für das gesamte Bild berechnet wurden, werden diese Summen in Rasterreihenfolge untersucht, um zu bestimmen, wieviele Zeilen und Spalten entfernt werden können, ohne die Formatierung des Dokuments zu zerstören (Schritt 345). Die Anzahl von als "entfernbar" gekennzeichneten aufeinanderfolgenden Zeilen und Spalten wird vermerkt (Schritt 350), und es wird eine Zahl als der maximale Prozentsatz von Zeilen gewählt, die aus den aufeinanderfolgenden Zeilen (Spalten) entfernt werden können (Schritt 355). Wenn zum Beispiel eine maximale Verkleinerung von 40% zulässig ist und die Anzahl von aufeinanderfolgenden Zeilen mit geringen Informationen vier ist, dann kann nur eine Zeile mit geringen Informationen entfernt werden, d. h. 25% der aufeinanderfolgenden Zeilen mit geringen Informationen. Wenn zwei der vier Zeilen mit geringen Informationen entfernt würden, würde eine Verkleinerung von 50% auftreten, d. h. mehr als die maximal zulässige Verkleinerung.
  • Bei der Bestimmung, welche der Zeilen oder Spalten entfernt werden sollen, werden die Zeilen (Spalten) mit der kleinsten Informationssumme identifiziert und entfernt. Ein analoger Prozeß wird für jeden Bereich mit geringen Informationen durchgeführt. Nachdem jede Zeile und Spalte gescannt wurde und jede mögliche Zeile und Spalte entfernt wurde, ist die Verkleinerungsprozedur abgeschlossen (Schritt 360). Wie oben besprochen können Unterabtastungsverfahren auf das Dokument angewandt werden, um die gewünschte Gesamt-Verkleinerung zu erzielen.
  • Die obigen Darlegungen sind lediglich beispielhaft für die Erfindung und es versteht sich somit, daß Fachleute in der Lage sein werden, zahlreiche alternative Anordnungen zur Ausübung der Erfindung zu konzipieren.

Claims (9)

1. Verfahren zur Verkleinerung eines Bildes einer Dokumentenseite (200) um einen bestimmten Gesamt- Prozentsatz der Verkleinerung, wobei das Bild eine Mehrzahl von Bildpunkten umfaßt, die Zeilen und Spalten bilden, wobei die Dokumentenseite (200) einen Bereich mit geringen Informationen (205, 210) mit mindestens eines von weißen Rändern, Leerstellen zwischen Textzeilen, Randlinien bei graphischen Bildern, Tabellengrenzen, weißen Leerstellen und schwarzen Leerstellen umfaßt, wobei das Verfahren durch folgendes gekennzeichnet ist:
selektives Entfernen eines Teils des besagten Bereichs mit geringen Informationen (205, 210) aus der Dokumentenseite (200), wobei der besagte Teil nicht größer als der besagte Gesamt-Prozentsatz ist, bevor das Bild um den besagten Gesamt-Prozentsatz der Verkleinerung verkleinert wird.
2. Verfahren nach Anspruch 1, mit dem Schritt der Identifizierung des Bereichs mit geringen Informationen, wobei der besagte Identifizierungsschritt die folgenden Schritte umfaßt:
Berechnen einer Informationssumme für jede Zeile von Bildpunkten in dem Bild auf der Grundlage von Prioritätswerten, die jedem Bildpunkt in der Zeile zugewiesen werden;
Berechnen einer Informationssumme für jede Spalte von Bildpunkten in dem Bild auf der Grundlage von Prioritätswerten, die jedem Bildpunkt in der Spalte zugewiesen werden;
Identifizieren einer Zeile oder Spalte mit einer Informationssumme, die einen ersten vorbestimmten Schwellenwert überschreitet, als eine Reihe mit geringen Informationen;
Identifizieren einer Zeile oder Spalte mit einer Informationssumme, die unter einen zweiten vorbestimmten Schwellenwert fällt, als eine Reihe mit geringen Informationen; und
Identifizieren jeder Gruppe benachbarter Reihen mit geringen Informationen als einen Bereich mit geringen Informationen.
3. Verfahren nach Anspruch 2, wobei der besagte Prioritätswert für einen ersten Bildpunkt in einer gegebenen Zeile auf einem binären Wert des besagten ersten Bildpunkts in der Zeile und Bildpunkten in entsprechenden Positionen in Zeilen auf jeweiligen Seiten der besagten gegebenen Zeile basiert.
4. Verfahren nach Anspruch 2, wobei der besagte Prioritätswert für einen ersten Bildpunkt in einer gegebenen Spalte auf einem binären Wert des besagten ersten Bildpunkts in der Spalte und Bildpunkten in entsprechenden Positionen in Spalten auf jeweiligen Seiten der besagten gegebenen Spalte basiert.
5. Verfahren nach Anspruch 3, wobei der besagte erste vorbestimmte Schwellenwert die Anzahl aufeinanderfolgender Bildpunkte mit einem hohen Prioritätswert in der besagten gegebenen Zeile anzeigt.
6. Verfahren nach Anspruch 4, wobei der besagte erste vorbestimmte Schwellenwert die Anzahl aufeinanderfolgender Bildpunkte mit einem hohen Prioritätswert in der besagten gegebenen Spalte anzeigt.
7. Verfahren nach Anspruch 6, wobei der besagte erste vorbestimmte Schwellenwert mindestens 100 aufeinanderfolgende Bildpunkte mit einem hohen Prioritätswert beträgt.
8. Verfahren nach Anspruch 2, wobei der besagte zweite vorbestimmte Schwellenwert ungefähr 60 aufeinanderfolgende Bildpunkte mit einem hohen Prioritätswert beträgt.
9. Verfahren zur Verkleinerung des Bildes einer gescannten Dokumentenseite mit einer Mehrzahl von Bildpunkten um einen bestimmten Gesamt-Prozentsatz der Verkleinerung, wobei jedem Bildpunkt ein Prioritätswert zugewiesen wird, wobei das Verfahren die folgenden Schritte umfaßt:
Berechnen einer Informationssumme für jede Zeile und Spalte des Bildes auf der Grundlage der Summe der Prioritätswerte der Bildpunkte in jeder Zeile und Spalte;
Identifizieren von Blöcken mindestens zweier benachbarter Zeilen oder Spalten mit Informationssummen, die unter einen vorbestimmten Schwellenwert fallen; und
Entfernen einer Anzahl benachbarter Zeilen oder Spalten um einen Betrag, der kleiner oder gleich dem besagten Prozentsatz vor der Durchführung der Verkleinerung für das gesamte Bild ist.
DE69415469T 1993-10-15 1994-10-05 Verfahren zur Verkleinerung des Bildes eines Dokuments Expired - Fee Related DE69415469T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/138,153 US5461707A (en) 1993-10-15 1993-10-15 Method of reducing document size for digital display

Publications (2)

Publication Number Publication Date
DE69415469D1 DE69415469D1 (de) 1999-02-04
DE69415469T2 true DE69415469T2 (de) 1999-06-24

Family

ID=22480684

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69415469T Expired - Fee Related DE69415469T2 (de) 1993-10-15 1994-10-05 Verfahren zur Verkleinerung des Bildes eines Dokuments

Country Status (5)

Country Link
US (1) US5461707A (de)
EP (1) EP0649245B1 (de)
JP (1) JP2971344B2 (de)
CA (1) CA2128390C (de)
DE (1) DE69415469T2 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6563964B1 (en) 1999-02-08 2003-05-13 Sharp Laboratories Of America, Inc. Image downsampling using redundant pixel removal
DE102004058937A1 (de) * 2004-12-07 2006-06-08 Micronas Gmbh Verfahren zur Skalierung eines Bildzeichens
US20080062438A1 (en) * 2006-09-12 2008-03-13 Xiofan Lin Document resizer
US7747107B2 (en) * 2007-03-06 2010-06-29 Mitsubishi Electric Research Laboratories, Inc. Method for retargeting images
JP4962291B2 (ja) * 2007-12-13 2012-06-27 株式会社デンソー 車載用画像処理装置及び車載用画像表示装置
US8675241B2 (en) * 2008-05-17 2014-03-18 Konica Minolta Laboratory U.S.A., Inc. Method for printing oversized image data
US20100017706A1 (en) * 2008-07-21 2010-01-21 Xerox Corporation Document size conversion
JP5500194B2 (ja) * 2012-03-22 2014-05-21 日本電気株式会社 撮影画像処理装置及び撮影画像処理方法
CN103150291B (zh) * 2013-01-31 2015-09-09 小米科技有限责任公司 文件切边方法、终端及服务器
US10133463B2 (en) * 2014-12-23 2018-11-20 Business Objects Software, Ltd Smart responsive behavior for pixel-perfect designs
US9400776B1 (en) * 2015-03-09 2016-07-26 Vinyl Development LLC Adaptive column selection
US10558742B2 (en) 2015-03-09 2020-02-11 Vinyl Development LLC Responsive user interface system
TWI567568B (zh) * 2016-03-22 2017-01-21 文鼎科技開發股份有限公司 字型調整方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4412252A (en) * 1981-06-01 1983-10-25 Ncr Corporation Image reduction system
JPS60146369A (ja) * 1983-12-30 1985-08-02 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション イメ−ジ縮小方法
JPS63202181A (ja) * 1987-02-17 1988-08-22 Toshiba Corp ライン画信号除去方式
JPH0385962A (ja) * 1989-08-30 1991-04-11 Ricoh Co Ltd ファクシミリにおける画像サイズ縮小装置
JPH03171971A (ja) * 1989-11-30 1991-07-25 Mita Ind Co Ltd ファクシミリ装置
JPH03195176A (ja) * 1989-12-25 1991-08-26 Sanyo Electric Co Ltd ファクシミリ装置
JPH0591270A (ja) * 1991-05-02 1993-04-09 Ricoh Co Ltd フアクシミリ装置
JPH05167869A (ja) * 1991-12-12 1993-07-02 Hitachi Ltd ファクシミリ装置

Also Published As

Publication number Publication date
CA2128390C (en) 1998-12-29
JP2971344B2 (ja) 1999-11-02
CA2128390A1 (en) 1995-04-16
EP0649245B1 (de) 1998-12-23
US5461707A (en) 1995-10-24
DE69415469D1 (de) 1999-02-04
EP0649245A1 (de) 1995-04-19
JPH07220064A (ja) 1995-08-18

Similar Documents

Publication Publication Date Title
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE3546136C2 (de)
DE3854381T2 (de) Bildverarbeitungssystem und Verfahren unter Benutzung kombinierter Schwarzweiss und Grautonbilddaten.
DE3689416T2 (de) Mustermerkmalextraktion.
DE3716787C2 (de)
DE4311172C2 (de) Verfahren und Einrichtung zum Identifizieren eines Schrägenwinkels eines Vorlagenbildes
DE3546337C2 (de)
DE69428082T2 (de) Verfahren zur Detektion finanzieller Beträge in binären Bildern
DE69415469T2 (de) Verfahren zur Verkleinerung des Bildes eines Dokuments
DE69605255T2 (de) Vorrichtung und Verfahren für die Extraktion von Artikeln eines Dokuments
DE69826044T2 (de) Vektorkartenplanarisierung und -einfang
DE19814075B4 (de) Verfahren zum Abtasten und Erkennen mehrerer Fotografien und zum Beseitigen von Randfehlern
DE3320691C2 (de)
DE69121523T2 (de) Beseitigung von fehlerhaften Punkten in einem abgetasteten Bild
DE69926469T2 (de) Filterung von Bilddaten bei der Verarbeitung zusammengesetzter Dokumente
DE69029594T2 (de) Ermittlung von Linienabschnitten und von vorbestimmten Mustern in einem optisch abgetasteten Dokument
DE3789091T2 (de) Bildverarbeitungsverfahren und -system zur Bildrekonstruktion.
DE102007040070B4 (de) Bilddichteumwandlungsverfahren, Bildverbesserungsverarbeitungseinrichtung und dafür geeignetes Programm
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE68904611T2 (de) Verfahren und vorrichtung zur erzeugung von gemischten bildern.
DE3751688T2 (de) Verfahren zur Glättung von Bildsignalen
DE60118297T2 (de) Verfahren zum entfernen von farbwechselartefakten aus digitalen farbbildern
DE69512074T2 (de) Verfahren und gerät zur automatischen bestimmung eines textgebiets auf einem bitmapbild
DE69508941T2 (de) Automatische feststellung von leerseiten und grenzlinien für zweitonbilder
DE69511136T2 (de) Pixelkorrektur und Glättungsverfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee