DE69131496T2 - Bildverarbeitungs-Gerät und Verfahren - Google Patents

Bildverarbeitungs-Gerät und Verfahren

Info

Publication number
DE69131496T2
DE69131496T2 DE69131496T DE69131496T DE69131496T2 DE 69131496 T2 DE69131496 T2 DE 69131496T2 DE 69131496 T DE69131496 T DE 69131496T DE 69131496 T DE69131496 T DE 69131496T DE 69131496 T2 DE69131496 T2 DE 69131496T2
Authority
DE
Germany
Prior art keywords
character
line
spaces
image data
codes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69131496T
Other languages
English (en)
Other versions
DE69131496D1 (de
Inventor
Masayuki Kiriyama
Kinya Takahashi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2125932A external-priority patent/JPH0424782A/ja
Priority claimed from JP2125931A external-priority patent/JPH0424757A/ja
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69131496D1 publication Critical patent/DE69131496D1/de
Publication of DE69131496T2 publication Critical patent/DE69131496T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

    Hintergrund der Erfindung Gebiet der Erfindung
  • Die Erfindung betrifft ein Bildverarbeitungsgerät und insbesondere eine Technik, bei der nicht nur Zeichen sondern auch Leer-Freiräume von eingegebenen Bildinformationen erkannt werden und das Ergebnis der Erkennung in einem gewünschten Format erzeugt wird.
  • Zugehöriger Stand der Technik
  • Anforderungen an eine elektrischen Umwandlung von Nachrichten in einer Zeitung, einem Buch oder dergleichen und zum Ablegen oder Speichern als Datenbank, wodurch sie zur effektiven Verwendung freigegeben werden, wachsen schnell. Die Entwicklung eines Gerätes zur Zeichenerkennung, das ein gedrucktes Dokument mit einer hohen Geschwindigkeit sowie mit einer hohen Genauigkeit eingeben kann, wird prompt durchgeführt.
  • Es ist ein OCR (Optisches-Zeichen-Lese-Gerät) als ein derartiges Gerät zur Zeichenerkennung bekannt.
  • Beispielsweise ist bislang ein Ausgabeformat eines durch das OCR erkannten Dokumentes fest vorgegeben und der Anwender kann das Ausgabeformat nicht bestimmen. D. h., sowohl die Betriebsart des Anzeigens von lediglich Zeichencodes durch Ignorieren des Stils bzw. der Art des gewünschten Dokumentes als auch die Betriebsart des Er zeugens von Leerzeichen- und Zeilenwechselcodes entsprechend dem Stil eines gewünschten Dokumentes sind vorbestimmt. Andererseits kann ein Absatz nicht mit einer hohen Genauigkeit erkannt werden.
  • Jedoch weist das vorstehend beschriebene Gerät die nachstehende Nachteile auf, da der Anwender das Ausgabeformat nicht verändern kann.
  • (1) Wenn lediglich Zeichencodes erzeugt werden, werden Leerzeichen- und Zeilenwechselcodes entsprechend einem gewünschten Dokumentformat nach Beendigung der Erkennung neu eingegeben.
  • (2) Falls sowohl die Leerstelle als auch der Absatz von Anfang an erkannt und durch einen Anzeigebereich angezeigt werden, tritt ein Problem derart auf, daß zur Erkennung eine Zeitdauer benötigt wird.
  • D. h., es ist ein Problem derart vorhanden, daß zum Erhalten eines gewünschten Dokumentes eine Zeitdauer benötigt wird, solange das Ausgabeformat nicht bestimmt werden kann.
  • (3) Selbst wenn ein Absatz erkannt wird, ist ein Problem derart vorhanden, daß der Absatz nicht mit einer hohen Genauigkeit erkannt werden kann.
  • JP-A-6 016 317 1 beschreibt eine Satz-Lesevorrichtung zum Analysieren eines entweder in horizontalen oder vertikalen Zeilen organisierten gedruckten Texts, um Absatzspalten oder -Zeichenreihen zu erkennen. Sätze in einem Text werden durch Hinzufügen einer Anzeige-Sequenz identifiziert, wobei diese Sequenz dann durch eine Muster-Leseeinrichtung gelesen wird.
  • JP-A-3 025 692 beschreibt ein Verfahren, bei dem Leer- Freiräume zwischen Zeichen in einem Text von längeren Freiräumen am Ende eines Absatzes durch Vergleich dieser Leer-Freiräume mit dem mittleren Teilungsabstand zwischen erfaßten Zeichen unterschieden werden.
  • Jedoch offenbart diese nach dem Prioritätsdatum der vorliegenden Erfindung veröffentlichte Druckschrift nicht deutlich, wie die Anzahl der Leerzeichencodes zu bestimmen ist, welche zur Darstellung der Leer-Freiräume zwischen Zeichen zugewiesen werden müssen.
  • Eine derartige Zuweisung wird durch die vorliegende Erfindung mittels den Einrichtungen und Schritten durchgeführt, die jeweils in den beiliegenden Ansprüchen 1 und 5 beschriebenen sind.
  • Ausführungsbeispiele der Erfindung sind nachstehend unter Bezug auf die beigefügte Zeichnung beschrieben.
  • Fig. 1 stellt ein Blockschaltbild eines Ausführungsbeispiels der Erfindung dar,
  • Fig. 2 stellt eine erläuternde Darstellung eines Erkennungsbetriebsart-Auswahlbildschirms dar,
  • Fig. 3A und 3B stellen Darstellungen eines Beispiels eines Dokumentbildes dar,
  • Fig. 4 stellt eine Darstellung von Hauptdaten-Gebieten dar,
  • Fig. 5 stellt ein Flußdiagramm eines Erkennungsergebnis- Ausgabebereiches dar,
  • Fig. 6 stellt ein detailliertes Flußdiagramm eines Zeichenkette-Ausgabebereiches dar,
  • Fig. 7 stellt eine Beispiel eines Dokumentbildes dar, und
  • Fig. 8 stellt ein Flußdiagramm einer Absatzerfassung dar.
  • Die Erfindung kann auf ein Zeichenerkennungsgerät oder auf ein Zeichenverarbeitungsgerät mit einem Zeichenerkennungsgerät angewendet werden. Die Erfindung kann auf ein Gerät mit einer Vorrichtung oder auf ein System mit einer Vielzahl von Vorrichtungen angewandt werden.
  • Fig. 1 stellt ein Blockschaltbild eines Zeichenerkennungsgerätes gemäß einem Ausführungsbeispiel dar. Bezugszeichen 1 kennzeichnet einen Kathodenstrahlröhre (CRT)-Anzeigebereich zum Anzeigen von Dokument-Bilddaten durch Raster-Abtastung, 2 ein Video-Speicher mit wahlfreiem Zugriff (VRAM) zum Speichern von Muster-Entwicklungsinformationen auf einem Bildschirm des CRT-Anzeigebereiches 1, 3 eine Anzeigesteuereinrichtung zum Steuern der Entwicklung der Muster in dem VRAM 2 und des Musterlesens an den CRT-Anzeigebereich 1, 4 einen Mikroprozessor (MPU) zum ganzheitlichen bzw. integrierten Steuern der jeweiligen Bereiche, 5 einen Hauptspeicher mit einem ein Steuerprogramm aufweisenden Festspeicher (ROM) und einem als Arbeitsspeicher für Datenverarbeitungen dienenden RAM, 6 eine Zeichenerkennungseinrichtung zum Anpassen eines Zeichenbildes und eines Musters und zum Erzeugen eines Zeichencodes, 7 eine externe Vorrichtung mit magnetischen Platten, auf die das Ergebnis der Unterscheidung und ein in Frage kommendes Zeichen geschrieben wird, 8 eine Zeigevorrichtung (PD), die auch als Anzeigeeinrichtung der Erfindung dient und eine willkürliche Position in dem CRT-Anzeigebereich 1 bestimmt, 9 eine Tastatur und 10 einen Eingangs/Ausgangs- (E/A)-Bus zum Verbinden jedes Blockes mit der MPU 4.
  • Bei dem Blockschaltbild gemäß Fig. 1 wurde die Erläuterung bezüglich des Zeichenerkennungsgerätes durchgeführt. Jedoch kann eine Erkennungsfunktion ebenfalls einem vorstehend angeführten Zeichenverarbeitungsgerät hinzugefügt werden. Dabei wird ein Dokument-Verarbeitungsprogramm ebenfalls in dem ROM gespeichert. Die MPU wird ebenfalls in der Zeichenerkennungseinrichtung 6 bereitgestellt und die Verarbeitungen werden parallel zu der Dokument-Verarbeitungssteuerung durch die MPU 4 ausgeführt.
  • Wenn ein Symbol zum Ausführen der Erkennungsverarbeitung auf dem Bildschirm während der Bearbeitung des Dokumentes angezeigt wird und das Symbol durch eine Zeigevorrichtung (PD) oder dergleichen bestimmt wird, wird die Erkennungsverarbeitung begonnen und ein Menü zum Auswählen von beispielsweise eines Ausgabeformates des Ergebnisses der Erkennung wird angezeigt. Oder wenn ein Symbol, zum Eingeben eines Bildes durch eine Abtastvorrichtung, bestimmt wird, kann ein in Fig. 2 gezeigtes Menü ebenfalls automatisch angezeigt werden.
  • Fig. 2 zeigt einen Menü-Bildschirm, der auf dem CRT- Anzeigebereich 1 angezeigt wurde und der zum willkürlichen Auswählen des Ausgabeformates verwendet wird. Mittels des Menü-Bildschrims kann der Anwender unter Verwendung der PD 8 und der KBD 9 eine gewünschte Betriebsart und willkürlich ein Ausgabeformat bestimmen.
  • Als Ergebnis der Erkennung erzeugt die MPU 4 eine Zeichenkette mit einem Format entsprechend der aus den Ausgabedaten des Zeichenerkennungsgerätes bestimmten Ausgabebetriebsart.
  • Fig. 3A stellt eine schematische Darstellung eines Beispiels eines Dokumentbildes dar. Ein als schraffierter Abschnitt gezeigtes Rechteck 31 kennzeichnet ein umschriebenes Rechteck jedes Zeichens. Bezugszeichen 32 kennzeichnet ein Rechteck einer Zeichenzeile.
  • Die MPU in der Erkennungseinrichtung 6 erhält ein umschriebenes Rechteck jedes Zeichens gemäß 31 in Fig. 3 aus dem Dokumentbild mittels einer Ausschneideverarbeitung eines Zeichens. Nachfolgend wird das Zeichenbild erkannt und ein Zeichencode wird als Ergebnis der Erkennung erhalten. Den Zeichencode jedes Zeichens und die Position der umschriebenen Rechtecke anzeigende Informationen werden in dem RAM 5 des Gerätes als Informationen gespeichert, wie in Fig. 3B gezeigt ist.
  • Bei der in der Erkennungseinrichtung 6 ausgeführten Zeichen-Ausschneideverarbeitung wird zuerst eine Häufigkeitsverteilung in der Richtung der Zeichenzeile hinsichtlich des eingegebenen Dokumentbildes erhalten und die Position der Zeichenzeile wird erfaßt. Nachfolgend werden der linke und der rechte Rand jedes in der Zeichenzeile befindlichen Zeichens durch Erhalten der Zeichenzeile und der Häufigkeitsverteilung in der vertikalen Richtung in dem Bild des Zeichenzeilenabschnittes erfaßt. Daher werden die ersten und die letzten Zeichen in jeder Zeile eines Dokumentes als Objekt der Zeichenerkennung durch die Erkennungseinrichtung 6 unterschieden, so daß die Informationen bezüglich der ersten und letzten Zeichen ebenso in dem RAM 5 gespeichert werden.
  • Fig. 4 stellt eine Darstellung eines Beispiels eines Hauptdaten-Formates in dem RAM 5 des Gerätes dar.
  • Sieben Informationen von jedem Zeichen wurden in dem Zeichen-Informationsgebiet 41 entsprechend der Erscheinungsreihenfolge der Zeichen gespeichert. CD(i) (0 &le; i < die gesamte Anzahl der Zeichen) zeigt einen durch die Erkennungseinrichtung 6 erhaltenen Zeichencode an. Andererseits kennzeichnen gemäß Fig. 3B CPX(i), CPY(i), CPW(i) und CPH(i) umschriebene Rechtecke, CPX(i) und CPY(i) geben X- und Y-Koordinaten des linken oberen Rands des umschriebenen Rechteckes an und CPW(i) und CPH(i) stellen jeweils eine Breite und eine Höhe dar. BL(i) kennzeichnet die Anzahl von Leerzeichen, die direkt vor dem Zeichen einfügbar sind. LF(i) gibt die Anzahl der Zeilenwechselzeichen an, die direkt nach dem Zeichen als Begrenzung des Absatzes eingefügt sind. Anfangswerte von BL(i) und LF(i) werden auf Null gesetzt und Werte werden durch Verarbeitungen darin passend gespeichert, was nachstehend beschrieben ist. Werte werden durch das Zeichenerkennungsgerät in von BL(i) und LF(i) verschiedene Felder gespeichert.
  • Informationen bezüglich jeder Zeichenzeile werden in dem Zeichenzeilen-Informationsspeichergebiet 42 entsprechend der Erscheinungsreihenfolge der Zeichenzeilen gespeichert. Eine Adresse für das ersten Zeichen in dem Zeicheninformations-Speichergebiet der in der Zeichenzeile enthaltenen Zeichen wurde in LS(i) gespeichert. Gemäß Fig. 3B kennzeichnen LPX(j), LPY(j), LPW(j) und LPH(j) Rechtecke einer Zeichenzeile und zeigen die Minimal-Rechtecke an, die alle in der Zeichenzeile enthaltenen Zeichen vereinigen. PT(j) kennzeichnet einen Zeichenteilungsabstand einer die Zeichenzeile bildenden Zeichenkette. Ein Mittelwert wird von den Zeichenpositionen erhalten und in PT(j) gespeichert. Auf ähnliche Weise kennzeichnet WD(j) einen Mittelwert der Zeichenbreite der Zeichenzeile.
  • Fig. 5 stellt ein Flußdiagramm zum Ausgeben des Ergebnisses der Erkennung dar. Eine derartige Ausgabeverarbeitung wird entsprechend dem Programm in dem ROM 5 unter der Steuerung der MPU 4 ausgeführt.
  • Zuerst wird in Schritt S5-1 zum Erfassen des rechten und linken Rands eines Dokumentes eine X-Koordinate LX des linken Rands und eine X-Koordinate RX des rechten Rands eines Ziel-Dokumentbildes (siehe beispielsweise Fig. 7) erhalten. Die Koordinate des linken Rands LX wird als Minimalwert des linken Rands LPX(j) (0 &le; j < NL, wobei NL die Anzahl der Zeichenzeilen kennzeichnet) der Zeichenzeilen-Rechtecke in dem Zeichenzeilen-Informationsspeichergebiet 42 erhalten. Auf ähnliche Weise wird die Koordinate des rechten Rands als Maximalwert der Koordinaten des rechten Rands LPX(j) + LPW(j) der Zeichenzeilen erhalten. Die Koordinate des linken Rands LX und die Koordinate des rechten Rands RX des erhaltenen Dokumentes werden in dem RAM 5 gespeichert.
  • In einem Schritt S5-2 zum Erfassen einer Zeichenhöhe wird eine Zeichenhöhe FH eines Abschnittes entsprechend einem Körper in dem Dokument erhalten. Um die von dem Körper verschiedenen Zeichenzeilen zu entfernen, wird ein Abschnitt extrahiert, in dem die Zeichenzeilen-Rechtecke mit der gleichen Höhe, wie die, die in der vorherigen Zeile am häufigsten ununterbrochen auftauchen, und ein Mittelwert dieser Höhen wird berechnet und als Zeichenhöhe FH gesetzt. Eine Unterscheidung, ob die benachbarten Zeichenzeilen die gleiche Höhe aufweisen oder nicht, wird wie nachstehend beschrieben durchgeführt.
  • 1 - &alpha; < LPH(j - 1)/LPH(j) < 1 + &alpha;, Gleichung S5-2-1,
  • wobei 1 &le; j < NL ist.
  • &alpha; ist eine Konstante zum Absorbieren von Fehlern und wird beispielsweise auf 0,2 gesetzt. Folglich wird ein Kopfabschnitt 7-1 in Fig. 7 gelöscht.
  • In Schritt S5-3 zum Erfassen von Intervallen zwischen Zeichenzeilen wird ein Intervall LS zwischen Zeichenzeilen des Abschnittes entsprechend dem Körper erhalten. Auf gleiche Weise wie in dem Zeichenhöhe-Erfassungsbereich wird ein Abschnitt extrahiert, in dem der gleiche Freiraum zwischen Zeichenzeilen wie der Freiraum zwischen vorherigen Zeichenzeilen häufiger ununterbrochen auftaucht, und ein Mittelwert davon wird berechnet und als ein Intervall LS zwischen Zeilen gesetzt. Eine Unterscheidung, ob die benachbarten Intervalle zwischen den Zeichenzeilen die gleichen sind oder nicht, wird wie nachstehend beschrieben durchgeführt.
  • 1 - &alpha; < {LPY(j + 1) - (LPY(j) + LPH(j))}/ {LPY(j) - (LPY(j - 1) + LPH(j - 1))} < 1 + &alpha;
  • Gleichung S5-3-1,
  • wobei 1 &le; j < NL - 1 ist.
  • Die Zeichenhöhe FH und das Intervall LS zwischen Zeichenzeilen werden in dem RAM gespeichert. Somit können Absätze 7-2 und 7-3 in Fig. 7 unterschieden werden, was nachstehend beschrieben ist.
  • In Schritt S5-4 zum Erfassen einer Leerstelle werden Leerstellen entsprechend Leerzeichen in jeder Zeichenzeile gefunden bzw. erfaßt und in dem ROM 5 als BL(i) in dem Zeicheninformations-Speichergebiet 41 gespeichert.
  • In einer Zeichenzeile j wird ein Faktor berechnet, der angibt, um wievielmal die Länge {CPX(i) - (CPX(i - 1) + CPW(i - 1))} der Leerstellen zwischen einem Zeichen i-1 und einem Zeichen i (1 &le; i < die Anzahl von Zeichen in der Zeichenzeile j) größer als ein Zeichenteilungsabstand PT(j) der Zeichenzeile ist. Ein dem Faktor am nächsten kommender ganzer Wert wird als BL(i) in dem ROM 5 gespeichert. Falls keine Leerzeichen vorhanden sind, wird 0 in BL(i) substituiert bzw. eingesetzt und in dem RAM 5 gespeichert. Für ein erstes Zeichen s in der Zeichenzeile wird eine ganze Zahl durch die MPU 4 berechnet, die angibt, um wievielmal eine Differenz zwischen der Koordinate des linken Rands LX des Dokumentes und CPx(s) größer als der Zeichenteilungsabstand PT(j) ist. Ein Ergebnis der Berechnung wird als BL(s) in dem ROM 5 gespeichert.
  • In Schritt S5-5 zum Erfassen eines Absatzes wird eine Begrenzung des Absatzes erfaßt bzw. herausgefunden und ein vorbestimmter Wert wird in dem ROM 5 als LF(i) des Begrenzungszeichens gespeichert.
  • Die Begrenzung des Absatzes wird durch die MPU 4 unter den nachstehenden Bedingungen bestimmt.
  • (1) Ein Bereich, in dem das Intervall zwischen Zeichenzeilen größer als das Intervall LS zwischen Zeichenzeilen des Körpers ist, stellt eine Wendemarke bzw. einen Wendepunkt des Absatzes dar.
  • (2) Eine Zeichenzeile mit einer Leerstelle in dem Kopfabschnitt ist die erste Zeile des Absatzes.
  • (3) Eine Zeichenzeile, in der das letzte Zeichen nicht bis an den rechten Rand des Dokumentes reicht, ist die letzte Zeile des Absatzes.
  • Mit anderen Worten, die vorstehend beschriebenen Punkte (1) bis (3) werden als Grenze des Absatzes festgesetzt, wenn eine der nachstehenden Bedingungsgleichungen bzw. Relationen erfüllt ist.
  • Die vorstehend angeführten Bedingungen (1) bis (3) werden hinsichtlich der Zeichenzeile j (1 &le; j < NL) durch die nachstehenden Gleichungen ausgedrückt.
  • (1') {LPY(j) - (LPY(j - 1) + LPH(i))}/LS > m
  • (2') BL (s) > 0
  • (3') RX - CPX(e) > 2WD(j)
  • s kennzeichnet eine Zeichennummer des ersten Zeichens der Zeichenzeile j, e zeigt eine Zeichennummer des letzten Zeichens der Zeichenzeile j-1 an und m stellt eine Konstante wie beispielsweise 2 dar.
  • Falls die Gleichung (2') oder (3') erfüllt ist, wird 1 in LF(e) gesetzt. Falls die Gleichung (1') erfüllt ist, wenn ein ganzzahliger Wert, der am nächsten an den Wert von {LPY(j) - LPY(j - 1) + LPH(j - 1))}/(FH + LS) herankommt, gleich oder größer als 1 ist, wird ein Wert von einem derartigen ganzzahligen Wert+1 in LF(e) gesetzt. Falls der ganzzahlige Wert gleich 0 ist, wird 2 in LF(e) gesetzt. Ein Verarbeitungsablauf ist nachstehend mit Bezug auf die Fig. 7 und 8 ausführlich beschrieben.
  • In Schritt S5-6 zum Ausgeben einer Zeichenkette wird eine gewünschte Zeichenkette in der bestimmten Ausgabebetriebsart erzeugt.
  • Als eine Ausgabebetriebsart kann jeweils die Betriebsart zum Unterscheiden, ob Leerstellen in der Zeile erkannt werden oder nicht, die Betriebsart hinsichtlich des Einfügens eines Zeilenwechselcode nach jedem Zeilenende oder nach jedem Absatz eines zu erkennenden Dokumentes oder die Betriebsart des Nicht-Einfügens eines Zeilenwechselcodes unter Verwendung der PD 8 oder der KBD 9 auf dem Anzeigebildschirm der CRT 1 gemäß Fig. 2 bestimmt werden.
  • Fig. 6 stellt ein detailliertes Flußdiagramm des Zeichenkette-Ausgabebereiches dar. Ein Programm zum Steuern der vorstehend angeführten Verarbeitungen wird in dem ROM 5 gespeichert und die Verarbeitungen werden unter Steuerung der MPU 4 ausgeführt.
  • Verarbeitungen in den Schritten S6-3 bis S6-14 werden für NL Zeichenzeilen von der nullten Zeile bis zu der (NL-1)- ten Zeile durchgeführt. In Schritt S6-3 wird die Zeichennummer des ersten Zeichens der Zeichenzeile j für i gesetzt. Das erste Zeichen der Zeichenzeile kann aus LS(j) des Zeichenzeilen-Informationsspeichergebietes erhalten werden. Verarbeitungen in den Schritten S6-5 bis S6-12 werden bezüglich jedes in der Zeichenzeile j enthaltenen Zeichens durchgeführt. Eine Unterscheidung, ob das Zeichen das letzte Zeichen der Zeichenzeile ist oder nicht, wird durch Verzweigung der Bedingung in Schritt S6-4 durchgeführt. Falls als Erstes die Ausgabebetriebsart auf die Betriebsart zum Erkennen der Leerstellen in der Zeile (Schritt S6-5) gesetzt wurde und falls ebenso viele Freiräume wie Leerzeichen vor dem Zeichen i (Schritt S6-6) vorhanden sind, werden in (Schritt S6-7) die BL(i) Leerzeichen auf der CRT 1 erzeugt. Falls in den Schritten S6-5 und S6-6 auf NEIN (N) entschieden wird, wird nichts erzeugt und die Verarbeitungsroutine schreitet zu Schritt S6-8 voran. In Schritt S6-8 wird der Zeichencode CD(i) als durch die Erkennungseinrichtung erkanntes Ergebnis der Anzeigesteuereinrichtung 3 zugeführt. Falls danach die Ausgabebetriebsart auf die Betriebsart zum Erkennen des Zeilenwechselcodes am Ende des Absatzes (Schritt S6-9) gesetzt wurde und falls der Zeilenwechselcodes eingefügt werden sollte (Schritt SE- 10), werden in Schritt S6-11 LF(i) Zeilenwechselcodes an die Anzeigesteuereinrichtung 3 zugeführt. Nach Beendigung der Verarbeitungen für alle Zeichen der Zeichenzeile j wird in Schritt S6-13 überprüft, ob die Ausgabebetriebsart auf die Betriebsart zum Wechsel nach jedem Zeilenende gesetzt wurde oder nicht. Falls JA (J), wird in Schritt S6-14 ein Zeilenwechselcode vorbehaltlos von der Anzeigesteuereinrichtung 3 erzeugt. Falls bestimmt wird, daß die Verarbeitungen für alle Zeichenzeilen in Schritt S6-2 ausgeführt wurden, ist die vorstehend beschriebene Verarbeitungsroutine beendet.
  • Bei dem Ausführungsbeispiel wurden alle Verarbeitungen in den Schritten S5-1 bis S5-5 ungeachtet der Art der Ausgabebetriebsart ausgeführt. Jedoch können einige Verarbeitungen entsprechend der Ausgabebetriebsart übersprungen werden. Beispielsweise bei der Betriebsart, in der es nicht notwendig ist, die Absätze zu erkennen, ist es unnötig, die Verarbeitungen in Schritt S5-2 und Schritt S5-3 auszuführen. Bei der Betriebsart, in der es nicht notwendig ist, sowohl die Absätze als auch die Leerstellen in der Zeile zu erkennen, ist es unnötig, die Verarbeitungen in Schritt S5-1 bis Schritt S5-5 durchzuführen. Durch Hinzufügen einer derartigen Überspringsteuerung kann die Verarbeitungsgeschwindigkeit verbessert werden.
  • Eine Absatzerfassung in Schritt S5-5 gemäß Fig. 5 ist nachstehend detailliert beschrieben. In diesem Schritt wird eine Begrenzung des Absatzes bestimmt und ein vorbestimmter Wert wird in LF(i) des Zeichens entsprechend der Begrenzung gespeichert.
  • Die Begrenzung des Absatzes wird durch die nachstehenden Bedingungen bestimmt.
  • (1) Ein Bereich, in dem das Intervall zwischen Zeichenzeilen größer als das Intervall LS zwischen Zeichenzeilen des Satzes ist, stellt eine Wendemarke bzw. einen Wendepunkt des Absatzes dar.
  • (2) Eine Zeichenzeile mit einer Leerstelle in dem Kopfabschnitt ist eine erste Zeile des Absatzes.
  • (3) Eine Zeichenzeile, in der das letzte Zeichen nicht bis an den rechten Rand des Dokumentes reicht, ist die letzte Zeile des Absatzes.
  • Fig. 7 stellt eine schematische Darstellung des eingegebenen Dokumentes dar.
  • Bei einem Beispiel eines Dokumentes gemäß Fig. 7 entspricht eine Zeichenzeile 7-1 einem Kopfabschnitt, Bezugszeichen 7-2 kennzeichnet einen Satz und Bezugszeichen 7-3 kennzeichnet beispielsweise einen detaillierten bzw. einzeln aufgeführten Abschnitt. Der Absatzerfassungsbereich dient der Erfassung der Zeichenzeile 7-1, der Zeichenzeilen 7-4 bis 7-5, der Zeichenzeilen 7-6 bis 7-7 und der Zeichenzeilen 7-8 bis 7-9 unter Verwendung einer Zeichenzeile 7-10 als Absatz. Da die Zeichenzeile 7-8 Zeichen bis an den rechten Rand aufweist, fahren die Zeichen bis zu der Zeichenzeile 7-9 fort.
  • Fig. 8 stellt ein detailliertes Flußdiagramm des Absatzerfassungsbereiches dar. Ein Programm zum Steuern der Verarbeitungen wird in dem ROM 5 gespeichert und die Verarbeitungen werden unter der Steuerung der MPU 4 ausgeführt.
  • Die Verarbeitungen werden sequentiell von der Zeichenzeile der Zeichenzeilennummer 1 für die NL Zeichenzeilen der Zeichennummern 1 bis NL (Schritt S8-1) begonnen. Verarbeitungen in den Schritten S8-3 bis S8-12 werden für jede Zeichenzeile j ausgeführt. Zuerst wird die Zeichennummer des ersten Zeichens S der Zeichenzeile j in einem in der MPU 4 oder dem Hauptspeicher 5 gemäß Fig. 1 bereitgestellten Register s gespeichert. Register zum Speichern der Informationen der anderen Zeichen sind ebenso passend in der MPU 4 oder dem Hauptspeicher 5 gemäß Fig. 1 bereitgestellt und werden als Speicher für das Programm verwendet. Das Gebiet des Registers s wird in dem RAM 5 bereitgestellt. Die Zeichennummer des ersten Zeichens kann von LS(j) in der Zeichenzeilen-Informationsspeichergebiet 42 erhalten werden. Auf ähnliche Weise wird die Zeichennummer des letzten Zeichens e der Zeichenzeile j-1 vor der Zeichenzeile j in dem Register e gespeichert. Ein Gebiet des Zeichens e wird in dem RAM 5 bereitgestellt. Die Zeichennummer des letzten Zeichens e der vorherigen Zeichenzeile kann leicht erhalten werden, da sich ein derartiges Zeichen genau vor dem durch LS(i) angezeigten Zeichen in dem Zeichenzeilen-Informationsspeichergebiet 42 befindet. Falls in Schritt S8-5 ein Intervall zwischen der Zeichenzeile j-1 und der Zeichenzeile j größer als das Intervall LS zwischen den Zeichenzeilen des Körperabschnittes ist, wird bestimmt, daß sich zwischen den Zeichenzeilen j und j-1 ein anderer Absatz befindet, so daß die Verarbeitungsroutine zu Schritt S8-6 voranschreitet.
  • Die Unterscheidung in Schritt S8-5 wird praktisch wie nachstehend beschrieben ausgeführt.
  • (LPY(J) - (LPY(j - 1) + LPH(j - 1)))/LS > m Gleichung S8-5-1,
  • wobei m eine Konstant wie beispielsweise 2 ist.
  • In Schritt S8-6 wird die dazwischen einfügbare Anzahl von Leerzeilen berechnet und ein berechneter Wert wird in ein Register n gespeichert. Ein Wert von n ist praktisch durch die nachstehende Gleichung beschrieben.
  • n = (LPY(j) - (LPY(j-1) + LPH(j-1) + LPH(j-1)))/(FH + LS) Gleichung S8-6-1
  • Wenn n größer oder gleich 1 ist, wird in den Schritten S8-7 und S8-8 der Wert von (n + 1) in LF(e) gespeichert. Falls n kleiner als 1 ist, wird 2 in LF(e) gespeichert. Der Wert in LF(e) ist gleich der Anzahl der Zeilenwechselcodes, wenn die Zeilenwechselcodes danach erzeugt werden. In Schritt S8-10 wird überprüft, ob eine Leerstelle vor dem ersten Zeichen S der Zeichenzeile j vorhanden ist oder nicht. Mit anderen Worten, eine derartige Unterscheidung wird durch Überprüfen, ob BL(s) in dem Zeicheninformations-Speichergebiet 41 größer als Null ist oder nicht, durchgeführt. Falls bestimmt wird, daß eine Leerstelle vor dem ersten Zeichen S vorhanden ist, folgt Schritt S8-11 und 1 wird in LF(e) gespeichert.
  • In Schritt S8-12 wird überprüft, ob eine Leerstelle nach dem letzten Zeichen e der Zeichenzeile j-1 vorhanden ist oder nicht. Die Leerstelle wird durch einen Abstand zwischen der Position des letzten Zeichens e und dem rechten Rand des Dokumentes unterschieden. Mit anderen Worten, eine derartige Leerstelle wird wie nachstehend beschrieben unterschieden.
  • RX - CPX(e) > 2WD(j - 1) Gleichung S8-12-1.
  • Somit ist es möglich derart zu erkennen, daß die Zeichenzeilen 7-5, 7-9 und 7-10 gemäß Fig. 7 die Enden der Absätze darstellen.
  • Durch Ausführen der vorsehend beschriebenen Verarbeitungen hinsichtlich der Zeichenzeilen der Nummern j (= 1) bis NL-1 wird die Verarbeitungsroutine beendet. Somit kann die Begrenzung des Abstandes erkannt werden, da ein Zeichen, in dem ein Wert bezüglich des Wertes in LF(i) jedes Zeichens größer als Null gespeichert wurde, ein letztes Zeichen des Absatzes ist.

Claims (8)

1. Bildverarbeitungsgerät, mit
einer Eingabeeinrichtung (MPU 4) zur Eingabe von Bilddaten, und
einer Extraktionseinrichtung (MPU 4) zur Extraktion einer Vielzahl von Teilstücken von Zeichenpositionsinformationen aus den durch die Eingabeeinrichtung eingegebenen Bilddaten,
einer Erfassungseinrichtung (S5-4) zur Erfassung einer Vielzahl von Freiräumen zwischen jeweils zwei benachbarten Teilstücken der Vielzahl von Teilstücken der durch die Extraktionseinrichtung extrahierten Zeichenpositionsinformationen,
gekennzeichnet durch
eine Herleitungseinrichtung zur Herleitung eines Teilungsabstandsmittelwertes (PT(j)) für jede Zeile (j) der Eingabebilddaten aus den durch die Erfassungseinrichtung, erfaßten Zeichenpositionsinformationen,
eine Einrichtung zur Berechnung (S5-4) eines Faktors, der angibt, um wievielmal jeder der erfaßten Vielzahl der Freiräume (CPX(i) - CPX(i-1) + CPW (i-1)) größer als der Zeichenteilungsabstand (PT(j)) ist,
eine Einrichtung zur Einstellung (S5-4) der dem berechneten Faktor am nächsten kommenden ganzen Zahl als die Anzahl von Freiraumkodes (BL(i)), die jedem der Vielzahl der erfaßten Freiräume zugewiesen ist, und
eine Ausgabeeinrichtung (S5-6, S6-7) zur Ausgabe einer Anzahl von Freiraumkodes (BL(i)), die gleich der durch die Einstelleinrichtung eingestellten ganzen Zahl ist.
2. Gerät nach Anspruch 1, wobei die Eingabeeinrichtung eine Abtasteinrichtung aufweist.
3. Gerät nach Anspruch 1, wobei die Freiraumkodes Leerzeichenkodes aufweisen.
4. Gerät nach Anspruch 1, wobei die Freiraumkodes Zeilenwechselkodes aufweisen.
5. Bildverarbeitungsverfahren mit den Schritten:
Erhalten von Eingabebilddaten eines Bildes,
Extrahieren einer Vielzahl von Teilstücken von Zeichenpositionsinformationen aus den Eingabebilddaten,
Erfassen (S5-4) einer Vielzahl von Freiräumen zwischen jeweils zwei benachbarten Teilstücken der Zeichenpositionsinformationen,
gekennzeichnet durch folgende Schritte
Herleiten eines Teilungsabstandsmittelwertes (PT(j)) für jede Zeile (j) der Eingabebilddaten aus den Zeichenpositionsinformationen,
Berechnen (S5-4) eines Faktors, der angibt, um wievielmal jeder der erfaßten Vielzahl der Freiräume (CPX(i) - CPX(i-1) + CPW (i-1)) größer als der Zeichenteilungsabstand (PT(J)) ist,
Einstellen (S5-4) der dem berechneten Faktor am nächsten kommenden ganzen Zahl als die Anzahl von Freiraumkodes (BL(i)), die jedem der Vielzahl der erfaßten Freiräume zugewiesen ist, und
Ausgeben (S5-6, S6-7) der Anzahl der Freiraumkodes (BL(i)) zur Darstellung des Freiraums.
6. Verfahren nach Anspruch 5, wobei die Bilddaten durch Abtasten des Bildes erhalten werden.
7. Verfahren nach einem der Ansprüche 5 und 6, wobei die Freiraumkodes Leerzeichenkodes aufweisen.
8. Verfahren nach einem der Ansprüche 5 und 6, wobei die Freiraumkodes Zeilenwechselkodes aufweisen.
DE69131496T 1990-05-15 1991-05-14 Bildverarbeitungs-Gerät und Verfahren Expired - Fee Related DE69131496T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2125932A JPH0424782A (ja) 1990-05-15 1990-05-15 文書処理装置
JP2125931A JPH0424757A (ja) 1990-05-15 1990-05-15 文書処理装置

Publications (2)

Publication Number Publication Date
DE69131496D1 DE69131496D1 (de) 1999-09-09
DE69131496T2 true DE69131496T2 (de) 2000-01-05

Family

ID=26462227

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69131496T Expired - Fee Related DE69131496T2 (de) 1990-05-15 1991-05-14 Bildverarbeitungs-Gerät und Verfahren

Country Status (3)

Country Link
US (1) US5754685A (de)
EP (1) EP0461760B1 (de)
DE (1) DE69131496T2 (de)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5517578A (en) * 1993-05-20 1996-05-14 Aha! Software Corporation Method and apparatus for grouping and manipulating electronic representations of handwriting, printing and drawings
DE19507059B9 (de) * 1995-03-01 2005-02-17 Wevelsiep, Klaus, Prof. Dipl.-Ing. Dr. Verfahren zur omnidirektionalen Erfassung von OCR-Klarschrift auf Etiketten oder ähnlichen Datenträgern durch zufallsgesteuerte Suche und Dekodierung mit einem neuronalen Netzwerk
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
US6880122B1 (en) 1999-05-13 2005-04-12 Hewlett-Packard Development Company, L.P. Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions
DE10000935C2 (de) * 1999-05-13 2003-07-31 Hewlett Packard Co Vorrichtung und Verfahren zum Steuern einer Dokumentenbereichsanalyse
US8565474B2 (en) * 2010-03-10 2013-10-22 Microsoft Corporation Paragraph recognition in an optical character recognition (OCR) process
CN101984419B (zh) * 2010-10-21 2013-08-28 优视科技有限公司 用于对网页图片内容进行段落重排的方法及装置
JP5801601B2 (ja) 2011-05-10 2015-10-28 キヤノン株式会社 画像認識装置、画像認識装置の制御方法、およびプログラム
JP5701839B2 (ja) 2012-10-26 2015-04-15 株式会社東芝 電子機器および方法
JP6119689B2 (ja) * 2014-07-11 2017-04-26 コニカミノルタ株式会社 電子文書生成システム、電子文書生成装置およびプログラム
US10127673B1 (en) * 2016-12-16 2018-11-13 Workday, Inc. Word bounding box detection

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3618032A (en) * 1968-12-09 1971-11-02 Ibm Automatic data composing, editing and formatting system
US4190835A (en) * 1976-09-22 1980-02-26 U.S. Philips Corporation Editing display system with dual cursors
JPS60109892A (ja) * 1983-11-18 1985-06-15 Brother Ind Ltd 電子式タイプライタ
JPS60158482A (ja) * 1984-01-27 1985-08-19 シャープ株式会社 Crt表示装置の制御方式
JPS60163171A (ja) * 1984-02-06 1985-08-26 Hitachi Ltd 文章読取装置
DE3523042A1 (de) * 1984-06-28 1986-01-02 Canon K.K., Tokio/Tokyo Bildverarbeitungssystem
DE3650496T2 (de) * 1985-04-17 1996-10-31 Hitachi Ltd Bildverarbeitungsgerät
EP0272070B1 (de) * 1986-12-15 1995-03-01 Omron Corporation Eingabevorrichtung für einen Rechner
JPH07111727B2 (ja) * 1988-05-31 1995-11-29 富士電機株式会社 文書読取装置
US5033008A (en) * 1988-07-22 1991-07-16 International Business Machines Corporation Dynamic selection of logical element data format as a document is created or modified
JPH0816918B2 (ja) * 1989-04-18 1996-02-21 シャープ株式会社 行抽出方法
JP2705981B2 (ja) * 1989-06-23 1998-01-28 富士電機株式会社 文字読取方法

Also Published As

Publication number Publication date
EP0461760B1 (de) 1999-08-04
EP0461760A2 (de) 1991-12-18
EP0461760A3 (en) 1993-07-21
DE69131496D1 (de) 1999-09-09
US5754685A (en) 1998-05-19

Similar Documents

Publication Publication Date Title
DE69425084T2 (de) Verfahren und Gerät zur Erkennung von Textzeilen, Wörtern und räumlichen Merkmalen von Zeichenzellen
DE3650554T2 (de) Speicherungs- und Wiederauffindungsverfahren für Bilddaten
DE69230632T2 (de) Optische Worterkennung durch Wortgestaltuntersuchung
EP1665132B1 (de) Verfahren und system zum erfassen von daten aus mehreren maschinell lesbaren dokumenten
DE3716787C2 (de)
DE69027134T2 (de) Zeichenverarbeitungsgerät
DE3633743C2 (de)
DE3411939C2 (de)
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE69723220T2 (de) Gerät und Verfahren zur Extrahierung von Tabellengeraden innerhalb normaler Dokumentbilder
DE69604481T2 (de) Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern
DE69232493T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE69226846T2 (de) Verfahren zur Bestimmung von Wortgrenzen im Text
DE3689034T2 (de) Elektronisches System zur Text-Grafik-Aufbereitung.
DE4216893C2 (de) Dateneingabeverfahren
DE3523042C2 (de)
DE3515159C2 (de)
DE19953608B4 (de) Vorrichtung und Verfahren zum Erkennen eines Fonts eines Textes in einem Dokumentenverarbeitungssystem
DE69130469T2 (de) Gerät und Verfahren zur Bildverarbeitung
DE69131496T2 (de) Bildverarbeitungs-Gerät und Verfahren
DE3425449A1 (de) Verfahren und vorrichtung zur alphanumerischen handschriftenerkennung
DE3722444A1 (de) Verfahren und vorrichtung zum erzeugen von entwurfsmusterdaten
DE69526285T2 (de) Zeichenerkennung
DE69624663T2 (de) Verfahren und Gerät zur Bildverarbeitung und Speichermedium

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee