FR2552605A1 - Fast fax device with branch recognition for images containing repetitive symbols - Google Patents

Fast fax device with branch recognition for images containing repetitive symbols Download PDF

Info

Publication number
FR2552605A1
FR2552605A1 FR8315204A FR8315204A FR2552605A1 FR 2552605 A1 FR2552605 A1 FR 2552605A1 FR 8315204 A FR8315204 A FR 8315204A FR 8315204 A FR8315204 A FR 8315204A FR 2552605 A1 FR2552605 A1 FR 2552605A1
Authority
FR
France
Prior art keywords
symbols
image
symbol
branch
branches
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR8315204A
Other languages
French (fr)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DARMON CLAUDE
Original Assignee
DARMON CLAUDE
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DARMON CLAUDE filed Critical DARMON CLAUDE
Priority to FR8315204A priority Critical patent/FR2552605A1/en
Publication of FR2552605A1 publication Critical patent/FR2552605A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

The invention relates to a fax device making it possible to transmit images at high computational and transmission speed. The device consists of a linear image reader, for example a CCD reader, an extractor operating iteratively line after line and composed of: - a conversion unit 2.1 transforming, for each line, the signals from the image reader into a representation by zone length; - a zone numbering unit 2.2 which attributes a branch number to each zone and a condition number to each branch; - a loading unit 2.3 which stores in memory the image represented by branches; - a symbol coding unit composed of a prerecognition unit, a recognition unit and two coding units. The device according to the invention is particularly intended for fax machines.

Description

Domaine technique : Télécopie.Technical area: Fax.

Etat de la technique : Dans le domaine de la télécopie, de nombreux dispositifs ont été proposés depuis la fin des années 1970, fondés sur le prin cipe de la reconnaissance des formes, oui permettent une réduction notable du débit de transmission par rapport aux dispositifs plus traditionnels de télé- copie numerique. Ce sont les dispositifs de PRITT et all. (2) SEGEN et JOHN-
SEN (3), JOLY et ROMEO (4). Ces dispositifs obéissent tous au schéma de la figure 1.Le principe en est le suivant
L'inage est codée numériquement par le lecteur d'image (1) ; les symboles (ensemble connexe de noirs de taille non limitée) et éventuellement les graphismes (ensemble connexe de noirs de taille non limitée) sont extraits l'un après l'autre de l'image numérisée (2) ; cette phase est appelée phase d'extraction.Le résidu (s'il en existe) est codé directement par un procédé de télécopie numérique traditionnel ; les graphismes font l'obiet d'un codage indépendant ; enfin et surtout, les symboles extraits sont tout d'abord l'objet d'une reconnaissance pour ~a oir s ils ont déjà ete trouves au moins une fois dans l'image ; ils sont codés dans une mémoire d'image. la reconnaissance est faite en comparant le symbole à tous les symboles de la bibliothèque- mémoire re numérique contenant les images numérisées de toutes les formes de -symboles 'symboles-prototype" déjà rencontrés- Si une ressemblance est trouvée avec le le symbole-prototype x de la bibliothèque, le numéro du symbole-prototype ainsi que les co-rdonnées du symbole dans l'image sont codés (3.3) ; pour améliorer la vitesse de traitement, la comparaison à la bibilothèque est faite en deux temps
Une première phase (3.1) de pré-reconnaissance permet de trier très rapidement, mais grossièrement, tous les symboles prototypes très différents de notre symbole ; une deuxième phase (3.2) de reconnaissance fine appelée "template matching" réalise une comparaison soigneuse mais couteuse de notre symbole avec les symbe'e-prototypes les plus ressemblants ; les symbole-prototypes de la bi biotheque sont ensuite codés (3.4.) ; l'ensemble des codes sortant des blocs (3.3), (3. ), (4) et (5) sont ensuite regroupés par un organe de formation du message (6) et expédiés vers le récepteur de télécopie via la voie téléphonique.
State of the art: In the facsimile field, many devices have been proposed since the end of the 1970s, based on the principle of pattern recognition, yes allow a significant reduction in the transmission rate compared to more devices. traditional digital tele- copying. These are the PRITT and all devices. (2) SEGEN and JOHN-
SEN (3), JOLY and ROMEO (4). These devices all obey the diagram of Figure 1.The principle is as follows
The inage is digitally coded by the image reader (1); the symbols (related set of blacks of unlimited size) and possibly the graphics (related set of blacks of unlimited size) are extracted one after the other from the digitized image (2); this phase is called the extraction phase. The residue (if any) is coded directly by a traditional digital fax process; graphics are subject to independent coding; finally and above all, the extracted symbols are first of all the object of a recognition for ~ a oir if they have already been found at least once in the image; they are coded in an image memory. recognition is made by comparing the symbol to all the symbols in the digital memory-re memory containing the digitized images of all forms of -symbols' prototype-symbols "already encountered- If a resemblance is found with the the prototype-symbol x of the library, the number of the prototype symbol as well as the co-rdata of the symbol in the image are coded (3.3); to improve the speed of processing, the comparison with the library is done in two stages
A first phase (3.1) of pre-recognition makes it possible to sort very quickly, but roughly, all the prototype symbols very different from our symbol; a second phase (3.2) of fine recognition called "template matching" makes a careful but costly comparison of our symbol with the most similar symbe'e-prototypes; the bi-library prototype symbols are then coded (3.4.); all the codes coming out of the blocks (3.3), (3.), (4) and (5) are then grouped together by a message forming unit (6) and sent to the fax receiver via the telephone channel.

Les trois procédés proposés jusqu'a présent sont très couteux en temps de calcul d'crdinateur et celui-ci risque d'être très largement supérieur au temps de transmission proprement dit. The three methods proposed so far are very costly in computer computation time and the latter risks being very much greater than the transmission time proper.

Le cout élevé du traitement de l'image pour en extraire son code est lié essentiellement à la conception de l'organe d'extraction (2) qui effectue l'extraction des symboles les uns après les autres, ce qui oblige à de nombreuses et coûteuses manipulations de l'image. The high cost of processing the image to extract its code is essentially linked to the design of the extraction member (2) which performs the extraction of the symbols one after the other, which requires numerous and costly image manipulation.

Le dispositif décrit ici a pour but de remédier à cet inconvénient afin de diminuer les temps de traitement de l'image avant son expédition. The purpose of the device described here is to remedy this drawback in order to reduce the processing times of the image before it is shipped.

Principe du dispositif : (cf. Figures 1 et 2)
(1) Un lecteur linéaire d'image pouvant être par exemple un lecteur de type CCD (Charge CoupledDevice) qui se déplace de haut en bas (ou de bas en haut) de l'image selon un pas constant et qui fournit pour chaque ligne-lue une séquence de bits représentant la succession -selon un pas horizontal constant- des noirs et blancs (bit = 1 pour un noir, bit = o pour un blanc) avec éventuellement un signal de synchronisation en début de chaque ligne. (cf. figures 3 et 4).
Principle of the device: (see Figures 1 and 2)
(1) A linear image reader which can for example be a CCD (Charge CoupledDevice) type reader which moves up and down (or from bottom to top) of the image at a constant step and which provides for each line - read a sequence of bits representing the succession - according to a constant horizontal step - of the blacks and whites (bit = 1 for a black, bit = o for a white) with possibly a synchronization signal at the start of each line. (cf. figures 3 and 4).

(2) Un extracteur fonctionnant itérativement ligne apyres ligne et composé comme suit (cf. Figure 2). (2) An extractor operating iteratively line after line and composed as follows (see Figure 2).

(2.1) Une unité de conversion transformant à la ligne courante les si-; gnaux du lecteur d' image en une série d'informations stockées dans une mémoire tampon l-D. Ces informations constituent la représentation par longueur de zone : ce sont le nombre de zones rencontrées et pour chaque zone de noir rencontrée : l'abaisse abc du point le plus à gauche sur la ligne, la longueur 1 de noir (Figure 5). (2.1) A conversion unit transforming the si-; image reader signals into a series of information stored in an l-D buffer. This information constitutes the representation by length of area: these are the number of areas encountered and for each area of black encountered: the lowering abc from the leftmost point on the line, the length 1 of black (Figure 5).

(2.2) Une unité de numérotation de zone qui adjoint au tableau précédent le numéro de la branche à laquelle appartient la zone, et qui choisit - si nécessaire- pour chaque branche un numéro d'état définissant le symbole auquel elle appartient (Figure 6). (2.2) A zone numbering unit which adds to the preceding table the number of the branch to which the zone belongs, and which chooses - if necessary - for each branch a state number defining the symbol to which it belongs (Figure 6) .

(2.3) Une unité de chargement qui stocke au fur et à mesure de la lecture dans une mémoire numérique,appelée mémoire d'image, l'information abcisse gauche, largueur de noire pour chaque numéro de zone à hauteur courant?, à compter de la hauteur de départ de la branche (cf. Figure 7). Ce mode de stockage en mémoire est appelé représentation par branche. (2.3) A loading unit which stores as it is read in a digital memory, called image memory, the information on the left abscissa, width of black for each zone number at current height ?, from the starting height of the branch (see Figure 7). This mode of storage in memory is called representation by branch.

Les états des branches sont stockés dans une mémoire spéciale, lorsque l'unité de numérotation de zone trouve absente une branche attendue, si cette branche est la dernière de son numéro d'état, elle déclanche une ålarme de fin de symbole. (cf. Figure 7). Les symboles n'apparaissent oas danslamémoire d'image comme un tout comme dans les autres méthodes (2), (3), (4), au contraire, les branches scnt distinctes,avec ua numéro d'état figurant leur appartenance à un symbole. Four lire un symbole en mémoire d' image, il faut connaltre son numéro d'état et tirer toutes les branches ayant ce numéro d'état, c'est l'ensemble de ces branches qui constitue le symbole. The states of the branches are stored in a special memory, when the zone numbering unit finds an expected branch absent, if this branch is the last of its state number, it triggers an end of symbol alarm. (see Figure 7). The symbols do not appear in the image memory as a whole as in the other methods (2), (3), (4), on the contrary, the branches scnt distinct, with a status number showing their membership of a symbol . To read a symbol in image memory, it is necessary to know its state number and to draw all the branches having this state number, it is the set of these branches which constitutes the symbol.

(3) Une unité de codage des symboles décompose de façon classique en (3.1), une unité de préreconnaissance et (3.2) une unité de "template mat ch ing".  (3) A symbol coding unit classically breaks down into (3.1), a pre-recognition unit and (3.2) a "template mat ch ing" unit.

(3.1) Unité de préreccnnaissance : Celle-ci effectue sur chaque symbole de la bibliothèque stockée sous forme par branche, une comparaison de plus en plus fine avec le symbole disponible en mémoire. Sa mise en fonction est ef fectuée sur envoi d'une alar.rile symbole. (3.1) Pre-birth unit: This performs an increasingly fine comparison on each symbol of the library stored in branch form with the symbol available in memory. It is put into operation by sending a symbol alarm.

Le principe de cette unité est de travailler directement sur les informations des branches constituant le symbole telles qu'elles apparaissent dans la moire d'image. La facilité du fonctionnement provient de ce que le symbole et son homologue recherché en bibliothèque se déduisent l'un de l'autre par une translation seulement et pas par une rotation ou une homothétie. The principle of this unit is to work directly on the information of the branches constituting the symbol as they appear in the image memory. The ease of operation comes from the fact that the symbol and its counterpart sought in the library are deduced from each other by a translation only and not by a rotation or a homothety.

L'unité lit en memoire d'image toutes les branches dont le numéro d'état est celui émis à l'instant de l'alarme. Ces branches sont celles du symbole à traiter.The unit reads in image memory all the branches whose status number is that issued at the time of the alarm. These branches are those of the symbol to be treated.

Une formule de réalisation préférentielle consiste en
(1) comparer le hauteur du symbole,
(2) comparer Je nombres de branches et leurs coordonnées de début et de fin,
(3) comparer les abcisses de début et de fin des branches.
A preferred embodiment consists of
(1) compare the height of the symbol,
(2) compare the numbers of branches and their start and end coordinates,
(3) compare the abscissae at the start and end of the branches.

L'unité de préreconnaissance permet ainsi de trier un maximum de symboles-prototype auxquels ne ressemble pas le symbole. Sur les autres symbolesprototype est appliqué l'unité de reconnaissance fine. The pre-recognition unit thus makes it possible to sort a maximum of prototype symbols which the symbol does not look like. On the other prototype symbols, the fine recognition unit is applied.

(3.2) Unité de reconnaissance fine ("template-matching" )
Celle-ci compare, point à point, le symbole et le symbole-prototype et selon une réalisation particulière, n'accepte pas de variations de forme supérieure à un pas de quantification entre les deux symboles.
(3.2) Fine recognition unit ("template-matching")
This compares, point to point, the symbol and the prototype symbol and according to a particular embodiment, does not accept variations in form greater than a quantification step between the two symbols.

A la suite du "template-matching", le dispositif peut répondre à la question de savoir si le symbole est nouveau ou est identique au symboleprototype nO i de la bibliothèque. Following the "template-matching", the device can answer the question of knowing whether the symbol is new or is identical to the prototype symbol nO i of the library.

Si le symbole n'a pas été reconnu, on stocke ses branches dans la bibliothèque selon le meme mode de stockage que la mémoire d'image. If the symbol has not been recognized, its branches are stored in the library according to the same storage mode as the image memory.

(3.3) et (3.4) Unités de codage
Pcur chaque symbole on code, qu'il ait été reconnu ou pas dans la bibliothèque, son numéro dans la bibliothèque, ainsi que ses coordonnées dans l'image (3.3).
(3.3) and (3.4) Coding units
For each symbol we code, whether or not it has been recognized in the library, its number in the library, as well as its coordinates in the image (3.3).

Chaque symbole de la bibliothèque est codé parallèlement par l'unité de codage (3.4). Le codage est réalisé soit au fur et à mesure du traitement de l'image, scit une fois que l'image a été complètement traitée. Each symbol in the library is coded in parallel by the coding unit (3.4). The coding is carried out either as the image is processed, scit once the image has been completely processed.

orque la reconnaissance et le cokage du SyFw ole cnt été terminés, les branches correspondantes dans la mémoire d'image sont effacée ainsi que leur numéro et le numéro d'état de symbole. hen recognition and coking of the SyFw ole cnt has been completed, the corresponding branches in the image memory are deleted as well as their number and the symbol status number.

Les zones noires qui ne sont pas dans le sens de la hauteur ne rentrent pas dans le cadre des symboles. Elles peuvent, par exemple, faire l'objet d'un codage à titre de résidu (4) selon les méthodes connues de codage à deux dimensions (1), ou alors être codées en tant que graphismes (5). The black zones which are not in the direction of the height do not enter in the frame of the symbols. They can, for example, be coded as a residue (4) according to known two-dimensional coding methods (1), or else be coded as graphics (5).

Elements innovatifs
Le dispositif décrit ne diffère pas dans sa structure générale des au- tres dispositifs de télécopie à reconnaissance.
Innovative elements
The device described does not differ in its general structure from other recognition facsimile devices.

Son originalité réside
1) dans son extracteur rapide susceptible de faire d'un seul coup l-'extraction de tous les symboles d'une ligne de texte d'un document dactylographié en codant l'image directement sous forme de sa représentation par branche.
Its originality lies
1) in its fast extractor capable of doing all of a sudden the extraction of all the symbols from a line of text of a typed document by coding the image directly in the form of its representation by branch.

2) Dans le choix de la représentation par branche qui est bien adaptée à la recornaissance et au codage des symboles typographiques répétitifs par l'unité de préreconnaissance qui compare directement les différentes branches du symbole se trouvant en mémoire d'image,avec les symboles-prototype déjà enregistrés dans la bibliothèque de symboles. 2) In the choice of representation by branch which is well suited to the recognition and coding of repetitive typographic symbols by the pre-recognition unit which directly compares the different branches of the symbol found in image memory, with the symbols- prototype already saved in the symbol library.

BIBLIOGRAPHIE (1) G. Aaron - Codage bidimensionnel d'images monochromes pour la télécopie.BIBLIOGRAPHY (1) G. Aaron - Two-dimensional coding of monochrome images for facsimile.

Acta Electronica, 21, 1, 1978, pp39 - 53.Acta Electronica, 21, 1, 1978, pp39 - 53.

(2) W.K. Pratt, P.J. Capitant, W.H. Chen, E.R. Hamilton, R.H. Wallis
Combined Symbol Matching Facsimile Data Compression System. Proc. IEEE,
Vol. 68, n 7, Juillet 1980.
(2) WK Pratt, PJ Capitant, WH Chen, ER Hamilton, RH Wallis
Combined Symbol Matching Facsimile Data Compression System. Proc. IEEE,
Flight. 68, no 7, July 1980.

(3) J.Segen, O. Johnsen. Facsimile Compression by Pattern Matchir.g. Proc.(3) J. Segen, O. Johnsen. Facsimile Compression by Pattern Matchir.g. Proc.

Pattern Reccngnition and Image Processing. Juin 1982. Las Vegas, pp. 191-196. Pattern Reccngnition and Image Processing. June 1982. Las Vegas, pp. 191-196.

(4) P. Joly et F. Roméo. Présentation d'une méthode de compression d'images.(4) P. Joly and F. Roméo. Presentation of an image compression method.

Note tech- vue CNET I4T/PAA/OGE/TDT/818. Octobre 1982.  Technical note CNET I4T / PAA / OGE / TDT / 818. October 1982.

LISTE DES FIGURES ET LEGENDES
PLANCHE 1/4 : FIGURE 1 : Diagramme général du dispositif de télécopie à
reconnaissance - (B. Bibliothèque).
LIST OF FIGURES AND LEGENDS
BOARD 1/4: FIGURE 1: General diagram of the facsimile machine
recognition - (B. Library).

PLANCHE 2/4 : FIGURE 2 : Diagramme général de 11 extracteur itératif.PLATE 2/4: FIGURE 2: General diagram of 11 iterative extractor.

(A * Alarme, ME : Mémoire d'état de branches, MI : Mémoire
tampon l-D, TC : Tableau complet, TP : tableau complet
à la ligne précédente).
(A * Alarm, ME: Branch status memory, MI: Memory
buffer lD, TC: full table, TP: full table
on the previous line).

PLANCHE 3/4
FIGURE 3 : Représentation par longueur de zone (1 : Branche n 1,
2 : Branche n 2, 3 : abolisse gauche de la zone courante,
4 : longueur de la zone courante).
PLATE 3/4
FIGURE 3: Representation by zone length (1: Branch n 1,
2: Branch 2, 3: left abolisse of the current area,
4: length of the current area).

FIGURE 4 : Codage binaire ligne par ligne en sortie du lecteur image.  FIGURE 4: Binary coding line by line at the output of the image reader.

PLANCHE 4/4
FIGURE 5 : Mémoire tampon l-D
FIGURE 6 : Tableau complet
Légende commune à la figure 5 et à la figure 6 : 1 : Nombres de zones à la hauteur courante, 2 : abolisse gauche de la lèpre zone, 3 : longueur de la 1ère zone, 4 : abscisse gauche de la 2ème zone, 5 : longueur de la 2ème zone, 6 et 7 : numéros des branches.
PLATE 4/4
FIGURE 5: lD buffer memory
FIGURE 6: Complete table
Common legend in Figure 5 and Figure 6: 1: Number of zones at current height, 2: left abolissa of leprosy zone, 3: length of 1st zone, 4: left abscissa of 2nd zone, 5: length of the 2nd zone, 6 and 7: branch numbers.

FIGURE 7 : Organisation de la mémoire d' image. (1 : numéro de branche, 2 : état, 3 : branche-départ, 4 : branche-arrivée, 5 : ordonne de début de branche, 6 : longueur de la branche, 7 : abolisse de début de branche, 8 : abolisse au point courant de la branche (abcisse relative), 9 longueur de zone au point courant de la branche).  FIGURE 7: Organization of the image memory. (1: branch number, 2: state, 3: branch-start, 4: branch-arrival, 5: order of branch start, 6: length of branch, 7: abolisse of branch start, 8: abolisse of current point of the branch (relative abscissa), 9 zone length at the current point of the branch).

Claims (9)

REVENDICATIONS 1. Procédé de reconnaissance de symboles figurant dans une image à coder, procédé selon lequel l'image est lue et numérisée, et les informations numériques représentatives des symboles sont comparées avec des informations stockées dans une bibliothèque de symboles prototypes constituée au fur et à mesure du codage de l'image, caractérisé en ce que1. Method for recognizing symbols appearing in an image to be coded, method according to which the image is read and digitized, and the digital information representative of the symbols is compared with information stored in a library of prototype symbols built up progressively image coding, characterized in that - l'image est analysée ligne par ligne pour extraire des informations caractérisant les branches constitutives des symboles figurant sur l'image, et the image is analyzed line by line to extract information characterizing the branches making up the symbols appearing on the image, and - les informations caractérisant les branches sont utilisées pour comparer chaque symbole extrait aux différents symboles déjà trouvés dans l'image et stockés dans la bibliothèque en tant que symboles prototypes. - the information characterizing the branches is used to compare each extracted symbol with the various symbols already found in the image and stored in the library as prototype symbols. 2. Procédé selon la revendication 7, caractérisé en ce que les informations caractérisant chaque branche comprennent un ensemble de données représentant la forme de la branche et un numéro d'état correspondant au symbole extrait auquel appartient la branche.2. Method according to claim 7, characterized in that the information characterizing each branch comprises a set of data representing the shape of the branch and a state number corresponding to the extracted symbol to which the branch belongs. 3. Procédé selon la revendication 2, caractérisé en ce que chaque ligne d'image est analysée pour fournir une représentation de la ligne par zones correspondant à des parties de symboles lus sur l'image, un même numéro de branche est associé aux différentes zones qui sont sur des lignes successives et qui appartiennent à une même branche, et le numéro d'état est associé dynamiquement à chaque branche en fonction du symbole auquel elle appartient.3. Method according to claim 2, characterized in that each image line is analyzed to provide a representation of the line by zones corresponding to parts of symbols read on the image, the same branch number is associated with the different zones which are on successive lines and which belong to the same branch, and the state number is dynamically associated with each branch according to the symbol to which it belongs. 4. Procédé selon la revendication 3, caractérisé en ce que le même numéro d'état est associé aux branches constituant un même symbole, deux branches ayant le même numéro d'état appartenant à un même symbole.4. Method according to claim 3, characterized in that the same state number is associated with the branches constituting the same symbol, two branches having the same state number belonging to the same symbol. 5. Procédé selon l'une quelconque des revendications 3 et 4, caractérisé en ce que les informations Ca- ractérisant chaque branche d'un symbole extrait comprennent une ou plusieurs des informations représentant les caractéristiques qui figurent dans le groupe constitué par : le numéro de la branche, le numéro d'état correspondant au symbole, les coordonnées de début et de fin de la branche, la longueur de la branche, l'abscisse et la longueur de chaque zone faisant partie de la branche.5. Method according to any one of claims 3 and 4, characterized in that the information characterizing each branch of an extracted symbol comprises one or more of the information representing the characteristics which appear in the group consisting of: the number of the branch, the state number corresponding to the symbol, the start and end coordinates of the branch, the length of the branch, the abscissa and the length of each zone forming part of the branch. 6. Procédé selon l'une quelconque des revendications 1 à 5, caractérisé. en ce que les symboles extraits sont comparés séquentiellement aux symboles prototypes en comparant des caractéristiques apparaissant dans leur représentation par branches et en appliquant à chaque fois une série de tests de complexité croissante.6. Method according to any one of claims 1 to 5, characterized. in that the extracted symbols are compared sequentially to the prototype symbols by comparing characteristics appearing in their representation by branches and by applying each time a series of tests of increasing complexity. 7. Procédé selon la revendication 6, caractérisé en ce que la comparaison est effectuée, dans un premier stade, en comparant, selon un ordre de complexité croissante :la hauteur du symbole, le nombre de branches et leurs ordonnées de début et de fin, et les abscisses de début et de fin des branches.7. The method as claimed in claim 6, characterized in that the comparison is carried out, in a first stage, by comparing, in an order of increasing complexity: the height of the symbol, the number of branches and their start and end ordinates, and the abscissa at the start and end of the branches. 8. Dispositif de reconnaissance de symboles destiné à la mise en oeuvre du procédé selon l'une quelconque des revendications 1 à 7, dispositif comportant un extracteur associé à un lecteur d'image pour fournir des informations numériques représentant les symboles lus sur une image à coder, une bibliothèque dans laquelle sont enregistrées des informations numériques représentant des symboles prototypes et qui est constituée au fur et à mesure du codage de l'image, et des moyens de comparaison entre les informations représentant les symboles extraits et-les informations représentant les symboles prototypes, caractérisé en ce que8. Symbol recognition device for implementing the method according to any one of claims 1 to 7, device comprising an extractor associated with an image reader for providing digital information representing the symbols read on an image to coding, a library in which digital information representing prototype symbols is stored and which is built up as the image is coded, and means of comparison between the information representing the extracted symbols and the information representing the symbols prototypes, characterized in that - l'extracteur est agencé de manière à analyser l'image ligne par ligne pour extraire des informations caractérisant les branches constitutives des symboles lus sur l'image, the extractor is arranged so as to analyze the image line by line in order to extract information characterizing the branches making up the symbols read on the image, - une mémoire d'image reçoit les informations de l'extracteur pour mémoriser, pour chaque symbole extrait, les informations caractérisant les différentes branches constitutives du symbole, et an image memory receives the information from the extractor to store, for each symbol extracted, the information characterizing the different branches making up the symbol, and - les moyens de comparaison sont reliés à la mémoire d'image pour permettre la reconnaissance de symboles par comparaison effectuée à partir des informations caractérisant les branches constituant les symboles. - The comparison means are connected to the image memory to allow the recognition of symbols by comparison made from information characterizing the branches constituting the symbols. 9. Procédé de télécopie rapide selon lequel les symboles figurant dans une image à transmettre qui est lue et numérisée sont reconnus par comparaison avec des symboles prototypes stockés dans une bibliothèque constituée au fur et à mesure de l'analyse de l'image, et chaque symbole reconnu est converti sous forme d'une information comprenant un code identifiant le symbole-prototype correspondant et les coordonnées du symbole dans l'image, caractérisé en ce que le reconnaissance des symboles est effectuée suivant le procédé de l'une quelconque des revendications 1 à 7. 9. Fast faxing method according to which the symbols appearing in an image to be transmitted which is read and scanned are recognized by comparison with prototype symbols stored in a library built up as the image is analyzed, and each recognized symbol is converted into information comprising a code identifying the corresponding prototype symbol and the coordinates of the symbol in the image, characterized in that the recognition of symbols is carried out according to the method of any one of claims 1 to 7.
FR8315204A 1983-09-22 1983-09-22 Fast fax device with branch recognition for images containing repetitive symbols Withdrawn FR2552605A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR8315204A FR2552605A1 (en) 1983-09-22 1983-09-22 Fast fax device with branch recognition for images containing repetitive symbols

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR8315204A FR2552605A1 (en) 1983-09-22 1983-09-22 Fast fax device with branch recognition for images containing repetitive symbols

Publications (1)

Publication Number Publication Date
FR2552605A1 true FR2552605A1 (en) 1985-03-29

Family

ID=9292509

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8315204A Withdrawn FR2552605A1 (en) 1983-09-22 1983-09-22 Fast fax device with branch recognition for images containing repetitive symbols

Country Status (1)

Country Link
FR (1) FR2552605A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2618623A1 (en) * 1987-07-24 1989-01-27 Thomson Csf Device for coding/decoding document images using the recognition of shapes and its use in a facsimile system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2179421A5 (en) * 1972-04-01 1973-11-16 Leitz Ernst Gmbh
DE3128794A1 (en) * 1981-07-21 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Method for finding and delimiting letters and letter groups or words in text areas of an original which can also contain graphical and/or image areas apart from text areas

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2179421A5 (en) * 1972-04-01 1973-11-16 Leitz Ernst Gmbh
DE3128794A1 (en) * 1981-07-21 1983-05-05 Siemens AG, 1000 Berlin und 8000 München Method for finding and delimiting letters and letter groups or words in text areas of an original which can also contain graphical and/or image areas apart from text areas

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PROCEEDINGS IEEE CONFERENCE ON PATTERN RECOGNITION AND IMAGE PROCESSING, 14-17 juin 1982, IEEE, LAS VEGAS, Nevada (US), J. SEGEN et al.: "Facsimile compression by pattern matching", pages 191-196. *
PROCEEDINGS OF THE 6TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION, 19-22 octobre 1982, IEEE, M]NICH (DE), Y. HONGO et al.: "Stamped character inspection apparatus based on the BIT matrix method", pages 448-450. *
PROCEEDINGS OF THE IEEE, vol. 68, no. 7, juillet 1980, NEW YORK (US), W.K. PRATT et al.: "Combined symbol matching facsimile data compression system", pages 786-796. *
THE MARCONI REVIEW, vol. XXXII, nos. 172-175, janvier-décembre 1969, CHELMSFORD, ESSEX (GB), J. THOMPSON et al.: "Experimental multifont page reader", pages 82-104. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2618623A1 (en) * 1987-07-24 1989-01-27 Thomson Csf Device for coding/decoding document images using the recognition of shapes and its use in a facsimile system

Similar Documents

Publication Publication Date Title
JP5302768B2 (en) Image processing apparatus and image processing method
Sabourin et al. Off-line identification with handwritten signature images: survey and perspectives
US6597808B1 (en) User drawn circled region extraction from scanned documents
JPH03119486A (en) Method of compressing information included in entered form for storage or transfer
JPH01279368A (en) Transfer system for character data
EP0200593B1 (en) Document seizing, processing and compression apparatus
JPH05225378A (en) Area dividing system for document image
JP4077919B2 (en) Image processing method and apparatus and storage medium therefor
JP2000207489A (en) Character extracting method and device and record medium
Natei et al. Extracting text from image document and displaying its related information
FR2552605A1 (en) Fast fax device with branch recognition for images containing repetitive symbols
JP2831390B2 (en) Image processing device
JP2014132392A (en) Image processing apparatus, image processing method, and program
Aparna et al. A complete OCR system development of Tamil magazine documents
EP2507726B1 (en) Method of generating a result from a search engine search
FR2683350A1 (en) METHOD OF PROCESSING IMAGES MIXING SINGLE SCRIPT AND INTERMEDIATE PSEUDO-TINT PROCESSING AND DEVICE FOR IMPLEMENTING SAME
JP2000148908A (en) Method and device for processing document picture and recording medium
JPH04105178A (en) Document picture processor
JP2002236921A (en) Document image recognition method, document image recognition device and recording medium
JPH08237404A (en) Selection of optical character recognition mode
Bailey et al. Electronic schematic recognition
JPS6254380A (en) Character recognizing device
KR100332753B1 (en) Image processing method of image processing system
JPH0785221A (en) Method for separating and recognizing character and symbol in automatic drawing recognizing device
KR100334624B1 (en) Clustering based document image segmentation method

Legal Events

Date Code Title Description
ST Notification of lapse