EP1581906A2

EP1581906A2 - Procede pour la saisie numerique, le stockage et/ou la transmission d'une information a l aide d une camera equipant un terminal de communication

Info

Publication number: EP1581906A2
Application number: EP03755214A
Authority: EP
Inventors: Martin Lefebure
Original assignee: Real Eyes 3D SA
Current assignee: Real Eyes 3D SA
Priority date: 2002-05-27
Filing date: 2003-05-27
Publication date: 2005-10-05
Also published as: WO2003100713A2; US20060164517A1; AU2003254539A1; CN101103620A; FR2840093B1; JP2006514344A; WO2003100713A3; AU2003254539A8; FR2840093A1

Abstract

Procédé de sélection de zone de numérisation par une caméra (CN), de correction de la déformation projective, d'amélioration de la résolution, puis de binarisation, comprenant les phases opératoires suivantes : la réalisation d'un contour fermé (DC) dans le document à traiter (O) ou autour du document à traiter (O), réalisé manuellement ou imprimé, la présentation du document à traiter (O) devant la caméra (CN) sous une incidence quelconque de manière que le susdit contour soit entièrement visible dans l'image présente sur l'écran de visualisation (AF), l'acquisition de l'image et la recherche de contour dans l'image, le calcul des déformations projectives (bloc CC), l'extraction et la fusion des contenus des images, la génération de l'image finale.

Description

PROCEDE POUR LA SAISIE NUMERIQUE, LE STOCKAGE ET/OU LA TRANSMISSION D'UNE INFORMATION A L'AIDE D'UNE CAMERA EQUIPANT UN TERMINAL DE COMMUNICATION.

La présente invention concerne un procédé pour la saisie numérique d'une information présente sur un support, à l'aide d'une caméra équipant un terminal de communication. Son but est de permettre au terminal de stocker et/ou de transmettre cette information à un destinataire étant entendu que, pour pouvoir être utilisée, cette information doit être extraite et corrigée pour tenir compte notamment de déformations projectives et/ou complétée par incorporation d'un fond et/ou de données textuelles.

Elle s'applique notamment, mais non exclusivement, à la transmission et au stockage de données textuelles et de graphismes numérisés, préalablement visionnés par une caméra sous incidence quelconque puis traités par correction de la déformation projective et éventuellement par amélioration de la résolution.

Un tel processus convient tout particulièrement à la transmission d'informations textuelles et/ou graphiques prises par une caméra équipant un terminal de communication portable tel que, par exemple, un émetteur/récepteur de radio cellulaire.

En effet, pour ce type d'applications, lorsque l'on souhaite transmettre à un destinataire un message écrit tiré d'une photographie, il est fréquemment nécessaire d'effectuer des corrections sans lesquelles le message figurant dans la photographie reçue par le destinataire serait illisible. De même, il s'avère souhaitable de procéder à des inclusions dans l'image transmise, de motifs extérieurs, par exemple des légendes saisies sur le clavier du dispositif, ou même d'effectuer la superposition de l'image prise par la caméra et d'un fond pouvant être sélectionné par exemple dans une bibliothèque accessible par l'appareil.

D'une manière générale, on sait que l'information est devenue aujourd'hui omniprésente et sa maîtrise est capitale ; or cette information est constituée, en grande partie, de données textuelles.

Les connaissances, qu'elles soient techniques, scientifiques, historiques, économiques, juridiques, médicales..., sont en majorité mémorisées et véhiculées par des textes ; celles qui sont publiées récemment sont directement accessibles sous forme électronique ; par contre, la majorité du patrimoine des connaissances n'est encore disponible que sous forme de document papier.

La société est ainsi confrontée à un besoin énorme de retraitement, dit aussi « rétroconversion », pour passer à un format électronique.

La reconnaissance des documents s'apparente à de la reconnaissance d'image ; elle concerne toutes les questions autour du langage écrit et de sa transformation numérique : reconnaissance de caractères, formatage du texte, structuration du contenu et accès à l'information par son indexation.

Il s'agit donc de retrouver une structure existante, de sorte que la reconnaissance soit guidée par un modèle explicite ou implicite de la classe de document étudiée. Le modèle décrit les éléments qui composent le document et leurs relations ; cette description peut être physique par exemple en donnant le format de mise en page. Par ailleurs, on sait que l'interprétation par une personne d'un texte ou d'un graphique, préalablement visionné par une caméra, suppose une prise de vue quasi normale ou perpendiculaire au document supportant le texte ou le graphique et une résolution suffisante pour distinguer les détails.

On peut comprendre aisément que la lecture d'un texte par la personne recevant le message est grandement facilitée sous incidence normale ou quasi normale au plan du document ; quant à l'interprétation d'un graphique, elle nécessite, presque obligatoirement, le respect des formes et des proportions.

Enfin, la reconnaissance de caractères et de documents a considérablement progressé ; les scanners fournissent une résolution suffisante pour les étapes ultérieures de reconnaissance ; celles-ci sont les suivantes :

- acquisition ou numérisation, - redressement,

- quantification,

- binarisation,

- segmentation des pages,

- reconnaissance des caractères, - reconnaissance de la structure logique.

Pour améliorer la qualité de la segmentation et de la reconnaissance automatique de caractères, il est souhaitable que l'image du document soit parfaitement droite et de résolution suffisante ; cela facilite notamment la recherche des colonnes du texte dans le cas où deux colonnes consécutives sont très proches l'une de l'autre et la reconnaissance de caractères si ceux-ci sont de taille particulièrement réduite ; il est donc nécessaire de détecter l'angle de déviation globale de la page et d'améliorer la définition de l'image, notamment, celles issues de caméra de qualité insuffisante permettant de distinguer les détails d'un texte ou d'un graphique pris à une certaine distance et de garantir une résolution minimale pour la reconnaissance des caractères ; plusieurs algorithmes ont été mis au point pour détecter l'angle d'inclinaison du texte ; celui-ci ne peut néanmoins excéder 10 à 20° dans le plan de la scannérisation.

La difficulté devient insurmontable quand le document a été visionné par une caméra sous une incidence quelconque, le document ayant subi une déformation projective : à partir d'une certaine distance de la caméra, on constate la disparition de détails dans l'image qui sont nécessaires à la reconnaissance des caractères et, par conséquent, à la compréhension du document.

L'invention a plus particulièrement pour but de supprimer ces inconvénients et de permettre le stockage et/ou la transmission à un destinataire d'une information corrigée, éventuellement complétée par incorporation d'un fond et/ou de données textuelles.

Bien entendu, pour parvenir à ce résultat, l'invention propose une solution tenant compte des contraintes dues à la taille d'un terminal de communication classique, de ses ressources tant matérielles que logicielles et des débits de transmission.

En conséquence, le procédé selon l'invention comprend les étapes suivantes :

- la prise d'au moins une image par la caméra,

- l'extraction au moins partielle de données contextuelles identifiables incluses dans ladite image grâce à des moyens de traitement intégrés audit terminal,

- l'extraction de données brutes relatives à ladite information par lesdits moyens de traitement,

- le stockage dans une mémoire dudit terminal et/ou la transmission, à destination d'un récepteur, des données brutes, - la correction des données brutes par des moyens de traitement dudit terminal et/ou dudit récepteur à l'aide des données contextuelles,

- la transmission des données corrigées au destinataire par ledit terminal ou par ledit récepteur.

Avantageusement :

- ce procédé pourra comprendre la prise de plusieurs images et la fusion ou la sélection des données extraites, avant ou après correction,

- les données contextuelles et les données brutes pourront être transmises au susdit récepteur, lequel pourra effectuer les susdites corrections et transmettre les données corrigées au destinataire, à la demande du susdit terminal,

- la correction pourra être effectuée par les moyens de traitement du terminal tandis que les données corrigées pourront être transmises directement au destinataire par le terminal ou indirectement par l'intermédiaire du récepteur,

- les données contextuelles pourront être transmises au récepteur, lequel pourra effectuer un traitement de ces données et transmettre au terminal des consignes de contrôle permettant aux moyens de traitement du terminal d'effectuer la correction des données brutes,

- les données contextuelles et les données brutes relatives à ladite information pourront être transmises au récepteur, lequel pourra effectuer la susdite correction et transmettre les données corrigées au destinataire ainsi que des consignes de contrôle permettant aux moyens de traitement du terminal d'effectuer eux-mêmes la correction des données brutes,

- le susdit terminal pourra comprendre des moyens d'accès à une banque d'images ainsi que des moyens permettant d'effectuer une incrustation des données corrigées dans au moins une image sélectionnée.

Par ailleurs, l'étape de correction prévue dans le procédé selon l'invention, pourra comprendre les phases opératoires suivantes : - la réalisation d'un contour dans le document à traiter ou autour du document à traiter, soit à l'aide d'un tracé (par exemple : quadrilatère rectangle) réalisé manuellement ou imprimé, soit à l'aide d'un cadre de matériau quelconque évidé, - la présentation du document à traiter devant la caméra sous une incidence quelconque de manière que le susdit contour soit entièrement visible dans l'image présente sur l'écran de visualisation,

- la recherche de contour dans l'image,

- le calcul des déformations projectives, l'extraction et la fusion des contenus des images,

- la génération de l'image finale.

Avantageusement, ce procédé permet de :

- faciliter l'interprétation du document reçu par la personne concernée, - reconstituer la structure du document à partir de la description physique de celui-ci,

- effectuer la reconnaissance de caractères à partir de logiciels connus de l'état de l'art,

- transférer le document par l'intermédiaire d'un réseau de communication, tel que Internet, d'un réseau cellulaire tel que GSM, GPRS ou UMTS,

- stocker le document sur un support approprié connu de l'état de l'art,

- réduire la taille de l'information numérisée de manière à diminuer la mémoire nécessaire au stockage et à augmenter la vitesse de transmission de cette information.

Dans ce cas, le procédé, selon l'invention, pourra faire intervenir :

- une unité centrale rassemblant des moyens de traitement et de mémorisation,

- une caméra reliée à l'unité centrale, de préférence fixée ou intégrée à celle- ci,

- un écran permettant de visualiser l'image prise par la caméra, - des moyens de transmission et de stockage des informations numérisées.

Ainsi, la rétroconversion du document, c'est-à-dire son passage sous format électronique, sera rendue possible, permettant de ce fait son exploitation, sa transmission et son stockage.

Des modes d'exécution de l'invention seront décrits ci-après, à titre d'exemples non limitatifs, avec référence aux dessins annexés, dans lesquels :

La figure 1 est une représentation schématique d'un système permettant l'extraction et la correction d'une information contenue dans une image prise par un terminal de communication équipé d'une caméra ;

La figure 2 est une représentation schématique permettant d'illustrer les problèmes que pose la prise de vue d'un document sous incidence quelconque ;

La figure 3 représente un organigramme concernant l'acquisition de l'image et la recherche du contour dans l'image ;

La figure 4 représente un organigramme concernant l'extraction, la fusion des contenus des images et la génération de l'image finale ;

La figure 5 représente un organigramme détaillé concernant la recherche de contour dans l'image ;

La figure 6 représente un organigramme détaillé concernant la sélection du contour et le calcul de la déformation projective du contour trouvé dans l'image ;

La figure 7 représente un organigramme détaillé concernant la fusion des informations contenues dans le contour trouvé et le rehaussement des contrastes des images ;

La figure 8 représente un organigramme détaillé concernant l'obtention de l'image finale ; La figure 9 est une représentation schématique illustrant un mode de sélection du contour sous forme graphique ;

La figure 10 est une représentation schématique illustrant un autre mode de sélection du contour.

Dans l'exemple représenté sur la figure 1, le système pour la mise en œuvre du procédé selon l'invention fait intervenir un terminal de communication TC, comportant un transmetteur TR tel que, par exemple, un téléphone portable GSM comprenant de façon classique un émetteur Ei et un récepteur Ri. Ce terminal TC est équipé d'une caméra numérique CN permettant d'effectuer des prises de vue d'un support O comprenant des données textuelles DT et des données contextuelles DC.

Conformément à l'invention, les données numériques délivrées par la caméra CN, pour chacune des images du support O, sont transmises à un circuit de traitement comprenant un dispositif d'extraction de données contextuelles EC (pouvant consister en un contour inscrit dans le support O, par exemple un document que l'on souhaite traiter) et un dispositif d'extraction des données textuelles brutes EDTB relatives à l'information contenue dans l'image. Ce dispositif d'extraction EDTB est conçu de manière à pouvoir utiliser éventuellement les données contextuelles extraites par le dispositif d'extraction EC.

Le dispositif d'extraction EDTB est relié à un circuit correcteur CC qui est conçu de manière à corriger au moins partiellement les données brutes délivrées par le dispositif d'extraction EDTB à partir des données contextuelles délivrées par le dispositif d'extraction EC.

Les données corrigées par le circuit correcteur CC sont transmises à l'émetteur Ε du transmetteur TR en vue d'être retransmises à un destinataire DES, soit directement, soit par l'intermédiaire d'un dispositif de réception REC situé à distance du transmetteur TR.

Le dispositif de réception REC est équipé d'un circuit de traitement TRC permettant de corriger les données brutes éventuellement partiellement corrigées par le circuit correcteur CC du terminal de communication TC. Cette correction est effectuée grâce aux données contextuelles extraites par le dispositif d'extraction EC et transmises au dispositif de réception REC par le terminal TC. De même, ce dispositif de réception REC pourra être équipé d'un système de reconnaissance automatique d'écriture de manière à pouvoir réutiliser l'information dans un éditeur de texte.

En alternative, le dispositif de réception REC pourra être conçu de manière à élaborer des consignes ou des algorithmes de traitement, à partir des données contextuelles transmises par le terminal TC et pour transmettre ces consignes ou ces algorithmes au circuit correcteur CC, via un émetteur E₂ et le récepteur Ri, de manière à permettre au terminal TC d'effectuer la correction des données brutes à l'aide d'un circuit correcteur CC simplifié (les traitements lourds qui nécessitent des ressources importantes étant réalisés par le circuit de traitement TRC du dispositif de réception REC).

Les données corrigées par le circuit correcteur CC ou par le circuit de traitement TRC pourront être transmises à un circuit d'incrustation CI situé en amont du transmetteur TR qui permet d'incorporer et éventuellement de fusionner ces données corrigées dans ou moins une image sélectionnée par un circuit de sélection SEL. Inversement, le circuit d'incrustation pourra comprendre des moyens permettant d'incorporer à ladite image sélectionnée d'autres informations telles que, par exemple, des informations textuelles et/ou graphiques. Cette image peut par exemple consister en un fond monochrome. Elle peut être sélectionnée parmi une pluralité d'images stockées ou éventuellement téléchargées dans le terminal TC, voire même prises par la caméra.

Avantageusement, ces images pourront provenir d'une banque de données d'images BDI équipant le récepteur REC.

Dans ce cas, le terminal TC pourra être conçu de manière à adresser au récepteur REC un ordre de sélection d'une image contenue dans la banque de données BDI. De même, le récepteur REC sera conçu de manière à adresser au terminal TC l'image sélectionnée en vue d'effectuer l'incrustation.

Bien entendu, le terminal TC pourra comprendre un afficheur AF permettant de visualiser les données et éventuellement les domiées contextuelles, éventuellement incrustées dans une image, avant de les transmettre au destinataire DES, soit directement, soit par l'intermédiaire du récepteur REC.

Dans l'exemple représenté sur la figure 2, la caméra C est axée sur le centre d'un document rectangulaire D selon un angle d'incidence i. L'image de ce document, saisie par la caméra C telle que visualisée sur un écran E, a subi une déformation projective et présente donc une forme trapézoïdale D'.

Pour supprimer cet inconvénient, l'invention propose d'inclure préalablement dans le document D des données contextuelles, ici un contour fermé dans le document à traiter ou autour du document à traiter. Ce contour pourrait également consister en le bord périphérique du document ; il constitue ainsi une zone de numérisation visionnée par la caméra ; les images successives acquises par la caméra, sont rendues visibles sur l'écran de visualisation.

Conformément à l'organigramme de la figure 3, pour chacune des prises de vue demandées par l'utilisateur, le procédé comprend une première étape de recherche du contour (bloc 1), jusqu'à l'obtention du contour trouvé (bloc 2) ; le contour étant détecté, l'image est sauvegardée (bloc 3) et l'acquisition est terminée ; le processus se répète jusqu'à l'obtention de N images, N étant fixé à l'avance (bloc 4).

Conformément à l'organigramme de la figure 4, à partir des images sauvegardées, le procédé effectue un calcul des déformations projectives des contours (bloc 5), puis la fusion des informations contenues dans les images (bloc 6) et enfin la génération de l'image finale (bloc 7).

Conformément à l'organigramme de la figure 5, le procédé comprend la détection des frontières présentes dans l'image (bloc 11), l'extraction des frontières suffisamment longues (bloc 12) et la détection des zones délimitées par les frontières trouvées dont l'aire est suffisante et ne touchant pas le bord de l'image (bloc 13).

Conformément à l'organigramme de la figure 6, le procédé propose, pour chaque zone trouvée dans la phase de recherche de contour, de calculer l'axe principal de la zone (bloc 51), puis de trouver un point externe à la zone sur l'axe (bloc 52), puis de construire le cône externe issu du point externe (bloc 53), puis d'extraire les points de la f ontière dont la normale extérieure s'oppose au vecteur le joignant et partant du point externe (bloc 54), puis de calculer la droite portée par l'axe principal des points extraits (bloc 55), puis, quatre droites étant trouvées, de calculer les quatre sommets du quadrilatère issu des quatre droites (bloc 56), puis, l'aire du quadrilatère étant proche de l'aire de la zone, de calculer l'homographie déformant le quadrilatère en rectangle de proportion fixée à l'avance (bloc 57).

Si quatre droites ne sont pas trouvées, le procédé propose de calculer l'axe déduit par translation de l'axe principal des points extraits, dans la direction perpendiculaire à celui-ci (bloc 58). Si l'aire du quadrilatère rectangle n'est pas proche de l'aire de la zone non encore considérée, le procédé propose d'effectuer à nouveau un calcul de l'axe principal de la zone (bloc 51), suivi des opérations définies ci-dessus.

Conformément à l'organigramme de la figure 7, le procédé comprend, pour chaque image à traiter par la correction de déformation projective, la construction d'une image virtuelle rectangulaire par projection du contenu du contour en utilisant l'homographie calculée (bloc 61), le rehaussement du contraste de l'image virtuelle par application d'un filtre dit de rehaussement des bords (bloc 62), puis le calcul de l'image virtuelle moyenne dont les intensités de couleur sont les moyennes des intensités de couleur des images virtuelles rehaussées (bloc 63).

Conformément à l'organigramme de la figure 8, le procédé propose, pour chaque pixel de l'image virtuelle moyenne, de calculer la moyenne des intensités de couleur, suivant la formule M = (R+V+B)/3 (bloc 71). Si le terme M est inférieur à un seuil prédéterminé, le pixel de l'image finale est considéré comme noir (bloc 72) ; a contrario, si le terme M est supérieur à ce même seuil, le pixel de l'image finale est considéré comme blanc (bloc 73).

Le contour recherché 1 est représenté, sur la figure 9, par ses quatre segments de droite la, lb, le et ld :

- soit la droite 2, l'axe principal de la zone délimitée par le contour 1, passant par le barycentre G,

- soit le point 3, situé à l'extérieur de la zone sur l'axe 2,

- soit les demi-droites 31 et 32, issues du point 3, formant le cône externe au segment de droite la du contour 1,

- soit les points 4 et 5, situés sur le segment la, - soit les normales extérieures au contour 41 et 51, les demi-droites perpendiculaires au segment de droite la, au niveau des points 4 et 5. Les points 4 et 5 sont deux points parmi les points extraits qui définissent la frontière de la zone matérialisée par le segment de droite la, puisque les normales extérieures au contour 41 et 51 s'opposent aux demi-droites rejoignant respectivement les points 3 et 4, 3 et 5.

La recherche des autres segments de droite lb, le et ld est effectuée selon le même procédé à partir de la droite 6, déduite par translation du segment de droite la, en s'éloignant de celui-ci par rapport au point 3, et du point 7, situé sur la droite 6, à l'extérieur de la zone délimitée par le contour 1, et des demi- droites 71 et 72 formant le cône externe au segment de droite lb.

Dans cet exemple, le procédé de sélection de zone de numérisation par caméra, de correction de la déformation projective, d'amélioration de la résolution puis de binarisation comprend :

- la réalisation d'un contour fermé dans le document à traiter ou autour du document à traiter, soit à l'aide d'un tracé (par exemple : quadrilatère rectangle) réalisé manuellement ou imprimé, soit à l'aide d'un cadre de matériau quelconque évidé, - la présentation du document à traiter devant la caméra sous une incidence quelconque de manière que le susdit contour et le susdit document soient entièrement visibles dans l'image présente sur l'écran de visualisation,

- la détection des frontières présentes dans l'image,

- l'extraction des frontières suffisamment longues, - la détection des zones délimitées par les frontières trouvées dont l'aire est suffisante et ne touchant pas le bord de l'image,

- la recherche de nouvelles frontières et la poursuite du processus si le contour n'est pas trouvé, jusqu'à l'obtention d'un contour permettant la sauvegarde et l'acquisition de l'image, - la sauvegarde et l'acquisition de l'image si un contour est trouvé, - le calcul des déformations projectives des contours consistant à calculer l'axe principal de la zone, puis à trouver un point externe à la zone sur l'axe, puis à construire le cône externe issu du point externe, puis à extraire les points de la frontière dont la normale extérieure s'oppose au vecteur le joignant et partant du point externe, puis à calculer la droite portée par l'axe principal des points extraits, puis, quatre droites étant trouvées, à calculer les quatre sommets du quadrilatère issu des quatre droites, puis, l'aire du quadrilatère rectangle étant proche de l'aire de la zone non encore considérée, à calculer l'homographie déformant le quadrilatère en rectangle de proportion fixée à l' avance,

- le calcul de l'axe déduit par translation de l'axe principal des points extraits, dans la direction perpendiculaire à celui-ci, si quatre droites ne sont pas trouvées,

- le calcul à nouveau de l'axe principal d'une zone non encore considérée, suivi des opérations précédentes, si l'aire de quadrilatère rectangle n'est pas proche de l'aire de la zone,

- la construction pour chaque image d'une image virtuelle rectangulaire par projection du contenu du contour en utilisant l'homographie calculée,

- l'amélioration du contraste de l'image virtuelle par application d'un filtre dit de rehaussement des bords, le calcul de l'image virtuelle moyenne dont les intensités de couleur sont des moyennes des intensités de couleur des images virtuelles rehaussées,

- le calcul de l'image virtuelle moyenne dont les intensités de couleur sont les moyennes des intensités de couleur des images virtuelles rehaussées, - le calcul, pour chaque pixel de l'image virtuelle moyenne, de la moyenne M des intensités de couleur,

- la désignation comme pixel noir, tout pixel dont le terme M est inférieur à un seuil prédéterminé,

- la désignation comme pixel blanc, tout pixel dont le terme M est supérieur à un seuil prédéterminé. Ainsi, ce procédé permet la présentation, l'exploitation, la transmission et le stockage de textes et de graphiques numérisés, préalablement visionnés par une caméra sous incidence quelconque puis traités par correction de la déformation projective et par amélioration de la résolution.

Bien entendu, l'invention ne se limite pas au mode d'exécution précédemment décrit.

Ainsi notamment, les données contextuelles pourront comprendre un contour non fermé réalisé à main levée. Dans ce cas, la détection de ce contour CO pourra s'effectuer selon une séquence opératoire comprenant les étapes suivantes (figure 10) :

- la recherche le long d'une ligne horizontale, par exemple la ligne médiane de l'image d'un pixel présentant avec le ou les pixels environnants une variation de niveau significative (par exemple déterminée par la dérivée première des niveaux de gris de l'image au niveau de ces pixels),

- dans le cas où aucun pixel n'est trouvé à l'étape précédente sur la ligne horizontale, une recherche similaire le long d'au moins une ligne verticale (par exemple la ligne médiane), - le suivi de la courbe supposée formée par les pixels à variation de niveau significative, en testant itérativement les pixels voisins non encore explorés,

- le calcul du barycentre G et des principaux axes XX' - YY' du contour précédemment déterminé,

- un test pour déterminer si les points du contour ont un rapport de dispersion raisonnable entre les deux principales directions,

- le choix d'un axe du contour (cet axe sera de préférence un axe principal XX' - YY' du contour et, si nécessaire, un axe secondaire) et, sur cet axe :

. la détermination, de part et d'autre du contour CO de points externes PEi et PE₂, situés à l'extérieur du contour CO à une distance de quelques pixels et, pour chaque point externe, . la détermination de deux couples de points singuliers (PSi, PS'i) - (PS₂,

PS'₂), tels que par exemple des angles ou des extrémités du contour, en utilisant à cet effet pour chacun des points externes PEi, PE2, deux segments de droite (SD SD'i) - (SD₂, SD'₂) issus d'un point externe et définissant un angle dans lequel le contour se trouve inscrit, et

- le calcul des paramètres de transformation projective en utilisant la forme géométrique définie par les points singuliers (PSi, PS'i) - (PS₂, PS'₂).

Dans l'exemple de la figure 10, le contour CO présente approximativement la forme d'un U couché. Dans ce cas, les points singuliers consistent en les deux extrémités PS'_l5 PS'₂ du contour CO et les deux sommets PSi, PS₂ des angles respectivement formés entre l'âme et les deux branches du U. L'axe principal XX' n'est pas utilisé en raison du fait qu'il ne coupe le contour qu'une seule fois. C'est la raison pour laquelle on utilise l'axe YY' (qui recoupe l'axe principal XX' au niveau du barycentre G).

Par ailleurs, le procédé selon l'invention pourra comprendre un processus de classification du support de l'image (papier uni/papier quadrillé) et d'élimination du quadrillage dans le cas d'un papier quadrillé.

Ce processus consiste à déterminer si les tracés de l'image à bas gradient (variation des niveaux de gris) constituent un quadrillage s'étendant jusqu'à au moins une frontière de l'image. Si tel est le cas, le procédé consiste à élever le seuil au-delà duquel les gradients sont pris en compte de manière à éliminer le quadrillage. Bien entendu, ce processus implique que les lignes du quadrillage présentent un contraste (en référence au papier) plus faible que le contenu manuscrit de l'image, ce qui est vrai dans la très grande majorité des cas.

Ce processus pourra comprendre les étapes suivantes : - le choix du plus petit seuil de gradient significatif au regard du bruit pour détecter le contour par exemple de la façon précédemment indiquée, - si les motifs détectés touchent une frontière entourant l'image, la déduction que des lignes de quadrillage sont présentes sur le support,

- si les lignes de quadrillage sont présentes, l'incrémentation du seuil de gradient puis l'exécution à nouveau de la deuxième étape avec le nouveau seuil, ce processus étant répété jusqu'à ce que le contour trouvé ne touche plus le bord,

- l'usage du dernier seuil de gradient (gradient de disparition des lignes de quadrillage) pour extraire les données contenues dans l'image (par exemple selon un processus d'extraction classique) sans prendre en considération les lignes de quadrillage.

De même, le processus d'extraction des données pourra s'effectuer selon une séquence comprenant les étapes suivantes :

a) La détermination, pour chaque point de l'image, d'une valeur Vo [C, L] consistant en une combinaison des composantes de la couleur de l'image pour le point repéré par la colonne C et la ligne L de l'image, cette valeur No [C, L] ayant pour expression :

V₀ [C, L] = αRouge [C, L] + βVert [C, L] + γBleu [C, L]

Formule dans laquelle α, β, γ sont des coefficients pouvant répondre, par exemple, aux relations suivantes :

α + β + γ = 1 et α, β, γ > 0

b) Le calcul, pour chaque point de l'image, d'une valeur N_{Ν +} i [C, L] de la manière suivante (selon qu'il s'agit d'une information sombre sur un fond claire ou le contraire) :

V_N[C+1,L+1] + V_N[C-1,L-1]

V_N[C + 1,L-1] + V_N[C-1,L+1]

V_N[C,L+1] + V_N[C,L-1]

c) L'itération de l'étape b un nombre prédéterminé de fois puis la prise en compte de la valeur finale V_Nfinaι-

d) Le calcul, pour chaque point de l'image, de la différence D [C, L]

D [C, L] = V_{N fma}ι [C, L] - V₀ [C, L] (ou V₀ [C, L] - V_{N flna}ι [C, L])

e) la comparaison, pour chaque point de l'image, de la valeur D [C, L] avec une valeur de seuil V_s de manière à déterminer les valeurs à extraire de la façon suivante : si D [C, L] < V_s alors D [C, L] = 0 si D [C, L] ≥Vs on conserve la valeur D [C, L] ou on la remplace par D [C, L] - V_s

f) on quantifie les valeurs de D [C, L] dans un nombre prédéterminé de niveaux (étant entendu que l'on obtient une binarisation dans le cas où le nombre de niveaux est égal à 2). Eventuellement, la valeur de seuil (Vs) pourra consister en la valeur de seuil de gradient de disparition du quadrillage utilisé dans le processus d'élimination du quadrillage précédemment décrit.

Claims

REVENDICATIONS

1. Procédé pour la saisie numérique d'une information présente sur un support (O) par une caméra (CN) équipant un terminal de communication (TC), ainsi que pour le stockage et/ou la transmission par ce terminal (TC), à un destinataire (DES), de ladite information, caractérisé en ce qu'il comprend les étapes suivantes :

- la prise d'au moins une image du support (O) par la caméra (CN),

- l'extraction au moins partielle de données contextuelles (DC) identifiables incluses dans ladite image grâce à des moyens de traitement (EC, EDTB) intégrés audit terminal (TC),

- l'extraction de données brutes relatives à ladite information par lesdits moyens de traitement (EC, EDTB) à l'aide des données contextuelles,

- le stockage dans une mémoire dudit terminal (TC) et/ou la transmission à destination d'un récepteur (REC), de l'information extraite,

- la correction des données brutes par des moyens de traitement (CC-TRC) dudit terminal (TR) et/ou dudit récepteur (REC) à l'aide des données contextuelles,

- la transmission des données corrigées au destinataire (DES) par ledit terminal (TC) ou par ledit récepteur (REC).

2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend la prise de plusieurs images et la fusion ou la sélection des susdites données avant ou après correction.

3. Procédé selon la revendication 1, caractérisé en ce que les données contextuelles et les susdites données brutes sont transmises au susdit récepteur (REC), lequel effectue les susdites corrections et transmet les données corrigées au destinataire à la demande du susdit terminal (TC).

4. Procédé selon la revendication 1, caractérisé en ce que la susdite correction est effectuée par les moyens de traitement du terminal (TC), et en ce que les données corrigées sont transmises directement au destinataire (DES) par le terminal (TC) ou indirectement par l'intermédiaire du récepteur (REC).

5. Procédé selon la revendication 1, caractérisé en ce que les données contextuelles sont transmises au récepteur (REC), lequel effectue un traitement de ces données et transmet au terminal des consignes de contrôle permettant aux moyens de traitement du terminal (TC) d'effectuer la correction des données brutes.

6. Procédé selon la revendication 1, caractérisé en ce que les données contextuelles et les données brutes relatives à ladite information sont transmises au récepteur (REC), lequel effectue la susdite correction ou transmet les données corrigées et/ou interprétées au destinataire (DES) ainsi qu'éventuellement les consignes de contrôle permettant aux moyens de traitement du terminal (TC) d'effectuer la correction des données brutes.

7. Procédé selon la revendication 1, caractérisé en ce que le susdit terminal (TC) comprend des moyens permettant d'effectuer l'incrustation et/ou la fusion des données corrigées dans au moins une image sélectionnée pouvant consister en un fond monochrome.

8. Procédé selon la revendication 7, caractérisé en ce que la susdite image est sélectionnée dans une banque d'images (BDI) ou est prise par la caméra (CN) du terminal (TC).

9. Procédé selon la revendication 8, caractérisé en ce que la banque d'images (BDI) est directement accessible par le terminal (TC) ou indirectement par l'intermédiaire du récepteur (REC).

10. Procédé selon l'une des revendications précédentes, caractérisé en ce que la susdite correction porte sur la géométrie, le contraste et/ou la couleur.

11. Procédé selon l'une des revendications précédentes, caractérisé en ce que les données corrigées sont transmises au récepteur (REC) et/ou au destinataire (DES) sous forme vectorielle.

12. Procédé selon l'une des revendications précédentes, caractérisé en ce que le susdit terminal (TC) comprend des moyens permettant la restitution des couleurs contenues dans l'image et/ou le fond et/ou la sélection des couleurs utilisables dans le processus de correction.

13. Procédé selon l'une des revendications précédentes, caractérisé en ce que les susdites données contextuelles sont matérialisées par un contour fermé ou ouvert, tracé éventuellement à la main sur le support, et en ce que la susdite étape d'extraction des données contextuelles comprend la recherche du contour dans l'image et le calcul des déformations projectives du contour.

14. Procédé selon la revendication 13, caractérisé en ce que la recherche de contour dans l'image comprend :

- la détection des frontières présentes dans l'image (bloc 11),

- l'extraction des frontières suffisamment longues (bloc 12), - la détection des zones délimitées par les frontières trouvées dont l'aire est suffisante et ne touchant pas le bord de l'image (bloc 13), - la recherche de nouvelles frontières et la poursuite du processus si le contour n'est pas trouvé, jusqu'à l'obtention d'un contour.

15. Procédé selon la revendication 13, caractérisé en ce que l'extraction de l'image et la génération de l'image finale comprend :

- le calcul des déformations projectives des contours consistant à calculer l'axe principal de la zone (bloc 51), puis à trouver un point externe à la zone sur l'axe (bloc 52), puis à construire le cône externe issu du point externe (bloc 53), puis à extraire les points de la frontière dont la normale extérieure s'oppose au vecteur le joignant et partant du point externe (bloc 54), puis à calculer la droite portée par l'axe principal des points extraits (bloc 55), puis, quatre droites étant trouvées, à calculer les quatre sommets du quadrilatère issu des quatre droites (bloc 56), puis, l'aire du quadrilatère rectangle étant proche de l'aire de la zone non encore considérée, à calculer l'homographie déformant le quadrilatère en rectangle de proportion fixée à l'avance (bloc 57),

- le calcul à nouveau de l'axe principal d'une zone non encore considérée (bloc 58), suivi des opérations précédentes, si l'aire de quadrilatère rectangle n'est pas proche de l'aire de la zone,

- la construction pour chaque image d'une image virtuelle rectangulaire par projection du contenu du contour en utilisant l'homographie calculée (bloc

61), et

- l'amélioration éventuelle du contraste de l'image virtuelle par application d'un filtre dit de rehaussement des bords (bloc 62).

16. Procédé selon la revendication 15, caractérisé en ce qu'il comprend une phase de binarisation comportant les étapes suivantes :

- le calcul de l'image virtuelle moyenne dont les intensités de couleur sont les moyennes des intensités de couleur des images virtuelles rehaussées (bloc

63),

- le calcul, pour chaque pixel de l'image virtuelle moyenne, de la moyenne M des intensités de couleur (bloc 71),

- la désignation comme pixel noir, tout pixel dont le terme M est inférieur à un seuil prédéterminé (bloc 72),

- la désignation comme pixel blanc, tout pixel dont le terme M est supérieur à un seuil prédéterminé (bloc 73).

17. Procédé selon la revendication 1, caractérisé en ce que les données contextuelles sont matérialisées par un contour fermé ou non fermé inclus dans l'image et en ce que la détection de ce contour en vue d'extraire les données contextuelles s'effectue conformément à la séquence suivante :

- la recherche le long d'une première droite d'un pixel présentant avec les pixels environnant une variation de niveau significative,

- la recherche selon une autre droite dans le cas où aucun pixel n'a été trouvé dans l'étape précédente,

- le suivi de la courbe supposée par les pixels à variation de niveau significative, en testant itérativement les pixels voisins non encore explorés, - le calcul du barycentre (G) et des principaux axes du contour précédemment déterminé,

- le choix d'un axe du contour et sur cet axe :

. la détermination, de part et d'autre du contour (CO), de points externes (PEi, PE₂) situés à l'extérieur du contour (CO), à une distance de quelques pixels et, pour chaque point externe,

. la détermination de deux couples de points singuliers (PS_l5 PS'i - PS₂,

PS'₂), en utilisant à cet effet, pour chacun des points externes (PEi, PE₂), deux segments de droite (SDi, SD'i - SD₂, SD'₂) issus d'un point externe et définissant un angle dans lequel le contour se trouve inscrit, et - le calcul des paramètres de transformation projective en utilisant la forme géométrique définie par les points singuliers (PSi, PS'i - PS₂, PS'₂).

18. Procédé selon la revendication 1, caractérisé en ce qu'il comprend la classification du support de l'image et l'élimination d'un quadrillage éventuellement présent sur le support, cette classification comportant les étapes suivantes :

- le choix du plus petit seuil de gradient significatif au regard du bruit pour détecter le contour par exemple de la façon précédemment indiquée,

- si les motifs détectés touchent une frontière entourant l'image, la déduction que des lignes de quadrillage sont présentes sur le support,

- si les lignes de quadrillage sont présentes, l'incrémentation du seuil de gradient puis l'exécution à nouveau de la deuxième étape avec le nouveau seuil, ce processus étant répété jusqu'à ce que le contour trouvé ne touche plus le bord, - l'usage du dernier seuil de gradient (gradient de disparition des lignes de quadrillage) pour extraire les données contenues dans l'image.

19. Procédé selon la revendication 1, caractérisé en ce que l'extraction des susdites données comprend les phases opératoires suivantes : a) la détermination, pour chaque point de l'image, d'une valeur V₀ [C,L] par combinaison des composantes de couleur de l'image pour le point repéré à l'intersection d'une colonne (C) et d'une ligne (L) de l'image, b) le calcul, pour chaque point de l'image, d'une valeur V_{N +} i [C,L] par la sélection de la valeur maximale ou minimale entre V_N [C,L] et les valeurs moyennes des couples de points opposés par rapport à celui situé à l'intersection de la colonne (C) et de la ligne (L), c) l'itération de l'étape b un nombre prédéterminé de fois, puis la prise en compte d'une valeur finale (V_NFmai) d) le calcul, pour chaque point de l'image, de la différence D [C, L]

D [C, L] = V_Nfmal [C, L] - V₀ [C, L] ou V₀ [C, L] - V_Nfmal [C, L] e) la comparaison, pour chaque point de l'image, de la valeur D [C, L] avec une valeur de seuil (V_s), en vue de déterminer la valeur à extraire, et la quantification des valeurs extraites dans un nombre prédéterminé de niveaux.

20. Procédé selon les revendications 18 et 19, caractérisé en ce que la valeur de seuil (V_s) consiste en la valeur de seuil de gradient de disparition du quadrillage.