FR2628864A1 - Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images - Google Patents

Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images Download PDF

Info

Publication number
FR2628864A1
FR2628864A1 FR8803639A FR8803639A FR2628864A1 FR 2628864 A1 FR2628864 A1 FR 2628864A1 FR 8803639 A FR8803639 A FR 8803639A FR 8803639 A FR8803639 A FR 8803639A FR 2628864 A1 FR2628864 A1 FR 2628864A1
Authority
FR
France
Prior art keywords
block
blocks
image
vectors
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR8803639A
Other languages
English (en)
Other versions
FR2628864B1 (fr
Inventor
Bruno Choquet
Daniele Pele
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telediffusion de France ets Public de Diffusion
Etat Francais
Original Assignee
Telediffusion de France ets Public de Diffusion
Etat Francais
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telediffusion de France ets Public de Diffusion, Etat Francais filed Critical Telediffusion de France ets Public de Diffusion
Priority to FR8803639A priority Critical patent/FR2628864B1/fr
Publication of FR2628864A1 publication Critical patent/FR2628864A1/fr
Application granted granted Critical
Publication of FR2628864B1 publication Critical patent/FR2628864B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/015High-definition television systems
    • H04N7/0152High-definition television systems using spatial or temporal subsampling
    • H04N7/0155High-definition television systems using spatial or temporal subsampling using pixel blocks
    • H04N7/0157High-definition television systems using spatial or temporal subsampling using pixel blocks with motion estimation, e.g. involving the use of motion vectors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Le domaine de l'invention est celui de l'analyse et du codage du mouvement des points de séquences d'images électroniques, en vue d'en optimiser le sous-échantillonnage 14 et de regrouper les points au sein de blocs de points à déplacement homogène, selon une opération 12 dite de " segmentation ". L'objectif est d'insérer l'opération de segmentation au moins partiellement dans le processus préalable d'estimation de mouvement 11, en permettant de minimiser le nombre de représentants de l'image, ainsi que le débit des données d'assistance 13 à la reconstruction 15, 16 d'une image HD au décodeur. Cet objectif est atteint par un procédé qui sélectionne un nombre limité de vecteurs-représentants-candidats VRC, parmi des vecteurs-vitesse-prédits et/ou estimés, puis, leur fait subir une opération de dispersion autour de leur valeur d'origine avant d'effectuer une réallocation desdits VRC dispersés selon une procédure adaptative du type " aggrégation/division " de blocs dans ladite image.

Description

"Procédé de sewentation d'un champ de vecteurs vitesse. notamment de vitesses de deplacement de points d'une image dans une séquence d'imaaes".
Le domaine de l'invention est celui de l'analyse et du codage de séquences d'images électroniques, et plus particuliérement de l'analyse du mouvement des points de telles images électroniques.
Dans un cas spécifique qui sera détaillé ciaprès, le procédé suivant l'invention s'applique à l'analyse de séquences d'images en haute définition destinées å être transmises à travers un canal à débit limité. Une application préférentielle de ce type est la transmission de télévision haute définition sur canal
MAC.
Toutefois, le procédé de l'invention peut aussi bien être utilisé dans tout système analysant une séquence d'imagés (robotique, suivi de cibles, recherche de paramètres spatiaux et/ou temporels,...) ou une séquence d'ensembles de données (applications médicales, météorologiques,...).
Le procédé suivant l'invention est destiné à s'inscrire dans une chaine de traitement d'images, et a constituer un maillon d'analyse des vitesses de déplacement des points d'image dans le plan d'image, afin notamment de regrouper les points au sein de blocs de points à déplacement homogène, selon une opération dite de "segmentation".
Une telle analyse présente de très nombreux intérêts.
Dans le cas de la transmission de séquences d' images HD (10) dans un canal 18 à débit limité (figure 1), le traitement d'images a pour objet de réduire le volume d'informations transmises, de telle façon que
- à l'émission, on procède à une opération 14 de sous-échantillonnage d'une image HD, les données sous échantillonnées 19 étant accompagnées de "données d'assistance" 13 transmises conjointement dans le canal de données 18
- à la réception, on effectue une opération inverse consistant å utiliser les donnees d'assistance 13 et le signal sous-échantillonné 19 dans une opération 15 d'interpolation et de compensation pour restituer un signal 16 haute définition.
Le cas échéant, le signal sous-échantillonné 19 peut être visualisé tel quel sur un poste de télévision conventionnel 17.
Dans ce type d'application, l'étape de segmentation 12 de l'image en blocs de points présentant des vitesses de déplacement relativement homogènes, selon la présente invention, intervient par exemple préalablement à l'opération de sous-échantillonnage à l'émission.
La segmentation de l'image s'inscrit ainsi avantageusement entre une opération préalable d'estimation de mouvement des points d'images, et une opération de compression des données d'images.
L'opération d'estimation de mouvement a pour objectif de créer une base de données spatio-temporelle, dont les données sont représentatives de l'activité de mouvement des points, dans le plan d'image, et dans le temps.
L'opération de segmentation consiste A optimiser le sous-échantillonnage ultérieur du signal d'image, en regroupant le plus grand nombre de points possible, au sein de blocs de points å déplacement homogène. Chaque bloc est donc susceptible d'être représenté par un vecteur unique de vitesse de déplacement.
Les vecteurs de vitesse de déplacement permettent ensuite de réaliser un sous-échantillonnage de l'image dans l'axe du mouvement, comme décrit dans la demande de brevet française n*87 17 601 du 16.12.87, aux noms des mêmes déposants.
La figure 1 illustre schématiquement la succession d'étapes du processus de codage/décodage dans lequel s'inscrit le procédé de segmentation suivant l'invention.
On notera que la segmentation pilote non seulement le sous-échantillonnage d'images, mais encore l'élaboration de données d'assistance, ces dernières permettant la restitution de l'image haute définition, par interpolation et compensation, à partir de l'image sous-échantillonnée.
On connait un procédé d'estimation de mouvement, avec multiprédiction de mouvement incluant une prédiction dans le sens du mouvement, tel que décrit dans la demande de brevet n87 17 602 déposée le 16.12.87 aux noms des mêmes déposants, conjointement à la demande antérieure déjà mentionnée.
Selon ce procédé d'estimation de mouvement, et comme schématisé en figure 2, plusieurs prédictions (1, 2,...n) sont émises 20, puis servent de point de départ à un calcul d'estimation de vitesse 22, selon un processus algorithmique de correction par optimisation de critère 21. Un algorithme preféré est celui de WAIXER et RAO, utilisant comme critère l'écart de luminance DFD (= DFD = "displaced frame difference") entre l'image source et l'image estimée. (voir WALKER, DR., RAO, K.R. "New technique in pel-recursive motion compensation" ICC 84,
Amsterdam, pp. 703-706).
La meilleure estimation, c'est-à-dire celle qui minimise la DFD 23, 24, est ensuite retenue comme estimation de mouvement pour le point courant 25.
Au cours de ce procédé d'estimation de mouvement, le calcul de l'écart de luminance DFD, qui sert autant dans la fonction de correction 21 que dans l'opération de choix de la meilleure estimation 23, 24, correspond au calcul le plus coûteux au point de vue de la réalisation matérielle de l'estimateur, et du temps de traitement.
En conséquence, un premier objectif de l'invention est de fournir un procédé de segmentation du champ des vecteurs de déplacement des points d'images, compatible avec un tel procédé d'estimation, notamment en insérant l'opération de segmentation au moins partiellement dans le processus d'estimation de mouvement.
Un second objectif de l'invention est de bénéficier des calculs du critère de correction et du critère de choix (DFD) effectués dans le procédé d'estimation, pour la mise en oeuvre de la segmentation, afin d'alléger et de rationaliser la réalisation matérielle du codeur d'images.
Un objectif complémentaire de l'invention est de fournir un procédé de segmentation susceptible d'optimiser la structure de sous-échantillonnage, afin de permettre une restitution optimale de la séquence d'images à partir du signal sous-échantillonné. A cet égard, l'image sous-échantillonnée doit pouvoir être soit visualisée telle quelle (dans le cas par exemple où le sous-échantillonnage consiste à comprimer une image HD sous un format transmissible par canal de télévision conventionnelle) soit reconstruite à l'aide de données d'assistance pour obtenir une image HD.
Un autre objectif de l'invention est de fournir un procédé de segmentation maximisant la taille des blocs de points à mouvement homogène. Chaque bloc pouvant être représenté par un vecteur-vitesse représentant unique, l'objectif est ainsi de minimiser le nombre de représentants de l'image, ainsi que le débit des données d'assistance à la reconstruction d'une image HD au décodeur.
Un objectif supplémentaire de l'invention est de fournir un procédé de segmentation permettant l'élimination des points isoles (du point de vue de leur mouvement), en évitant de condamner un bloc en bordure de contour d'image.
L'invention a également pour objectif de se rapprocher d'un processus de reconnaissance de formes, en permettant une construction adaptative des blocs d'images visant à épouser au mieux les contours des objets en mouvement, voire même les contours qui se chevauchent de deux objets superposés dans des plans différents.
Ces objectifs ainsi que d'autres qui apparaîtront par la suite sont atteints à l'aide d'un procédé de segmentation d'un champ de vecteurs-vitesses, notamment représentatif des valeurs de la vitesse courante de déplacement, dans le plan de l'image, de points d'une image électronique appartenant à une séquence d'images, ladite segmentation consistant à découper ledit champ de vecteurs en blocs de vitesses de déplacement sensiblement homogènes, et à affecter à chacun desdits blocs au moins un vecteur représentant, notamment en vue de réaliser un traitement de compression optimise de signal d'image,
caractérisé en ce que
chaque vecteur de déplacement courant d'un point courant est calculé selon un processus algorithmique convergent de prédiction/correction, ledit processus consistant à prendre comme hypothèse de départ de calcul une valeur prédite de mouvement, ladite valeur prédite étant corrigée ensuite au sein du processus selon un procédé de correction par optimisation de critère permettant de calculer une valeur estimée de déplacement,
en ce que ledit procédé réalise en parallèle au moins deux -calculs d'estimation de mouvement à partir d'au moins deux valeurs prédites de mouvement du point courant,
en ce que ledit procédé sélectionne un nombre limité de vecteurs-représentants-candidats (VRC), parmi lesdits vecteurs -vitesse-prédits et/ou lesdits vecteursvitesse-estimés,
en ce qu'on réalise une dispersion de chacun desdits VRC autour de sa valeur d'origine, de façon à obtenir une pluralité de VRC acceptables,
et en ce qu'on effectue une réallocation desdits VRC dispersés selon une procédure adapatative du type "aggrégation/division" de blocs dans ladite image.
Selon une première variante du procédé, lesdits vecteurs-représentants-candidats sont sélectionnés pour chaque bloc d'image, en chaque point dudit bloc, parmi au moins lesdits vecteurs-vitesse-prédits et/ou lesdits vecteurs-vitesse-estimés, ladite opération de sélection consistant en un seuillage sur ledit critère de décision.
De façon avantageuse, on effectue ladite sélection des candidats en chaque point- d'image, simultanément à une seconde opération de sélection d'une estimation optimale de mouvement en chaque point, à l'instant t, en vue par exemple de réaliser une projection approximative de la position de chaque point d'image à l'instant (t+l) et/ou en vue d'élaborer des données d'assistance à la restitution d'image à partir et en complément desdits représentants de blocs,
ladite seconde opération de selection choisissant ladite valeur d'estimation optimale de mouvement, pour chaque point, parmi au moins lesdits vecteurs vitesse estimés, selon un procédé de décision par optimisation dudit critère de décision.
L'invention a également pour objet un procédé de segmentation d'un champ de vecteurs-vitesse, notamment représentatif des valeurs de la vitesse courante de déplacement, dans le plan de l'image, de points d'une image électronique appartenant à une séquence d'image, ladite segmentation consistant à découper ledit champ de vecteurs en blocs de vitesses de déplacement sensiblement homogènes, et & affecter à chacun desdits blocs au moins un vecteur représentant, notamment en vue de réaliser un traitement de compression optimisé de signal d'image,
caractérisé en ce que
- on définit une taille minimale de blocs d'image au sein de ladite image électronique;
- on sélectionne, pour chaque point de l'image, au moins un vecteur vitesse estimé optimal, et le cas échéant, un ou plusieurs vecteurs-représentantscandidats, susceptibles de représenter un bloc auquel appartiendra ledit point;
- on "disperse" lesdits vecteurs-représentantscandidats autour de leur valeur d'origine, de façon à obtenir une pluralité de vecteurs-candidats acceptables pour ledit pointu
- on recense au sein de chaque bloc l'occurrence de citation de chaque vecteur-représentantcandidat par lesdits points du bloc, et on sélectionne pour représenter le bloc, les vecteurs-candidats dépassant un seuil donné de citation;
- on explore les possibilités de fusion de chaque bloc élémentaire avec les blocs adjacents, selon un procédé itératif consistant à rechercher Si les blocs situés à la péripherie dudit bloc de départ présentent des représentants-candidats communs avec ledit bloc de départ, et à réaliser la fusion du bloc de départ et des blocs périphériques si le nombre de blocs périphériques à représentant commun dépasse un certain seuil;
- on affecte audit bloc final, élémentaire ou fusionné, un vecteur représentant choisi parmi les vecteurs représentants-candidats restants.
Avantageusement, on réalise itérativement la fusion des blocs en explorant à nouveau à la périphérie de chaque bloc fusionné courant, en vue d'un accroissement supplémentaire dudit bloc fusionné, lesdits seuils de fusion étant décroissants au fur et à mesure de la croissance des blocs fusionnés.
Dans une seconde variante de réalisation, le procédé de segmentation suivant l'invention, est caractérisé en ce que ledit processus de sélection desdits VRC consiste à découper préalablement l'image courante en zones égales, et à selectionner un nombre donné (L) de VRC par zone d'image,
en ce que ledit processus de reallocation consiste dans une première phase, à tenter d'affecter, pour chaque bloc d'images, celui desdits VRC sélectionné dans la zone qui est le plus représentatif des éléments d'images dudit bloc parmi les VRC dépassant un seuil donné de représentativité, puis à defaut, dans une seconde phase, à affecter audit bloc, un desdits VRC selon un critère d'optimisation d'allocation.
Cette méthode est constituée d'une étape de sélection de vecteurs vitesse représentatifs entre deux images à partir d'un histogramme et d'une étape de réallocation de ces vecteurs à des blocs image.
Afin d'éviter de nombreux calculs d'erreur, la réallocation se fait en deux phases principales
- réallocation d'un vecteur sur un critère "vecteur majoritaire",
puis pour les blocs sans vecteur suite à cette première phase
- réallocation d'un vecteur selon l'environnement connexe, ou si ce n'est pas possible selon un critère d'erreur de reconstruction minimale.
D'autre part, cette méthode, bien qu'applicable dans un schéma de choix a posteriori, permet également d'envisager une technique de choix dite a priori, c'està-dire dans laquelle l'information de mouvement issue d'une voie d'estimation de mouvement pilote le choix de la voie de traitement suivant que les zones sont estimées à mouvement fiable (estimation- de mouvement maintenue), ou non fiable voire extrême (on préfère alors un filtrage linéaire, par exemple) (voir demande de brevet 87 17601).
D'autres caracteristiques et avantages- de l'invention apparaîtront à la lecture suivante de la description d'un mode de réalisation préférentiel de l'invention, donné à titre illustratif, et des dessins annexés relatifs essentiellement à la première variante, dans lesquels
- la figure 1 schématise la position de l'étape de segmentation, selon l'invention, dans une chaîne de codage/décodage d'images, à compensation de mouvement
- la figure 2 schématise le processus multiprédictif d'estimation de mouvements qui est avantageusement mis en oeuvre correlativement au procédé de segmentation selon l'invention
- la figure 3 schématise la greffe de l'étape de sélection des représentants du procédé de segmentation suivant l'invention, sur le procédé multiprédictif d'estimation de mouvements de la figure 2
- la figure 4 illustre l'étape de dispersion d'un vecteur-vitesse représentant candidat, selon le procédé de segmentation de l'invention
- la figure 5 représente un bloc élémentaire de points, selon le procédé de segmentation de l'invention
- la figure 6 est une représentation, dans le plan des vecteurs possibles, de deux vecteurs candidats dispersés, pour un meme point, en mémoire intermédiaire
- la figure 7 est une représentation d'un exemple d'opération de cumul des memoires intermediaires de deux points Al et A2 appartenant à un même bloc
- la figure 8 illustre le cumul des citations de vecteurs représentants, sur un bloc de 4 x 4 points
- la figure 9 est une grille de référence repérant les blocs 4 x 4 au sein d'une fenêtre 24 x 24
- la figure 10 est un schéma synoptique d'un mode de réalisation préférentiel d'une réalisation matérielle mettant en oeuvre le procédé de segmentation suivant l'invention ;
- la figure 11 illustre un mode de mémorisation de l'ensemble des vecteurs représentants, dans le plan des vecteurs possibles, pour un bloc d'image.
DescriDtion d'une première variante de l'invention
La figure 3 décrit la première phase de la segmentation dans la première variante du procédé, c'està-dire lorsqu'elle est mise en oeuvre parallèlement au procédé d'estimation de mouvement de la figure 2.
La notation DFD recouvre le calcul de la DFD elle-même et plus particulièrement, une fonction de correction destinée à assurer la convergence vers la "vraie" valeur du mouvement.
On reconnaitra, dans le module 30 situé à droite du trait 32 en pointillés, dans la figure 3, le schéma du procédé d'estimation de mouvement, avec multiprédiction, déjà représenté en figure 2. Pour chacune des prédictions P1, P2, P3, on calcule une estimation de mouvements El, E2, E3, au moyen d'une fonction de correction destinée à assurer la convergence vers la "vraie" valeur du mouvement par optimisation du critère DFD (DFD-10, DFD-20, DFD-30).
Lesdites valeurs prédites sont avantageusement choisies parmi les valeurs suivantes
au moins une prediction spatiale de mouvement et/ou
au moins une prédiction temporelle de mouvement ; et/ou
au moins une prédiction spatio-temporelle dans l'axe du mouvement.
Les écarts de luminance DFD-ll, DFD-21, DFD-31 obtenus pour chacune des estimations calculées El, E2,
E3, servent de critères de choix de l'estimation E retenue en sortie du selecteur 34. Le sélecteur 34 est commandé par le circuit 33 de détection de l'écart minimal DFD-min, entre les trois ecarts DFD-ll, DFD-21,
DFD-31.
Le cas échéant, une seconde itération 35 est réalisée sur l'estimation retenue E, selon l'algorithme d'optimisation de la DFD, par fonction de correction convergente, pour obtenir une estimation affinée E'.
Parallèlement au choix du meilleur vecteurvitesse estimé, E, E', pour le point courant, le module 31 du schéma de la figure 3 mémorise un certain nombre de vecteurs-représentants-candidats (VRC) 36. Chaque VRC potentiel P1, P2, P3, El, E2, E3, choisi parmi les vecteurs-vitesse-prédits et les vecteurs-vitesse-estimés, au point courant, sera retenu si l'écart de luminance
DFD, qui lui est associé (DFD-10, DFD-20, DFD-30, DFD-ll,
DFD-21, DFD-31) est inférieur à un seuil prédéterminé 37.
Ainsi, si : DFD-10 < au seuil 37 est vérifié, alors P1 est un vecteur-candidat et est mémorisé vers la mémoire 38.
Si par exemple : DFD-20 > au seuil 37 est vérifié, alors P2 ne peut pas être un vecteur-candidat, et est rejeté.
Par point d'image, il y a donc un certain nombre de vecteurs-représentants-candidats possibles. Le nombre maximal de VRC est déduit du nombre de prédictions initiales, et varie suivant le système général de multiprédiction retenu et le nombre d'iterations. Dans le cas où aucun VRC n'est retenu, cela signifie que la vitesse du point courant n'est pas bien connue.
Comme représenté en figure 4, chaque composante (horizontale et verticale) du vecteur-vitesse v d'un point est par exemple limitée à la dynamique + 15, avec une précision 1/8. On peut alors représenter ce vecteur par deux valeurs entières incluses entre 0 et 255 (plus précisément, 8 et 248) par la transformation
Vx - 128 + 8.vx
Vy - 128 +8.vy,
soit 16 bits par vecteur-vitesse.
Du fait que chaque point d'image peut avoir jusqu'à m vecteurs candidats (m = 6 dans le cas de la figure 3), il est nécessaire de stocker ces m vecteurs (de 16 bits chacun) puisqu'ils seront utilisés pour rechercher des vecteurs représentants par bloc de 4 points x 4 lignes. Comme schématisé en figure 10 (référence 38), la solution retenue est de créer m mémoires 39 dédiées chacune à une prédiction ou å une estimation convenue. Un point d'image aura au mieux un candidat par plan mémoire 39.
Chaque mémoire contient les candidats de 4 lignes d'image successives. Une ligne d'image possède N points (N peut être de l'ordre de 1920 en TVHD), imposant ainsi une dimension 4xN par mémoire. A chaque adresse est mémorisé un contenu de 16 bits.
Un système de gestion assure l'écriture des vecteurs-candidats, point par point, donc séquentiellement en respect avec le balayage de l'image.
Les adresses de ligne sont calculées modulo 4.
Ce même système de gestion assure la lecture de 4x4 points (conformément à la figure 5), créant ainsi un bloc élémentaire. Ce bloc 4x4 est ensuite traité pour déterminer le (ou les) vecteur(s) représentant le bloc.
Le procédé de l'invention utilise ensuite une étape de dispersion des VRC.
Ainsi, on suppose que si le vecteur V(Vx, Vy) est candidat potentiel pour représenter la vitesse au point d'image (x, y, t), alors tout vecteur de valeur
V + dV est aussi vecteur candidat.
Cette dispersion permet le traitement de recherche d'un vecteur comme représenant d'un bloc d'image, comme décrit ci-après.
Le paramètre dV est un nombre entier, de quelques unités (par exemple dans la gamme lu,255)).
Chaque vecteur de l'intervalle V + dV a la même probabilité que V de représenter le mouvement en (x, y, t).
D'autres types de probabilité peuvent être retenus, par exemple avec la prise en compte d'un facteur de confiance, maximum pour V et décroissant quand dV s'accroit.
Dans la première variante du procédé, selon le mode de réalisation représente en figure 5, un bloc élémentaire d'image est formé par un ensemble rectangulaire 4 x 4 (4 lignes x 4 points), contenant donc 16 points d'image disposés orthogonalement, notés de Al à A16. La taille 4 x 4 est considérée par la suite, comme taille minimale pour sélectionner les vecteurs-mouvement.
Après dispersion 101 de chaque VRC, la mémoire intermédiaire 102 stocke, sous forme de valeurs 1 ou O, les vecteurs-candidats ou non d'un point image. A toute valeur 1 correspond un couple d'adresses qui sont les composantes d'un vecteur-candidat.
La mémoire intermédiaire 102 a pour dimension 256x256, 1 bit par adresse.
Elle reste active pour un point d'image jusqu'à lecture complète de m vecteurs-candidats du point. Elle est ensuite réinitialisée.
Le transfert de chaque vecteur correspond à la fonction suivante
on lit le contenu relatif au point Al dans la première mémoire 39 des vecteurs-vitesse. Si ce contenu est égal à 4, on passe à la mémoire suivante. Si ce contenu est différent de 4, on note Vx, Vy les composantes horizontale et verticale du vecteur (Vx et Vy appartiennent par exemple à l'intervalle [8, 248)).
Le contenu d'adresse Vx, Vy de la mémoire intermédiaire est mis à 1, ainsi que tous les contenus des adresses Vx + dVx, Vy + dvy.
On lit ensuite la mémoire suivante 39 des vecteurs-vitesse, au point Al. Le vecteur est noté V'x,
V'y. Tous les contenus d'adresse V'x + dVx, V'y + dvy sont mis à 1, comme schématisé en figure 6.
On poursuit ainsi jusqu'à la dernière mémoire des vecteurs-vitesse. Le point Al est donc représenté par un ensemble de contenus d'adresses connexes ou non égaux à 1. Ces données sont transférées vers la mémoire de cumul 103.
On considère ensuite le point A2, du même bloc (figure 5), pour lequel on décrit à nouveau les mémoires des vecteurs-vitesse dont les valeurs vont permettre de modifier la mémoire intermédiaire 102. Cette mémoire est en effet libre, et initialisée, suite au transfert vers la mémoire du cumul 103.
Quand, à son tour, A2 est traité, on transfère le contenu de la mémoire intermédiaire 102 vers la mémoire de cumul 103. La mémoire intermédiaire ainsi libéree peut être utilisée par A3 et ainsi de suite jusqu'à Ax16.
Le rôle de la mémoire de cumu-l 103 est de contenir l'addition adresse par adresse des différentes mémoires intermédiaires issues de Al à A16.
Sa dimension est alors 256 x 256, 4 bits.
Son fonctionnement est illustré sur les figures 7 et 8. La figure 7 représente le cumul des vecteurs liés à Al et A2. Les adresses communes aux points Al et A2 sont mises à 2, les adresses non communes restent à 1.
Le but de cette technique est d'incrémenter d'une unité le contenu des adresses de la mémoire de cumul 103 en fonction du contenu de la mémoire intermédiaire courante 102.
La figure 8 reproduit le fonctionnement illustré en figure 7, mais avec davantage de points selon une représentation simplifiée à une seule dimension.
L'intégrale A évolue en fonction des memoires intermédiaires liées aux points Ai. Son maximum peut atteindre 16 si les 16 points du bloc 4 x 4 courant ont au moins un vecteur commun.
La figure 8 montre un segment V1V2 en chaque point duquel les 16 points ont un vecteur identique.
L'unicité (V1 - V2) est peu probable en raison de la dispersion des vecteurs-candidats. L'unicité n'est pas souhaitable pour permettre, dans une étape ultérieure de regrouper les blocs élémentaires 4 x 4 en blocs plus importants. Augmenter le nombre de points d'image représentés par un seul vecteur a un intérêt capital en
HDMAC pour réduire le débit des données d'assistance numérique.
Dans la pratique, toute position de E A est déclarée vecteur pouvant représenter le bloc Ai si la courbe cumulée atteint x t x 16. Le paramètre x t (104) définit le pourcentage de points Ai ayant un vecteur commun, par exemple
x t - 100 x 13/16 - 81 %
Cette technique assouplit la méthode en éliminant les points isolés, en évitant de condamner un bloc en bordure de contour, en assurant une segmentation plus large... Bien entendu, la valeur x t se déduit de la qualité d'image finale obtenue car plus on inclut de points n'ayant pas le vecteur représentant, plus il y aura d'erreur à la reconstruction.
Comme représenté en figure 10, quand le dernier point d'un bloc élémentaire 4x4 est traité, l'additionneur 107 fournit le cumul des vecteurs candidats des points Al à A16. Ce cumul, de valeur [0, 16), n'est pas ecrit en mémoire de cumul 103 (limitée à 4 bits), mais orienté vers un opérateur qui compare le résultat par adresse avec le seuil 104 préalablement déterminé.
Des qu'une adresse possède un contenu supérieur au seuil 104, on admet cette adresse comme vecteur représentant un bloc courant. Alors, à cette adresse, le contenu d'une mémoire 105 des vecteurs représentant le bloc 4x4 (mémoire préalablement initialisée à 0) est mis à 1.
Cette mémoire 105 possède 256x256 adresses, de contenu 1 bit.
L'étape qui vient d'être décrite, associe à un bloc 4x4 ses vecteurs représentants sous la forme d'un tableau 256x256 (105).
Pour fusionner ce bloc avec ses voisins immédiats, la duree de vie du tableau témoin 256x256 (105) doit permettre le regroupement des points d'image par bloc 32x32, soit 8blocs 4x4 horizontaux et 8 blocs 4x4 verticaux. Afin d'éviter un volume matériel considérable, on réalise avantageusement une compression de données 108 en transformant tout tableau 256x256 (105) r;ous forme de vecteurs associés à deux valeurs (horizontale et verticale) de dispersion (figure 11).
La figure 11 illustre le traitement mis en oeuvre. L'intérieur du contour en trait gras est constitué de points dont les adresses sont autant de vecteurs représentant le bloc 4x4 courant.
Le contour en trait gras est divisé en formes géométriques simples (carrés ou rectangles) 111, 112, 113, 114. Pour chacune d'elles, on repère un coin de la forme géométrique et la longueur des côtés adjacents.
Le coin retenu sert de référence, par exemple le coin 115 Vlx, Vly pour définir le rectangle de côtés dVlx et dVly. I1 en est de même pour les autres portions de la forme initiale
111 - Vlx, Vly, dVlx, dVly
112 = V2x, V2y, dV2x, dV2y
113 - V3x, V3y, dV3x, dV3y
114 = V4x, V4y; dV4x, dV4y
L'organisation des mémoires 108 de stockage des vecteurs sous forme comprimee (ainsi d'ailleurs que la suite du système) est calquée sur tout ce qui a été décrit jusqu'à présent.
Les valeurs Vix, Viy sont mises en mémoire 108, V1 en mémoire 1, V2 en mémoire 2, ....
Une mémoire supplémentaire 109 par rapport aux traitements des points pour lesquels la dispersion est figée à + dV, contient les dispersions dVix, dViy associés à chaque vecteur Vix, Viy.
Ces mémoires ont pour capacité 16 bits par adresse pour les vecteurs Vix, Viy, 8 bits par
Une procédure avantageuse permet d'inclure dans un bloc principal un certain nombre de blocs élémentaires isolés. Ce nombre est un pourcentage variable avec la taille du bloc principal.
Selon un processus analogue à celui qui traite les points d'un bloc, des blocs voisins possédant au moins un vecteur commun peuvent être fusionnés et être représentés par le (ou les) vecteur(s) commun(s).
Le système de fusion des blocs qui a été développé fonctionne de la façon suivante.
Nommons (figure 9) les blocs 4 x 4 par la lettre B, indicée de 2 chiffres, le premier pour la position verticale, le second pour la position horizontale.
L'algorithme de fusion procédure de la gauche vers la droite et du haut vers le bas.
Si Bill, B12, B21 et B22 ont au moins vecteur commun, ces blocs sont fusionnés et représentés par le (ou les) vecteur(s) commun(s). Si l'un au moins de ces blocs ne répond pas au critère de vecteur commun, la fusion n'a pas lieu. Dans ce cas, la recherche reprend à partir de B12.
Si la fusion a eu lieu, on cherche à agrandir l'ensemble des 4 premiers blocs avec l'apport des 5 voisins immédiats, B 13, B 23, B 31, B 32, B 33. Pour réaliser cela, 4 au moins de ces 5 nouveaux blocs doivent posséder au moins un même vecteur commun avec le groupe initial. La condition "4 au moins" peut éventuellement être moins stricte et devenir "3 au moins".
Si la fusion des 9 blocs n'est pas possible, le processus ci-dessus repart de B 13.
Si la fusion des 9 blocs est possible, on cherche à rajouter les 7 blocs voisins immédiats qui sont
B 14, B 24, B 34, B 41, B 41, B 43 et B 44. Pour réaliser cette nouvelle fusion, 5 au moins (par exemple) de ces 7 nouveaux blocs doivent posséder au moins un vecteur commun avec le groupe précédent de 9 blocs.
Si ce critère est vérifié, on obtient ainsi un bloc de 16 x 16 points d'image ayant au moins un vecteur commun.
La fusion se poursuit avec les poins Bi5 (i = 1, ...5) et B5 (j =
Les blocs 4 x 4 en bord d'image se voient systématiquement affecter des vecteurs-vitesse des blocs adjacents (qui ne sont pas eux-mêmes en bord d'image).
Cette procédure élimine tous les blocs 4 x 4 en bord d'image. L'avantage est d'éviter une augmentation importante et inutile du codage de ces blocs.
Un exemple de réalisation materielle est schématisé dans le module 120 de la figure 10.
En application du principe de regroupement qui vient d'être décrit, on crée des blocs de taille progressive, regroupant d'abord les blocs élémentaires 4x4 points en blocs 8x8 points, puis 12x12 points, puis 16x16 points.... jusqu'd 32x32 points.
Le regroupement recherché en premier est un bloc 8x8 que l'on étendra progressivement.
La phase de validation 121 est analogue à celle décrite précédemment en 101. La seule différence réside dans la dispersion modulée individuellement par vecteur représentant un bloc 4x4.
Les mémoires intermédiaires 122 et de cumul 123, ainsi que leurs environnements de calcul 127 et de gestion, sont identiques aux descriptions précédentes, sauf la mémoire de calcul qui est portée à 6 bits par adresse (un regroupement 32x32 points équivaut à sommer les vecteurs de 64 blocs élémentaires 4x4 à partir du contenu 1 bit de la mémoire intermédiaire 122).
A l'équivalent du traitement effectué sur les blocs 4x4, quand un bloc de taille supérieure est complet, le cumul est comparé à un seuil, 124 (dépendant éventuellement de la taille du bloc traite).
Trois cas, 131, 132, 133, peuvent alors se présenter
1. (131) Si le seuil est atteint et si le regroupement des blocs est inférieur à 32x32 points (8x8 blocs élémentaires de 4x4 points), alors on cherche à accroître le regroupement en associant au regroupement constitué les blocs 4x4 adjacents.
2. (132) Si le seuil n'est pas atteint, un regroupement supérieur est impossible. On met en mémoire le dernier regroupement ayant permis d'atteindre le seuil ainsi que le vecteur correspondant.
3. (133) Si le seuil est atteint et si le regroupement des blocs est égal à la taille maximale retenue pour le système (dans l'exemple, 32X32 points), on met en mémoire le bloc final et son vecteurreprésentant.
Une mémoire 125 de dimension (N/4) x 8 contient les coordonnées de chaque bloc (21 bits pour une image
Haute Définition) et le vecteur représentant (16 bits).
Les dimensions de cette mémoire 125 sont données pour le regroupement le plus défavorable, c'està-dire uniquement des blocs de 4x4 points.
A partir de la segmentation ainsi réalisée, on peut imaginer un algorithme de codage 126, par exemple 3 bits pour la taille du bloc (4x4, 8x8, 12x12, 16x16, 32x32) et 16 bits pour le vecteur représentant (ou une représentation inférieure à 16 bits si l'on diminue la précision du vecteur, 1/8, ou sa dynamique, + 15).
Descrition d'une seconde variante de l'invention
Selon une seconde variante du procédé de segmentation suivant l'invention, on réalise tout d'abord une sélection d'un nombre donné de vecteursreprésentants-candidats au sein de zones d'image, puis on réalloue ces vecteurs sélectionnés à chacun des blocs d'image de la zone.
Par zone d'images HD (1/16 d'image), on sélectionne L vecteurs indépendants, c'est-à-dire suffisamment éloignés pour ne pas recouvrir les mêmes points d'image. Par exemple, pour les images 4-2-2, sources des simulations actuelles, une zone d'image est un quart d'image et L est fixé à 8.
Pour chaque zone, la méthode de sélection est la suivante
1 - Histogramme 2D des vecteurs mouvement préalablement filtrés médian (le filtre utilisé est avantageusement un filtre "losange" 5 x 5).
De plus, on peut éliminer certaines valeurs de cet histogramme : les vecteurs "faibles" ou "trop grands" peuvent être traités par les voies linéaires.
2 - Lissage de cet histogramme en vue d'éliminer les petits pics proches. Une fenêtre glissante.
2D balaye l'histogramme et pour chaque point cournant (Vx, Vy) centre de al fenêtre, on intègre les valeurs du compteur sur (Vx - E , Vx + > x(Vy - , Vy + i, ) par exemple : g = 1/2 ;
on rappelle que la précision des vecteurs est de 1/8).
3 - Sélection de pics sur les valeurs résultantes de l'histogramme.
Pour cela, on ne garde que les points présentant un maximum local, c'est-à-dire dans les simulations actuelles, les vecteurs (Vx, Vy) où le compteur est maximum sur le voisinage 3 x 3 dont (Vx, Vy) est le centre.
Les vecteurs correspondant aux 8 plus grandes valeurs de l'histogramme sont sélectionnés comme représentants de la zone. Lorsqu'un vecteur est sélectionné, la zone à + autour de ce vecteur n'est plus prise en compte dans la recherche des autres maxima.
Les vecteurs qui ne correspondent pas à un de ces représentants à +E ne sont pas pris en compte (ils ne sont pas transmis). Dans la suite de la description, on parlera de "vecteurs noirs".
L'étape de réallocation des vecteurs sélectionnés, est avantageusement réalisée selon une méthode de réallocation "multi niveaux" par bloc image inspirée des méthodes "split and merge" (division et aggrégation).
Cette méthode a pour premier but d'avoir le plus grand nombre possible de blocs de taille maximale avec un seul vecteur-mouvement représentant (éventuellement "vecteur noir", ce cas est alors traité par une voie linéaire dans le cas d'un choix a priori).
La taille maximale M x M des blocs est fixée par la méthode de codage hiérarchique de l'information de mouvement. En effet, cette méthode permet de réduire d'autant plus le nombre d'éléments binaires transmis que les blocs homogènes en information de mouvement sont grands.
Le deuxième but de cette méthode de réallocation est de nécessiter le moins de calculs possibles, du type du calcul d'une DFD.
Ces deux buts conduisent à une méthode de réallocation en deux phases
1 - Réallocation d'un mouvement sélectionné sur un critère de majorité de V + & par bloc image.
2 - Réallocation d'un mouvement élu selon l'environnement proche ou en dernier recours sur un critère d'erreur minimale (fonction de la DFD) aux blocs sans vecteur suite à la première phase.
Pour chacune de ces phases, la réallocation se fait pour des blocs de différentes tailles, d'où l'appellation de réallocation multi niveaux, le nombre de niveaux étant égal à (log2 M - 1). A titre d'exemple, on choisit M - 16 , pour la description suivante d'un mode préférentiel de mise en oeuvre.
En d'autres termes, ladite première phase du processus de réallocation des VRC consiste à effectuer une opération itérative de recherche d'un VRC le plus représentatif au sein de blocs d'images de taille 2m n x 2.n éléments d'images, et à défaut, à décomposer ledit bloc en quatre sous-blocs de taille 2m~l.n x 2l.n, pour une nouvelle itération de tentative de recherche d'un VRC le plus représentatif sur chacun desdits sous-blocs.
Pour la réalisation de cette première phase, on réalloue un vecteur sélectionné, ou "noir", à un bloc si ce vecteur (+ ) est majoritaire à un certain pourcentage dans le bloc (ex : 75 2)
L'image est tout d'abord découpée en blocs de taille 16 x 16 au cours d'un premier niveau de travail.
On essaye de réallouer un vecteur majoritaire V + , à , + X1% à chacun des blocs. Les blocs sans vecteur, i.e les blocs "noirs" seront traités aux niveaux suivants. A titre d'exemple numérique, on peut prendre X1 - 75%, 1 1 0,5
Au cours d'un second niveau de travail, l'image est découpée en blocs de taille 8 x 8, en phase avec le niveau 1. A chaque bloc correspondant à un bloc noir du niveau 1, on essaye de réallouer un vecteur majoritaire (+ 2) à X2 %, X2 < X1
Les blocs noirs resultants, c'est-à-dire sans vecteur sélectionné majoritaire, seront traités au niveau suivant.
Au troisième niveau, on réalise la même opération que précédemment avec des blocs de taille 4 x 4. Cette taille de bloc est la plus petite acceptable.
En fin de phase 1 on se retrouve avec des blocs 16 x 16, 8 x 8, 4 x 4, soit contenant un des L représentants, soit "noirs". La phase 2 consiste à réallouer un vecteur aux blocs noirs selon l'environnement ou sur un critère de DFD minimale.
Au cours de cette deuxième phase, on réalloue un vecteur sélectionné à chaque bloc noir sur un critère "vecteurs voisins égaux" ou si ce n'est le cas sur un critère d'erreur inférieur à un seuil ou minimale.
L'erreur est une fonction de la somme des différences interimages déplacées entre image compensée et image originale sur le bloc considéré. (Par exemple : 7 DFD2,
EIDFDl, maxlDFDl)
Là encore, la réallocation se fait à différents niveaux de découpage, chaque niveau étant en phase avec le niveau supérieur.
Au cours d'un premier niveau, la réallocation d'un vecteur aux blocs noirs 4 x 4, s'effectue de la manière suivante
- Si les trois voisins du bloc 4 x 4, tel que l'ensemble des quatre blocs soit inclus dans le bloc 8 x 8 du niveau supérieur, sont affectés d'un même vecteur, on lui affecte ce vecteur (si une information de mouvement, issue d'une voie d'estimation a priori, "pilote" la chaine, il faut s'assurer que l'erreur résultante est inférieure à un seuil).
- si les trois voisins sont noirs, on laisse le bloc 4 x 4 à noir t son cas sera peut être réglé au niveau supérieur des blocs 8 x 8.
- si ces trois voisins ne sont pas égaux, on essaye de lui allouer un vecteur sélectionné selon le critère d'erreur minimale choisi.
Au cours d'un second niveau de travail, la même opération qu'au niveau 1 est répétée pour les blocs 8 x 8 noirs, et on regarde alors les trois voisins du bloc 16 x 16 correspondant au niveau supérieur.
Au niveau 3, et dans le cas où l'on choisit un critère d'erreur minimale, les seuls blocs "noirs" restant à ce niveau sont des blocs 16 x 16, et on tente de leur réallouer un vecteur sur ce même critère.
Dans le cas où l'erreur minimale doit être inférieure à un seuil, les blocs sans vecteurs, i.e les blocs noirs sont de taille 4 x 4, 8 x 8 et 16 x 16. Le cas des blocs 4 x 4 et 8 x 8 a été traité précédemment, et on essaye d'allouer un vecteur aux blocs noirs 16 x 16 sur le critère d'erreur minimale à un seuil. Avec ce critère, tous les blocs sans vecteur représentant seront traités par les voies linéaires.

Claims (21)

REVENDICATIONS
1) Procédé de segmentation d'un champ de vecteurs-vitesses, notamment représentatif des valeurs de la vitesse courante de déplacement, dans le plan de l'image, de points d'une image électronique appartenant à une séquence d'image, ladite segmentation consistant à découper ledit champ de vecteurs en blocs de vitesse de déplacement sensiblement homogènes, et à affecter à chacun desdits blocs au moins un vecteur représentant, notamment en vue de réaliser un traitement de compression optimisé de signal d'image,
caractérisé en ce que
chaque vecteur de déplacement courant d'un point courant est calculé selon un processus algorithmique convergent de prédiction/correction, ledit processus consistant à prendre comme hypothèse de départ de calcul une valeur prédite de mouvement, ladite valeur predite étant corrigée ensuite au sein du processus selon un procédé de correction par optimisation de critère permettant de calculer une valeur estimée de déplacement,
en ce que ledit procédé réalise en parallèle au moins deux calculs d'estimation de mouvement (El, E2) à partir d'au moins deux valeurs prédites (P1, P2) de mouvement du point courant,
en ce que ledit procédé sélectionne un nombre limité de vecteurs-représentants-candidats (VRC), parmi lesdits vecteurs-vitesse-prédits (P1, P2) et/ou lesdits vecteurs-vitesse-estimés (El, E2)
en ce qu'on réalise une dispersion de chacun desdits VRC autour de sa valeur d'origine, de façon à obtenir une pluralite de VRC acceptables (V + dV)
et en ce qu'on effectue une réallocation desdits VRC dispersés selon une procédure adapatative du type waggregation/division" de blocs dans ladite image.
2) Procédé selon la revendication 1, caractérisé en ce que lesdits VRC sont sélectionnés, pour chaque bloc d'image, en chaque point dudit bloc, parmi au moins lesdits vecteurn-vitesse-prédits (P1, P2) et/ou lesdits vecteurs-vitesse-estimés (El, E2), ladite opération de sélection consistant en un seuillage sur ledit critère de décision.
3) Procédé selon la revendication 1 ou 2, caractérisé en ce que ledit critère de décision est l'écart de luminance DFD de Walker et Rao.
4) Procédé selon la revendication 2, caractérisé en ce qu'on effectue ladite sélection des vecteurs-représentants-candidats, en chaque point d'image, simultanément à une seconde opération de sélection d'une estimation optimale de mouvement en chaque point, à l'instant t, en vue par exemple de réaliser une projection approximative de la position de chaque point d'image à l'instant (t+l) et/ou en vue d'élaborer des données d'assistance à la restitution d'image à partir et en complément desdits représentants de blocs,
et en ce que ladite seconde opération de sélection choisit ladite valeur d'estimation optimale de mouvement (E, E'), pour chaque point, parmi au moins lesdits vecteurs vitesse estimés (El, E2, E3), selon un procédé de décision par optimisation dudit critère de décision.
5) Procédé selon la revendication 2 ou 4, caractérisé en ce que lesdites valeurs prédites sont choisies parmi les valeurs suivantes
au moins une prédiction spatiale de mouvement et/ou
au moins une prédiction temporelle de mouvement ; et/ou
au moins une prédiction spatio-temporelle dans l'axe du mouvement.
6) Procédé selon la revendication 4, caractérisé en ce que ladite valeur optimale d'estimation du vecteur vitesse en chaque point, subit au moins une itération supplémentaire de prédiction/correction, permettant d'affiner la valeur (E') du vecteur estimé (E),
et en ce que lesdites valeurs de vitesse à estimation affinée subissent également ladite première opération de sélection de représentants-candidats par seuillage.
7) Procédé de segmentation d'un champ de vecteurs-vitesse, notamment représentatif des valeurs de la vitesse courante de déplacement, dans le plan de l'image, de points d'une image électronique appartenant à une séquence d'image, ladite segmentation consistant à découper ledit champ de vecteurs en blocs de vitesse de déplacement sensiblement homogènes, et à affecter à chacun desdits blocs au moins un vecteur-représentant, notamment en vue de réaliser un traitement de compression optimisé de signal d'image,
caractérisé en ce que
- chacun desdits vecteurs-vitessereprésentants-candidats, sélectionnés en chaque point d'image, est dispersé autour de sa valeur d'origine, de façon à obtenir une pluralité de vecteurs-représentantscandidats acceptables pour lesdits points.
- on cumule, pour un bloc donné, le nombre de citations de chaque vecteur-représentant-candidat par l'ensemble des points dudit bloc.
- on effectue un seuillage sur ledit taux de citation pour sélectionner les vecteurs-représentantscandidats acceptables pour représenter le bloc entier.
8) Procédé selon la revendication 7, caractérise en ce que chacun des vecteurs-représentantscandidats résultant de ladite opération de dispersion est affecté d'un facteur de confiance spécifique, ledit facteur de confiance décroissant pour un écart croissant de dispersion par rapport audit vecteur représentantcandidat d'origine,
et en ce que ledit cumul du nombre de citations est pondéré pour chaque citation par ledit facteur de confiance correspondant.
9) Procédé de segmentation suivant l'une quelconque des revendications 7 ou 8, caractérisé en ce que
- on definit une taille minimale de bloc, chaque bloc élémentaire faisant l'objet d'une sélection de vecteurs-représentants par seuillage parmi les vecteurs-représentants-candidats des points dudit bloc;
- on fusionne les blocs élementaires des candidats-représentants communs selon des règles géométriques de fusion, les nouveaux candidatsreprésentants des blocs fusionnés étant lesdits candidats-representants communs auxdits blocs élémentaires.
10) Procédé de segmentation selon l'une quelconque des revendications 7 à 9, caractérisé en ce que
- on définit une taille minimale de bloc, chaque bloc élémentaire faisant l'objet d'une sélection de vecteurs-représentants-candidats par seuillage parmi les vecteurs-représentants-candidats des points dudit bloc;
- on explore à la périphérie de chaque bloc s'il existe des blocs élémentaires comportant des représentants-candidats communs avec ledit bloc central;
- on réalise la fusion du bloc central avec lesdits blocs périphériques si le pourcentage de blocs périphériques comportant des représentants-candidats communs avec le bloc central, dépasse un seuil donné.
11) Procédé selon la revendication 9 ou 10, caractérisé en ce qu'on réalise itérativement la fusion des blocs en explorant à nouveau à la périphérie de chaque bloc fusionne courant, en vue d'un accroissement supplémentaire dudit bloc fusionné;
et en ce que lesdits seuils de fusion sont décroissants au fur et à mesure de la croissance des blocs fusionnés.
12) Procédé selon l'une quelconque des revendications 9 à 11, caractérisé en ce que ledit procédé est appliqué à la détermination des vecteurs de vitesse de déplacement des points d'une image électronique, dans le plan de l'image,
et en ce que ladite taille minimale de blocs élémentaires est de 4x4 pixels.
13) Procédé selon la revendication 12, caractérisé en ce que lesdits blocs fusionnés sont des blocs de forme carrée, déterminés à l'intérieur de fenêtres de taille 32x32 pixels.
14) Procédé selon l'une quelconque des revendications 9 à 13, caractérise en ce qu'on admet la possibilite d'inclusion d'un premier bloc élémentaire fusionne à l'intérieur d'un second bloc fusionne.
15) Procédé de segmentation d'un champ de vecteurs de vitesses, notamment représentatif des valeurs de la vitesse courante de déplacement, dans le plan de l'image, de points d'une image électronique appartenant à une séquence d'image, ladite segmentation consistant à découper ledit champ de vecteurs en blocs de vitesse de déplacement sensiblement homogènes, et à affecter à chacun desdits blocs au moins un vecteur représentant, notamment en vue de réaliser un traitement de compression optimisé de signal d'image,
caracterisé en ce que
- on définit une taille minimale de blocs d'image au sein de ladite image électronique;
- on sélectionne, pour chaque point de l'image, au moins un vecteur vitesse estimé optimal, et le cas échéant, un ou plusieurs vecteurs-representants- candidats, susceptibles de représenter un bloc auquel appartiendra ledit point;
- on disperse lesdits vecteurs-candidatsreprésentants autour de leur valeur d'origine, de façon à obtenir une pluralité de vecteurs-candidats acceptables pour ledit point;
- on recense au sein de chaque bloc l'occurrence de citation de chaque vecteur-candidatreprésentant par lesdits points du bloc, et on sélectionne pour représenter le bloc, les vecteurscandidats dépassant un seuil donné de citation;
- on explore les possibilités de fusion de chaque bloc élémentaire avec les blocs adjacents, selon un procédé itératif consistant à rechercher Si les blocs situés à la périphérie dudit bloc de depart présentent des représentants-candidats communs avec ledit bloc de départ, et à réaliser la fusion du bloc de départ et des blocs périphériques si le nombre de blocs périphériques à représentant commun dépasse un certain seuil;
- on affecte audit bloc final, élémentaire ou fusionné, un vecteur représentant choisi parmi les vecteurs-représentants-candidats restants.
16) Procédé selon la revendication 1, caractérisé en ce que ledit processus de sélection desdits VRC consiste à découper préalablement l'image courante en zones égales, et à sélectionner un nombre donné (L) de VRC par zone d'image,
et en ce que ledit processus de réallocation consiste dans une première phase, à tenter d'affecter, pour chaque bloc d'images, celui desdits VRC sélectionné dans la zone qui est le plus représentatif des éléments d'image dudit bloc parmi les VRC dépassant un seuil donné de représentativité, puis à défaut, dans une seconde phase, à affecter audit bloc, un desdits VRC selon un critère d'optimisation d'allocation.
17) Procédé selon la revendication 16, caractérisé en ce que ledit processus de sélection dudit nombre donné de VRC par portion d'image, consiste à realiser un histogramme, sur chaque zone d'image, de l'ensemble des vecteurs-vitesse de la zone, puis à repérer les vecteurs-vitesse présentant un maximum local parmi lesquels seront sélectionnés les VRC les plus représentatifs pour l'ensemble de la zone.
18) Procédé selon la revendication 17, caractérisé en ce que le champ de vecteurs-vitesse de la zone subit en outre au moins un traitement parmi les traitements suivants: un filtrage médian préalable des vecteurs-vitesse, une élimination préalable des vecteursvitesse extrêmes, un lissage local de l'histogramme.
19) Procédé selon la revendication 16, caractérisé en ce que ladite première phase du processus de réallocation des VRC consiste à effectuer une opération itérative de recherche d'un VRC le plus représentatif au sein de blocs d'images de taille 2m.n x 2m.n éléments d'images, et à défaut, à décomposer ledit bloc en quatre sous-blocs de taille 2m-l .n x 2m-l n, pour une nouvelle itération de tentative de recherche d'un VRC le plus représentatif sur chacun desdits sous-blocs.
20) Procédé selon la revendication 19, caractérisé en ce que ladite seconde phase dudit processus de réallocation consiste en ce que lesdits blocs non pourvus de VRC, après exécution de la première phase, se voient affecter un desdits VRC sélectionné selon un critère d'homogénéisation avec l'environnement et/ou d'erreur minimale ou seuillée.
21) Procédé selon la revendication 16 ou 20, caractérisé en ce que ladite seconde phase du processus de reallocation B s'effectue selon un processus itératif d'aggrégation de blocs voisins non pourvus de VRC.
FR8803639A 1988-03-21 1988-03-21 Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images Expired - Lifetime FR2628864B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR8803639A FR2628864B1 (fr) 1988-03-21 1988-03-21 Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR8803639A FR2628864B1 (fr) 1988-03-21 1988-03-21 Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images

Publications (2)

Publication Number Publication Date
FR2628864A1 true FR2628864A1 (fr) 1989-09-22
FR2628864B1 FR2628864B1 (fr) 1990-06-15

Family

ID=9364452

Family Applications (1)

Application Number Title Priority Date Filing Date
FR8803639A Expired - Lifetime FR2628864B1 (fr) 1988-03-21 1988-03-21 Procede de segmentation d'un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d'une image dans une sequence d'images

Country Status (1)

Country Link
FR (1) FR2628864B1 (fr)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2648979A1 (fr) * 1989-06-27 1990-12-28 Thomson Consumer Electronics Procede de segmentation du champ de mouvement d'une image et son application au codage d'images video
EP0448449A1 (fr) * 1990-03-20 1991-09-25 France Telecom ProcédÀ© et système d'estimation de mouvement pour des images de télévision numérique haute définition
EP0619552A1 (fr) * 1993-04-07 1994-10-12 Laboratoires D'electronique Philips S.A.S. Procédé et dispositif d'estimation de mouvement d'objets dans des images successives animées subdivisées en blocs bidimensionnels d'éléments d'image
WO1995031071A1 (fr) * 1994-05-10 1995-11-16 Kaleida Labs, Inc. Systeme a codage d'images et a distribution des pixels a echelle variable, pour la compression et la decompression des images
EP0707427A2 (fr) * 1994-10-13 1996-04-17 AT&T Corp. Méthode et appareil pour le codage basé sur des régions d'une séquence d'images vidéo
WO1997016025A1 (fr) * 1995-10-20 1997-05-01 Nokia Mobile Phones Ltd. Codage de champ vectoriel de deplacement
FR2762699A1 (fr) * 1997-04-24 1998-10-30 Mitsubishi Electric Corp Procede et appareil pour le codage et le decodage d'images mobiles, sur la base de regions
CN1107413C (zh) * 1995-10-20 2003-04-30 诺基亚流动电话有限公司 运动矢量信息组编码
CN109919126A (zh) * 2019-03-19 2019-06-21 北京鑫洋泉电子科技有限公司 一种移动物体探测方法、装置及存储介质
US10647661B2 (en) 2017-07-11 2020-05-12 Vertex Pharmaceuticals Incorporated Carboxamides as modulators of sodium channels

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987005770A1 (fr) * 1986-03-19 1987-09-24 British Broadcasting Corporation Traitement de signaux video en vue d'une reduction de la largeur de bande

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1987005770A1 (fr) * 1986-03-19 1987-09-24 British Broadcasting Corporation Traitement de signaux video en vue d'une reduction de la largeur de bande

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ICC'84 - IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS, "Links for the Future Science, Systems & Services for Communications", 14-17 mai 1984, Amsterdam, Proceedings, vol. 2, pages 707-710, IEEE, New York, US; A.FURUKAWA et al.: "Motion-adaptive interpolation for videoconference pictures" *
IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. PAMI-2, no. 6, novembre 1980, pages 516-522, IEEE, New York, US; S.TSUJI et al.: "Tracking and segmentation of moving objects in dynamic line images" *
PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON COMMUNICATIONS - ICC'84, Amsterdam, 14-17 mai 1984, "Links for the Future Science, Systems & Services for Communications", partie 1, pages 703-706, IEEE, New York, US; D.R.WALKER et al.: "New techniques in pel-recursive motion compensation" *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0406074A1 (fr) * 1989-06-27 1991-01-02 THOMSON multimedia Procédé de segmentation du champ de mouvement d'une image pour le codage d'images vidéo
WO1991000577A1 (fr) * 1989-06-27 1991-01-10 Thomson Consumer Electronics S.A. Procede de segmentation du champ de mouvement d'une image et son application au codage d'images video
US5193001A (en) * 1989-06-27 1993-03-09 Thomson Consumer Electronics Method of segmenting the field of motion of an image and its application to the encoding of video images
FR2648979A1 (fr) * 1989-06-27 1990-12-28 Thomson Consumer Electronics Procede de segmentation du champ de mouvement d'une image et son application au codage d'images video
EP0448449A1 (fr) * 1990-03-20 1991-09-25 France Telecom ProcédÀ© et système d'estimation de mouvement pour des images de télévision numérique haute définition
FR2660141A1 (fr) * 1990-03-20 1991-09-27 France Etat Procede et systeme d'estimation de mouvement pour des images de television numerique haute definition.
US5245423A (en) * 1990-03-20 1993-09-14 Centre National D'etudes Des Telecommunications Movement estimation method and system for high definition digital television frames
EP0619552A1 (fr) * 1993-04-07 1994-10-12 Laboratoires D'electronique Philips S.A.S. Procédé et dispositif d'estimation de mouvement d'objets dans des images successives animées subdivisées en blocs bidimensionnels d'éléments d'image
FR2703802A1 (fr) * 1993-04-07 1994-10-14 Philips Electronique Lab Dispositif d'estimation de mouvement entre des images successives d'une séquence d'images animées subdivisées en blocs bidimensionnels d'éléments d'image.
US5555033A (en) * 1993-04-07 1996-09-10 U.S. Philips Corporation Method and device for estimating motion of objects in successive animated images subdivided into tow-dimensional blocks of pixels
US5585944A (en) * 1994-05-10 1996-12-17 Kaleida Labs, Inc. Method for compressing and decompressing images by subdividing pixel color distributions
WO1995031071A1 (fr) * 1994-05-10 1995-11-16 Kaleida Labs, Inc. Systeme a codage d'images et a distribution des pixels a echelle variable, pour la compression et la decompression des images
EP0707427A2 (fr) * 1994-10-13 1996-04-17 AT&T Corp. Méthode et appareil pour le codage basé sur des régions d'une séquence d'images vidéo
EP0707427A3 (fr) * 1994-10-13 1997-10-29 At & T Corp Méthode et appareil pour le codage basé sur des régions d'une séquence d'images vidéo
WO1997016025A1 (fr) * 1995-10-20 1997-05-01 Nokia Mobile Phones Ltd. Codage de champ vectoriel de deplacement
US6163575A (en) * 1995-10-20 2000-12-19 Nokia Mobile Phones Limited Motion vector field coding
CN1107413C (zh) * 1995-10-20 2003-04-30 诺基亚流动电话有限公司 运动矢量信息组编码
FR2762699A1 (fr) * 1997-04-24 1998-10-30 Mitsubishi Electric Corp Procede et appareil pour le codage et le decodage d'images mobiles, sur la base de regions
US6633611B2 (en) 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
US10647661B2 (en) 2017-07-11 2020-05-12 Vertex Pharmaceuticals Incorporated Carboxamides as modulators of sodium channels
US11603351B2 (en) 2017-07-11 2023-03-14 Vertex Pharmaceuticals Incorporated Carboxamides as modulators of sodium channels
CN109919126A (zh) * 2019-03-19 2019-06-21 北京鑫洋泉电子科技有限公司 一种移动物体探测方法、装置及存储介质
CN109919126B (zh) * 2019-03-19 2023-07-25 北京鑫洋泉电子科技有限公司 一种移动物体探测方法、装置及存储介质

Also Published As

Publication number Publication date
FR2628864B1 (fr) 1990-06-15

Similar Documents

Publication Publication Date Title
EP0406074B1 (fr) Procédé de segmentation du champ de mouvement d&#39;une image pour le codage d&#39;images vidéo
EP2446628B1 (fr) Procédé de décodage d&#39;images, dispositifs de décodage et programme d&#39;ordinateur correspondants
EP3707676B1 (fr) Procédé d&#39;estimation de pose d&#39;une caméra dans le référentiel d&#39;une scène tridimensionnelle, dispositif, système de réalite augmentée et programme d&#39;ordinateur associé
EP0627693B1 (fr) Dispositif de segmentation d&#39;images composées de textures
WO1991003797A1 (fr) Procede et dispositif d&#39;estimation et de codage hierarchise du mouvement de sequences d&#39;images
CN108764244B (zh) 基于卷积神经网络和条件随机场的潜在目标区域检测方法
EP0321356A1 (fr) Procédé d&#39;estimation multi prédictif du mouvement des points d&#39;une image électronique
FR2628864A1 (fr) Procede de segmentation d&#39;un champ de vecteurs vitesse, notamment de vitesses de deplacement de points d&#39;une image dans une sequence d&#39;images
CN112767466A (zh) 一种基于多模态信息的光场深度估计方法
CN111488932A (zh) 一种基于帧率感知的自监督视频时-空表征学习方法
KR102466061B1 (ko) 계층적 생성 적대 네트워크를 이용한 노이즈 제거 장치 및 그 방법
EP0276603B1 (fr) Procédés de codage et de transmission d&#39;un signal numérique, par rafraichissement temporel sélectif d&#39;un quantificateur vectoriel
EP0545475B1 (fr) Méthodes et dispositifs de synthèse de signaux de texture
FR2628276A1 (fr) Procede de reduction de debit d&#39;une sequence de donnees d&#39;assistance a la reconstitution d&#39;une image electronique a partir d&#39;un signal sous-echantillonne
EP0619552B1 (fr) Procédé et dispositif d&#39;estimation de mouvement d&#39;objets dans des images successives animées subdivisées en blocs bidimensionnels d&#39;éléments d&#39;image
CN117173037A (zh) 一种针对图像降噪的神经网络结构自动搜索方法
EP0364333A1 (fr) Procédé et dispositif de validation de plots, pour radar, avec mise à jour autoadaptative
EP0542335B1 (fr) Dispositif d&#39;estimation de mouvement entre images animées subdivisées en blocs bidimensionnels d&#39;éléments d&#39;image
WO2020157733A1 (fr) Procédé dynamique d&#39;imagerie tridimensionnelle
Gu et al. Generative and discriminative learning for distorted image restoration
Guo et al. Incremental Neural Implicit Representation with Uncertainty-Filtered Knowledge Distillation
FR2680931A1 (fr) Procede de detection et de suivi d&#39;objets en mouvement par analyse de sequences d&#39;images.
CA2376684C (fr) Decodeur video optimal base sur les standards de type mpeg
Mathew et al. A Survey on Image Denoising Techniques
FR2744586A1 (fr) Analyse d&#39;images animees

Legal Events

Date Code Title Description
TP Transmission of property
ST Notification of lapse