EP2936811A1

EP2936811A1 - Procédé et dispositif de transmission d'une séquence d'images basé sur un codage région adaptatif

Info

Publication number: EP2936811A1
Application number: EP13815088.3A
Authority: EP
Inventors: Zaher El Chami; Thomas BULTEL
Original assignee: Orange SA
Current assignee: Orange SA
Priority date: 2012-12-21
Filing date: 2013-12-13
Publication date: 2015-10-28
Also published as: US20160057431A1; WO2014096638A1; FR3000350A1

Abstract

Procédé et dispositif de transmission d'une séquence d'images, procédé et dispositif de réception, programme d'ordinateur et support d'enregistrement correspondants. L'invention concerne un procédé de transmission d'une séquence d'images. Selon l'invention, ledit procédé comprend les étapes suivantes : - identification (11), dans au moins une image de ladite séquence, d'au moins deux régions distinctes; - pour chacune desdites régions, détermination (12) d'un mode de codage adapté à ladite région; - codage (13) de ladite au moins une image en utilisant, pour chacune desdites régions, le mode de codage adapté à ladite région, et transmission (14) dans un unique flux vidéo.

Description

Procédé et dispositif de transmission d'une séquence d'images, procédé et dispositif de réception, programme d'ordinateur et support d'enregistrement correspondants

1. Domaine de l'invention

Le domaine de l'invention est celui de la transmission de séquences d'images, notamment dans le cadre de session multimédia de type vidéoconférence, lecture vidéo en continu, télésurveillance, etc.

Plus précisément, l'invention concerne le maintien ou l'amélioration de la qualité des images d'une séquence transmise dans de tels contextes, notamment lorsque les conditions de transmission évoluent.

L'invention trouve des applications dans tous les domaines nécessitant le transfert d'une séquence d'images, ou vidéo, y compris dans le contexte du codage vidéo.

2. Art antérieur

Lors de l'établissement d'une session multimédia comportant un transfert d'une séquence d'images, ou vidéo, le choix du codeur (et du décodeur associé) est effectué en tenant compte de plusieurs paramètres :

les capacités du canal de transmission par lequel la vidéo transite (par exemple canal de type « IP ») ;

les capacités et type de codage que l'émetteur admet ;

les capacités et type de décodage que le récepteur admet.

- les modes de codage/décodage que l'émetteur/récepteur emploie.

Par mode de codage, ou stratégie de codage (ou d'encodage), on entend notamment le choix d'implémentation du codage effectué au niveau du codeur/décodeur. Par exemple, il peut s'agir d'un mode de codage intra, d'un mode de codage inter de type P hiérarchique (tel que défini dans le document « H. 264 hierarchical P coding in the context of ultra-low delay, low complexity applications » Thomas Wiegand par exemple), d'un mode de codage inter de type IPPP (pour « image I, image P, image P, image P »), d'un mode de codage inter de type IPPPI (pour « image I, image P, image P, image P, image I »), d'un mode de codage de type « skip », etc.

Après l'établissement de la session multimédia, la qualité de la vidéo reçue par un client (encore appelé utilisateur) peut éventuellement être dégradée, suite à un étranglement au niveau du réseau, une perte de données, voire une limitation de capacité de traitement au niveau du client.

Pour continuer la transmission de la séquence d'images malgré ces modifications des conditions de transmission, les codeurs vidéo existants, notamment selon les normes H.264, H.263, MPEG4, etc, acceptent la mise en œuvre de solutions spécifiques consistant à :

a) diminuer la qualité de la vidéo en augmentant la compression de chaque image ; b) diminuer la qualité de la vidéo en diminuant la fréquence des images (en anglais « frame- rate ») ;

c) garder la même qualité et demander l'envoi d'une image en mode intra (image brute sans être encodée) ;

d) garder la même qualité et changer de type de codeur/décodeur.

Un inconvénient des deux premières techniques proposées (a) et b)) est qu'elles diminuent la qualité de la vidéo, ce qui conduit à une dégradation de la vidéo reçue par le client, au niveau de la qualité des images ou de la fluidité des images.

Les deux dernières techniques proposées (c) et d)) permettent de garantir une qualité de vidéo constante lors de l'apparition de problèmes survenant au niveau du réseau.

Cependant, si la technique c) est appliquée suite à une baisse de débit sur les canaux de transport (entraînant ainsi une perte de données et donc une dégradation des images), la mise en œuvre de cette solution conduit à une dégradation accentuée de la qualité de l'image. En effet, cette solution consiste à envoyer une image en mode intra, qui contient la totalité de l'information d'une image et est donc de grande taille, dans un canal ne pouvant envoyer que des données de petites tailles.

La technique d) consiste à changer de codeur vidéo et choisir un nouveau codeur vidéo, dont le taux de compression est supérieur, afin que le débit d'envoi soit adapté à celui du canal de transmission. Un inconvénient de cette technique réside dans le coût de traitement supplémentaire engendré du coté du décodeur. En effet, la mise en œuvre de la technique d) nécessite que la puissance des processeurs, côté client, soit adaptée au coût demandé par le nouveau codeur/décodeur. Si elle n'est pas adaptée, la mise en œuvre de cette solution entraîne une dégradation accentuée de la qualité de la vidéo, si le processeur n'arrive pas à traiter les demandes de calculs ordonnées par le nouveau codeur/décodeur, et la qualité de l'image reçue (en sortie du décodeur vidéo) est dégradée.

Enfin, quelque soit le mode de codage/décodage choisit, une dégradation sur l'un des éléments de la chaîne de transmission (réduction de débit par exemple) entraine généralement une dégradation plus ou moins accentuée de la qualité de la vidéo reçue par le client.

Il existe donc un besoin pour une nouvelle technique de transmission d'une séquence d'images, ne présentant l'ensemble de ces inconvénients de l'art antérieur.

3. Exposé de l'invention

L'invention propose une solution à ce problème, sous la forme d'un procédé de transmission d'une séquence d'images, comprenant les étapes suivantes :

identification, dans au moins une image de la séquence, d'au moins deux régions distinctes ; pour chacune des régions, détermination d'un mode de codage adapté à la région ;

codage de la ou des images en utilisant, pour chacune des régions, le mode de codage adapté à la région, et transmission dans un unique flux vidéo.

Ainsi, l'invention repose sur une approche nouvelle et inventive de la transmission d'une séquence d'images, permettant de coder différemment différentes régions ou zones des images. De cette façon, il est possible d'utiliser un mode de codage plus robuste pour une région présentant un fort intérêt (notamment du point de vue du client), et un mode de codage moins robuste pour une région présentant un faible intérêt.

En particulier, à conditions de transmission équivalentes, il est possible selon l'invention de transmettre un flux vidéo qui, du point de vue du client, présente une meilleure qualité qu'un flux vidéo transmis selon une technique classique. En effet, selon l'art antérieur, toute l'image est codée en utilisant un mode de codage spécifique, alors que selon l'invention, les régions présentant un fort intérêt sont codées en utilisant un mode de codage plus robuste, et apparaissent donc comme présentant une meilleure qualité pour le client.

De plus, en cas de dégradation des conditions de transmission, le client ne détecte pas la dégradation de l'image, car celle-ci n'est pas, ou peu, dégradée pour la ou les régions auxquelles il accorde de l'intérêt (par exemple le centre de l'image), même si elle est dégradée pour la ou les régions qui ne sont pas d'un intérêt important (par exemple le fond ou les bords de l'image).

Par ailleurs, en cas d'erreur au cours de la transmission, il est possible de ne renvoyer que les informations associées à la région dans laquelle l'erreur est survenue (par exemple sous forme de résidu de prédiction ou de la région entière sous forme d'image intra), ce qui permet de limiter la consommation de bande passante. En effet, une perte ou erreur survenant dans une région n'impacte pas les autres régions, puisque les différentes régions sont codées indépendamment, en utilisant des modes de codage distincts.

En particulier, on note que l'invention nécessite l'utilisation d'un seul codeur (par exemple de type H.263, H.264, MPEG4, ou d'autres codeurs existants ou à venir), pouvant implémenter différents modes ou stratégies de codage sur les différentes régions d'une image.

Selon un aspect spécifique de l'invention, l'étape de détermination d'un mode de codage adapté à une région tient compte du contenu de la région.

Par exemple, l'étape de détermination tient compte d'une activité dans la région.

Ainsi, si l'on considère une séquence d'images dans laquelle la première image est composée d'un personnage et d'un fond à un instant tO, la deuxième image est composée du même personnage animé d'un mouvement et du même fond à un instant tl, et la troisième image est composée du même personnage animé d'un autre mouvement et du même fond à un instant t2, alors les images de la séquence d'images pourront être segmentée de façon similaire en deux régions, une première région correspondant au personnage et une deuxième région correspondant au fond, et deux modes de codage distincts pourront être affectés à ces deux régions.

La région correspondant au personnage dans cet exemple présente une forte activité (mouvement du personnage sur les trois images) et correspond donc à une région importante pour le client, qui reçoit et visualise la vidéo. On affecte donc, selon l'invention, un mode de codage robuste à cette région, qui permet de coder cette région avec une bonne qualité (par exemple comme un mode de codage de type P hiérarchique).

A l'inverse, la région correspondant au fond dans cet exemple ne présente pas, ou peu, d'activité, et correspond donc à une région de moindre intérêt pour le client. On affecte donc, selon l'invention, un mode de codage moins robuste à cette région, qui permet de coder cette région avec une qualité plus faible (par exemple comme un mode de codage de type IPPP).

Ainsi, à titre d'exemple, au sein d'une même image, certaines régions peuvent donc être codées comme une image de type I et d'autres comme une image de type P.

La ou les images codées en utilisant, pour chacune des régions, le mode de codage adapté à la région, sont ensuite transmises dans un unique flux vidéo.

En particulier, et comme présenté ci-dessus, le mode de codage adapté à une région est défini pour plusieurs images de la séquence.

A titre d'exemple, les modes de codage appartiennent au groupe comprenant :

un codage de type IPPP, ou « image I, image P, image P, image P »,

un codage de type image P hiérarchique,

un codage de type IPPPI, ou « image I, image P, image P, image P, image I »,

un codage de type intra-rafraîchissement adaptatif (en anglais « AIR » pour « adaptive intra refresh ») ;

un codage de type « backchannel » (en français « canal de retour »), tel que décrit dans la norme H.263 par exemple.

Bien entendu, cette liste n'est pas exhaustive, et tout mode de codage peut être appliqué indépendamment sur chacune des régions d'une image, par exemple suivant l'intérêt de la région. En particulier, les exemples de modes de codage proposés concernent plus spécifiquement les transmissions temps réels, mais d'autres modes de codage sont envisageables dans le cas général, notamment avec des images de type B.

En particulier, pour une région de l'image satisfaisant un critère d'intérêt particulier, le mode de codage déterminé est un codage robuste de type image P hiérarchique ou IPPPI.

Pour une région de l'image ne satisfaisant pas le critère d'intérêt particulier, le mode de codage déterminé est de type IPPP. Selon un autre aspect de l'invention, le procédé de transmission comprend une étape préalable de détermination des paramètres de transmission de la séquence d'images.

Ainsi, un premier jeu de paramètres de transmission, définissant par exemple la fréquence de transmission des images, la résolution des images, le débit de transmission, etc, peut être négocié/défini préalablement à la transmission, lors de l'ouverture d'une session multimédia.

Une fois ce premier jeu de paramètres défini, on considère un deuxième « jeu de paramètres » spécifiques au codeur, définissant par exemple les différents modes de codage/décodage autorisés par le codeur et le décodeur. Ces modes de codage/décodage dépendent notamment des paramètres de transmission définis dans le premier jeu (comme la fréquence de transmission des images, la résolution, etc, prédéfinies).

Selon un aspect particulier de l'invention, le procédé de transmission comprend une étape de mise à jour des régions et des modes de codage adaptés à chacune des régions, périodique et/ou tenant compte d'une modification du canal de transmission.

Ainsi, il est possible de redéfinir les régions et/ou le mode de codage utilisé pour chaque région au cours de la transmission, périodiquement et/ou en fonction d'une variation du canal de transmission. Le schéma adaptatif proposé selon ce mode de réalisation permet d'optimiser le codage de la séquence d'images.

Par exemple, cette étape de mise à jour peut être effectuée à réception, par le codeur, d'une information sur le canal de transmission (« feedback »).

Selon une autre caractéristique particulière de l'invention, au moins un indicateur peut être inséré dans le flux vidéo, afin d'identifier les différentes régions de l'image et/ou de préciser le mode de codage utilisé pour chaque région.

Dans un autre mode de réalisation, l'invention concerne un dispositif de transmission d'une séquence d'images, comprenant :

des moyens d'identification, dans au moins une image de la séquence, d'au moins deux régions distinctes ;

des moyens de détermination d'un mode de codage adapté à chacune des régions ;

des moyens de codage de la ou des images en utilisant, pour chacune des régions, le mode de codage adapté à la région, et des moyens de transmission dans un unique flux vidéo.

Un tel dispositif de transmission est notamment adapté à mettre en œuvre le procédé de transmission décrit précédemment. Il comprend par exemple un codeur vidéo de type H.263, H.264, MPEG4, etc. Ce dispositif pourra bien sûr comporter les différentes caractéristiques relatives au procédé de transmission selon l'invention, qui peuvent être combinées ou prises isolément. Ainsi, les caractéristiques et avantages de ce dispositif sont les mêmes que ceux du procédé de transmission, et ne sont pas détaillés plus amplement.

L'invention concerne par ailleurs un procédé de réception d'une séquence d'images, comprenant les étapes suivantes :

réception d'un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de la ou des images ;

décodage et restitution de la ou des images.

Un tel procédé est notamment adapté à recevoir un flux vidéo tel que décrit précédemment. Ce procédé pourra donc comporter les différentes caractéristiques relatives au procédé de transmission selon l'invention. Ainsi, les caractéristiques et avantages de ce procédé de réception sont les mêmes que ceux du procédé de transmission, et ne sont pas détaillés plus amplement.

Dans un autre mode de réalisation, l'invention concerne un dispositif de réception d'une séquence d'images, comprenant :

des moyens de réception d'un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de ladite au moins une image ; des moyens de décodage et restitution de la ou des images codées.

Un tel dispositif de réception est notamment adapté à mettre en œuvre le procédé de réception décrit précédemment. Il comprend par exemple un décodeur vidéo de type H.263, H.264, MPEG4, etc.

Ce dispositif pourra bien sûr comporter les différentes caractéristiques relatives au procédé de réception selon l'invention, qui peuvent être combinées ou prises isolément. Ainsi, les caractéristiques et avantages de ce dispositif sont les mêmes que ceux du procédé de réception, et ne sont pas détaillés plus amplement.

Dans un autre mode de réalisation, l'invention concerne un ou plusieurs programmes d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé de transmission et/ou d'un procédé de réception tels que décrits précédemment, lorsque ce ou ces programmes sont exécutés par un processeur.

Ainsi, les procédés de transmission et/ou de réception selon l'invention peuvent être mis en œuvre de diverses manières, notamment sous forme câblée ou sous forme logicielle.

Dans encore un autre mode de réalisation, l'invention concerne au moins un support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions exécutables par un ordinateur pour la mise en œuvre d'un procédé de transmission et/ou d'un procédé de réception tels que décrits précédemment.

4. Liste des figures

D'autres caractéristiques et avantages de l'invention apparaîtront plus clairement à la lecture de la description suivante d'un mode de réalisation particulier, donné à titre de simple exemple illustratif et non limitatif, et des dessins annexés, parmi lesquels :

la figure 1 présente les principales étapes d'un procédé de transmission selon un mode de réalisation particulier de l'invention ;

la figure 2 présente les principales étapes d'un procédé de réception selon un mode de réalisation particulier de l'invention ;

la figure 3 illustre un exemple de traitement d'une image d'une séquence d'images selon un mode de réalisation particulier de l'invention ;

les figures 4 et 5 présentent respectivement la structure d'un dispositif de transmission et d'un dispositif de réception selon un mode de réalisation particulier de l'invention.

5. Description d'un mode de réalisation de l'invention

5.1 Principe général

Le principe général de l'invention repose sur l'identification de différentes régions dans au moins une image d'une séquence d'images, et sur le codage spécifique de ces différentes régions, en utilisant un mode de codage adapté pour chaque région. Un tel mode de codage est sélectionné parmi un ensemble de modes de codage défini pour le codeur utilisé. Ainsi, on peut utiliser un premier mode de codage pour coder une première région de l'image, un deuxième mode de codage pour coder une deuxième région de l'image, etc. La ou les images ainsi codées par le codeur sont transmises dans un unique flux vidéo.

Il est ainsi possible de maintenir la qualité de la vidéo perçue par un client même en cas de modification des conditions de transmission, voire d'améliorer la qualité de la vidéo perçue par un client par rapport aux techniques de transmission existantes à mêmes conditions de transmission.

En particulier, il est possible de limiter la dégradation de la qualité de la vidéo perçue par un client ou utilisateur, notamment en cas de réduction de la capacité du canal, en adaptant le mode de codage aux différentes régions de l'image, et par exemple en tenant compte des régions d'intérêt des images.

5.2 Description de modes de réalisation particuliers

On présente, en relation avec la figure 1, les principales étapes d'une technique de transmission d'une séquence d'images Seq selon un mode de réalisation particulier de l'invention. Au cours d'une première étape 11, on identifie (Id), dans au moins une image de la séquence Séq, au moins deux régions distinctes.

Selon le mode de réalisation de l'invention, l'identification de différentes régions dans une image peut être mise en œuvre de manière statique ou dynamique, et manuel ou automatique.

Par exemple, selon une première variante, dite statique, il peut être prédéterminé, en fonction du flux vidéo à transmettre, que certaines régions de l'image (par exemple les bords, les coins) soient de moindre intérêt pour l'utilisateur et donc traitées comme des régions dont la qualité peut être dégradée en utilisant un mode de codage basique. Par déduction, les autres régions de l'image, par exemple le centre, sont considérées comme étant de grand intérêt par le client, et donc traitées comme des régions dont il faut préserver la qualité en utilisant un mode de codage robuste.

Ainsi, si le flux vidéo contient plutôt des scènes figées, par exemple dans le cas d'une session de vidéoconférence avec des interlocuteurs statiques, les régions peuvent être prédéfinies.

Selon une deuxième variante, dite dynamique, les différentes régions ne sont pas prédéfinies avant la transmission.

Par exemple, on peut employer des techniques connues de recherche de mouvement, afin d'accorder plus d'importance à des régions actives, présentant du mouvement, au détriment de régions ne présentant pas de mouvement, donc statiques.

Il est par ailleurs possible de segmenter les images de la séquence d'images manuellement, ou automatiquement en utilisant une technique connue, de type ordonnancement flexible des macroblocs (en anglais FMO ou « Flexible Macroblock Ordering ») par exemple.

Au cours d'une deuxième étape 22, on détermine, pour chacune des régions, un mode de codage adapté à la région.

On rappelle que tout mode de codage compatible avec le codeur utilisé peut être appliqué indépendamment sur chacune des régions, suivant l'intérêt de la région, selon ce mode de réalisation particulier. Un tel mode ou algorithme de codage permet notamment d'améliorer la qualité et/ou la résistance aux pertes.

Il est ainsi possible d'assigner, selon ce mode de réalisation particulier, des modes de codage différents au sein d'une même image, en choisissant un mode de codage qui soit adapté à l'activité de la région correspondante. Ainsi, la solution proposée, selon ce mode de réalisation, permet une dégradation non uniforme de la séquence d'images en cas de réduction de la capacité du canal, alors que les solutions existantes reposent sur une dégradation équivalente (sur toute l'image) de la séquence d'images. La solution proposée permet donc, selon ce mode de réalisation particulier, de dégrader d'avantage les images de la séquence dans les régions dans lesquelles la qualité perçue par le client est de faible intérêt, et de préserver un maximum de qualité dans les régions dans lesquelles la qualité perçue par le client est primordiale.

De cette façon, il est possible de conserver la qualité d'une région d'intérêt au sein d'un flux vidéo, ou de limiter la dégradation afin qu'elle ne soit pas perçue par le client, dans un environnement contraint en terme de capacité de transmission des données.

Par exemple, si la région est de faible intérêt, on choisit un mode de codage ne retransmettant pas cette région de l'image en cas d'erreur. Notamment, s'il s'agit d'une région de l'image « fond », c'est-à-dire n'évoluant pas dans la séquence d'images, on peut choisir un mode de codage de type « skip », correspondant donc à une absence de transmission d'informations représentatives de cette région. A l'inverse, si la région présente un intérêt important, on peut choisir un mode de codage qui renvoie l'image I.

Au cours d'une troisième étape 13, la ou les images de la séquence sont codées, en utilisant, pour chacune des régions, le mode de codage adapté à la région déterminé à l'étape précédente. Un unique flux vidéo est généré au cours de cette troisième étape.

On note que ces trois premières étapes 11, 12 et 13 peuvent être mises en œuvre par un codeur, tel qu'un codeur H.263, H.264, MPEG4, etc par exemple.

Au cours d'une quatrième étape 14, le flux vidéo est transmis à destination d'un client.

On décrit désormais, en relation avec la figure 2, les principales étapes d'une technique de réception d'un flux vidéo selon un mode de réalisation particulier de l'invention.

Au cours d'une première étape 21, on reçoit un flux vidéo comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de la ou des images, obtenu comme décrit ci-dessus.

Au cours d'une deuxième étape 22, la ou les images codées sont décodées, et la séquence d'image correspondante Seq est restituée sur un terminal du client.

Différentes options de décodage peuvent être envisagées, mettant en œuvre soit un décodeur classique, soit une séparation des données du flux vidéo en fonction de la région de l'image afin de soumettre chaque région de l'image à un décodeur adapté au mode de codage utilisé pour la région correspondante.

En particulier, selon l'art antérieur, une image ne pouvait être restituée ou rafraîchie au niveau du terminal client qu'une fois les informations représentatives de la totalité de l'image reçues et décodées. Selon l'invention, il est possible de restituer/rafraîchir une région de l'image (par exemple une région d'intérêt, dans laquelle il y a plus de mouvement) dés que les informations représentatives de cette région de l'image sont reçues et décodées. 5.3 Exemples de mise en œuvre de l'invention

On présente désormais, en relation avec la figure 3, un premier exemple de mise en œuvre de l'invention.

On considère par exemple une séquence d'images représentative d'un journal télévisé, dans lequel la scène se compose du fond fondu avec changement de luminosité, du présentateur et d'un envoyé spécial, et d'une zone en pied de scène indiquant les cours de la bourse ou un bandeau d'informations.

Selon un mode de réalisation particulier de l'invention, une image à un instant t est décomposée en quatre régions :

une région 31, en hachuré, indiquant les cours de la bourse ou un bandeau d'informations ;

une région 32 qui correspond à la zone d'évolution du présentateur ;

une région 33 qui correspond à la zone d'évolution de l'envoyé spécial ; et une région 34 représentant le fond.

En cas de dégradation des conditions de transmission, et notamment du canal de transmission, au lieu de réduire la qualité de la vidéo en réduisant par exemple la fréquence des images à 25 images par seconde sur toute l'image, on propose selon l'invention de conserver cette fréquence à 50 images par seconde, et d'appliquer un mode de codage différent aux différentes régions de l'image :

sur la région 33 contenant l'envoyé spécial, qui correspond à la zone de priorité la plus importante du point de vue du client : application d'un mode de codage de type P hiérarchique, ou bien d'un mode de codage de type I, P, I, P, etc (en d'autres termes, on envoie l'image intra de cette région une fois sur deux : avec la première image, avec la troisième image, avec la cinquième image, etc) ;

sur la région 32 contenant le présentateur, qui correspond à une zone de priorité normale du point de vue du client : application d'un mode de codage classique, par exemple de type I, P, P, P, P, I (en d'autres termes, on envoie l'image intra de cette région une fois sur cinq : avec la première image, avec la sixième image, etc) ;

sur la région 31 contenant le bandeau d'informations ou les cours de la bourse, qui correspond à une zone de faible priorité du point de vue du client : application d'un mode de codage moins robuste, par exemple de type I, P, P, P, P, P, P, P, P, P, I (en d'autres termes, on envoie l'image intra de cette région une fois sur dix : avec la première image, avec la onzième image, etc). On peut également choisir un mode de codage ne retransmettant pas la région de l'image (ou un résidu correspond à cette région de l'image) en cas de perte de données ; sur la région 34 contenant le fond / reste de l'image : application d'un mode de codage encore moins robuste. Notamment, lorsque le reste de l'image est fixe, on peut utiliser le mode de codage « skip » dès que la qualité du fond restitué au client est suffisante. Par exemple, on envoie l'image intra de cette région une seule fois, puis on ne code plus cette région tant qu'il n'y a pas de changement au niveau du fond. En particulier, on peut choisir un mode de codage ne permettant aucune retransmission en cas d'erreur ou de perte de données. Ainsi, en cas d'erreur, aucune mise à jour du fond n'est demandée, dans la mesure où cette région est de faible intérêt pour le client.

Ainsi, l'invention permet, selon au moins un de ses modes de réalisation, de limiter la dégradation perçue par le client/utilisateur en cas de dégradation des conditions de transmission, puisque l'envoyé spécial et le présentateur restent fluides et bien définis, et que le bandeau d'information/cours de la bourse reste lisible (même si de moins bonne qualité que l'envoyé spécial et le présentateur). On rappelle que selon les techniques de l'art antérieur, l'image est dégradée dans son ensemble.

Selon encore un deuxième exemple de mise en œuvre de l'invention, on considère une session de vidéoconférence dont le débit entrant dans le serveur de vidéoconférence est limité à 2 Mbs. Le débit sortant, au niveau de chacun des participants, dépend du nombre de participants à cette vidéoconférence. Par exemple, si le nombre de participants est égal à 5, alors chacun des participants dispose en moyenne de 400 kbs, et la qualité d'émission de la vidéo de chaque participant est alors limitée par ce débit. Par ailleurs, si le nombre de participants augmente, et notamment s'il double (10 participants), le débit alloué à chaque participant est divisé par deux, soit 200 kbs, et la qualité de la vidéo émise par chacun des participants est dégradée, de manière uniforme pour toute l'image selon les techniques connues de l'art antérieur.

Au contraire, selon un mode de réalisation particulier de l'invention, l'image de chaque participant est segmentée en deux régions différentes : une première région pour le visage et une seconde région pour le fond. Chacune de ces régions prend une partie du débit de 200kbs alloué, et un mode de codage distinct est affecté à chacune de ces régions, en fonction de l'intérêt associé à chaque région.

Ainsi, si le débit consommé par la région visage, tout en conservant les autres paramètres de transmission d'origine (taille et fréquence d'images), est inférieur à 200 kbs (150 kbs par exemple), alors aucun changement de qualité ne va être appliqué sur cette région (on conserve un mode de codage classique, ou on utilise un mode de codage plus robuste pour améliorer la qualité de la région visage, comme le codage de type AIR ou IPPPI). Le reste du débit (50 kbs) est alloué alors pour la région du fond, pour laquelle on utilise un mode de codage moins robuste, comme le codage IPPP.

Si le débit consommé par la région visage, tout en conservant les autres paramètres de transmission d'origine (taille et fréquence d'images), est supérieur à 200 kbs (250 kbs par exemple), alors le mode de codage est modifié afin d'utiliser un mode de codage moins consommateur de bande passante, comme le codage de type P hiérarchique, de façon à n'utiliser qu'une partie du débit, par exemple 150 kbs. Le reste du débit (50 kbs) peut alors être alloué pour la région du fond, pour laquelle on utilise un mode de codage moins robuste, comme le codage IPPP. Côté décodeur, on rafraîchit donc moins souvent une région présentant un plus faible intérêt pour le client.

A titre d'exemple, si on considère des applications temps réel, on peut classer différents modes de codage en fonction de leur coût en terme de débit, avec du moins coûteux au plus coûteux : le codage de type IPPP, le codage de type P hiérarchique, le codage de type « backchannel », le codage de type AIR, le codage de type IPPPI.

Finalement, les deux régions sont transmises dans un unique flux vidéo.

Ce traitement, selon ce mode de réalisation de l'invention, engendre une perte de qualité sur la région correspondant au fond, ce qui ne perturbe pas l'utilisateur, le fond ne bougeant pas ou peu, mais la qualité de la région visage est conservée (voire améliorée). Ainsi, la dégradation de la qualité de l'image engendrée par une diminution du débit de transmission n'est pas perçue par l'utilisateur.

5.4 Structures simplifiées d'un dispositif de transmission et d'un dispositif de réception La figure 4 présente la structure simplifiée d'un dispositif de transmission mettant en œuvre le procédé de transmission selon un mode de réalisation particulier de l'invention.

Ce dispositif comprend une mémoire RAM 41, une unité de traitement 42, équipée par exemple d'un processeur, et pilotée par un programme d'ordinateur stocké dans une mémoire ROM 43. A l'initialisation, les instructions de code du programme d'ordinateur sont par exemple chargées dans la mémoire RAM 41 avant d'être exécutées par le processeur de l'unité de traitement 42. L'unité de traitement 42 reçoit en entrée au moins une image d'une séquence d'images. Le processeur de l'unité de traitement 42 met en œuvre les étapes du procédé de transmission décrit précédemment, selon les instructions du programme d'ordinateur 43, en appliquant un traitement distincts aux différentes régions de la ou des images, et génère en sortie un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de la ou des images. Pour cela, le dispositif de transmission comprend, outre la mémoire 41, des moyens d'identification, dans au moins une image de la séquence, d'au moins deux régions distinctes, des moyens de détermination d'un mode de codage adapté à chacune des régions, des moyens de codage de la ou des images, et des moyens de transmission dans un unique flux vidéo. Ces moyens sont pilotés par le microprocesseur de l'unité de traitement 42.

La figure 5 présente la structure simplifiée d'un dispositif de réception mettant en œuvre le procédé de réception selon un mode de réalisation particulier de l'invention.

Ce dispositif comprend une mémoire RAM 51, une unité de traitement 52, équipée par exemple d'un processeur, et pilotée par un programme d'ordinateur stocké dans une mémoire ROM 53. A l'initialisation, les instructions de code du programme d'ordinateur sont par exemple chargées dans la mémoire RAM 51 avant d'être exécutées par le processeur de l'unité de traitement 52. L'unité de traitement 52 reçoit en entrée un unique flux vidéo. Le processeur de l'unité de traitement 52 met en œuvre les étapes du procédé de réception décrit précédemment, selon les instructions du programme d'ordinateur 53, pour décoder et restituer la ou les images codées en utilisant un mode de codage adapté à chaque région de la ou des images. Pour cela, le dispositif de réception comprend, outre la mémoire 51, des moyens de réception d'un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de la ou des images, des moyens de décodage et restitution de la ou des images. Ces moyens sont pilotés par le microprocesseur de l'unité de traitement 52.

Selon différents modes de réalisation, l'invention est mise en œuvre au moyen de composants logiciels et/ou matériels.

Un composant logiciel correspond à un ou plusieurs programmes d'ordinateur, un ou plusieurs sous-programmes d'un programme, ou de manière plus générale à tout élément d'un programme ou d'un logiciel apte à mettre en œuvre une fonction ou un ensemble de fonctions. Un tel composant logiciel est exécuté par un processeur de données d'une entité physique (codeur, émetteur, terminal, décodeur, récepteur, dispositif de transmission, dispositif de réception, ...) et est susceptible d'accéder aux ressources matérielles de cette entité physique (mémoires, supports d'enregistrement, bus de communication, cartes électroniques d'entrées/sorties, interfaces utilisateur, ...).

De la même manière, un composant matériel correspond à tout élément d'un ensemble matériel (ou « hardware ») apte à mettre en œuvre une fonction ou un ensemble de fonctions. Il peut s'agir d'un composant matériel programmable ou avec processeur intégré pour l'exécution de logiciel, par exemple un circuit intégré, une carte à puce, une carte à mémoire, une carte électronique pour l'exécution d'un micrologiciel (« firmware »), etc.

Claims

REVENDICATIONS

1. Procédé de transmission d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :

identification (11), dans au moins une image de ladite séquence, d'au moins deux régions distinctes ;

pour chacune desdites régions, détermination (12) d'un mode de codage adapté à ladite région ;

codage (13) de ladite au moins une image en utilisant, pour chacune desdites régions, le mode de codage adapté à ladite région, et transmission (14) dans un unique flux vidéo.

2. Procédé de transmission selon la revendication 1, caractérisé en ce que ladite étape de détermination (12) tient compte du contenu de ladite région.

3. Procédé de transmission selon la revendication 2, caractérisé en ce que ladite étape de détermination (12) tient compte d'une activité dans ladite région.

4. Procédé de transmission selon la revendication 1, caractérisé en ce que ledit mode de codage adapté à une région est défini pour plusieurs images de ladite séquence.

5. Procédé de transmission selon la revendication 1, caractérisé en ce que lesdits modes de codage appartiennent au groupe comprenant :

un codage de type IPPP, ou « image I, image P, image P, image P »,

un codage de type image P hiérarchique,

- un codage de type IPPPI, ou « image I, image P, image P, image P, image I »,

un codage de type intra-rafraîchissement adaptatif.

6. Procédé de transmission selon la revendication 5, caractérisé en ce que, pour une région de l'image satisfaisant un critère d'intérêt particulier, le mode de codage déterminé est de type image P hiérarchique ou IPPPI.

7. Procédé de transmission selon la revendication 1, caractérisé en ce qu'il comprend une étape préalable de détermination des paramètres de transmission de ladite séquence d'images.

8. Procédé de transmission selon la revendication 1, caractérisé en ce qu'il comprend une étape de mise à jour desdites régions et desdits modes de codage adaptés à chacune desdites régions, périodique et/ou tenant compte d'une modification du canal de transmission.

9. Dispositif de transmission d'une séquence d'images, caractérisé en ce qu'il comprend : des moyens d'identification (11), dans au moins une image de ladite séquence, d'au moins deux régions distinctes ;

des moyens de détermination (12) d'un mode de codage adapté à chacune desdites régions ;

- des moyens de codage (13) de ladite au moins une image en utilisant, pour chacune desdites régions, le mode de codage adapté à ladite région, et des moyens de transmission (14) dans un unique flux vidéo.

10. Procédé de réception d'une séquence d'images, caractérisé en ce qu'il comprend les étapes suivantes :

réception (21) d'un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de ladite au moins une image ;

décodage (22) et restitution de ladite au moins une image.

11. Dispositif de réception d'une séquence d'images, caractérisé en ce qu'il comprend :

des moyens de réception (21) d'un unique flux vidéo, comprenant au moins une image codée en utilisant un mode de codage adapté à chaque région de ladite au moins une image ;

des moyens de décodage (22) et restitution de ladite au moins une image.

12. Programme d'ordinateur comportant des instructions pour la mise en œuvre d'un procédé selon la revendication 1 ou selon la revendication 10 lorsque ce programme est exécuté par un processeur.

13. Support d'enregistrement lisible par un ordinateur sur lequel est enregistré un programme d'ordinateur comprenant des instructions exécutables par un ordinateur pour la mise en œuvre d'un procédé selon la revendication 1 ou selon la revendication 10.