FR2925705A1 - Dispositif d'aide a la capture d'images - Google Patents

Dispositif d'aide a la capture d'images Download PDF

Info

Publication number
FR2925705A1
FR2925705A1 FR0760170A FR0760170A FR2925705A1 FR 2925705 A1 FR2925705 A1 FR 2925705A1 FR 0760170 A FR0760170 A FR 0760170A FR 0760170 A FR0760170 A FR 0760170A FR 2925705 A1 FR2925705 A1 FR 2925705A1
Authority
FR
France
Prior art keywords
image
interest
perceptual
format
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0760170A
Other languages
English (en)
Inventor
Meur Olivier Le
Jean Claude Chevet
Philippe Guillotel
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority to FR0760170A priority Critical patent/FR2925705A1/fr
Priority to PCT/EP2008/067685 priority patent/WO2009080639A2/fr
Priority to CN2008801217969A priority patent/CN101903828B/zh
Priority to EP08863889.5A priority patent/EP2232331B1/fr
Priority to US12/735,073 priority patent/US20100259630A1/en
Priority to JP2010538693A priority patent/JP5512538B2/ja
Priority to KR1020107016017A priority patent/KR101533475B1/ko
Publication of FR2925705A1 publication Critical patent/FR2925705A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B15/00Special procedures for taking photographs; Apparatus therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/631Graphical user interfaces [GUI] specially adapted for controlling image capture or setting capture parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/63Control of cameras or camera modules by using electronic viewfinders
    • H04N23/633Control of cameras or camera modules by using electronic viewfinders for displaying additional information relating to control or operation of the camera
    • H04N23/635Region indicators; Field of view indicators

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)
  • Indication In Cameras, And Counting Of Exposures (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

L'invention concerne un dispositif d'aide à la capture d'images (1) comprenant :- des moyens d'analyse (20) aptes à calculer des données d'intérêt perceptuel pour des zones d'une image devant être capturée;- des moyens d'affichage (30) aptes à superposer à l'image au moins un indicateur graphique indiquant la position d'au moins une zone d'intérêt dans l'image.L'invention concerne également un dispositif de capture d'images comprenant le dispositif d'aide à la capture d'images (1) selon l'invention.

Description

DISPOSITIF D'AIDE A LA CAPTURE D'IMAGES
1. Domaine de l'invention L'invention se rapporte au domaine général de l'analyse d'images. Plus 5 particulièrement, l'invention concerne un dispositif d'aide à la capture d'images et un dispositif de capture d'image comprenant le dispositif d'aide.
2. Etat de l'art Actuellement, lorsqu'un caméraman filme une scène, outre 10 l'observation directe de la scène au travers du viseur de la caméra, les seuls moyens dont il dispose pour s'assurer que la scène qu'il filme est bien cadrée est soit d'utiliser une voie de retour, soit d'utiliser des tests oculométriques. L'observation directe de la scène au travers d'un viseur ne permet pas toujours au caméraman de la cadrer correctement notamment dans le cas de 15 scène à fort mouvement (p.ex. scènes de sport). II peut également être difficile pour lui de déterminer comment cadrer une scène dans le cas où cette scène comprend de nombreuses zones d'intérêt (p.ex. cas d'un panoramique). L'utilisation d'une voie de retour permet par exemple au réalisateur 20 d'indiquer au caméraman que l'image est mal cadrée. Une telle solution n'est cependant pas satisfaisante dans la mesure où elle n'est pas instantanée. Les tests oculométriques, quant à eux, sont difficiles et longs à mettre en place. En effet, ils nécessitent de disposer d'un panel représentatif d'observateurs. En outre, les résultats de ses tests ne sont pas immédiats et 25 nécessitent une longue phase d'analyse.
3. Résumé de l'invention L'invention a pour but de pallier au moins un des inconvénients de l'art antérieur. 30 L'invention concerne un dispositif d'aide à la capture d'images comprenant : - des moyens d'analyse aptes à calculer des données d'intérêt perceptuel pour des zones d'une image devant être capturée; - des moyens d'affichage aptes à superposer à l'image au moins un indicateur graphique indiquant la position d'au moins une zone d'intérêt dans l'image. Le dispositif d'aide à la capture d'images selon l'invention simplifie la prise de vue en fournissant au caméraman davantage d'information sur la scène qu'il est en train de filmer. Selon une caractéristique particulière de l'invention, les moyens d'analyse sont adaptés pour calculer une donnée d'intérêt perceptuel pour chaque pixel de l'image. Selon un aspect particulier de l'invention, l'indicateur graphique est 10 superposé sur l'image de telle sorte qu'il soit centré sur le pixel de l'image dont la donnée d'intérêt perceptuel est la plus élevée. Selon une caractéristique particulière de l'invention, l'image étant divisée en blocs de pixels, les moyens d'analyse sont adaptés pour calculer une donnée d'intérêt perceptuel pour chaque bloc de l'image. 15 Selon un autre aspect particulier de l'invention, l'indicateur graphique est une flèche pointant vers au moins un bloc dont la donnée d'intérêt perceptuel est supérieure à un seuil prédéfini. Avantageusement, les moyens d'affichage sont en outre aptes à modifier au moins un paramètre d'un indicateur graphique en fonction d'un 20 taux d'intérêt perceptuel associée à la zone de l'image couverte par l'indicateur graphique. Selon un exemple de réalisation, le taux d'intérêt perceptuel est égal au rapport entre la somme des données d'intérêt perceptuel associées aux pixels de l'image couverts par l'indicateur graphique et la somme des 25 données d'intérêt perceptuel associés à tous les pixels de l'image. Selon un exemple de réalisation, l'indicateur graphique est un cercle dont l'épaisseur est proportionnelle au taux d'intérêt perceptuel. L'indicateur graphique appartient au groupe comprenant : - un cercle ; 30 - un rectangle - une flèche ; et - une croix.
L'invention concerne également un dispositif de capture d'images comprenant : - un dispositif d'aide à la capture d'images selon l'une des revendications précédentes ; et - un viseur sur lequel l'indicateur graphique est affiché par le dispositif d'aide à la capture d'images selon l'invention. Le dispositif de capture d'images selon l'invention aide le caméraman à cadrer correctement la scène qu'il est en train de filmer en lui indiquant grâce aux indicateurs graphique comment positionner sa caméra pour que l'image filmée soit centrée sur une des zones d'intérêt de la scène. Selon un mode de réalisation particulier, le dispositif de capture d'images est apte à capturer des images d'un premier format prédéfini et l'indicateur graphique est un cadre définissant un second format prédéfini différent du premier format.
Selon un exemple de réalisation, le premier format et le second format appartient au groupe comprenant : - le format 16/9 ; et - le format 4/3. 4. Listes des fiqures L'invention sera mieux comprise et illustrée au moyen d'exemples de modes de réalisation et de mise en oeuvre avantageux, nullement limitatifs, en référence aux figures annexées sur lesquelles : r la figure 1 représente un dispositif d'aide à la capture d'images selon 25 l'invention; la figure 2 illustre un procédé de calcul de données d'intérêt perceptuel; la figure 3 représente une image divisée en bloc de pixels à chacun desquels est associée une donnée d'intérêt perceptuel; r la figure 4 représente une image sur laquelle est superposé un indicateur 30 graphique en forme de flèche; la figure 5 représente une image sur laquelle sont superposés quatre indicateurs graphiques en forme de flèche; la figure 6 représente une image sur laquelle sont superposés deux indicateurs graphiques en forme de cercle; r la figure 7 représente une image sur laquelle sont superposés deux indicateurs graphiques en forme de rectangle; r la figure 8 représente une image sur laquelle est superposée une carte de chaleur représentative de la saillance de l'image; la figure 9 représente une image sur laquelle sont superposés des indicateurs graphiques en forme de carré et leur barycentre; r la figure 10 représente un dispositif de capture d'images selon l'invention; 10 r la figure 11 représente une image au format 16/9 et un indicateur graphique en forme de cadre au format 4/3; et r la figure 12 représente une image au format 4/3 et un indicateur graphique en forme de cadre au format 16/9.
15 5. Description détaillée de l'invention La figure 1 représente un dispositif d'aide à la capture d'images selon l'invention. Le dispositif d'aide à la capture d'images comprend un module d'analyse 20 apte à analyser une image devant être capturée. Plus 20 précisément, le module 20 analyse le contenu visuel de l'image afin de calculer des données d'intérêt perceptuel. Une donnée d'intérêt perceptuel peut être calculée pour chaque pixel de l'image ou pour des groupes de pixels de l'image, par exemple un bloc de pixels. Les données d'intérêt perceptuel sont avantageusement utilisées pour déterminer des zones d'intérêt dans 2.5 l'image, i.e. des zones attirant le regard d'un observateur. A cet effet, le procédé décrit dans la demande de brevet européen EP 04804828.4 publiée le 30/06/2005 sous le numéro 1695288 peut être utilisé pour calculer pour chaque pixel de l'image une donnée d'intérêt perceptuel également appelée valeur de saillance. Ce procédé illustré par la figure 2 30 consiste en une première étape de modélisation spatiale suivie d'une étape de modélisation temporelle. L'étape de modélisation spatiale est composée de 3 étapes E201, E202 et E203. Lors de la première étape E201 les données images incidentes (p.ex. composantes RGB) sont filtrées afin de les rendre cohérentes avec ce que notre système visuel percevrait en regardant l'image. A cet effet, l'étape E201 met en oeuvre des outils qui modélisent le système visuel humain. Ces outils tiennent compte du fait que le système visuel humain n'apprécie pas de la même façon les différentes composantes visuelles de notre environnement. Cette sensibilité limitée est simulée par l'utilisation de fonctions de sensibilité aux contrastes (abrégé CSF pour l'acronyme anglais Contrast Sensitivity Function) et par l'utilisation du masquage visuel intra et inter composantes. Plus précisément, lors de l'étape E201, une décomposition hiérarchique en canaux perceptuels, notée DCP sur la figure 2, simulant le pavage fréquentiel du système visuel est appliquée aux composantes (A, Cri, Cr2) de l'espace de couleurs antagonistes de Krauskopf, déduites des composantes RGB d'une image. A partir du spectre de fréquence, un ensemble de sous-bandes ayant une gamme de fréquences radiales et une sélectivité angulaire particulière est définie. Chaque sous-bande peut être en fait considérée comme l'image neuronale délivrée par une population de cellules visuelles réagissant à une fréquence et une orientation particulière. La fonction CSF suivie d'une opération de masquage est appliquée sur chaque sous-bande. Une opération de masquage visuel intra et inter composantes est effectuée à la suite. Lors de la seconde étape E202, les sous-bandes issues de l'étape E201 sont convoluées avec un opérateur proche d'une différence de Gaussiennes (DoG). L'étape E202 a pour objectif de simuler le mécanisme de la perception visuelle. Ce dernier permet d'extraire les caractéristiques visuelles contenant 2.5 de l'information importante (notamment des singularités locales qui sont en contraste avec leur environnement) conduisant à la création d'une représentation économique de notre environnement. L'organisation des champs récepteurs des cellules visuelles qu'elles soient rétiniennes ou corticales répond tout à fait à ce besoin. Ces cellules sont circulaires et sont 30 constituées d'un centre et d'un pourtour ayant des réponses antagonistes. Les cellules corticales ont en plus la particularité d'avoir une direction préférée. Cette organisation leur confère donc la propriété de répondre fortement sur les contrastes et de ne pas répondre sur les zones uniformes. La modélisation de ce type de cellules s'effectue via des différences de Gaussiennes (DoG) orientées ou non. La perception consiste également à accentuer certaines caractéristiques essentielles à l'interprétation de l'information. Suivant les principes de l'école Gestaltiste, un filtre en papillon est appliqué après la DoG afin de renforcer les contours co-linéaires, alignés et de faible courbure. La troisième étape E203 consiste à construire la carte de saillance spatiale. A cet effet, une fusion des différentes composantes est effectuée en groupant ou en liant des éléments, a priori indépendants, pour former une image compréhensible par le cerveau. La fusion est basée sur une compétition intra composante et inter composantes permettant d'utiliser la complémentarité et la redondance des informations portées par différentes dimensions visuelles (achromatique ou chromatique). L'étape de modélisation temporelle, elle-même divisée en 3 étapes E204, E205 et E206, est basée sur l'observation suivante : dans un contexte animé, les contrastes de mouvement sont les attracteurs visuels les plus significatifs. Ainsi, un objet en déplacement sur un fond fixe, ou réciproquement un objet fixe sur un fond mouvement, attire notre attention visuelle. Pour déterminer ces contrastes, la prise en compte des mouvements oculaires de poursuite est primordiale. Ces mouvements oculaires permettent de compenser naturellement le déplacement d'un objet. La vélocité du mouvement considéré exprimée dans le référentiel rétinien est alors quasi nulle. Pour déterminer les contrastes de mouvement les plus pertinents, il est par conséquent nécessaire de compenser le mouvement inhérent de la caméra, supposé dominant. A cet effet, un champ de vecteurs est estimé à l'étape E204 grâce à un estimateur de mouvement travaillant sur la décomposition hiérarchique en canaux perceptuels. A partir de ce champ de vecteurs, un modèle paramétrique affine complet qui représente le mouvement dominant (par exemple mouvement translationnel) est estimé à l'étape E205 grâce à une technique d'estimation robuste basée sur des M-estimateurs. Le mouvement rétinien est alors calculé à l'étape E206. Il est égal à la différence entre le mouvement local et le mouvement dominant. Plus la valeur du mouvement rétinien est forte (en prenant en compte tout de même la vélocité maximale théorique du mouvement oculaire de poursuite), plus la zone en question attire le regard. La saillance temporelle qui est proportionnelle au mouvement rétinien ou au contraste de mouvement est ensuite déduite de ce mouvement rétinien. Etant donné qu'il est plus aisé de détecter un objet en mouvement parmi des éléments perturbateurs (ou distracteurs) fixes que le contraire, le mouvement rétinien est modulé par la quantité globale de mouvement de la scène.
Les cartes de saillance spatiale et temporelle sont fusionnées à l'étape E207. L'étape de fusion E207 fait intervenir un mécanisme de compétition intra et inter cartes. Une telle carte peut se présenter sous la forme d'une carte de chaleur indiquant les zones ayant un intérêt perceptuel important. Toutefois, l'invention n'est pas limitée au procédé décrit dans la demande de brevet européen EP 04804828.4 qui n'est qu'un exemple de réalisation. Tout procédé permettant de calculer des données d'intérêt perceptuel (p.ex. des cartes de saillance) dans une image convient. Par exemple, le procédé décrit dans le document de Itti et al. intitulé A mode/ of saliency-based visual attention for rapid scene analysis et publié en 1998 dans IEEE trans. on PAMI peut être utilisé par le module d'analyse 20 pour analyser l'image.
Le dispositif d'aide à la capture d'images 1 comprend en outre un module d'affichage 30 apte à superposer à l'image analysée par le module d'analyse 20 au moins un indicateur graphique indiquant la position d'au moins une zone d'intérêt dans l'image, i.e. une zone ayant une donnée d'intérêt perceptuel élevée. La position de cet indicateur graphique sur l'image et éventuellement ses caractéristiques géométriques dépendent des données d'intérêt perceptuel calculées par le module d'analyse 20. Cet indicateur graphique est positionné de telle sorte qu'il indique la position d'au moins une zone de l'image dont l'intérêt perceptuel est élevé. Selon une variante, une pluralité d'indicateurs graphiques sont superposés à l'image, chacun d'eux indiquant la position d'une zone de l'image dont l'intérêt perceptuel est élevé. Selon un premier mode de réalisation, l'indicateur graphique est une flèche. Afin de positionner la flèche dans l'image, celle-ci est divisée en N blocs de pixels ne se recouvrant pas. En supposant que N=16, comme illustré sur la figure 3, une donnée d'intérêt perceptuel est calculée pour chaque bloc. Selon un exemple de réalisation, la donnée d'intérêt perceptuel associé à un bloc est égale à la somme des données d'intérêt perceptuel associées à chaque pixel du bloc en question. Selon une variante, la donnée d'intérêt perceptuel associé au bloc est égale à la valeur maximale des données d'intérêt perceptuel dans le bloc en question. Selon une autre variante, la donnée d'intérêt perceptuel associé au bloc est égale à la valeur médiane des données d'intérêt perceptuel dans le bloc en question. Les données d'intérêt perceptuel sont identifiées sur la figure 3 à l'aide des lettres allant de A à P. La somme de certaines de ces données est comparée à un seuil prédéfini TH afin de déterminer la position de la ou des flèches sur l'image. Selon un exemple de réalisation, l'algorithme suivant est appliqué : Si A+B+C+D>TH alors un indicateur graphique flèche vers le haut est positionné en bas de l'image indiquant que le haut de l'image, en l'occurrence la première ligne de blocs, est une zone d'intérêt perceptuel élevé; Si A+E+I+M>TH alors un indicateur graphique flèche vers la gauche est positionnée à droite de l'image indiquant que la gauche de l'image, en l'occurrence la première colonne de blocs, est une zone d'intérêt perceptuel élevé; Si M+N+O+P>TH alors un indicateur graphique flèche vers le bas est positionné en haut de l'image indiquant que le bas de l'image, en l'occurrence la dernière ligne de blocs, est une zone d'intérêt perceptuel élevé; Si D+H+L+P>TH alors un indicateur graphique flèche vers la droite est positionné à gauche de l'image indiquant que la droite de l'image, en l'occurrence la dernière colonne de blocs, est une zone d'intérêt perceptuel élevé comme illustré sur la figure 4; Dans le cas où (F+G+J+K)>TH, alors le centre de l'image a un intérêt perceptuel élevé par rapport au reste de l'image. Dans ce cas, 4 flèches pointant vers le centre de l'image sont superposées à l'image comme illustrée par la figure 5. Ces 4 flèches peuvent être remplacées par un indicateur graphique particulier, par exemple une croix positionnée au centre de l'image. En revanche, si la quasi-totalité de l'image a un intérêt perceptuel élevé, il est avantageux d'indiquer au caméraman que celui-ci doit effectuer une opération de zoom-out afin de restituer la zone d'intérêt perceptuel élevé dans son contexte. A cet effet, 4 flèches pointant vers l'extérieur de l'image sont superposées à l'image. Selon un autre mode de réalisation, l'indicateur graphique est un disque de taille variable représenté en transparence sur l'image comme illustrée sur la figure 6. Cet indicateur graphique est positionné dans l'image de telle sorte qu'il soit centré sur le pixel auquel est associée la donnée d'intérêt perceptuel la plus élevée. Si plusieurs indicateurs graphiques sont positionnés dans l'image alors ils sont centrés sur les pixels auxquels sont associées les données d'intérêt perceptuel les plus élevées. Selon une caractéristique particulière de l'invention, au moins une caractéristique de l'indicateur graphique est modifiée en fonction d'un taux d'intérêt perceptuel également appelé taux de saillance de saillance. Le taux de saillance associé à une zone de l'image est égale à la somme des données d'intérêt perceptuel associées aux pixels appartenant à cette zone divisée par la somme des données d'intérêt perceptuel associées aux pixels de toute l'image. Ainsi, l'épaisseur du contour du cercle peut être modulée en fonction du taux de saillance à l'intérieur de ce cercle. Plus l'épaisseur du cercle est grande, plus la zone de l'image à l'intérieure du cercle est saillante par rapport au reste de l'image. Selon une autre variante, représentée sur la figure 7, le disque est remplacé par un rectangle de taille variable. Dans ce cas, la largeur et/ou la longueur du rectangle est modifiée en fonction du taux de couverture de saillance. Selon une autre variante, l'indicateur graphique est une carte de chaleur représentée en transparence sur l'image comme illustrée sur la figure 8. Selon une autre variante, l'indicateur graphique est un carré de taille prédéfinie. Par exemple, les n pixels les plus saillants, i.e. ayant une donnée d'intérêt perceptuel élevée, sont identifiés. Le barycentre de ces n pixels est calculé, les pixels étant pondérés par leur donnée d'intérêt perceptuel respective. Un carré est alors positionné sur l'image affichée (carré clair positionné sur le ventre du golfeur sur la figure 9) de telle sorte qu'il soit centré sur le barycentre. En référence à la figure 10, l'invention concerne également un dispositif de capture d'images 3 telle une caméra numérique comprenant un dispositif d'aide à la capture d'image 1 selon l'invention, un viseur 2et une interface de sortie 4. Le dispositif de capture d'images comprend d'autres composants bien connus de l'homme du métier telle des mémoires, bus pour le transfert des données, etc, qui ne sont pas représentée sur la figure 10. Une scène est filmée à l'aide du dispositif de capture d'image 3. Le caméraman observe la scène au travers du viseur 2, plus particulièrement, il visualise au travers du viseur 2 une image qui est analysée par le module 10 du dispositif d'aide à la capture d'image 1. Le module 20 du dispositif d'aide à la capture d'image 1 affiche ensuite, sur le viseur 2, au moins un indicateur graphique lequel se superpose à l'image visualisée au travers du viseur 2. Par ailleurs, les images visualisées au travers du viseur 2 sont ensuite capturées par le dispositif de capture d'images 3 et stockées en mémoire dans le dispositif de capture d'images 3 ou transmises directement à un module de stockage distant ou à une application distante au travers de l'interface de sortie 4. L'affichage de tels indicateurs graphiques sur le viseur 2 permet au caméraman qui filme la scène de déplacer sa caméra afin de centrer dans l'image visualisée sur le viseur 2 les zones visuellement importantes de la scène filmée. Sur la figure 4, une flèche pointant vers la droite est positionnée sur la gauche de l'image. Cette flèche indique avantageusement au caméraman en train de filmer une scène de golf que la zone d'intérêt perceptuel élevé, en l'occurrence le golfeur, se situe sur la droite de l'image. Cela lui indique la manière dont il doit déplacer sa caméra pour que la zone d'intérêt perceptuel élevée soit au centre de l'image filmée. Sur la figure 5, les 4 flèches indiquent au caméraman qu'il doit effectuer une opération de zoom in. Les indicateurs graphiques permettent avantageusement au caméraman de s'assurer que les zones d'intérêt perceptuel élevé dans une scène seront présentes dans les images capturées. Ils permettent en outre au caméraman de s'assurer que ces zones sont centrées dans les images capturées. En outre, en modulant certains paramètres des indicateurs graphiques ils permettent au caméraman de hiérarchiser les zones d'intérêt perceptuel élevé en fonction de leur taux de saillance respectifs. Selon un mode de réalisation particulier, l'indicateur graphique est un cadre de taille prédéfinie. Selon l'invention, le cadre affiché sur le viseur 2 est superposé à l'image de telle sorte qu'il soit centré sur une zone de l'image ayant un intérêt perceptuel élevé. Cet indicateur graphique est avantageusement utilisé pour représenter sur une image capturée au format 16/9, un cadre au format 4/3 comme illustré par la figure 11. Le cadre au format 4/3 est une aide pour le caméraman. En effet, le caméraman peut utiliser cette information supplémentaire pour cadrer correctement la scène de telle sorte qu'un film au format 4/3 généré à partir du format 16/9 capturé par le dispositif de capture d'images soit pertinent, i.e. notamment que les zones d'intérêt perceptuel élevé dans la scène soient également présentent dans les images au format 4/3. Cet indicateur graphique permet donc au caméraman d'améliorer la prise de vue lorsqu'il sait que le contenu vidéo capturé au format 16/9 sera par la suite converti au format 4/3. A l'inverse sur la figure 12, une image est capturée au format 4/3 et un cadre au format 16/9 se superposant à l'image est affiché sur le viseur 2. Bien entendu l'invention n'est pas limitée au cas des seuls formats 16/9 et 4/3. Elle peut s'appliquer à d'autres formats. Par exemple, le cadre au format 4/3 peut être remplacé par un cadre au format 1/1, lorsque la scène filmée doit être convertie par la suite au format 1/1 pour être diffusé par exemple sur un réseau mobile.
Bien entendu, l'invention n'est pas limitée aux exemples de réalisation mentionnés ci-dessus. En particulier, l'homme du métier peut apporter toute variante dans les modes de réalisation exposés et les combiner pour bénéficier de leurs différents avantages. Notamment, tout autre indicateur graphique que ceux mentionnés précédemment peut être utilisé, comme par exemple une ellipse, un parallélogramme, une croix ... D'autre part les indicateurs graphiques peuvent être affichés en surimpression sur un écran de contrôle externe au dispositif de capture d'images au lieu d'être affichés sur le viseur d'un dispositif de capture d'images.

Claims (12)

Revendications
1. Dispositif d'aide à la capture d'images (1) caractérisé en ce qu'il comprend : - des moyens d'analyse (20) aptes à calculer des données d'intérêt perceptuel pour des zones d'une image devant être capturée; - des moyens d'affichage (30) aptes à superposer à ladite image au moins un 10 indicateur graphique indiquant la position d'au moins une zone d'intérêt dans ladite image.
2. Dispositif selon la revendication 1, dans lequel lesdits moyens d'analyse (20) sont adaptés pour calculer une donnée d'intérêt perceptuel pour chaque 1.5 pixel de ladite image.
3. Dispositif selon la revendication 2, dans lequel ledit indicateur graphique est superposé sur ladite image de telle sorte qu'il soit centré sur le pixel de l'image dont la donnée d'intérêt perceptuel est la plus élevée.
4. Dispositif selon la revendication 1, dans lequel ladite image étant divisée en blocs de pixels lesdits moyens d'analyse (20) sont adaptés pour calculer une donnée d'intérêt perceptuel pour chaque bloc de ladite image. 25
5. Dispositif selon la revendication 4, dans lequel l'indicateur graphique est une flèche pointant vers au moins un bloc dont la donnée d'intérêt perceptuel est supérieure à un seuil prédéfini.
6. Dispositif selon la revendication 2, dans lequel les moyens d'affichage (30) 30 sont en outre aptes à modifier au moins un paramètre dudit au moins un indicateur graphique en fonction d'un taux d'intérêt perceptuel associée à la zone de l'image couverte par ledit indicateur graphique. 20
7. Dispositif selon la revendication 6, dans lequel le taux d'intérêt perceptuel est égal au rapport entre la somme des données d'intérêt perceptuel associées aux pixels de l'image couvert par l'indicateur graphique et la somme des données d'intérêt perceptuel associés à tous les pixels de l'image.
8. Dispositif selon les revendications 6 ou 7, dans lequel l'indicateur graphique est un cercle dont l'épaisseur est proportionnelle au taux d'intérêt perceptuel.
9. Dispositif selon la revendication 1, dans lequel l'indicateur graphique appartient au groupe comprenant : - uncercle; - un rectangle - une flèche ; et - une croix.
10. Dispositif de capture d'images (3) comprenant : - un dispositif d'aide à la capture d'images (1) selon l'une des revendications précédentes ; et - un viseur (2); ledit indicateur graphique étant affiché par ledit dispositif d'aide à la capture d'images (1) sur ledit viseur (2).
11. Dispositif selon la revendication 10, lequel est apte à capturer des images 25 d'un premier format prédéfini et dans lequel ledit indicateur graphique est un cadre définissant un second format prédéfini différent dudit premier format.
12. Dispositif selon la revendication 11, dans lequel ledit premier format et ledit second format appartient au groupe comprenant : 30 - le format 16/9 ; et - le format 4/3.
FR0760170A 2007-12-20 2007-12-20 Dispositif d'aide a la capture d'images Withdrawn FR2925705A1 (fr)

Priority Applications (7)

Application Number Priority Date Filing Date Title
FR0760170A FR2925705A1 (fr) 2007-12-20 2007-12-20 Dispositif d'aide a la capture d'images
PCT/EP2008/067685 WO2009080639A2 (fr) 2007-12-20 2008-12-17 Dispositif d'assistance à la capture d'images
CN2008801217969A CN101903828B (zh) 2007-12-20 2008-12-17 帮助捕获图像的设备
EP08863889.5A EP2232331B1 (fr) 2007-12-20 2008-12-17 Dispositif d'assistance à la capture d'images
US12/735,073 US20100259630A1 (en) 2007-12-20 2008-12-17 Device for helping the capture of images
JP2010538693A JP5512538B2 (ja) 2007-12-20 2008-12-17 画像取り込み支援装置
KR1020107016017A KR101533475B1 (ko) 2007-12-20 2008-12-17 이미지들의 캡쳐를 돕는 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0760170A FR2925705A1 (fr) 2007-12-20 2007-12-20 Dispositif d'aide a la capture d'images

Publications (1)

Publication Number Publication Date
FR2925705A1 true FR2925705A1 (fr) 2009-06-26

Family

ID=39714057

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0760170A Withdrawn FR2925705A1 (fr) 2007-12-20 2007-12-20 Dispositif d'aide a la capture d'images

Country Status (7)

Country Link
US (1) US20100259630A1 (fr)
EP (1) EP2232331B1 (fr)
JP (1) JP5512538B2 (fr)
KR (1) KR101533475B1 (fr)
CN (1) CN101903828B (fr)
FR (1) FR2925705A1 (fr)
WO (1) WO2009080639A2 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6015267B2 (ja) * 2012-09-13 2016-10-26 オムロン株式会社 画像処理装置、画像処理プログラム、これを記録したコンピュータ読み取り可能な記録媒体、および、画像処理方法
US9344626B2 (en) 2013-11-18 2016-05-17 Apple Inc. Modeless video and still frame capture using interleaved frames of video and still resolutions
US10136804B2 (en) * 2015-07-24 2018-11-27 Welch Allyn, Inc. Automatic fundus image capture system
CN108139758A (zh) * 2015-10-09 2018-06-08 深圳市大疆创新科技有限公司 基于显著性特征的载运工具定位
JP6988146B2 (ja) * 2016-05-25 2022-01-05 ソニーグループ株式会社 演算処理装置及び演算処理方法
CN114598833B (zh) * 2022-03-25 2023-02-10 西安电子科技大学 基于时空联合注意力的视频插帧方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020191861A1 (en) * 2000-12-22 2002-12-19 Cheatle Stephen Philip Automated cropping of electronic images
JP2005341449A (ja) * 2004-05-31 2005-12-08 Toshiba Corp デジタルスチルカメラ
EP1695288A1 (fr) * 2003-12-18 2006-08-30 Thomson Licensing Dispositif et procede de creation d'une carte de relief d'une image
JP2006285475A (ja) * 2005-03-31 2006-10-19 Mimi:Kk デジタルカメラ機能を利用した多次元的デジタル画像複合処理インターフェイス技術
EP1748385A2 (fr) * 2005-07-28 2007-01-31 THOMSON Licensing Procédé et dispositif générant une séquence image de taille réduite
DE102005041633A1 (de) * 2005-08-26 2007-03-29 Adam Stanski Verfahren und Vorrichtung zur Positions- und Ähnlichkeitsbestimmung von Objektpunkten in Bildern

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02185240A (ja) * 1988-12-27 1990-07-19 Univ Chicago 画像処理方法及び装置
JP2000237176A (ja) * 1999-02-17 2000-09-05 Fuji Photo Film Co Ltd 放射線画像表示方法および装置
JP2001204729A (ja) * 2000-01-31 2001-07-31 Toshiba Corp 超音波画像診断装置
JP2001298453A (ja) * 2000-04-14 2001-10-26 Fuji Xerox Co Ltd ネットワーク表示装置
US20020126990A1 (en) * 2000-10-24 2002-09-12 Gary Rasmussen Creating on content enhancements
JP2003185458A (ja) * 2001-12-14 2003-07-03 Denso Corp ナビゲーション装置、プログラム
KR100643269B1 (ko) * 2004-01-13 2006-11-10 삼성전자주식회사 Roi를 지원하는 영상 코딩 방법 및 장치
JP4168940B2 (ja) * 2004-01-26 2008-10-22 三菱電機株式会社 映像表示システム
WO2006082967A1 (fr) * 2005-02-07 2006-08-10 Matsushita Electric Industrial Co., Ltd. Dispositif d’imagerie
JP4839872B2 (ja) * 2005-02-14 2011-12-21 コニカミノルタホールディングス株式会社 画像形成装置、画像形成方法及び画像形成プログラム
JP2006271870A (ja) * 2005-03-30 2006-10-12 Olympus Medical Systems Corp 内視鏡用画像処理装置
JP2006303961A (ja) * 2005-04-21 2006-11-02 Canon Inc 撮像装置
JP4929630B2 (ja) * 2005-07-06 2012-05-09 ソニー株式会社 撮像装置、制御方法、およびプログラム
TW200719281A (en) * 2005-07-28 2007-05-16 Thomson Licensing Method and device for generating a sequence of images of reduced size
EP1966648A4 (fr) * 2005-12-30 2011-06-15 Nokia Corp Procede et dispositif de reglage de l'autofocalisation d'une camera video par suivi d'une region d'interet
FR2897183A1 (fr) * 2006-02-03 2007-08-10 Thomson Licensing Sas Procede de verification des zones de saillance d'un document multimedia, procede de creation d'un document publicitaire, et produit programme d'ordinateur
US8194947B2 (en) * 2006-11-21 2012-06-05 Hologic, Inc. Facilitating comparison of medical images
US8126267B2 (en) * 2007-02-05 2012-02-28 Albany Medical College Methods and apparatuses for analyzing digital images to automatically select regions of interest thereof
US8237807B2 (en) * 2008-07-24 2012-08-07 Apple Inc. Image capturing device with touch screen for adjusting camera settings
US8913176B2 (en) * 2008-09-05 2014-12-16 Lg Electronics Inc. Mobile terminal and method of performing multi-focusing and photographing image including plurality of objects using the same

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020191861A1 (en) * 2000-12-22 2002-12-19 Cheatle Stephen Philip Automated cropping of electronic images
EP1695288A1 (fr) * 2003-12-18 2006-08-30 Thomson Licensing Dispositif et procede de creation d'une carte de relief d'une image
JP2005341449A (ja) * 2004-05-31 2005-12-08 Toshiba Corp デジタルスチルカメラ
JP2006285475A (ja) * 2005-03-31 2006-10-19 Mimi:Kk デジタルカメラ機能を利用した多次元的デジタル画像複合処理インターフェイス技術
EP1748385A2 (fr) * 2005-07-28 2007-01-31 THOMSON Licensing Procédé et dispositif générant une séquence image de taille réduite
DE102005041633A1 (de) * 2005-08-26 2007-03-29 Adam Stanski Verfahren und Vorrichtung zur Positions- und Ähnlichkeitsbestimmung von Objektpunkten in Bildern

Also Published As

Publication number Publication date
EP2232331B1 (fr) 2022-02-09
CN101903828A (zh) 2010-12-01
JP2011509003A (ja) 2011-03-17
KR101533475B1 (ko) 2015-07-02
EP2232331A2 (fr) 2010-09-29
KR20100098708A (ko) 2010-09-08
US20100259630A1 (en) 2010-10-14
CN101903828B (zh) 2013-11-13
WO2009080639A2 (fr) 2009-07-02
WO2009080639A3 (fr) 2009-10-01
JP5512538B2 (ja) 2014-06-04

Similar Documents

Publication Publication Date Title
Wronski et al. Handheld multi-frame super-resolution
US10015469B2 (en) Image blur based on 3D depth information
KR102480245B1 (ko) 패닝 샷들의 자동 생성
EP3134868B1 (fr) Génération et utilisation d'une image de radon tridimensionnelle (3d)
Mustaniemi et al. Gyroscope-aided motion deblurring with deep networks
FR2925705A1 (fr) Dispositif d'aide a la capture d'images
FR2890517A1 (fr) Procede et dispositif d'affichage d'images
US20120068996A1 (en) Safe mode transition in 3d content rendering
US9300857B2 (en) Real-time sharpening of raw digital images
CN107690673A (zh) 图像处理方法、装置及服务器
EP2909671B1 (fr) Procede de conception d'un imageur monovoie passif capable d'estimer la profondeur de champ
KR101470833B1 (ko) 전달률 하한치를 이용한 안개영상 개선 장치
Mandl et al. Neural cameras: Learning camera characteristics for coherent mixed reality rendering
CA2914360A1 (fr) Systemes de reperage de la position de la camera de tournage pour le tournage de films video
Popovic et al. Design and implementation of real-time multi-sensor vision systems
FR3052565B1 (fr) Dispositif individuel d'immersion visuelle pour personne en mouvement
Muniraj et al. Subpixel based defocused points removal in photon-limited volumetric dataset
EP2987319A1 (fr) Procede de generation d'un flux video de sortie a partir d'un flux video large champ
CN114007056A (zh) 一种立体全景图像的生成方法和装置
JP6006506B2 (ja) 画像処理装置及び画像処理方法、プログラム、並びに記憶媒体
JP2009245406A (ja) 画像処理装置およびそのプログラム
Yu et al. Racking focus and tracking focus on live video streams: a stereo solution
CN112995514B (zh) 一种工业相机的拍照物距的获取方法及设备
Anthes Smarter photography
EP2678823B1 (fr) Dispositif et procédé de gestion de la position du plan focal dans une scène stéréoscopique

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20120831