ES2535113T3 - Procedimiento de clasificación de objetos en un sistema de observación por imágenes - Google Patents

Procedimiento de clasificación de objetos en un sistema de observación por imágenes Download PDF

Info

Publication number
ES2535113T3
ES2535113T3 ES10798992.3T ES10798992T ES2535113T3 ES 2535113 T3 ES2535113 T3 ES 2535113T3 ES 10798992 T ES10798992 T ES 10798992T ES 2535113 T3 ES2535113 T3 ES 2535113T3
Authority
ES
Spain
Prior art keywords
image
vision
mdt
sensor
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10798992.3T
Other languages
English (en)
Inventor
Jérôme Fournier
Alain Simon
Etienne Payot
Gilles Henaff
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thales SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thales SA filed Critical Thales SA
Application granted granted Critical
Publication of ES2535113T3 publication Critical patent/ES2535113T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

Procedimiento de clasificación de un objeto presente en una imagen obtenida por un sistema (100) de observación por imágenes que consta de un sensor, que comprende una etapa de extracción del objeto a clasificar en la imagen, caracterizado porque consta de una etapa de clasificación del objeto a partir de una base de conocimientos: - constando dicha base de conocimientos de varias clases que constan cada una de un conjunto de objetos representados por una etiqueta y un conjunto de características entre las que están la información contextual de fondo de imágenes, resultantes de un tratamiento alimentado por un Modelo Digital del Terreno (2), denominado MDT, y - que comprende unas reglas de decisión asociadas a estos fondos de imágenes, comprendiendo esta etapa de clasificación las siguientes subetapas: - adquisición mediante unos medios (10) de posicionamiento del sistema, de la posición geográfica del sensor del dispositivo (1) de obtención de imágenes durante la adquisición de la imagen; - alimentación del sistema de observación mediante el MDT, extracción en el MDT de una zona de interés asociada a esta posición; - estimación de la altitud del sensor del dispositivo de obtención de imágenes durante la adquisición de la imagen, mediante unos medios de medición de altitud; - determinación de las elevaciones del terreno en un sector compatible del campo de visión del dispositivo de obtención de imágenes, en función de dicha altitud y de dicha zona de interés; - proyección en el campo de visión de una segmentación del campo de visión a partir de las elevaciones del terreno; - a partir de esta segmentación del campo de visión y de la posición del objeto en este campo de visión, determinación del fondo de imágenes asociado al objeto que hay que clasificar; - aplicación de las reglas de decisión (32) asociadas a este fondo.

Description

5
10
15
20
25
30
35
40
45
50
55
E10798992
16-04-2015
DESCRIPCIÓN
Procedimiento de clasificación de objetos en un sistema de observación por imágenes
El campo de la invención es el de la clasificación de objetos en los sistemas de observación por imágenes.
El problema planteado en la presente solicitud es el de la discriminación entre diferentes objetos. La variedad de los objetos y de los fondos presentes en las escenas naturales tratadas es muy grande y es complicado discernir los objetos, más aún porque su distancia y eventualmente su velocidad radial cuando estos objetos son móviles no se conocen con las adquisiciones realizadas en imágenes pasivas. Por ejemplo, a larga distancia, los barcos pueden ser muy parecidos (velocidades radiales cercanas, movimiento casi rectilíneo uniforme, niveles de intensidad cercanos, etc.) a los aviones. Por otra parte, los objetos de interés se deben tratar potencialmente a gran distancia lo que augura bajas resoluciones y, por lo tanto, una información que no es necesariamente muy rica para tomar una decisión de clasificación. Además, las condiciones de la toma de imagen (condiciones meteorológicas, condiciones día/noche, reflejos, deslumbramiento,…) modifican la señal sobre estos objetos, complicando aun más la tarea de discriminación.
Las técnicas de clasificación funcionan representando los objetos mediante un conjunto de características (velocidad, SNR, intensidad, firmas de forma…). Estas definen uno o varios espacios de características multidimensionales en los que se proyectan las características extraídas de los objetos, formando de este modo unas “nubes de puntos” o clases de las que hay que encontrar las fronteras. Estas fronteras se “aprenden” basándose en un conjunto de objetos de referencia también llamado conjunto de aprendizaje, del que conocemos el tipo real (es decir que la naturaleza de las clases se conoce a priori y sin ambigüedad). Cuanto mejores son las características y cuanto más separadas están las nubes de puntos formadas por las diferentes clases de interés, más discriminantes son las fronteras encontradas. Del mismo modo, cuanto más grande es la variedad de los objetos y más grande es el número de clases, más complicado es caracterizarlos bien y, por lo tanto, discriminarlos. Las reglas que permiten decidir la pertenencia o no de un objeto a una clase son el resultado del aprendizaje.
Se llama clasificador (o experto) a un programa informático cuya función es decidir a qué clase pertenece un nuevo objeto suministrado en la entrada, en función de la información aprendida. La clase de pertenencia se determina mediante la aplicación de las reglas de decisión (también llamadas base de conocimientos) todas las que se han aprendido previamente en los datos de aprendizaje.
La clasificación de un nuevo objeto supone, por lo tanto, que las reglas de decisión se han elaborado previamente.
En primer lugar, se considera la elaboración de esta base de conocimientos. Esta se basa en un conjunto de ejemplos conocidos llamados prototipos. Los prototipos se representan a menudo mediante unos vectores de características en los que cada componente es una medición hecha sobre los objetos reales o sobre uno de sus atributos cualitativos. Cada característica se convierte, por lo tanto, en un eje en un espacio cuya dimensión es igual a la multiplicidad del conjunto de las características. Un prototipo es un punto proyectado en este espacio y esta serie de mediciones, o el conjunto de las características de un prototipo, forma una representación del objeto real y constituye su firma. La dificultad aquí es encontrar “buenas” características que permiten que más adelante el clasificador reconozca fácilmente las diferentes clases de objetos: se dice entonces que estas son discriminantes.
La fase de aprendizaje consiste en escindir (o separar) el espacio de representación por medio de las fronteras y en asignar etiquetas de clase a las zonas así formadas. La elaboración de la base de conocimientos (o el aprendizaje de los clasificadores) consiste, por lo tanto, en buscar estas fronteras de decisión. La zona en la que se encuentra un vector de características determina su clase de pertenencia.
Existen varios métodos para definir un determinado número de reglas que indican la pertenencia o no a una clase. Se pueden descomponer estos métodos en dos grandes familias, una que utiliza un enfoque denominado estructural y la otra un enfoque estadístico.
El enfoque estructural utiliza la topología de las estructuras elementales de los objetos (la forma se describe en forma de estructuras elementales y de relaciones entre estas estructuras) para definir estas reglas; por ejemplo, en reconocimiento sintáctico, una palabra se representa por unas letras ordenadas en un orden preciso. De este modo, forman parte de esta categoría de métodos los árboles de decisión, los sistemas expertos y los programas de análisis sintáctico.
Por lo general, no es posible construir una partición perfecta del espacio como se ilustra en el ejemplo de la figura 1. Las tres clases de objetos respectivamente etiquetadas “et1”, “et2” y “et3”, que están representadas por medio de dos características, velocidad e intensidad del objeto, están claramente delimitadas por las tres fronteras “frontera1”, “frontera2” y “frontera3”. Según un enfoque estadístico, las fronteras de decisión se aprenden a partir del conjunto (o base) de aprendizaje que se considera estadísticamente representativo de la distribución real de las clases; de ahí el importante papel que desempeñan los objetos de referencia de esta base. Este enfoque se basa en unas características que tienen la forma de un vector de valores numéricos (por lo general reales).
La definición de estas reglas de pertenencia es el resultado, como se va a ver, de un cierto equilibrio.
E10798992
16-04-2015
Un objeto o una observación a clasificar (en una etapa posterior, cuando ya se haya establecido la base de conocimientos), se vuelve por lo tanto un punto en el espacio de las características. El conocimiento de la distribución espacial de las clases permite teóricamente categorizar y, por lo tanto, reconocer instantáneamente los objetos así representados. Las fronteras que separan las clases en el espacio de las características, denominadas
5 fronteras de decisión y que se derivan de estas reglas de pertenencia, deben por lo tanto ser el resultado de un cierto compromiso entre el poder de generalización y el de memorización. Por generalización, se entiende la capacidad de un clasificador para reconocer correctamente nuevas observaciones, mientras que la memorización es su capacidad para clasificar correctamente los ejemplos que le han servido como aprendizaje. El aprendizaje de los clasificadores estadísticos es, por lo tanto, una búsqueda de estas fronteras de decisión.
10 Existen varios tipos de características relativas a una descripción:
-local: se han propuesto numerosos algoritmos para desarrollar descriptores invariantes a los cambios de escala y a las transformaciones análogas;
-de forma: si la información radiométrica es significativa, muchos objetos o clases de objetos se caracterizan por su forma. Si se toma, por ejemplo, la clase de los humanos, es imposible contentarse con la información sobre 15 niveles de gris y es necesario describir la forma de las siluetas. Por ejemplo, se puede describir esta forma a
partir de las derivadas espaciales 2D, de los contornos 2D o incluso de la forma 3D;
-de textura: la descripción de la textura se combina con unos algoritmos de clasificación no supervisada o de forma más general con unos algoritmos que describen las distribuciones de datos. Es entonces posible obtener una descripción de textura adecuada que es discriminante e invariante a las transformaciones de imagen. La
20 utilización de una gran cantidad de imágenes de aprendizaje permite establecer un modelo de texturas reales como, por ejemplo, la hierba y el follaje y, por lo tanto, establecer un modelo de determinados tipos de imágenes, como por ejemplo las escenas naturales de exterior.
Las características se basan, por lo general, en mediciones locales realizadas sobre el objeto que hay que reconocer. Los descriptores de textura o los métodos de tipo “bag of words” (J. Ponce, M. Hebert, C. Schmid y A.
25 Zisserman (eds.), Toward Category-Level Object Recognition, Springer-Verlag, Lecture Notes in Computer Science, vol. 4.170, en prensa) permiten una cierta consideración del contexto, sin embargo estos enfoques son a menudo caros.
Habiéndose establecido las clases, sus etiquetas y las reglas de pertenencia a estas clases, se considera ahora la etapa de clasificación de un nuevo objeto en una de estas clases; se trata de un problema de clasificación
30 multiclase. Un número elevado de clases hace que estos problemas sean difíciles de resolver y genera una gran complejidad de cálculo.
Existen enfoques estadísticos para resolver los problemas multiclase. Se diferencian dos familias de métodos:
-los métodos convencionales como los K vecinos más cercanos o las redes neuronales que consideran todas las clases a la vez; se trata de métodos multiclase;
35 -los demás métodos combinan unos clasificadores binarios, con estrategias “uno contra todos” o “uno contra uno” cuyos ejemplos se describen respectivamente en las publicaciones “Duda, R., Hart, P. y Stork, D. (2000), Pattern Classification, New York, NY: Wiley-interscience” y “Hastie, T. y Tibshirani, R. (1998), “Classification by pairwise coupling, 1997, Conf. on Advances in neural information processing systems, The MIT Press, vol. 10, págs. 507513".
40 En la estrategia “uno contra todos”, la similitud entre las diferentes clases no se tiene en cuenta. No existe, por lo tanto, una garantía en cuanto a la existencia de una discriminación entre las clases. Esto plantea un auténtico problema de rendimiento del módulo de clasificación. La estrategia “uno contra uno” descompone exhaustivamente imagen1
un problema de Q clases en un problema de clases. Dicha estrategia aumenta de manera importante el número
de clases así como el tiempo de cálculo.
45 Con el fin de mejorar la separación de las clases y la legibilidad del problema de clasificación, el enfoque estructural basado en el árbol de decisión puede ser pertinente. Sin embargo, la construcción de estos árboles es difícil tanto en la elección de los atributos que hay que utilizar para cada nodo del árbol, como en la profundidad del árbol. Además, aunque dicha estructura la puede entender un humano, esta no garantiza una buena discriminación.
Los enfoques mixtos, que combinan árboles de decisión y enfoques estadísticos, han aparecido recientemente en el
50 estado de la técnica y proponen una cascada de clasificadores potenciados; se puede citar “Viola y Jones (2001), Rapid object detection using a boosted cascade of simple features, en IEEE Computer Society Conference on Computer Vision and Pattern Recognition”. La ventaja de dichos métodos es principalmente la de minimizar el tiempo de cálculo empleado en los casos simples y dedicar lo esencial del tratamiento a los casos difíciles. Estos enfoques se utilizan para aplicaciones de clasificación binarias (detección de rostros o de peatones). Sin embargo,
55 se han realizado trabajos para extender estos algoritmos a los problemas de clasificación multiclase. El principal inconveniente de estas técnicas es la dificultad de comprender e interpretar el funcionamiento de estos algoritmos.
5
10
15
20
25
30
35
40
45
50
55
E10798992
16-04-2015
En el campo de la teledetección en el que se busca reconocer la naturaleza de la cobertura natural de la escena observada, existen aplicaciones que utilizan un Modelo Digital del Terreno (o MDT) acoplado a una clasificación (supervisada o no supervisada). Se busca en este caso reconocer el tipo de cobertura natural de la escena (glaciar, lago, bosque, campo…) y no de los objetos de interés en la escena.
En el campo de la observación por imágenes, los métodos de clasificación de blancos apenas se describen. La mayoría de los enfoques presentados se basa en los modelos de evolución de seguimiento y de las funciones de creencia. Cuando la tarea de discriminación es difícil, el equilibrio tiempo de cálculo / rendimientos es difícil de obtener.
El objetivo de la invención es resolver estos inconvenientes.
El principio de la invención consiste en subdividir el problema global de clasificación en diferentes subproblemas correspondientes a los diferentes tipos de fondos a los que pertenecen los objetos.
Para ello, se utiliza como nueva característica del objeto, el tipo de fondo al que pertenece, por ejemplo fondo de mar, fondo de tierra, fondo de cielo, línea de cresta o línea de horizonte. Esta información se calcula mediante la utilización de un Modelo Digital del Terreno (MDT), del conocimiento de la información de navegación (posición geográfica y altitud del sensor del sistema de imágenes) y de la dirección espacial en la que se ve el objeto.
Para una zona de interés centrada en el sistema, se determinan en una primera fase las elevaciones del terreno y se proyectan en el campo de visión las líneas de lado y líneas de cresta, lo que permite segmentar el campo de visión como se ha especificado más arriba. Hay que señalar que, cuando la plataforma se desplaza y/o el sensor se ve sometido a variaciones de altitud, el campo de visión del sensor es, con el tiempo, más ancho que su campo de visión instantáneo. El campo en el que se realiza el cálculo, en particular en elevación, tiene en cuenta este hecho.
Por medio de esta nueva característica, se puede posicionar un objeto en un tipo de fondo particular y aplicarle unas reglas de decisión adaptadas basándose en un conocimiento específico de este fondo. Dicho de otro modo, para un tipo de fondo particular, la variedad de los objetos se reduce con respecto al problema global, la caracterización de los datos es menos complicada y la discriminación es mejor, reduciéndose las ambigüedades entre objetos a los objetos que pertenecen a unos fondos comunes.
De manera más precisa, la invención tiene por objeto un procedimiento de elaboración de una base de conocimientos de imágenes obtenidas mediante un dispositivo de obtención de imágenes provisto de un sensor, que comprende una etapa de definición de N clases constando cada una de un conjunto de objetos representados por una etiqueta y un conjunto de características, y una etapa de aprendizaje de reglas de decisión asociadas a estas clases. Se caracteriza principalmente porque comprende, además, las siguientes etapas:
-definición de K información contextual de fondo de imagen fk, variando k de 1 a K y K>1; -asociación de una de estas informaciones de fondo de imagen fk a cada objeto; -distribución de los objetos en M nuevas clases, siendo N < M ≤ KxN, constando cada una de un conjunto de
objetos representados por una nueva etiqueta que incluye una antigua etiqueta y una de dichas informaciones de
fondo de imagen fk y el conjunto de las características de estos objetos; -definición para cada fondo fk de un subconjunto Qk de estas M clases asociadas a este fondo de imagen; -aprendizaje de reglas de decisión para cada uno de estos subconjuntos Qk.
Según una característica de la invención, al ser los fondos de imagen unos fondos determinados sin ambigüedad, la información de fondo de imagen fk se refieren, además, a información sobre zonas fronterizas entre dos de dichos fondos determinados sin ambigüedad, determinándose la anchura de estas zonas fronterizas en función de errores predeterminados en el MDT y/o la posición del sensor y/o su altitud.
Un operario va a decidir segmentar el problema en varios subproblemas que se relacionan con diferentes fondos (por ejemplo: tierra/mar). Sin embargo, el cálculo de la información de pertenencia a uno o a otro tipo de fondo (pertenencia binaria o probabilística) bien lo fija un operario o bien incluso se calcula automáticamente utilizando el MDT.
La invención también tiene por objeto un procedimiento de clasificación de un objeto presente en una imagen obtenida por un sistema de observación por imágenes, que comprende una etapa de extracción del objeto que hay que clasificar en la imagen, caracterizado porque consta de una etapa de clasificación del objeto a partir de una base de conocimientos tal como se ha descrito con anterioridad, que comprende las siguientes subetapas:
-adquisición, mediante unos medios de posicionamiento del sistema, de la posición geográfica del sensor del
dispositivo de obtención de imágenes durante la adquisición de la imagen; -alimentación del sistema de observación mediante el Modelo Digital del Terreno y extracción en el MDT de una
zona de interés asociada a esta posición; -estimación de la altitud del sensor del dispositivo de obtención de imágenes durante la adquisición de la imagen,
mediante unos medios de medición de altitud, filtrándose de manera ventajosa estas mediciones; -determinación de las elevaciones del terreno en un sector compatible con el campo de visión del dispositivo de
E10798992
16-04-2015
obtención de imágenes, en función de dicha altitud y de dicha zona de interés; -proyección en el campo de visión del sensor de la información contextual de fondo para segmentar el campo de visión; -determinación del fondo fk asociado al objeto que hay que clasificar; 5 -aplicación de unas reglas de decisión del subconjunto asociado a este fondo, siendo estas reglas el resultado del procedimiento de elaboración de una base de conocimientos como se ha descrito con anterioridad.
Cuando el MDT no suministra información de elevación de terreno para algunas posiciones del sensor (en las zonas cubiertas por agua, por ejemplo), la etapa de extracción en el MDT de una zona de interés comprende una etapa previa para completar dicho MDT mediante información de elevación de terreno asociadas a estas posiciones
10 (altitudes nulas o valores mínimos o medios de las zonas adyacentes).
Por último, la invención se refiere a un sistema de observación por imágenes que comprende un dispositivo de obtención de imágenes provisto de un sensor, unos medios de posicionamiento del dispositivo de obtención de imágenes, unos medios de almacenamiento en los que se almacenan los archivos de un Modelo Digital del Terreno y una unidad de tratamiento que consta de unos medios de implementación del procedimiento de clasificación tal
15 como se ha descrito con anterioridad.
La solución propuesta permite mejorar los rendimientos del sistema reduciendo la complejidad de la tarea de discriminación de los diferentes tipos de blancos y permitiendo una adaptación del proceso de clasificación al entorno geográfico actual del sistema.
Además, la interpretación de eventuales problemas o errores de clasificación, y en consecuencia la búsqueda de
20 soluciones a estos problemas, se ve facilitada por la reducción del perímetro del problema: el análisis se hace para un tipo de fondo únicamente.
Por último, la ventaja del método es permitir un ahorro de tiempo de cálculo. En efecto, con respecto a un enfoque global (es decir, un enfoque que utiliza una base de aprendizaje que reagrupa todos los tipos de objetos y una caracterización mediante un número importante de atributos), se reduce el tamaño de la base de aprendizaje y el
25 número de características necesarias para la toma de decisión.
Se mostrarán otras características y ventajas de la invención en la lectura de la descripción detallada que viene a continuación, hecha a título de ejemplo no limitativo y en referencia a los dibujos adjuntos, en los que:
la figura 1 representa esquemáticamente un ejemplo de tres clases perfectamente distribuidas en un espacio de dos dimensiones;
30 la figura 2 ilustra esquemáticamente un ejemplo según la invención de distribución de tres clases de origen (N = 3) en seis nuevas clases (M = 6) obtenidas distribuyendo los objetos de cada una de las tres clases de origen en un fondo de cielo y en un fondo de mar; las figuras 3a y 3b representan esquemáticamente unos ejemplos de elevación de terreno (fig. 3a) y de mapa de intervisibilidad (fig. 3b);
35 la figura 4 representa esquemáticamente un ejemplo de sistema de observación por imágenes equipado con unos medios de clasificación según la invención.
De una figura a otra, los mismos elementos se identifican con las mismas referencias.
Se va a describir el procedimiento según la invención en relación con el ejemplo de la figura 2.
40 Se definen N clases (en el ejemplo N = 3) que constan cada una de un conjunto de objetos de referencia representados por una etiqueta (clase1, clase2 y clase3). Estas clases presentan tradicionalmente una baja separabilidad. A estas clases está asociado un conjunto de características (en el ejemplo caract1, caract2) y de reglas de decisión asociadas a estas características.
La siguiente etapa consiste en definir K (K>1) características contextuales, en este caso características de fondo de
45 imagen fk, variando k de 1 a K; en el ejemplo de la figura se trata de un fondo de mar f1, y de un fondo de cielo f2 (K =2).
Se asocia entonces una característica de contexto fk a cada objeto de cada una de las N clases; esto lo lleva a cabo bien un operario, o bien se calcula automáticamente utilizando el MDT. Un objeto barco está, por ejemplo, asociado al fondo de mar, pero no está asociado al fondo de cielo y recíprocamente un avión está asociado al fondo de cielo
50 pero no está asociado al fondo de mar. Se pueden asociar varias características de contexto fk a un mismo objeto. Por su movimiento errático, un pájaro es susceptible de pasar de manera sucesiva en un corto lapso de tiempo de un tipo de fondo de mar a un tipo de fondo de cielo, lo que no es el caso de un avión.
También se pueden definir como información de fondo fk, información sobre zonas fronterizas entre dos fondos determinados sin ambigüedad, determinándose la anchura de estas zonas fronterizas en función de errores
55 predeterminados en el MDT y/o la posición del sensor y/o su altitud.
5
10
15
20
25
30
35
40
45
50
55
E10798992
16-04-2015
A partir de estas características fk y de las N clases de origen, se definen entonces M nuevas clases siendo N < M ≤ K x N. De este modo, cada clase de origen se escinde en subclases en la base de la información contextual de fondo fk, Hay como máximo K subclases para cada clase de origen. Se puede tener M = KxN como en la figura en la que los objetos de tres clases de origen están distribuidos en 6 (tenemos M = KxN = 2x3) nuevas clases: tres nuevas clases para el fondo de cielo y tres nuevas clases para el fondo de mar. Pero también se puede tener M < KxN cuando ninguno de los objetos de una de las N clases de origen está asociado a una o varias de las características de contexto.
Esta distribución se puede realizar por un operario o mediante un aprendizaje automático o eventualmente por ambos.
De este modo, se definen M (en nuestro ejemplo M = 6 siendo K = 2 y N = 3) nuevas clases en las que los objetos de las tres clases de origen se distribuyen en función de las antiguas características y de las nuevas características de contexto. Cada nueva clase está representada por una nueva etiqueta que incluye una antigua etiqueta y una de dichas informaciones de fondo de imagen y el conjunto de características de estos objetos.
Para cada fondo fk se define un subconjunto Qk de estas M clases asociadas a este fondo de imagen. En nuestro ejemplo, se definen dos subconjuntos Q1 y Q2 de 3 clases, uno para el fondo de mar f1, el otro para el fondo de cielo f2. Un subconjunto Qk puede estar vacío cuando, por ejemplo, ningún objeto de una clase de origen está asociado al fondo de imagen fk: ningún objeto barco está asociado al fondo de cielo, por ejemplo.
Las reglas de decisión se establecen de manera convencional para cada uno de estos subconjuntos Qk,
De este modo, se define una nueva base de conocimientos.
Esta solución permite mejorar los rendimientos del sistema de clasificación reduciendo la complejidad de la tarea de discriminación de los diferentes tipos de blancos y permitiendo una adaptación del proceso de clasificación al entorno geográfico actual del sistema.
Además, la interpretación de eventuales problemas o errores de clasificación, y en consecuencia la búsqueda de soluciones se ve facilitada por la reducción de perímetro del problema: el análisis se hace para un tipo de fondo únicamente.
Por último, la ventaja del procedimiento es permitir un ahorro de tiempo de cálculo. En efecto, con respecto a un enfoque global (es decir, un enfoque que utiliza una base de aprendizaje que reagrupa todos los tipos de objetos y una caracterización mediante un número importante de atributos), se reducen el tamaño de la base de aprendizaje y el número de características necesarias para la toma de decisión.
A esta nueva base de aprendizaje de M clases le corresponde un nuevo procedimiento de clasificación de un nuevo objeto.
Comprende, en particular, una etapa que consiste en asociar una información de fondo fk al nuevo objeto. Un objeto puede pertenecer de manera segura a un único tipo de fondo o bien se puede situar en una zona fronteriza ambigua. Para tomar en consideración estas zonas ambiguas, se puede elegir definir la zonas fronterizas tales que “línea de cresta” y “línea horizontal” como nueva información de fondo fk y asociar el objeto a una única información de fondo. Según una alternativa, se puede no completar esta información de fondo por estas zonas fronterizas y asociar el objeto simultáneamente a dos informaciones de fondo fk.
De este modo, por ejemplo, la cinemática de los dos objetos:
-avión, barco puede ser muy cercana al igual que sus intensidades de ahí el riesgo de confusión; pero si el objeto
que hay que clasificar no está demasiado cerca del horizonte, se asociará a una característica de fondo “cielo” o
“mar”, y se orientará hacia las clases en las que no hay ambigüedad avión/barco: en las clases “cielo”, los
aviones son se pueden confundir con los barcos y a la inversa en las clases “mar”, los barcos no se pueden
confundir con aviones; -avión, cresta de ola puede ser muy cercana al igual que sus intensidades de ahí el riesgo de confusión; en las
clases “cielo”, los aviones no se pueden confundir con las crestas de ola y a la inversa en las clases “mar”, las
olas no se pueden confundir con los aviones; -barco, borde de nubes puede ser muy cercana al igual que sus intensidades de ahí el riesgo de confusión; en las
clases “cielo”, los bordes de nube no se pueden confundir con los barcos y a la inversa en las clases “mar”, los
barcos no se pueden confundir con los bordes de nube.
La información de fondo fk asociada al nuevo objeto se calcula a partir de la posición geográfica y de la altitud del dispositivo de imágenes del sistema de observación y mediante el uso de un Modelo Digital del Terreno (MDT). Para una zona de interés centrada en la posición y la dirección de la línea de mira del dispositivo de obtención de imágenes, se determinan en una primera fase las elevaciones del terreno como se ilustra en la figura 3a. Las elevaciones del terreno pueden salir del campo de visión del sensor e incluso del campo en el que se calcula la información, a su vez superior (al menos en elevación) a la extensión del sensor. A continuación se proyecta en el
E10798992
16-04-2015
campo de visión del dispositivo de obtención de imágenes, la información contextual de fondo previamente reunida en los mapas 31 de intervisibilidad en los que se representan las líneas de costa y líneas de cresta como se ilustra en la figura 3b, lo que permite segmentar el campo de visión como se ha especificado más arriba, es decir en función de la información contextual de fondo.
5 Por medio de esta nueva característica fk, el objetivo es situar un objeto en un tipo de fondo particular y aplicarle las reglas de decisión adaptadas definidas durante la elaboración de la nueva base de conocimientos.
La clasificación de un nuevo objeto es por lo general diferida de la elaboración de la base de datos. En el caso, por ejemplo, de un sistema de observación instalado a bordo de una aeronave, la base de conocimientos se elabora en tierra, implementándose el procedimiento de clasificación en vuelo. La base de conocimientos se produce en tierra
10 antes de la misión y la toma de decisión se lleva a cabo durante la misión.
El sistema de observación por imágenes 100 descrito en relación con la figura 4, que está equipado con un dispositivo de clasificación (o clasificador), comprende:
-unos medios 10 de posicionamiento como un sistema de navegación inercial (SNI) y un GPS, solidarios con el dispositivo 1 de obtención de imágenes (eventualmente de imagen pasiva) que sirve para la determinación de las
15 orientaciones angulares de los objetos extraídos de las imágenes y para el posicionamiento del sensor según sus coordenadas geodésicas. Conviene de manera ventajosa conocer los errores en esta información con el fin de poder ponderar la confianza en los resultados de pertenencia que hay que producir.
-un Modelo Digital del Terreno 2 que incluye la zona geográfica cubierta por el sistema de observación. Si el sistema está diseñado para instalarse a bordo de un portador en movimiento, conviene disponer en el disco duro 20 del MDT todas las zonas en las que el sistema debe funcionar.
-Una unidad 3 de tratamiento que integra un microprocesador y que lleva instalado un software encargado de tratar los datos del MDT y del sistema de navegación inercial para posicionar los diferentes objetos que hay que clasificar en los diferentes tipos de fondos y de este modo implementar le procedimiento de clasificación de un nuevo objeto que se va a describir más adelante. Algunas partes del tratamiento se pueden implantar
25 eventualmente en un FPGA.
El método se puede adaptar a la precisión de medición de los sensores inerciales y al nivel de precisión del Modelo Digital del Terreno. El principio no se ve socavado por una evolución de estos últimos, un aumento de la precisión de estos elementos permite, después de una simple reparametrización, ganar precisión de segmentación del campo de visión.
30 El funcionamiento del procedimiento de clasificación de un nuevo objeto es el siguiente:
1. El sistema 10 inercial mide los datos C inerciales siguientes al nivel del dispositivo 1 de obtención de imágenes y los transfiere a la unidad 3 de tratamiento: longitud, latitud, altitud, cabeceo, balanceo y guiñada. Si estos no se conocen a priori y están fijados en la unidad de tratamiento, el sistema inercial también puede suministrar los valores de las incertidumbres sobre las anteriores mediciones.
35 2. La unidad 3 de tratamiento recibe los datos inerciales C, extrae la longitud y la latitud A; según una variante, la unidad de tratamiento recibe directamente una posición geográfica A de los medios 10 de posicionamiento como un GPS. A partir de esta posición A, se determina una zona B de interés (zona geográfica centrada en el sistema) y se extraen entonces los datos de altitud correspondiente a la zona B de interés de los archivos del Módulo Digital del Terreno 2, almacenados en los medios de almacenamiento (disco duro tradicionalmente). De
40 preferencia, cuando no hay datos de altitud para algunas zonas B de interés, tales como zonas cubiertas por agua, la unidad 3 de tratamiento determina artificialmente para estas zonas, unos datos de altitud mediante 0 o mediante los valores mínimos o medios de las zonas adyacentes.
3. La unidad 3 de tratamiento extrae el dato de altitud del sensor de los datos inerciales C y lo utiliza conjuntamente con la zona B de interés para construir, por proyección, un mapa 31 de intervisibilidad (para cada
45 dirección observada, este mapa proporciona el tipo de fondo visible) para todo el campo de visión. Este mapa 31 de intervisibilidad se ilustra en la figura 3b.
4. La unidad 3 de tratamiento extrae los datos cabeceo, balanceo y guiñada de los datos inerciales C y los utiliza conjuntamente con la altitud del sensor para referenciar los objetos en el mismo punto de referencia angular que el mapa 31 de intervisibilidad.
50 5. La unidad 3 de tratamiento deduce de esto el tipo de fondo fk al que pertenece el objeto durante la clasificación y, en función de esta última información, le aplica las reglas de decisión del clasificador 32 que se aplican sobre este tipo de fondo y definidas durante la elaboración de la nueva base de conocimientos.
La frecuencia de las operaciones 1, 2, 3, por una parte, y de las operaciones 4, 5, por otra parte, puede diferir según las necesidades de la aplicación (portadores en movimiento, frecuencias de las peticiones de clasificación, etc.). Una
55 necesidad típica es una baja frecuencia temporal para las operaciones 1, 2, 3 (suficiente cuando el movimiento portador es lento) y una alta frecuencia temporal para las operaciones 4, 5 (el número de objetos que hay que clasificar es por lo general grande y los tiempos de toma de decisión deben ser cortos).

Claims (5)

  1. 5
    10
    15
    20
    25
    30
    35
    REIVINDICACIONES
    1. Procedimiento de clasificación de un objeto presente en una imagen obtenida por un sistema (100) de observación por imágenes que consta de un sensor, que comprende una etapa de extracción del objeto a clasificar en la imagen, caracterizado porque consta de una etapa de clasificación del objeto a partir de una base de conocimientos:
    -constando dicha base de conocimientos de varias clases que constan cada una de un conjunto de objetos representados por una etiqueta y un conjunto de características entre las que están la información contextual de fondo de imágenes, resultantes de un tratamiento alimentado por un Modelo Digital del Terreno (2), denominado MDT, y -que comprende unas reglas de decisión asociadas a estos fondos de imágenes,
    comprendiendo esta etapa de clasificación las siguientes subetapas:
    -adquisición mediante unos medios (10) de posicionamiento del sistema, de la posición geográfica del sensor del dispositivo (1) de obtención de imágenes durante la adquisición de la imagen; -alimentación del sistema de observación mediante el MDT, extracción en el MDT de una zona de interés asociada a esta posición; -estimación de la altitud del sensor del dispositivo de obtención de imágenes durante la adquisición de la imagen, mediante unos medios de medición de altitud; -determinación de las elevaciones del terreno en un sector compatible del campo de visión del dispositivo de obtención de imágenes, en función de dicha altitud y de dicha zona de interés; -proyección en el campo de visión de una segmentación del campo de visión a partir de las elevaciones del terreno; -a partir de esta segmentación del campo de visión y de la posición del objeto en este campo de visión, determinación del fondo de imágenes asociado al objeto que hay que clasificar; -aplicación de las reglas de decisión (32) asociadas a este fondo.
  2. 2.
    Procedimiento de clasificación de un objeto según la reivindicación anterior, caracterizado porque se filtran las medidas de altitud.
  3. 3.
    Procedimiento de clasificación de un objeto según una de las reivindicaciones anteriores, caracterizado porque el MDT no suministra información para algunas posiciones del sensor, la etapa de extracción en el MDT de una zona de interés comprende una etapa previa para completar dicho MDT mediante altitudes nulas o valores mínimos o medios de zonas adyacentes asociadas a estas posiciones.
  4. 4.
    Procedimiento de clasificación de un objeto según una de las reivindicaciones anteriores, caracterizado porque la información de fondo corresponde a unas zonas fronterizas determinadas en función de errores predeterminados en el MDT y/o la posición del sensor y/o su altitud.
  5. 5.
    Sistema (100) de observación por imágenes que comprende un dispositivo (1) de obtención de imágenes provisto de un sensor, unos medios (10) de posicionamiento del dispositivo de obtención de imágenes, unos medios de almacenamiento en los que se almacenan los ficheros de un Modelo Digital del Terreno (2) y una unidad (3) de tratamiento que consta de unos medios (31, 32) de implementación del procedimiento de clasificación según las reivindicaciones anteriores.
    8
ES10798992.3T 2009-12-23 2010-12-08 Procedimiento de clasificación de objetos en un sistema de observación por imágenes Active ES2535113T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0906294 2009-12-23
FR0906294A FR2954540B1 (fr) 2009-12-23 2009-12-23 Procede de classification d'objets dans un systeme de veille par imagerie.
PCT/EP2010/069116 WO2011076563A1 (fr) 2009-12-23 2010-12-08 Procede de classification d'objets dans un systeme de veille par imagerie

Publications (1)

Publication Number Publication Date
ES2535113T3 true ES2535113T3 (es) 2015-05-05

Family

ID=42537632

Family Applications (1)

Application Number Title Priority Date Filing Date
ES10798992.3T Active ES2535113T3 (es) 2009-12-23 2010-12-08 Procedimiento de clasificación de objetos en un sistema de observación por imágenes

Country Status (8)

Country Link
US (1) US9892340B2 (es)
EP (1) EP2517152B1 (es)
BR (1) BR112012018330A8 (es)
CA (1) CA2785384C (es)
ES (1) ES2535113T3 (es)
FR (1) FR2954540B1 (es)
IL (1) IL220606A (es)
WO (1) WO2011076563A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101657526B1 (ko) * 2012-01-11 2016-09-19 한화테크윈 주식회사 특징점 검사영역 설정기와 설정 방법 및 이를 구비하는 영상 안정화 장치
CN110068328B (zh) * 2018-01-22 2022-08-26 腾讯科技(深圳)有限公司 导航路线生成方法、装置、计算机可读存储介质和计算机设备
CN110516646B (zh) * 2019-09-02 2022-02-15 南京大学 一种结合极化分解与地形特征的表碛覆盖型冰川识别方法
US11580661B2 (en) * 2020-11-23 2023-02-14 Motorola Solutions, Inc. Device, method and system for estimating elevation in images from camera devices
CN114332466B (zh) * 2022-03-11 2022-07-15 中国科学技术大学 图像语义分割网络持续学习方法、***、设备及存储介质
CN117523568B (zh) * 2024-01-08 2024-03-29 陕西欧卡电子智能科技有限公司 一种基于无人船的桥高检测方法、装置、设备及介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6625310B2 (en) * 2001-03-23 2003-09-23 Diamondback Vision, Inc. Video segmentation using statistical pixel modeling
FR2826720B1 (fr) 2001-06-29 2003-09-05 Thales Sa Procede de synthese d'une image cartographique
KR100488685B1 (ko) 2002-08-22 2005-05-11 한국과학기술원 자동 영상등록 및 보정을 위한 영상 처리방법
US7725258B2 (en) * 2002-09-20 2010-05-25 M7 Visual Intelligence, L.P. Vehicle based data collection and processing system and imaging sensor system and methods thereof
IL153535A (en) 2002-12-19 2007-12-03 Rafael Advanced Defense Sys Method and system for processing and analyzing digital data of the surface

Also Published As

Publication number Publication date
EP2517152B1 (fr) 2015-01-21
FR2954540A1 (fr) 2011-06-24
FR2954540B1 (fr) 2018-11-16
CA2785384A1 (en) 2011-06-30
WO2011076563A1 (fr) 2011-06-30
BR112012018330A2 (pt) 2018-06-05
US20120274766A1 (en) 2012-11-01
IL220606A0 (en) 2012-08-30
IL220606A (en) 2016-08-31
BR112012018330A8 (pt) 2018-06-19
CA2785384C (en) 2018-01-02
US9892340B2 (en) 2018-02-13
EP2517152A1 (fr) 2012-10-31

Similar Documents

Publication Publication Date Title
Maddern et al. 1 year, 1000 km: The oxford robotcar dataset
US11393216B2 (en) Method of computer vision based localisation and navigation and system for performing the same
Stenborg et al. Long-term visual localization using semantically segmented images
Alvarez et al. Combining priors, appearance, and context for road detection
US10054445B2 (en) Vision-aided aerial navigation
US20210157006A1 (en) System and method for three-dimensional object detection
Huang et al. Structure from motion technique for scene detection using autonomous drone navigation
ES2535113T3 (es) Procedimiento de clasificación de objetos en un sistema de observación por imágenes
US9576200B2 (en) Background map format for autonomous driving
JP2019527832A (ja) 正確な位置特定およびマッピングのためのシステムおよび方法
Barnes et al. Exploiting 3D semantic scene priors for online traffic light interpretation
CN113468287B (zh) 飞行数据处理方法、计算设备、飞行器及其降落***
Ali et al. A Review of Navigation Algorithms for Unmanned Aerial Vehicles Based on Computer Vision Systems
Anand et al. LiDAR-INS/GNSS-based real-time ground removal, segmentation, and georeferencing framework for smart transportation
US20230360547A1 (en) Method and system for on-board localization
Soleimani et al. A disaster invariant feature for localization
Kim Aerial map-based navigation using semantic segmentation and pattern matching
Islam et al. Road trail classification using color images for autonomous vehicle navigation
Bhaganagar et al. A novel machine-learning framework with a moving platform for maritime drift calculations
Chiel et al. Visual GPS-denied multi-agent localization & terrain classification
Sineglazov et al. Intelligent system for visual navigation
Nidal Al Said An Unmanned Aerial Vehicles Navigation System on the Basis of Pattern Recognition Applications
Rognlien et al. Detecting Location of Free Range Sheep-Using Unmanned Aerial Vehicles and Forward Looking Infrared Images
Issartel Towards a robust slam framework for resilient AUV navigation
Gustafsson Geolocation: Maps, measurements and methods