ES2313035T3 - Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional. - Google Patents

Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional. Download PDF

Info

Publication number
ES2313035T3
ES2313035T3 ES04744492T ES04744492T ES2313035T3 ES 2313035 T3 ES2313035 T3 ES 2313035T3 ES 04744492 T ES04744492 T ES 04744492T ES 04744492 T ES04744492 T ES 04744492T ES 2313035 T3 ES2313035 T3 ES 2313035T3
Authority
ES
Spain
Prior art keywords
dimensional
model
scale
parts
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES04744492T
Other languages
English (en)
Inventor
Peter-Andre Redert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2313035T3 publication Critical patent/ES2313035T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering
    • G06T15/10Geometric effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Multimedia (AREA)
  • Processing Or Creating Images (AREA)
  • Image Generation (AREA)
  • Image Analysis (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Image Processing (AREA)

Abstract

Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional que representa una escena tridimensional que comprende un número de objetos en un modelo (210 a 224) de salida tridimensional a escala para su visualización en un dispositivo de visualización de imagen tridimensional, comprendiendo el procedimiento: - determinar, para partes del modelo (200 a 208) de entrada tridimensional, las probabilidades respectivas de que las partes correspondientes del modelo (210 a 224) de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo (200 a 208) de entrada tridimensional en una dirección de visualización; y - transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.

Description

Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional.
La invención se refiere a un procedimiento de ajuste a escala para un modelo de entrada tridimensional en un modelo de salida tridimensional a escala.
La invención se refiere además a una unidad de ajuste a escala para ajustar a escala un modelo de entrada tridimensional en un modelo de salida tridimensional a escala.
La invención además se refiere a un aparato de visualización de imagen que comprende:
- medios de recepción para recibir una señal que representa un modelo de entrada tridimensional;
- una unidad de ajuste a escala para ajustar a escala el modelo de entrada tridimensional en un modelo de salida tridimensional a escala; y
- medios de visualización para visualizar una vista del modelo de salida tridimensional a escala.
El ajuste a escala de modelos tridimensionales es conocido. La solicitud de patente europea EP0817123 da a conocer un dispositivo y procedimiento para ajustar a escala un modelo 3D para la visualización de una imagen estereoscópica. El dispositivo y procedimiento tienen como fin mover un objeto 3D a una posición en la que es probable que el espectador fije sus ojos. De esta forma puede reducirse la astenopía dando como resultado una fatiga ocular reducida. Para obtener este resultado se determina un rango de mirada indicativo de una posición en la que es probable que el usuario fije sus ojos. Una vez establecida esta posición, el objeto 3D se mueve en una dirección perpendicular a la pantalla de visualización, en el proceso el modelo se aumenta o reduce para que el espectador perciba el movimiento.
Hay sin embargo otra razón para ajustar a escala un modelo tridimensional aparte de reducir la fatiga visual. La probabilidad de que el tamaño de una escena tridimensional no se corresponda con las capacidades de visualización de un aparato de visualización de imagen es alta. Por consiguiente, se requiere una operación de ajuste a escala. Otras razones por las que podría requerirse ajuste a escala son para adaptar la geometría del modelo tridimensional que representa la escena tridimensional a un canal de transmisión o para adaptar el modelo tridimensional a las preferencias del espectador.
Las operaciones lineales de ajuste a escala en un modelo tridimensional que representa una escena tridimensional son ampliamente conocidas. Una realización del aparato de visualización de imagen del tipo descrito en el párrafo introductorio se conoce a partir de la patente estadounidense 6.313.866. Este aparato de visualización de imagen comprende un circuito para adquirir un valor máximo de información de profundidad a partir de una primera señal de imagen. El aparato de visualización de imagen comprende además un circuito de control de paralaje para controlar la cantidad de paralaje de una segunda señal de imagen basándose en la información de profundidad contenida en la primera y segunda señales de imagen de modo que una imagen correspondiente a la segunda señal de imagen puede visualizarse en tres dimensiones delante de una imagen correspondiente a la primera señal de imagen. Un sintetizador de imagen tridimensional sintetiza la primera y segunda señales de imagen que el circuito de control de paralaje ha controlado, basándose en la cantidad de paralaje de cada señal de imagen, de modo que las imágenes se corresponden con esa primera y segunda señales de imagen en el espacio de visualización tridimensional. El ajuste a escala de información de profundidad se realiza en principio mediante una adaptación lineal de la información de profundidad excepto para información de profundidad que exceda los límites de las capacidades de visualización. Estos últimos valores se recortan.
Una desventaja del ajuste a escala o adaptación de profundidad es que podría dar como resultado una reducción de impresión de profundidad. Especialmente el ajuste a escala de profundidad lineal podría ser desventajoso para la impresión de profundidad del modelo tridimensional a escala.
Es un objetivo de la invención proporcionar un procedimiento del tipo descrito en el párrafo introductorio que dé como resultado un modelo de salida tridimensional a escala que se asemeje al modelo de entrada tridimensional en cuanto a la percepción y que tenga una impresión tridimensional agradable.
Este objetivo de la invención se consigue porque el procedimiento comprende:
- determinar, para partes del modelo de entrada tridimensional, probabilidades respectivas de que las partes correspondientes del modelo de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo de entrada tridimensional en una dirección de visualización; y
- transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala, basándose en las probabilidades respectivas.
Como se describió con anterioridad, el ajuste a escala se requiere para que el modelo de entrada tridimensional se corresponda con por ejemplo las capacidades de visualización de un dispositivo de visualización. Tras el ajuste a escala del modelo de entrada tridimensional en el modelo de salida tridimensional a escala, se crearán múltiples vistas basándose en el modelo de salida tridimensional a escala. La idea es que no debería desperdiciarse rango de profundidad, por ejemplo del dispositivo de visualización, en el ajuste a escala para partes finalmente invisibles del modelo de salida tridimensional a escala. Esto significa que aquellas partes del modelo de entrada tridimensional que se corresponden con partes del modelo de salida tridimensional a escala que no serán visibles en una de las vistas deberían descartarse para el ajuste a escala. Haciendo que el dispositivo de visualización aplique una vista particular del modelo de entrada tridimensional, mediante la proyección del modelo de entrada tridimensional en una dirección de visualización, es posible determinar la visibilidad de las partes del modelo de entrada tridimensional en esa vista particular. Basándose en eso, es posible determinar la probabilidad de visibilidad de partes del modelo de salida tridimensional a escala. Las partes del modelo de salida tridimensional a escala que se corresponden con partes del modelo de entrada tridimensional que son visibles en la vista particular serán también visibles en general en una vista basada en el modelo de salida tridimensional a escala. Otras partes del modelo de salida tridimensional a escala que se corresponden con otras partes del modelo de entrada tridimensional que no son visibles en la vista particular tendrán una probabilidad relativamente baja de ser visibles en una vista basada en el modelo de salida tridimensional a escala. Haciendo múltiples proyecciones del modelo de entrada tridimensional, cada una en una dirección que se corresponde con una dirección de visualización, las probabilidades de ser visibles pueden adaptarse. Sin embargo, incluso sin hacer realmente estas proyecciones las probabilidades de visibilidad pueden determinarse basándose en otros parámetros, por ejemplo parámetros relacionados con las capacidades conocidas de un dispositivo de visualización. Alternativamente, las probabilidades se determinan basándose en parámetros de un canal de transmisión.
En una realización del procedimiento según la invención, determinar la probabilidad de que una primera de las partes sea visible, se basa en comparar un primer valor de una primera coordenada de la primera de las partes con un segundo valor de la primera coordenada de una segunda de las partes. Determinar si partes del modelo de entrada tridimensional se tapan mutuamente en la dirección de la vista puede realizarse fácilmente mediante comparación de los valores de las coordenadas de las partes de la entrada tridimensional. Preferiblemente, la primera coordenada se corresponde con la dirección de visualización.
En una realización del procedimiento según la invención, determinar la probabilidad de que la primera de las partes sea visible, se basa en las capacidades de un dispositivo de visualización en el que se visualizará el modelo de salida tridimensional a escala. Las capacidades del dispositivo de visualización podrían corresponderse con un ángulo máximo de visualización y el rango de profundidad del dispositivo de visualización. Estas propiedades del dispositivo de visualización determinan qué vistas pueden crearse, es decir las máximas diferencias entre las diferentes vistas. Basándose en estas propiedades del dispositivo de visualización en combinación con una vista apropiada, es decir una proyección de la entrada tridimensional, puede determinarse fácilmente la probabilidad de visibilidad de partes en cualquiera de las vistas posibles.
En una realización del procedimiento según la invención, la transformación geométrica de las partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala, comprenden una de traslación, rotación o deformación. La topología de las partes no se cambia debido a estas transformaciones geométricas.
Es un objetivo adicional de la invención proporcionar una unidad de ajuste a escala del tipo descrito en el párrafo introductorio que proporciona un modelo de salida tridimensional a escala que se asemeja al modelo de entrada tridimensional en cuanto a la percepción y que tiene una impresión tridimensional agradable.
Este objetivo de la invención se consigue porque la unidad de ajuste a escala comprende:
- medios de determinación de probabilidad para determinar, para partes del modelo de entrada tridimensional, probabilidades respectivas de que las partes correspondientes del modelo de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo de entrada tridimensional en una dirección de visualización; y
- medios de transformación para transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.
Es un objetivo adicional de la invención proporcionar un aparato de visualización de imagen del tipo descrito en el párrafo introductorio que proporciona un modelo de salida tridimensional a escala que se asemeja al modelo de entrada tridimensional en cuanto a la percepción y que tiene una impresión tridimensional agradable.
Este objetivo de la invención se consigue porque la unidad de ajuste a escala comprende:
- medios de determinación de probabilidad para determinar, para partes del modelo de entrada tridimensional, probabilidades respectivas de que las partes correspondientes del modelo de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo de entrada tridimensional en una dirección de visualización; y
\newpage
- medios de transformación para transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.
Modificaciones de la unidad de ajuste a escala y del aparato de visualización de imagen y variaciones de los mismos pueden corresponderse con modificaciones y variaciones del procedimiento descrito.
Estos y otros aspectos del procedimiento, de la unidad de ajuste a escala y del aparato de visualización de imagen según la invención resultarán evidentes a partir de y se aclararán con respecto a las implementaciones y realizaciones descritas a continuación en la presente memoria y con referencia a los dibujos adjuntos, en los que:
La figura 1 muestra esquemáticamente un dispositivo de visualización autoestereoscópico según la técnica anterior;
la figura 2A muestra esquemáticamente una vista desde arriba de un modelo de entrada tridimensional;
La figura 2B muestra esquemáticamente una vista frontal del modelo de entrada tridimensional de la figura 2A;
la figura 2C muestra esquemáticamente una vista desde arriba de un modelo de salida tridimensional a escala que se basa en el modelo de entrada tridimensional de la figura 2A;
la figura 3A muestra esquemáticamente los contenidos de una pila de la memoria z (z-buffer) tras el cálculo de una vista basándose en un modelo de entrada tridimensional;
la figura 3B muestra esquemáticamente el contenido de la pila de la memoria z de la figura 3A tras la segmentación;
la figura 3C muestra esquemáticamente el contenido de la pila de la memoria z de la figura 3B tras actualizar las probabilidades de visibilidad;
la figura 4 muestra esquemáticamente una unidad de ajuste a escala según la invención;
la figura 5 muestra esquemáticamente la unidad de transformación geométrica de la unidad de ajuste a escala según la invención;
la figura 6 muestra esquemáticamente el ajuste a escala de un modelo de entrada tridimensional en un modelo de salida tridimensional a escala; y
la figura 7 muestra esquemáticamente un aparato de visualización de imagen según la invención.
Se usan los mismos números de referencia para indicar partes similares a lo largo de todas las figuras.
Hay varios tipos de modelos para el almacenamiento de información tridimensional:
- Mallas de alambre, por ejemplo tal como se especifican para VRML. Estos modelos comprenden una estructura de líneas y caras.
- Estructuras de datos volumétricas o mapas voxel (Voxel significa elemento de volumen). Estas estructuras de datos volumétricas comprenden una serie de elementos tridimensional. Cada elemento tiene tres dimensiones y representa un valor de una propiedad. Por ejemplo los datos CT (tomografía por ordenador, Computer tomography) se almacenan como una estructura de datos volumétrica en la que cada elemento se corresponde con un valor Hounsfield respectivo.
- Imagen bidimensional con mapa de profundidad, por ejemplo una imagen bidimensional con Valores RGBZ. Esto significa que cada píxel comprende valores de componente de tres colores y un valor de profundidad. Los valores de componente de tres colores también representan un valor de luminancia.
- Modelos basados en imágenes, por ejemplo pares de imágenes estéreo o imágenes multivista. Estos tipos de imágenes se llaman también campos de luz.
Son posibles las conversiones de datos representados por un tipo de modelo tridimensional en otro modelo tridimensional. Por ejemplo datos representados con una malla de alambre o una imagen bidimensional con mapa de profundidad pueden convertirse mediante renderizado en datos representados con una estructura de datos volumétrica o un modelo basado en imagen.
La cantidad de profundidad que puede realizarse con un dispositivo de visualización de imagen tridimensional depende de su tipo. Con un dispositivo de visualización volumétrica la cantidad de profundidad se determina completamente mediante las dimensiones del dispositivo de visualización. Pantallas estéreo con, por ejemplo, gafas tienen una limitación flexible en cuanto a la cantidad de profundidad que depende del observador. Los observadores podrían llegar a fatigarse si la cantidad de profundidad está causada excesivamente por un "conflicto" entre la adaptación a la lente y la convergencia mutua de los ojos. Los dispositivos de visualización autoestereoscópicos, por ejemplo basados en un LCD con una pantalla lenticular para múltiples vistas, tienen un rango d de profundidad máximo teórico que viene determinado por la cantidad de vistas. La figura 1 muestra esquemáticamente un dispositivo 100 de visualización autoestereoscópico. Fuera del dispositivo 100 de visualización físico, pero dentro de una caja 102 virtual, puede mostrar objetos dentro de un cierto rango de profundidad, a espectadores dentro de un cierto ángulo \alpha de visualización. Ambos definen conjuntamente una constante k en píxeles, que es un porcentaje del número N de píxeles horizontales en el dispositivo 100 de visualización. Esta k es igual a la máxima disparidad que el dispositivo de visualización puede mostrar. Puede excederse el rango de profundidad máximo, dando como resultado una pérdida de nitidez.
La figura 2A muestra esquemáticamente una vista desde arriba de un modelo de entrada tridimensional. El modelo de entrada tridimensional comprende un número de objetos, 200 a 208, que difieren en tamaño y forma. La figura 2B muestra esquemáticamente una vista frontal del modelo de entrada tridimensional de la figura 2A. Puede observarse claramente que algunos de los objetos tapan otros objetos, completamente o parcialmente. Lo que significa que algunas partes del modelo de entrada tridimensional no son visibles en la vista frontal. Por ejemplo uno de los objetos, concretamente el objeto 200, es completamente invisible en la vista frontal.
La figura 2C muestra esquemáticamente una vista desde arriba de un modelo de salida tridimensional a escala que se basa en el modelo de entrada tridimensional de la figura 2A. Un primero de los objetos del modelo de entrada tridimensional a escala que se corresponde con un primero 200 de los objetos del modelo de entrada tridimensional se recorta al borde del rango de profundidad. Un segundo 224 de los objetos del modelo de entrada tridimensional a escala que se corresponde con un segundo 208 de los objetos del modelo de entrada tridimensional se sitúa cerca del otro borde del rango de profundidad. Un tercero de los objetos del modelo de entrada tridimensional a escala que se corresponde con un tercero 202 de los objetos del modelo de entrada tridimensional comprende tres partes 210 a 214 de las que dos son visibles y una tercera 212 no es visible en ninguna de las vistas posibles. Un cuarto de los objetos del modelo de entrada tridimensional a escala que se corresponde con un cuarto 204 de los objetos del modelo de entrada tridimensional comprende dos partes 216,218 de las que una primera 216 es visible y una segunda 218 no es visible en ninguna de las vistas posibles. Un quinto de los objetos del modelo de entrada tridimensional a escala que se corresponde con un quinto 206 de los objetos del modelo de entrada tridimensional comprende dos partes 220,222 de las que una primera 210 es visible y una segunda 222 no es visible en ninguna de las vistas
posibles.
En conexión con las figuras 3A a 3C se describirá cómo la probabilidad de visibilidad puede determinarse para partes de un modelo de entrada tridimensional que comprende un número de objetos 1 a 8. Esto se basa en el procedimiento según la invención que comprende las siguientes etapas:
- calcular la proyección del modelo de entrada tridimensional mediante una pila de la memoria z;
- indicar cuáles de los elementos de la pila de la memoria z son visibles en la proyección mediante comparación de valores z de pares de elementos de la pila de la memoria z que tienen valores x mutuamente iguales y valores y mutuamente iguales; y
- determinar qué grupos de elementos de la pila de la memoria z forman las partes respectivas del modelo de entrada tridimensional, mediante segmentación de los elementos de la pila de la memoria z;
- indicar la probabilidad de visibilidad de cada elemento de la pila de la memoria z que forma parte de un grupo de elementos de la pila de la memoria z que comprenden un elemento de la pila de la memoria z adicional que es visible, basándose en la capacidad de un dispositivo de visualización.
En este caso un elemento de la pila de la memoria z se corresponde con una parte del modelo de entrada tridimensional.
La figura 3A muestra esquemáticamente el contenido de una pila 300 de la memoria z tras el cálculo de una vista 302 basándose en el modelo de entrada tridimensional. La pila 300 de la memoria z comprende un número de celdas 304 a 322 de datos para el almacenamiento de datos que representan a las partes del modelo de entrada tridimensional.
Esta pila 300 de la memoria z comprende tres niveles, i=1, i=2 e i=3.
Los números 1 a 8 indicados en las celdas 304 a 322 de datos de la pila 300 de la memoria z se corresponden con los diferentes objetos 1 a 8 del modelo de entrada tridimensional. Por ejemplo, en una primera celda 312 de datos se almacenan datos relacionados con una parte del segundo objeto 2. En la pila 300 de la memoria z se almacenan los valores z, es decir valores de profundidad, de las partes del modelo de entrada tridimensional. Además de eso, se almacenan los correspondientes valores de color y de luminancia. En las figuras 3A a 3C solamente se representan un número de celdas 304 a 322 de datos para un único valor de la coordenada y.
Es ampliamente conocida en la técnica anterior la creación de una proyección basándose en una pila 300 de la memoria z. Debido a la naturaleza de una pila de la memoria z es muy fácil determinar cuáles de los elementos de la pila de la memoria z son visibles en la vista 302: aquéllos con el nivel superior, es decir i=3 en este caso. Por lo tanto, en la vista 302 solamente están presentes aquellas partes de las que se almacenan los datos en las celdas de datos, por ejemplo 304 a 310, de nivel superior i=3. En la figura 3A las celdas de datos correspondientes a las partes que son visibles en esta vista particular están sombreadas. Puede observarse en este caso que solamente una parte del segundo objeto 2 es visible y solamente una parte del octavo objeto 8 es visible. La mayor parte del cuarto objeto 4 es visible, excepto aquella parte que se tapa por el quinto objeto 5.
La figura 3B muestra esquemáticamente el contenido de la pila de la memoria z de la figura 3A tras la segmentación. La segmentación se aplica para determinar qué grupos de los elementos de la pila de la memoria z forman los respectivos objetos 1 a 8 del modelo de entrada tridimensional. Con este propósito, el contenido de las celdas 304 a 322 de datos de la pila 300 de la memoria z se analiza para determinar qué grupos de las celdas de datos almacenan los datos que pertenecen a los diferentes objetos del modelo de entrada tridimensional. Esta segmentación, o extracción de objeto se basa en los valores almacenados, por ejemplo color, luminancia y profundidad, en combinación con la distancia entre las diferentes celdas 304 a 322 de datos de la pila 300 de la memoria z. En la figura 3B se indican los diferentes grupos de celdas de datos mediante las curvas con puntos en sus extremos.
Además de luminancia, color y profundidad también se almacena en memoria la probabilidad de visibilidad. Por cada celda de datos se almacena un valor de esa cantidad. Normalmente pueden distinguirse los siguientes tipos:
- I: definitivamente será visible en una de las proyecciones;
- II: muy probablemente será visible en una de las proyecciones;
- III: muy probablemente no será visible en una de las proyecciones; y
- IV: definitivamente no será visible en una de las proyecciones.
Tras la primera proyección, el tipo I se asigna a un número de elementos de la pila de la memoria z, por ejemplo 304 y 306. Otros elementos de la pila de la memoria z podrían inicializarse con tipo IV o III.
Tras la segmentación, la probabilidad de visibilidad de un número de los elementos de la pila de la memoria z se actualiza, basándose en la capacidad del dispositivo de visualización. Normalmente se adapta la probabilidad de visibilidad de cada elemento de la pila de la memoria z que forma parte de un grupo de elementos de la pila de la memoria z que comprenden un elemento de la pila de la memoria z adicional que es visible (Tipo I). Por ejemplo, en una primera celda 312 de datos se almacenan los datos relacionados con una parte del segundo objeto 2. Tras la segmentación queda claro que la primera celda 312 de datos pertenece a un grupo de celdas de datos al que también pertenece una segunda celda 304 de datos de la que se conoce que almacena datos que pertenecen a una parte de objeto 2 que es visible. Basándose en esto y basándose en el ángulo de visualización y el rango de profundidad conocidos se decide actualizar la probabilidad de visibilidad de la segunda celda 312 de datos a tipo II. En la figura 3C se indica con una flecha 324 que este elemento de la pila de la memoria z podría ser visible en otra vista. También la probabilidad de visibilidad de otras celdas 314 a 322 de datos se actualiza de manera similar. La figura 3C muestra esquemáticamente el contenido de una pila de la memoria z de la figura 3B tras actualizar las probabilidades de visibilidad. Los elementos de la pila de la memoria z asignados a probabilidad de visibilidad de tipo I o II están sombreados.
En el ejemplo descrito en conexión con las figuras 3A a 3C todos los objetos son opacos, es decir no transparentes. Debería observarse que el procedimiento según la invención también puede aplicarse para objetos transparentes. En ese caso, debería almacenarse también un valor que representa la transparencia de cada uno de los elementos de la pila de la memoria z, es decir partes de los modelos de entrada tridimensionales, en las respectivas celdas 304 a 322 de datos.
La figura 4 muestra esquemáticamente una unidad 400 de ajuste a escala según la invención para ajustar a escala un modelo de entrada tridimensional en un modelo de salida tridimensional a escala. La unidad 400 de ajuste a escala comprende:
- una unidad 402 de determinación de probabilidad para determinar, para partes del modelo de entrada tridimensional, probabilidades respectivas de que las partes correspondientes del modelo de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala; y
- una unidad 408 de transformación geométrica para transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.
Se proporcionan datos que representan el modelo de entrada tridimensional en el conector 410 de entrada de la unidad 400 de ajuste a escala y la unidad 400 de ajuste a escala proporciona datos que representan el modelo de salida tridimensional a escala en el conector 412 de salida. Mediante la interfaz 414 de control se proporcionan los datos de control relacionados con un dispositivo de visualización, por ejemplo el rango de profundidad y ángulo máximo de visualización.
El funcionamiento de la unidad 402 de determinación de probabilidad se describe en conexión con las figuras 3A a 3C. La unidad 408 de transformación geométrica comprende una unidad 404 de detección de mínimo y máximo y una unidad 406 de control de ganancia. La unidad 404 de detección de mínimo y máximo se dispone para determinar para cada serie de elementos de la pila de la memoria z que tienen valores x mutuamente iguales y valores y mutuamente iguales un valor z mínimo y un valor z máximo correspondientes. La unidad 406 de control de ganancia se dispone para calcular valores z a escala para los elementos de la pila de la memoria z basándose en los respectivos valores z mínimos y valores z máximos y el rango de profundidad del dispositivo de visualización. El funcionamiento de la unidad 408 de transformación geométrica según la invención se describirá con más detalle en conexión con la
figura 4.
La unidad 402 de determinación de probabilidad, la unidad 404 de detección de mínimo y máximo y la unidad 406 de control de ganancia pueden implementarse utilizando un procesador. Normalmente, estas funciones se realizan bajo el control de un producto de programa software. Durante la ejecución, normalmente se carga el producto de programa software en una memoria, como una RAM, y se ejecuta desde la misma. El programa puede cargarse desde una memoria auxiliar, como una ROM, disco duro, o almacenamiento magnético y/o óptico, o pueden cargarse mediante una red como Internet. Opcionalmente un circuito integrado de aplicación específica proporciona la funcionalidad descrita.
La figura 5 muestra esquemáticamente la unidad 408 de transformación geométrica de la unidad de ajuste a escala 400 según la invención. Esta unidad 408 de transformación geométrica está diseñada para procesar los datos en una pila 300 de la memoria z como se describe en conexión con la figura 3C.
Los datos que están almacenados en la pila 300 de la memoria z se proporcionan para cada par x, y. En el ejemplo descrito en conexión con la figura 3C hay tres niveles por cada serie i=1, i=2 o i=3. Para cada uno de los niveles se proporciona un valor z y una probabilidad de visibilidad. Si un elemento de la memoria z particular es de tipo IV, es decir definitivamente no visible en una de las proyecciones, entonces los datos correspondientes se proporcionan a la unidad 518 de recorte. De lo contrario los datos se proporcionan al detector 502 de máximo y al detector 504 de mínimo. El detector 502 de máximo se dispone para extraer el valor z máximo por cada coordenada x, y y el detector 504 de mínimo se dispone para extraer el valor z mínimo por cada coordenada x, y. Los valores z máximos para cada coordenada x, y se proporcionan a una primera unidad 506 de filtro. Los valores z mínimos para cada coordenada x, y se proporcionan a una segunda unidad 508 de filtro. Preferiblemente la primera unidad 506 de filtro y la segundo unidad 508 de filtro son filtros morfológicos. Los filtros morfológicos son unidades de procesamiento de imagen no lineales comunes. Véase por ejemplo El artículo "Low-level image processing by max-min filters" por P. W. Verbeek, H. A. Vrooman y L. J. van Vliet, en "Signal Processing", vol. 15, nº 3, pág. 249 a 258, 1988. Otros tipos de filtros, por ejemplo paso bajo, podrían también aplicarse para la primera unidad 506 de filtro y la segunda unidad 508 de filtro. La salida de la primera unidad 506 de filtro es un tipo de relieve de valores z máximos y la salida de la segunda unidad 508 de filtro es un tipo de relieve de valores z mínimos.
La salida de la primera unidad 506 de filtro y la segunda unidad 508 de filtro se combinan mediante un primer medio 510 de combinación que suma las dos señales y divide la suma por un factor dos. La salida del primer medio 510 de combinación es una especie de valor medio, es decir un relieve medio. Esta salida se resta de los datos de entrada mediante la unidad 514 de resta. Esta resta puede interpretarse como una especie de corrección de desplazamiento.
La salida de la primera unidad 506 de filtro y la segunda unidad 508 de filtro se combinan también mediante un segundo medio 512 de combinación que resta las dos señales y divide la suma por un factor dos. La salida del segundo medio 512 de combinación es una especie de valor de rango que se utiliza para normalizar los datos de salida de la unidad 514 de resta. Esta normalización se realiza mediante la unidad 516 de normalización. La salida de la unidad 516 de normalización se proporciona a la unidad 520 de multiplicación que mapea los datos con el rango de profundidad disponible u opcionalmente rango de profundidad preferido. En este caso, k es una función del rango de profundidad de la pantalla y el ángulo de visualización disponibles.
La figura 6 muestra esquemáticamente el ajuste a escala de un modelo de entrada tridimensional en un modelo de salida tridimensional a escala. El ajuste a escala se realiza mediante el enfoque de alargamiento tal como se describe en conexión con la figura 5. El modelo de entrada tridimensional comprende tres objetos 602 a 606 que son visibles en una vista que se corresponde con una proyección que es aplicable para el dispositivo de visualización. El dispositivo de visualización tiene un rango d de profundidad. El alargamiento es tal que el uso del rango de profundidad disponible es óptimo. Eso significa que si hay solamente dos objetos para un cierto par x, y entonces uno de los objetos, o una parte del mismo, se mueve al borde frontal del rango d de profundidad y el otro objeto, o una parte del mismo, se mueve al borde posterior del rango d de profundidad. Por ejemplo el primer objeto 602 de entrada se solapa parcialmente con el segundo objeto 604 de entrada, es decir el segundo objeto 604 de entrada tapa parcialmente el primer objeto 602 de entrada. El resultado es que una primera parte 612 correspondiente al primer objeto 602 de entrada se mapea con el borde posterior del rango d de profundidad y que una primera parte 614 correspondiente al segundo objeto 604 de entrada se mapea con el borde frontal de la rango d de profundidad.
Si hay solamente un objeto para un cierto par x, y entonces este objeto, o una parte del mismo, se mueve al centro del rango d de profundidad. Por ejemplo una primera parte 620 correspondiente al tercer objeto 606 de entrada se mapea con el centro del rango d de profundidad. También una segunda parte 618 correspondiente al segundo objeto 604 de entrada se mapea con el borde frontal de la rango d de profundidad y una segunda parte 608 correspondiente al primer objeto 602 de entrada se mapea con el centro del rango d de profundidad.
Para hacer los mapeos a partir de partes de un único objeto de entrada suaves, hay partes de transición. La primera unidad 506 de filtro y la segunda unidad 508 de filtro causan este suavizado. Por ejemplo, una tercera parte 610 correspondiente al primer objeto 602 de entrada forma una transición desde el centro al borde posterior del rango d de profundidad, para conectar la primera parte 612 y la segunda parte, correspondiente al primer objeto 602 de entrada. También una tercera parte 616 correspondiente al segundo objeto 604 de entrada forma una transición desde el centro al borde frontal del rango d de profundidad, para conectar la primera parte 614 y la segunda parte 618, correspondiente al segundo objeto 604.
La figura 7 muestra esquemáticamente un aparato 700 de visualización de imagen según la invención, que comprende:
- un receptor 702 para recibir una señal que representa un modelo de entrada tridimensional;
- una unidad 400 de ajuste a escala para ajustar a escala el modelo de entrada tridimensional en un modelo de salida tridimensional a escala, tal como se describe en conexión con la figura 4; y
- un dispositivo 100 de visualización para visualizar una vista del modelo de salida tridimensional a escala.
La señal puede ser una señal de emisión recibida mediante una antena o cable pero también puede ser una señal desde un dispositivo de almacenamiento como un VCR (grabador de cinta de vídeo, Video Cassette Recorder) o disco versátil digital (DVD, Digital Versatile Disk). La señal se proporciona en el conector 710 de entrada. El aparato 700 de visualización de imagen podría ser por ejemplo una TV. Opcionalmente el aparato 700 de visualización de imagen comprende medios de almacenamiento, como un disco duro o medios para almacenamiento en medios extraíbles, por ejemplo discos ópticos. El aparato 700 de visualización de imagen podría también ser un sistema aplicado por un estudio de cine u organismo de radiodifusión.
Debería observarse que las realizaciones mencionadas con anterioridad ilustran más que limitan la invención y que los expertos en la técnica serán capaces de diseñar realizaciones alternativas sin apartarse del alcance de las reivindicaciones adjuntas. En las reivindicaciones, cualquier símbolo de referencia colocado entre paréntesis no deberá interpretarse como que limita la reivindicación. Las expresiones "comprendiendo" y "que comprende" no excluyen la presencia de elementos o etapas no indicados en la reivindicación. La palabra "un" o "una" precediendo a un elemento no excluye la presencia de una pluralidad de tales elementos. La invención puede implementarse mediante hardware que comprende varios elementos diferentes y mediante un ordenador programado apropiado. En las reivindicaciones de unidad que enumeran varios medios, varios de estos medios pueden realizarse por un único artículo de hardware.

Claims (10)

1. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional que representa una escena tridimensional que comprende un número de objetos en un modelo (210 a 224) de salida tridimensional a escala para su visualización en un dispositivo de visualización de imagen tridimensional, comprendiendo el procedimiento:
- determinar, para partes del modelo (200 a 208) de entrada tridimensional, las probabilidades respectivas de que las partes correspondientes del modelo (210 a 224) de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo (200 a 208) de entrada tridimensional en una dirección de visualización; y
- transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.
2. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 1, mediante el cual determinar la probabilidad de que la primera de las partes sea visible, se basa en comparar un primer valor de una primera coordenada de la primera de las partes con un segundo valor de la primera coordenada de una segunda de las partes.
3. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 2, mediante el cual determinar la probabilidad de que una primera de las partes sea visible, se basa en las capacidades de un dispositivo (100) de visualización en el que se visualizará el modelo (210 a 224) de salida tridimensional a escala.
4. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 3, mediante el cual las capacidades del dispositivo (100) de visualización se corresponden con un ángulo máximo de visualización y un rango de profundidad del dispositivo (100) de visualización.
5. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 1, mediante el cual transformar geométricamente las partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas comprende una de traslación, rotación o deformación.
6. Procedimiento de ajuste a escala de un modelo (1 a 8) de entrada tridimensional según la reivindicación 1, que comprende:
- calcular la proyección (302) del modelo (1 a 8) de entrada tridimensional mediante una pila (300) de memoria z;
- indicar cuáles de los elementos de la pila de la memoria z son visibles en la proyección mediante comparación de valores z de pares de elementos de la pila de la memoria z que tienen valores x mutuamente iguales y valores y mutuamente iguales;
- determinar qué grupos de elementos de la pila de la memoria z forman las partes respectivas del modelo (1 a 8) de entrada tridimensional, mediante segmentación de los elementos de la pila de la memoria z; e
- indicar la probabilidad de visibilidad de cada elemento de la pila de la memoria z que forma parte de un grupo de elementos de la pila de la memoria z que comprende un elemento de la pila de la memoria z adicional que es visible.
7. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 6, que comprende además
- determinar, para cada serie de elementos de la pila de la memoria z que tienen valores x mutuamente iguales y valores y mutuamente iguales, un correspondiente valor z mínimo y valor z máximo; y
- calcular valores z a escala para los elementos de la pila de la memoria z basándose en los valores z mínimos y valores z máximos respectivos y el rango de profundidad del dispositivo (100) de visualización.
8. Procedimiento de ajuste a escala de un modelo (200 a 208) de entrada tridimensional según la reivindicación 7, mediante el cual determinar valores z mínimos se basa en una operación morfológica.
9. Unidad (400) de ajuste a escala para ajustar a escala un modelo (200 a 208) de entrada tridimensional que representa una escena tridimensional que comprende un número de objetos en un modelo (210 a 224) de salida tridimensional a escala para su visualización en un dispositivo de visualización de imagen tridimensional, comprendiendo la unidad (400) de ajuste a escala:
- medios (402) de determinación de probabilidad para determinar, para partes del modelo (200 a 208) de entrada tridimensional, probabilidades respectivas de que las partes correspondientes del modelo (210 a 224) de salida tridimensional a escala sean visibles en una vista bidimensional del modelo de salida tridimensional a escala, basándose la determinación en una proyección del modelo (200 a 208) de entrada tridimensional en una dirección de visualización; y
- medios (408) de transformación para transformar geométricamente partes del modelo de entrada tridimensional en las partes respectivas del modelo de salida tridimensional a escala basándose en las probabilidades respectivas.
10. Aparato (700) de visualización de imagen que comprende:
- medios (702) de recepción para recibir una señal que representa un modelo (200 a 208) de entrada tridimensional;
- una unidad (400) de ajuste a escala para ajustar a escala el modelo (200 a 208) de entrada tridimensional en un modelo (210 a 224) de salida tridimensional a escala, según la reivindicación 9; y
- medios (100) de visualización para visualizar una vista del modelo (210 a 224) de salida tridimensional a escala.
ES04744492T 2003-07-11 2004-07-05 Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional. Expired - Lifetime ES2313035T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03102126 2003-07-11
EP03102126 2003-07-11

Publications (1)

Publication Number Publication Date
ES2313035T3 true ES2313035T3 (es) 2009-03-01

Family

ID=34042949

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04744492T Expired - Lifetime ES2313035T3 (es) 2003-07-11 2004-07-05 Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional.

Country Status (9)

Country Link
US (1) US7388583B2 (es)
EP (1) EP1658558B1 (es)
JP (1) JP4625805B2 (es)
KR (1) KR101035103B1 (es)
CN (1) CN1973304B (es)
AT (1) ATE407412T1 (es)
DE (1) DE602004016347D1 (es)
ES (1) ES2313035T3 (es)
WO (1) WO2005006181A2 (es)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1697902A1 (en) * 2003-12-19 2006-09-06 Koninklijke Philips Electronics N.V. Method of and scaling unit for scaling a three-dimensional model
US20110115041A1 (en) * 2009-11-19 2011-05-19 Zena Technologies, Inc. Nanowire core-shell light pipes
US8889455B2 (en) * 2009-12-08 2014-11-18 Zena Technologies, Inc. Manufacturing nanowire photo-detector grown on a back-side illuminated image sensor
EP2332340B1 (en) * 2008-10-10 2015-12-23 Koninklijke Philips N.V. A method of processing parallax information comprised in a signal
USD624952S1 (en) 2008-10-20 2010-10-05 X6D Ltd. 3D glasses
USRE45394E1 (en) 2008-10-20 2015-03-03 X6D Limited 3D glasses
USD603445S1 (en) 2009-03-13 2009-11-03 X6D Limited 3D glasses
USD666663S1 (en) 2008-10-20 2012-09-04 X6D Limited 3D glasses
KR101502597B1 (ko) * 2008-11-13 2015-03-13 삼성전자주식회사 고심도 입체 영상 표시가 가능한 디스플레이 장치 및 방법
US8542326B2 (en) 2008-11-17 2013-09-24 X6D Limited 3D shutter glasses for use with LCD displays
CA2684513A1 (en) 2008-11-17 2010-05-17 X6D Limited Improved performance 3d glasses
US20100245999A1 (en) * 2009-03-30 2010-09-30 Carlow Richard A Cart For 3D Glasses
USD646451S1 (en) 2009-03-30 2011-10-04 X6D Limited Cart for 3D glasses
USD672804S1 (en) 2009-05-13 2012-12-18 X6D Limited 3D glasses
USD650956S1 (en) 2009-05-13 2011-12-20 X6D Limited Cart for 3D glasses
USD669522S1 (en) 2010-08-27 2012-10-23 X6D Limited 3D glasses
USD692941S1 (en) 2009-11-16 2013-11-05 X6D Limited 3D glasses
USD671590S1 (en) 2010-09-10 2012-11-27 X6D Limited 3D glasses
USD662965S1 (en) 2010-02-04 2012-07-03 X6D Limited 3D glasses
GB2479784B (en) 2010-04-23 2012-11-07 Nds Ltd Image scaling
USD664183S1 (en) 2010-08-27 2012-07-24 X6D Limited 3D glasses
JP5681588B2 (ja) * 2010-09-30 2015-03-11 富士フイルム株式会社 立体画像編集装置および立体画像編集方法
JP5306544B2 (ja) * 2010-11-05 2013-10-02 富士フイルム株式会社 画像処理装置、画像処理プログラム、画像処理方法、及び記憶媒体
JP5050094B2 (ja) * 2010-12-21 2012-10-17 株式会社東芝 映像処理装置及び映像処理方法
JP5909055B2 (ja) * 2011-06-13 2016-04-26 株式会社東芝 画像処理システム、装置、方法及びプログラム
FR2968108A1 (fr) 2011-06-20 2012-06-01 Thomson Licensing Procede de reduction de la taille d’une image stereoscopique
EP2555166B1 (en) * 2011-08-01 2019-10-16 Harman Becker Automotive Systems GmbH Space error parameter for 3D buildings and terrain
USD711959S1 (en) 2012-08-10 2014-08-26 X6D Limited Glasses for amblyopia treatment
CN107038682B (zh) * 2016-02-03 2020-06-26 上海源胜文化传播有限公司 一种三维人体模型的缩放***及方法
CN109359380B (zh) * 2018-10-16 2020-06-09 上海莉莉丝科技股份有限公司 缩放方法、装置、设备及介质
US20220319031A1 (en) * 2021-03-31 2022-10-06 Auris Health, Inc. Vision-based 6dof camera pose estimation in bronchoscopy

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3504111B2 (ja) * 1996-06-27 2004-03-08 株式会社東芝 立体視システム、立体視方法、及び、異なる2つの視点から見た一対の画像を立体視可能に表示させるコンピュータプログラムを格納する記憶媒体
US6198484B1 (en) * 1996-06-27 2001-03-06 Kabushiki Kaisha Toshiba Stereoscopic display system
JPH11113028A (ja) * 1997-09-30 1999-04-23 Toshiba Corp 3次元映像表示装置
US6466185B2 (en) * 1998-04-20 2002-10-15 Alan Sullivan Multi-planar volumetric display system and method of operation using psychological vision cues
US6456285B2 (en) * 1998-05-06 2002-09-24 Microsoft Corporation Occlusion culling for complex transparent scenes in computer generated graphics
AUPQ691100A0 (en) * 2000-04-14 2000-05-11 Lim, Dr Hong Lip Improvements to 3d graphics
DE60237113D1 (de) * 2002-01-07 2010-09-02 Koninkl Philips Electronics Nv Verfahren und einheit zur skalierung eines drei-dimensionellen modells und anzeigevorrichtung
US7113183B1 (en) * 2002-04-25 2006-09-26 Anark Corporation Methods and systems for real-time, interactive image composition

Also Published As

Publication number Publication date
KR101035103B1 (ko) 2011-05-19
JP4625805B2 (ja) 2011-02-02
CN1973304A (zh) 2007-05-30
US20060197783A1 (en) 2006-09-07
JP2007528049A (ja) 2007-10-04
EP1658558A2 (en) 2006-05-24
EP1658558B1 (en) 2008-09-03
CN1973304B (zh) 2010-12-08
KR20060029287A (ko) 2006-04-05
ATE407412T1 (de) 2008-09-15
WO2005006181A2 (en) 2005-01-20
DE602004016347D1 (de) 2008-10-16
WO2005006181A3 (en) 2006-12-07
US7388583B2 (en) 2008-06-17

Similar Documents

Publication Publication Date Title
ES2313035T3 (es) Procedimiento y unidad de ajuste a escala para ajustar a escala un modelo tridimensional.
US8405708B2 (en) Blur enhancement of stereoscopic images
US10460459B2 (en) Stitching frames into a panoramic frame
US7609906B2 (en) Method and system for acquiring and displaying 3D light fields
JP4125252B2 (ja) 画像生成装置、画像生成方法、及び画像生成プログラム
US8711204B2 (en) Stereoscopic editing for video production, post-production and display adaptation
ES2323287T3 (es) Percepcion de profundidad.
US8253740B2 (en) Method of rendering an output image on basis of an input image and a corresponding depth map
US7983477B2 (en) Method and apparatus for generating a stereoscopic image
KR101960844B1 (ko) 영상 처리 장치 및 방법
US20150302592A1 (en) Generation of a depth map for an image
US20130057644A1 (en) Synthesizing views based on image domain warping
KR100918007B1 (ko) 3차원 모델의 스케일링 방법, 스케일링 유닛 및 화상디스플레이 장치
EP1668919A1 (en) Stereoscopic imaging
CN110892706B (zh) 用于在2d显示设备上显示从光场数据导出的内容的方法
US7692646B2 (en) Method of and scaling unit for scaling a three-dimensional model
CN114637391A (zh) 基于光场的vr内容处理方法及设备
JP7344886B2 (ja) 3dディスプレイのためのオーバースキャン