ES2899979T3 - Generación y procesamiento de señales de imagen de rango dinámico alto - Google Patents

Generación y procesamiento de señales de imagen de rango dinámico alto Download PDF

Info

Publication number
ES2899979T3
ES2899979T3 ES19203489T ES19203489T ES2899979T3 ES 2899979 T3 ES2899979 T3 ES 2899979T3 ES 19203489 T ES19203489 T ES 19203489T ES 19203489 T ES19203489 T ES 19203489T ES 2899979 T3 ES2899979 T3 ES 2899979T3
Authority
ES
Spain
Prior art keywords
dynamic range
bit words
color
pixel values
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19203489T
Other languages
English (en)
Inventor
Philip Newton
Haan Wiebe De
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Application granted granted Critical
Publication of ES2899979T3 publication Critical patent/ES2899979T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/003Details of a display terminal, the details relating to the control arrangement of the display terminal and to the interfaces thereto
    • G09G5/006Details of the interface to the display terminal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G5/00Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
    • G09G5/02Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the way in which colour is displayed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/64Circuits for processing colour signals
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2340/00Aspects of display data processing
    • G09G2340/06Colour space transformation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/04Exchange of auxiliary data, i.e. other than image data, between monitor and graphics controller
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09GARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
    • G09G2370/00Aspects of data communication
    • G09G2370/12Use of DVI or HDMI protocol in interfaces along the display data pipeline

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Color Television Systems (AREA)

Abstract

Un aparato para generar una señal de imagen en la cual los píxeles están codificados en palabras de N bits, comprendiendo el aparato: un receptor (201) configurado para obtener valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits; un primer generador (203) configurado para codificar los valores de píxeles de rango dinámico alto como las palabras de N bits definidas por una representación del segundo color, en donde las palabras de N bits se asignan a partir de las palabras de M bits; en donde el primer generador (203) está configurado además para incluir alternativamente las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo en un segmento de la señal de imagen, y un segundo generador (205) dispuesto para incluir en la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, comprendiendo el indicador además datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa de que las palabras de N bits de rango dinámico alto se incluyen en el segmento, en donde el segundo generador (205) está además dispuesto para incluir un segundo indicador en la señal de imagen, indicando el segundo indicador que el segmento se está utilizando para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende las palabras de N bits de rango dinámico alto.

Description

DESCRIPCIÓN
Generación y procesamiento de señales de imagen de rango dinámico alto
Campo de la invención
La invención se refiere a la generación y/o procesamiento de una señal de imagen que comprende valores de píxeles de rango dinámico alto.
Antecedentes de la invención
La codificación digital de diversas señales fuente se ha vuelto cada vez más importante en las últimas décadas a medida que la representación y la comunicación de señales digitales han reemplazado cada vez más a la representación y la comunicación analógicas. Se está investigando y desarrollando continuamente cómo mejorar la calidad que se puede obtener a partir de imágenes codificadas y secuencias de vídeo, manteniendo a la vez la tasa de datos a niveles aceptables.
Un factor importante para la calidad de imagen percibida es el rango dinámico que se puede reproducir cuando se muestra una imagen. Sin embargo, convencionalmente, el rango dinámico de las imágenes representadas ha tendido a reducirse sustancialmente en relación con la visión normal. De hecho, los niveles de luminancia que se encuentran en el mundo real abarcan un rango dinámico de hasta 14 órdenes de magnitud, que van a partir de una noche sin luna hasta mirar directamente al sol. El rango dinámico de luminancia instantánea y la correspondiente respuesta del sistema visual humano pueden estar entre 10.000:1 y 100.000:1 en días soleados o de noche.
Tradicionalmente, el rango dinámico de sensores de imagen y pantallas se ha limitado a rangos dinámicos de magnitud más bajos. Además, las pantallas a menudo están limitadas por el entorno de visualización (pueden volverse negras si el mecanismo de generación de luminancia está apagado, pero aún así reflejan, por ejemplo, la luz ambiental en su vidrio frontal; un televisor con una visualización diurna soleada puede tener DR < 50:1). En consecuencia, tradicionalmente ha sido posible almacenar y transmitir imágenes en formatos codificados con gamma de 8 bits sin introducir artefactos evidentemente perceptibles en los dispositivos de representación tradicionales. Sin embargo, en un esfuerzo por registrar imágenes más precisas y vivas, se han desarrollado nuevos sensores de imagen de Rango Dinámico Alto (HDR) que son capaces de registrar rangos dinámicos de más de 6 órdenes de magnitud. Además, la mayoría de los efectos especiales, la mejora de gráficos por ordenador y otros trabajos de posproducción ya se realizan de manera rutinaria a profundidades de bits más altas y con rangos dinámicos más altos.
Además, el contraste y la luminancia máxima de los sistemas de visualización de última generación continúan aumentando. Recientemente, se han presentado nuevas pantallas con una luminancia máxima de hasta 4000 Cd/m-2 y relaciones de contraste de hasta quizás 5-6 órdenes de magnitud, aunque esto en general se reduce a significativamente menos en entornos de visualización de la vida real. Se espera que las pantallas futuras puedan proporcionar rangos dinámicos aún más altos y, específicamente, luminancias máximas y relaciones de contraste más altas. Cuando se muestran señales de 8 bits codificadas tradicionalmente en dichas pantallas, pueden aparecer molestos artefactos de cuantificación y recorte, o los valores grises de las diferentes regiones pueden mostrarse incorrectamente, etc. Los artefactos pueden ser particularmente notables si la compresión tal como la compresión DCT de acuerdo con el estándar MPEG o similar de compresión de imágenes fijas o vídeo se usa en algún lugar a lo largo de la cadena de procesamiento de imágenes, a partir de la creación de contenido hasta la representación final. Además, los formatos de vídeo tradicionales ofrecen un margen y una precisión insuficientes para transmitir la información rica contenida en las nuevas imágenes HDR.
Como resultado, existe una necesidad creciente de nuevos enfoques que permitan al consumidor beneficiarse plenamente de las capacidades de los sensores y sistemas de visualización de última generación (y futuros). Preferiblemente, las representaciones de dicha información adicional son compatibles con versiones anteriores, de tal modo que los equipos heredados aún pueden recibir flujos de vídeo ordinarios, a la vez que los nuevos dispositivos habilitados para h Dr pueden aprovechar al máximo la información adicional transmitida por el nuevo formato. Por lo tanto, es deseable que los datos de vídeo codificados no solo representen imágenes HDR, sino que también permitan la codificación de las imágenes tradicionales de Rango Dinámico Bajo (LDR) correspondientes que se pueden mostrar en equipos convencionales.
El documento WO2005/104035 (Ward), como se puede ver en la Figura 1, trata sobre la codificación de una imagen HDR en dos conjuntos de datos, es decir, una imagen de mapa de tonos la cual es una imagen LDR estándar, y adicionalmente información HDR la cual, como que se muestra en la Figura 3 es típicamente una imagen de datos de relación, es decir, la cantidad de amplificación que se debe dar a las lumas LDR para obtener las lumas HDR. Ward no tiene un “segundo indicador en la señal de imagen, siendo el segundo indicador indicativo de la palabra de N bits que se utiliza para valores de píxeles de rango dinámico bajo, tanto cuando la palabra de N bits comprende valores de píxeles de rango dinámico bajo como cuando la palabra de N bits comprende valores de píxeles de rango dinámico alto” porque eso no tiene sentido en ese marco (no lo necesita, ni puede incorporar fácilmente, ni señalar nada útil sobre su códec de esa manera). Incluso no hay una sola imagen que contenga los valores de color de píxeles HDR.
El documento WO2010/104624 (Miller) trata sobre la construcción de una representación de color teórica muy grande que puede codificar cualquier luminancia y color HDR de acuerdo como se desee. Sin embargo, no se trata de indicar con un indicador que se están comunicando colores HDR, y mucho menos de qué manera. Ciertamente, tampoco corresponde con ningún segundo indicador que indique que su imagen HDR es en realidad una imagen LDR, ni le corresponde esto. El documento WO2010/105036 (Gish) es como la Figura 7 que muestra otro codificador de imágenes HDR del tipo que necesita diversos datos para codificar una sola imagen HDR, es decir, una imagen 738 LDR, un flujo de bits 740 TM y un flujo de bits 742 residual. No enseñan un color de imagen LDR que contiene realmente valores de píxeles HDR, ni un segundo indicador indica que la palabra de N bits se usa para valores de píxeles de rango dinámico bajo cuando la palabra de N bits comprende valores de píxeles de rango dinámico alto.
El documento WO2010/021705 (Doser) es un sistema para comunicar una versión mejorada (por ejemplo, HDR) de una imagen LDR (versión estándar), con base en la adición de datos 310 de mejora adicionales. No enseña un color de imagen LDR que realmente contiene valores de píxeles HDR, ni un segundo indicador indica que la palabra de N bits se utiliza para valores de color de píxeles de rango dinámico bajo cuando la palabra de N bits comprende valores de píxeles de rango dinámico alto, porque su versión estándar no contiene los colores de píxeles HDR, y los datos de mejora también son un enfoque técnicamente muy diferente.
Una cuestión crítica para la introducción de imágenes y vídeo de rango dinámico aumentado es cómo codificar, almacenar y distribuir de forma eficaz la información asociada. En particular, es deseable que se mantenga la compatibilidad con versiones anteriores y que se facilite la introducción de imágenes de rango dinámico alto en los sistemas existentes. También es significativa la eficiencia en términos de velocidad de datos y complejidad de procesamiento. Otro tema crítico es, por supuesto, la calidad de imagen resultante.
Por lo tanto, sería ventajoso un enfoque mejorado para distribuir, comunicar y/o representar imágenes de rango dinámico alto.
Resumen de la invención
Por consiguiente, la invención busca preferiblemente mitigar, aliviar o eliminar una o más de las desventajas de la técnica anterior individualmente o en cualquier combinación.
De acuerdo con un aspecto de la invención, se proporciona un aparato para generar una señal de imagen en la cual los píxeles están codificados en palabras de N bits, comprendiendo el aparato:
un receptor (201) configurado para obtener valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits;
un primer generador (203) configurado para codificar los valores de píxeles de rango dinámico alto como las palabras de N bits definidas por una representación del segundo color, en donde las palabras de N bits se asignan a partir de las palabras de M bits;
en donde el primer generador (203) está configurado además para incluir alternativamente las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo en un segmento de la señal de imagen, y
un segundo generador (205) dispuesto para incluir en la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, comprendiendo además el indicador datos que especifican cómo se realizó una asignación a partir de las palabras de M bits a las palabras de N bits en la alternativa de que las palabras de N bits de rango dinámico alto se incluyan en el segmento, en donde el segundo generador (205) está además dispuesto para incluir un segundo indicador en la señal de imagen, indicando el segundo indicador que el segmento se utiliza para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende palabras de N bits de rango dinámico alto.
Se tiene en cuenta que las palabras de valor de píxel se pueden codificar en secciones de datos separadas, tales por ejemplo como, componentes, o, algunas secciones pueden incluir datos los cuales no son de rango dinámico alto (HDR) de por sí.
La invención puede proporcionar una señal de imagen mejorada para distribuir datos de imagen de Rango Dinámico Alto (HDR). El enfoque puede, en particular, proporcionar una compatibilidad con versiones anteriores mejorada en diversas aplicaciones y/o puede, por ejemplo, facilitar la introducción de la distribución de imágenes h Dr en los sistemas de imagen y vídeo existentes.
La señal de imagen puede ser una sola señal de imagen, tal como un archivo de imagen digital, o puede, por ejemplo, ser una señal de vídeo que comprende una pluralidad de imágenes.
Las palabras de N bits pueden comprender una pluralidad de componentes los cuales pueden representar por separado e individualmente diferentes componentes de color. Una palabra de N bits puede representar una pluralidad de componentes de color. La palabra de N bits puede dividirse en diferentes segmentos los cuales pueden asignarse a componentes de color individuales. Por ejemplo, se pueden usar palabras de N1 bits para datos de píxeles para un primer componente de color, N2 bits se pueden usar para datos de píxeles para un segundo componente de color, y N3 bits se pueden usar para datos de píxeles para un tercer componente de color (donde, por ejemplo, N1+N2+N3=N). Como un ejemplo específico, se puede proporcionar una representación de color RGB en palabras de N bits donde se distribuyen N/3 bits a cada uno de los componentes de color R, G y B.
De manera similar, las palabras de M bits pueden comprender una pluralidad de componentes los cuales pueden representar por separado e individualmente diferentes componentes de color. Una palabra de M bits puede representar una pluralidad de componentes de color. La palabra de M bits puede dividirse en diferentes segmentos los cuales pueden asignarse a componentes de color individuales. Por ejemplo, los M1 bits pueden usarse para datos de píxeles para un primer componente de color, los M2 bits pueden usarse para datos de píxeles para un segundo componente de color, y los M3 bits pueden usarse para datos de píxeles para un tercer componente de color (donde, por ejemplo, M1+M2+M3=M).
La señal de imagen puede ser una sola señal de imagen continua y completa. Sin embargo, en otras realizaciones, la señal de imagen puede ser una señal de imagen compuesta o dividida. Por ejemplo, los datos de píxeles para la imagen en forma de palabras de N bits se pueden propagar en diversos paquetes o mensajes de datos. De manera similar, el indicador puede proporcionarse junto con o separado de las palabras de N bits, por ejemplo, almacenados en una parte diferente de una memoria, o incluso proporcionados a través de un enlace de comunicación diferente. Por ejemplo, el indicador puede transmitirse en paquetes o mensajes de datos diferentes a los de las palabras de N bits. Por ejemplo, la señal de imagen puede dividirse en paquetes de datos de imagen y paquetes de datos de control, proporcionándose las palabras de N bits en el primero y proporcionándose el indicador en el último tipo de paquetes de datos. Como mínimo, el codificador y el decodificador tendrían una forma fija (única o múltiple) de codificar datos HDR en una palabra de N bits disponible fija, y luego el indicador sería simple, y solo se dice que los datos codificados representan “datos HDR” o, por ejemplo, datos “HDR-tipo-1” o “HDR-tipo-2” en lugar de datos LDR. El lado receptor, entonces, de acuerdo con lo acordado, por ejemplo, el escenario de codificación de tipo 2 sabría cómo transformar en última instancia esto en la señal que se representará en una pantalla (o impresora, etc.). Dicho escenario se puede utilizar, por ejemplo, cuando los originales HDR arbitrarios (por ejemplo, con lumas de 16 bits con el código máximo correspondiente al pico de blanco 5000 nits, o lumas de 22 bits con pico_de_blanco 550000 nits), se transforman primero en una señal intermedia (la cual es más utilizable para la visualización, ya que un objeto brillante de 550000 nits no se puede representar de todos modos, por lo que preferiblemente se clasifica primero a algún valor que aún transmita un brillo enorme, pero se puede representar en una pantalla, por ejemplo, 5000 nits). Las difíciles elecciones matemáticas o artísticas de convertir la representación de la escena del mundo real en una señal útil, y que se puede representar se eliminan de esta parte de la cadena de imágenes, y se tratan en una parte anterior, por lo que la codificación de tipo 2 solo debería tratar la conversión de lo que terminó en la representación intermedia de M bits, a la representación de N bits de tipo 2. Sin embargo, el indicador puede ser más complejo, o indicarse de otra manera co-suministrado con datos adicionales que especifiquen cómo se realizó exactamente una asignación a la señal de N bits, de tal modo que, por ejemplo, también los originales de 22 bits/550000 nits se pueden aplicar directamente a la segunda parte de la cadena de imágenes y convertirlos a la señal de N bits. En dichos casos, la información útil sería información de escala (lineal) (por ejemplo, asociada con una escala entre un primer rango de luminancias asociado con la primera codificación de palabras de M bits frente a un segundo rango de palabras de N bits), tal como por ejemplo, una especificación del nivel de 550000 nits (o una indicación de valor de blanco derivado, por ejemplo, un nivel de blanco estimado, escalado, o destinado a ser representado en un nivel de blanco de pantalla de referencia [la cual se puede ver como un ejemplo de una luminancia de pantalla asociada], cuya una pantalla de recepción real puede entonces asignarse de manera óptima de acuerdo con lo que puede generar como máximo como pico de blanco; es decir, representará los datos los cuales tenían un nivel de blanco codificado de, por ejemplo, 5000 nits de manera diferente a los datos con un nivel de blanco de 50000 nits, por ejemplo, si la pantalla puede mostrar un pico de blanco de 10000 nits, puede representar el primer blanco [es decir, píxeles que tienen un valor de código de Y=1023, por ejemplo] como luminancia de salida de pantalla igual a 6000 nits, y el segundo como luminancia de salida de pantalla igual a 10000 nits). Y puede ser más útil incluir información sobre cómo exactamente todos los valores de luminancia o color a lo largo del rango de colores codificables en la representación de M bits se distribuyen a lo largo del rango codificable de la señal de N bits, por ejemplo, utilizar los bits en la nueva representación de N bits de la mejor manera posible y codificar con la mayor precisión posible toda la textura de diversos objetos importantes a lo largo del rango de luminancia en las imágenes ingresadas en la representación de M bits, por ejemplo, mediante la codificación conjunta de funciones de asignación. Por supuesto, todos estos pueden variar dinámicamente entre diferentes escenas de una película, por ejemplo, cambiar entre escenas sencillas en interiores bien iluminadas las cuales pueden representarse mejor con codificaciones LDR, a una escena exterior con fuegos artificiales espectacularmente brillantes, las cuales pueden representarse mejor con una variante más ajustada a HDR, con diferentes estadísticas de imagen que dan como resultado diferentes estadísticas de codificación de N bits.
De acuerdo con una característica opcional de la invención, la representación del primer color es diferente de la representación del segundo color.
Esto puede proporcionar un rendimiento mejorado en diversas realizaciones y en diversos escenarios puede permitir específicamente una comunicación altamente eficiente de datos de imágenes HDR. El aparato puede adaptar datos de imágenes HDR para que coincidan específicamente con los requisitos, características y/o preferencias del medio de distribución específico.
De acuerdo con una característica opcional de la invención, el aparato comprende además una unidad de transformación para transformar los valores de píxeles de rango dinámico alto a partir de la representación del primer color a la representación del segundo color.
Esto puede proporcionar un rendimiento mejorado en diversas realizaciones y en diversos escenarios puede permitir específicamente una comunicación altamente eficiente de datos de imágenes HDR. El aparato puede adaptar datos de imágenes HDR para que coincidan específicamente con los requisitos, características y/o preferencias del medio de distribución específico.
De acuerdo con una característica opcional de la invención, la transformación comprende una compresión de palabras de M bits en palabras de N bits, donde M es mayor que N.
En diversas realizaciones se puede conseguir una señal de imagen más eficaz para distribuir contenido HDR. Una compresión que permite una distribución más eficiente puede, por ejemplo, aplicar transformaciones no lineales para transformar, por ejemplo, una representación de color de palabra de M bits lineal en una representación de color de palabra de N bits no lineal.
De acuerdo con una característica opcional de la invención, la compresión comprende utilizar un esquema de cuantificación diferente para los valores de píxeles de acuerdo con la representación del segundo color que para los valores de píxeles de acuerdo con la representación del primer color.
En diversas realizaciones se puede conseguir una señal de imagen más eficaz para distribuir contenido HDR. El esquema de cuantificación para la representación del segundo color puede, por ejemplo, permitir que el rango dinámico sea cubierto por menos niveles de cuantificación y puede permitir que N sea menor que M. El esquema de cuantificación para la representación del segundo color puede ser, por ejemplo, una cuantificación no uniforme de los valores del componente de color y/o rango dinámico de luminancia.
De acuerdo con una característica opcional de la invención, la representación del primer color es la misma que la representación del segundo color.
Esto puede permitir una representación eficiente y/o de baja complejidad y/o un funcionamiento facilitado en diversos escenarios. En particular, puede permitir que se utilice un procesamiento de baja complejidad y pocos recursos computacionales para manejar de manera eficiente imágenes de rango dinámico alto.
De acuerdo con una característica opcional de la invención, el indicador comprende una indicación de una luminancia de pantalla asociada con la representación del segundo color.
La señal de imagen puede incluir una indicación de cómo los valores de píxeles proporcionados se correlacionan nominalmente con las luminancias previstas. El enfoque puede, por ejemplo, permitir que una pantalla que recibe la señal de imagen adapte la representación de los valores de píxeles para corresponder a las características reales de la pantalla. Por ejemplo, se pueden aplicar transformaciones para proporcionar conversiones precisas o apropiadas de las visualizaciones nominales o de referencia asociadas con la representación del segundo color a la visualización real utilizada para la representación.
El indicador puede proporcionar específicamente una indicación de una luminancia de referencia correspondiente a un valor de píxel de referencia. Por ejemplo, el indicador puede indicar la luminancia correspondiente al valor de píxel que representa la luminancia más alta de la representación del segundo color.
El enfoque puede permitir la codificación de cualquier espacio HDR a la vez que permite que se muestre en cualquier pantalla. Por ejemplo, una imagen HDR se puede codificar para que corresponda a un rango dinámico con una radiación más brillante de 50000 nits. Sin embargo, al representar una señal de este tipo en una pantalla de 1000 nits, es deseable proporcionar una asignación inteligente entre el rango dinámico codificado y el rango dinámico de la representación. Dicha transformación puede mejorarse y/o facilitarse mediante el indicador que indica una luminancia de pantalla asociada con la representación del segundo color.
De acuerdo con una característica opcional de la invención, el indicador comprende una indicación de la representación del segundo color.
Esto puede mejorar el rendimiento y/o facilitar la representación. En particular, puede permitir que un dispositivo que recibe la señal de imagen optimice su procesamiento para la representación de color específica utilizada. Las representaciones de color pueden especificar cómo se empaquetan los valores de datos (por ejemplo, primero una luma, luego un tono como un componente de 3 bits, luego una saturación de acuerdo con alguna asignación de ubicación de los bits de palabras sucesivos), y lo que significan (cuales primarios, etc.).
De acuerdo con una característica opcional de la invención, la representación del primer color emplea un valor de color separado para cada componente de color de la representación del primer color, y la representación del segundo color emplea un conjunto de valores de color para cada componente de color de la segunda representación del color junto con un factor exponencial común.
Esto puede proporcionar una representación particularmente eficaz. El conjunto de valores de color para cada componente de color de la representación del segundo color puede corresponder a una representación lineal o no lineal (tal como, por ejemplo, logarítmica) de los valores de luminancia del componente de color.
La señal de imagen comprende un segmento para datos de imagen de píxeles, y el primer generador está dispuesto para incluir alternativamente valores de píxeles de rango dinámico bajo o valores de píxeles de rango dinámico alto de acuerdo con una representación del segundo color en el segmento, y el indicador está dispuesto para indicar si el primer segmento comprende valores de color de rango dinámico bajo o valores de color de rango dinámico alto.
Esto puede proporcionar una representación particularmente ventajosa. En diversos escenarios, puede proporcionar una mejor compatibilidad con versiones anteriores y/o facilitar la introducción de HDR en sistemas o estándares existentes. En particular, el enfoque puede permitir que los enfoques de distribución de vídeo existentes para la distribución de imágenes de rango dinámico bajo se adapten fácilmente a la distribución de imágenes de rango dinámico alto.
El segmento puede ser, por ejemplo, un segmento reservado para la comunicación de datos de color mejorados. Por ejemplo, un estándar de señal de imagen puede permitir que los datos de imagen se comuniquen de acuerdo con una representación de color estándar y de acuerdo con una representación de color mejorada, donde la representación de color mejorada permite una representación de cromaticidad mejorada en relación con la representación de color estándar (por ejemplo, una cuantificación de cromaticidad más fina, o una gama más amplia). Normalmente, la representación de color mejorada puede utilizar más bits que la representación de color estándar. El enfoque puede permitir que un segmento reservado para la representación de color mejorada se utilice para la comunicación de datos de rango dinámico alto.
El segundo generador está dispuesto para incluir además un segundo indicador en las señales de imagen, siendo el segundo indicador indicativo del segmento que se utiliza para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende valores de píxeles de rango dinámico bajo como cuando el segmento comprende valores de píxeles de rango dinámico alto.
Esto puede proporcionar una representación particularmente ventajosa. En diversos escenarios, puede proporcionar una mejor compatibilidad con versiones anteriores y/o facilitar la introducción de HDR en sistemas o estándares existentes. En particular, el enfoque puede permitir que los enfoques de distribución de vídeo existentes para la distribución de imágenes de rango dinámico bajo se adapten fácilmente para permitir la distribución de imágenes de rango dinámico alto.
El uso del segundo indicador, el cual puede indicar que el segmento usa datos de rango dinámico bajo incluso cuando contiene datos de rango dinámico alto, se puede usar para asegurar que el procesamiento o la distribución con base en este indicador serán los mismos que para los datos de rango dinámico bajo. Esto puede impedir conflictos y, en particular, puede permitir que la funcionalidad no sea capaz de procesar datos de rango dinámico alto o que el primer indicador siga procesando la señal. Entonces, otra funcionalidad puede aprovechar el primer indicador para procesar los valores de los píxeles como datos de rango dinámico alto. Por ejemplo, en algunas realizaciones, solo la visualización de representación usará el primer indicador para procesar los datos de píxeles, a la vez que la distribución intermedia o la funcionalidad de almacenamiento se basan solo en el segundo indicador y, por lo tanto, no es necesario que sea capaz de procesar el primer indicador o, de hecho, valores de píxeles de rango dinámico alto. El segundo indicador puede ser un indicador estandarizado existente, siendo el primer indicador un nuevo indicador introducido en un estándar existente.
De acuerdo con una característica opcional de la invención, un número de bits K reservado para cada píxel en el segmento es mayor que N.
Esto puede permitir un funcionamiento mejorado y/o facilitado en diversos escenarios. En algunas realizaciones, los bits K-N pueden usarse para la comunicación de otros datos, tales como por ejemplo, datos de mejora de la cromaticidad.
De acuerdo con una característica opcional de la invención, la señal de codificación de imágenes está de acuerdo con un estándar HDMI.
La invención puede proporcionar una señal de imagen HDMI™ (Interfaz Multimedia de Alta Definición) particularmente ventajosa para su distribución de acuerdo con los estándares HDMI™.
De acuerdo con una característica opcional de la invención, el primer generador está dispuesto para incluir los valores de píxeles de rango dinámico alto en un segmento de datos de color profundo.
Esto puede proporcionar un enfoque particularmente ventajoso y, en particular, puede permitir una compatibilidad mejorada con versiones anteriores.
De acuerdo con una característica opcional de la invención, el segundo generador está dispuesto para incluir el indicador en un InfoFrame de Información de Vídeo Auxiliar.
Esto puede proporcionar un enfoque particularmente ventajoso y, en particular, puede permitir una compatibilidad mejorada con versiones anteriores.
De acuerdo con una característica opcional de la invención, la señal de codificación de imágenes está de acuerdo con un estándar DisplayPort.
La invención puede proporcionar una señal de imagen DisplayPort™ particularmente ventajosa para su distribución de acuerdo con los estándares DisplayPort™.
De acuerdo con un aspecto de la invención, se proporciona un método para generar una señal de imagen en la cual se codifican los píxeles en palabras de N bits, comprendiendo el método las etapas de:
obtener valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits;
codificar los valores de píxeles de rango dinámico alto en la señal de imagen como las palabras de N bits definidas por una representación del segundo color, en donde las palabras de N bits se asignan a partir de las palabras de M bits;
incluir en un segmento de la señal de imagen alternativamente las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo;
que incluye en la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, comprendiendo además el indicador datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa que las palabras de N bits de rango dinámico alto están incluidas en el segmento,
en donde el método está además dispuesto para incluir un segundo indicador en la señal de imagen, indicando el segundo indicador que el segmento se está utilizando para valores de píxeles de rango dinámico bajo cuando el segmento comprende los valores de píxeles de rango dinámico bajo y cuando el segmento comprende las palabras de N bits de rango dinámico alto.
De acuerdo con una característica opcional de la invención, la señal de imagen está de acuerdo con un estándar HDMI, y el aparato comprende además medios para transmitir una indicación de la capacidad para procesar valores de píxeles de rango dinámico alto en el bloque de datos específicos de un proveedor HDMI.
Esto puede permitir una distribución de la señal de imagen particularmente ventajosa. En particular, puede proporcionar una mejor compatibilidad con versiones anteriores y/o facilitar la introducción de información h Dr en sistemas HDMI.
De acuerdo con un aspecto de la invención, se proporciona una señal de imagen en la cual los píxeles están codificados en palabras de N bits, comprendiendo la señal de imagen un segmento el cual, alternativamente, comprende palabras de N bits de rango dinámico alto de acuerdo con una representación del segundo color, las cuales se asignan a partir de palabras de M bits de rango dinámico alto de entrada de acuerdo con una representación de color del primer color, o comprenden valores de píxeles de rango dinámico bajo;
y la señal de imagen que comprende un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, cuyo indicador comprende además datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa que las palabras de N bits de rango dinámico alto se incluyan en la imagen;
en donde la señal de imagen comprende un segundo indicador el cual indica que el segmento se está utilizando para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende palabras de N bits de rango dinámico alto.
Estos y otros aspectos, características y ventajas de la invención resultarán evidentes y se aclararán con referencia a la(s) realización(es) descrita(s) a continuación.
Breve descripción de los dibujos
Se describirán realizaciones de la invención, únicamente a modo de ejemplo, con referencia a los dibujos, en los cuales
La Figura 1 es una ilustración de una ruta de distribución de contenido audiovisual;
La Figura 2 es una ilustración de un aparato para generar una señal de imagen de acuerdo con algunas realizaciones de la invención;
La Figura 3 es una ilustración de un aparato para generar una señal de imagen de acuerdo con algunas realizaciones de la invención;
La Figura 4 es una ilustración de un aparato para procesar una señal de imagen;
La Figura 5 ilustra ejemplos de codificación de valores de píxeles;
La Figura 6 ilustra un ejemplo de un sistema para generar contenido audiovisual; y
La Figura 7 ilustra un ejemplo de un sistema para procesar contenido audiovisual.
Descripción detallada de algunas realizaciones de la invención
La Figura 1 ilustra un ejemplo de una ruta de distribución audiovisual. En el ejemplo, un aparato 101 proveedor de contenido genera una señal de contenido audiovisual para un elemento de contenido audiovisual, tal como por ejemplo, una película, un programa de televisión, etc. El aparato 101 proveedor de contenido puede codificar específicamente el contenido audiovisual de acuerdo con un formato de codificación y representación de color adecuados. En particular, el aparato 101 proveedor de contenido puede codificar las imágenes de una secuencia de vídeo del elemento de contenido audiovisual de acuerdo con una representación adecuada, tal como por ejemplo, YCrCb. Se puede considerar que el aparato 101 proveedor de contenido representa una casa de producción y distribución la cual crea y difunde el contenido.
La señal de contenido audiovisual se distribuye luego a un dispositivo 103 de procesamiento de contenido a través de una ruta 105 de distribución. El dispositivo 103 de procesamiento de contenido puede ser, por ejemplo, un decodificador que reside con un consumidor específico del elemento de contenido.
El contenido audiovisual se codifica y distribuye a partir del aparato 101 proveedor de contenido a través de un medio, el cual puede, por ejemplo, consistir en medios empaquetados (DVD o BD, etc.), Internet o transmisión. Luego llega a un dispositivo fuente en la forma de dispositivo 103 de procesamiento de contenido el cual comprende una funcionalidad para decodificar y representar el contenido.
Se apreciará que la ruta 105 de distribución puede ser cualquier ruta de distribución y a través de cualquier medio o usando cualquier estándar de comunicación adecuado. Además, la ruta de distribución no necesita ser en tiempo real, pero puede incluir almacenamiento permanente o temporal. Por ejemplo, la ruta de distribución puede incluir Internet, transmisión por satélite o terrestre, etc., almacenamiento en medios distribuidos físicamente tal como DVD o Blu-ray Disc™ o una tarjeta de memoria, etc. Asimismo, el dispositivo 103 de procesamiento de contenido puede ser cualquier dispositivo adecuado tal como un reproductor de Blu-ray™, un receptor de televisión terrestre o satelital, etc.
El dispositivo 103 de procesamiento de contenido está acoplado a una pantalla 107 a través de una ruta 109 de comunicación. El dispositivo 103 de procesamiento de contenido genera una señal de visualización que comprende una señal visual de audio que representa el elemento de contenido audiovisual. La señal de visualización puede ser específicamente la misma que la señal de contenido audiovisual. Por lo tanto, el dispositivo fuente transmite el contenido decodificado a un dispositivo receptor, el cual puede ser un televisor u otro dispositivo el cual convierte las señales digitales en una representación física.
En algunas realizaciones, los datos que representan las imágenes del contenido audiovisual son los mismos para la señal de contenido audiovisual y para la señal de visualización. En este ejemplo, la pantalla 107 puede comprender una funcionalidad para el procesamiento de imágenes que incluye, por ejemplo, generación de imágenes con mayor rango dinámico. Sin embargo, se apreciará que en algunas realizaciones, el dispositivo 103 de procesamiento de contenido puede realizar, por ejemplo, mejora de imagen o algoritmos de procesamiento de señal en los datos y puede decodificar y recodificar específicamente la señal audiovisual (procesada). La recodificación puede realizarse específicamente en un formato de codificación o representación diferente al de la señal de contenido audiovisual.
El sistema de la Figura 1 está dispuesto para proporcionar información de vídeo de Rango Dinámico Alto (HDR). Además, con el fin de proporcionar, por ejemplo, compatibilidad con versiones anteriores mejorada, también puede, en algunos escenarios, proporcionar información de Rango Dinámico Bajo (LDR) que permite presentar una imagen LDR. Específicamente, el sistema puede comunicar/distribuir señales de imagen relacionadas con imágenes LDR y HDR.
El enfoque descrito a continuación se puede aplicar en uno o ambos del enlace 105 a partir del aparato 101 proveedor de contenido al dispositivo 103 de procesamiento de contenido y el enlace 109 a partir del dispositivo 103 de procesamiento de contenido a la pantalla 107. Además, el enfoque se puede aplicar de manera diferente en las dos rutas, por ejemplo, mediante el uso de diferentes representaciones de color o estándares de codificación. Sin embargo, la siguiente descripción se centrará, por brevedad y claridad, en la aplicación del enfoque a una interfaz entre un decodificador audiovisual y una pantalla correspondiente. Por lo tanto, la descripción se centrará en una aplicación a la ruta 109 de comunicación entre el dispositivo 103 de procesamiento de contenido y la pantalla 107 en la Figura 1.
Las pantallas convencionales suelen utilizar una representación LDR. Normalmente, dichas representaciones LDR se proporcionan por una representación de 8 bits de tres componentes relacionada con primarios específicos. Por ejemplo, se puede proporcionar una representación de color RGB mediante tres muestras de 8 bits referenciadas a un primario Rojo, Verde, y Azul respectivamente. Otra representación utiliza un componente de luminancia y dos componentes de crominancia (tal como YCrCb). Estas representaciones de LDR corresponden a un rango de luminosidad o brillo dados.
Sin embargo, cada vez se proporcionan más dispositivos de captura de imágenes los cuales pueden capturar rangos dinámicos más grandes. Por ejemplo, las cámaras suelen proporcionar rangos de 12 bits, 14 bits o incluso 16 bits. Por lo tanto, en comparación con una cámara LDR estándar convencional de 8 bits, una cámara HDR puede capturar fielmente (linealmente), 12 bits, 14 bits (o más) que van a partir de un blanco más brillante a un negro determinado. Por lo tanto, el HDR puede corresponder a un número creciente de bits para las muestras de datos correspondientes a LDR, lo que permite representar un rango dinámico más alto.
El HDR permite específicamente que se presenten imágenes (o áreas de imagen) significativamente más brillantes. De hecho, una imagen HDR puede proporcionar un blanco sustancialmente más brillante que el que puede proporcionar la imagen LDR correspondiente. De hecho, una imagen HDR puede permitir un blanco al menos cuatro veces más brillante que la imagen LDR. El brillo se puede medir específicamente en relación con el negro más oscuro que se puede representar o se puede medir en relación con un nivel de gris o negro dado.
La imagen LDR puede corresponder específicamente a parámetros de visualización específicos, tales como una resolución de bits fija relacionada con un conjunto específico de primarios y/o un punto blanco específico. Por ejemplo, se pueden proporcionar 8 bits para un conjunto dado de primarios RGB y, por ejemplo, un punto blanco de 500 Cd/m2. La imagen HDR es una imagen que incluye datos los cuales deben representarse por encima de estas restricciones. En particular, un brillo puede ser más de cuatro veces más brillante que el punto blanco (por ejemplo, 2000 Cd/m2) o más.
Los valores de píxeles de rango dinámico alto tienen un rango de contraste de luminancia (la luminancia más brillante en el conjunto de píxeles dividido por la luminancia más oscura) el cual es (mucho) más grande que un rango que se puede mostrar fielmente en las pantallas estandarizadas en la era NTSC y MPEG-2 (con sus RGB primarios típicos, y un blanco D65 con un nivel de activación máximo [255, 255, 255] un brillo de referencia de, por ejemplo, 500 nits o menos). Por lo general, para dicha visualización de referencia, 8 bits son suficientes para mostrar todos los valores de gris entre aproximadamente 500 nits y aproximadamente 0.5 nits (es decir, con un rango de contraste de 1000:1 o inferior) en etapas visualmente pequeñas, a la vez que las imágenes HDR se codifican con una palabra de bits más alta, por ejemplo, 10 bits (la cual también es capturada por una cámara con una profundidad de pozo más grande y DAC, por ejemplo, 14 bits). En particular, las imágenes HDR suelen contener diversos valores de píxeles (de objetos de imágenes brillantes) por encima de una escena en blanco. En particular, diversos píxeles son más brillantes que 2 veces el blanco de una escena. Este blanco de la escena puede equipararse típicamente con el blanco de la pantalla de referencia NTSC/MPEG-2.
El número de bits usados para las imágenes HDR X puede ser típicamente mayor o igual al número de Y bits usados para imágenes LDR (X puede ser típicamente, por ejemplo, 10 o 12, o 14 bits (por canal de color si se utilizan diversos de los canales), y Y puede ser, por ejemplo, 8, o 10). Puede ser necesaria una transformación/asignación para ajustar los píxeles en un rango más pequeño, por ejemplo, una escala compresiva. Normalmente, puede estar implicada una transformación no lineal, por ejemplo, una codificación logarítmica puede codificar (como lumas) un rango de luminancia mucho mayor en una palabra de X bits que una codificación lineal, ya sea que las etapas de diferencia de luminancia de un valor al siguiente no sean equidistantes, pero tampoco es necesario que lo sean como ocurre con el sistema visual humano.
La Figura 2 ilustra un aparato para generar una señal de imagen. En la señal de imagen, los píxeles se codifican en palabras de N bits con al menos una luma codificada por píxel. Las palabras de N bits pueden comprender una pluralidad de componentes individuales. Por ejemplo, una palabra de N bits que representa un píxel puede dividirse en un número de secciones, cada una de las cuales contiene un número de bits que representan una propiedad para el píxel. Por ejemplo, las palabras de N bits pueden dividirse en un número de secciones, cada una de las cuales contiene un componente de valor de píxel correspondiente a un color primario. Por ejemplo, una palabra de N bits puede proporcionar un valor de píxel RGB en una sección que incluye bits que proporcionan el valor de píxel R, otra sección que incluye bits que proporcionan el valor de píxel G, y una tercera sección que incluye bits que proporcionan el valor de píxel B.
Las palabras de N bits que representan valores de píxeles HDR, se proporcionan de acuerdo con una representación de color. Se apreciará que se puede usar cualquier representación de color adecuada que permita la representación de píxeles HDR, que incluye, por ejemplo, una representación de color RGB, o YCrCb. También se apreciará que se pueden usar representaciones de colores múltiples primarios que utilicen más de tres primarios.
Se apreciará que el aparato se puede utilizar en cualquier ubicación adecuada en la ruta de distribución a partir de la generación de contenido de imagen hasta la representación de contenido de imagen. Sin embargo, la siguiente descripción se centrará en una realización en donde el aparato se implementa como parte del dispositivo 103 de procesamiento de contenido de la Figura 1.
El aparato comprende un receptor 201 el cual recibe valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits. El receptor 201 puede recibir específicamente una señal de imagen que comprende valores de píxeles para una imagen HDR. La señal puede recibirse a partir de cualquier fuente externa o interna adecuada, pero en el ejemplo específico, la señal es recibida por el dispositivo 103 de procesamiento de contenido a partir del aparato 101 proveedor de contenido.
De manera similar a las palabras de N bits generadas por el aparato de la Figura 2, las palabras de M bits recibidas también pueden comprender una pluralidad de componentes individuales. Por ejemplo, una palabra de M bits que representa un píxel puede proporcionarse en un número de secciones, cada una de las cuales contiene un número de bits que representan una propiedad del píxel. Por ejemplo, las palabras de M bits pueden dividirse en un número de secciones, cada una de las cuales contiene un componente de valor de píxel correspondiente a un color primario. Por ejemplo, una palabra de M bits puede proporcionar un valor de píxel RGB en una sección que incluye bits que proporcionan el valor de píxel R, otra sección que incluye bits que proporcionan el valor de píxel G, y una tercera sección que incluye bits que proporcionan el valor de píxel B.
Además, las palabras de M bits que proporcionan los valores de píxeles HDR se proporcionan de acuerdo con una representación del primer color. Se apreciará que se puede usar cualquier representación de color adecuada que permita la representación de píxeles HDR, que incluye, por ejemplo, una representación de color RGB, o YCrCb. También se apreciará que se pueden usar representaciones de colores múltiples primarios que utilicen más de tres primarios. Para mayor brevedad y claridad, la siguiente descripción se centrará en una señal de entrada que comprende valores de píxeles HDR como palabras de M bits de acuerdo con una representación de color RGB.
En algunas realizaciones, la representación de color de las palabras de M bits (de entrada) (la representación del primer color) y la representación de color de las palabras de N bits (de salida) (la representación del segundo color) puede ser la misma y de hecho N puede ser igual a M. Por lo tanto, en algunas realizaciones, se puede usar la misma representación de color para la señal de imagen (de salida) que para la señal de imagen recibida (de entrada).
En el ejemplo de la Figura 2, el receptor 201 está acoplado a un primer generador 203 el cual está dispuesto para incluir palabras de N bits en la señal de imagen. En el ejemplo específico, esto se hace generando paquetes de datos que incluyen las palabras de N bits para la imagen. Además, en el ejemplo, las representaciones de color y la longitud de las palabras para las señales de entrada y salida son las mismas y, por lo tanto, el primer generador 203 puede incluir directamente las palabras de M bits recibidas que representan los valores de píxeles HDR en la señal de imagen de salida, por ejemplo, generando directamente paquetes de datos adecuados o segmentos que comprenden los valores de M bits.
El receptor 201 está además acoplado a un segundo generador 205 el cual está dispuesto para generar e incluir un indicador en la señal de imagen el cual indica que los valores de píxeles HDR están codificados en la señal de imagen. Por lo tanto, se proporciona un indicador como parte de la señal de imagen que indica que la señal comprende valores HDR. El indicador puede incluirse, por ejemplo, en la señal de imagen al incluirse en un mensaje de datos o paquete de datos distribuido junto con los mensajes de datos o paquetes de datos que comprenden los datos de valor de píxel.
El primer y segundo generadores 203, 205 están acoplados a una unidad 207 de salida la cual está dispuesta para emitir la señal de imagen. En el ejemplo específico, la unidad 207 de salida puede simplemente transmitir los mensajes o paquetes de datos que contienen los datos y el indicador de valor de píxel.
Por lo tanto, en el ejemplo específico, la señal de imagen es una señal compuesta o dividida formada por un número de partes comunicadas independientemente. En el ejemplo específico, la señal de imagen comprende una pluralidad de diferentes tipos de paquetes de datos. Sin embargo, en otras realizaciones, la señal de imagen puede proporcionarse como un solo flujo de datos combinado que comprende tanto los datos como el indicador de valor de píxel. En dichos ejemplos, los datos proporcionados por el primer y segundo generadores 203, 205 pueden combinarse en un solo dato o flujo de bits por la unidad 207 de salida. Específicamente, la unidad 207 de salida puede comprender un multiplexor para multiplexar los datos en un solo flujo o archivo de datos.
El aparato de la Figura 2 genera una señal de imagen la cual no solo puede contener una representación eficiente de los datos de imagen HDR, sino la cual también proporciona una distribución y comunicación HDR flexible. En particular, puede proporcionar una compatibilidad con versiones anteriores mejorada y, por ejemplo, permitir o facilitar la introducción de imágenes HDR en sistemas y estándares no diseñados originalmente para imágenes HDR. Por ejemplo, puede permitir que un equipo con capacidad adecuada (tal como pantallas) procese la señal de imagen de acuerdo como sea apropiado para los datos HDR y, por lo tanto, se puede lograr un procesamiento condicional de los valores de píxeles recibidos con base en la presencia o ausencia de una indicación HDR.
En el ejemplo de la Figura 2, la representación de color de la señal de entrada es la misma que la representación de color de la señal de salida y, de hecho, las muestras HDR recibidas se incluyen directamente en la señal de imagen. Sin embargo, en diversas aplicaciones, la representación del primer color será diferente de la representación del segundo color.
La Figura 3 ilustra el aparato de la Figura 2 modificado para incluir un procesador 301 de transformación entre el receptor 201 y el primer generador 203. El procesador 301 de transformación está dispuesto para transformar los valores de píxeles de rango dinámico alto a partir de la representación del primer color a la representación del segundo color.
El procesador 301 de transformación puede estar dispuesto específicamente para realizar una compresión de la representación de los valores de píxeles HDR de tal manera que se reduzca el número requerido de bits. Por lo tanto, en diversos escenarios, la unidad de transformación está dispuesta para transformar las palabras de M bits de entrada en palabras de N bits de salida donde M es mayor que N. Por lo tanto, el procesador 301 de transformación típicamente puede estar dispuesto para generar una representación más compacta de los valores de píxeles HDR que permiten una velocidad de datos reducida.
La transformación puede incluir específicamente una representación no lineal de los rangos dinámicos. Por ejemplo, la señal de entrada puede recibirse como muestras de acuerdo con una representación de color RGB lineal de 16 bits. Por lo tanto, las palabras de entrada pueden ser palabras de entrada de 48 bits. Dicha representación tiende a proporcionar una representación bastante precisa del rango dinámico y reduce las bandas, etc. a límites aceptables incluso para rangos dinámicos relativamente altos. Sin embargo, requerir 48 bits por píxel da como resultado una velocidad de datos relativamente alta que es inadecuado o indeseable para diversas aplicaciones.
En consecuencia, el procesador 301 de transformación puede procesar las palabras de 48 bits para proporcionar una representación más eficaz. Este enfoque puede utilizar típicamente las características perceptivas del sistema visual humano. Una característica de la visión humana es que la sensibilidad a las variaciones de brillo tiende a ser no lineal. De hecho, el aumento de luminancia que se requiere para que un humano perciba un aumento (o disminución) de brillo aumenta para aumentar la luminancia. Por consiguiente, se pueden usar etapas más grandes para luminancias más altas que para luminancias más bajas y, en consecuencia, el procesador 301 de transformación puede, en diversas realizaciones, convertir las representaciones lineales de M bits en una representación no lineal de N bits. En diversos escenarios, se puede lograr una transformación adecuada aplicando una función logarítmica a los valores de píxeles.
En algunas realizaciones, la transformación puede implementarse como o que incluye un cambio en el esquema de cuantificación utilizado para los valores de píxeles. Un esquema de cuantificación puede proporcionar la relación entre los valores de píxeles reales y la luz correspondiente irradiada a partir de la pantalla (o a partir de una pantalla nominal). En particular, el esquema de cuantificación puede proporcionar las correlaciones entre valores de bits y un valor correspondiente de un rango dinámico completo.
Por ejemplo, un rango de visualización dado puede normalizarse al rango de 0-1 donde 0 corresponde a una luz mínima que se irradia y 1 corresponde a la luz máxima que se irradia. Un esquema de cuantificación lineal y uniforme simple puede simplemente dividir el rango de 0-1 en intervalos de cuantificación de igual tamaño. Por ejemplo, para una representación de 12 bits, el rango de 0-1 se divide en 4096 etapas iguales.
El procesador 301 de transformación puede cambiar el esquema de cuantificación de entrada aplicado a los componentes de la palabra de M bits a un esquema de cuantificación diferente el cual se aplica a las salidas de las palabras de N bits.
Por ejemplo, la cuantificación de entrada de 65336 etapas para cada componente de color puede convertirse en 1024 etapas. Sin embargo, en lugar de usar simplemente una cuantificación lineal correspondiente, el procesador 103 de transformación puede aplicar un esquema de cuantificación no lineal en donde específicamente el tamaño de las etapas de cuantificación aumenta para valores de bits crecientes (correspondientes a una salida de luz aumentada).
La representación no uniforme y no lineal refleja la percepción humana y, por lo tanto, en diversos casos puede permitir que el número reducido de bits proporcione una imagen que se percibe como de la misma calidad que la del número más alto de bits generado por una cuantificación uniforme y lineal.
El cambio de esquemas de cuantificación se puede realizar en principio des-cuantificando las palabras de M bits de entrada seguido de una cuantificación en las palabras de N bits. Sin embargo, en diversos escenarios, el procesador 103 de transformación puede simplemente convertir las palabras aplicando operaciones de bits adecuadas directamente en las palabras de M bits y, en particular, proporcionando una asignación no lineal de los 16 bits de cada componente de color de entrada en 10 bits del componente de color de salida correspondiente.
En algunas realizaciones, el procesador 301 de transformación puede transformar individual y por separado cada componente de las palabras de M bits en un componente correspondiente de las palabras de N bits. Por ejemplo, una palabra de M bits puede contener una muestra de píxel R, una muestra de píxel G, y una muestra de píxel B para una representación de color RGB y esto puede convertirse en una muestra de píxel R, una muestra de píxel G, y una muestra de píxel B para una representación de color RGB de la palabra de N bits, donde las muestras R, G y B se asignan a diferentes bits de las palabras de N bits.
Sin embargo, a menudo se puede lograr un rendimiento particularmente ventajoso mediante las palabras de N bits que comprenden tanto secciones individuales para cada componente como una sección común que representa un componente común para los componentes individuales de la palabra de N bits.
Específicamente, se puede proporcionar un valor de color separado para cada componente de color de la representación de color de las palabras de M bits. Por lo tanto, las palabras de M bits solo pueden proporcionarse como muestras de color separadas, tal como por ejemplo, en una representación RGB. Sin embargo, la representación de color de las palabras de N bits puede incluir un valor separado para cada componente de color (tal como para el componente R, G y B) pero, además, puede proporcionar un factor exponencial común para todos los componentes de color. Por lo tanto, la representación de N bits puede comprender cuatro secciones con tres secciones que proporcionan un valor de muestra individual para componentes de color individuales y una cuarta sección que proporciona un factor exponencial común para todos los valores de color. Como un ejemplo específico, la unidad 201 de transformación puede convertir de una representación RGB de M bits a una representación RGBE de N bits con el fin de proporcionar una representación más eficiente de los valores de píxeles HDR.
Se apreciará que en algunas realizaciones, el procesador 301 de transformación puede estar dispuesto para realizar un procesamiento más complejo y puede, por ejemplo, asignar a partir de una representación de color a otra teniendo en cuenta las características de la imagen, las características de visualización, etc.
Por ejemplo, el aparato puede estar dispuesto para seleccionar entre una gama de representaciones de color para codificar las muestras HDR, y puede seleccionar la que sea más adecuada para los datos de imagen actuales. Por ejemplo, para una secuencia de imágenes que tiene un rango dinámico muy alto, se puede usar una representación no lineal (por ejemplo, logarítmica) a la vez que para una secuencia de rangos de imágenes que tienen un rango dinámico más bajo se puede usar una representación lineal. El aparato está además dispuesto para incluir una indicación de la codificación seleccionada en la señal de imagen (por ejemplo, una indicación de una función de asignación de tonos, o función gamma, etc.). Por lo tanto, el indicador puede indicar la representación de color específica utilizada para las palabras de N bits de la señal de imagen.
Se apreciará que se puede utilizar cualquier asignación adecuada entre las palabras de M bits y las palabras de N bits (y, por lo tanto, entre las representaciones de color primero y segundo) sin restar valor a la invención.
En algunas realizaciones, el indicador puede comprender una indicación de una luminancia de pantalla asociada con la representación de color de las palabras de N bits. Por ejemplo, se puede proporcionar una indicación de la luminancia cubierta por el rango de codificación de colores.
Como un ejemplo específico, la representación del segundo color puede estar asociada con una visualización de referencia o nominal. La visualización de referencia puede corresponder a una luminancia máxima dada y la indicación puede indicar, por ejemplo, que el código más brillante (por ejemplo, 1023 para una representación de 10 bits) está destinado a corresponder a una luminancia de, por decir, 50 000 nits. Esto permite, por ejemplo, incluir una representación graduada de manera diferente, y un aparato receptor inteligente puede tomar eso en cuenta.
Dicha indicación de este tipo puede usarse en un receptor para adaptar las muestras de píxeles HDR recibidas a la luminancia de representación de la pantalla específica. De hecho, en diversos casos será más ventajoso realizar una asignación de las muestras de píxeles HDR en valores de activación para la pantalla teniendo en cuenta el rango de luminancia absoluta que se puede proporcionar.
Por ejemplo, si los valores de píxeles HDR se proporcionan simplemente como valores relativos a un rango dinámico normalizado (por decir de 0 a 1), la pantalla representará típicamente la imagen usando las luminancias fraccionarias correspondientes. Por ejemplo, un valor de píxel de 0.5 se representará como la mitad de la salida de luz máxima. Sin embargo, para contenido HDR y/o pantallas HDR, dicho enfoque puede no ser óptimo. Por ejemplo, una imagen de una playa con un sol en el cielo y algunas áreas oscuras puede usar el rango dinámico completo para proporcionar un sol muy brillante (luminoso) cuando se presenta en una pantalla de 50000 nits. Debido al rango dinámico grande, esto es posible sin dejar de proporcionar una playa y un cielo brillantes (pero más oscuros), y a la vez proporcionar detalles de las áreas de sombra. Sin embargo, si la misma imagen se presenta en una pantalla de 10000 nits, una escala lineal simple dará como resultado que el cielo y la playa estén representados por luminosidades mucho más bajas, lo que hará que parezcan relativamente oscuros y apagados. Además, el detalle de la sombra puede comprimirse tanto que el detalle no es perceptible (o incluso representable). En cambio, sería ventajoso que la pantalla recortara el sol muy fuerte para reducir los valores de luminancia a la vez que se mantiene o solo se reduce moderadamente la luminancia para el cielo y la playa. Por lo tanto, se puede realizar una asignación adaptativa y no lineal. Sin embargo, dicho enfoque requiere que la pantalla no solo considere las características de la pantalla, y especialmente el rango de luminancia, sino también que conozca las luminancias absolutas reales a las que se pretende que correspondan los valores de píxeles HDR recibidos.
El enfoque puede permitir, por ejemplo, que se realice una codificación de la imagen HDR de acuerdo con cualquier espacio HDR adecuado, a la vez que permite que la imagen se represente en cualquier pantalla, por ejemplo, una con salida de 1000 nits, una con salida de 20000 nits, etc. Esto se puede lograr realizando una asignación de gama y esta asignación de gama puede ser específicamente en respuesta a las diferencias entre las diferencias de luminancia absoluta entre la referencia para la codificación y la visualización real en la cual se representa. Por ejemplo, si una pantalla simplemente asignada en, por ejemplo, un rango HDR de 50000 nits a, por decir, 1000 nits disponibles en la pantalla específica (con todo comprimido linealmente), entonces la mayoría de los colores se volverían demasiado oscuros. Un mejor enfoque puede ser, por ejemplo, asignar las luminancias por encima de, por decir, 5000 nits, para que estén muy cerca del blanco de la pantalla (por ejemplo, 950 nits). Por ejemplo, el rango de 5000 nits a 50000 nits se puede asignar a 950 nits a 1000 nits; 1000 nits a 5000 nits se pueden asignar a 850 nits a 950 nits; 750 nits a 1000 nits a 750 nits a 850 nits, y el rango restante de 0-750 nits simplemente se puede asignar a sí mismo.
La señal de imagen se genera para incluir un segmento de datos en el cual se proporcionan datos de imagen de píxeles. Por ejemplo, la señal de imagen puede estar de acuerdo con un estándar que especifica segmentos de datos específicos en los cuales se incluyen valores de píxeles. En algunas realizaciones, dichos segmentos pueden usarse para valores de píxeles HDR o pueden usarse para valores de píxeles LDR. Por lo tanto, a veces el segmento de datos puede comprender valores de píxeles LDR y otras veces el segmento de datos puede contener valores de píxeles HDR. En dichas realizaciones, el indicador se usa para indicar el tipo de datos los cuales se incluyen en el segmento de datos. Por lo tanto, el indicador es indicativo de si el segmento de datos incluye datos HDR o datos LDR. Dicho enfoque permite un sistema muy flexible y, en particular, puede facilitar la introducción de la comunicación/distribución de datos HDR en los sistemas y estándares existentes, ya que los segmentos de datos LDR definidos existentes pueden reutilizarse para datos h Dr con el único requisito de que se introduzca un nuevo indicador.
La Figura 4 ilustra un ejemplo de un colector para procesar una señal proporcionada por un aparato como se describió anteriormente. En el ejemplo específico, el colector es una pantalla dispuesta para presentar la imagen de la señal de imagen. El colector puede ser específicamente la pantalla 107 de la Figura 1.
La pantalla 107 comprende un receptor 401 el cual recibe la señal de imagen. La señal de imagen comprende un segmento de datos el cual puede contener valores de píxeles de rango dinámico alto en palabras de N bits de acuerdo con una representación de color o puede contener valores de píxeles de rango dinámico bajo (de acuerdo con otra representación de color). La señal de imagen comprende además un indicador el cual es indicativo de si el segmento de datos comprende los valores de píxeles de rango dinámico alto o los valores de píxeles de rango dinámico bajo.
El receptor 401 está acoplado a un extractor 403 el cual está dispuesto para extraer los datos del segmento de datos. El extractor 403 recupera así los datos de la muestra de píxeles de la señal de imagen.
El extractor 403 está acoplado a un procesador para procesar los datos de muestra de píxeles. En el ejemplo, el procesador es un controlador 405 de pantalla el cual además está acoplado a un panel 407 de pantalla y al receptor 401.
El controlador 405 de pantalla recibe los datos de muestra de píxeles del extractor 403 y el indicador del receptor 401 y procede a generar una señal de activación de visualización para el panel 407 de pantalla.
El procesamiento del controlador 405 de pantalla depende de si el indicador indica que los datos de píxeles son para una imagen HDR o LDR. Por ejemplo, si la pantalla es una pantalla LDR, puede generar directamente señales de activación correspondientes a los valores de píxeles para la pantalla siempre que el indicador refleje que los valores de los píxeles ya son valores LDR. Sin embargo, si el indicador refleja que los valores de píxeles recibidos son realmente valores de píxeles HDR, el controlador 405 de pantalla puede proceder a realizar la asignación de la gama y otras conversiones de HDR a LDR. Por ejemplo, se puede aplicar una escala no lineal a los valores de píxeles de HDR (por ejemplo, correspondiente a una operación de registro y una operación de recorte). Dicha conversión puede tomar en cuenta además el rango dinámico asociado con los datos HDR recibidos al adaptar la conversión.
Por el contrario, si la pantalla es una pantalla HDR, puede usar directamente valores de píxeles cuando el indicador indica que los datos de píxeles son datos HDR, y puede realizar una conversión de gama (que incluye la mejora de luminancia) cuando el indicador indica que los datos de píxeles son datos LDR.
En algunas realizaciones, el sistema puede estar dispuesto para proporcionar una codificación eficaz de los valores de píxeles de HDR de tal manera que no se utilicen todos los bits de datos disponibles. Por ejemplo, el segmento de datos puede estar dispuesto para proporcionar valores de datos de píxeles en palabras de K bits. El segmento de datos puede ser, por ejemplo, un segmento de datos de mejora del color el cual puede proporcionar una precisión mejorada. Por ejemplo, el segmento de datos puede proporcionar valores de datos LDR RGB de 16 bits correspondientes a que K sea igual a 48 bits. Sin embargo, los datos HDR pueden generarse de acuerdo con una codificación eficiente, tal como por ejemplo de acuerdo con una representación RGBE de 32 bits. En dichas realizaciones, hay 16 bits adicionales para cada píxel no utilizado por los datos HDR. En algunos casos, estos datos adicionales pueden utilizarse para proporcionar otra información. Por ejemplo, los bits no utilizados pueden usarse para proporcionar información de color adicional. En otras formas de realización, los bits pueden definirse en un valor constante para proporcionar una codificación más eficaz, reduciendo así la velocidad de transmisión de datos.
El aparato de la Figura 2 (o 3) está dispuesto para generar una señal de imagen la cual comprende un segundo indicador que indica que el segmento de datos se usa para datos LDR incluso en el caso en donde se usa para datos LDR. Por lo tanto, este segundo indicador indica que los datos del segmento de datos son datos LDR convencionales de acuerdo con una representación LDR adecuada tanto en el caso en que el segmento de datos sí contiene dichos datos LDR como también cuando contiene datos HDR de acuerdo con una representación del color diferente.
Por lo tanto, en dicha realización de este tipo, la señal de imagen contiene una pluralidad de indicadores la cual, en algunos escenarios, pueden estar en conflicto entre sí (o cuando un indicador puede ser “ incorrecto”).
El enfoque puede permitir que algunos equipos, procesamientos y funcionalidades utilicen solo el segundo indicador, lo que da como resultado que los datos se manejen exactamente como si fueran datos LDR. Dicho enfoque es particularmente adecuado para componentes que no son capaces de manejar datos HDR (por ejemplo, equipos heredados) pero que pueden manejar señales de imagen con datos LDR. Sin embargo, al mismo tiempo, se pueden disponer otros equipos, procesamiento y funcionalidad para usar el primer indicador para interpretar correctamente los datos del segmento de datos y, en consecuencia, procesarlos como datos h Dr . En consecuencia, dichos componentes con capacidad HDR pueden aprovechar al máximo los datos HDR.
El enfoque puede ser particularmente adecuado para mejorar los sistemas y estándares LDR existentes para incluir datos HDR. Por ejemplo, el segundo indicador puede ser un indicador del sistema/estándares LDR originales, siendo el primer indicador un nuevo indicador introducido en el sistema al mejorarlo para incluir HDR. El nuevo indicador puede proporcionarse en una sección opcional de la señal de imagen. De esta forma, el equipo existente, por ejemplo, el cual es utilizado para comunicación, enrutamiento, conmutación, etc. puede procesar la señal exactamente de la misma manera que una señal LDR con base únicamente en el primer indicador. Por lo tanto, dado que los datos HDR están codificados en un segmento de datos el cual puede usarse para datos LDR, y el segundo indicador corresponde a ellos, el equipo heredado no conocerá la diferencia entre una señal HDR y una señal LDR. Por consiguiente, el equipo de distribución de LDR existente puede usarse para distribuir los datos HDR a partir de una fuente HDR a un colector HDR. Sin embargo, el colector con capacidad HDR estará dispuesto para buscar el primer indicador y, en consecuencia, podrá determinar que los datos contenidos en el segmento de datos son datos HDR y no datos LDR.
A continuación, se proporcionará un ejemplo específico de una realización en donde la señal de imagen se genera de acuerdo con el estándar HDMI™. La realización utiliza el modo de Color Profundo de HDMI™ para introducir contenido HDR.
HDMI™ admite la transmisión de contenido de vídeo de diversas codificaciones de píxeles tales como YCbCr 4:4:4, YCbCr 4:2:2 y RGB 4:4:4. En los formatos de codificación estándar HDMI™, están disponibles 8 bits por componente correspondientes a los valores de píxeles que se proporcionan en palabras de 24 bits. Sin embargo, además, HDMI™ admite la transmisión de contenido con una mayor precisión de color y/o una gama de colores más amplia que los 8 bits normales por componente. Esto se denomina modo de Color Profundo y en este modo HDMI™ admite hasta 16 bits por componente (48 bits por píxel, es decir, palabras de 48 bits).
El modo de color profundo se basa en que la velocidad de reloj del enlace aumenta con una relación a la profundidad de píxel /24 (24 bits/píxel = 1.0 x reloj de píxel) y se transmite un paquete de control adicional que indica al colector la profundidad de color y el empaquetado de los bits (el paquete de control puede ser un ejemplo del segundo indicador mencionado anteriormente). Este mismo mecanismo también se utiliza en el ejemplo para la transmisión de contenido HDR y no se requieren cambios en este mecanismo.
En el ejemplo, el contenido HDR se comunica en los segmentos de datos de Color Profundo en lugar que en los datos LDR de precisión mejorada. La comunicación se logra configurando la comunicación HDMI™ como para un modo de Color Profundo, pero con una indicación adicional que se introduce para reflejar que los datos no son datos LDR mejorados sino que son datos HDR.
Además, la codificación de píxeles no solo utiliza el enfoque lineal RGB de 16 bits por componente del modo Color Profundo con un rango dinámico mejorado, sino que proporciona los datos HDR utilizando codificaciones de píxeles HDR eficientes tales como, por ejemplo, RGBE, XYZE, LogLuv, o por ejemplo la codificación de flotante de precisión simple RGB de 12 bits que también se utiliza para el modo Color Profundo de HDMI™. Estos datos codificados HDR más eficientes se transmiten entonces utilizando el modo de transmisión para Color Profundo de HDMI™.
Por ejemplo, como se ilustra en la Figura 5, una palabra de 48 bits Color Profundo comprende tres componentes de 16 bits correspondientes a una muestra lineal R, G y B. La codificación de datos HDR en dicha representación de color lineal tiende a ser sub-óptima, y en el ejemplo de la Figura 5, la palabra de 48 bits se utiliza en cambio para proporcionar una parte fraccionaria de 8 bits para cada muestra R, G y B junto con un exponente de 8 bits. O podría usarse para partes fraccionarias de 3*12 o 3*14 bits exponente de 6 bits, etc.
El valor del exponente proporciona un factor de escala común para las tres partes fraccionarias, siendo el factor de escala igual a 2 a la potencia del valor del exponente menos 128. Las partes fraccionarias pueden ser lineales y pueden proporcionarse como valores de punto flotante. Dicha codificación RGBE puede proporcionar una representación mucho más eficiente del rango dinámico muy grande asociado con los datos HDR. De hecho, en el ejemplo, la codificación utiliza solo 32 bits, por lo que deja más ancho de banda en la interfaz el cual puede, por ejemplo, utilizarse para la transmisión de formatos 3D o 4k2k
El enfoque permite una comunicación eficiente de HDR usando HDMI™ y de hecho requiere cambios mínimos en el estándar HDMI™. Se puede lograr una introducción facilitada de HDR a HDMI™ y, en particular, no se requiere hardware nuevo. Además, los equipos existentes pueden ser capaces de cambiar datos HDR, ya que pueden tratarse como datos de Color Profundo.
En el ejemplo, la interfaz HDMI™ está configurada en modo Color Profundo pero con un indicador configurado para indicar que el contenido transmitido no son datos Color Profundo sino más bien datos HDR. El indicador se puede proporcionar configurando campos adecuadamente reservados en un Infoframe AVI (Información de Vídeo Auxiliar). Como otro ejemplo, el indicador puede proporcionarse en la forma de una nueva trama de información definida específicamente para indicar la transmisión de contenido HDR. Como aún otro ejemplo, el infoframe específico del proveedor HDMI™ puede usarse para proporcionar la indicación.
Con más detalle, la señalización en HDMI™ se basa en CEA 861-D. CEA861-D define la señalización a partir del colector a la fuente a través de E-EDID y a partir de la fuente al colector a través del infoframe AVI. El infoframe AVI proporciona señalización de tramas sobre muestreo de color y croma, sobre y sub-escaneo y relación de aspecto.
De acuerdo con algunas realizaciones, la interfaz HDMI está configurada para indicar la transmisión de contenido de Color Profundo pero preferiblemente con una codificación de píxeles HDR en la forma de por ejemplo, RGBE (u otras representaciones HDR eficientes).
Un posible (parte de un) infoframe AVI de ejemplo puede ser.
Figure imgf000015_0001
Y1 y Y0 indican el formato de muestra del componente de color y el muestreo de croma utilizado. Para la transmisión de contenido HDR, esto puede ser 00 o 10 indicando RGB y YCbCr 4:4:4. Preferiblemente, el valor 11 reservado actualmente puede usarse para indicar RGBE u otra representación HDR adecuada.
C1 y C0 indican la colorimetría del contenido transmitido. Para el contenido HDR, esto puede definirse en 00, lo que significa que no hay datos, o en 11 para indicar que se usa una colorimetría extendida, como se indica en los bits ECO, EC1 y EC2.
ITC indica si el contenido es contenido de IT y este bit se usa junto con CN1 y CN0 para indicar al colector que debe impedir cualquier operación de filtrado o reconstrucción analógica. Para contenido HDR, este bit normalmente se puede definir.
EC2, EC1 y EC0 indican el espacio de color, colorimetría del contenido. Para HDR, se puede utilizar una de las gamas más amplias definidas actualmente. Además, los campos actualmente reservados se pueden utilizar para indicar otros espacios de color más adecuados para futuras pantallas HDR.
Q1 y Q0 indican el rango de cuantificación RGB, para el contenido HDR, el rango completo (10) u 11 (el cual está reservado actualmente) podría usarse para indicar que el contenido HDR se transmite en el modo de Color Profundo. YQ1 y YQO indican lo mismo pero para la cuantificación de YCC. Nuevamente, hay dos campos reservados que podrían usarse con el propósito de indicar el contenido HDR llevado en el modo Color Profundo, tal como por ejemplo, YCrCb de 36 bits.
CN1 y CN0 indican el tipo de contenido (Gráficos, Fotografía, Cine, Juego) para la aplicación de TI y se utilizan en combinación con el bit de TI.
Para permitir que el Colector (la pantalla) indique que admite contenido HDR, se puede implementar una extensión de la especificación E-EDID. HDMI™ utiliza E-EDID para señalizar las capacidades de visualización a partir de la pantalla hacia el dispositivo de reproducción. La especificación HDMI™, a través de un bloque de datos específico del proveedor HDMI™ en el E-EDID, ya especifica cómo indicar la compatibilidad con la transmisión en modo Color Profundo. Esto puede mejorarse para incluir también la posibilidad de compatibilidad con formatos HDR tales como RGBE u otras codificaciones de color HDR.
Como otro ejemplo, puede incluirse un indicador para indicar que la pantalla admite contenido HDR y una lista de las codificaciones de color que puede admitir además de las ya especificadas en HDMI™ tales como; RGBE, XYZE, LogLuv 32, o incluso EXR.
Una versión extendida del bloque de datos específico del proveedor de HDMI™ con señalización para soporte HDR puede ser, por ejemplo, la siguiente:
Figure imgf000016_0001
Como otro ejemplo, el enfoque puede usarse para una interfaz DisplayPort. Por ejemplo, se puede usar un enfoque similar al descrito para HDMI con los datos de imagen de un flujo de contenido principal que contiene datos LDR, datos HDR o ambos. Puede proporcionarse un indicador para indicar el tipo de datos de imagen en el flujo de contenido. Los datos de control y configuración (que incluye en particular el indicador) pueden proporcionarse en Paquetes de Datos Secundarios, y pueden proporcionarse en particular usando InfoFrames CEA 861 como se describe para HDMI. Además, el canal AUX puede usarse para intercambiar información de control. En particular, la capacidad de la pantalla para manejar datos HDR puede comunicarse mediante el canal AUX.
Como aún otro ejemplo, el enfoque puede usarse para sistemas Blu-ray Disc™.
Se apreciará que el sistema descrito puede usarse con diversos tipos diferentes de creación, provisión y consumo de contenido, que incluye, por ejemplo, sistemas de consumo.
La Figura 6 muestra esquemáticamente un ejemplo de algunos de los aparatos que pueden estar presentes en el lado de creación (transmisión) para ser utilizados para crear una buena señal de descripción de color. En el ejemplo, los aparatos están integrados con una cámara de película de celuloide clásica (se tiene en cuenta que la representación de asistencia digital de la escena solo [en cuanto a los valores de píxeles de las grabaciones analógicas frente a las digitales] puede vincularse completamente a la imagen de celuloide realmente capturada si se incorporan modelos de calibración de material de película para asignar los dos (sin embargo, el desarrollo sigue siendo una variable desconocida con la que se puede jugar adicionalmente), pero incluso sin ellos, la grabación digital aún puede producir información complementaria muy valiosa, por ejemplo, si está co-registrado geométricamente con la ventana de vista capturada con celuloide, se pueden definir regiones, y además de los valores de grano desarrollados capturados con celuloide, se pueden codificar, por ejemplo, valores de vista de escena reales lineales a través de la captura digital), porque la persona experta comprenderá cómo transponer estos componentes al campo de un clasificador de color, o un transcodificador que hace lo mismo para, por ejemplo, una vieja foto de Laurel y Hardy.
La Figura 6 muestra adjunta a la cámara 601, una pantalla 603 digital (la cual, por ejemplo, recibe una señal de un CCD co-registrado con la lente de la cámara). Sin embargo, la conexión 604 no necesita ser fija, sino que también puede ser un transmisor para un número de pantallas separadas (por ejemplo, una para el operador de la cámara y otra en la pila de vista general del director). Sobre la pantalla 603, el operador de cámara o director de fotografía puede dibujar, por ejemplo, una región 650 la cual saben que han calibrado con la iluminación de su escenario como una parte oscura de la imagen, lo cual se puede hacer con por ejemplo, un lápiz 608 óptico u otro medio de entrada de interfaz de usuario [mostramos solo un ejemplo, porque creemos que la persona experta puede comprender bien qué tipos de sistema permiten que un usuario proporcione comentarios sobre una imagen mostrada]. La pantalla 603 puede almacenar información agregada en una memoria 606 (por ejemplo, una tarjeta de memoria desmontable), o comunicarse a través de un sistema 605 de transmisión. También puede recibir información adicional a partir de un dispositivo 620 de análisis de escena en el lugar de filmación (el cual puede ser simplemente un fotómetro o incluso un espectrómetro de muestreo espacial), a través de su sistema 621 de transmisión, el cual también puede transmitir al lugar de acumulación de datos final (es decir, 640). Además, los medidores 630 en escena (es decir, medidores de iluminación local para medir cómo se iluminan las caras de los actores, especialmente cuando hay una iluminación muy variable; sistemas de esferas orientados a la distribución de la iluminación circundante, etc.) pueden transmitir sus datos a cualquier parte del sistema a través de su sistema 631 de transmisión. La pantalla receptora puede entonces intentar reproducir la luz en su brillo original, o al menos una fracción (o función) de la misma, típicamente de acuerdo con algún modelo psicovisual para crear una apariencia similar o una apariencia artística, etc. Todos los datos se acumulan en un aparato 640 de acumulación de datos con memoria integrada, típicamente un ordenador (con sistema 641 de transmisión).
El sistema que se ilustra en la Figura 6 puede, por lo tanto, por ejemplo, ser utilizado por un operador para generar una imagen LDR mediante clasificación de color/asignación de tonos manual (y también se puede componer una imagen HDR, o al menos una vista parcial). La imagen LDR resultante se puede codificar y representar en la primera imagen de píxeles. El sistema puede además determinar automáticamente los parámetros para generar la imagen HDR. Alternativamente, el operador también puede utilizar el sistema de la Figura 6 para generar los datos de extensión HDR, por ejemplo, mediante un proceso semiautomático.
La Figura 7 muestra un ejemplo de sistema de decodificación y visualización de imágenes en el lado de recepción, por ejemplo, en la sala de estar de un consumidor (la persona experta comprenderá cómo se verá un sistema similar de acuerdo con los principios de nuestra invención en, por ejemplo, una sala de cine digital). Una realización del aparato 701 de procesamiento de imágenes de representación de color es un decodificador (el cual puede corresponder al dispositivo 103 de procesamiento de contenido de la Figura 1) con un lector de Blu-ray incorporado (pero este también puede ser, por ejemplo, un ordenador portátil o dispositivo portátil como un teléfono móvil, etc., es decir, el aparato 701 puede ser tan pequeño como una tarjeta de inserción [siempre que pueda leer las especificaciones del régimen, y permitir el procesamiento de color con esta] o tan grande como un estudio de transcodificación de cine profesional) puede recibir un Blu-ray 702 con toda la señal de imagen de extensión LDR/HDR codificada en este, es decir, tanto la primera imagen con el LDR como la segunda imagen con datos de extensión HDR incluidos.
El aparato puede, como otro ejemplo, recibir las señales a través de una primera conexión 703 a, por ejemplo, un cable 704 de transmisión de señal de televisión (o antena, o entrada para fotos digitales en una tarjeta de memoria, etc.; la señal de imagen también puede significar de diversas maneras, por ejemplo, una señal codificada estándar de televisión, o un archivo de imagen sin procesar, etc.) el cual lleva las señales de entrada (típicamente compresión codificada). En algunas realizaciones, las dos imágenes podrían proporcionarse a través de dos rutas, por ejemplo, los datos de descripción HDR pueden venir a través de otro medio a través de un segundo conector 704, por ejemplo, conectado a internet 705.
El aparato 701 tiene un IC el cual tiene al menos un extractor 711 dispuesto para extraer los datos y sacarlos directamente o convertirlos a nuevos valores más adecuados para realizar un procesamiento de imágenes controlado por una unidad 712 de procesamiento de imágenes. Esto puede ser realizado de manera tan simple como para aplicar solo algunas transformaciones de representación de tono a los píxeles correspondientes al régimen especial que se va a representar, o tener algoritmos complejos, por ejemplo, típicamente correspondiente a cualquiera de los algoritmos que se pueden aplicar en el lado de creación, por ejemplo, un algoritmo/unidad de segmentación y/o seguimiento.
El reproductor 701 puede emitir su imagen de salida IR' de representación intencionada mejorada a la pantalla/televisión a través de un cable 720 de vídeo (por ejemplo, HDMI), pero dado que la televisión puede hacer (o se le puede solicitar que realice) procesamiento adicional (en su imagen IC 731 de análisis y/o procesamiento), una segunda conexión (cable o inalámbrica) 721 puede estar presente para las señales de control c S (las cuales pueden comprender cualquier dato de la señal y/o datos de control derivados de la misma). Normalmente, estas señales de control adicionales se pueden agregar a través del cable de vídeo, actualizando, por ejemplo, el protocolo HDMI (inalámbrico). El aparato 723 también puede enviar señales de color a través de la conexión 723 a una segunda pantalla 740 de color ambiental, la cual también puede obtener sus señales de entrada de color de representación previstas a través de la pantalla 730. La pantalla de ejemplo tiene una retroiluminación LED 732, ideal para la representación HDR. Pueden estar presentes dispositivos de medición del entorno como el dispositivo 780 de medición, por ejemplo, una cámara barata la cual puede comprobar el entorno del televisor, las luces de la habitación, los reflejos en la placa frontal del televisor, la visibilidad de las escalas de grises de calibración, etc., y pueden comunicar esta información al aparato 701 y/o a la pantalla 730.
Los componentes algorítmicos divulgados en este texto pueden (total o parcialmente) realizarse en la práctica como hardware (por ejemplo, partes de un IC específico de la aplicación) o como software que se ejecuta en un procesador de señal digital especial, o un procesador genérico, etc.
Debería ser comprensible para el experto en nuestra presentación qué componentes pueden ser mejoras opcionales y pueden realizarse en combinación con otros componentes, y cómo las etapas (opcionales) de los métodos corresponden a los respectivos medios de los aparatos, y viceversa. La palabra “aparato” en esta solicitud se usa en su sentido más amplio, es decir, un grupo de medios que permiten la realización de un objetivo particular y, por lo tanto, pueden, por ejemplo, ser (una pequeña parte de) un IC, o un dispositivo dedicado (tal como un dispositivo con una pantalla), o parte de un sistema en red, etc. “Disposición” también está destinada a ser utilizada en el sentido más amplio, por lo que puede comprender, entre otras cosas, un solo aparato, una parte de un aparato, una colección de (partes de) aparatos cooperantes, etc.
Debe entenderse que la denotación de producto de programa informático abarca cualquier realización física de una colección de comandos que habilitan un procesador genérico o de propósito especial, después de una serie de etapas de carga (las cuales pueden incluir etapas de conversión intermedias, tales como la traducción a un lenguaje intermedio, y un lenguaje de procesador final) para ingresar los comandos en el procesador y ejecutar cualquiera de las funciones características de una invención. En particular, el producto de programa informático se puede realizar como datos en un portador, tales como por ejemplo, un disco o una cinta, los datos presentes en una memoria, los datos que viajan a través de una conexión de red -por cable o inalámbrica-, o el código de programa en papel. Aparte del código de programa, los datos característicos necesarios para el programa también pueden incorporarse como un producto de programa informático. Algunas de las etapas necesarias para el funcionamiento del método pueden estar ya presentes en la funcionalidad del procesador en lugar de estar descritas en el producto del programa informático, tales como las etapas de entrada y salida de datos.
Se apreciará que la descripción anterior para mayor claridad ha descrito realizaciones de la invención con referencia a diferentes circuitos, unidades y procesadores funcionales. Sin embargo, será evidente que se puede utilizar cualquier distribución adecuada de funcionalidad entre diferentes circuitos, unidades o procesadores funcionales sin restar valor a la invención. Por ejemplo, la funcionalidad que se ilustra para ser realizada por procesadores o controladores separados puede ser realizada por el mismo procesador o controladores. Por lo tanto, las referencias a unidades funcionales o circuitos específicos sólo deben verse como referencias a medios adecuados para proporcionar la funcionalidad descrita en lugar de indicativos de una estructura u organización lógica o física estricta.
La invención se puede implementar en cualquier forma adecuada, que incluye hardware, software, firmware o cualquier combinación de estos. La invención puede implementarse opcionalmente, al menos en parte, como software informático que se ejecuta en uno o más procesadores de datos y/o procesadores de señales digitales. Los elementos y componentes de una realización de la invención pueden implementarse de manera física, funcional y lógica de cualquier manera adecuada. De hecho, la funcionalidad puede implementarse en una sola unidad, en una pluralidad de unidades o como parte de otras unidades funcionales. Como tal, la invención puede implementarse en una sola unidad, o puede distribuirse de manera física y funcional entre diferentes unidades, circuitos y procesadores.
Aunque la presente invención se ha descrito en relación con algunas realizaciones, no se pretende que se limite a la forma específica aquí expuesta. Más bien, el alcance de la presente invención está limitado únicamente por las reivindicaciones adjuntas. Además, aunque puede parecer que se describe una característica en conexión con realizaciones particulares, un experto en la técnica reconocerá que diversas características de las realizaciones descritas pueden combinarse de acuerdo con la invención. En las reivindicaciones, el término que comprende no excluye la presencia de otros elementos o etapas.
Además, aunque se enumeran individualmente, se pueden implementar una pluralidad de medios, elementos, circuitos o etapas del método, por ejemplo, un solo circuito, unidad o procesador. Además, aunque se pueden incluir características individuales en diferentes reivindicaciones, estas posiblemente se pueden combinar de manera ventajosa, y la inclusión en diferentes reivindicaciones no implica que una combinación de características no sea factible y/o ventajosa. Además, la inclusión de una característica en una categoría de reivindicaciones no implica una limitación a esta categoría, sino que indica que la característica es igualmente aplicable a otras categorías de reivindicaciones, de acuerdo como corresponda. Además, el orden de las características en las reivindicaciones no implica ningún orden específico en el cual se deban trabajar las características y, en particular, el orden de las etapas individuales en una reivindicación de método no implica que las etapas deban realizarse en este orden. Más bien, las etapas se pueden realizar en cualquier orden adecuado. Además, las referencias singulares no excluyen una pluralidad. Por lo tanto, las referencias a “un”, “una”, “primero”, “segundo”, etc. no excluyen una pluralidad. Los signos de referencia en las reivindicaciones se proporcionan simplemente como un ejemplo aclaratorio y no se interpretarán como limitantes del alcance de las reivindicaciones de ninguna manera.

Claims (7)

REIVINDICACIONES
1. Un aparato para generar una señal de imagen en la cual los píxeles están codificados en palabras de N bits, comprendiendo el aparato:
un receptor (201) configurado para obtener valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits;
un primer generador (203) configurado para codificar los valores de píxeles de rango dinámico alto como las palabras de N bits definidas por una representación del segundo color, en donde las palabras de N bits se asignan a partir de las palabras de M bits;
en donde el primer generador (203) está configurado además para incluir alternativamente las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo en un segmento de la señal de imagen, y
un segundo generador (205) dispuesto para incluir en la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, comprendiendo el indicador además datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa de que las palabras de N bits de rango dinámico alto se incluyen en el segmento, en donde el segundo generador (205) está además dispuesto para incluir un segundo indicador en la señal de imagen, indicando el segundo indicador que el segmento se está utilizando para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende las palabras de N bits de rango dinámico alto.
2. El aparato de acuerdo con la reivindicación 1, en donde la representación del primer color es diferente de la representación del segundo color, en donde el aparato comprende además una unidad (301) de transformación para transformar los valores de píxeles de rango dinámico alto a partir de la representación del primer color a la representación del segundo color.
3. El aparato de la reivindicación 2 en donde la unidad de transformación implementa una compresión en las palabras de N bits a partir de palabras de M bits las cuales tienen un valor M el cual es mayor que el valor N, en donde se usa un esquema de cuantificación diferente para los valores de píxeles en las palabras de N bits de acuerdo con la representación del segundo color que el esquema de cuantificación de los valores de píxeles en las palabras de M bits.
4. Un método para generar una señal de imagen en la cual los píxeles se codifican en palabras de N bits, comprendiendo el método las etapas de:
obtener valores de píxeles de rango dinámico alto de acuerdo con una representación del primer color en palabras de M bits;
codificar los valores de píxeles de rango dinámico alto en la señal de imagen como las palabras de N bits definidas por una representación del segundo color, en donde las palabras de N bits se asignan a partir de las palabras de M bits;
incluir en un segmento de la señal de imagen alternativamente las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo;
incluir en la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, comprendiendo el indicador además datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa que las palabras de N bits de rango dinámico alto se incluyen en el segmento, en donde el método está además dispuesto para incluir un segundo indicador en la señal de imagen, indicando el segundo indicador que el segmento se está utilizando para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende las palabras de N bits de rango dinámico alto.
5. El método de generar una señal de imagen en la cual los píxeles están codificados en palabras de N bits como se reivindica en la reivindicación 4, en donde la representación del primer color es diferente de la representación del segundo color, comprendiendo el método la etapa de transformar las palabras de M bits en las palabras de N bits de acuerdo con la representación del segundo color.
6. El método de generar una señal de imagen en la cual los píxeles se codifican en palabras de N bits como se reivindica en la reivindicación 5, en donde la transformación comprende comprimir en las palabras de N bits a partir de palabras de M bits las cuales tienen un valor M el cual es mayor que el valor N, en donde se usa un esquema de cuantificación diferente para los valores de píxeles en las palabras de N bits de acuerdo con la representación del segundo color que el esquema de cuantificación de los valores de píxeles en las palabras de M bits.
7. Una señal de imagen en la cual los píxeles están codificados en palabras de N bits, comprendiendo la señal de imagen un segmento el cual, alternativamente, comprende palabras de N bits de rango dinámico alto de acuerdo con una representación del segundo color, el cual se asigna a partir de las palabras de M bits de entrada de rango dinámico alto de acuerdo con a una representación de color del primer color, o comprende valores de píxeles de rango dinámico bajo;
comprendiendo la señal de imagen un indicador que indica si el segmento comprende las palabras de N bits de rango dinámico alto o los valores de píxeles de rango dinámico bajo, cuyo indicador comprende además datos que especifican cómo se realizó una asignación de las palabras de M bits a las palabras de N bits en la alternativa que las palabras de N bits de rango dinámico alto se incluyen en el segmento;
en donde la señal de imagen comprende un segundo indicador el cual indica que el segmento se está utilizando para valores de píxeles de rango dinámico bajo tanto cuando el segmento comprende los valores de píxeles de rango dinámico bajo como cuando el segmento comprende palabras de N bits de rango dinámico alto.
ES19203489T 2011-05-10 2012-04-27 Generación y procesamiento de señales de imagen de rango dinámico alto Active ES2899979T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP11165491 2011-05-10

Publications (1)

Publication Number Publication Date
ES2899979T3 true ES2899979T3 (es) 2022-03-15

Family

ID=46147540

Family Applications (2)

Application Number Title Priority Date Filing Date
ES12722877T Active ES2974956T3 (es) 2011-05-10 2012-04-27 Generación y procesamiento de señales de imágenes de alto rango dinámico
ES19203489T Active ES2899979T3 (es) 2011-05-10 2012-04-27 Generación y procesamiento de señales de imagen de rango dinámico alto

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES12722877T Active ES2974956T3 (es) 2011-05-10 2012-04-27 Generación y procesamiento de señales de imágenes de alto rango dinámico

Country Status (11)

Country Link
US (2) US10097822B2 (es)
EP (3) EP4375982A2 (es)
JP (1) JP6234920B2 (es)
KR (2) KR102135841B1 (es)
CN (1) CN103582911B (es)
BR (1) BR112013028556B1 (es)
ES (2) ES2974956T3 (es)
MX (1) MX2013012976A (es)
PL (2) PL2707868T3 (es)
RU (1) RU2611978C2 (es)
WO (1) WO2012153224A1 (es)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2745507A1 (en) 2011-09-27 2014-06-25 Koninklijke Philips N.V. Apparatus and method for dynamic range transforming of images
EP2959676B1 (en) * 2013-02-21 2020-09-23 Dolby Laboratories Licensing Corporation Systems and methods for appearance mapping for compositing overlay graphics
RU2633128C2 (ru) * 2013-02-21 2017-10-11 Конинклейке Филипс Н.В. Улучшенные способы и устройства кодирования и декодирования hdr изображения
US8866975B1 (en) * 2013-05-02 2014-10-21 Dolby Laboratories Licensing Corporation Backwards-compatible delivery of digital cinema content with higher dynamic range and related preprocessing and coding methods
JP2015005878A (ja) * 2013-06-20 2015-01-08 ソニー株式会社 再生装置、再生方法、および記録媒体
WO2014203746A1 (ja) 2013-06-20 2014-12-24 ソニー株式会社 再生装置、再生方法、および記録媒体
TWI684364B (zh) 2013-06-21 2020-02-01 日商新力股份有限公司 送訊裝置、高動態範圍影像資料送訊方法、收訊裝置、高動態範圍影像資料收訊方法及程式
KR102249202B1 (ko) * 2013-06-24 2021-05-10 소니 주식회사 재생 장치, 재생 방법 및 기록 매체
JP2015008360A (ja) * 2013-06-24 2015-01-15 ソニー株式会社 再生装置、再生方法、および記録媒体
JP2015008361A (ja) * 2013-06-24 2015-01-15 ソニー株式会社 再生装置、再生方法、および記録媒体
TWI630820B (zh) 2013-07-19 2018-07-21 新力股份有限公司 File generation device, file generation method, file reproduction device, and file reproduction method
TWI630821B (zh) 2013-07-19 2018-07-21 新力股份有限公司 File generation device, file generation method, file reproduction device, and file reproduction method
TWI632810B (zh) * 2013-07-19 2018-08-11 新力股份有限公司 Data generating device, data generating method, data reproducing device, and data reproducing method
CA2924784C (en) * 2013-09-27 2022-08-30 Sony Corporation Reproduction device, reproduction method, and recording medium
JP2016541140A (ja) * 2013-11-13 2016-12-28 エルジー エレクトロニクス インコーポレイティド Hdr放送サービスの提供のための放送信号送受信方法及び装置
KR101867828B1 (ko) * 2013-11-21 2018-06-18 엘지전자 주식회사 비디오 처리 방법 및 비디오 처리 장치
US11350015B2 (en) 2014-01-06 2022-05-31 Panamorph, Inc. Image processing system and method
US9584701B2 (en) 2014-01-06 2017-02-28 Panamorph, Inc. Image processing system and method
RU2653249C2 (ru) * 2014-01-07 2018-05-07 Долби Лэборетериз Лайсенсинг Корпорейшн Способы кодирования, декодирования и представления изображений высокого динамического диапазона
JP6686438B2 (ja) * 2014-01-24 2020-04-22 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10313709B2 (en) * 2014-02-07 2019-06-04 Sony Corporation Transmission device, transmission method, reception device, reception method, display device, and display method
CN111246050B (zh) * 2014-02-25 2022-10-28 苹果公司 用于视频数据处理的***、装置和方法
WO2015174108A1 (ja) * 2014-05-15 2015-11-19 ソニー株式会社 通信装置及び通信方法、並びにコンピューター・プログラム
WO2015174026A1 (ja) * 2014-05-16 2015-11-19 パナソニックIpマネジメント株式会社 変換方法および変換装置
PL3324629T3 (pl) 2014-05-28 2019-11-29 Koninklijke Philips Nv Sposoby i urządzenia do kodowania obrazów hdr oraz sposoby i urządzenia do wykorzystania tak zakodowanych obrazów
EP2953119A1 (en) * 2014-06-05 2015-12-09 Martin Professional ApS Video display device with color purity control
EP3157243B1 (en) * 2014-06-10 2024-07-03 Panasonic Intellectual Property Management Co., Ltd. Conversion method and conversion device
CN110460745B (zh) * 2014-06-10 2022-03-08 松下知识产权经营株式会社 显示装置
RU2696216C2 (ru) * 2014-06-13 2019-07-31 Сони Корпорейшн Передающее устройство, способ передачи, приемное устройство и способ приема
EP3157251B1 (en) 2014-06-16 2019-08-21 Panasonic Intellectual Property Management Co., Ltd. Playback method and playback apparatus
CN110572605B (zh) 2014-06-20 2022-01-07 松下知识产权经营株式会社 再现方法及再现装置及存储介质
EP3174280A1 (en) * 2014-06-23 2017-05-31 Panasonic Intellectual Property Management Co., Ltd. Conversion method and conversion apparatus
CN110675840B (zh) 2014-06-26 2022-03-25 松下知识产权经营株式会社 显示装置及显示方法
EP3163894B1 (en) * 2014-06-27 2020-08-19 Panasonic Intellectual Property Management Co., Ltd. Data output device, data output method, and data generation method
WO2016021120A1 (ja) 2014-08-07 2016-02-11 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 再生装置、再生方法および記録媒体
JP6466258B2 (ja) 2014-08-07 2019-02-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 再生装置、再生方法および記録媒体
KR102279842B1 (ko) * 2014-08-08 2021-07-21 코닌클리케 필립스 엔.브이. Hdr 이미지 인코딩 방법 및 장치
MX368411B (es) 2014-08-08 2019-10-02 Koninklijke Philips Nv Metodos y aparatos para codificacion de imagenes de alto rango dinamico (hdr).
JP2016538745A (ja) * 2014-08-08 2016-12-08 エルジー エレクトロニクス インコーポレイティド ディスプレイ適応的映像再生のためのビデオデータ処理方法及び装置
MX367898B (es) * 2014-09-22 2019-09-11 Panasonic Ip Man Co Ltd Metodo de reproduccion y aparato de reproduccion.
JP5995129B2 (ja) * 2014-09-22 2016-09-21 パナソニックIpマネジメント株式会社 再生方法および再生装置
CN110971886B (zh) * 2014-11-04 2021-12-03 松下电器(美国)知识产权公司 再现方法、再现装置以及记录介质
RU2689411C2 (ru) 2014-11-10 2019-05-28 Конинклейке Филипс Н.В. Способ для кодирования, процессор видео, способ для декодирования, декодер видео
WO2016080233A1 (ja) * 2014-11-17 2016-05-26 ソニー株式会社 送信装置、ハイダイナミックレンジ画像データ送信方法、受信装置、ハイダイナミックレンジ画像データ受信方法およびプログラム
JP6463179B2 (ja) * 2015-03-17 2019-01-30 キヤノン株式会社 信号処理装置、信号処理方法および撮像装置
WO2016157838A1 (ja) * 2015-03-27 2016-10-06 パナソニックIpマネジメント株式会社 信号処理装置、表示装置、信号処理方法、およびプログラム
KR102310241B1 (ko) 2015-04-29 2021-10-08 삼성전자주식회사 소스 디바이스, 그의 제어 방법, 싱크 디바이스 및 그의 화질 개선 처리 방법
CN106331692B (zh) * 2015-06-15 2018-01-23 冠捷投资有限公司 数字影像的量化范围的判断方法
US10140694B2 (en) * 2015-08-31 2018-11-27 Lg Electronics Inc. Image display apparatus
US9767543B2 (en) 2015-09-22 2017-09-19 Samsung Electronics Co., Ltd. Method and apparatus for enhancing images via white pop-out
US10587852B2 (en) 2015-10-06 2020-03-10 Lg Electronics Inc. Broadcast signal transmission device, broadcast signal reception device, broadcast signal transmission method, and broadcast signal reception method
DE102015220993A1 (de) 2015-10-27 2017-04-27 Zf Friedrichshafen Ag Zusammenbaueinheit für eine elektrische Antriebseinheit innerhalb eines Antriebsstrangs eines Fahrzeugs
JP6710970B2 (ja) 2015-12-28 2020-06-17 ソニー株式会社 送信装置および送信方法
EP3427478B1 (en) * 2016-03-07 2023-08-23 Koninklijke Philips N.V. Encoding and decoding hdr videos
US10757385B2 (en) * 2016-08-24 2020-08-25 Qualcomm Incorporated Color gamut adaptation with feedback channel
WO2018070822A1 (ko) * 2016-10-14 2018-04-19 엘지전자 주식회사 적응적 영상 재생을 위한 데이터 처리 방법 및 장치
JP6659178B2 (ja) * 2017-03-01 2020-03-04 キヤノン株式会社 画像処理装置および画像処理方法
US10542187B2 (en) 2017-03-01 2020-01-21 Canon Kabushiki Kaisha Image processing apparatus and image processing method
US9986200B1 (en) * 2017-05-11 2018-05-29 Novatek Microelectronics Corp. Method and video conversion system of updating video setting
CN110999301B (zh) * 2017-08-15 2023-03-28 杜比实验室特许公司 位深度高效图像处理
GB2568038B (en) 2017-10-30 2020-12-02 Imagination Tech Ltd Systems and methods for processing a stream of data values
GB2567881B (en) 2017-10-30 2021-02-10 Imagination Tech Ltd Systems and methods for processing a stream of data values
GB2568039B (en) * 2017-10-30 2020-10-28 Imagination Tech Ltd Systems and methods for processing a stream of data values
KR102546990B1 (ko) 2018-03-16 2023-06-23 엘지전자 주식회사 신호 처리 장치 및 이를 구비하는 영상표시장치
JP6602414B2 (ja) * 2018-03-16 2019-11-06 キヤノン株式会社 装置、方法、及びプログラム
CN112204646A (zh) * 2018-03-29 2021-01-08 巴科股份有限公司 用于led显示器的驱动器
US10964289B2 (en) * 2019-07-25 2021-03-30 Google Llc OLED display with different spatial gamma
JP6904470B2 (ja) * 2019-08-30 2021-07-14 ソニーグループ株式会社 再生装置、表示装置、情報処理方法
JP7005570B2 (ja) * 2019-10-09 2022-01-21 キヤノン株式会社 装置、方法、及びプログラム
CN111885393A (zh) * 2020-07-31 2020-11-03 广州华多网络科技有限公司 一种直播方法、***、存储介质及设备
CN114331852A (zh) * 2020-09-29 2022-04-12 北京小米移动软件有限公司 高动态范围图像的处理方法、装置及存储介质
CN117425928A (zh) * 2021-05-27 2024-01-19 巴科股份有限公司 生成用于发光元件的驱动信号的方法和装置

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2643531B1 (fr) * 1989-02-21 1996-04-26 Thomson Csf Procede et dispositif de compression de l'information destine au decodage compatible d'une famille de signaux de television de resolutions croissantes
US6118820A (en) 1998-01-16 2000-09-12 Sarnoff Corporation Region-based information compaction as for digital images
KR100965881B1 (ko) * 2003-10-10 2010-06-24 삼성전자주식회사 비디오 데이터 인코딩 시스템 및 디코딩 시스템
US8218625B2 (en) * 2004-04-23 2012-07-10 Dolby Laboratories Licensing Corporation Encoding, decoding and representing high dynamic range images
KR101329173B1 (ko) * 2004-11-01 2013-11-14 테크니컬러, 인크. 향상된 컬러 공간 콘텐츠를 마스터하고 분배하는 방법 및 시스템
US8253859B2 (en) * 2006-05-16 2012-08-28 Sony Corporation Transmission system, transmission apparatus, and transmission method for transmitting video data
US7885469B2 (en) 2006-05-22 2011-02-08 Microsoft Corporation Encoded high dynamic range textures
KR101521041B1 (ko) * 2006-05-25 2015-05-15 톰슨 라이센싱 가중 인코딩을 위한 방법 및 시스템
CN101193202A (zh) 2006-12-22 2008-06-04 陈珉 高动态范围图像在传统输出设备上的显示方法
WO2009051690A1 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for artifact removal for bit depth scalability
CN101933094A (zh) 2008-01-31 2010-12-29 汤姆逊许可证公司 用于观看数据定义和高清晰度多媒体接口上的传输的方法和***
DE102008007204B4 (de) 2008-02-01 2018-04-19 Robert Bosch Gmbh Saugstrahlpumpe
US20090322800A1 (en) 2008-06-25 2009-12-31 Dolby Laboratories Licensing Corporation Method and apparatus in various embodiments for hdr implementation in display devices
CN102132561A (zh) * 2008-08-22 2011-07-20 汤姆逊许可证公司 用于内容传送的方法和***
CN102349290B (zh) * 2009-03-10 2014-12-17 杜比实验室特许公司 扩展动态范围和扩展维数图像信号转换
KR101346008B1 (ko) * 2009-03-13 2013-12-31 돌비 레버러토리즈 라이쎈싱 코오포레이션 고 동적 범위, 가시 동적 범위, 및 광색역 비디오의 층상 압축
CN101951510B (zh) 2010-07-26 2012-07-11 武汉大学 一种基于多尺度DoG滤波器的高动态范围压缩方法
EP3716632B1 (en) * 2010-11-23 2022-05-04 Dolby Laboratories Licensing Corporation Display of high dynamic range images on a global dimming display using bit depth reduction mapping metadata
EP2658260B1 (en) * 2010-12-22 2020-12-09 Panasonic Corporation Image encoding apparatus, image decoding apparatus, image encoding method, and image decoding method for bit-depth scalability
UA109312C2 (uk) * 2011-03-04 2015-08-10 Імпульсно-кодова модуляція з квантуванням при кодуванні відеоінформації
US9292940B2 (en) 2011-04-28 2016-03-22 Koninklijke Philips N.V. Method and apparatus for generating an image coding signal

Also Published As

Publication number Publication date
PL3627490T3 (pl) 2022-02-28
US10097822B2 (en) 2018-10-09
CN103582911A (zh) 2014-02-12
BR112013028556A2 (pt) 2017-01-17
PL2707868T3 (pl) 2024-06-17
ES2974956T3 (es) 2024-07-02
USRE49692E1 (en) 2023-10-10
KR102135841B1 (ko) 2020-07-22
KR102061349B1 (ko) 2019-12-31
EP3627490A1 (en) 2020-03-25
JP6234920B2 (ja) 2017-11-22
EP2707868B1 (en) 2024-04-03
EP3627490B1 (en) 2021-09-29
JP2014519620A (ja) 2014-08-14
BR112013028556B1 (pt) 2022-01-04
WO2012153224A1 (en) 2012-11-15
MX2013012976A (es) 2013-12-06
EP4375982A2 (en) 2024-05-29
RU2611978C2 (ru) 2017-03-01
KR20140043742A (ko) 2014-04-10
KR20190126191A (ko) 2019-11-08
EP2707868A1 (en) 2014-03-19
CN103582911B (zh) 2017-01-18
US20140079113A1 (en) 2014-03-20
RU2013154551A (ru) 2015-06-20

Similar Documents

Publication Publication Date Title
ES2899979T3 (es) Generación y procesamiento de señales de imagen de rango dinámico alto
US10402953B2 (en) Display method and display device
KR102529013B1 (ko) 컬러 픽처를 인코딩 및 디코딩하는 방법 및 장치
JP5314029B2 (ja) 色信号変換装置及び色信号変換方法
JP6946325B2 (ja) 高ダイナミックレンジピクチャを符号化する方法及び装置、対応する符号化方法及並びに符号化装置
CN107409210B (zh) 匹配不同动态范围的彩色图片之间的色彩的方法和设备
US20150256860A1 (en) Graphics Blending for High Dynamic Range Video
TW201701665A (zh) 編碼及解碼彩色圖像之方法及裝置
BR112014006977B1 (pt) Aparelho de processamento de imagem, aparelho codificador do sinal de imagem disposto para codificar uma imagem, método de processamento de imagem e método para transmitir um sinal de imagem disposto para codificar uma imagem
AU2015207825A1 (en) Method, apparatus and system for encoding video data for selected viewing conditions
CN112215760A (zh) 一种图像处理的方法及装置
JP6742417B2 (ja) デジタル画像の処理方法、付随する装置、端末機器およびコンピュータプログラム
ES2728053T3 (es) Métodos y aparatos para crear funciones de mapeo de códigos para codificar una imagen HDR, y métodos y aparatos para el uso de tales imágenes codificadas
ES2787827T3 (es) Aparatos y procedimientos para la codificación y decodificación de imágenes HDR
Demos High Dynamic Range Intermediate