ES2774013B2 - Metodo y sistema para convertir una imagen digital de color a escala de grises - Google Patents

Metodo y sistema para convertir una imagen digital de color a escala de grises Download PDF

Info

Publication number
ES2774013B2
ES2774013B2 ES201831253A ES201831253A ES2774013B2 ES 2774013 B2 ES2774013 B2 ES 2774013B2 ES 201831253 A ES201831253 A ES 201831253A ES 201831253 A ES201831253 A ES 201831253A ES 2774013 B2 ES2774013 B2 ES 2774013B2
Authority
ES
Spain
Prior art keywords
color
image
value
channel
colors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES201831253A
Other languages
English (en)
Other versions
ES2774013A1 (es
Inventor
Zamorano Mariano Rincon
Cesteros Oscar Sanchez
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universidad Nacional de Educacion a Distancia UNED
Original Assignee
Universidad Nacional de Educacion a Distancia UNED
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universidad Nacional de Educacion a Distancia UNED filed Critical Universidad Nacional de Educacion a Distancia UNED
Priority to ES201831253A priority Critical patent/ES2774013B2/es
Publication of ES2774013A1 publication Critical patent/ES2774013A1/es
Application granted granted Critical
Publication of ES2774013B2 publication Critical patent/ES2774013B2/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Color Image Communication Systems (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

MÉTODO Y SISTEMA PARA CONVERTIR UNA IMAGEN DIGITAL DE
COLOR A ESCALA DE GRISES
Campo técnico de la invención
La presente invención se encuadra en el campo del procesamiento de imágenes digitales y en concreto dentro de los conversores de RGB a escala de grises — comúnmente conocido como transformación de color a blanco y negro.
Estado de la Técnica
El color es un tema de estudio antiguo, pero su tratamiento científico con el fin de tener métodos que lo analicen, clasifiquen o describan, es contemporáneo [1] [2] [3]. Newton, en su Óptica [4], ya hacía mención a él, y lo definía como una propiedad de la luz, y por lo tanto como un «efecto físico». Primero Goethe [5], y con mayor intensidad Schopenhauer [6], discutirían esta definición incluyendo varias categorías más, como el color químico (producido por la incidencia de la luz sobre las superficies y su transformación posterior) o el fisiológico (generado a partir de los procesos del sistema de percepción y que es causante de efectos o procesos como la post-imagen), e indicando que, si bien el color tiene su origen en la luz, el sistema de percepción visual tiene un papel activo, transformando la señal original en la expresión subjetiva final que entendemos por color. Schopenhauer llegaría al enfrentamiento con la teoría newtoniana indicando que el color es un efecto fisiológico del sistema de percepción, existiendo como tal, y únicamente, en el cerebro.
Desde el inicio del siglo XIX y hasta mediados del XX existirían dos teorías principales centradas en dos posiciones científicas. Por un lado, la teoría tricromática, basada en Newton, elaborada por Thomas Young a principios del XIX y definida finalmente por Von Helmholtz [7] a finales de este siglo. Y por otro lado, la teoría de procesos opuestos, definida por Hering [8] en gran medida a partir de Goethe y Schopenhauer. Con el avance de la neurociencia se cerraría el debate incluyendo ambas teorías, donde la primera, la tricromática, se relaciona con la captación sensorial de la luz en la retina, y la segunda, procesos opuestos, con el procesamiento neuronal.
En cuanto a la organización de los colores en una jerarquía, el tema es más amplio, y ha sido objeto de estudio inicialmente por artistas y, sobre todo a partir de mediados del siglo XX, por la psicología del arte [9]. Existen diferentes modelos para representar el color, y el consenso es más complejo, aunque se puede establecer que existen unos denominados colores primarios que, a través de la mezcla entre sí, dan los colores secundarios, estos, a su vez, a los terciarios, y así hasta llegar a millones de combinaciones. Desde la esfera de color de Runge [10], a la de Munsell [11], pasando por sistemas de ruedas o pirámides, pero en ningún caso se establece una jerarquía hasta llegar al modelo de hexágono de Krueppers [12] (ver figura 2). El modelo de Krueppers sí establece una jerarquía con su «romboedro» que va del blanco, pasando por el amarillo, rojo, verde y azul, hasta el negro. El determinar esta jerarquía es un paso necesario para obtener una escala donde las propiedades de cada color queden reflejadas en la transformación a niveles de gris, pero resulta difícil determinar una conversión efectiva desde el modelo RGB. En [6], Schopenhauer describe una relación entre la jerarquía y la división de la actividad de la retina, de tal manera que el blanco corresponde a la actividad plena y el negro a la ausencia total de actividad, mientras que el amarillo es % de actividad, el rojo y el verde / , y el azul 1% (ver figura 3). Schopenhauer indica que existe, además de esta división, que denomina cuantitativa, otra cualitativa que determina la presencia o la ausencia de actividad. En definitiva, si el amarillo es % de la actividad, es % de inactividad, y a su vez, el amarillo junto con su opuesto, el azul (con % de actividad), suman uno, la actividad plena de la retina. De esta manera, su sistema antecede al sistema de colores opuestos que después Hering desarrollaría, pero para nuestro fin, lo relaciona con una jerarquía.
Además, en las artes visuales, la distinción entre colores cálidos y fríos es muy común [1], lo cual permite establecer el contraste de color también por categorías. Berlin and Kay [13], después de estudiar distintos lenguajes alrededor del mundo, demostraron que los colores son universales e independientes a sensibilidades culturales. E. Rosch [14] descubrió una tribu en Nueva Guinea (Los Danis) con solamente dos categorías: clarocálido y frío-oscuro. Ellos aprendieron los colores rojo, verde, azul y amarillo (los colores primarios para los procesos opuestos) mucho más rápido que los otros. Una justificación de este hecho es que existe una estructura neuronal que analiza las relaciones entre colores opuestos y, por tanto, la percepción visual del contraste entre las categorías cálido y claro opuestas a frío y oscuro.
Schopenhauer conocía el efecto final del procesamiento de los colores por el cerebro, pero no cómo se producía, aunque intuía que era un problema fisiológico. Sin embargo, hoy en día, el conocimiento de todos los órganos implicados en la visión es amplio.
Davida Teller [15] definió la estructura de la retina en dos arquitecturas, la primera tricromática y la segunda de procesos opuestos— por lo tanto, ambas teorías sobre el tratamiento del color no eran excluyentes, sino que eran parte de un mismo proceso, pero en distintas fases del mismo.
Con el surgimiento de las cámaras y los televisores digitales, y después de los monitores para equipos informáticos durante el siglo XX, el procesamiento de las imágenes se estableció como un campo multidisciplinar, en donde encontraba cobijo un amplio abanico de especialistas, científicos y técnicos, pero también de creativos, diseñadores y artistas. Uno de los problemas con el que se encontraron fue el de la conversión a escala de grises (blanco y negro para el gran público) de imágenes en color sin que se perdieran las propiedades de luminosidad, matiz y saturación que este elemento visual ofrece en la percepción [16]. Los primeros conversores utilizaban la intensidad de luz, eliminando información tanto de la saturación como del matiz. Como primera solución se determinó el uso de «pesos» en cada canal RGB — el sistema de color RGB es el estándar de facto, aunque existen otros como CIE LAB— de tal manera que se le daba un mayor protagonismo al canal R sobre el G o el B, siendo este último el que tenía un peso menor, manteniendo de este modo las diferencias del matiz junto a las de luminosidad. Este tipo de conversores asumían cuestiones de la percepción humana para su desarrollo y establecían cálculos científicos para determinar los pesos.
Existe una segunda línea de conversores que ponderan el valor del color RGB original por el contraste en cada región de la imagen para establecer una diferenciación según la relación de cada píxel con su entorno [17]. El contraste local de cada píxel nos indica su relevancia dentro de la imagen con el fin de determinar su posición en la escala de grises final. Para llevar a cabo esta tarea es necesario aplicar algoritmos y procesamientos concretos en cada píxel (o en cada grupo de píxeles) que dependen de circunstancias locales, y en algunos casos globales con el resto de la imagen.
Conversores que utilizan «pesos»:
• Métodos como CIECAM97, L*a*b* lum, XYZ lum o YCrCb Lum.
• Patentes:
o Method and device for use in converting a colour image into a grayscale image. (US8355566B2)
o Method and apparatus for converting a color image to grayscale (US8594419B2).
o Method of converting color image into grayscale image and recording médium storing program for performing the same (US8526719B2).
o Method and device for use in converting a colour image into a grayscale image (US7382915B2). Utiliza máscaras en forma de filtro.
Conversores que analizan el contraste en cada región (de una manera local, global o ambas):
• Métodos como Color2Gray [18].
• Patentes:
o Color to monochrome conversion (US4977398A).
o Mapping of color images to black-and-white textured images (US5153576A).
o Image processing for converting color images into monochrome pattern images (US5726781A).
o System for black and white printing of colored pages (US5898819A).
o Printing black and white reproducible color documents (US5701401A)
o Color transforming method (US6101272A).
Otras opciones:
• Method for converting a video signal into a black/white signal (US4257070A ).
Utiliza canales con propiedades visuales: intensidad, matiz, textura y efecto pictórico y aplica umbrales.
Resumen de los principales problemas:
• La conversión del color a partir de sus tres dimensiones: matiz, luminosidad y saturación. Con la combinación de los tres canales RGB se obtiene una escala de grises que mide la luminosidad. Con el uso de pesos en cada canal se introduce además el matiz, pero la combinación final no es fácil partiendo del sistema RGB y sin incluir la saturación. .
• Establecer una escala de luminosidad, e incluso de saturación, a priori es fácil, pero determinar la del matiz es mucho más compleja.
• El análisis local del contraste es eficaz cuando éste es alto, pero no cuando es medio o bajo. Esto provoca que los colores, en regiones donde el contraste no es muy alto, se encuentren en valores bajos en la escala de grises final, aunque sus colores originales tengan un valor mayor en sus propiedades de luminosidad, matiz o saturación.
• La valoración local o global donde se compara cada pixel con su entorno establece una escala final ligada a la propia estructura de la composición de colores de la imagen, pero es complejo comparar los resultados entre varias imágenes, sobre todo por sus propiedades.
Breve descripc ión de la invención
La presente invención se refiere a un método y a un sistema definido de acuerdo con las reivindicaciones. La invención propone realizar la conversión de color a escala de grises a nivel de pixel gracias a un sistema de color que está basado en los estudios sobre el color de Schopenhauer, la teoría de colores opuestos de Hering y los avances recientes en el conocimiento de la fisiología y funcionamiento de la retina proporcionados por la neurociencia. Este sistema de color permite generar una jerarquía relacionada con la actividad neuronal de la retina y, además, determina la categoría de cada color, bien cálida o bien fría, con el fin de diferenciar los valores semejantes en la jerarquía —como el rojo con el verde— y poder diferenciarlos para mantener el contraste. Ese contraste, que existe en las propiedades originales de color (luminosidad, matiz y saturación), se suele perder en la conversión. La transformación se realiza en dos pasos: en primer lugar, se obtiene el valor de cada pixel en la jerarquía y, en segundo lugar, se aumenta o disminuye el valor según la categoría de cálido o frío a la que pertenece.
La invención tiene diversas aplicaciones en herramientas informáticas de edición para diseñadores gráficos, artistas y expertos en imagen donde se usa el color con estrategias de comunicación y con necesidad de objetividad. Además, teniendo en cuenta que la accesibilidad es una cuestión clave en nuestra sociedad y que más del 70% de la comunicación es visual, se establece también como un importante campo de aplicación el de los sistemas o soportes para personas con problemas para distinguir los colores (acromatopsia, discromatopsia, en especial el daltonismo: protanopia, deuteronopsia, etc.).
La presente invención puede implementarse con componentes físicos de hardware o con software en un programa informático ejecutable en el procesador de un ordenador o dispositivo similar. La invención emplea dos vías complementarias bioinspiradas, denominadas ON y OFF. Por vía se debe entender la ruta que siguen el conjunto de señales que transportan una determinada información. La vía ON describe la actividad y la vía OFF la inactividad (aunque, por simplificación, en este documento sólo se usará la vía ON).
En la presente invención, cada vía consta de cuatro canales, denominados L, M, S y LM, todos con valores entre 0 y 1. El primero recibe la señal del canal R (señal de onda larga, que informa de la actividad en el rango de baja frecuencia del espectro visible), el segundo de G (señal de onda media, que informa de la actividad en el rango de media frecuencia del espectro visible), el tercero de S (señal de onda corta, que informa de la actividad en el rango de alta frecuencia del espectro visible), y el último, LM, es la suma con saturación de la actividad en R y G. La actividad total de la vía, de acuerdo con la presente invención, se define como la suma ponderada de las actividades parciales en cada canal y se asume que todos los canales aportan por igual. El resultado es una jerarquía o escala que ordena los colores en consonancia con la actividad de la retina según Schopenhauer. En esta escala, normalizada en el rango [0,1], los colores principales tienen los siguientes valores:
Blanco=1, Amarillo = 3/4, Rojo = 1/2, Verde = 1/2, Azul: 1/4, Negro = 0.
Sin embargo, no existe una diferenciación de los colores cálidos y fríos, como ejemplo, los colores básicos rojo y verde se encuentran en el mismo punto de la escala, con valor 1/2, por lo que es necesario una segunda transformación que los diferencie. La propuesta es aumentar el valor de actividad cuando es un color cálido y reducirlo cuando es un color frío a través de una segunda etapa de transformación dependiente de la categoría del color:
• Definimos que un píxel tiene asociado un color cálido cuando su valor en el canal L es superior a 0,5 en la vía ON.
• Definimos que un píxel tiene asociado un color frío cuando su valor en el canal L es igual o inferior a 0,5 en la vía ON.
Esta segunda etapa determina el valor final en escala de grises de la conversión. Las mejoras y ventajas técnicas de este conversor en relación a otros son principalmente las siguientes:
• La capacidad de convertir las propiedades de luminosidad, matiz y saturación a la escala de grises a partir de una jerarquía de colores bioinspirada, donde se relacionan las tres propiedades y no sólo una o dos de ellas.
• La distinción de las categorías de cálido y frío y la determinación de su nivel de intensidad establecen la distinción entre colores opuestos que tienen el mismo nivel de la escala jerárquica de conversión, mejorando la conversión final.
• Reducción de la complejidad computacional: al realizar el procesamiento a nivel de pixel, sin necesidad de analizar su contexto, lo que consigue una reducción muy significativa del cómputo necesario para transformar el color RGB en niveles de gris.
Solución de los principales problemas:
La conversión del color a partir de sus tres dimensiones: matiz, luminosidad y saturación. Con la combinación de los tres canales RGB se obtiene una escala de grises que mide la luminosidad. Con el uso de pesos en cada canal se introduce además el matiz, pero la combinación final no es fácil partiendo del sistema RGB y sin incluir la saturación. El paso de un modelo de tres canales homogéneos a otro de cuatro canales facilita la definición de una jerarquía cuantitativa en consonancia con la teoría de colores opuestos que tiene en cuenta las propiedades de luminosidad, matiz y saturación.
El análisis local del contraste es eficaz cuando éste es alto, pero no cuando es medio o bajo. Esto provoca que los colores, en regiones donde el contraste no es muy alto, se encuentren en valores bajos en la escala de grises final, aunque sus colores originales tengan un valor expresivo mayor. En la presente propuesta no hay análisis local del contraste, sino que se utilizan las categorías excluyentes de cálido y frío, que se obtienen a partir de uno de los canales.
La valoración local o global donde se compara cada pixel con su entorno establece una escala final ligada a la propia estructura de la composición de colores de la imagen, pero es complejo comparar los resultados entre varias imágenes, sobre todo en la comparación de cada color. La conversión en la presente invención es puntual, se centra en el análisis de los valores RGB del propio píxel, con lo cual no hay ningún ajuste determinado por la relación con otros píxeles de la imagen.
En definitiva, se solucionan los principales problemas de la conversión de RGB a niveles de gris con un modelo universal en el que se realza el contraste entre colores según la categoría del propio color (cálida/fría), y no dependiendo de análisis locales de contraste. El hecho de no depender de la propia estructura de la composición de la imagen y de las relaciones locales facilita la relación entre imágenes —todas tiene el mismo criterio de conversión— y, por lo tanto, su comparación. Además, la propuesta incluye dos constantes que controlan el aumento (en la categoría cálida) o reducción (en la fría) de la intensidad final en la conversión, lo que permite ajustar el resultado final.
Breve descripc ión de las figuras
Fig. 1. Esquema general de las etapas del conversor de color aplicado a cada píxel de la imagen.
Figs. 2. Sistemas de color conocidos. Fig. 2A esfera de color de Runge; Fig. 2B esfera de Munsell; Fig. 2C rueda de colores con colores primarios y secundarios; y Fig. 2D hexágono de Kueppers.
Fig. 3. Relación entre colores básicos y escala de grises en relación a la actividad de la retina según Schopenhauer.
Fig. 4. Esquema de la estructura neuronal de la retina en relación al color. Transformación de la captación de información en un sistema tricromático a uno de cuatro canales de acuerdo con la invención.
Fig. 5. Esquema básico de la primera etapa de conversión de acuerdo con la invención. Fig. 6. Espacio de color generado con la primera etapa de la invención y su relación con el valor «A» de actividad.
Fig. 7. Espacio de color generado con la primera etapa de la invención y su relación con las categorías de color (claro-cálido, cálido, frío y frío-oscuro).
Fig. 8. Esquema básico de las etapas de la invención.
Figs. 9A-9E. Conversión según la invención de una imagen Fig. 9A y los resultados obtenidos con diferentes configuraciones: Fig. 9B con W=0 y C=0, sin aumento o decremento en zonas cálidas y frías; Fig. 9C con W=0.32 y C=0.16; Fig. 9D contraste alto aplicado para zonas cálidas W=1 ,y C=0; y Fig. 9E contraste alto aplicado en zonas frías, W=0 y C=1.
Figs. 10A-10D. Cartas de color Ishihara para detección de la ceguera de color y su conversión con cieY y según la invención.
Figs. 11A-11I. Comparativa de la conversión final con conversores de pesos y por contrastes. Fig. 11A ilustra la imagen original: «Sol naciente» de Monet; Fig. 11B conversión primera según la escala jerárquica; Fig. 11C muestra la determinación de las áreas de categorías de cálido y frío; Figs. 11D-11G muestran los resultados obtenidos con conversores por pesos, Fig. 11E muestra los resultados obtenidos con conversor por contraste local, y Fig. 11F muestra los resultados obtenidos con el conversor propuesto.
Fig. 12. Diagrama de bloques de un ejemplo de realización del sistema.
Descripción detallada de la invención
a) Paso del m odelo tric rom ático a uno de cuatro canales
En la presente invención se combinan la teoría de colores opuestos y la teoría tricromática para pasar de un modelo tricromático (RGB) a uno de procesos opuestos con cuatro canales que facilita el paso de color RGB a escala de grises.
El paso de tres a cuatro canales está inspirado en las estructuras neuronales de la retina y el núcleo geniculado lateral, las cuales están implicadas en las primeras etapas de procesamiento del color (ver figura 4):
* Conos 21 Los primeros implicados en el reconocimiento del color, se encuentran en la retina y están divididos en tres tipos según su respuesta a tres longitudes de onda en la luz: L(larga), M(media) y S(corta). Los tres tipos de conos se corresponden respectivamente con los canales R, G y B del sistema tricromático,
* Células ganglionales 22. Se establecen en dos vías, una que determina la intensidad y otra su ausencia, denominadas ON 23 y OFF 24 , respectivamente, y existen tres tipos de células en cada una: magnocélulas 26, parvocélulas 25 y koniocélulas 27. Mientras que las células ganglionales 22 se configuran de la siguiente manera:
• Magnocélulas 26: denominadas como LM, realizan la suma con saturación de las señales L y M.
• Parvocélulas 25: hay dos grupos, unas transportan la señal del canal L y otras la del M.
• Koniocélulas 27: transportan la señal del canal S.
b) Im plem entación de un conversor
b.1) Primera etapa de conversión
La idea principal es obtener el valor de intensidad de cada pixel transformando los valores RGB según una escala que permite mantener las propiedades del color. Nos basamos en el valor de actividad definido en la teoría del color de Schopenhauer y el modelo de cuatro canales obtenido en el paso anterior para establecer el valor inicial en escala de grises. Este valor se obtiene como:
Ecuación 1: A = LM+L+M+S donde LM = min(L M, 1)
Siendo L=R, M=G, S=B y LM=L+M, y usando A como valor en escala de grises inicial, según la primera etapa de esta conversión (ver figura 5). Todos los valores están normalizados en el intervalo [0,1]. Así, por ejemplo, el color amarillo, codificado como (1,1,0) en RGB, pasa a (1,1,0,1) en cuatro canales (L,M,S,LM) y el valor de actividad asociado es A=3/4=0.75.
Como hemos indicado anteriormente, se establecen dos vías visuales opuestas, denominadas ON y OFF, relacionadas con el valor de actividad o su ausencia respectivamente. Este sistema se relaciona con la división cualitativa de Schopenhauer, donde se establecen dos partes opuestas. Para explicar el funcionamiento según la presente invención de un conversor de RGB a niveles de gris, no es necesario el uso de ambas vías y se simplifica usando solamente la vía ON.
Segunda etapa de conversión: D iferenciación entre cálido y frío.
El valor A, obtenido con la etapa anterior, determina la posición de cada color en una jerarquía inicial, donde los canales R y G originales se sitúan de una manera simétrica (ver figura 6). Esto quiere decir que un color rojo y su opuesto verde, obtendrán el mismo valor A. Por ejemplo, para RGB( 1,0,0 ) y RGB( 0,1,0 ) A = 0.5 en ambos casos, para RGB(0.5,0,0) y RGB(0,0.5,0), A = 0.375 , ó para RGB(0,5,0.2,0) y RGB( 0.2,0,5,0 ), A = 0.35 . Para obtener una conversión más efectiva, es necesario establecer la diferenciación entre ambos canales, para lo que utilizamos la característica cálido-frío, aumentando el valor en escala de grises para colores cálidos y reduciéndolo para colores fríos. La relación entre los canales y ambas categorías es:
• Cálido: preponderancia de L y LM.
• Frío: preponderancia de M y S
En la conversión, el canal L controla tanto la influencia del LM como la del L, por lo que se implementa la definición de la categoría cálido como:
L>0.5
y de la categoría frío como:
-L>0.5
El canal -L es el perteneciente a la vía OFF, aunque, por motivos de simplificación, se decide no usar la vía OFF y utilizar la siguiente relación para la categoría frio:
L<=0.5
Sobre la esfera donde se representa el espacio de color tras la primera etapa de la conversión, se muestran los límites de ambas categorías a través de la influencia del canal L (ver figura 7). Las subcategorías de claro-cálido y oscuro-frío quedan definidas cuando los valores de actividad son superiores a 0.75 o inferiores a 0.25 y no aportan mayor funcionalidad a este modelo — el primero queda dentro de la categoría de cálido y el segundo dentro de la categoría de frío.
Una vez definidos qué colores son cálidos y cuáles fríos, se aplica ahora un factor aditivo que aumente el valor en la conversión a escala de grises para los primeros y lo reduzca para los segundos. La ecuación 2 formaliza la operación: preferiblemente, se utiliza una función sigmoide para obtener una transición suave y aumentar de manera no lineal los valores cálidos (cuando L>0.5) y reducirlos para colores fríos (cuando L<=0.5) y se acota el valor final al intervalo [0,1]. Se utiliza cualquier otra función que aproxime a ésta.
Ecuación 2:
Figure imgf000012_0001
Para poder ajustar el cambio debido a la calidez/frialdad del color por separado, se introduce el parámetro a, el cual puede tomar dos valores configurables: W si el color es cálido y C si es frío, ambos en el intervalo [0,1]:
si L > 0.5 a = / ; 0<=W<=1
si L < 0.5 a = C; 0<=C<=1
De esta manera, A’ (ver figura 8) será el valor final en la escala de grises, obtenido tras la segunda etapa de la conversión.
En la fig. 9A se ilustra una imagen con colores cálidos y fríos diferenciados para comprobar cómo ajustar la configuración para obtener un resultado adecuado. En la fig.
9B, el resultado tras la primera etapa de la conversión, sin aumentar o reducir las zonas cálidas y frías. Se aprecia que la expresividad del color es baja, el amarillo destaca, y el cian y el magenta se diferencian poco. En la fig. 9C, se realiza un ajuste para obtener un resultado equilibrado, donde el naranja y el magenta destacan en niveles altos sobre el verde (que permanece en un nivel medio), y el azul y cian se reducen un poco en niveles inferiores. En las figs. 9D y 9E, se aplica un factor de realce alto para zonas cálidas y frías respectivamente. Se aprecian las diferencias de aplicar un criterio u otro y la ventaja del ajuste para obtener la conversión más adecuada dependiendo de la imagen y los objetivos, aunque es posible determinar configuraciones por defecto.
En la fig. 10, se muestra la aplicación del conversor en varias cartas de color del test de Ishihara para la detección de la ceguera en el color (en la primera columna), y cómo el conversor cieY, ilustrado en la segunda columna, es incapaz de detectar las diferencias entre el color rojo y el verde, mientras que la transformación según la invención sí determina esa diferencia y muestra el número correspondiente en la tercera columna. Más concretamente: En la fig. 10A se muestra la carta 1, el número 12 es visible para todos los casos, con o sin ceguera del color. En las figs. 10B y 10C se muestran las cartas 9 y 11, donde no son visibles los números 74 y 6, cuando hay problemas en la detención de rojos y/o verdes. En la fig. 10D se muestra la carta 17, donde, si sólo es visible el 4 y poco o nada el 2, muestra problemas con el rojo, y si es al revés, con el verde. Un conversor clásico como cieY es incapaz de mostrar ninguno de los números (ver segunda columna), mientras que la presente invención lo hace en todos los casos (ver tercera columna), manteniendo, por lo tanto, las propiedades del color en la conversión.
Finalmente, en la fig. 11A se muestra la imagen de la pintura «Sol naciente» de Monet. En la fig. 11B se realiza la conversión según la primera etapa de la conversión, donde se utiliza la escala jerárquica. En la fig. 11C se muestran las áreas de la imagen de las categorías cálido y frío. Después, se comparan los resultados de varios conversores: conversores con «pesos» en las figs. 11D-11G; conversores por contraste en la fig. 11H y la segunda etapa de la conversión en la fig. 11I. Si nos fijamos en el sol, que claramente destaca del resto de la imagen en color, podemos ver las diferencias entre los distintos conversores. De una manera general, del resto de conversores, sólo el que utiliza el contraste local, color2gray como muestra la fig. 11H, consigue que aparezca en la conversión destacado. Si vemos la conversión de la primera etapa, el resultado es mejor que los demás conversores de «pesos» (se destaca algo más), pero es inferior al de contraste Color2gray de la fig. 11H, pero al aplicar las categorías cálido-frío de la segunda etapa de la conversión mejora el resultado (se destaca del fondo claramente) como se aprecia en la fig. 111. Además, si nos fijamos en el resto de elementos donde hay menos contraste local (sobre todo los barcos del fondo), color2gray de la fig. 11H apenas los diferencia, mientras que aplicando la presente invención, como prueba la fig.
11I, sí.
La utilidad práctica de la presente invención es muy considerable. Se puede implementar tanto en hardware como en software en cámaras digitales, aplicaciones de móviles, tabletas y ordenadores, para el tratamiento de imágenes y la edición de las mismas en el análisis científico y también con fines creativos y artísticos. Además, su campo de acción se puede extender a la visión artificial y en general a aplicaciones donde sea necesario obtener una representación en escala de grises sin perder las propiedades básicas del color de luminosidad, matiz y saturación, e incluso donde existan problemas de detección del color (acromatopsia, discromatopsia, en especial el daltonismo: protanopia, deuteronopsia, etc.).
De una manera global y comparativa con otras soluciones, esta invención tiene como mejoras técnicas:
• En relación a los conversores que van pixel a pixel: mantiene en la conversión las propiedades de luminosidad, matiz y saturación, lo cual se puede demostrar aplicando el test de Ishihara sobre la ceguera del color, donde el conversor pasa las pruebas (ver figura 10).
• En relación a los conversores que evalúan el contraste: al evaluar pixel a pixel, el rendimiento se mejora, obteniendo resultados similares en la conversión (ver figura 11).
En la fig. 12 se ilustra un ejemplo de diagrama de bloques funcionales de un sistema que implementa la invención. El sistema puede ser implementado en ordenador, entendiéndose en sentido amplio cualquier dispositivo electrónico con capacidad de proceso y de almacenamiento digital (por ejemplo, una FPGA).
El sistema para convertir una imagen digital en color a una imagen digital en escala de grises dispone de una unidad de entrada 32 que obtiene a partir de píxeles de una imagen en color 31, el valor de cada píxel en los tres canales primarios R 33, G 34, y B 35. El sistema cuenta con una unidad de proceso 46, que puede incluir un microprocesador, para realizar las tareas y operaciones de conversión. En concreto, la arquitectura funcional de la unidad de proceso 46 puede incorporar un módulo de conversión de canales 36 y un módulo de cómputo de actividad 41.
El módulo de conversión de canales 36 normaliza los tres canales primarios R, G, y B para obtener el correspondiente canal normalizado L 37, M 38 , y S 39. 32 también genera un cuarto canal LM 40 sumando, con saturación a 1, los canales primarios normalizados L 37 y M 38.
En la unidad de proceso 46, el valor en escala de grises se obtiene inicialmente como la suma ponderada de los cuatro canales 37-40 y, para conseguir mayor calidad en la conversión, como se ha indicado anteriormente, se incrementa el valor cuando el canal normalizado L 37 es mayor que 0.5 y se decrementa cuando es menor que 0.5. Una interfaz de usuario 42 permite introducir valores de las constantes W, C. La constante W modifica el contraste para los colores cálidos de la imagen 31, mientras que la constante C lo hace para colores fríos. Estas constantes se transmiten al módulo de cómputo de actividad 41 de la unidad de proceso 46 para realizar las operaciones ya indicadas en las ecuaciones anteriores.
El sistema dispone además de una unidad de salida 44 para reproducir el valor de actividad de gris calculado en la unidad de proceso 46 para los píxeles de la imagen en color original 31 y con ello puede mostrar una imagen en escala de grises 43.
Esquema del a lgoritm o
Image=new OBimage('RGB'); //objeto imagen en RGB, es la imagen de entrada
imagen_grayscale=new OBimage('grayscale'); //objeto imagen en escala de grises, es la imagen de salida
for(_i=0;_i<image.width;_i++){
for(_j=0;_j<image.height;_j++){
_pixel=getPixel(image.data, _i,_j); //función para extraer los canales RGB del pixel
//1. extraer los valores RGB y pasarlos a L,M,LM y S
L=_pixel.rgb.R/255; '/canal R normalizado en el intervalo[0,1]
M=_pixel.rgb.G/255; //canal G normalizado en el intervalo[0,1]
S=_pixel.rgb.B/255; //canal B normalizado en el intervalo[0,1]
LM=max(L+M,1);
//2. calcular el valor A para L,M,LM y S
A=(L+M+S+LM)/4; //valor A
//3. calcular el valor A' para L,M,LM y S
//3.1 Establecer las constantes W y C
W=0.8; //por ejemplo un valor alto
C=0.2; //po r ejemplo un valor bajo
//3.2 Determinar la categoría de color: cálido o frío, y su nivel.
if(L>0.5) then a=W else a=C;
//3.3 Aplicar la ecuación 2 que amplía(cálido) o reduce (frío) el valor A A'=max(min(A+(_rangeC*((1/(1+exp(-3*((2*L)-1))))-0.5))),1),0);
//4. Cargar valor A' en la imagen
_pixel.grayscale=A'*255; //pasar al valor de pixeles en la escala 0-255 putPixel(imagen_grayscale.data, _pixel.grayscale, _i,_j); //función para cargar el valor del pixel }
}
Bibliografía
[1] R. Arnheim, Art and visual perception: A psychology of the Creative eye, Univ of California Press, 1956.
[2] D. A. Dondis, A primer of visual literacy, Mit Press, 1974.
[3] E. H. Gombrich, Illusion and art. A study in the psychology of pictorial representation, Oxford, 1959.
[4] I. Newton, Optics: or a treatise of the refections, refractions, inflections and colours of light, William Innys at the West-End of St. Paul’s, 1730.
[5] J. W. Goethe, Theory of colours, MIT press, 1840.
[6] A. Schopenhauer, On Vision and Colors, Pricenton Architectural Press, 2010.
[7] H. V. Helmholtz, "LXXXI. on the theory of compound colours," Philosophical Magazine A, vol. 4, pp. 519-534, 1852.
[8] E. Hering, Ueber individuelle Verschiedenheiten des Farbensinnes, 1885.
[9] J. Pawlik, Theorie der Farbe, 1976.
[10] P. O. Runge, Color Sphere, Pricenton Architectural Press, 2010.
[11] A. H. Munsell, Atlas of the Munsell color system, Wadsworth, Howland & Company, Incorporated, Printers., 1915.
[12] H. Kueppers, The basic law of color theory, Barrons Educational Series Incorporated., 1982.
[13] B. Berlin and P. Kay, Basic color terms: Their universality and evolution, 1991.
[14] E. Rosch, "The nature of mental codes for color categories," Journal of experimental psychology: Human perception and performance, vol. 1, p.303, 1975.
[15] D. Teller, "Vision and the Visual System," E. John Palmer, Ed., 2014.
[16] R. Bala and R. Eschbach, "Spatial color-to-grayscale transform preserving chrominance edge information," Color and Imaging Conference, vol. 1, pp. 82-86, 2004.
[17] J. G. Kuk, J. H. Ahn and N. I. Cho, "A color to grayscale conversion considering local and global contrast," Asian Conference on Computer Vision, pp. 513-524.
[18] A. A. Gooch, S. C. Olsen, J. Tumblin and B. Gooch, "Color2gray: saliencepreserving color removal," ACM Trans. on Graphics, vol.24, pp.634-639, 2005.

Claims (6)

REIVINDICACIONES
1. Método implementado en ordenador para convertir una imagen digital en color (31) a una imagen digital en escala de grises (43) que comprende los pasos:
- obtener, para una pluralidad de píxeles de la imagen en color (31), el valor de cada píxel en los tres canales R, G, y B (33,34,35);
- normalizar los tres canales primarios R, G, y B para obtener los canales normalizados L, M, y S (37,38,39);
- generar un cuarto canal normalizado adicional LM (40) mediante la suma con saturación de los canales L (37) y M (38), donde la suma con saturación es la suma del canal L (37) y del canal M (38), si dicha suma es menor que la unidad, o la unidad en caso contrario;
- determinar la actividad, A, como el valor de cada píxel en una escala de grises de acuerdo con los valores de los canales L, M, S y LM (37,38,39,40);
- determinar el valor final de cada píxel, A', en la imagen de escala de grises (43), sobreponderando la actividad A para colores cálidos si L es mayor que 0.5, e infraponderando la actividad A en caso contrario, para colores fríos si L es menor o igual que 0.5.
2. Método, según la reivindicación 1, donde, para calcular el valor final en escala de
grises, se aplica una función A' = max( m in(
Figure imgf000018_0001
donde A = ------$------ donde LM = min(L M, 1), donde el valor del parámetro a se corresponde con una de las constantes, W: para modificar el contraste en la región de colores cálidos en la imagen (31), o C: para modificar el contraste en la región de colores fríos en la imagen (31); de forma que se cumple:
si L > 0.5 a = / ; 0<=W<=1; y si L < 0.5 a = C ; 0<=C<=1.
3. Sistema para convertir una imagen digital en color (31) a una imagen digital en escala de grises (43) que comprende:
- una unidad de entrada (32) configurada para obtener, para una pluralidad de píxeles de la imagen en color (31), el valor de cada píxel en los tres canales R, G, y B (33,34,35); - una unidad de proceso (46) configurada para:
- normalizar los tres canales primarios R, G, y B para obtener los canales normalizados L, M, y S (37,38,39);
- generar un cuarto canal normalizado adicional LM (40) mediante la suma con saturación del canal L (37) y del canal M (38), donde la suma con saturación es la suma del canal L (37) y del canal M (38), si dicha suma es menor que la unidad, o la unidad en caso contrario;
- determinar la actividad, A, de cada píxel de acuerdo con los valores de los canales L, M, S y LM (37,38,39,40) como un valor de escala de grises inicial; - determinar el valor final de cada píxel, A', en la imagen de escala de grises (43), sobreponderando la actividad A, para colores cálidos si L es mayor que 0.5, e infraponderando la actividad A, en caso contrario, para colores fríos.
- una unidad de salida (44) configurada para mostrar la imagen en escala de grises (43).
4. Sistema según la reivindicación 3, donde para calcular el valor de cada píxel en escala de grises se modifica el valor de actividad A según una función A':
A' = max( m in( A (a * ( i+e_31(2¿_1) - ° .5) ) , V), 0 )
donde A = LM+L$+M+S , donde LM = min(L M, 1), donde el valor del parámetro a se corresponde con una de las constantes, W: para modificar el contraste de regiones con colores cálidos en la imagen de color (31), o C: para modificar el contraste en regiones con colores fríos; de forma que se cumple:
si L > 0.5 a = / ; 0<=W<=1; y si L < 0.5 a = C ; 0<=C<=1.
5. Sistema según la reivindicación 4, que comprende además una interfaz de usuario (42) para recibir e introducir los valores de las constantes W, C y para transmitirlos a la unidad de proceso (46).
6. Producto de programa informático para ordenador que comprende instrucciones para llevar a cabo el método definido en las reivindicaciones 1 o 2, cuando las instrucciones del programa se ejecutan en un procesador de un ordenador.
ES201831253A 2018-12-20 2018-12-20 Metodo y sistema para convertir una imagen digital de color a escala de grises Active ES2774013B2 (es)

Priority Applications (1)

Application Number Priority Date Filing Date Title
ES201831253A ES2774013B2 (es) 2018-12-20 2018-12-20 Metodo y sistema para convertir una imagen digital de color a escala de grises

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
ES201831253A ES2774013B2 (es) 2018-12-20 2018-12-20 Metodo y sistema para convertir una imagen digital de color a escala de grises

Publications (2)

Publication Number Publication Date
ES2774013A1 ES2774013A1 (es) 2020-07-16
ES2774013B2 true ES2774013B2 (es) 2021-08-11

Family

ID=71528135

Family Applications (1)

Application Number Title Priority Date Filing Date
ES201831253A Active ES2774013B2 (es) 2018-12-20 2018-12-20 Metodo y sistema para convertir una imagen digital de color a escala de grises

Country Status (1)

Country Link
ES (1) ES2774013B2 (es)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0500327B1 (en) * 1991-02-20 1998-09-30 Canon Kabushiki Kaisha Image processing apparatus
US8355566B2 (en) * 2009-04-03 2013-01-15 Hong Kong Baptist University Method and device for use in converting a colour image into a grayscale image
US8594419B2 (en) * 2009-11-09 2013-11-26 Hewlett-Packard Development Company, L.P. Method and apparatus for converting a color image to grayscale
CN106856001A (zh) * 2016-12-08 2017-06-16 彭志勇 灰度图像的保存方法和灰度图像原始像素的获取方法
CN108230405A (zh) * 2017-11-30 2018-06-29 中原智慧城市设计研究院有限公司 基于灰度化的图像白平衡处理方法

Also Published As

Publication number Publication date
ES2774013A1 (es) 2020-07-16

Similar Documents

Publication Publication Date Title
Zhang et al. Underwater image enhancement via extended multi-scale Retinex
Jefferson et al. Accommodating color blind computer users
WO2018201662A1 (zh) 嘴唇渲染颜色的方法、装置及电子设备
Rizzi et al. From retinex to automatic color equalization: issues in developing a new algorithm for unsupervised color equalization
Wesolkowski Color image edge detection and segmentation: A comparison of the vector angle and the euclidean distance color similarity measures
Brainard Bayesian approaches to color vision
Hong et al. A neuromorphic model for achromatic and chromatic surface representation of natural images
CN108428215A (zh) 一种图像处理方法、装置和设备
Yeonan-Kim et al. Retinal lateral inhibition provides the biological basis of long-range spatial induction
Provenzi Computational Color Science: Variational Retinex-like Methods
Albers et al. An independent contribution of colour to the aesthetic preference for paintings
CN112215808A (zh) 一种生成人脸皮肤敏感图的方法及其相关装置
Durmus Spatial frequency and the performance of image-based visual complexity metrics
EP2902965B1 (en) Heteroptics analysis device, heteroptically-altered image generating device for generating heteroptics to create perception approximating original image, heteroptics analysis method, method for generating heteroptically-altered image to create perception approximating original image, and program
Hung et al. Abrupt darkening under high dynamic range (HDR) luminance invokes facilitation for high-contrast targets and grouping by luminance similarity
JP6765519B2 (ja) 色処理プログラム、色処理方法、色彩感覚検査システム、出力システム、色覚補正画像処理システムおよび色覚シミュレーション画像処理システム
CN112686800B (zh) 图像处理方法、装置、电子设备及存储介质
Meylan Tone mapping for high dynamic range images
ES2774013B2 (es) Metodo y sistema para convertir una imagen digital de color a escala de grises
Spieringhs et al. Road marking contrast threshold revisited
CN113610823A (zh) 图像处理方法、装置、电子设备及存储介质
Ulucan et al. BIO-CC: Biologically inspired color constancy.
JP6949795B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
Vladusich Gamut relativity: a new computational approach to brightness and lightness perception
US11527023B2 (en) Image processing for increasing visibility of obscured patterns

Legal Events

Date Code Title Description
BA2A Patent application published

Ref document number: 2774013

Country of ref document: ES

Kind code of ref document: A1

Effective date: 20200716

FG2A Definitive protection

Ref document number: 2774013

Country of ref document: ES

Kind code of ref document: B2

Effective date: 20210811