MX2013001709A - Metodo de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de decodificacion de imágenes en movimiento, y aparato de codificacion y decodificacion de imagenes en movimiento. - Google Patents

Metodo de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de decodificacion de imágenes en movimiento, y aparato de codificacion y decodificacion de imagenes en movimiento.

Info

Publication number
MX2013001709A
MX2013001709A MX2013001709A MX2013001709A MX2013001709A MX 2013001709 A MX2013001709 A MX 2013001709A MX 2013001709 A MX2013001709 A MX 2013001709A MX 2013001709 A MX2013001709 A MX 2013001709A MX 2013001709 A MX2013001709 A MX 2013001709A
Authority
MX
Mexico
Prior art keywords
decoding
processing unit
unit
coding
arithmetic
Prior art date
Application number
MX2013001709A
Other languages
English (en)
Inventor
Takahiro Nishi
Hisao Sasai
Youji Shibahara
Kyoko Tanikawa
Toshiyasu Sugio
Toru Matsunobu
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Publication of MX2013001709A publication Critical patent/MX2013001709A/es

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método de codificación de imágenes en movimiento incluye (i) transformar, para cada una de una o más segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, una señal de imágenes en movimiento en un dominio espacial en un coeficiente de dominio de frecuencia y cuantificar el coeficiente de dominio de frecuencia, y (ii) ejecutar la codificación aritmética sobre un indicador de luminancia CBF si un coeficiente cuantizado está incluido o no en la segunda unidad de procesamiento en la cual se ejecutan la transformación y la cuantización (S704), en donde, en la codificación aritmética, se determina una Tabla de probabilidades para uso en la codificación aritmética de acuerdo a si el tamaño de la primera unidad de procesamiento (S701) es idéntico o no al tamaño de la segunda unidad de procesamiento y a si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado (S702 y S703).

Description

METODO DE CODIFICACION DE IMAGENES EN MOVIMIENTO, METODO DE DECODIFICACION DE IMAGENES EN MOVIMIENTO, APARATO DE CODIFICACION DE IMAGENES EN MOVIMIENTO, APARATO DE DECODIFICACION DE IMAGENES EN MOVIMIENTO, Y APARATO DE. CODIFICACION Y DECODIFICACION DE IMAGENES EN MOVIMIENTO Campo de la Invención La presente invención se refiere a un método de codificación de imágenes en movimiento y un aparato de codificación de imágenes en movimiento el cual codifica un indicador el cual indica si hay o no un coeficiente de transformación de un bloque objetivo de codificación de tal manera que se codifica una imagen para cada uno de los bloques, y un método de decodificación de imágenes en movimiento, un aparato de decodificación de imágenes en movimiento y un aparato de codificación y decodificación de imágenes en movimiento el cual decodifica un indicador el cual indica si hay un coeficiente de transformación codificado o no.
Antecedentes de la Invención En años recientes, ha habido un número creciente de aplicaciones para servicios de tipo de video por demanda, por ejemplo, incluyendo conferencias por video, emisión de video digital, y direccionamiento de .contenidos de video a través del Internet, y estas aplicaciones dependen de la transmisión Ref. 238536 de información de video. En el momento de la transmisión o grabación de datos de video, se transmite una cantidad considerable de datos a través de una ruta de transmisión convencional de un ancho de banda limitado o se almacena en un medio de grabación convencional con capacidad de datos limitada. Con el fin de transmitir información de video a través de un canal de transmisión convencional y almacenar información de video en un medio de grabación convencional, es esencial comprimir o reducir la cantidad de datos digitales.
Así, se ha desarrollado una pluralidad de estándares de codificación de video para la compresión de datos de video. Tales estándares de codificación de video incluyen, por ejemplo, estándares del International Telecommunication Union Telecommunication Standardization Sector (ITU-T) denotados como H. 26x, y los estándares ISO/IEC denotados, MPEG-x. El estándar de codificación de video más actualizado y avanzado es actualmente el estándar denotado como H.264/AVC o PEG-4/AVC (referencia a literatura diferente de patente 1) .
La metodología de codificación que sirve como base para estos estándares se basa en ' la codificación de predicción que incluye etapas principales que se muestran en (a) a (d) a continuación, (a) Con el fin de llevar a cabo la compresión de datos en un nivel de bloque para cada uno de los marcos de video, el marco de video se divide en bloques de píxeles. (b) Prediciendo cada uno de los bloques de los datos de video ya codificados, se especifica una redundancia temporal y espacial, (c) Sustrayendo los datos de predicción de los datos de video, se elimina la redundancia especificada. (d) Por transformaciones de Fourier, cuatización y codificación de entropía, se comprimen los datos restantes (bloques residuales) .
Lista de Citas Literatura No de patentes NPL 1 ITU-T Recommendation H.264 "Advanced video coding for generic audiovisual services," Marzo 2010 NPL 2 JCT-VC "WD3 : Working Draft 3 of High-Efficiency Video Coding," JCTVC-E603 , Marzo 2011 Breve Descripción de la Invención Problema técnico Recientemente, ha habido una necesidad creciente de un incremento adicional en la eficiencia de la codificación contra el entorno del progreso en imágenes en movimiento de alta definición.
Por lo tanto, la presente invención tiene el objetivo de proveer un método de codificación de imágenes en movimiento, un aparato de codificación de imágenes en movimiento, un método para decodificar imágenes en movimiento, un aparato para decodificar imágenes en movimiento, y un aparato de codificación y decodificación de imágenes en movimiento los cuales tienen alta eficiencia de codificación.
Solución al problema Un método de codificación de imágenes en movimiento de acuerdo con un aspecto de la presente invención es un método para codificar una señal de imágenes en movimiento para cada una de las primeras unidades de procesamiento. Más específicamente, el método de codificación de imágenes en movimiento comprende: transformar, para cada una de las una o más de las segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, la señal de imagen en movimiento en un dominio espacial en un coeficiente de dominio de frecuencia y cuantizar el coeficiente de dominio de frecuencia; y ejecutar una codificación aritmética sobre un indicador CBF de luminancia que indica si se incluye o no un coeficiente cuantizado en cada una de las segundas unidades de procesamiento para las cuales se ejecutan la transformación y la cuantización . En la ejecución de la codificación aritmética, se determina una tabla de probabilidades para uso en la codificación aritmética de acuerdo a si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado.
Cabe anotar que la presente invención puede realizarse o implementarse no solamente como métodos de codificación y métodos de decodificación, sino también como programas para hacer que las computadoras ejecuten cada una de las etapas incluidas en los métodos de codificación y métodos de decodificación. Naturalmente, los programas pueden ser distribuidos a través de un medio de grabación no transitorio tal como memorias solamente de lectura de disco compacto (CD-ROM, POR SUS SIGLAS EN INGLÉS) y redes de comunicación tales como el Internet.
Efectos ventajosos de la invención La presente invención hace posible ejecutar eficientemente la codificación aritmética y decodificación aritmética sobre un indicador CBF de luminancia.
Breve Descripción de las Figuras FIG. 1 La Figura 1 es un diagrama de bloque que muestra un aparato de decodificación que incluye una unidad de decodificación de un indicador CBF de luminancia de acuerdo con la Modalidad 1 de la presente invención; FIG. 2 La Figura 2 es un diagrama de flujo que muestra un flujo de operaciones de una unidad de decodificación de CBF de luminancia 101 de acuerdo con la presente invención; FIG . 3 La Figura 3 es una vista esquemática para la explicación de detalles de la unidad de decodificación de luminancia CBF 101 de acuerdo con la modalidad 1; FIG. 4 La Figura 4 es un diagrama de bloques que muestra un ejemplo de una configuración de un aparato de decodificación de imágenes en movimiento de acuerdo con la Modalidad 1 de la presente invención; FIG. 5A La Figura 5A es la tabla 1000 para uso en la decodificación aritmética de acuerdo con la presente modalidad y una tabla que corresponde a la Tabla 0000 en Figura 28A; FIG. 5B La Figura 5B es la Tabla 1001 para uso en la decodificación aritmética de acuerdo con la presente modalidad y una tabla que corresponde a la Tabla 0001 en Figura 28B; FIG. 5C La Figura 5C es la Tabla 1002 para uso en la decodificación aritmética de acuerdo con la presente modalidad y una tabla que corresponde a la Tabla 0002 en Figura 28C; FIG. 5D La Figura 5D es la Tabla 1003 para uso en la decodificación aritmética de acuerdo con la presente modalidad y una tabla que corresponde a la Tabla 0003 en Figura 28D; FIG. 6 La Figura 6 es un diagrama para la explicación de un método para obtener ctxldxlnc el cual es un número para derivar una probabilidad con respecto al indicador de luminancia CBF de acuerdo con la modalidad 1 de la presente invención; FIG. 7 La Figura 7 es un diagrama de flujo que muestra un flujo de operaciones de una unidad de codificación de un indicador de luminancia CBF de acuerdo con la Modalidad 2 de la presente invención; FIG. 8 La Figura 8 es un diagrama de bloques que muestra un ejemplo de una configuración de un aparato de codificación de imágenes de acuerdo con la Modalidad 2 de la presente invención; FIG. 9 La Figura 9 es una configuración global de un sistema proveedor de contenidos que implementa servicios de distribución de contenidos; FIG. 10 La Figura 10 es una configuración global de un sistema de emisión digital; FIG . 11 La Figura 11 es un diagrama de bloques que muestra un ejemplo de una configuración de una televisión; FIG. 12 La Figura 12 es un diagrama de bloques que ilustra un ejemplo de una configuración de una unidad de reproducción/grabación de información que lee y escribe información desde y en un medio de grabación que es un disco óptico; FIG. 13 La Figura 13 es un diagrama que muestra una configuración de un medio de grabación que es un disco óptico; FIG. 14A La Figura 14A es un diagrama que muestra un ejemplo de un teléfono celular; FIG. 14B La Figura 14B es un diagrama de bloques que muestra un ejemplo de una configuración de un teléfono celular; FIG. 15 La Figura 15 es un diagrama que muestra una estructura de datos multiplexados ; FIG . 16 La Figura 16 es un diagrama que muestra cómo multiplexar cada corriente en datos multiplexados; FIG . 17 La Figura 17 es un diagrama que muestra cómo una corriente de video es almacenada en una corriente de paquetes PES en más detalle; FIG. 18 La Figura 18 es un diagrama que muestra una estructura de paquetes TS y paquetes fuente en los datos multiplexados FIG. 19 La Figura 19 es un diagrama que muestra una estructura de datos de una PMT; FIG. 20 La Figura 20 es un diagrama que muestra una estructura interna de información de datos multiplexados; FIG. 21 La Figura 21 es un diagrama que muestra una estructura interna de información de atributos de corriente; FIG. 22 La Figura 22 es un diagrama que muestra etapas para identificar datos de video; FIG. 23 La Figura 23 es un diagrama de bloques que muestra un ejemplo de una configuración de un circuito integrado para implementar el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento de acuerdo con cada una de las modalidades ; FIG. 24 La Figura 24 es un diagrama que muestra una configuración para conmutar entre diferentes frecuencias de impulso ; FIG. 25 La Figura 25 es un diagrama que muestra etapas para identificar datos de video y conmutar entre frecuencias de impulso ; FIG. 26 La Figura 26 es un diagrama que muestra un ejemplo de una tabla de búsqueda en la cual los estándares de video están asociados con las frecuencias de impulso; FIG. 27A La Figura 27A es un diagrama que muestra un ejemplo de una configuración para compartir un módulo de una unidad de procesamiento de señales; FIG. 27B La Figura 27B es un diagrama que muestra otro ejemplo de una configuración para compartir un módulo de la unidad de procesamiento de señales; FIG. 28A La Figura 28A es una correspondencia entre un tipo de división SliceType y un número ctxldx el cual corresponde a un valor de probabilidad necesario para la codificación aritmética y decodificación aritmética; FIG. 28B La Figura 28B es una tabla para la definición de combinaciones de números ctxldx 0 a 11 tal como se ilustra en la Figura 28? y la información (m, n) necesaria para determinar una probabilidad inicial; FIG. 28C La Figura 28C es una tabla que indica la localización de un valor de compensación ctsIdxOffset el cual define que el ctxldx principal cambia de acuerdo con un tipo de división; FIG. 28D La Figura 28D es una tabla acerca de cómo ctxldx se localiza en binldx el cual es un número que indica un orden desde la principal de la secuencia de señal binaria; FIG. 29A La Figura 29A es un diagrama que muestra cómo obtener ctxldxlnc el cual es una señal para derivar un número ctxldx con respecto a un indicador que incluye un indicador de luminancia CBF en HEVC; FIG. 29B La Figura 29B es una tabla que muestra cómo determinar ctxldxlnc del indicador de luminancia CBF; FIG. 30 La Figura 30 es una gráfica que muestra un flujo de los procesos de decodificación adaptativos de contexto convencional; FIG. 31 La Figura 31 es una gráfica que muestra un flujo de los procesos de decodificación aritmética de derivación convencionales ; FIG. 32 La Figura 32 es un diagrama de flujo para explicar en más detalle el procesamiento de normalización (RenormD) tal como se ilustra en la Etapa SC08 en Figura 30.
Descripción, Detallada de la Invención Base para la formación del conocimiento subyacente de la presente invención En el proceso (d) antes descrito, los presentes estándares de codificación de video y los estándares de codificación de video bajo consideración reducen adicionalmente una cantidad de información codificando un indicador que indica si hay o no información en el bloque residual después de la transformada de Fourier y la cuantización. Más específicamente, el indicador que indica si hay o no un coeficiente en el bloque residual después de la cuantización es codificado con longitud variable.
Cabe anotar que en un estándar candidato denominado codificación de video de alta eficiencia (HEVC, por sus siglas en inglés) en el cual se está progresando en el trabajo hacia la estandarización entre paréntesis referencia a la literatura no de patente 2) , este identificador de identificación es denominado identificador de bloque codificado (CBF, por sus siglas en inglés) y el identificador de identificación correspondiente a una señal de luminancia se denomina indicador de luminancia CBF cbf_luma. En la codificación de longitud variable, se conoce la Codificación Aritmética Binaria Adaptativas de Contexto (CABAC, por sus siglas en inglés) basada en la codificación aritmética que se describirá más adelante, y en HEVC, la codificación se ejecuta con parámetros definidos por un método mostrado en las Figuras 28A a 29B.
Las Figuras 28A a 28D son un grupo de información que muestra la definición de información para el indicador de codificación de luminancia CBF en HEVC. Primero, la Tabla 0000 tal como se ilustra en la Figura 28A muestra 1 correspondencia entre un tipo de división (I/P/B) denominada SliceType, y un número ctxldx correspondiente a un valor de probabilidad necesario para codificación aritmética y decodificación aritmética. Esto muestra, por ejemplo, en el caso de la división I, que los números ctxldx usados para codificar y decodificar el indicador de luminancia CBF son de 4 clases, esto es, 0 a 3. De la misma forma, esto muestra 4 clases, esto es, 4 a 7 en el caso de una división P, y cuatro clases, esto es, 8 a 11 en el caso de una división B.
A continuación, la Tabla 0001 mostrada en la Figura 28B es una Tabla para definir una combinación de números ctxldx de 0 a 11 mostrados en la Tabla 0000 e información (m, n) necesaria para determinar una probabilidad inicial. Cabe anotar que con respecto a una técnica para derivar la probabilidad inicial con el uso de (m, n) , se usa una técnica descrita en la literatura no de patente 1 o en la literatura no de patente 2.
A continuación, la Tabla 0002 mostrada en Figura 28C es una Tabla que muestra una localización de un valor de compensación ctxIdxOffset el cual define un cambio del ctxldx principal de acuerdo con el SliceType (en los ejemplos, 0, 4, y 8) .
A continuación, la Tabla 0003 mostrada en la Figura 28D es una Tabla que muestra cómo localizar ctxldx con respecto a binldx el cual es un número que muestra un orden desde la parte principal de la secuencia de señal porque ctxldx está localizado para cada señal de secuencia binaria (bin) cuando la codificación y decodificación aritméticas se ejecutan realmente. En otras palabras, el primer bit de la primera secuencia de señal binaria se determina como binldx = 0, y en lo sucesivo se define como 1 y 2. Cabe anotar que puesto que el indicador de luminancia CBF es un indicador que indica "0" o "1", está definido solamente en el caso de bixldx = 0. Un método definido en la sub cláusula 9.3.3.1.1.1 muestra que el número ctxldx se usa con uno de 0, 1, 2, y 3 y está provisto con una compensación de 0 , 4, y 8 de acuerdo con SliceType. Cabe anotar que en la Tabla es un signo no disponible .
Además , el contenido de la subcláusula 9.3.1.1.1 será descrito en detalle con referencia a las Figuras 29A y 29B. B01 mostrada en la Figura 29A es una porción extraída de la literatura no de patente 2 de una porción que muestra un método para obtener una señal de ctxldxlnc para derivar el número ctxldx con respecto a un indicador que incluye el indicador de luminancia CBF en HEVC.
Primero, 9.3.3.1.1 muestra que la codificación aritmética se ejecuta sobre un indicador que incluye el indicador de luminancia CBF con base en resultados de los bloques vecinos. A continuación, en una porción de 9.3.3.1.1.1, se describen detalles acerca de la derivación de un resultado de bloque localizado por encima del bloque que incluye un indicador del objetivo de codificación y un resultado de bloque localizado a la izquierda. Debe anotarse que en el indicador de luminancia CBF, tal como se indica en la Tabla 9-50 mostrada en la Figura 29B, se muestra que ctxldxlnc se determina como sigue por parte del indicador de luminancia CBF en el bloque izquierdo y el indicador de luminancia CBF en el bloque superior.
Primero, en el caso donde el indicador de luminancia CBF en el bloque izquierdo es 0 (o no existe) y el indicador de luminancia CBF en el bloque superior es 0 (o no existe) , el número ctxldxlnc del indicador en un luminancia CBF del objetivo de codificación se determina como 0 (caso 1) . Además, en el caso donde el indicador de luminancia CBF en el bloque izquierdo es 1 o el indicador de luminancia CBF en el bloque superior es 0 (o no existe) , el número ctxldxlnc del indicador de luminancia CBF del objetivo de codificación se determina como 1 (caso 2) . Además, en el caso donde el indicador de luminancia CBF en el bloque izquierdo de 0 (o no existe) y el indicador de luminancia CBF en el bloque superior es 1, el número ctxldxlnc del indicador de luminancia CBF del objetivo de codificación se determina como 2 (caso 3) . Además, en el caso donde el indicador de luminancia CBF en el bloque izquierdo es un indicador de luminancia CBF en el bloque superior es 1, el número ctxldxlnc del indicador CBF del objetivo de codificación se determina como 3 (caso 4) .
De esta manera, se conmuta ctxldxlnc para la derivación de un valor de probabilidad para uso en la codificación aritmética y en la decpdificación aritmética del indicador de luminancia CBF del objetivo de codificación de acuerdo con un valor del indicador de luminancia CBF circundante .
A continuación, se describirá la codificación de longitud variable para el indicador de identificación (CBF) y similares. En H.264, como uno de los métodos de codificación de longitud variable, existe una codificación aritmética binaria adaptativa al contexto (CABAC) . CABAC se describirá con referencia a las Figuras 30 a 32.
La Figura 30 es un diagrama de flujo que muestra un flujo de los procesos de decodificación aritméticos adaptativos al contexto convencional descrito más arriba. Cabe anotar que este diagrama se extrae de la literatura no de patente 1 y es tal como se describe en la literatura no de patente 1 en tanto no hay explicación específica.
En el proceso de decodificación aritmética, se introduce primero un contexto (ctxldx) determinado basado en el tipo de señal.
Esto es seguido por: el cálculo de un valor qCodIRangeldx derivado de un parámetro codIRange que muestra un estado interno actual del aparato de decodificación aritmético; la obtención de un valor pStateldx que es un valor de estado correspondiente a ctxld ,· y la obtención de codIRangeLPS con referencia a una Tabla (rangeTableLPS) con base en estos dos valores de qCodIRangeldx y pStateldx. Aquí, este codIRangeLPS denota un valor que es un parámetro que muestra el estado interno del aparato de decodificación aritmética en el momento de la ocurrencia de un LPS (este LPS especifica uno de los símbolos 0 y 1 que tienen la probabilidad de ocurrencia más baja) con respecto a un primer parámetro codIRange que muestra el estado interno del aparato de decodificación aritmética. Además, un valor obtenido por la sustracción del antes mencionado codIRangeLPS del codIRange actual se incluye en codIRange (etapa SC01) .
A continuación, el codIRange calculado se compara con un segundo parámetro codlOffset que muestra el estado interno del aparato de decodificación aritmética (etapa SC02) . Cuando el codlOffset es mayor o igual a codIRange (SÍ en la etapa SC02) , se determina que el símbolo del LPS se ha presentado, y que valMPS (un valor MPS (0 o 1) que especifica uno de los símbolos 0 y 1 y que tiene la probabilidad de ocurrencia más alta, y el valor diferente (0 cuando val PM = 1 es satisfecho o 1 cuando valMPM = 0 es satisfecho) se fijan en binVal que es un valor de salida de decodificación.
Además, un valor obtenido por la sustracción de codIRange se fija a un segundo parámetro codlOffset que muestra el estado interno del aparato de decodificación aritmética. Adicionalmente, se calcula un valor de codIRangeLPS en la etapa SC01 fijado al primer parámetro codIRange que muestra el estado interno del aparato de decodificación aritmética (etapa SC03) porque ha ocurrido LPS.
Debe notarse que en el caso donde el valor pStateldx que es un valor de estado correspondiente al ctxldx es 0 (SÍ en la Etapa SC05) , se muestra que la probabilidad de LPS es mayor que la probabilidad de MPS, y por lo tanto valMPM es reemplazado (0 cuando valMPM = 1 es satisfecho o 1 cuando valMPM = 0 es satisfecho) (etapa SC06) . Entretanto, en el caso donde el valor pStateldx es 0 (NO en la etapa SC05) , el valor pStateldx se actualiza con base en una Tabla de transformación transIdxLPS en el caso donde se presente LPS (etapa SC07) .
Adicionalmente, en el caso donde codlOffset es pequeño (NO en SC02), se determina que el símbolo de MPS se ha presentado, y valMPS se fija en binVal que es un valor de salida de decodificación, y el valor pStateldx es actualizado con base en la Tabla de transformación transIdxMPS en el caso donde se ha presentado el MPS (etapa SC04) .
Finalmente, se ejecuta la normalización (RenormD) (etapa SC08) para finalizar la decodificación aritmética.
Como se describió anteriormente, en la codificación aritmética binaria adaptativa al contexto, se almacena una pluralidad de probabilidades de presencia del símbolo cada una de las cuales es la probabilidad de ocurrencia de un símbolo binario correspondiente al índice de contexto que está almacenado y las probabilidades de ocurrencia del símbolo se conmutan de acuerdo con una condición (por ejemplo, con referencia al valor del bloque adyacente) . Por lo tanto el orden de los procesos necesita ser mantenido.
La Figura 31 es un diagrama de flujo que muestra un flujo de los procesos de decodificación aritmética antes descritos convencionales para el procesamiento alternativo. Debe anotarse que este diagrama se extrae de la literatura no de patente 1 y es como se describe en la literatura no de patente 1 en tanto no hay explicación específica.
Primero, el segundo parámetro codlOffset que muestra un estado interno actual del aparato de decodificación aritmética se desplaza a la izquierda (se dobla), y se lee 1 bit de la corriente de bits. Este valor (doblado) se fija cuando la lectura de bits es 0, mientras que un valor obtenido por la adición de 1 al mismo se fija cuando la lectura de bits es 1 (SD01) .
A continuación, en el caso donde codlOffset es mayor que o igual al primer parámetro codIRange que muestra el estado interno del aparato de decodificación aritmética (SÍ en SD02) , "1" se fija en binVal que es un valor de salida de decodificación, y un valor obtenido a través de la sustracción de codIRange se fija en codlOffset (etapa SD03 entretanto, en el caso donde codlOffset es más pequeño que el primer parámetro codIRange que muestra el estado interno del aparato de decodificación aritmética (NO en SD02) , "0" se fija en binVal que es un valor de salida de decodificación (etapa SD04) .
La Figura 32 es un diagrama de flujo para explicar en detalle el proceso de normalización (RenormD) muestra la etapa SC08 en Figura 30. Cabe anotar que este diagrama es extraído de la literatura no de patente 1 en tanto no hay explicación específica.
Cuando el primer parámetro codIRange que muestra el estado interno del aparato de decodificación aritmética en la decodificación aritmética es más pequeño que 0 x 100 (en la notación hexadecimal que es 256 en el sistema decimal) (SÍ en la Etapa SE01) , codIRange se desplaza a la izquierda (doblado) , el Segundo parámetro codlffset que muestra el estado interno del aparato de decodificación aritmética es desplazado a la izquierda (doblado) , y se lee 1 bit a partir de la corriente de bits. Este valor (doblado) se fija cuando la lectura de bits es 0, mientras que un valor obtenido agregando 1 al mismo sería cuando la lectura de bits es 1 (SE02) . Este procesamiento se completa cuando codIRange alcanza o excede finalmente 256 (NO en la etapa SE01) .
La decodificación aritmética se ejecuta llevando a cabo los procesos anteriores.
Sin embargo, la técnica convencional requiere que el valor de probabilidad varié de acuerdo con los resultados de los bloques superior e izquierdo que son vecinos uno con otro para la codificación aritmética y la decodificación aritmética del indicador de luminancia CBF. Contra este fondo, los resultados de los bloques vecinos en las porciones izquierda y superior para la codificación o decodificación deberian ser grabados para la codificación aritmética y decodificación aritmética. Debido a esto, en el caso donde la resolución de un video de entrada es grande, debe prepararse una memoria voluminosa para almacenar los resultados .
Con el fin de resolver el problema antes descrito, un método de codificación de imágenes móviles de acuerdo con una modalidad no limitante y de ejemplo es un método para decodificar una señal de imagen en movimiento para cada una de las primeras unidades de procesamiento. Más específicamente, el método de codificación de imágenes en movimiento que comprende: transformar, para cada una o más de las segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, la señal de imágenes móviles en un dominio espacial en un coeficiente de dominio de frecuencia y cuantificar el coeficiente de dominio de frecuencia; y ejecutar la codificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en cada una de las segundas unidades de procesamiento para las cuales se ejecutan la transformación y la cuantización. En la ejecución de una codificación aritmética, se determina una Tabla de probabilidades para uso de acuerdo con el hecho de que si un tamaño de la primera unidad de procesamiento es o no idéntico a un tamaño de la segunda unidad de procesamiento y de si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
Con esta configuración, puesto que puede determinarse un valor de probabilidad para ejecutar la codificación aritmética del indicador de luminancia CBF sin depender del valor del indicador de luminancia CBF para cada uno de los bloques circundantes, puede mantenerse una eficiencia de codificación alta incluso si una capacidad de memoria para mantener el indicador de luminancia CBF disminuye significativamente.
Adicionalmente , en la ejecución de una codificación aritmética, se determina adicionalmente una Tabla de probabilidades para uso en la codificación aritmética de acuerdo con un tipo de una división a la cual pertenece la primera unidad de procesamiento.
Por ejemplo, la primera unidad de procesamiento puede ser una unidad de codificación. Además, la segunda unidad de procesamiento puede ser una unidad de transformación .
Además, la conmutación puede ejecutarse entre la codificación que se conforma con un primer estándar y en la codificación que conforma con un segundo estándar y la cuantización y la codificación aritmética se ejecutan a medida que la codificación que se conforma con el primer estándar, y el método de codificación de imágenes en movimiento puede comprender adicionalmente la codificación como un identificador que indica un estándar de codificación.
Un método de decodificación de imágenes en movimiento de acuerdo con una modalidad no limitante y de ejemplo es un método para decodificar una señal de imágenes en movimiento para cada una de las unidades de procesamiento. Más específicamente, el método de decodificación de imágenes en movimiento incluye: ejecutar la decodificación aritmética sobre un indicador de luminancia CBF que indica si está incluido o no un coeficiente cuantizado en una o más unidades secundarias de procesamiento en la primera unidad de procesamiento; y reconstruir la señal de imágenes en movimiento usando el coeficiente cuantizado de la segunda unidad de procesamiento cuando el indicador de luminancia CBF indica que el coeficiente cuantizado está incluido en cada una de las segundas unidades de procesamiento, siendo decodificado el indicador de luminancia CBF en la decodificación aritmética. En la ejecución de la decodificación aritmética, se determina una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo con si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y de si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado.
En la ejecución de la decodificación aritmética, se determina adicionalmente una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo con un tipo de una división a la cual pertenece la unidad primera de procesamiento .
Por ejemplo, la primera unidad de procesamiento puede ser una unidad de codificación. Además, la segunda unidad de procesamiento puede ser una unidad de transformación .
Además, la conmutación puede ejecutarse entre la decodificación que se conforma con un primer estándar y la decodificación que se conforma con un segundo estándar de acuerdo con un identificador el cual está incluido en una señal codificada e indica el primer estándar o el segundo estándar, y la decodificación aritmética y la reconstrucción pueden ejecutarse como la decodificación que se conforma con el primer estándar cuando el identificador indica el primer estándar.
El aparato de codificación de imágenes en movimiento de acuerdo con una modalidad no limitante y de ejemplo codifica una señal de imágenes en movimiento para cada una de las primeras unidades de procesamiento. Más específicamente, el aparato de codificación de imágenes en movimiento que comprende: una unidad de transformación y cuantización configurada para transformar, para cada una o más de las segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, la señal de imágenes , en movimiento en un dominio espacial en un coeficiente de dominio de frecuencia y para cuantificar el coeficiente de dominio de frecuencia; y una unidad de codificación aritmética configurada para llevar a cabo la codificación aritmética sobre un indicador de luminancia GBF que indica si un coeficiente cuantizado está incluido o no en la segunda unidad de procesamiento procesada por la unidad de transformación y cuantización. La unidad de codificación aritmética está configurada para determinar una Tabla de probabilidades para uso en la codificación aritmética de acuerdo a si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado.
Un aparato de decodificación de imágenes en movimiento de acuerdo con una modalidad no limitante y de ejemplo decodifica una señal de imágenes en movimiento codificadas para cada una de las primeras unidades de procesamiento. Más específicamente, el aparato de decodificación de imágenes en movimiento que comprende: una unidad de decodificación aritmética configurada para llevar a cabo la decodificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en una o más segundas unidades de procesamiento incluidas en la primera unidad de procesamiento; y una unidad de reconstrucción configurada para reconstruir una señal de imágenes en movimiento utilizando el coeficiente cuantizado de la segunda unidad de procesamiento cuando el indicador de luminancia CBF indica que el coeficiente cuantizado está incluido en la segunda unidad de procesamiento, siendo procesados el indicador de luminancia CBF por la unidad de decodificación aritmética. La unidad de decodificación aritmética está configurada para determinar una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo a si el tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
Un aparato de codificación y decodificación de imágenes en movimiento de acuerdo con una modalidad no limitante y de ejemplo incluye el aparato de codificación de imágenes en movimiento y el aparato de decodificación de imágenes en movimiento que se describieron anteriormente.
Cabe anotar que pueden implementarse modalidades generales o específicas no sólo como un sistema, un método, un circuito integrado, un programa de computadora, o- un medio de grabación, sino también como una combinación opcional de un sistema, un método, un circuito integrado, un programa de computadora y un medio de grabación.
De aquí en adelante, se describen ciertas modalidades ejemplares en mayor detalle con referencia a los dibujos acompañantes. Cada una de las modalidades ejemplares descritas más adelante muestra un ejemplo general o específico. Los valores numéricos, formas, materiales, elementos estructurales, la disposición y conexión de los elementos estructurales, etapas, el orden de procesamiento de las etapas, etc., mostrados en las siguientes modalidades ejemplares son solamente ejemplos, y por lo tanto no limitan el concepto inventivo, el cual está definido en las reivindicaciones anexas y sus equivalentes . La presente invención está definida por el alcance de las reivindicaciones. Por lo tanto, entre los elementos estructurales en las siguientes modalidades ejemplares, los elementos estructurales no citados en ninguna de las reivindicaciones independientes que definen la parte más genérica del concepto inventivo se describen como elementos estructurales arbitrarios.
Modalidad 1 Un aparato de decodificación de imágenes en movimiento de acuerdo con la modalidad 1 decodifica una señal de imágenes en movimiento para cada una de las primeras unidades de procesamiento. Por lo tanto, el aparato de decodificación de imágenes en movimiento incluye: una unidad de decodificación aritmética que ejecuta la decodificación aritmética sobre un indicador de luminancia por lo que indica si un coeficiente cuantizado está incluido o no en una o más de las segundas unidades de procesamiento incluidas en la primera unidad de procesamiento; y una unidad de reconstrucción la cual reconstruye una señal de imágenes en movimiento utilizando un coeficiente cuantizado de las segunda unidad de procesamiento cuando el indicador de luminancia CBF decodificado en la unidad de decodificación aritmética muestra que el coeficiente cuantizado está incluido en la segunda unidad de procesamiento.
La unidad de decodificación aritmética determina una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo con si el tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado. Adicionalmente, la unidad de decodificación aritmética puede determinar una Tabla de probabilidades de acuerdo con un tipo de división al cual pertenece la primera unidad de procesamiento (I slice/P slice/B slice) . Cabe anotar que "la determinación de una Tabla de probabilidades" puede ser parafraseada como "conmutar un contexto", por ejemplo.
Una entrada de imágenes en movimiento en el aparato de decodificación de imágenes en movimiento está compuesta de una pluralidad de imágenes. Además, cada una de las imágenes está dividida en una pluralidad de secciones . Luego la sección es codificada o decodificada de acuerdo con cada una de las unidades de procesamiento . La unidad de procesamiento incluye una unidad de codificación (CU, por sus siglas en inglés) , una unidad de predicción (PU, por sus siglas en inglés) , y una unidad de transformación (TU, por sus siglas en inglés) . CU es un bloque de máximo 128 x 128 píxeles y es una unidad que corresponde a un macro-bloque convencional. PU es una unidad fundamental para la inter-predicción. TU es una unidad fundamental para la transformación ortogonal, y el tamaño de TU es tan pequeño o más pequeño que el tamaño de CU. En lo sucesivo, la unidad de codificación se describe como un bloque codificado y la unidad de transformación se describe como un bloque transformado.
La primera unidad de procesamiento de acuerdo con la presente modalidad es, por ejemplo, un bloque codificado (CU) . Además, la segunda unidad de procesamiento de acuerdo con la presente modalidad es, por ejemplo, un bloque transformado (TU) . Hay un indicador de luminancia CBF en cada uno de los bloques transformados y el indicador de luminancia CBF indica si hay o no un coeficiente cuantizado en el bloque transformado. Cabe anotar que "si hay o no un coeficiente cuantizado del bloque transformado" puede ser parafraseada como si hay o no un coeficiente cuantizado para hacer codificada. Adicionalmente, puede ser parafraseada como si hay o no un coeficiente diferente de 0 en- el bloque transformado.
La Figura 1 es un diagrama de bloque que muestra una configuración funcional de un aparato de decodificación que incluye una unidad de decodificación de un indicador de luminancia CBF de acuerdo con la modalidad 1 de la presente invención.
Un aparato de decodificación 100 de acuerdo que la presente modalidad, como se muestra en la Figura 1, incluye una unidad de decodificación 101 de luminancia CBF, una unidad de control 102, un conmutador 103, una unidad de decodificación de coeficiente residual 104, y una unidad de reconstrucción de señal residual 105, y una unidad de adición 106. El aparato de decodificación 100 reconstruye el indicador de luminancia CBF a partir de una información de posición de POS y una corriente de bits BS obtenida, y genera una señal de imagen decodificada OUT desde una señal de predicción de imágenes PRED.
Una operación de la unidad de decodificación de luminancia CBF 101 de acuerdo con la presente modalidad se describirá en detalle con referencia la Figura 2. La Figura 2 es un diagrama de flujo que muestra un flujo de operaciones de la unidad de decodificación de luminancia CBF 101 de acuerdo con la presente invención.
Primero, la unidad de decodificación de luminancia CBF 101 obtiene una corriente de bits objetivo BS . Además, la unidad de control 102 obtiene información POS que indica donde un objetivo de decodificación tiene el tamaño de un bloque codificado y un coeficiente de transformación, y lo genera hacia la unidad de decodificación de luminancia CBF 101.
A continuación, la unidad de decodificación de luminancia CBF 101, partir de la información obtenida de la unidad de control 102, determina (i) si un tamaño de un bloque de transformación que muestra el indicador de luminancia CBF del objetivo de decodificación es o no el mismo que el de un bloque codificado, o (ii) si, por ejemplo, el tamaño del bloque transformado es o no el mismo que el tamaño máximo del bloque transformado (S201) . Debe notarse que la información que especifica el tamaño máximo del bloque transformado está, por ejemplo, incluida en una corriente de bits .
Cabe anotar que la información que especifica el tamaño máximo del bloque transformado está, por ejemplo, incluida en una corriente de bits cuando se satisface al menos uno de los más arriba descritos (i) y (ii) (SÍ en S201) , ctxldxlnc el cual es un número para prescribir información de probabilidad utilizada para la decodificación aritmética se fija en 1 (S203). Entretanto, cuando no se satisface ninguno de los anteriormente descritos (i) y (ii) (NO in S201) , ctxldxlnc el cual es un número para prescribir la información de probabilidades para uso en la decodificación aritmética se fija en 0 (S202) . Cabe anotar que el valor fijado para ctxldxlnc no está limitado a los ejemplos de las etapas S202 y S203. En otras palabras, es aceptable en tanto un valor diferente se fije para cada una de etapa S202 y etapa S203. Aun así, debe fijarse un valor común para el lado de la codificación y el lado de la decodificación .
A continuación, se obtiene un valor de probabilidades que corresponde al ctxldx obtenido agregando ctxldxlnc el cual es un número para prescribir la información de probabilidad obtenida en las etapas S202 y S203, y un valor de compensación (con referencia a las Figuras 5A a 5D que se van a describir) , lo cual se determina para cada una de las secciones predeterminadas, y se ejecuta un procesamiento de decodificación aritmética sobre el indicador de luminancia CBF objetivo (S204). Con esto, se obtiene el indicador de luminancia CBF.
A continuación, el indicador de luminancia CBF obtenido en la etapa S204 es generado con respecto a la unidad de control 102 y se usa para control del conmutador 103. En el caso donde el indicador de luminancia CBF indique "no coeficiente" (por ejemplo 0), el conmutador 103 se conecta a un terminal B. En otras palabras, puesto que no hay el coeficiente de transformación en el bloque transformado, no hay señal residual para hacer añadida con respecto a la señal de predicción de imágenes PRED. Por lo tanto, la señal de predicción de imágenes PRED es generada como una señal de decodificación de imágenes OU .
Entre tanto, en el caso en que el indicador de luminancia CBF indica "existe coeficiente" (por ejemplo 1) , el conmutador 101 se conecta a un terminal A. En este caso, la señal de coeficiente residual incluida en la corriente de bits BS es decodificada por la unidad de decodificación de coeficiente residual 104, y la señal residual obtenida a través de la transformación inversa y cuantización inversa por la unidad de reconstrucción de señal residual 105, y la señal de prohibición de imágenes PRED son añadidas mediante la unidad de adición 106, y se genera la señal de imágenes decodificadas OUT. Con esto, la señal de imágenes decodificadas OUT puede ser generada correctamente a partir de la corriente de bits BS con el uso del indicador de luminancia CBF.
En otras palabras, la unidad de decodificación de luminancia CBF 101, y la unidad de control 102 mostradas en la Figura 1, por ejemplo, corresponden a la unidad de decodificación aritmética de acuerdo con la presente modalidad. Además, el conmutador 103, la unidad de decodificación de coeficiente residual 104, y la unidad de reconstrucción residual 105 mostradas en la Figura 1 corresponden a la unidad de reconstrucción de acuerdo con la presente modalidad. Cabe anotar que no están limitadas a las relaciones de correspondencia anteriormente descritas.
La Figura 3 es una vista esquemática para explicar la condición mostrada en la etapa S201 de la Figura 2. Los bloques 301 a 306 ilustrados en marcos gruesos denotan los bloques codificados. Además, los bloques generados a través de la división adicional de los bloques 301 y 302 denotan bloques transformados.
El tamaño del bloque transformado se determina tan grande o más pequeño que el tamaño del bloque codificado. Cabe anotar que en esta descripción, se describirá el caso donde los tamaños de los bloques 301 y 302 son el tamaño máximo del bloque codificado (64 x 64 píxeles) y el tamaño máximo del bloque transformado se determina para que sea un tamaño de bloque más pequeño por una capa jerárquica (32 x 32 píxeles) . Además, el tamaño máximo del tamaño transformado varía de acuerdo con la información ilustrada en la información de cabeza de la sección.
Cabe anotar que puesto que la presente invención, independientemente del tamaño del bloque transformado, se caracteriza por las tablas de probabilidad de conmutación de acuerdo con una condición constante (etapa S201) y no dependiendo de los resultados de los bloques circundantes, la presente invención puede realizar los efectos de la presente invención (reducción en la cantidad de memoria) incluso si hay un cambio en el tamaño máximo del bloque transformado.
Aquí, se describirá el caso donde el bloque 301 se determina como un bloque codificado.
Primero, en el caso donde un pequeño bloque de la primera capa jerárquica obtenido a través de la división del bloque 301 en cuatro bloques es un bloque transformado, el indicador de luminancia CBF 311 correspondiente al bloque pequeño de la primera capa jerárquica es decodificado . En el caso donde el indicador de luminancia CBF 311 no indica coeficiente, el coeficiente de transformación no se incluye en el bloque pequeño de la primera capa jerárquica. Por lo tanto, los indicadores de luminancia CBF 312 y 313 correspondientes a los bloques más pequeños que éste no son decodificados . Cabe anotar que en el caso donde el indicador de luminancia CBF 311 se decodifica, el bloque pequeño de la primera capa jerárquica se convierte en el tamaño máximo del bloque transformado (SÍ en S201 de la Figura 2) . Por lo tanto, ctxldxlnc = 1 se utiliza como un número que muestra una Tabla de probabilidades para uso en la decodificación aritmética del indicador de luminancia CBF (S203 en Figura 2) .
Entretanto, en el . caso donde un pequeño bloque de la segunda capa jerárquica (16 x 16 píxeles) obtenido cada uno a través de la división del bloque en cuatro bloques en un bloque transformado, se decodifica el indicador de r luminancia CBF 312 correspondiente al bloque pequeño de la segunda capa jerárquica. Además, en el caso donde un pequeño bloque de la tercera capa jerárquica (8 x 8 píxeles) obtenidos cada uno a través de una división adicional en el bloque en 4 bloques es un bloque transformado, el indicador de luminancia CBF 313 correspondiente al bloque pequeño de la tercera capa jerárquica es decodif cado . En estos casos, ctxldxlnc = 0 se usa como un número que muestra una Tabla de probabilidades para uso en la decodificación aritmética del indicador de luminancia CBF (S202 en Figura 2) .
En el caso donde el indicador de luminancia CBF (se omite la ilustración) correspondiente al bloque pequeño de la primera capa jerárquica del bloque 302 sedes modifica, se utiliza ctxldxlnc = 1 como un número que muestra la Tabla de probabilidades, mientras que en el caso donde el indicador de luminancia CBF (se omite la ilustración) correspondiente al bloque pequeño de la segunda y siguientes jerarquías se decodifica, se usa ctxldxlnc = 0 como un número que muestra la Tabla de probabilidades. Adicionalmente , también con respecto a los bloques 303 a 306, después de que se determina si el tamaño del bloque transformado es idéntico o no al tamaño del bloque codificado o al tamaño máximo del bloque transformado, se determina un número ctxldxlnc que muestra una Tabla de probabilidades de acuerdo con un resultado de la determinación.
Tal como se describió anteriormente, por conmutación entre dos clases en las cuales se determina ctxldxlnc como "0" o "1" con base en una comparación entre el tamaño del bloque transformado y el tamaño del bloque codificado, el número de tablas de probabilidad se reduce desde el convencional 4 a 2 (por división) . Puesto que no hay necesidad de referencia para el indicador de luminancia CBF del bloque circundante para determinar ctxldxlnc del indicador de luminancia CBF del objetivo de decodificación, no es necesario preparar una cantidad voluminosa de memoria incluyendo el regulador de línea. Como resultado, el indicador de luminancia CBF puede ser decodificado correctamente.
Además, conmutando la Tabla de probabilidades del indicador de luminancia CBF entre dos etapas pasadas en si el tamaño del bloque transformado es máximo o no, puede limitarse un descenso en la eficiencia de codificación causado por una reducción en el número de tablas de probabilidad. Esto se debe a que la existencia o ausencia de un coeficiente de transformación depende frecuentemente del tamaño de bloque del bloque transformado. Más específicamente, esto obtiene ventaja del hecho de que es más alta la posibilidad de que todos los coeficientes lleguen a ser 0 si el tamaño del transformado es más pequeño.
Cabe anotar que una unidad de decodificación aritmética de acuerdo con la modalidad 1 de la presente invención (un aparato de decodificación 100) está incluido en un aparato de decodificación de imágenes en movimiento el cual decodifica datos de imágenes codificados que están comprimidos y codificados. La Figura 4 es un diagrama de bloques que muestra un ejemplo de una configuración de un aparato 400 de decodificación de imágenes en movimiento de acuerdo con la modalidad 1 de la presente invención.
El aparato de decodificación de imágenes en movimiento 400 decodifica datos de imágenes codificadas que están comprimidas y codificadas. Por ejemplo, los datos de imágenes codificadas se introducen en el aparato de decodificación de imágenes 400 en forma de una señal de objetivo de decodificación para cada uno de los bloques. El aparato de decodificación de imágenes 400 reconstruye los datos de las imágenes ejecutando decodificación de longitud variable, cuantización inversa, y transformación inversa sobre la señal objetivo de decodificación de entrada.
Como se muestra la Figura 4, el aparato de decodificación de imágenes en movimiento 400 incluye una unidad de decodificación de entropía 410, una unidad de cuantización inversa y transformación inversa 420, un agregador 425, un filtro de desbloqueo 430, una memoria 440, una unidad de intra-predicción 450, una unidad de compensación de movimiento 460, y un conmutador intra/inter470.
La unidad de decodificación de entropía 410 reconstruye coeficientes cuantizados ejecutando decodificación de longitud variable sobre una señal de entrada (corriente de entrada) . Cabe anotar aquí que la señal de entrada (corriente de entrada) es una señal de objetivo de decodificación y corresponde a datos para cada uno de los bloques de datos de imágenes codificadas. Además, la unidad de decodificación de entropía 410 obtiene datos de movimiento de la señal de entrada, y genera los datos de movimiento obtenidos hacia la unidad de compensación de movimiento 460.
La unidad de cuantización inversa y transformación inversa 420 reconstruye los coeficientes de transformación ejecutando cuantización inversa sobre los coeficientes cuantizados reconstruidos por la unidad de decodificación de entropía 410. Entonces, la unidad de cuantización inversa y transformación inversa reconstruye un error de previsión ejecutando transformación inversa sobre los coeficientes de transformación reconstruidos.
El agregador 425 añade el error de producción reconstruido por la unidad de cuantización inversa y transformación inversa 420 y una señal de previsión obtenida del conmutador intra/inter 470 para generar una imagen decodificada .
El filtro de desbloqueo 430 ejecuta la filtración de desbloqueo sobre la imagen decodificada generada por el agregador 425. La imagen decodificada procesada por el filtro de desbloqueo se genera como una señal decodificada.
La memoria 440 es una memoria para almacenar imágenes de referencia para uso en la compensación del movimiento. Más específicamente, la memoria 440 almacena imágenes decodificadas en las cuales se ejecuta un proceso de filtración de desbloqueo por el filtro de desbloqueo 430.
La unidad de intra-predicción 450 ejecuta la intra-predicción para generar una señal de predicción (una señal de intra-predicción) . Más específicamente, la unidad de intra-predicción 450 ejecuta la intra-predicción con referencia a imágenes que circundan el bloque de objetivo de decodificación (señal de entrada) en la imagen decodificada generada por el agregador 425 para generar una señal de intra-predicción .
La unidad de compensación del movimiento 460 ejecutará compensación del movimiento con base en una salida de datos de movimiento desde la unidad de decodificación de entropía 410 para generar una señal de predicción (una señal de inter-predicción) .
El conmutador intra/inter 470 selecciona cualquiera de una señal de intra-predicción y una señal de inter-predicción, y genera la señal seleccionada como la señal de predicción para el agregador 425.
Con la estructura anterior, el aparato de decodificación de imágenes en movimiento 400 de acuerdo con la modalidad 2 de la presente invención decodifica los datos de imágenes codificados por compresión.
Cabe anotar que en el aparato de decodificación de imágenes en movimiento 400, la unidad de decodificación del indicador de luminancia CBF de acuerdo con la modalidad 1 de la presente invención está incluida en la unidad de decodificación de entropía 410, la unidad de cuantización inversa y transformación inversa 420, y el agregador 425. Más específicamente, por ejemplo, la unidad de decodificación de luminancia CBF 101, la unidad de control 102, el conmutador 103, la unidad de decodificación de coeficiente residual 104 en la Figura 1 están incluidos en la unidad de decodificación de entropía 410, la unidad de reconstrucción de señal 105 de la Figura 1 está incluida en la unidad de cuantización inversa y transformación inversa 420 en la Figura 4, y la unidad de adición 106 en la Figura 1 está incluida en el agregador 425 en la Figura 4. Cabe anotar que no están limitados a las relaciones de correspondencia descritas anteriormente.
Como se describió anteriormente, el aparato de decodificación de imágenes en ' movimiento y el método de decodificación de imágenes en movimiento de acuerdo con la modalidad 1 de la presente invención hace posible reconstruir apropiadamente una corriente de bits en las cuales la necesidad de una memoria para decodificar la luminancia CBF disminuye ejecutando decodificación aritmética del indicador de luminancia CBF del objetivo de decodificación sin depender del valor de luminancia CBF del bloque circundante.
Las Figuras 5A, 5B, 5C y 5D muestran cada una un ejemplo de tablas 1000 a 1003 para uso en la decodificación aritmética de acuerdo con la presente modalidad. Cabe anotar que las tablas 1000 a 1003 son tablas que corresponden a las Figura 28A a 28D, respectivamente. Como se muestra en las Figuras 5A a 5D, en la presente modalidad, se conmutan tablas de probabilidad por sección. Además, el resultado del indicador de luminancia CBF para cada uno de los bloques circundantes no se usa para la conmutación de la Tabla de probabilidad. Esto se describirá más adelante con referencia a la Figura 6 La Figura 6 consiste de frases para explicar el método para obtener ctxldxlnc el cual es un número para derivar la probabilidad con respecto al indicador de luminancia CBF de acuerdo con la presente modalidad. Tal como se ilustra aquí, el conmutador de los dos números depende del tamaño del bloque del tamaño de transformación ( transformDepth y MaxTrafoSize) pero no depende de los resultados de los bloques circundantes.
Modalidad 2 Se describirá un delineamiento de un método de codificación aritmética de acuerdo con la presente modalidad. Cabe anotar que se omitirán descripciones detalladas acerca de porciones similares a la modalidad 1 y nos enfocaremos en las diferencias.
El método de codificación aritmética de acuerdo con la presente modalidad no usa convencionalmente el resultado del indicador de luminancia CBF en los bloques circundantes para codificar el indicador de luminancia CBF, sino que se caracteriza por conmutar entre dos tablas de probabilidades (por sección) de acuerdo con el tamaño del bloque transformado. Con esto, se reduce significativamente un tamaño de memoria necesario para la codificación.
Se describirá un delineamiento del método de codificación aritmética de acuerdo con la presente modalidad. En el caso donde no hay explicación específica, se muestra que puede tomarse el mismo método que el método de codificación aritmética convencional.
Un aparato de codificación de imágenes en movimiento de acuerdo con la modalidad 2 codifica una señal de imágenes en movimiento para cada una de las primeras unidades de procesamiento. Más específicamente, el aparato de codificación de imágenes en movimiento incluye una unidad de transformación y cuantización que transforma una señal de imágenes en movimiento (por ejemplo una señal residual) en un dominio espacial hacia un coeficiente de dominio de frecuencia y cuantifica el coeficiente de dominio de frecuencia para cada una o más de las segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, y una unidad de codificación aritmética la cual ejecuta la codificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en la segunda unidad de procesamiento procesada por la unidad de transformación y cuantización.
Entonces, la unidad de codificación aritmética determina una Tabla de probabilidades para uso en codificación aritmética de acuerdo con si el tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado (se conmuta un contexto) . La unidad de codificación aritmética puede determinar adicionalmente una Tabla de probabilidades para uso en la codificación aritmética de acuerdo con un tipo al cual pertenece la primera unidad de procesamiento .
A continuación, se describirá un flujo de procesos por una unidad de codificación de indicador de luminancia CBF que ejecuta el método de codificación del indicador de luminancia CBF de acuerdo con la presente modalidad. La Figura 7 es un diagrama de flujo que muestra un ejemplo de un flujo de operaciones de una unidad de codificación del indicador de luminancia CBF de acuerdo con la modalidad 2 de la presente invención.
La unidad de codificación del indicador de luminancia CBF, a partir de la información obtenida a partir de la unidad de control, determina (i) si un tamaño de un bloque de transformación que indica el indicador de luminancia CBF del objetivo de codificación es el mismo o no que el de un bloque codificado, o (ii) si un tamaño de un bloque de transformación, por ejemplo, es el mismo que el tamaño máximo del bloque de transformación (S701) . Cabe anotar que la información que especifica el tamaño máximo del bloque de transformación está, por ejemplo, incluida en una corriente de bits.
Cuando se satisface al menos uno de (i) y (ii) (YES in S701) , ctxldxlnc el cual es un número para prescribir la información de probabilidades para la codificación aritmética se fija en 1 (S703) . Entretanto, cuando no se satisface ninguno de los anteriormente (i) y (ii) (NO en S701) , ctxldxlnc el cual es un número para prescribir la información de probabilidad para la codificación aritmética se fija en 0 (S702) .
A continuación, se obtiene un valor de probabilidad que corresponde a ctxldx obtenido por la adición de ctxldxlnc el cual es un número para prescribir la información de probabilidad obtenida en las etapas S702 y S703 y un valor de compensación (con referencia a las Figuras 5A a 5D) el cual se determina con anticipación para cada una de las secciones, y el procesamiento de la codificación aritmética se ejecuta sobre el indicador de luminancia CBF objetivo (S704) . Con esto, se codifica el indicador de luminancia CBF.
Codificando de esta manera, puede realizarse un aparato de codificación del indicador de luminancia CBF con una cantidad de memoria requerida limitada.
Cabe anotar que una unidad de codificación del indicador de luminancia CBF de acuerdo con la modalidad 2 de la presente invención se incluye en un aparato de codificación de imágenes que ejecuta codificación por compresión sobre datos de imágenes. La Figura 8 es un diagrama de bloque que muestra un ejemplo de una configuración de un aparato de codificación de imágenes 200 de acuerdo con la modalidad 2 de la presente invención.
El aparato de codificación de imágenes 200 ejecuta la codificación por compresión sobre datos de imágenes. Por ejemplo, los datos de imágenes son introducidos en el aparato de codificación de imágenes 200 como una señal de entrada para cada uno de los bloques. El aparato de codificación de imágenes 200 ejecuta la transformación, cuantización y codificación con longitud variable de señal de entrada para generar una señal codificada.
Como se muestra en la Figura 10, el aparato de codificación de imágenes 200 incluye un sustractor 200, una unidad de transformación y cuantización 210, una unidad de codificación de entropía 220, una unidad de cuantización inversa y transformación inversa 230, un agregador 235, un filtro de desbloqueo 240, una memoria 250, una unidad de intra-predicción 260, una unidad de estimación de movimiento 270, una unidad de compensación del movimiento 280, y un conmutador intra/ínter 290.
El sustractor 205 calcula un error de predicción que es la diferencia entre la señal de entrada y la señal de predicción.
La unidad de transformación y cuantización 210 transforma el error de previsión en el dominio espacial en coeficientes de transformación en el dominio de frecuencia. Por ejemplo, la unidad de transformación y cuantización 210 ejecuta una Transformación en Coseno Discreta (DCT, por sus siglas en inglés) sobre el error de predicción para generar coeficientes de transformación. Adicionalmente , la unidad de transformación y cuantización 210 cuantifica los coeficientes de transformación para generar coeficientes cuantizados.
Además, la unidad de transformación y cuantización 210 genera un indicador de luminancia CBF que indica si un coeficiente (coeficiente cuantizado) está presente o no en el bloque transformado. Más específicamente, la unidad de transformación y cuantización 210 fija "1" para el indicador de luminancia CBF cuando un coeficiente está presente en el bloque transformado y fija "0" para el indicador de luminancia CBF cuando un coeficiente no está presente en el bloque transformado.
La unidad de codificación de entropía 220 ejecuta una codificación de longitud variable sobre el coeficiente cuantizado para generar una señal codificada. Además, la unidad de codificación de entropía 220 codifica datos de movimiento (por ejemplo un vector de movimiento) estimado por la unidad de estimación de movimiento 270, agrega los datos de movimiento a la señal codificada y genera la señal codificada.
La unidad de cuantización inversa y transformación inversa 230 reconstruye los coeficientes de transformación ejecutando cuantización inversa sobre los coeficientes cuantizados. Adicionalmente, la unidad de cuantización inversa y transformación inversa 230 reconstruye un error de predicción - ejecutando transformación inversa de los coeficientes de transformación reconstruidos. Aquí, el error de predicción reconstruido ha perdido información a través de la cuantización, y por lo tanto no coincide con el error de predicción que es generado por el sustractor 205. En otras palabras, el error de predicción reconstruido incluye un error de cuantización.
El agregador 235 agrega el error de predicción reconstruido y la señal de predicción para generar una imagen decodificada local.
El filtro de desbloqueo 240 ejecutará filtración de desbloqueo sobre la imagen decodificada local generada.
La memoria 250 es una memoria para almacenar imágenes de referencia para utilizar en la compensación del movimiento. Más específicamente, la memoria 250 almacena las imágenes decodificadas locales procesadas por el filtro de desbloqueo .
La unidad de intra-predicción 260 ejecuta la intra-predicción para generar una señal de predicción (una señal de intra-predicción) . Más específicamente, la unidad de intra-predicción 260 ejecuta una intra-predicción con referencia a imágenes que circundan el bloque objetivo de codificación (señal de entrada) en la imagen decodificada local generada por el agregador 235 para generar una señal de intra-predicción.
La unidad de estimación de movimiento 270 estima datos de movimiento (por ejemplo un vector de movimiento) entre la señal de entrada y una imagen de referencia almacenada en la memoria 250.
La unidad de compensación de movimiento 280 ejecuta compensación de movimiento con base en los datos de movimiento estimados para generar una señal de predicción (una señal de inter-predicción) .
El conmutador intra/inter 290 selecciona cualquiera de una señal de intra-predicción y una señal de inter-predicción, y genera la señal seleccionada como señal de predicción a sustractor 205 y al agregador 235.
Con esta estructura, el aparato de codificación de imágenes 200 de acuerdo con la modalidad 2 de la presente invención codifica por compresión los datos de imágenes.
Cabe anotar que en el aparato de codificación de imágenes en movimiento 200, la unidad de codificación del indicador CBF está, por ejemplo, incluida en la unidad de codificación de entropía 220. En otras palabras, la unidad de codificación del identificador CBF incluida en la unidad de codificación de entropía 220 ejecuta la codificación aritmética sobre el indicador de luminancia CBF generado por la unidad de transformación y cuantización 210. Cabe anotar que no está limitada a las relaciones de correspondencia descritas anteriormente.
Cabe anotar que esto no se limita a la relación de correspondencia descrita más arriba.
Modalidad 3 El procesamiento descrito en cada una de las modalidades puede implementarse simplemente en un sistema de computadora independiente, grabando, en medio de grabación, un programa para implementar las configuraciones del método de codificación de imágenes en movimiento (método de codificación de imágenes) y el método de decodificación de imágenes en movimiento (método de decodificación de imágenes) en cada una de las modalidades. Los medios de grabación pueden ser cualquier medio de grabación en tanto el programa pueda ser grabado, tal como un disco magnético, un disco óptico, un disco magnético óptico, una tarjeta IC, y una memoria de semiconductor.
En lo que sigue, se describirán las aplicaciones para el método de codificación de imágenes en movimiento (método de codificación de imágenes) y el método de decodificación de imágenes en movimiento escrito (método de decodificación de imágenes) en cada una de las modalidades y sistemas que utilizan los mismos. El sistema tiene una característica de tener un aparato de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que utiliza el método de codificación de imágenes y un aparato de decodificación de imágenes que utiliza el método de decodificación de imágenes. Pueden cambiarse otras configuraciones del sistema según sea apropiado dependiendo de los casos .
La Figura 9 ilustra una configuración global de un sistema proveedor de contenido exlOO para implementar servicios de distribución de contenido. El área para proveer servicios de comunicación está dividida en celdas de tamaño deseado, y estaciones base exl06, exl07, exl08, exl09, y exllO que son estaciones inalámbricas fijas colocadas en cada una de las celdas .
El sistema proveedor de contenido exlOO se conecta a dispositivos tales como una computadora exlll, un asistente digital (PDA, por sus siglas en inglés) exll2, una cámara exll3, un teléfono celular exll4 y una máquina de juegos exll5, a través del Internet exlOl, un proveedor de servicio de Internet exl02, una red telefónica exl04, así como las estaciones base exl06 a exllO, respectivamente.
Sin embargo, la configuración del sistema proveedor de contenidos exlOO no se limita a la configuración mostrada en la Figura 9, y es aceptable una combinación en la cual se conectan cualquiera de los elementos. Además, cada dispositivo puede ser conectado directamente a la red telefónica exl04, en lugar de a través de las estaciones base exl06 a exllO que son las estaciones inalámbricas fijas. Adicionalmente, los dispositivos pueden ser interconectados uno a otro a través de comunicaciones inalámbricas de corta distancia y otras .
La cámara exll3, tal como una cámara de video digital, es capaz de capturar video. Una cámara exll6, tal como una cámara digital, es capaz de capturar tanto imágenes detenidas como de video. Adicionalmente , el teléfono celular exll4 puede ser uno que satisfaga cualquiera de los estándares tales como el Sistema Global para Comunicaciones Móviles (GSM, por sus siglas en inglés) (marca registrada) , Acceso Múltiple de División de Código (CDMA, por sus siglas en inglés) , Acceso Múltiple de División de . Código de Banda Ancha (W-CDMA, por sus siglas en inglés) , Evolución de Largo Plazo (LTE, por sus siglas en inglés) , y Acceso de Paquetes de Alta Velocidad (HSPA, por sus siglas en inglés) . Alternativamente, el teléfono celular exll4 puede ser un Sistema de Teléfono Manual Personal (PHS, por sus siglas en inglés) .
En el sistema proveedor de contenidos exlOO, un servidor de direccionamiento exl03 está conectado a la cámara exll3 y otros a través de la red telefónica exl04 y la estación base exl09, lo que permite la distribución de imágenes de un espectáculo en vivo y otros . En tal distribución, un contenido (por ejemplo, video de un espectáculo de música en vivo) capturado por el usuario usando la cámara exll3 se codifica tal como se describió anteriormente en cada una de las modalidades (esto es, la cámara funciona como el aparato de codificación de imágenes de acuerdo con un aspecto de la. presente invención) , y el contenido codificado es transmitido al servidor de direccionamiento exl03. Por otro lado, el servidor de direccionamiento exl03 porta la distribución de corriente de los datos a los clientes por solicitud. Los clientes incluyen el computadora exlll, PDA exll2, la cámara es exll3, el teléfono celular exll4, y la máquina de juegos exll5 que son capaces de decodificar los datos codificados antes mencionados. Cada uno de los dispositivos que ha recibido los datos distribuidos decodifica y reproduce los datos codificados (esto es, funciona como el aparato de decodificación de imágenes de acuerdo con un aspecto de la presente invención) .
Los datos capturados pueden ser codificados por la Cámara exll3 o por el servidor de direccionamiento exl03 que transmite los datos, o los procesos de codificación pueden ser compartidos entre la cámara exll3 y el servidor de direccionamiento exl03. De la misma forma, los datos distribuidos pueden ser decodificados por los clientes o el servidor de direccionamiento exl03, o los procesos de decodificación pueden ser compartidos entre los clientes y el servidor de direccionamiento exl03. De la misma forma, los datos de las imágenes detenidas y video capturados por no solamente la Cámara exll3 siempre por la Cámara exll6 pueden ser transmitidos al servidor de direccionamiento exl03 a través del computadora exlll. Los procesos de codificación pueden ser llevados a cabo por la Cámara exll6, la computadora exlll, o el servidor de direccionamiento exl03, o compartidos entre ellos.
Adicionalmente , los procesos de codificación y decodificación pueden ser ejecutados por un LSI ex500 incluido en general en cada uno de las computadoras exlll y los dispositivos. El LSI ex500 puede ser configurado con un chip individual o con una pluralidad de chips . El software para codificar y decodificar video puede estar integrado en algún tipo de medio de grabación (tal como un CD-ROM, POR SUS SIGLAS EN INGLÉS, un disco flexible y un disco duro) que es legible por la computadora exlll y otros, y los procesos de codificación y decodificación pueden llevarse a cabo utilizando el software. Adicionalmente, cuando el teléfono celular exll4 está equipado con una cámara, los datos de video obtenidos por la cámara pueden ser transmitidos. Adicionalmente, cuando el teléfono celular exll4 está equipado con una cámara, los datos de video obtenidos por la cámara pueden ser transmitidos. Los datos de video son datos codificados por el LSI ex500 incluido el teléfono celular exll4.
Adicionalmente, el servidor de direccionamiento exl03 puede estar compuesto de servidores y ordenadores, y puede descentralizar datos y procesar los datos descentralizados, grabar o distribuir datos.
Como se describió anteriormente, los clientes pueden recibir y reproducir los datos codificados en el sistema de suministro de contenidos exlOO. En otras palabras, los clientes pueden recibir y decodificar información transmitida por el usuario, y reproducir los datos decodificados en tiempo real en el sistema de suministro de contenidos exlOO, de tal manera que el usuario que no tenga ningún derecho y equipo particular puede implementar una emisión personal.
Aparte del ejemplo del sistema de suministro de contenidos exlOO, puede implementarse al menos uno de los aparatos de codificación de imágenes en movimiento (aparato de codificación de imágenes) y el aparato de decodificación de imágenes en movimiento (aparato de decodificación imágenes) descritos en cada una de las modalidades en un sistema de emisión digital ex200 ilustrado en la Figura 10. Más específicamente, una estación de emisión ex201 se comunicaba trasmite, a través de ondas de radio con un satélite de emisión ex202, datos multiplexados obtenidos por la multiplexión de datos de audio y otros sobre datos de video. Los datos de video son datos codificados por el método de codificación de imágenes en movimiento descrito en cada una de las modalidades (esto es, datos codificados por el aparato de codificación de imágenes de acuerdo con un aspecto de la presente invención) . Al recibir los datos multiplexados, el satélite de emisión ex202 transmite ondas de radio para la emisión. Luego, una antena de uso doméstico ex204 con una función de recepción de emisión satelital recibe las ondas de radio. A continuación, un dispositivo tal como televisión (receptor) ex300 y una caja encima del televisor (STB, por sus siglas en inglés) ex217 decodificados datos multiplexados recibidos, que reproduce los datos decodificados (esto es, funciona como el aparato de decodificación de imágenes de acuerdo con aspectos de la presente invención) .
Adicionalmente, un lector/grabador ex218 (i) lee y decodifica los datos multiplexados grabados sobre un medio de grabación ex215, tal como un DVD y un BD, o (ii) codifica señales de video en el medio de grabación ex215, y en algunos casos, escribe datos obtenidos por multiplexión de una señal de audio de los datos codificados. El lector/decodificador 218 puede incluir el aparato de decodificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las modalidades. En este caso, las señales de video reproducidas se despliegan en el monitor ex219 y pueden ser reproducidas por otro dispositivo o sistema que utilice el medio de grabación ex215 sobre el cual están grabados los datos multiplexados . También es posible implementar el aparato de decodificación de imágenes en movimiento en la caja encima del televisor ex217 conectada al cable ex203 para una televisión por cable o para la antena ex204 para emisión satelital y/o terrestre, de' tal manera que se desplieguen las señales de video sobre el monitor ex219 de la televisión ex300. El aparato de decodificación de imágenes en movimiento puede ser implementado no en la set top box sino en la televisión.
La Figura 11 ilustra la televisión (receptor) ex300 que utiliza el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento descritos en cada una de las modalidades . La televisión ex300 incluye: un sintonizador ex301 que tiene o proporciona datos multiplexados obtenidos por la multiplexion de datos de audio sobre datos de video, a través de la antena ex204 o el cable ex203, etc., que recibe una emisión; una unidad de modulación/desmodulación ex302 que desmodula los datos multiplexados recibidos o modula los datos en datos multiplexados que pueden ser suministrados hacia el exterior; y una unidad de multiplexión/desmultiplexión ex303 que desmultiplexa los datos multiplexados modulados en datos de video y datos de audio, o multiplexados datos de video y datos de audio codificados por una unidad de procesamiento de señales ex306 en datos.
La televisión ex300 incluye adicionalmente : una unidad de procesamiento de señales ex306 que incluye una unidad de procesamiento de señales de audio ex304 y una unidad de procesamiento de señales de video ex305 que decodifican datos de audio y datos de video y codifica datos de audio y datos de video, respectivamente (las cuales funcionan como el aparato de codificación de imágenes y el aparato de decodificación de imágenes de acuerdo con los aspectos de la presente invención) ; y una unidad de salida ex309 que incluye un altavoz ex307 que proporciona la señal de audio decodificada, y una unidad de pantalla ex308 que despliega la señal de video decodificada, tal como una pantalla. Adicionalmente, la televisión ex300 incluye una unidad de interfaz ex317 que incluye una unidad de entrada en operación ex312 que recibe una entrada de una operación de usuario. Adicionalmente, la televisión ex300 incluye una unidad de control ex310 que controla globalmente cada elemento constituyente de la televisión ex300, y una unidad de circuito de suministro de potencia ex311 que suministra potencia a cada uno de los elementos. Diferente a la unidad de entrada en operación ex312, la unidad de interfaz ex317 puede incluir: un puente ex313 que está conectado a un dispositivo externo, tal como el lector/grabador ex218; una unidad de ranura ex3l4 para permitir la conexión del medio de grabación ex216, tal como una tarjeta SD; un impulsor ex315 para ser conectado a un medio de grabación externo, tal como un disco duro; y un módem ex316 para ser conectado a una red telefónica. Aquí, el medio de grabación ex2l6 puede grabar eléctricamente información utilizando un elemento de memoria de semiconductor no volátil/volátil para el almacenamiento. Los elementos constituyentes de la televisión ex300 están conectados unos a otros a través de un bus sincrónico.
Primero, se describirá la configuración en la cual la televisión ex300 decodifica los datos multiplexados obtenidos desde el exterior a través de la antena ex204 y otros y reproduce los datos decodificados . En la televisión ex300, por una operación del usuario a través de un controlador remoto ex220 y otros, la unidad de multiplexión/desmultiplexión ex303 desmultiplexa los datos multiplexados desmodulados por la unidad de modulación/desmodulación ex302, bajo control de la unidad de control ex310 incluyendo una CPU. Además, la unidad de procesamiento de señal de audio ex304 decodifica los datos de audio desmultiplexados, y la unidad de procesamiento de señal de video ex305 decodifica los datos de video multiplexados, usando el método de decodificación descrito en cada una de las modalidades, en la televisión ex300. La unidad de salida ex309 provee la señal de video y la señal de audio decodificada de salida, respectivamente. Cuando la unidad de salida ex309 provee la señal de video y la señal de audio, las señales pueden ser almacenadas temporalmente en reguladores ex318 y ex319, y otros de tal manera que las señales se reproduzcan en sincronización una con otra. Además, la televisión ex300 pude leer datos multiplexados no a través de una emisión y otros sino a partir de los medios de grabación ex215 y ex216, tales como un disco magnético, un disco óptico, y una tarjeta SD . A continuación, se describirá una configuración en la cual la televisión ex300 codifica una señal de audio y una señal de video, y transmite los datos hacia afuera o escribe los datos sobre un medio de grabación. En la televisión ex300, por operación del usuario a través del controlador remoto ex220 y otros, la unidad de procesamiento de señal de audio ex304 codifica una señal de audio, y la unidad de procesamiento de señal de video ex305 codifica una señal dé video, bajo control de la unidad de control ex310 usando el método de codificación descrito en cada una de las modalidades. La unidad de multiplexión/desmultiplexión ex303 multiplexa la señal de video y la señal de audio codificadas y proporciona la señal de salida resultante. Cuando la unidad de multiplexión/desmultiplexión ex303 multiplexa la señal de video y la señal de audio, las señales pueden almacenarse temporalmente en los reguladores ex320 y 321, y otros de tal manera que las señales se reproducen en sincronización una con otra. Aquí, los reguladores ex318, ex319, ex320 y ex321 pueden ser plurales tal como se ilustra, o por lo menos puede compartirse un regulador en la televisión ex300. Además, los datos pueden ser almacenados en un regulador de tal manera que el sobre- flujo y el sub- flujo del sistema puedan ser evitados entre la unidad de modulación/desmodulación ex302 y la unidad de multiplexión/desmultiplexión ex303, por ejemplo.
Adicionalmente, la televisión ex300 puede incluir una configuración para recibir una entrada AV de un micrófono o una cámara diferente a la configuración para obtener datos de audio y video a partir de una emisión o de un medio de grabación, y puede codificar los datos obtenidos. Aunque la televisión ex300 puede codificar, multiplexar y proveer datos de salida en la descripción, puede ser capaz de solamente recibir, decodificar y proveer datos de salida pero no la codificación, multiplexión y provisión de los datos de salida .
Adicionalmente, cuando el lector/grabador ex218 lee o escribe datos multiplexados desde o en un medio de grabación, uno entre la televisión ex300 y el lector/grabador ex218 puede decodificar o codificar los datos multiplexados, y la televisión ex300 y el lector/grabador ex218 pueden compartir y la decodificación o codificación.
Como ejemplo, la Figura 12 ilustra una configuración de una unidad de reproducción/grabación de información ex400 cuando los datos se leen o escriben a partir de o en un disco óptico. La unidad de reproducción/grabación de información ex400 incluye elementos constituyentes ex401, ex402, ex403, ex404, ex405, ex406 y 407 que serán descritos en lo que sigue. La cabeza óptica ex401 irradia un punto de láser en una superficie de grabación del medio de grabación ex215 que es un disco óptico para escribir información, y detecta la luz reflejada desde la superficie de grabación del medio de grabación ex2l5 para leer la información. La unidad de grabación de modulación ex402 impulsa eléctricamente un láser semiconductor incluido en la cabeza óptica ex401 y modula la luz del láser de acuerdo con los datos grabados. La unidad de desmodulación y reproducción ex403 amplifica una señal de reproducción obtenida detectando eléctricamente la luz reflejada desde la superficie de grabación utilizando un foto-detector incluido en la cabeza óptica ex401, y desmodula la señal de reproducción separando un componente de la señal grabado sobre el medio de grabación ex215 para reproducir la información necesaria. El regulador ex404 mantiene temporalmente la información que se va a grabar sobre el medio de grabación ex215 y la información reproducida desde el medio de grabación ex215. El motor del disco ex405 hace rotar el medio de grabación ex215. La unidad de control servo ex406 hace mover la cabeza óptica ex401 hasta una pista de información predeterminada mientras controla el impulso de rotación del disco del motor ex405 de tal manera que sigue el punto de láser. La unidad de control del sistema ex407 controla globalmente la unidad de reproducción/grabación de información ex400. Los procesos de lectura y escritura pueden ser implementados por la unidad de control del sistema ex407 usando diversa información almacenada en el regulador ex404 y generando y agregando nueva información según sea necesario, y mediante la unidad de grabación de modulación ex402, la unidad de desmodulación de reproducción ex403, y la unidad de control servo ex406 que graban y reproducen información a través de la cabeza óptica ex401 mientras es operada de una forma coordinada. La unidad de control del sistema ex407 incluye, por ejemplo, un microprocesador, y ejecuta el procesamiento haciendo que una computadora ejecute un programa para leer y escribir.
Aunque la cabeza óptica ex401 irradia un punto de láser en la descripción, puede llevar a cabo grabación a alta densidad utilizando luz de campo cercano.
La Figura 13 ilustra el medio de grabación ex215 que es el disco óptico. Sobre la superficie de grabación del medio de grabación ex215, se forman en espiral surcos de guía, y una pista de información ex213 graba, anticipadamente, información de direccionamiento que indica una posición absoluta sobre el disco de acuerdo con el cambio en una forma de los surcos de guía. La información de direccionamiento incluye información para determinar posiciones de bloques de grabación ex231 que son una unidad para grabar datos. La reproducción de la pista de información ex230 y la lectura de la información de direccionamiento en un aparato que graba y reproduce datos puede llevar a la determinación de las posiciones de los bloques de grabación. Adicionalmente , el medio de grabación ex215 incluye un área de grabación de datos ex233, un área de circunferencia interna ex232, y un área de circunferencia externa ex234. El área de grabación interna ex234 es un área para uso en la grabación de datos del usuario. El área de circunferencia interna ex232 y el área de circunferencia externa ex234 están dentro y fuera del área de grabación de datos ex233, respectivamente están para uso específico excepto para grabación de los datos del usuario. La unidad de reproducción/grabación de información 400 lee y escribe audio codificado, datos de video codificados, o datos multiplexados obtenidos por multiplexión de los datos de audio y video codificados, desde y sobre el área de grabación de datos ex233 del medio de grabación ex215.
Aunque un disco óptico que tiene una capa, tal como un DVD o un BD se describe como un ejemplo en la descripción, el disco óptico no está limitado a tal, y puede ser un disco óptico que tiene una estructura de capas múltiples y es capaz de ser grabado en una parte diferente a la superficie. Adicionalmente, el disco óptico puede tener una estructura para grabación/reproducción mul'tidimensional , tal como grabación de información utilizando luces de colores con diferentes longitudes de onda, en la misma porción del disco óptico y para grabar información que tenga diferentes capas desde diferentes ángulos.
Adicionalmente, un vehículo ex210 que tiene una antena ex205 puede recibir datos desde el satélite ex202 y otros, y reproducir video sobre un dispositivo de despliegue tal como un sistema de navegación de automóviles ex211 fijado en el automóvil ex210, en el sistema de emisión digital ex200. Aquí, una configuración del sistema de navegación de vehículos ex211 será una configuración, por ejemplo, que incluye una unidad receptora GPS de la configuración ilustrada en la Figura 11. Lo mismo será válido para la configuración de la computadora exlll, el teléfono celular exll4 y otros.
La Figura 14A ilustra el teléfono celular exll4 que usa el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento descritos en las modalidades. El teléfono celular exll4 incluye.- una antena ex350 para transmitir y recibir ondas de radio a través de la estación base exllO; una unidad de cámara ex365 capaz de capturar imágenes en movimiento y detenidas; y una unidad de pantalla ex358 tal como una pantalla de cristal líquido para desplegar los datos tales como video decodificado capturado por la unidad de cámara ex365 o recibido por la antena ex350. El teléfono celular exll4 incluye adicionalmente : una unidad de cuerpo principal que incluye una unidad de teclado de operación ex366; una unidad de salida de audio ex357 tal como un altavoz para salida de audio; una unidad de entrada de audio ex356 tal como un micrófono para entrada de audio ; una unidad de memoria ex367 para el almacenamiento de imágenes capturadas de video o detenidas, audio grabado, datos codificados o decodificados del video recibido, las imágenes detenidas, correos electrónicos u otros; y una unidad de ranura ex364 que es una unidad de interfaz para un medio de grabación que almacena datos de la misma forma que la unidad de memoria ex367.
A continuación se describirá un ejemplo de la configuración del teléfono celular exll4 con referencia a la Figura 14B. En el teléfono celular exll4 una unidad de control principal ex360 diseñada para controlar globalmente cada unidad del cuerpo principal incluyendo la unidad de pantalla ex358 así como la unidad de teclado de operación ex366, está conectada mutuamente, a través de un bus sincrónico ex370, a una unidad de circuito de suministro de potencia ex361, una unidad de control de entrada de operación ex362, una unidad de procesamiento de señal de video ex355, una unidad de interfaz de cámara ex363, una unidad de control de una pantalla de cristal líquido (LCD, por sus siglas en inglés) , una unidad de modulación/desmodulación ex352, una unidad de multiplexión/desmultiplexión ex353, una unidad de procesamiento de señales de audio ex354, la unidad de ranura ex364 y la unidad de memoria ex367.
Cuando una tecla de finalización de llamada o una tecla de encendido es activada por una operación del usuario, la unidad de circuito de suministro de potencia ex36l suministra a las respectivas unidades potencia desde un paquete de batería de tal manera que se active el teléfono celular exll4.
En el teléfono celular exll4, la unidad de procesamiento de señales de audio ex354 convierte las señales de audio recolectadas por la unidad de entrada de audio ex356 en modo de conversación en voz en señales de audio digitales bajo el control de la unidad de control principal ex360 incluyendo una CPU, ROM y RAM. Luego, la unidad de modulación/desmodulación ex352 ejecuta el procesamiento de espectro esparcido sobre las señales de audio digital, y la unidad de transmisión y recepción ex351 lleva a cabo una conversión digital a análogo y conversión de la frecuencia de los datos, de tal manera que se transmiten los datos resultantes a través de la antena ex350. También, en el teléfono celular exll4, la unidad de transmisión y recepción ex351 amplifica los datos recibidos por la antena ex350 en modo de conversación en voz y ejecuta la conversión de la frecuencia y la conversión de análogo a digital sobre los datos. Entonces, la unidad de modulación/desmodulación ex352 ejecuta el procesamiento inverso de espectro esparcido en los datos, y la unidad de procesamiento de señales de audio ex354 la convierte en señales de audio análogas, de tal manera que las hace salir a través de la unidad de salida de audio ex357.
Adicionalmente, cuando se transmite un correo electrónico en modo de comunicación de datos, los datos de texto del correo electrónico introducidos por la operación de la unidad de teclado de operación ex366 y otros del cuerpo principal, se envían hacia la unidad de control principal ex360 a través de la unidad de control de entrada de operación ex362. La unidad de control principal ex360 hace que la unidad de modulación/desmodulación ex352 ejecute el procesamiento de espectro disperso sobre los datos de texto, y la unidad de transmisión y recepción ex351 ejecuta la conversión digital a análogo y la conversión de frecuencia sobre los datos resultantes para transmitir los datos a la estación base exllO a través de la antena ex350. Cuando se recibe un correo electrónico, el procesamiento que es aproximadamente inverso al procesamiento para la transmisión de un correo electrónico se ejecuta sobre los datos recibidos, y los datos resultantes se suministran en la unidad de pantalla ex358.
Cuando se transmite video, imágenes detenidas, video y audio en modo de comunicación de datos, la unidad de procesamiento de señal de video ex335 comprime y codifica las de señales de video suministradas desde la unidad de cámara ex365 usando el método de codificación de imágenes en movimiento mostrado en cada una de las modalidades (esto es, funciona como el aparato de codificación de imágenes de acuerdo con el aspecto de la presente invención) , y transmite los datos de video codificados a la unidad de multiplexión/desmultiplexión ex353. En contraste, durante el tiempo en que la unidad de cámara ex365 captura video, imágenes detenidas y otros, la unidad de procesamiento de señales de audio ex354 codifica señales de audio recolectadas por la unidad de entrada de audio ex356, y transmite los datos de audio codificados a la unidad de multiplexión/desmultiplexión ex353.
La unidad de multiplexión/desmultiplexión ex353 multiplexa los datos de video codificados suministrados desde la unidad de procesamiento de señales de video ex355 y los datos de audio codificados suministrados desde la unidad de procesamiento de señal de audio ex354, utilizando un método predeterminado. Entonces, ' la unidad de modulación/desmodulación (unidad de circuito de modulación/desmodulación) ex352 ejecuta el procesamiento de espectro disperso sobre los datos multiplexados , y la unidad de transmisión y recepción ex351 lleva a cabo la conversión digital a análogo y la conversión de la frecuencia sobre los datos de tal manera que se transmitan los datos resultantes a través de la antena ex350.
Cuando se reciben datos de un archivo de video que está enlazado a una página web y otros en modo de comunicación de datos o cuando se recibe un correo electrónico con video y/o audio anexo, con el fin de decodificar los datos multiplexados recibidos a través de la antena ex350, la unidad de multiplexión/desmultiplexión ex353 desmultiplexa los datos multiplexados en una corriente de bits de datos de video y una corriente de bits de datos de audio, y suministra la a la unidad de procesamiento de señales de video ex355 los datos de video codificados y a la unidad de procesamiento de señales de audio ex354 los datos de audio codificados, a través de la barra colectora sincrónica ex370. La unidad de procesamiento de señales de video ex355 decodifica la señal de video usando un método que decodificación de imágenes en movimiento correspondiente al método de codificación de imágenes en movimiento mostrado en cada una de las modalidades (esto es, funciona como el aparato de decodificación de imágenes de acuerdo con el aspecto de la presente invención) , y entonces la unidad de pantalla ex358 despliega, por ejemplo, las imágenes de video y detenidas incluidas en el archivo de video enlazado a la página web a través de la unidad de control LCD ex359. Adicíonalmente , la unidad de procesamiento de señales de audio ex354 decodifica la señal de audio, y la unidad de salida de audio ex357 provee el audio.
Adicíonalmente, de forma similar a la televisión ex300, un terminal tal como el teléfono celular exll4 tiene probablemente tres tipos de configuraciones de implementación incluyendo no solamente (i) un terminal de transmisión y recepción que incluye tanto un aparato de codificación como un aparato de decodificación, sino también un (ii) terminal de transmisión que incluye solamente un aparato de codificación y (iii) un terminal de recepción que incluye solamente un aparato de decodificación. Aunque el sistema de emisión digital ex200 recibe y transmite los datos multiplexados obtenidos por la multiplexión de los datos de audio sobre los datos de video en la descripción, los datos multiplexados pueden ser obtenidos como datos multiplexados no solamente los datos de audio sino los datos de caracteres relacionados con video sobre datos de video, y pueden ser no datos multiplexados sino datos de video por sí mismos.
Como tal, el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento en cada una de las modalidades puede ser usado en cualquiera de los dispositivos y sistemas descritos. Así, pueden obtenerse las ventajas descritas en cada una de las modalidades .
Adicionalmente , pueden hacerse diversas modificaciones y revisiones en cualquiera de las modalidades en la presente invención.
Modalidad 4 Los datos de video pueden ser generados por conmutación, según sea necesario, entre (i) el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento mostrado en cada una de las modalidades y (ii) un método de codificación de imágenes en movimiento o un aparato de codificación de imágenes en movimiento en conformidad con un estándar diferente, tal como MPEG- 2, MPEG-4 AVC, y VC-1.
Aquí, cuando se genera una pluralidad de datos de video que están conformes con los diferentes estándares, los métodos de decodificación necesitan ser seleccionados para estar conformes con los diferentes estándares. Sin embargo, puesto que no puede detectarse con cual estándar están conformes cada uno de la pluralidad de los datos de video que se van a decodificar, existe el problema de que no puede seleccionarse un método de decodificación apropiado.
Con el fin de resolver el problema, los datos multiplexados obtenidos por multiplexión de datos de audio y otros sobre datos de video tienen una estructura que incluye información de identificación sobre con cuál estándar se conforman los datos de video. De aquí en adelante se describirá la estructura específica de los datos multiplexados qué incluyen los datos de video generados en el método de codificación de imágenes y mediante el aparato de codificación de imágenes en movimiento, mostrado en cada una de las modalidades. Los datos multiplexados son una corriente digital en el formato de corriente de transporte MPEG-2 La Figura 15 ilustra una estructura de los datos multiplexados. Como se ilustra en la Figura 15, los datos multiplexados pueden obtenerse multiplexando por lo menos un de una corriente de video, una corriente de audio, una corriente de gráficas de presentación (PG, por sus siglas en inglés), y una corriente de gráficos interactivos. La corriente de video representa video primario y video secundario de una película, la corriente de audio (IG) representa una parte de audio primaria y una parte de audio secundaria para ser mezclada con la parte de audio primaria, y la corriente de gráficas de presentación representa subtítulos de la película. Aquí, el video primario es un video normal que se va a presentar sobre una pantalla, y el video secundario es un video que se va a presentar sobre una ventana más pequeña en el video primario. Adicionalmente, la corriente de gráficas interactivas representa una pantalla interactiva que se genera disponiendo los componentes GUI sobre una pantalla. La corriente de video se codifica en el método de codificación de imágenes en movimiento o mediante el aparato de codificación de imágenes en movimiento mostrado en cada una de las modalidades, o en un método de codificación de imágenes en movimiento o mediante un aparato de codificación de imágenes en movimiento en- conformidad con un estándar' convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1. La corriente de audio se codifica de acuerdo con un estándar tal como Dolby-AC-3, Dolby Digital Plus, MLP, DTS , DTS-HD, y PCM lineal.
Cada corriente incluida en los datos multiplexados se identifica por PID. Por ejemplo, 0x1011 se localiza en la corriente de video que se va a usar para video de una película, 0x1100 a OxlllF se localizan en las corrientes de audio, 0x1200 a 0xl21F se localizan en las corrientes de gráficas de presentación, 0x1400 a 0xl41F se localizan en las corrientes de gráficas interactivas, OxlBOO a OxlBlF se localizan en las corrientes de video que se van a utilizar para el video secundario de la película, y OxlAOO a OxlAlF se localizan en las corrientes de video que se van a usar para el audio secundario que se va a mezclar con el audio primario .
La Figura 16 ilustra esquemáticamente como se multiplexan los datos. Primero, una corriente de video ex235 compuesta de marcos de video y una corriente de audio ex238 compuesta de marcos de audio se transforman en una corriente de paquetes PES ex236 y una corriente de paquetes PES ex239( y adicionalmente en paquetes TS ex237 y paquetes TS ex240, respectivamente. De la misma forma, los datos de una corriente de gráficas de presentación ex241 y datos de una corriente de gráficas interactivas ex244 se transforman en una corriente de paquetes PES ex242 y una corriente de paquetes PES ex245, y adicionalmente en paquetes TS ex243 y paquetes TS ex246, respectivamente. Estos paquetes TS se multiplexan en una corriente para obtener datos multiplexados ex247.
La Figura 17 ilustra cómo una corriente de video es almacenada en una corriente de paquetes PES en más detalle. La primera barra en la Figura 17 muestra una corriente de marcos de video en una corriente de video. La segunda barra muestra la corriente de paquetes PES. Tal como lo indican las flechas denotadas como yyl, yy2 , yy3 , y yy4 en la Figura 17, la corriente de video se divide en imágenes como imágenes I, imágenes B, e imágenes P, cada una de las cuales es una unidad de presentación de video, y las imágenes se almacenan en una carga de pago de cada uno de los paquetes PES . Cada uno de los paquetes PES tiene un encabezamiento PES y el encabezamiento PES almacena un tiempo de marcación de presentación (PTS, por sus siglas en inglés) que implica un tiempo de despliegue de la imagen, y un tiempo de marcación de la decodificación (DTS, por sus siglas en inglés) que indica un tiempo de decodificación de la imagen.
La Figura 18 ilustra un formato de paquetes TS que se escribirán finalmente sobre los datos multiplexados . Cada uno de los paquetes TS es un paquete de longitud fija de 188 bytes que incluye un encabezamiento TS de 4 bytes, tal como un PID para identificar una corriente y una carga de pago TS de 184 bytes para almacenamiento de datos . Los paquetes PES se dividen, y almacenan en las cargas de pago TS, respectivamente. Cuando se utiliza un BD ROM, cada uno de los paquetes TS recibe un TP_Extra_Header de 4 bytes, dando como resultado paquetes fuente de 192 bytes. Los paquetes fuente se escriben sobre los datos multiplexados. El TP_Extra_Header almacena información tal como un Arrival_Time_Stamp (ATS). El ATS muestra un tiempo de inicio de transferencia en el cual cada uno de los paquetes TS va a ser transferido a un filtro PID. Los paquetes fuente se disponen en los datos multiplexados tal como se muestra en la parte inferior de la Figura 18. Los números se incrementan desde la cabeza de los datos multiplexados denominándose números de paquetes fuente (SPN, por sus siglas en inglés) .
Cada uno de los paquetes TS en los datos multiplexados incluye no solamente corrientes de audio, video, subtítulos y otros, sino también una Tabla de asociación de programas (PAT, por sus siglas en inglés) , y una referencia de reloj de programas (PCR, por sus siglas en inglés) . El PAT muestra lo que un PID en un PMT usado en los datos multiplexados indica, y un PID del PAT mismo se registra como cero. El PMT almacena PID de las corrientes de video, audio, subtítulos y otros incluidos en los datos multiplexados, y atribuye información de las corrientes correspondientes a los PID. El PMT también tiene diversos descriptores relativos a los datos multiplexados . Los descriptores tienen información tal como información de control de copias que muestran si se permite o no la copia de los datos multiplexados . El PCR almacena información de tiempo STC correspondiente a un ATS que muestra cuándo el paquete PCR es transferido a un decodificador, con el fin de alcanzar la sincronización entre un reloj de tiempo de llegada (ATC, por sus siglas en inglés) que es un eje de tiempo de ATS, y un reloj de tiempo de sistema (STC, por sus siglas en inglés) que es un eje de tiempo de PTS y DTS.
La Figura 19 ilustra la estructura de datos del PMT en detalle. Un encabezamiento de PMT se dispone en la parte superior del PMT. El encabezamiento del PMT describe la longitud de los datos incluidos en el PMT y otros. Se dispone una pluralidad de descriptores relacionados con los datos multiplexados después del encabezamiento del PMT. Información tal como la información de control de copias está escrita en los descriptores. Después de los descriptores, se dispone una pluralidad de piezas de información de corriente relativa a las corrientes incluidas en los datos multiplexados . Cada pieza de información de corriente incluye descriptores de corriente cada uno de los cuales describe información, tal como el tipo de corriente para identificar un códec de compresión de una corriente, una corriente PID, e información de atributos de corriente (tal como una rata de marco o una relación de aspecto) . Los descriptores de corriente son iguales en número al número de corrientes en los datos multiplexados .
Cuando los datos multiplexados se graban sobre un medio de grabación y otros, se graban junto con los archivos de información de datos multiplexados .
Cada uno de los archivos de información de datos multiplexados es información de manejo de los datos multiplexados como se muestra en la Figura 20. Los archivos de información de datos multiplexados están en correspondencia uno a uno con los datos multiplexados, y cada uno de los archivos incluye información de datos multiplexados, información de atributos de corriente y un mapa de entrada.
Como se ilustra en la Figura 20, la información de datos multiplexados incluye una rata de sistema, un tiempo de inicio de la reproducción, y un tiempo de finalización de la reproducción. La rata de sistema indica la rata de transferencia máxima a la cual un decodificador objetivo del sistema que se describirá más adelante transfiere los datos multiplexados a un filtro PID. Los intervalos de los ATS incluidos en los datos multiplexados se fijan para que no sean más altos que una rata del sistema. El tiempo de inicio de la reproducción indica un PTS en un marco de video en el encabezamiento de los datos multiplexados . Un intervalo de un marco se agrega a un PTS en un marco de video al final de los datos multiplexados, y el PTS se fija al tiempo de finalización de la reproducción.
Como se muestra en la Figura 21, una pieza de información de atributos se registra en la información de atributos de corriente, para cada PID de cada corriente incluida en los datos multiplexados . Cada pieza de información de atributos tiene información diferente dependiendo de si la corriente correspondiente es un una corriente de video, una corriente de audio, una corriente de gráficas de presentación, o una corriente de gráficas interactivas. Cada pieza de información de atributos de corriente de video porta información que incluye la clase de códec de compresión que está siendo utilizado para comprimir la corriente de video, y la resolución, relación de aspecto y rata de marco de las piezas de datos de imágenes que están incluidas en la corriente de video. Cada pieza de información de atributos de corriente de audio porta información que incluye la clase de códec de compresión que se usa para comprimir la corriente de audio, cuántos canales están incluidos en la corriente de audio, cual lenguaje soporta la corriente de audio, y qué tan alta es la frecuencia de muestreo. La información de atributos de corriente de video y la información de atributos de corriente de audio se usan para la inicialización de un decodificador antes de que el reproductor reproduzca la información.
En la presente modalidad, los datos multiplexados que se van a usar son de un tipo de corriente incluida en el PMT. Adicionalmente , cuando los datos multiplexados se graban sobre un medio de grabación, se usa la información de atributos de corriente de video incluida en la información de datos multiplexados. Más específicamente, el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades incluye una etapa o una unidad para localizar información única que indica los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las modalidades, al tipo de corriente incluido en el PMT o la información de atributos de corriente de video. Con la configuración, los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades pueden distinguirse de los datos de video que están conformes con otro estándar.
Adicionalmente, la Figura 22 ilustra las etapas del método de decodificación de imágenes en movimiento de acuerdo con la presente modalidad. En la etapa exSlOO, el tipo de corriente incluido en el PMT o la información de atributos de corriente de video incluida en la información de datos multiplexados se obtiene a partir de los datos multiplexados. A continuación, en la etapa exSlOl, se determina si el tipo de corriente o la información de atributos de corriente de video indican o no que los datos multiplexados se generan por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las modalidades. Cuando se determina que el tipo de corriente o la información de atributos de corriente de video indican que los datos multiplexados se generan por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las modalidades, en la etapa exS102, la decodificación es ejecutada por el método de decodificación de imágenes en movimiento en cada una de las modalidades. Adicionalmente, cuando el tipo de corriente o la información de atributos de corriente de video indican concordancia con los estándares convencionales, tales como MPEG-2, MPEG-4 AVC, y VC-1, en la etapa exS103, la decodificación es ejecutada por un método de decodificación de imágenes en movimiento en conformidad con los estándares convencionales.
Como tal, la localización de un nuevo valor único en el tipo de corriente o la información de atributos de corriente de video permite la determinación de si el método de decodificación de imágenes en movimiento o el aparato de decodificación de imágenes en movimiento que se describe en cada una de las modalidades pueden ejecutar o no la decodificación. Incluso cuando se introducen los datos multiplexados que están conformes con un estándar diferente, puede seleccionarse un método o aparato de decodificación apropiada. Así, el método o aparato de codificación de imágenes en movimiento o el método o aparato de decodificación de imágenes en movimiento en la presente modalidad pueden utilizarse en los dispositivos y sistemas descritos anteriormente.
Modalidad 5 Cada uno de los métodos de codificación de imágenes en movimiento, el aparato de codificación de imágenes en movimiento, el método de decodificación de imágenes en movimiento, y el aparato de decodificación de imágenes en movimiento en cada una de las modalidades se logran típicamente en la forma de un circuito integrado o un circuito integrado a gran escala (LSI, por sus siglas en inglés) . Como ejemplo del LSI, la Figura 23 ilustra una configuración del LSI ex500 que está hecha en un chip. El LSI ex500 incluye elementos ex501, ex502, ex503, ex504, ex505, ex506, ex507( ex508 y ex509 se describirán más adelante, y los elementos están conectados uno a otro a través de un bus ex510. La unidad de circuito de suministro de potencia ex505 se activa suministrando a cada uno de los elementos de potencia cuando la unidad de circuito de suministro de potencia ex505 es encendida.
Por ejemplo, cuando se ejecuta la codificación, el LSI ex500 recibe una señal AV desde un micrófono exll7, una cámara exll3, y otros a través de un AV 10 ex509 bajo el control de una unidad de control ex501 que incluye una CPU ex502, un controlador de memoria ex503, un controlador de corriente ex504, y una unidad de control de frecuencia de impulso ex512. La señal AV recibida se almacena temporalmente en la memoria externa ex511, tal como una SDRAM. Bajo el control de la unidad de control ex501, los datos almacenados se segmentan en porciones de datos de acuerdo con la cantidad de procesamiento y la velocidad que se va a trasmitir a una unidad de procesamiento de señales ex507. Entonces, la unidad de procesamiento de señales ex507 codifica una señal de audio y/o una señal de video. Aquí, la codificación de la señal de video es la codificación descrita en cada una de las modalidades. Adicionalmente, la unidad de procesamiento de señales ex507 multiplexa a veces los datos de audio codificados y los datos de video codificados, y una corriente 10 ex506 provee la salida de datos multiplexados . Los datos multiplexados provistos se transmiten a una estación base exl07, o se escriben sobre el medio de grabación ex215. Cuando se multiplexan conjuntos de datos, los datos deberían almacenarse temporalmente en el regulador ex508 de tal manera que los conjuntos de datos estén sincronizados uno con otro.
Aunque la memoria ex511 es un elemento por fuera del LSI ex500, puede incluirse en el LSI ex500. El regulador ex508 no se limita a un regulador, sino que puede estar compuesto de reguladores. Adicionalmente , el LSI ex500 puede hacerse en un c ip o en una pluralidad de chips .
Adicionalmente, aunque la unidad de control ex501 incluye el CPU ex502, el controlador de memoria ex503, el controlador de corriente ex504, la unidad de control de frecuencia de impulso ex5l2, la configuración de la unidad de control ex501 no está limitada a tal. Por ejemplo, la unidad de procesamiento de señales ex507 puede incluir adicionalmente una CPU. La inclusión de otra CPU en la unidad de procesamiento de señales ex507 puede mejorar la velocidad de procesamiento. Adicionalmente, como otro ejemplo, el CPU ex502 puede servir como o ser parte de la unidad de procesamiento de señales ex507 y, por ejemplo, puede incluir una unidad de procesamiento de señales de audio. En tal caso, la unidad de control ex501 incluye la unidad de procesamiento de señales ex507 o el CPU ex502 incluyendo una parte de la unidad de procesamiento de señales ex507.
El nombre usado aquí es LSI, pero también puede ser llamado IC, sistema LSI , súper LSI, o ultra LSI dependiendo del grado de integración.
Además , las formas de alcanzar la integración no están limitadas al LSI, y un circuito especial o un procesador de propósitos generales y así sucesivamente pueden también alcanzar la integración. Puede usarse una disposición de compuerta programable de campo (FPGA, por sus siglas en inglés) que pueda ser programada después de la manufactura de los LSI o un procesador reconfigurable que permita la reconfiguración de la conexión o la configuración de un LSI para el mismo propósito.
En el futuro, con el avance de la tecnología de los semiconductores, una nueva tecnología puede reemplazar el LSI. Los bloques funcionales pueden integrarse usando tal tecnología. La posibilidad es que la presente invención se aplique a la biotecnología.
Modalidad 6 Cuando se decodifican los datos de video generados en el método de codificación de imágenes en movimiento o mediante el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades, en comparación a cuando se decodifican los datos de video que están conformes a un estándar convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1, la cantidad de procesamiento probablemente se incrementa. Así, el LSI ex500 necesita ser fijado a una frecuencia de impulso más alta que la del CPU ex502 que se use cuando se decodifiquen los datos de video en conformidad con el estándar convencional. Sin embargo, cuando la frecuencia de impulsos se fija más alta, existe el problema de que se incrementa el consumo de energía.
Con el fin de resolver el problema, el aparato de decodificación de imágenes en movimiento, tal como la televisión ex300 y el LSI ex500 se configuran para determinar con cual estándar está conforme el video, y conmutar entre las frecuencias de impulso de acuerdo con el estándar determinado. La Figura 24 ilustra una configuración ex800 en la presente modalidad. Una unidad de conmutación de frecuencia de impulso ex803 fija una frecuencia de impulso a una frecuencia de impulso más alta cuando se generan datos de video por parte de un método de codificación de imágenes en movimiento o del aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades. Entonces, la unidad de conmutación de frecuencia de impulso ex803 instruye a una unidad de procesamiento de decodificación ex801 que ejecuta el método de decodificación de imágenes en movimiento descrito en cada una de las modalidades para decodificar los datos de video. Cuando los datos de video están conformes con el estándar convencional, la unidad de conmutación de frecuencia de impulso ex803 fija una frecuencia de impulso a una frecuencia de impulso más baja que la de los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades. Entonces, la unidad de conmutación de frecuencia de impulso ex803 instruye a la unidad de procesamiento de decodificación ex802 que está conforme con el estándar convencional para decodificar los datos de video.
Más específicamente, la unidad de conmutación de frecuencia de impulso ex803 incluye el CPU ex502 y la unidad de control de frecuencia de impulso ex502 en la Figura 23. Aquí cada una de las unidades de procesamiento de decodificación 801 que ejecutan el método de decodificación de imágenes en movimiento descrito en cada una de las modalidades y la unidad de procesamiento de decodificación ex802 que está conforme con el estándar convencional corresponde a la unidad de procesamiento de señales ex507 en la Figura 23. La CPU ex502 determina con cual estándar están conformes los datos de video. Entonces, la unidad de control de frecuencia de impulso ex512 determina una frecuencia de impulso basada en una señal del CPU ex502. Adicionalmente, la unidad de procesamiento de señales ex507 decodifica los datos de video con base en la señal del CPU ex502. Por ejemplo, la información de identificación descrita en la modalidad 4 se usa probablemente para identificar los datos de video. La información de identificación no está limitada a la descrita en la modalidad B, pero puede ser cualquier información en tanto la información indique con cuál estándar se conforman los datos de video. Por ejemplo, cuando se puede determinar con cuál estándar están conformes los datos de video con base en una señal externa para determinar que los datos de video se utilizan para una televisión, un disco, etc., la determinación puede hacerse con base en tal señal externa. Adicionalmente, el CPU ex502 selecciona una frecuencia de impulso basada, por ejemplo, en una Tabla de búsqueda en la cual los estándares de los datos de video están asociados con las frecuencias de impulso como se muestra en la Figura 26. La frecuencia de impulso puede ser seleccionada almacenando la Tabla de búsqueda en el regulador ex508 y en una memoria interna de un LSI, y con referencia la Tabla de búsqueda por el CPU ex502.
La Figura 25 ilustra etapas para ejecutar un método en la presente modalidad. Primero, en la etapa exS200, la unidad de procesamiento de señales ex507 obtiene información de identificación a partir de los datos multiplexados . A continuación, en la etapa exS201, el CPU ex502 determina si los datos de video se generan o no por el método de codificación y el aparato de codificación descritos en cada una de las modalidades, con base en la información de identificación. Cuando los datos de video se generan por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades, en la etapa exS202, el CPU ex502 transmite una señal para fijar la frecuencia de impulso a una frecuencia de impulso más alta a la unidad de control de frecuencia de impulso ex512. Entonces, la unidad de control dé frecuencia de impulso ex512 fija la frecuencia de impulso a la frecuencia de impulso más alta. Por otro lado, cuando la información de identificación indica que los datos de video están conformes con el estándar convencional, tales como MPEG-2, MPEG-4 AVC, y VC-1, en la etapa exS203, el CPU ex502 transmite una señal para fijar la frecuencia de impulso a una frecuencia de impulso más baja a la unidad de control de frecuencia de impulso ex512. Entonces, la unidad de control de frecuencia de impulso ex512 fija la frecuencia de impulso en la frecuencia de impulso más baja que la del caso donde los datos de video se generan por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades .
Adicionalmente, junto con la conmutación de las frecuencias de impulso, el efecto de conservación de energía puede mejorarse cambiando el voltaje que se aplica al LSI ex500 o un aparato que incluya el LSI ex500. Por ejemplo, cuando la frecuencia de impulsos se fija más baja, el voltaje que se va a aplicar al LSI ex500 o al aparato que incluye el LSI ex500 sería probablemente en un voltaje inferior al caso donde la frecuencia de impulso se fija más alta.
Adicionalmente, cuando la cantidad de procesamiento para decodificar es más grande, la frecuencia de impulso puede fijarse más alta y cuando la cantidad de procesamientos para decodificar es más pequeña, la frecuencia de impulso puede fijarse más baja como el método para fijar la frecuencia de impulso. Así, el método de fijación no está limitado a los descritos anteriormente. Por ejemplo, cuando la cantidad de procesamiento para decodificar datos de video en conformidad con MPEG-4 AVC es más grande que la cantidad de procesamiento para decodificar datos de video generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades, la frecuencia de impulso se fija probablemente en orden inverso a la fijación descrita anteriormente .
Adicionalmente, el método para fijar la frecuencia de impulso no se limita al método para fijar la frecuencia de impulso más baja. Por ejemplo, cuando la información de identificación indica que los datos de video son generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades, el voltaje que se aplica al LSI ex500 o al aparato que incluye el LSI ex500 probablemente se fije más alto. Cuando la información de identificación indica que los datos de video están conformes con el estándar convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1, el voltaje que se aplica al LSI ex500 o al aparato que incluye el LSI ex500 probablemente se fija más bajo. Como otro ejemplo, cuando la información de identificación indica que los datos de video se generan por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las modalidades, el impulso del CPU ex502 probablemente no tiene que ser suspendido. Cuando la información de identificación indica que los datos de video están conformes con el estándar convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1, el impulso del CPU ex502 probablemente se suspenda en un tiempo dado porque el CPU ex502 tiene capacidad de procesamiento extra. Incluso cuando la información de identificación indica que los datos de video se generan por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento en cada una de las modalidades, en el caso donde el CPU ex502 tiene capacidad de procesamiento extra, el impulso del CPU ex502 se suspende probablemente en un tiempo dado. En tal caso, el tiempo de suspensión se fija probablemente más corto que en el caso donde la información de identificación indica que los datos de video están conformes con el estándar convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1.
De acuerdo con lo anterior, el efecto de conservación de energía puede mejorarse conmutando entre las frecuencias de impulso de acuerdo con el estándar al cual están conformes los datos de video. Adicionalmente , cuando el LSI ex500 o el aparato que incluye el LSI ex500 se impulsa utilizando una materia, la vida de la batería puede extenderse con el efecto de conservación de energía.
Modalidad 7 Hay casos donde una pluralidad de datos de video que están conformes con los diferentes estándares, se proveen a los dispositivos y sistemas, tales como una televisión o un teléfono celular. Con el fin de permitir la decodificación de la pluralidad de los datos de video que están conformes con los diferentes estándares, la unidad de procesamiento de señales ex507 del LSI ex500 necesita estar conforme con los diferentes estándares. Sin embargo, los problemas de incremento en la escala del circuito del LSI ex500 y el incremento en el costo surgen con el uso individual de las unidades de procesamiento de señales ex507 que están conformes con los estándares respectivos .
Con el fin de resolver el problema, lo que se consigue es una configuración en la cual se comparte parcialmente la unidad de procesamiento de decodificación para implementar el método de decodificación de imágenes en movimiento descrito en cada una de las modalidades y la unidad de procesamiento de decodificación que está conforme con el estándar convencional, tal como MPEG-2, MPEG-4 AVC, y VC-1.
Ex900 en la Figura 27A muestra un ejemplo de la configuración. Por ejemplo, el método de decodificación de imágenes en movimiento descrito en cada una de las modalidades y el método de decodificación de imágenes en movimiento que está conforme con MPEG-4 AVC tienen, parcialmente en común, los detalles de procesamiento, tales como la codificación de entropía, la cuantización inversa, la filtración para desbloqueo y la previsión compensada del movimiento. Los detalles de procesamiento que se van a compartir incluyen probablemente el uso de una unidad de decodificación ex902 que está conforme con MP EG-4 AVC. En contraste, una unidad de procesamiento de decodificación dedicada ex901 se usa probablemente para otro procesamiento único a un aspecto de la presente invención. Puesto que el aspecto de la presente invención se caracteriza por la cuantización inversa en particular, por ejemplo, la unidad de procesamiento de decodificación dedicada ex901 se usa para cuantización inversa. De otra manera, la unidad de procesamiento de decodificación se comparte probablemente para uno de entre la decodificación de entropía, filtro de desbloqueo, y compensación de movimiento, o para todo el procesamiento. La unidad de procesamiento de decodificación para implementar el método de decodificación de imágenes en movimiento descrito en cada una de las modalidades puede ser compartida para el procesamiento que se va a compartir, y pueden usarse una unidad de procesamiento de decodificación dedicada para un procesamiento único al del MPEG-4 AVC.
Adicionalmente, exlOOO en la Figura 27B muestra otro ejemplo en que se comparte parcialmente el procesamiento. Este ejemplo utiliza una configuración que incluye una unidad de procesamiento de decodificación dedicada exlOOl que soporta el procesamiento único para un aspecto de la presente invención, una unidad de procesamiento de decodificación dedicada exl002 que soporta el procesamiento único para otro estándar convencional, y una unidad de procesamiento de decodificación exl003 que soporta el procesamiento que va a ser compartido en el método de decodificación de imágenes en movimiento de acuerdo con el aspecto de la presente invención y el método de decodificación de imágenes en movimiento convencional. Aquí, las unidades de procesamiento de decodificación dedicada exlOOl y exl002 no son necesariamente especializadas para el procesamiento de acuerdo con el aspecto de la presente invención y el procesamiento del estándar convencional, respectivamente, y pueden ser capaces de implementar un procesamiento general. Adicionalmente, la configuración de la presente modalidad puede ser implementada por el LSI ex500.
Como tal, la reducción de la escala del circuito de un LSI y la reducción del coste son posibles compartiendo la unidad de procesamiento de decodificación para el procesamiento que se va a compartir entre el método de decodificación de imágenes en movimiento de acuerdo con el aspecto de la presente invención y el método de decodificación de imágenes en movimiento en conformidad con el estándar convencional.
Aplicabilidad Industrial El método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento de acuerdo con una o más modalidades ejemplares divulgadas aquí son aplicables a diversas aplicaciones tales como aparatos para presentación de información y aparatos para captura de imágenes con alta resolución de soporte. Ejemplos de tales aparatos incluyen un equipo de televisión, una grabadora de video digital, un sistema de navegación para automóviles, un teléfono celular, una cámara digital y una cámara de video digital .
Lista de Signos de Referencia 100 Aparato de decodificación 101 Unidad de decodificación CBF de Luminancia 102 Unidad de control 103 Conmutador 104 Unidad de decodificación de coeficiente residual 105 Unidad de reconstrucción de señal residual 106 Agregador 200 Aparato de codificación de imagen 205 Sustractor 210 Unidad de Transformación y Cuantización 220 Unidad de Codificación de Entropía 230, 420 Unidad de Cuantización inversa y transformación inversa 235, 425 Agregador 240, 430 Filtro de desbloqueo 250, 440 Memoria 260, 450 Unidad de intra-predicción 270 Unidad de estimación de movimiento 280, 460 Unidad de compensación de movimiento 290, 470 Conmutador intra/Ínter 301, 302, 303, 304, 305, 306 Bloque 311, 312, 313, 314, 315 Indicador CBF de Luminancia 400 Aparato de codificación de imágenes en movimiento 410 Unidad de decodificación de entropía Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (11)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones :
1. Un método de codificación de imágenes en movimiento para codificar una señal de imágenes en movimiento para cada primera unidad de procesamiento, caracterizado porque comprende : transformar, para cada una o más segundas unidades de procesamiento incluidas en la primera unidad de procesamiento, la señal de imágenes en movimiento en un dominio espacial en un coeficiente de dominio de frecuencia y cuantificar el coeficiente de dominio de frecuencia; y ejecutar la codificación aritmética sobre un indicador de luminancia CBF que indica si el coeficiente cuantizado está incluido no en cada una de las segundas unidades de procesamiento para las cuales se ejecutan la transformación y la cuantización, en donde, en la ejecución de la codificación aritmética, se determina una Tabla de probabilidades para uso de la codificación aritmética de acuerdo con si el tamaño de la primera unidad de procesamiento es o no idéntico a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
2. El método de codificación de imágenes en movimiento de conformidad con la reivindicación 1, caracterizado porque, en la ejecución de la codificación aritmética, se determina adicionalmente una Tabla de probabilidades para uso en la codificación aritmética de acuerdo con un tipo de una división a la cual pertenece la unidad de procesamiento.
3. El método de codificación de imágenes en movimiento de conformidad con la reivindicación 1, caracterizado porque la primera unidad de procesamiento es una unidad de codificación, y la segunda unidad de procesamiento es una unidad de transformación.
4. El método de codificación de imágenes en movimiento de conformidad con las reivindicaciones 1 a 3, caracterizado porque se ejecuta conmutación entre la codificación que está conforme con un primer estándar y la codificación que está conforme con un segundo estándar, y la transformación y la cuantización y la codificación aritmética se ejecutan a medida de la conformación de la codificación con el primer estándar, y el método de codificación de imágenes en movimiento comprende adicionalmente codificar un identificador que indica un estándar de codificación.
5. Un método de decodificación de imágenes en movimiento para decodificar una señal de imágenes en movimiento codificada para cada primera unidad de procesamiento, caracterizado porque comprende: ejecutar una decodificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en una o más segundas unidades de procesamiento incluidas en la primera unidad de procesamiento; y reconstruir la señal de imágenes en movimiento utilizando el coeficiente cuantizado de la segunda unidad de procesamiento cuando el indicador de luminancia CBF indica que el coeficiente cuantizado está incluido en cada una de las segundas unidades de procesamiento, siendo decodificado el indicador de luminancia CBF en la decodificación aritmética, en donde, en la ejecución de la decodificación aritmética, se determina una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo a si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y a si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
6. El método de decodificación de imágenes en movimiento de conformidad con la reivindicación 5, caracterizado porque, en la ejecución de la decodificación aritmética, se determina adicionalmente una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo con un tipo de una división a la cual pertenece la primera unidad de procesamiento.
7. El método de decodificación de imágenes en movimiento de conformidad con las reivindicaciones 5 a 6, caracterizado porque la primera unidad de procesamiento es una unidad de codificación, y la segunda unidad de procesamiento es una unidad de transformación.
8. El método de decodificación de imágenes en movimiento de conformidad con las reivindicaciones 5 a 7, caracterizado porque la conmutación se ejecuta entre la decodificación que está conforme con un primer estándar y la decodificación que está conforme con un segundo estándar de acuerdo con un identificador el cual está incluido en una señal codificada e indica el primer estándar o el segundo estándar, y la decodificación aritmética y la reconstrucción se ejecutan a medida que la decodificación está conforme con el primer estándar cuando el indicador indica el primer estándar.
9. Un aparato de codificación de imágenes en movimiento para codificar una señal de imágenes en movimiento para cada primera unidad de procesamiento, caracterizado porque comprende : una unidad de transformación y cuantización configurada para transformar, para cada una de las una o más segundas unidades de procesamiento en la primera unidad de procesamiento, la señal de imágenes en movimiento en un dominio espacial en un coeficiente de dominio de frecuencia y para cuantificar el coeficiente de dominio de frecuencia; y una unidad de codificación aritmética configurada para ejecutar codificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en la segunda unidad de procesamiento procesada por la unidad de transformación y cuantización, en donde la unidad de codificación aritmética está configurada para determinar una Tabla de probabilidades para uso en la codificación aritmética de acuerdo con si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
10. Un aparato de decodificación de imágenes en movimiento para decodificar una señal de imágenes en movimiento codificadas para cada primera unidad de procesamiento, caracterizado porque comprende: una unidad de decodificación aritmética configurada para ejecutar decodificación aritmética sobre un indicador de luminancia CBF que indica si un coeficiente cuantizado está incluido o no en una o más segundas unidades de procesamiento incluidas en la primera unidad de procesamiento; y una unidad de reconstrucción configurada para reconstruir una señal de imágenes en movimiento usando el coeficiente cuantizado de la segunda unidad de procesamiento cuando el indicador de luminancia CBF indica que el coeficiente cuantizado está incluido en la segunda unidad de procesamiento, siendo procesado el indicador de luminancia CBF por la unidad de decodificación aritmética, en donde la unidad de decodificación aritmética está configurada para determinar una Tabla de probabilidades para uso en la decodificación aritmética de acuerdo a si un tamaño de la primera unidad de procesamiento es idéntico o no a un tamaño de la segunda unidad de procesamiento y a si la segunda unidad de procesamiento tiene o no un tamaño máximo predeterminado .
11. Un aparato de codificación y decodificación de imágenes en movimiento caracterizado porque comprende: el aparato de codificación de imágenes en movimiento de conformidad con la reivindicación 9; y el aparato de decodificación de imágenes en movimiento de conformidad con la reivindicación 10.
MX2013001709A 2011-07-29 2012-07-13 Metodo de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de decodificacion de imágenes en movimiento, y aparato de codificacion y decodificacion de imagenes en movimiento. MX2013001709A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161513141P 2011-07-29 2011-07-29
PCT/JP2012/004538 WO2013018296A1 (ja) 2011-07-29 2012-07-13 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、及び動画像符号化復号装置

Publications (1)

Publication Number Publication Date
MX2013001709A true MX2013001709A (es) 2013-03-06

Family

ID=47597216

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013001709A MX2013001709A (es) 2011-07-29 2012-07-13 Metodo de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de decodificacion de imágenes en movimiento, y aparato de codificacion y decodificacion de imagenes en movimiento.

Country Status (20)

Country Link
US (10) US8798147B2 (es)
EP (1) EP2739053B1 (es)
JP (3) JP5937020B2 (es)
CN (2) CN103202020B (es)
AU (2) AU2013200650B2 (es)
BR (1) BR112013003399B1 (es)
CA (1) CA2807959C (es)
ES (1) ES2754784T3 (es)
HU (1) HUE047353T2 (es)
LT (1) LT2739053T (es)
MX (1) MX2013001709A (es)
MY (1) MY164655A (es)
PL (1) PL2739053T3 (es)
PT (1) PT2739053T (es)
RU (1) RU2595573C2 (es)
SG (1) SG188213A1 (es)
SI (1) SI2739053T1 (es)
TW (1) TWI581610B (es)
WO (1) WO2013018296A1 (es)
ZA (1) ZA201301158B (es)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
US9338465B2 (en) 2011-06-30 2016-05-10 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
US11647197B2 (en) 2011-06-30 2023-05-09 Velos Media, Llc Context initialization based on slice header flag and slice type
CN103202020B (zh) * 2011-07-29 2017-02-08 太阳专利托管公司 动态图像解码方法以及动态图像解码装置
KR20130112374A (ko) * 2012-04-04 2013-10-14 한국전자통신연구원 고속 인트라 예측을 위한 영상 부호화 방법 및 장치
GB2523347B (en) * 2014-02-20 2016-01-13 Gurulogic Microsystems Oy Encoder, decoder and method
KR20230091200A (ko) * 2015-12-14 2023-06-22 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 삼차원 데이터 부호화 방법, 삼차원 데이터 복호 방법, 삼차원 데이터 부호화 장치 및 삼차원 데이터 복호 장치
CN115883826A (zh) * 2016-10-10 2023-03-31 三星电子株式会社 用于对图像进行编码/解码的方法和设备
CN110035287B (zh) 2018-01-12 2023-05-09 富士通株式会社 对统一转换单元模式进行分组标识的方法、装置和电子设备
EP3818705A1 (en) * 2018-07-02 2021-05-12 InterDigital VC Holdings, Inc. Context-based binary arithmetic encoding and decoding
BR112020026183A2 (pt) * 2019-03-01 2021-09-08 Huawei Technologies Co., Ltd. Método de codificação de vídeo, codificador, decodificador e produto de programa de computador
CN111372082B (zh) * 2019-03-27 2022-06-03 北京达佳互联信息技术有限公司 一种视频编码中编码块标志cbf的编解码方法及设备

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5937020B2 (ja) 1979-10-24 1984-09-07 日立化成工業株式会社 耐衝撃性の優れた樹脂組成物
JPS5937020U (ja) 1982-09-01 1984-03-08 松下電器産業株式会社 調理器の表示装置
TW232682B (es) 1992-08-18 1994-10-21 Ciba Geigy
CN100420308C (zh) * 2002-04-26 2008-09-17 株式会社Ntt都科摩 图象编码装置和图象译码装置
EP2479896A1 (en) * 2002-04-26 2012-07-25 NTT DoCoMo, Inc. Signal encoding method, signal decoding method, signal encoding device, signal decoding device, signal encoding program, and signal decoding program
MXPA04002265A (es) 2002-07-11 2004-06-29 Matsushita Electric Ind Co Ltd Metodo de determinacion de resistencia de filtracion, metodo de codificacion de pelicula y metodo de decodificacion de pelicula.
JP3959039B2 (ja) * 2003-02-28 2007-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム
US7720294B2 (en) * 2004-02-09 2010-05-18 Broadcom Corporation Unified decoder architecture
JP4148228B2 (ja) * 2005-02-10 2008-09-10 ソニー株式会社 画像記録装置、画像再生制御装置、画像記録再生制御装置、これらの装置の処理方法およびその方法をコンピュータに実行させるプログラム
US7525456B2 (en) 2005-04-15 2009-04-28 Qpixel Technology, Inc. Methods for adaptively selecting entropy encoding modes
US20070098069A1 (en) * 2005-04-27 2007-05-03 Stephen Gordon Inverse scan, coefficient, inverse quantization and inverse transform system and method
EP1746838A1 (en) * 2005-07-18 2007-01-24 Matsushita Electric Industrial Co., Ltd. Moving picture coding apparatus and moving picture decoding apparatus
RU2368095C1 (ru) * 2005-07-22 2009-09-20 Мицубиси Электрик Корпорейшн Кодер изображения и декодер изображения, способ кодирования изображения и способ декодирования изображения, программа кодирования изображения и программа декодирования изображения и компьютерно-считываемый носитель записи, на котором записана программа кодирования изображения, и компьютерно-считываемый носитель записи, на котором записана программа декодирования изображения
US7656326B2 (en) * 2006-06-08 2010-02-02 Via Technologies, Inc. Decoding of context adaptive binary arithmetic codes in computational core of programmable graphics processing unit
KR20090129926A (ko) * 2008-06-13 2009-12-17 삼성전자주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
KR101700358B1 (ko) * 2009-12-09 2017-01-26 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8942282B2 (en) * 2010-04-12 2015-01-27 Qualcomm Incorporated Variable length coding of coded block pattern (CBP) in video compression
EP2591605B1 (en) * 2010-07-06 2019-11-06 Nokia Technologies Oy Method and apparatus for determining mapping between a syntax element and a code word for variable length coding
US8344917B2 (en) * 2010-09-30 2013-01-01 Sharp Laboratories Of America, Inc. Methods and systems for context initialization in video coding and decoding
US20120230423A1 (en) * 2011-03-10 2012-09-13 Esenlik Semih Line memory reduction for video coding and decoding
CN103202020B (zh) 2011-07-29 2017-02-08 太阳专利托管公司 动态图像解码方法以及动态图像解码装置

Also Published As

Publication number Publication date
HUE047353T2 (hu) 2020-04-28
US20140348230A1 (en) 2014-11-27
CN107105246A (zh) 2017-08-29
ES2754784T3 (es) 2020-04-20
JPWO2013018296A1 (ja) 2015-03-05
EP2739053A4 (en) 2014-06-04
US20190082190A1 (en) 2019-03-14
ZA201301158B (en) 2015-11-25
JP6531924B2 (ja) 2019-06-19
CN107105246B (zh) 2020-01-10
US8798147B2 (en) 2014-08-05
TWI581610B (zh) 2017-05-01
LT2739053T (lt) 2019-10-10
CN103202020B (zh) 2017-02-08
EP2739053A1 (en) 2014-06-04
AU2017201384B2 (en) 2018-07-26
JP5937020B2 (ja) 2016-06-22
CA2807959A1 (en) 2013-02-07
US8837588B2 (en) 2014-09-16
MY164655A (en) 2018-01-30
PT2739053T (pt) 2019-12-10
CN103202020A (zh) 2013-07-10
RU2013105792A (ru) 2014-10-20
CA2807959C (en) 2018-06-12
SI2739053T1 (sl) 2019-11-29
US20130028319A1 (en) 2013-01-31
RU2595573C2 (ru) 2016-08-27
BR112013003399A2 (pt) 2020-08-25
AU2017201384A1 (en) 2017-03-30
PL2739053T3 (pl) 2020-04-30
US10587889B2 (en) 2020-03-10
SG188213A1 (en) 2013-04-30
JP2016167868A (ja) 2016-09-15
US20210006813A1 (en) 2021-01-07
KR20140042763A (ko) 2014-04-07
US20130272399A1 (en) 2013-10-17
US20140348229A1 (en) 2014-11-27
US20230370629A1 (en) 2023-11-16
BR112013003399B1 (pt) 2022-04-19
US9706207B2 (en) 2017-07-11
US9083973B2 (en) 2015-07-14
AU2013200650A1 (en) 2013-02-28
AU2013200650B2 (en) 2016-12-15
US11438619B2 (en) 2022-09-06
US20200162753A1 (en) 2020-05-21
US20220360807A1 (en) 2022-11-10
US10820006B2 (en) 2020-10-27
WO2013018296A1 (ja) 2013-02-07
TW201315240A (zh) 2013-04-01
US10158875B2 (en) 2018-12-18
JP2018121356A (ja) 2018-08-02
EP2739053B1 (en) 2019-09-04
US20170214931A1 (en) 2017-07-27
US11758174B2 (en) 2023-09-12

Similar Documents

Publication Publication Date Title
AU2018203520B2 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
AU2016202666B2 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
AU2017202023B2 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
AU2017201384B2 (en) Moving picture coding method, moving picture decoding method, moving picture coding apparatus, moving picture decoding apparatus, and moving picture coding and decoding apparatus
AU2012260302B2 (en) Image coding method, image coding apparatus, image decoding method, image decoding apparatus, and image coding and decoding apparatus
AU2012329550B2 (en) Image encoding method, image decoding method, image encoding apparatus, and image decoding apparatus
AU2012291454B2 (en) Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus
AU2012264031B2 (en) Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
AU2012277215B2 (en) Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
AU2012274765B2 (en) Image coding method, image decoding method, image coding apparatus, image decoding apparatus, and image coding and decoding apparatus
AU2012277220B2 (en) Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
AU2012333936B9 (en) Image coding method, image coding apparatus, image decoding method and image decoding apparatus
AU2012277160B2 (en) Image encoding method, image decoding method, image encoding device, image decoding device, and image encoding/decoding device
AU2013273044B2 (en) Video image encoding method, video image encoding device, video image decoding method, and video image decoding device
MX2013001773A (es) Metodo de codificacion de imagen, metodo de decodificacion de imagen, aparato de codificacion de imagen, aparato de decodificacion de imagen, y aparato de codificacion y decodificacion de imagen.
MX2013010231A (es) Metodo de codificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de decodificacion de imagenes en movimiento y aparato de codificacion y decodificacion de imagenes en movimiento.
AU2013254214B2 (en) Encoding method, decoding method, encoding apparatus, decoding apparatus, and encoding and decoding apparatus
MX2012012443A (es) Modo de filtrado para intra-prediccion deducida de estadisticas de bloques circundantes.
MX2013015089A (es) Metodo de codificacion de imagenes en movimiento, metodo de decodificacion de imagenes en movimiento, aparato de codificacion de imagenes en movimiento, aparato de decodificacion de imágenes en movimiento y aparato de codificacion y decodificacion de imagenes en movimiento.
MX2013014207A (es) Metodo de procesamiento de imagenes y aparato de procesamiento de imagenes.
MX2013013909A (es) Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imágenes.
MX2013013483A (es) Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
MX2013012124A (es) Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/decodificacion de video.
AU2013264361B2 (en) Image encoding method, image encoding device, image decoding method, image decoding device, and image encoding/decoding device
MX2015002891A (es) Metodo de decodificacion de imagen, metodo de codificacion de imagen, aparato de decodificacion de imagen, aparato de codificacion de imagen y aparato de codificacion y decodificacion de imagen.

Legal Events

Date Code Title Description
FG Grant or registration
GB Transfer or rights
PD Change of proprietorship

Owner name: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AME