ES2802073T3 - Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen - Google Patents

Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen Download PDF

Info

Publication number
ES2802073T3
ES2802073T3 ES12733945T ES12733945T ES2802073T3 ES 2802073 T3 ES2802073 T3 ES 2802073T3 ES 12733945 T ES12733945 T ES 12733945T ES 12733945 T ES12733945 T ES 12733945T ES 2802073 T3 ES2802073 T3 ES 2802073T3
Authority
ES
Spain
Prior art keywords
context
encoded
signal
contexts
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12733945T
Other languages
English (en)
Inventor
Hisao Sasai
Takahiro Nishi
Youji Shibahara
Toshiyasu Sugio
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Patent Trust Inc
Original Assignee
Sun Patent Trust Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Patent Trust Inc filed Critical Sun Patent Trust Inc
Application granted granted Critical
Publication of ES2802073T3 publication Critical patent/ES2802073T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/4006Conversion to or from arithmetic code
    • H03M7/4012Binary arithmetic codes
    • H03M7/4018Context adapative binary arithmetic codes [CABAC]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

Un procedimiento de codificación de imagen para codificar datos de imagen por compresión que incluye una pluralidad de unidades de procesamiento que tienen diferentes tamaños que comprenden un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32, comprendiendo dicho procedimiento de codificación de imagen: realizar una transformación de frecuencia en los datos de la imagen para generar coeficientes de transformación, generar (S401) señales de corriente a codificar para cada una de las unidades de procesamiento de los datos de imagen, indicando cada una de dichas señales de corriente a codificar si un coeficiente de transformación cuantificado respectivo es cero o no cero; generar (S402) una señal binaria realizando binarización en cada una de las señales de corriente a codificar; almacenar una pluralidad de contextos estando cada uno asociado con una información de probabilidad codificada, que incluye una pluralidad de primeros contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes posiciones de los coeficientes de transformación, en el que cada primer contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de posiciones diferentes, una pluralidad de segundos contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada segundo contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de diferentes informaciones de condición circundante, y una pluralidad de terceros contextos para cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada tercer contexto corresponde a una de una pluralidad de diferentes informaciones de condición circundante; seleccionar (S403) un contexto para cada una de las señales de corriente a codificar entre la pluralidad de contextos sobre la base de un tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar, información de posición que indica una posición del coeficiente de transformación indicado por la señal de corriente a codificar, e indicando la información de la condición circundante si los coeficientes de transformación que rodean el coeficiente de transformación indicado por la señal de corriente a codificar son cero o no cero; realizar codificación aritmética (S404) de la señal binaria utilizando información de probabilidad codificada asociada con el contexto seleccionado; y actualizar (S405) la información de probabilidad codificada asociada con el contexto seleccionado, en función de la señal binaria generada, en el que, en la etapa de selección, el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar y que corresponde a la información de posición se selecciona (S203) de la pluralidad de primeros contextos si el coeficiente de transformación indicado por el la señal de corriente a codificar se encuentra en un área de baja frecuencia (S202), caracterizado porque en la etapa de selección, el contexto que corresponde al tamaño de la unidad de procesamiento, incluida la señal de corriente a codificar y que corresponde a la información de condición circundante se selecciona (S216) de la pluralidad de segundos contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es menor que 16 x 16 (S205); el contexto que corresponde a la información de condición circundante se selecciona (S207) de la pluralidad de terceros contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si un tamaño de la unidad de procesamiento que incluye la señal de corriente es igual a un tamaño de bloque mayor o igual a 16 x 16 (S205), compartiendo así el contexto entre las unidades de procesamiento que tienen diferentes tamaños de bloque mayores o iguales a 16 x 16.

Description

DESCRIPCIÓN
Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen
La presente invención se refiere a procedimientos de codificación de imágenes, procedimientos de decodificación de imágenes, aparatos de codificación de imágenes, y aparatos de decodificación de imágenes, y en particular a un procedimiento de codificación de imágenes, un procedimiento de decodificación de imágenes, un aparato de codificación de imágenes, un aparato de decodificación de imágenes, y un aparato de codificación y decodificación de imágenes destinado a realizar codificación aritmética y/o decodificación aritmética.
[Técnica antecedente]
En los últimos años se ha visto un aumento en el número de solicitudes de servicios de, por ejemplo, servicios de video a pedido. Ejemplos de dichos servicios incluyen videoconferencia a través de Internet, transmisión de video digital y transmisión de contenido de video. Estas aplicaciones requieren que los datos de video que tienen una cantidad sustancial de datos digitales se transmitan a través de canales de transmisión y se almacenen en medios de almacenamiento. Sin embargo, los canales de transmisión convencionales tienen un ancho de banda de frecuencia disponible limitado, y los medios de almacenamiento convencionales tienen una capacidad limitada. De acuerdo con lo anterior, para transmitir los datos de video usando un canal de transmisión convencional y grabar los datos de video en un medio de grabación convencional, es inevitable comprimir o reducir la cantidad de datos de video.
Con el fin de comprimir datos de video, se han desarrollado muchos estándares de codificación de video. Dichos estándares de codificación de video son, por ejemplo, estándares del Sector de Normalización de las Telecomunicaciones de la Unión Internacional de Telecomunicaciones (ITU-T) denotados con H.26x y estándares ISO/IEC denotados con MPEG-x. Los estándares de codificación de video más avanzados son actualmente los estándares designados como H.264/AVC o MPEG-4/AVC (consulte el estándar ISO/IEC ISO/IEC 14496-10 “MPEG-4 Part 10 Advanced Video Coding”, el artículo “Overview of the H. 264/AVC Video Coding Standard” por Thomas Wiegand et al, IEEE Transactions on Circuits and Systems for Video Technology, julio de 2003, pp. 1-19, así como el documento “Test Model under Consideration for High-Efficiency Video Coding”, publicado por ISO/IEC JTC1/SC29/WG11, abril de 2010 Dresden).
Un esquema de modelado de contexto para la codificación de transformación de niveles de coeficientes que es particularmente adecuado para transformar bloques mayores de 8x 8, se divulga en el artículo “Improved Context Modeling for Coding Quantized Transform Coefficients in Video Compression” (codificación de imagen Simposio 2010; Nagoya) por Tung Nguyen et al.
Un esquema de modelado de contexto que selecciona un modelo de contexto para los bloques mayores de 8x8 sobre la base del número de coeficientes de transformación significativos ya codificadas en una zona predefinida se conoce a partir del artículo “Video coding technology proposal by Fraunhofer HHI” por M Winken y col. (Primera reunión JCT-v C; 15.4.2010 - 23.4.2010; Dresde; Equipo de colaboración conjunta sobre codificación de video de ISO/IEC JTC1/SC29/WG11 y ITU-T SG16 WP3).
La referencia JP 2004/064725 (A) divulga un procedimiento de codificación y decodificación de longitud variable, en el que se hace referencia a un número de coeficientes de un bloque de periferia y se cambia una tabla de codificación de longitud variable cuando se cambia el número de coeficientes de un bloque de codificación codificado. Cuando el tamaño del bloque de codificación y el tamaño del bloque de periferia son diferentes, el número del coeficiente del bloque de periferia se convierte de modo que el tamaño del bloque de codificación coincida con el tamaño del bloque de periferia.
Sin embargo, la codificación aritmética convencional tiene un problema de no proporcionar una eficiencia de codificación suficiente.
La presente invención se ha realizado para resolver el problema antes mencionado, con el objetivo de proporcionar un procedimiento de codificación de imágenes, un aparato de codificación de imágenes, un procedimiento de decodificación de imágenes, un aparato de decodificación de imágenes, y un aparato de codificación y decodificación de imágenes que hacen posible aumentar la eficiencia de codificación.
Esto se consigue mediante las características de las reivindicaciones independientes. Las realizaciones preferidas son la materia objeto de las reivindicaciones dependientes.
Con la presente invención, es posible aplicar el mismo contexto para las señales a ser codificadas que tienen las mismas propiedades estadísticas. Por esta razón, el procedimiento de codificación de imágenes de acuerdo con la presente invención está destinado a seleccionar el contexto compartido para las señales que tienen las mismas propiedades estadísticas incluso cuando los tamaños de las unidades de procesamiento son diferentes. De esta manera, es posible reducir el número de contextos que se utilizarán. Esta reducción en el número de contextos hace posible reducir el tamaño de la memoria para almacenar los contextos. En el presente documento, no es necesario que el procedimiento de codificación de imágenes de acuerdo con la presente invención esté configurado para usar todos los contextos para diferentes unidades de procesamiento. En otras palabras, el procedimiento de codificación de imágenes de acuerdo con la presente invención puede configurarse para usar parcialmente los contextos exclusivamente para una unidad de procesamiento particular.
Convencionalmente, el número de contextos es grande porque se establece un contexto diferente basado en un tamaño de unidad de procesamiento y en una posición de coeficiente o una condición circundante. En el caso de que se use un gran número de contextos, existe la posibilidad de que el número de actualizaciones de información de probabilidad codificada para algunos de los contextos sea pequeño y no se asegure la precisión de la información de probabilidad codificada. En contraste, como se describió anteriormente, el procedimiento de codificación de imágenes de acuerdo con la presente invención hace posible reducir el número de contextos, aumentar el número de actualizaciones para los contextos que se seleccionarán y compartirán, y aumentar la precisión de predicción de la información de probabilidad codificada. Este aumento en la precisión de la información de probabilidad codificada hace posible aumentar la eficiencia de codificación.
De acuerdo con el procedimiento de codificación de imagen de la presente invención de codificación, el contexto que se establece como un contexto compartido de antemano se puede seleccionar en el caso donde el tamaño de la unidad de procesamiento que incluye la señal de corriente que ha de codificarse obtenido en la obtención es más grande que un tamaño predeterminado.
Aquí, en general, se selecciona un contexto de acuerdo con una condición circundante. Cuando el tamaño de la unidad de procesamiento es relativamente grande, las propiedades estadísticas se vuelven aproximadamente iguales y, por lo tanto, se puede usar el mismo contexto compartido. Un aspecto del procedimiento de codificación de imágenes de acuerdo con la presente invención hace posible reducir el número de contextos utilizando un contexto compartido en el caso en que el tamaño de la unidad de procesamiento sea mayor que el tamaño predeterminado. De esta manera, es posible aumentar la precisión de predicción de la información de probabilidad codificada y, de este modo, aumentar la eficiencia de codificación en el caso en que el tamaño de la unidad de procesamiento sea mayor que el tamaño predeterminado.
El procedimiento de codificación de imágenes de la presente invención puede comprender además la realización de transformación de frecuencia en los datos de imagen para generar coeficientes de transformación de los componentes de frecuencia y generar las señales de corriente para ser codificados que indican respectivamente los coeficientes de transformación de los componentes de frecuencia, en el que en la selección, el contexto que se establece como un contexto dedicado para una unidad de procesamiento que se incluye en las unidades de procesamiento puede seleccionarse en el caso en que el componente de frecuencia correspondiente a la señal de corriente a codificar sea inferior a una frecuencia predeterminada. El procedimiento de codificación de imagen de la presente invención puede comprender además realizar una transformación de frecuencia en los datos de imagen para generar coeficientes de transformación de componentes de frecuencia y generar las señales de corriente a codificar que indican respectivamente los coeficientes de transformación de los componentes de frecuencia, en donde al seleccionar, el contexto que se establece para una unidad de procesamiento que se incluye en las unidades de procesamiento puede seleccionarse en el caso en que el componente de frecuencia correspondiente a la señal de corriente a codificar sea inferior a una frecuencia predeterminada.
De esta manera, es posible seleccionar un contexto adaptado a las características de los datos de imagen.
El procedimiento de codificación de imágenes de acuerdo con la presente invención puede comprender además la segmentación de los datos de imagen en una pluralidad de subbloques que tienen cada uno el mismo tamaño de la unidad de subprocesamiento, en el que en la generación, la señal binaria se puede generar mediante la realización de binarización en el señales de corriente a codificar de cada uno de los subbloques, y en la selección, se selecciona el contexto que puede establecerse previamente para el tamaño de la unidad de subprocesamiento. Es posible aplicar el mismo contexto estableciendo el contexto en función del tamaño del subbloque, independientemente de si el tamaño del bloque es grande o pequeño.
Con la presente invención, es posible decodificar adecuadamente los datos de imagen codificados, codificados utilizando el procedimiento de codificación de acuerdo con la presente invención. Como en el procedimiento de codificación de imágenes de acuerdo con la presente invención, es posible reducir el número de contextos. Además, es posible aumentar el número de actualizaciones para los contextos y, de este modo, aumentar la precisión de predicción de la información de probabilidad decodificada.
De acuerdo con el procedimiento de decodificación de imágenes de la presente invención, en la selección, el contexto que se establece como un contexto compartido de antemano se puede seleccionar en el caso en que el tamaño de la unidad de procesamiento que incluye las señales de corriente que se van a codificar obtenidas es mayor que un tamaño predeterminado.
De esta manera, es posible reducir el número de contextos porque el contexto compartido se utiliza cuando el tamaño de la unidad de procesamiento es mayor que el tamaño predeterminado. De esta manera, es posible aumentar la precisión de predicción de la información de probabilidad codificada y, de este modo, aumentar la eficiencia de codificación en el caso en que el tamaño de la unidad de procesamiento sea mayor que el tamaño predeterminado.
De acuerdo con el procedimiento de decodificación de imágenes de la presente invención, en la selección, el contexto que se establece como un contexto dedicado de antemano por una unidad de procesamiento incluidos en las unidades de procesamiento se puede seleccionar cuando el componente de frecuencia correspondiente a la señal de corriente a decodificar es menor que una frecuencia predeterminada en el caso en que la señal de corriente a decodificar es una señal que indica uno de los coeficientes de transformación de los componentes de frecuencia generados a través de la transformación de frecuencia en la generación de los datos de imagen codificados. De acuerdo con el procedimiento de decodificación de imágenes de la presente invención, en la selección, se puede seleccionar el contexto que se establece de antemano como un contexto compartido para las unidades de procesamiento que están incluidas en las unidades de procesamiento y que tienen frecuencias altas que son más altas que la frecuencia predeterminada. cuando el componente de frecuencia correspondiente a la señal de corriente a decodificar es mayor que la frecuencia predeterminada en el caso en que la señal de corriente a decodificar es una señal que indica uno de los coeficientes de transformación de los componentes de frecuencia generados a través de la transformación de frecuencia en la generación de los datos de imagen codificados.
De esta manera, es posible seleccionar un contexto adaptado a las características de los datos de imagen.
De acuerdo con el procedimiento de decodificación de imágenes de la presente invención, en el caso donde los datos de imagen codificada son datos de imagen codificada generados mediante la segmentación de los datos de imagen en una pluralidad de subbloques, cada uno con el mismo tamaño de la unidad de subprocesamiento, y la realización de binarización y codificación aritmética de cada uno de los subbloques, en la selección, se puede seleccionar el contexto que se establece como contexto para cada uno de los subbloques que tienen el tamaño de la unidad de subprocesamiento.
Es posible aplicar el mismo contexto estableciendo el contexto en función del tamaño del subbloque, independientemente de si el tamaño del bloque es grande o pequeño.
Es de notar que la presente invención puede realizarse o implementarse no sólo como procedimientos de codificación de imágenes, sino también como aparatos de codificación de imagen que incluyen unidades de procesamiento para realizar las etapas de procesamiento incluidos en los procedimientos de codificación de imágenes de codificación. Asimismo, la presente invención se puede realizar o implementar no solo como procedimientos de decodificación de imágenes, sino también como aparatos de decodificación de imágenes que incluyen unidades de procesamiento para realizar las etapas de procesamiento incluidos en los procedimientos de decodificación de imágenes. Además, la presente invención puede realizarse o implementarse como aparatos de codificación y decodificación de imágenes que incluyen unidades de procesamiento para realizar las etapas de procesamiento incluidos tanto en los procedimientos de codificación de imágenes como en los procedimientos de decodificación de imágenes.
Además, estas etapas se pueden realizar como un programa para hacer que un ordenador ejecute las siguientes etapas. Además, la presente invención puede implementarse como medios de grabación tales como memorias compactas de solo lectura (CD-ROM) legibles por ordenador, incluidos los programas grabados en los mismos, e información, datos y/o señales que representan los programas. Naturalmente, el programa, la información, los datos y las señales pueden distribuirse a través de redes de comunicación como Internet.
Algunos o todos los elementos estructurales que constituyen uno cualquiera de los aparatos de codificación de imágenes y los aparatos de decodificación de imágenes pueden estar configurados en forma de un único sistema de Integración a Gran Escala (LSI). Tal sistema LSI es un LSI súper multifuncional fabricado integrando unidades de elementos estructurales plurales en un solo chip. Por ejemplo, el sistema LSI es un sistema informático configurado para incluir un macroprocesador, una ROM, una memoria de acceso aleatorio (RAM) y similares.
[Efectos ventajosos de la invención]
La presente invención hace que sea posible realizar predicciones de probabilidades de ocurrencia de símbolos con alta precisión, y para de ese modo aumentar la eficiencia de codificación de imágenes.
[Breve descripción de los dibujos]
La figura 1 es un diagrama de bloques que muestra una estructura de un aparato de codificación aritmética de acuerdo con la técnica convencional.
La figura 2 es un diagrama de flujo que indica un procedimiento de codificación aritmética de acuerdo con la técnica convencional.
La figura 3 es un diagrama de bloques que muestra un ejemplo de una estructura de una unidad de codificación aritmética de un aparato de codificación de imágenes de acuerdo con la presente invención.
La figura 4 es un diagrama que muestra un ejemplo de una tabla de información de señal para su uso en un procedimiento de codificación de imagen y un/el aparato de codificación de imagen de acuerdo con la presente invención.
La figura 5A es un diagrama de bloques que muestra un ejemplo de una tabla de contexto para usar en un/el procedimiento de codificación de imagen y un/el aparato de codificación de imagen de acuerdo con la presente invención.
La figura 5B es un diagrama de bloques que muestra un ejemplo de una tabla de contexto para usar en un/el procedimiento de codificación de imágenes y un/el aparato de codificación de imágenes de acuerdo con la presente invención.
La figura 5C es un diagrama de bloques que muestra un ejemplo de una tabla de contexto para usar en un/el procedimiento de codificación de imagen y un/el aparato de codificación de imagen de acuerdo con la presente invención.
La figura 6 es un diagrama de flujo que indica un procedimiento de procesamiento en un procedimiento de codificación aritmética en un/el procedimiento de codificación de imágenes de acuerdo con la presente invención.
La figura 7 es un diagrama de flujo que indica un procedimiento de procesamiento en un/el procedimiento de codificación aritmética en un/el procedimiento de codificación de imagen de acuerdo con la presente invención.
La figura 8 es un diagrama de flujo que indica un ejemplo de un procedimiento de procesamiento en una unidad de control de clasificación de bloques de contexto que constituye un/el procedimiento de codificación de imagen y un/aparato de codificación de imagen de acuerdo con la presente invención.
La figura 9 es un diagrama de flujo que indica un ejemplo de un procedimiento de procesamiento en una unidad de control de clasificación de bloques de contexto que constituye un/el procedimiento de codificación de imagen y un/aparato de codificación de imagen de acuerdo con la presente invención.
La figura 10A es un diagrama de flujo que indica un ejemplo de un procedimiento de procesamiento en una unidad de control de clasificación de bloques de contexto que constituye un/el procedimiento de codificación de imagen y un/aparato de codificación de imagen de acuerdo con la presente invención.
La figura 10B es un diagrama de flujo que indica un ejemplo de un procedimiento de procesamiento en una unidad de control de clasificación de bloques de contexto que constituye un/el procedimiento de codificación de imagen y un/aparato de codificación de imagen de acuerdo con la presente invención.
La figura 11 es un diagrama esquemático que ilustra un procedimiento de cálculo de la condición circundante en un/el procedimiento de codificación de imagen y un aparato/de codificación de imagen de acuerdo con la presente invención.
La figura 12 es un diagrama de bloques que muestra un ejemplo de una estructura completa de un/el aparato de codificación de imágenes de acuerdo con la presente invención.
La figura 13 es un diagrama de bloques que muestra un ejemplo de una estructura de una/la unidad de decodificación aritmética de un/el aparato de decodificación de imágenes de acuerdo con la presente invención.
La figura 14 es un diagrama de flujo que indica un procedimiento de procesamiento en un procedimiento de decodificación aritmética en un/el procedimiento de decodificación de imágenes de acuerdo con la presente invención.
La figura 15 es un diagrama de flujo que indica un ejemplo de un procedimiento de decodificación aritmética en un/el procedimiento de decodificación de imágenes de acuerdo con la presente invención.
La figura 16 es un diagrama de bloques que muestra un ejemplo de una estructura completa de un/el aparato de codificación de imágenes de acuerdo con la presente invención.
La figura 17 es una configuración general de un sistema que proporciona contenido para implementar servicios de distribución de contenido.
La figura 18 es una configuración general de un sistema de radiotransmisión digital.
La figura 19 es un diagrama de bloques que ilustra un ejemplo de una estructura de un receptor de televisión.
La figura 20 es un diagrama de bloques que ilustra un ejemplo de una estructura de una unidad de reproducción y grabación de información que lee y escribe información desde o sobre un medio de grabación que es un disco óptico.
La figura 21 es un dibujo que muestra un ejemplo de una estructura de un medio de grabación que es un disco óptico.
La figura 22A es un dibujo que ilustra un ejemplo de un teléfono móvil.
La figura 22B es un diagrama de bloques que ilustra una estructura del teléfono móvil.
La figura 23 es un dibujo que muestra una estructura de datos multiplexados.
La figura 24 es un dibujo que ilustra esquemáticamente cómo cada uno de los flujos se multiplexa en datos multiplexados.
La figura 25 es un dibujo que ilustra cómo se almacena una transmisión de flujos de video en una transmisión de flujos de paquetes PES con más detalle.
La figura 26 es un dibujo que muestra una estructura de paquetes TS y paquetes fuente en los datos multiplexados.
La figura 27 es un dibujo que muestra una estructura de datos de un PMT.
La figura 28 es un dibujo que muestra una estructura interna de información de datos multiplexados.
La figura 29 es un dibujo que muestra una estructura interna de información de atributos de transmisión de flujos.
La figura 30 es un dibujo que muestra las etapas para identificar datos de video.
La figura 31 es un diagrama de bloques que ilustra un ejemplo de una estructura de un circuito integrado para implementar el procedimiento de codificación de imágenes en movimiento y el procedimiento de decodificación de imágenes en movimiento de acuerdo con cualquiera de las realizaciones.
La figura 32 es un dibujo que muestra una estructura para cambiar entre frecuencias de control.
La figura 33 es un dibujo que muestra las etapas para identificar datos de video y cambiar entre frecuencias de control.
La figura 34 es un dibujo que muestra un ejemplo de una tabla de consulta en la que los estándares de datos de video están asociados con las frecuencias de control.
La figura 35A es un dibujo que muestra un ejemplo de una estructura para compartir un módulo de una unidad de procesamiento de señal.
La figura 35B es un dibujo que muestra otro ejemplo de una estructura para compartir un módulo de una unidad de procesamiento de señal.
[Descripción de las realizaciones]
En primer lugar, una estructura básica de un aparato de codificación de imágenes convencional y un procedimiento de codificación de imágenes convencional se describen antes de explicar las realizaciones de la presente invención. El aparato de codificación de imagen convencional ejecuta procesamiento de codificación por compresión compuesta de predicción, transformación y cuantificación, y codificación de entropía en una señal de corriente de datos de imagen que se van a codificar.
En lo sucesivo, la codificación de entropía entre los procesos realizados por el aparato de codificación de imágenes se describe con referencia a la figura 1 y la figura 2. En el presente documento, la codificación aritmética se explica como la codificación de entropía.
La figura 1 es un diagrama de bloques que muestra una estructura de una unidad de codificación aritmética que ejecuta el procedimiento de codificación aritmética convencional. La figura 2 es un diagrama de flujo que indica un procedimiento de procesamiento del procedimiento de codificación aritmética (un ejemplo de codificación de entropía) conforme al estándar H.264/AVC convencional.
Como se muestra en la figura 1, la unidad 10 de codificación aritmética incluye una unidad 11 de binarización, una unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolos, una unidad 13 de control de contexto y un codificador 14 aritmético binario.
La unidad 10 de codificación aritmética recibe, como entradas, (i) una señal de entrada IS que es una señal de corriente que ha de codificarse, que se convierte en un objetivo de codificación, (ii) una información de tipo de señal SE que indica el tipo de la señal de entrada IS, y (iii) una señal de tamaño de bloque BLKS que indica el tamaño de bloque de la señal de entrada IS. En lo sucesivo, se dan descripciones asumiendo un caso en el que la señal de entrada IS es una señal que indica una corriente de coeficientes cuantificados actuales generados al cuantificar los datos de imagen que tienen un coeficiente cero y un caso en el que la señal de entrada IS es una señal que indica una corriente de los coeficientes cuantificados son coeficientes distintos de cero.
La unidad 11 de binarización ejecuta, en base a la información de tipo de señal SE, una conversión de proceso (binarización) de dos valores para la conversión de la señal de entrada IS en información binaria (un símbolo) de “0” 0 “1”, y envía una señal binaria BIN al codificador 14 aritmético binario y la unidad 13 de control de contexto.
La unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo almacena (i) una sola tabla de información de señal y (ii) una tabla de contexto que incluye una pluralidad de contextos preparados para diferentes tamaños y condiciones de bloque.
Esta tabla de información de señal es una tabla que almacena contextos, información de probabilidad que indican las probabilidades de ocurrencia símbolo PE, y los símbolos de una manera asociada. Las probabilidades de ocurrencia de símbolos PE son información de probabilidad para su uso en el procesamiento por el codificador 104 aritmético binario que se describirá más adelante.
Aquí, la figura 4 muestra un ejemplo de una tabla de información de señal en la que los índices ctxIdx, las probabilidades de ocurrencia pStateIdx y los símbolos valMPS, que son símbolos que tienen una probabilidad de ocurrencia alta (Símbolos más probables) están respectivamente asociados entre sí. Cada uno de los índices ctxIdx indica un contexto. Además, la información de probabilidad pStateIdx y el símbolo valMPS son los mismos que se muestran en el estándar H.264. En otras palabras, cada una de las probabilidades pStateIdx es un índice que indica un valor de una de las probabilidades de ocurrencia de símbolos PE correspondientes. La unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo almacena además una tabla de probabilidad de ocurrencia (no mostrada) que indica un valor de una de las probabilidades de ocurrencia de símbolo PE que corresponde a la información de probabilidad pStateIdx.
La tabla de contexto es una tabla que almacena una pluralidad de contextos ctxIdx para diferentes tamaños de bloque BLKS y condiciones. En el presente documento, dichas condiciones se determinan de acuerdo con las posiciones de los coeficientes cuantificados de las señales de corriente a codificar.
Aquí, la figura 5A es un diagrama de bloques que muestra un ejemplo de una tabla de contexto convencional. Más específicamente, por ejemplo, en la Tabla 1, (i) se establece un contexto ctxIds 0 para una condición 10 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, (ii) se establece un contexto ctxIds 1 para una condición 11 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, y (iii) se establece un contexto ctxIds 2 para las condiciones 12 y 13, cada una indicando una condición circundante correspondiente a un componente de alta frecuencia. Además, por ejemplo, en la Tabla 2, (i) se establece un contexto ctxIds 4 para las condiciones 4 y 5, cada una indicando la posición de un coeficiente correspondiente a un componente de baja frecuencia, y (ii) se establece un contexto ctxIds 15 para las condiciones 6 y 7, cada uno indicando una condición circundante correspondiente a componentes de alta frecuencia.
Se supone aquí, por ejemplo, que la Tabla 1 se usa para un tamaño de un bloque A que es un tamaño de bloque de 4 x 4, y que la Tabla 2 se utiliza para un tamaño de bloque B que es un tamaño de bloque de 8 x 8. Como se muestra en la figura 5A, los valores 0, 1 y 2 de los contextos ctxIdx para usar en la Tabla 1 no se usan en la Tabla 2. La Tabla 1 y la Tabla 2 corresponden respectivamente a diferentes tamaños de bloque y, por lo tanto, diferentes contextos ctxIdx se establecen para diferentes tamaños de bloque.
La unidad 13 de control de contexto realiza el procesamiento control de contexto de lectura de probabilidad de ocurrencia de símbolo PE correspondiente al tamaño de bloque mostrado por una señal de tamaño de bloque BLKS y una condición determinada en base a la información de tipo de señal de la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo, y enviar la probabilidad de ocurrencia de símbolo de lectura PE al codificador 14 aritmético binario. Además, la unidad 13 de control de contexto calcula una nueva probabilidad de ocurrencia de símbolo PE basada en una señal binaria BIN que es ingresada desde la unidad 11 de binarización. Después que se ejecuta el procesamiento de control de contexto, la unidad 13 de control de contexto realiza el procesamiento de actualización reemplazando, con la nueva probabilidad de ocurrencia de símbolo PE, la probabilidad de ocurrencia de símbolo PE identificada en el procesamiento de control de contexto entre los contextos ctxIdx almacenados en la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo.
El codificador 14 aritmético binario genera una señal OB de salida mediante la realización de la codificación aritmética en la entrada de señal BIN binaria de la unidad 11 de binarización, en base a la probabilidad de símbolo de ocurrencia PE leída por la unidad 13 de control de contexto, y emite la salida generada señal OB.
A continuación, un flujo de procedimiento de codificación aritmética se describe con referencia a la figura 2.
La unidad 10 de codificación aritmética comienza la codificación aritmética luego de recibir de la señal de entrada IS, los BLKS de señal de tamaño de bloque, y la información de tipo de señal de SE.
En el momento en que se inicia la codificación aritmética, en la etapa 11, la unidad 11 de binarización ejecuta binarización utilizando un enfoque predeterminado de acuerdo con la información de tipo de señal SE.
En la etapa S12, la unidad 13 de control de contexto obtiene el tamaño de bloque de la señal de entrada IS basado en los BLKS de señal de tamaño de bloque, y obtiene la posición del coeficiente como una condición, basándose en la información de tipo de señal SE. Además, la unidad 13 de control de contexto identifica el contexto ctxIdx correspondiente al tamaño de bloque y la condición de la señal de entrada IS, en base a la tabla de contexto almacenada en la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo. Además, la unidad 13 de control de contexto identifica además la probabilidad de ocurrencia de símbolo PE basada en la tabla de información de señal mostrada en la figura 4, y hace que la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo genere la probabilidad de ocurrencia de símbolo identificada PE al codificador aritmético binario (procesamiento de control de contexto).
En la etapa S13, el codificador 14 aritmético binario realiza la codificación aritmética en la señal binaria BIN utilizando la probabilidad de ocurrencia de símbolo PE recibida de la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo en la etapa S12, y genera los resultados como la señal de salida OB.
En la etapa S14, la unidad 13 de control de contexto calcula una nueva probabilidad de ocurrencia de símbolo PE basado en la señal binaria BIN calculada por la unidad 11 de binarización en la etapa S11, y actualiza el valor de la correspondiente probabilidad de ocurrencia pStateIdx en la tabla de información de señal almacenada en la unidad 12 de almacenamiento de probabilidad de ocurrencia de símbolo. Una vez completada la codificación aritmética en la señal de entrada IS, se realiza la codificación aritmética en la siguiente señal a procesar (no mostrada).
Como se describió anteriormente, la técnica convencional mostrada en la figura 1 y la figura 2 establece contextos para diferentes tamaños y condiciones de bloque. En otras palabras, contextualiza un conjunto basado en clasificaciones muy finas.
Sin embargo, es muy probable que las clasificaciones muy finas produzcan contextos que tienen una frecuencia de ocurrencia baja para el procesamiento de actualización de la probabilidad de ocurrencia de símbolo PE. Un contexto que tiene una frecuencia baja de ocurrencia para el procesamiento de actualización disminuye la precisión de la probabilidad de ocurrencia de símbolo PE. Esto hace que sea difícil realizar un control adaptado a las características de los datos de imagen, aunque dicho control es un efecto ventajoso de la codificación aritmética. Como resultado, la eficiencia de codificación disminuye.
Por esta razón, dichas clasificaciones deberán ser configuradas adecuadamente con el fin de aumentar la precisión de las probabilidades de ocurrencia de símbolos PE y para realizar así el control adaptado a las características de los datos de imagen.
El estándar de codificación de vídeo convencional soporta solamente tamaños de bloque limitado tal como un tamaño de bloque de 4 x 4 y un tamaño de bloque de 8 x 8. Sin embargo, recientemente, existe una demanda para soportar otros tamaños de bloque, como un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32. Un aumento en el número de tamaños de bloque aumenta significativamente el número de contextos. Por lo tanto, convencionalmente, existe el problema de que la frecuencia de actualización de la probabilidad de ocurrencia de símbolo PE puede reducirse aún más.
En lo sucesivo, las realizaciones de la presente invención se describen con referencia a los dibujos. Debe observarse que cada una de las realizaciones descritas a continuación muestra un ejemplo específico preferido de la presente invención. Los valores, formas, materiales, elementos estructurales, la disposición y las posiciones de los elementos estructurales, los estados de conexión de los elementos estructurales, las etapas, el orden de las etapas son todos ejemplos, y por lo tanto no deben interpretarse como limitantes de la presente invención. La presente invención está limitada únicamente en función del alcance de las reivindicaciones. Por lo tanto, los elementos estructurales que no se definen en las reivindicaciones independientes, cada uno de los cuales indica el concepto más genérico de la presente invención entre los elementos estructurales en las realizaciones indicadas a continuación, no siempre son necesarios para lograr el objetivo de la presente invención, sino que se explican como constitutivos las realizaciones preferidas.
[Realización 11
La realización 1 relacionada con un procedimiento de codificación de imágenes y un aparato de codificación de imágenes de acuerdo con la presente invención se describe con referencia a la figura 3 a la figura 8.
El procedimiento de codificación de imágenes de acuerdo con la presente invención se refiere particularmente a un procedimiento de codificación aritmética como un ejemplo de codificación de entropía entre la compresión de codificación compuesta de predicción, transformación y cuantificación, codificación de entropía, y similares realizado en una señal de corriente a codificar de datos de imagen. Además, el aparato de codificación de imágenes de acuerdo con la presente invención está configurado para incluir una unidad de predicción, una unidad de transformación y cuantificación, y una unidad de codificación aritmética (unidad de codificación de entropía) que ejecuta el procedimiento de codificación aritmética. La estructura general del aparato de codificación de imágenes se describe más adelante.
(Esquema de realización 1)
En primer lugar, se describe el esquema de un procedimiento de codificación aritmética y una unidad de codificación aritmética de acuerdo con la realización 1. En el presente documento, se proporciona una descripción de un caso en el que una señal que indica si una corriente de los coeficientes cuantificados de los componentes de frecuencia generados a través de la transformación y cuantificación es un coeficiente cero o un coeficiente distinto de cero se ingresa como una señal de entrada IS a la unidad de codificación aritmética.
En el caso en que la señal de entrada IS sea una señal correspondiente a un componente de alta frecuencia, por ejemplo, cuando el tamaño del bloque es un tamaño de bloque grande más grande que un tamaño de bloque de 16 x 16, se determina la probabilidad de ocurrencia de símbolo PE en función de una condición circundante. En otras palabras, los componentes de alta frecuencia en los bloques que tienen un tamaño de bloque de 16 x 16 o mayor tienen las mismas propiedades estadísticas de los datos de la imagen y, por lo tanto, el mismo contexto es aplicable cuando las condiciones (condiciones circundantes) son las mismas, incluso si Los tamaños de los bloques son diferentes.
En contraste, en el caso en que la señal de entrada IS corresponda a un componente de baja frecuencia en un bloque que tiene un tamaño grande, la probabilidad de ocurrencia de símbolo PE se determina basándose en la posición del coeficiente. Más específicamente, la señal correspondiente al componente de baja frecuencia que incluye un componente ortogonal es (i) una señal que tiene una alta probabilidad de tener las características de los datos de imagen y (ii) una parte de la que se puede obtener fácilmente la información estadística debido a Una alta frecuencia de presencia de una señal de SignificantFlag. Por esta razón, en el caso de las señales de entrada SI correspondientes a los componentes de baja frecuencia en los tamaños de bloque grandes, es posible realizar una codificación aritmética utilizando la información estadística adaptada a las características de los datos de la imagen de manera más significativa que la convencional estableciendo diferentes contextos sin establecer un contexto compartido cuando los tamaños de bloque son diferentes incluso cuando las condiciones (las posiciones de los coeficientes) son las mismas. Esto hace posible aumentar la eficiencia de codificación.
Como se describió anteriormente, en la realización 1, (i) en el caso de las señales de entrada SI de componentes de alta frecuencia en grandes bloques que tienen un tamaño de bloque grande, el contexto en el que se establece para la misma condición es en parte o totalmente compartida entre los bloques que tienen diferentes tamaños de bloque, y (ii) en el caso de la señal de entrada IS de un componente de baja frecuencia en el bloque que tiene un tamaño de bloque grande y la señal de entrada IS de un componente de baja frecuencia en el bloque que tiene un tamaño de bloque pequeño, los contextos se establecen para los tamaños y condiciones de bloque respectivos sin compartir el contexto entre los bloques.
Aquí, hay poca desventaja del uso de un tal contexto compartido para los componentes de baja frecuencia en los bloques que tienen un tamaño de bloque de gran tamaño. Por lo tanto, también es bueno usar un contexto compartido para las señales de entrada SI correspondientes a los bloques que tienen el tamaño de bloque grande independientemente de si cada una de las señales de entrada SI corresponde a un componente de baja frecuencia o un componente de alta frecuencia. Un procedimiento preferible para seleccionar objetivos de intercambio de contexto es establecer los objetivos de acuerdo con las señales de entrada SI, que son las señales de objetivo de codificación y los detalles de la información de tipo de señal SE.
(Estructura de la unidad de codificación aritmética en la realización 1)
A continuación, se ofrece una descripción de la estructura de una unidad de codificación aritmética que realiza un procedimiento de codificación aritmética de acuerdo con la realización 1.
Aquí, la figura 3 es un diagrama de bloques que muestra un ejemplo de la estructura de la unidad 100 de codificación aritmética de acuerdo con la Realización 1.
Como se muestra en la figura 3, la unidad 100 de codificación aritmética incluye una unidad 101 de binarización, una unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolos, una unidad 103 de control de contexto, un codificador 104 aritmético binario y una unidad 105 de control de clasificación de bloque de contexto.
La unidad 100 de codificación aritmética genera una señal de salida OB ejecutando la codificación aritmética en una señal de entrada IS que es una señal de corriente a codificar, y emite la señal de salida generada OB. En la Realización 1, la unidad 100 de codificación aritmética recibe, como entradas, la señal de entrada IS, una información de tipo de señal SE que indica el tipo de señal de entrada IS, y una señal de tamaño de bloque BLKS que indica el tamaño de bloque de la señal de entrada IS.
Aquí, en la Realización 1, se dan descripciones suponiendo un caso en el que la señal de entrada IS es una señal que indica si uno de los coeficientes cuantificados actuales de componentes de frecuencia generados al cuantificar los datos de imagen es un coeficiente cero o un valor de coeficiente distinto de cero (una señal llamada SignificantFlag en H.264). Debe observarse que la señal de entrada IS no está limitada a la misma, y puede ser un coeficiente cuantificado bruto o puede ser información utilizada para generar el coeficiente cuantificado.
Además, la información de tipo de señal SE es información que indica las propiedades de la señal de entrada IS, que es la señal de corriente que ha de codificarse. Más específicamente, en la Realización 1, se dan descripciones suponiendo un caso en el que la señal de entrada IS es una información de posición que indica la posición del coeficiente cuantificado y la información (una condición circundante) que indica si los coeficientes cuantificados que rodean el coeficiente cuantificado actual son cero o no cero. Debe observarse que la información de tipo de señal SE no está limitada a la misma, y puede ser, por ejemplo, información que indica si el componente directo del coeficiente cuantificado es cero o no cero, o puede ser información que indica una dirección de predicción en el caso en el que el procedimiento de predicción aplicado a la señal de entrada IS es intra predicción.
La realización 1 está configurada para recibir señales de tamaño de bloque BLKS suponiendo que los contextos están configurados adecuadamente para tamaños de bloque. Sin embargo, es posible configurar una realización que no utiliza tales señales de tamaño de bloque BLKS en el caso de establecer contextos de acuerdo con otras características de los datos de imagen.
La unidad 101 de binarización genera una señal binaria mediante la realización de binarización en la señal de corriente que ha de codificarse. Más específicamente, la unidad 101 de binarización genera una señal binaria BIN realizando binarización para convertir la señal de entrada IS, que es la señal de corriente que se codificará en información binaria (un símbolo) de “0” o “1”, en función de la información de tipo de señal SE. La unidad 101 de binarización envía la señal binaria generada BIN al codificador 104 aritmético binario y la unidad 103 de control de contexto.
La unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo es una unidad de almacenamiento configurado con una memoria no volátil o similar, y almacena una tabla de información de señal y una pluralidad de tablas de contexto. En el presente documento, la pluralidad de tablas de contexto se genera y almacena por adelantado. La misma pluralidad de tablas de contexto se almacenan también en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolos que constituye un aparato de decodificación de imágenes de acuerdo con la realización 2 descrita más adelante. La unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo almacena además una tabla de probabilidad de ocurrencia (no mostrada) que indica un valor de una de las probabilidades de ocurrencia de símbolo PE que corresponde a la información de probabilidad pStateIdx.
La tabla de información de señal es la misma que una tabla de información de señal convencional mostrada en la figura 4, y almacena índices ctxIdx que indican contextos, probabilidades de ocurrencia pStateIdx y símbolos valMPS de manera asociada.
En el presente documento, la tabla de almacenamiento de las probabilidades de ocurrencia pStateIdx que son índices que indican las probabilidades de ocurrencia de símbolos PE y ctxIdx que indican los contextos de una manera asociada se utiliza como la tabla de información de la señal. Sin embargo, se observa que en su lugar se puede utilizar una tabla que almacena los contextos ctxIdx y los valores de probabilidad de ocurrencia de símbolos PE de una manera directamente asociada. En este caso, es posible manejar valores más finos que los valores administrados en la tabla representando los valores de las probabilidades de ocurrencia de símbolos PE, por ejemplo, con una precisión de 16 bits (0 - 65535), y de ese modo aumentar la eficiencia de codificación.
En la realización 1, la tabla de contexto se compone de una pluralidad de tablas en las que los contextos ctxIds se establecen de acuerdo a las condiciones. Los contextos ctxIds son los mismos que los índices ctxIds en la tabla de información de señal mencionada anteriormente. En el presente documento, cada una de la figura 5B y la figura 5C muestra un ejemplo de una tabla de contexto para usar en la Realización 1.
En la Tabla 3 de la figura 5B, (i) se establece un contexto ctxIds 0 para una condición 10 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, (ii) se establece un contexto ctxIds 1 para una condición 11 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, y (iii) se establece un contexto ctxIds 2 para las condiciones 12 y 13, cada una indicando una condición circundante correspondiente a componentes de alta frecuencia. Además, en la Tabla 4, (i) se establece un contexto ctxIds 3 para una condición 14 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, (ii) se establece un contexto ctxIds 4 para una condición 15 que indica la posición de un coeficiente correspondiente a un componente de baja frecuencia, y (iii) un contexto ctxIds 2 se establece para las condiciones 16 y 17, que indican cada uno una condición circundante correspondiente a componentes de alta frecuencia.
En el presente documento, el índice ctxIdx asociado con los componentes de alta frecuencia (las condiciones son 12 y 13) en la Tabla 3 y el índice ctxIdx asociado con los componentes de alta frecuencia (las condiciones son 16 y 17) en la Tabla 4 se establece para tener el mismo valor 2. De esta manera, el tamaño de bloque correspondiente a la Tabla 3 y el tamaño de bloque correspondiente a la Tabla 4 comparten el contexto para las señales de entrada SI correspondientes a componentes de alta frecuencia.
La tabla de contexto muestra en la figura 5C es un ejemplo de variación de la tabla de contexto mostrada en la figura 5B, y se compone de tres Tablas 5 a 7. La Tabla 5 y la Tabla 6 se utilizan para establecer contextos basados en tamaños de bloque. Específicamente, la Tabla 5 y la Tabla 6 corresponden a un tamaño de bloque A (por ejemplo, un tamaño de bloque pequeño de 4 x 4) y un tamaño de bloque B (por ejemplo, un tamaño de bloque pequeño de 8 x 8), respectivamente. Además, la Tabla 7 se usa para establecer un contexto compartido independientemente del tamaño de bloque de la señal de entrada IS y si la señal de entrada IS es un componente de baja frecuencia o un componente de alta frecuencia. Por ejemplo, la Tabla 7 corresponde a un tamaño de bloque grande tal como un tamaño de bloque C (por ejemplo, un tamaño de bloque de 16 x 16), un tamaño de bloque D (por ejemplo, un tamaño de bloque de 32 x 32) y un tamaño de bloque E (por ejemplo, un tamaño de bloque de 64 x 64). Las configuraciones para la Tabla 5 y la Tabla 6 son las mismas que para la Tabla 1 y la Tabla 2. En la Tabla 7, se establece un contexto ctxIds 18 para una condición 18 y un contexto ctxIds 19 para una condición 19.
Cabe notar en la realización 1 que las condiciones se determinan de acuerdo con una de (i) la información (una condición que rodea) de bits que rodean una señal de corriente que ha de codificarse en un macrobloque, (ii) la información relacionada con los bits ya sometido a la codificación aritmética en el macrobloque, y (iii) la posición del bit (información de posición, información de coeficiente) de la señal de corriente a codificar.
La unidad 103 de control de contexto ejecuta el procesamiento de control de contexto para identificar una probabilidad de símbolo PE para uso en el codificador 104 aritmético binario y actualización del procesamiento para actualizar la probabilidad de ocurrencia de símbolo PE.
Se da una descripción de procesamiento de control de contexto por la unidad 103 de control de contexto. La unidad 103 de control de contexto obtiene una señal de control CTRS que es la salida de una unidad 105 de control de clasificación de bloque de contexto que se describe más adelante, y obtiene una tabla para ser utilizado entre las tablas de contexto en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo. Además, la unidad 103 de control de contexto identifica el contexto ctxIdx correspondiente a la condición identificada en base a la información de tipo de señal SE, con referencia a la tabla identificada en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo.
A continuación, la unidad 103 de control de contexto obtiene una probabilidad de ocurrencia pStateIdx correspondiente al índice de ctxIdx con referencia a la tabla de información de la señal. La unidad 103 de control de contexto identifica una probabilidad de ocurrencia de símbolo PE para usar en el codificador 104 aritmético binario, con referencia a la tabla de probabilidad de ocurrencia almacenada en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, en base a la probabilidad de ocurrencia pStateIdx. Además, la unidad 103 de control de contexto hace que la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo emita la probabilidad PE de ocurrencia de símbolo identificada al codificador 104 aritmético binario.
A continuación, se da una descripción del procesamiento de actualización por la unidad 103 de control de contexto. El proceso de actualización por la unidad 103 de control de contexto se lleva a cabo basado en el estándar H.264. Más específicamente, la unidad 103 de control de contexto deriva una nueva probabilidad de ocurrencia de símbolo PE y un símbolo valMPS, basado en una señal binaria BIN que se ingresa desde la unidad 101 de binarización. La unidad 103 de control de contexto reemplaza, con el valor correspondiente a la nueva probabilidad de ocurrencia de símbolo PE, el valor de la probabilidad de ocurrencia pStateIdx correspondiente al contexto ctxIdx identificado en el procesamiento de control de contexto, en la tabla de información de señal mostrada en la figura 4 almacenado en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo.
El codificador 104 aritmético binario genera una señal OB de salida mediante la realización de la codificación aritmética en la entrada de señal digital de la unidad 101 de binarización, usando la probabilidad de símbolo de ocurrencia PE leídos de la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo por la unidad 103 de control de contexto, y emite la señal de salida generada OB.
En la realización 1, la unidad 105 de control de clasificación de bloque de contexto determina una tabla de entre las tablas de contexto en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo basado en la señal de tamaño del bloque BLKS y la información de tipo de señal SE, genera una señal de control CTRS que indica la tabla determinada, y envía la señal de control CTRS a la unidad 103 de control de contexto.
(Procedimiento de procesamiento en la realización 1)
A continuación, se da una descripción de la estructura de un procedimiento de codificación aritmética realizado por la unidad 100 de codificación aritmética de acuerdo con la Realización 1.
Aquí, la figura 6 es un diagrama de flujo que indica un procedimiento de procesamiento en un procedimiento de codificación aritmética de acuerdo con la presente invención. El procedimiento de codificación de imagen de acuerdo con la presente invención está configurado para incluir: una señal de corriente a codificar, que obtiene la etapa de obtener una señal de corriente a codificar de datos de imagen (Etapa S401); una etapa de binarización para generar una señal binaria binarizando la señal de corriente a codificar (Etapa S402); una etapa de selección de contexto de seleccionar un contexto para la señal de corriente a codificar (Etapa S403); una etapa de codificación aritmética para realizar la codificación aritmética de la señal binaria, utilizando información de probabilidad codificada asociada con el contexto seleccionado en la etapa de selección de contexto (Etapa S404); y una etapa de actualización para actualizar la información de probabilidad codificada asociada con el contexto seleccionado en la etapa de selección de contexto, basado en la señal binaria (Etapa S405), y seleccionar, en la etapa de selección de contexto, el contexto de la señal de corriente a codificar de modo que el contexto sea compartido por otra señal que se codificará incluida en una unidad de procesamiento que tiene un tamaño de unidad de procesamiento diferente del tamaño de una unidad de procesamiento que incluye la señal de corriente a codificar.
La figura 7 es un diagrama de flujo que indica, con más detalle, el esquema del procedimiento de procesamiento del procedimiento de codificación aritmética de acuerdo con la Realización 1. En el presente documento, el diagrama de flujo de la figura 7 indica el procesamiento de codificación aritmética realizado en una sola señal de entrada (una señal de corriente a codificar). La señal de entrada IS se genera para cada uno de los componentes de frecuencia de cada uno de los bloques de una imagen mediante transformación y cuantificación. Por lo tanto, la codificación aritmética de todo el bloque se completa cuando se ejecuta la codificación aritmética de todos los componentes de frecuencia.
Como se muestra en la figura 7, cuando se inicia la codificación aritmética, la unidad 105 de control de clasificación de bloque de contexto obtiene el tamaño de bloque de la señal de corriente a codificar, en base a una señal de tamaño de bloque BLKS (Etapa S110).
La unidad 101 de binarización obtiene la señal de entrada IS que es un objetivo de codificación y la información de tipo de señal SE (la etapa de obtención de la señal de corriente a ser codificada), y lleva a cabo de binarización basado en la información de tipo de señal de SE en la señal de entrada IS de acuerdo con el estándar H.264 para generar una señal binaria BIN (Etapa S120, la etapa de binarización). En el presente documento, la información de tipo de señal SE incluye información que indica un esquema de binarización.
A continuación, la unidad 105 de control de clasificación de bloque de contexto determina si utilizar o no un contexto compartido para diferentes tamaños de bloque, basado en el tamaño de bloque y la información de tipo de señal SE obtenido en la Etapa S110 (Etapa S130).
Cuando la unidad 105 de control de clasificación de bloque de contexto determina usar un contexto dedicado para un tamaño de bloque particular (No en la etapa S130), la unidad 105 de control de clasificación de bloque de contexto selecciona la tabla en la que el contexto dedicado para un tamaño de bloque particular entre las tablas de contexto en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, y emite una señal de control CTRS que indica la tabla a la unidad 103 de control de contexto (Etapa S140).
Por otro lado, cuando la unidad 105 de control de clasificación de bloque de contexto determina utilizar el contexto compartido para diferentes tamaños de bloque (Sí en la Etapa S130), la unidad 105 de control de clasificación de bloque de contexto selecciona la tabla en la que el contexto compartido de diferente tamaños de bloque se establecen entre las tablas de contexto en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, y emite una señal de control CTRS que indica la tabla a la unidad 103 de control de contexto (Etapa S150).
La unidad 103 de control de contexto determina la tabla de contexto correspondiente a la señal de entrada IS entre las tablas de contexto almacenadas en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, en base a la señal de control CTRS (Etapa S160).
La unidad 103 de control de contexto determina un contexto ctxIdx basado en una condición determinada en base a la información de tipo de señal SE, con referencia a la tabla de contexto seleccionado (el procesamiento desde la Etapa S130 a este punto corresponde a la etapa de selección contexto, y la unidad 105 de control de clasificación de bloque de contexto y la unidad 103 de control de contexto que ejecutan las etapas corresponden a la unidad de control de selección de contexto). Además, la unidad 103 de control de contexto identifica una probabilidad de ocurrencia de símbolo PE correspondiente al contexto ctxIdx, con referencia a la tabla de información de señal y la tabla de probabilidad de ocurrencia, lee la probabilidad de ocurrencia de símbolo identificada PE de la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, y emite la probabilidad de ocurrencia de símbolo de lectura PE al codificador 104 aritmético binario.
El codificador 104 aritmético binario genera una señal de salida OB mediante la realización de la codificación aritmética de la señal binaria basado en la probabilidad de símbolo de ocurrencia PE leída por la unidad 13 de control de contexto, y emite la señal de salida generada OB (Etapa S170, la etapa de codificación aritmética).
La unidad 103 de control de contexto ejecuta el proceso de actualización de la actualización de la probabilidad de ocurrencia de símbolo PE basado en la señal binaria generada por la unidad 101 de binarización (Etapa S180, la etapa de actualización).
A continuación, se proporcionan detalles de descripciones (correspondientes a las etapas S130 a S160) de las operaciones realizadas por la unidad 105 de control de clasificación de bloque de contexto, con referencia a la figura 8 a la figura 11).
En el presente documento, cada una de las figuras 8, la figura 9, la figura 10A y la figura 10B es un diagrama de flujo que indica un ejemplo de operaciones por la unidad 105 de control de clasificación de bloques de contexto de acuerdo con la Realización 1. Cada uno de (a) a (c) de la figura 11 es un diagrama esquemático que muestra las relaciones posicionales de coeficientes cuantificados en un bloque correspondiente de los bloques que tienen un tamaño de bloque de 8 x 8, 16 x 16 o 32 x 32.
(Ejemplo de operación 1)
En La figura 8, la unidad 105 de control de clasificación de bloque de contexto determina en primer lugar la posición del coeficiente basándose en la información de tipo de señal SE, y determina si la posición del coeficiente de la señal de entrada IS, que es la señal de corriente a codificar, está incluida en el área de baja frecuencia o en el área de alta frecuencia (Etapa S202).
En este caso, como se describió anteriormente, los coeficientes cuantificados corresponden a señales generadas al realizar la transformación de frecuencia y cuantificación en los datos de imagen, y las posiciones de los coeficientes corresponden a los componentes de frecuencia en la transformación de frecuencia. Por ejemplo, en el diagrama esquemático mostrado como cada uno de (a) a (c) en la figura 11, los coeficientes cuantificados correspondientes a los componentes de baja frecuencia están ubicados en la porción superior izquierda, y los coeficientes cuantificados correspondientes a los componentes de alta frecuencia están ubicados en la porción inferior derecha. Más específicamente, en un caso ejemplar donde una posición de coeficiente es una de las posiciones de coeficiente en un bloque 2 x 2 que incluye al menos un componente directo, en particular, un caso donde una posición de coeficiente es una de las posiciones mostradas como LFR en el diagrama esquemático mostrado como cada uno de (a) a (c) en la figura 11, se determina que la señal de entrada IS es un coeficiente correspondiente a un componente de baja frecuencia. En el caso en el que la posición del coeficiente es una de las posiciones del coeficiente mostradas como un símbolo distinto de LFR en cada uno de (a) a (c) en la figura 11, se determina que la señal de entrada IS es un coeficiente correspondiente a un componente de alta frecuencia.
En el caso en que la señal de entrada IS sea un coeficiente correspondiente al componente de baja frecuencia (SÍ en la etapa S202), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto en la que los contextos se establecen en función de los tamaños de bloque, y emite la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de baja frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las posiciones de los coeficientes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para la señal de entrada IS de acuerdo con el tamaño del bloque y la posición del coeficiente (Etapa S203).
Por otro lado, en el caso en que la señal de entrada IS sea un coeficiente correspondiente al componente de alta frecuencia (NO en la etapa S202), la unidad 105 de control de clasificación de bloque de contexto calcula una condición circundante de la señal de corriente a codificar (Etapa S204). El procedimiento para calcular la condición circundante se describe más adelante.
A continuación, la unidad 105 de control de clasificación de bloque de contexto determina si el tamaño de bloque de la señal de corriente a codificar es mayor que un tamaño predeterminado (Etapa S205).
En el caso en que el tamaño de bloque de la señal de entrada IS sea menor que, por ejemplo, un tamaño de bloque 16 x 16 (NO en la etapa S205), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto compartida para tamaños de bloque pequeño, y genera la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de alta frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las condiciones circundantes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para bloques de pequeño tamaño, en función de la condición circundante (Etapa S206).
En el caso en que el tamaño de bloque de la señal de entrada IS sea mayor que el tamaño predeterminado (SÍ en la etapa S205), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto compartida para tamaños de bloque grandes, y emite la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de alta frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las condiciones circundantes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para bloques de gran tamaño, en función de la condición circundante (Etapa S207).
Aquí, es posible aumentar aún más la eficiencia de codificación haciendo posible seleccionar tamaños de bloque de 16 x 16, 32 x 32 y 64 x 64 como tamaños de transformación de frecuencia, aunque, en H.264, solo los coeficientes cuantificados en bloques que tienen cada uno un tamaño de bloque de 4 x 4 u 8 x 8. Sin embargo, cuando aumenta el número de tamaños de bloque seleccionables, se establecen contextos demasiado finos para los tamaños de bloque respectivos. Por lo tanto, la frecuencia de uso de cada uno de los contextos disminuye significativamente. Por esta razón, se utiliza un contexto compartido para señales de entrada que tienen las mismas propiedades estadísticas, incluso cuando los tamaños de bloque son diferentes de acuerdo con el procedimiento mencionado anteriormente. Más específicamente, en el Ejemplo de operación 1, se comparte un contexto entre bloques grandes que tienen un tamaño de bloque grande y otro contexto se comparte entre bloques pequeños que tienen un tamaño de bloque pequeño de modo que, por ejemplo, el contexto para bloques pequeños se usa para bloques que tienen cada uno un tamaño de bloque 4 x 4 u 8 x 8, y el contexto para bloques grandes se usa para bloques que tienen cada uno un tamaño de bloque 16 x 16, 32 x 32 o 64 x 64. Esto hace posible realizar la codificación aritmética de los datos de la imagen utilizando las propiedades estadísticas adaptadas a las características de los datos de la imagen y, al mismo tiempo, aumentar la frecuencia de uso de cada uno de los contextos y aumentar así la eficiencia de la codificación. En el ejemplo anterior, es posible seleccionar un tamaño de bloque 4 x 4, 8 x 8, 16 x 16, 32 x 32 y 64 x 64 como tamaños en la transformación de frecuencia. Sin embargo, los tamaños seleccionables no están limitados a los mismos. Dichos tamaños seleccionables se pueden establecer arbitrariamente, por ejemplo, se pueden establecer tamaños de bloque 4 x 4, 8 x 8, 16 x 16 y 32 x 32.
(Ejemplo de operación 2)
En la figura 9, la unidad 105 de control de clasificación de bloque de contexto determina en primer lugar, basándose en la información de tipo de señal SE, una posición de coeficiente de una señal de entrada IS que es la señal de corriente a codificar, y determina si la señal de entrada IS está incluida en el área de baja frecuencia o en el área de alta frecuencia (Etapa S202). En el presente documento, el procedimiento de determinación es el mismo que en el Ejemplo de operación 1.
En el caso donde la señal de entrada IS es un coeficiente correspondiente a un componente de baja frecuencia (SÍ en la etapa S202), la unidad 105 de control de clasificación de bloque de contexto selecciona un conjunto de tabla de contexto para el tamaño de bloque, y emite la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de baja frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las posiciones de los coeficientes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto de acuerdo con el tamaño del bloque y la posición del coeficiente (Etapa S203).
Por otro lado, en el caso en que la señal de entrada IS sea un coeficiente correspondiente al componente de alta frecuencia (NO en la etapa S202), la unidad 105 de control de clasificación de bloque de contexto calcula una condición circundante de la señal de corriente a codificar (Etapa S204). El procedimiento para calcular la condición circundante se describe más adelante.
A continuación, la unidad 105 de control de clasificación de bloque de contexto determina si el tamaño de bloque de la señal de corriente a codificar es mayor que un tamaño predeterminado (Etapa S205).
En el caso en que el tamaño de bloque de la señal de entrada IS sea menor que, por ejemplo, un tamaño de bloque de 16 x 16 (NO en la etapa S205), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto para el tamaño de bloque, y genera la información como una señal de control CTRS. En otras palabras, una tabla de contexto para un bloque que tiene un tamaño de bloque 4 x 4 y una tabla de contexto para un bloque que tiene un tamaño de bloque 8 x 8 se seleccionan por separado. De acuerdo con lo anterior, la unidad 103 de control de contexto establece los diferentes contextos para los tamaños y condiciones de bloque respectivos (Etapa S216). En el caso de que el tamaño del bloque sea pequeño, las imágenes de entrada SI pueden tener diferentes características de imagen, como contenidos de datos de imagen detallados. Por lo tanto, es posible ejecutar una codificación aritmética adaptada más adecuadamente a las características de los datos de imagen realizando un ejemplo de variación como se muestra en la figura 9.
En el caso en que el tamaño de bloque de la señal de entrada IS sea mayor que el tamaño predeterminado (SÍ en la etapa S205), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto compartida para tamaños de bloque grandes, y envía la información como una señal de control CTRS. En otras palabras, una tabla de contexto compartida para bloques que tienen cada uno un tamaño de bloque de 16 x 16, 32 x 32 o 64 x 64 se determina como el contexto que se utilizará. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de alta frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las condiciones circundantes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para bloques de gran tamaño, en función de la condición circundante (Etapa S207).
En el ejemplo anterior, es posible seleccionar un tamaño de bloque de 4 x 4, 8 x 8, 16 x 16, 32 x 32 y 64 x 64 como tamaños en la transformación de frecuencia. Sin embargo, los tamaños seleccionables no están limitados a los mismos. Dichos tamaños seleccionables se pueden establecer arbitrariamente, por ejemplo, se pueden establecer tamaños de bloque de 4 x 4, 8 x 8, 16 x 16 y 32 x 32.
(Ejemplo de operación 3)
La figura 10A es un diagrama de flujo obtenido cambiando la etapa S202 y la etapa S205 en la figura 9. La figura 10A y la figura 9 muestran sustancialmente las mismas operaciones.
En la figura 10A, la unidad 105 de control de clasificación de bloque de contexto determina en primer lugar si el tamaño de bloque de la señal de entrada IS, que es una señal de corriente a codificar, es mayor que un tamaño predeterminado (correspondiente a la etapa S222 y S205 en la Figura 9). A continuación, se describe un caso supuesto en el que el tamaño predeterminado es el tamaño del bloque 8 de x 8.
En el caso donde el tamaño de bloque de la señal de entrada IS es menor que el tamaño predeterminado (NO en la etapa S222), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto para el tamaño de bloque y envía la información como una señal de control CTRS. Como se describe en el Esquema de la Realización 1, la Realización 1 supone un caso en el que no se realiza el intercambio de contexto para las señales de entrada SI incluidas en un bloque que tiene un tamaño de bloque pequeño y se establecen diferentes contextos para las señales de entrada SI en función de los tamaños de bloque respectivos y condiciones. En otras palabras, los contextos para los bloques pequeños se determinan sustancialmente en función de los tamaños de bloque respectivos y las posiciones de coeficiente respectivas. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece diferentes contextos para los tamaños de bloque respectivos y las posiciones de coeficiente (Etapa S223).
Por otro lado, en el caso en que el tamaño de bloque de la señal de entrada IS sea mayor que el tamaño predeterminado (SI en la etapa S222), la unidad 105 de control de clasificación de bloque de contexto calcula una condición circundante para que la señal de corriente sea codificada (Etapa S224). El procedimiento para calcular la condición circundante se describe más adelante.
A continuación, la unidad 105 de control de clasificación de bloque de contexto determina si la señal de entrada IS es un coeficiente cuantificado correspondiente a un componente de baja frecuencia o un coeficiente cuantificado correspondiente a un componente de alta frecuencia (correspondiente a la etapa S225 y a la etapa S202 en la figura 9).
En el caso en que la señal de entrada IS sea una señal correspondiente al componente de baja frecuencia (SÍ en la etapa S225), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto en la que se establece el contexto para el tamaño de bloque, y emite la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de baja frecuencia se establecen adicionalmente en función de las condiciones determinadas respectivamente en función de las posiciones de los coeficientes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece contextos de acuerdo con las posiciones de los coeficientes y los tamaños de bloque (Etapa S226).
En el caso en que la señal de entrada IS sea una señal correspondiente a un componente de alta frecuencia (No en la etapa S225), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto compartida para tamaños de bloque grandes, y envía la información como un señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de alta frecuencia se establecen para las condiciones determinadas respectivamente en función de las condiciones circundantes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para bloques de gran tamaño, en función de la condición circundante (Etapa S227).
En el ejemplo anterior, es posible seleccionar un tamaño de bloque de 4 x 4, 8 x 8, 16 x 16, 32 x 32 y 64 x 64 como tamaños en la transformación de frecuencia. Sin embargo, los tamaños seleccionables no están limitados a los mismos. Tales tamaños seleccionables se pueden establecer arbitrariamente, por ejemplo, se pueden configurar tamaños de bloque de 4 x 4, 8 x 8, 16 x 16 y 32 x 32.
(Ejemplo de operación 4)
La figura 10B es un diagrama de flujo en el caso en que se utiliza un contexto compartido para las señales de entrada SI, cada una correspondiente a un tamaño de bloque grande, independientemente de si cada una de las señales de entrada SI es un componente de baja frecuencia o un componente de alta frecuencia.
En la figura 10B, la unidad 105 de control de clasificación de bloque de contexto determina en primer lugar si el tamaño de bloque de la señal de entrada IS, que es una señal de corriente a codificar, es mayor que un tamaño predeterminado (correspondiente a la etapa S222 y S205 en la Figura 9). A continuación, se describe un caso supuesto en el que el tamaño predeterminado es el tamaño del bloque de 8 x 8.
En el caso en que el tamaño de bloque de la señal de entrada IS sea menor que el tamaño predeterminado (NO en la etapa S222), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto en la que se establece el contexto para el tamaño de bloque, y emite la información como una señal de control CTRS. En el presente documento, como con el Ejemplo de operación 3, el Ejemplo de operación 4 supone un caso en el que no se realiza el intercambio de contexto para las señales de entrada SI incluidas en un bloque que tiene un tamaño de bloque pequeño, y se establecen contextos para los tamaños y condiciones de bloque respectivos. En otras palabras, los contextos para los bloques pequeños se determinan sustancialmente en función de los tamaños de bloque respectivos y las posiciones de coeficiente respectivas. De acuerdo con lo anterior, la unidad 103 de control de contexto establece diferentes contextos para los tamaños de bloque respectivos y las posiciones de coeficiente (Etapa S233).
En el caso en el que el tamaño de bloque de la señal de entrada IS es mayor que el tamaño predeterminado (SÍ en la etapa S222), la unidad 105 de control de clasificación de bloque de contexto selecciona una tabla de contexto compartida para tamaños de bloque grandes, y envía la información como una señal de control CTRS. En el presente documento, en la tabla de contexto, los índices ctxIdx para los componentes de baja frecuencia se establecen más en función de las condiciones determinadas respectivamente en función de las posiciones de los coeficientes, y los índices ctxIdx para los componentes de alta frecuencia se establecen más en función de las condiciones determinadas respectivamente en función de las condiciones circundantes. De acuerdo con lo anterior, como resultado, la unidad 103 de control de contexto establece el contexto para bloques de gran tamaño, en base a la posición del coeficiente y la condición circundante (Etapa S234).
En el Ejemplo de Operación 4, como se mencionó anteriormente, el intercambio de contexto se realiza solo para tamaños de bloque grandes (en la Realización 4, los tamaños de bloque grandes son, por ejemplo, tamaños de bloque 16 x 16, 32 x 32, 64 x 64, etc. que son más grandes que el tamaño del bloque 8 x 8). En otras palabras, se seleccionan diferentes contextos para los respectivos tamaños de bloque pequeño. De esta manera, es posible seleccionar un contexto adaptado a las características de los datos de imagen, para cada uno de los bloques pequeños, cada uno de los cuales tiene un cambio comparativamente grande. Además, es posible aumentar la frecuencia de actualización de la probabilidad de ocurrencia del símbolo mediante el intercambio de contexto para bloques grandes, cada uno de los cuales tiene un cambio comparativamente pequeño, y de ese modo aumentar la eficiencia de codificación.
En el ejemplo anterior, es posible seleccionar un tamaño de bloque 4 x 4, 8 x 8, 16 x 16, 32 x 32 y 64 x 64 como tamaños en la transformación de frecuencia. Sin embargo, los tamaños seleccionables no están limitados a los mismos. Dichos tamaños seleccionables se pueden establecer arbitrariamente, por ejemplo, se pueden establecer tamaños de bloque 4 x 4, 8 x 8, 16 x 16 y 32 x 32.
(Cálculo de las condiciones circundantes)
Se proporciona una descripción detallada basada en la figura 11.
En cada uno de (a) a (c) de la figura 11, el área superior izquierda 4 x 4 LFR es un área de baja frecuencia correspondiente a una señal de un componente de baja frecuencia. En cada uno de los ejemplos de operación 1 a 3 descritos anteriormente, se selecciona una tabla de contexto para el tamaño de bloque. En la tabla de contexto seleccionada aquí, los índices que indican los contextos ctxIdx se establecen para condiciones determinadas en función de las posiciones de los coeficientes, y un contexto se determina de acuerdo con el tamaño del bloque y la posición del coeficiente.
Por otro lado, el área distinta del área LFR es un área de alta frecuencia correspondiente a una señal de un componente de alta frecuencia. En el presente documento, el área de alta frecuencia se segmenta aún más en un área parcial SUPERIOR correspondiente a la porción del extremo superior (la porción encerrada por líneas diagonales desde la parte superior derecha a la inferior izquierda), un área parcial IZQUIERDA correspondiente a la porción del extremo izquierdo (la porción encerrado por líneas diagonales desde la parte superior izquierda a la inferior derecha), y un área parcial HFR correspondiente al área restante (la porción encerrada al cruzar líneas diagonales).
Las condiciones circundantes se calculan para las tres áreas parciales respectivas.
Primero, se da una descripción del cálculo de la condición circundante del área parcial SUPERIOR. En el área parcial SUPERIOR, la condición circundante correspondiente a la posición del coeficiente mostrada como X en (d) de la figura 11 se determina en base al número de coeficientes cuantificados de coeficientes distintos de cero entre los coeficientes cuantificados en las posiciones de coeficientes adyacentes de a a d. En este caso, los valores de las condiciones circundantes son cinco tipos que van de 0 a 4. En el presente documento, los contextos se pueden establecer por separado para los cinco tipos respectivos de condiciones circundantes. Por ejemplo, es posible realizar la clasificación en tres grupos de (0), (1, 2) y (3, 4) y establecer tres contextos para los grupos respectivos. En la clasificación, se puede usar otra combinación y se puede generar un número arbitrario de grupo.
A continuación, se da una descripción del cálculo de la condición circundante de la zona parcial IZQUIERDA. En el área parcial IZQUIERDA, la condición circundante correspondiente a la posición del coeficiente mostrada como X en (e) de la figura 11 se determina basándose en el número de coeficientes cuantificados de coeficientes distintos de cero entre los coeficientes cuantificados en las posiciones de coeficientes adyacentes e a f. En este caso, los valores de las condiciones circundantes son cinco tipos que van de 0 a 4. Como en el caso del área parcial SUPERIOR, los contextos se pueden establecer por separado para los cinco tipos respectivos de condiciones circundantes. Por ejemplo, es posible realizar la clasificación en tres grupos de (0), (1, 2) y (3, 4) y establecer tres contextos para los grupos respectivos. En la clasificación, se puede usar otra combinación y se puede generar un número arbitrario de grupo.
A continuación, se da una descripción del cálculo de la condición circundante de la HFR área parcial. En el área parcial HFR, la condición circundante correspondiente a la posición del coeficiente que se muestra como X en (f) de la figura 11 se determina basándose en el número de coeficientes cuantificados de coeficientes distintos de cero entre los coeficientes cuantificados en las posiciones de coeficientes adyacentes i a s. En este caso, los valores de las condiciones circundantes son doce tipos que van de 0 a 11. Como en el caso del área parcial SUPERIOR y el área parcial IZQUIERDA, los contextos pueden establecerse por separado para los doce tipos respectivos de condiciones circundantes. Por ejemplo, es posible realizar la clasificación en cinco grupos de (0), (1, 2), (3, 4), (5, 6) y (7, 8, 9, 10, 11) y establecer cinco contextos para los respectivos grupos. En la clasificación, se puede usar otra combinación y se puede generar un número arbitrario de grupo.
Las condiciones circundantes calculadas de acuerdo con el procedimiento mencionado anteriormente se representan, en común, como el número de coeficientes distintos de cero localizados en las posiciones de los coeficientes adyacentes. Por lo tanto, es posible obtener con precisión la información estadística sin depender de los tamaños de bloque, incluso cuando los tamaños de bloque son diferentes. Por esta razón, es posible realizar el intercambio de contextos independientemente de los tamaños de bloque, y aumentar la eficiencia de codificación utilizando el pequeño número de contextos.
Debe observarse que la información que indica la combinación de contextos puede registrarse en la porción inicial (encabezado de transmisión de flujos) en un flujo de bits. De esta manera, es posible cambiar la combinación de contextos de acuerdo con las características de los datos de imagen, y de ese modo esperar un aumento adicional en la eficiencia de codificación.
Además, la información que indica si se usa o no el mismo contexto para bloques que tienen diferentes tamaños de bloque puede registrarse en la porción inicial (encabezado de transmisión de flujos) de un flujo de bits. De esta manera, es posible cambiar la combinación de contextos de acuerdo con las características de los datos de imagen, y de ese modo esperar un aumento adicional en la eficiencia de codificación.
Debe observarse que la unidad de grabación en el encabezado puede ser una unidad correspondiente a un corte o una imagen. En este caso, es posible realizar un control más fino que el control en el caso de registrar la información en unidades de una transmisión de flujo, y de ese modo esperar un aumento adicional en la eficiencia de codificación.
(Ejemplo de variación de la unidad de control de clasificación de bloque de contexto)
La realización 1 describe un caso de establecer diferentes contextos para señales de entrada SI de componentes de baja frecuencia correspondientes a un tamaño de bloque pequeño y un tamaño de bloque grande y establecer un contexto compartido para señales de entrada SI de componentes de alta frecuencia correspondientes a un tamaño de bloque grande . Sin embargo, en el caso de tamaños de bloque grandes, también es bueno segmentar datos de imagen en subbloques (que tienen un tamaño de bloque pequeño) que tienen el mismo tamaño (correspondiente a la etapa de segmentación), y establecer una tabla de contexto para tamaños de bloque pequeños que es para cada uno de los subbloques. En otras palabras, el contexto es compartido por el subbloque y los bloques que tienen el mismo tamaño de bloque pequeño que el del subbloque.
Más específicamente, por ejemplo, un bloque que tiene un tamaño de bloque grande de 16 x 16 se segmenta en dieciséis subbloques de 4 x 4, y el contexto que se usa para los bloques que tienen un tamaño de bloque pequeño de 4 x 4 que se aplica a la codificación aritmética para los respectivos subbloques.
En este caso, la unidad 101 de binarización genera una señal binaria ejecutando la binarización en cada uno de los subbloques. El codificador 104 aritmético binario realiza la codificación aritmética de la señal binaria de cada uno de los subbloques.
Con esta estructura, es posible utilizar la tabla de contexto para tamaños de bloque pequeños también para los tamaños de bloque grandes. Como resultado, es posible realizar un intercambio de contexto entre los tamaños de bloque grandes y los tamaños de bloque pequeños.
(Estructura general del aparato de codificación de imágenes)
La unidad 100 de codificación aritmética de acuerdo con la realización 1 está incluida en un aparato de codificación de imágenes que codifica los datos de imagen de compresión.
El aparato 200 de codificación de imagen comprime códigos de datos de imagen. Por ejemplo, el aparato 200 de codificación de imagen recibe, como señales de entrada, los datos de imagen en unidades de un bloque. El aparato 200 de codificación de imagen genera una señal codificada realizando una transformación y cuantificación en y una codificación de longitud variable de cada una de las señales de entrada.
En el presente documento, la figura 12 es un diagrama de bloques que muestra un ejemplo de la estructura del aparato 200 de codificación aritmética que incluye la unidad 100 de codificación aritmética de acuerdo con la Realización 1. Como se muestra en la figura 12, el aparato 200 de codificación de imágenes incluye: un restador 205; una unidad 210 de transformación y cuantificación; una unidad 220 de codificación de entropía (correspondiente a la unidad 100 de codificación aritmética en la figura 3); una cuantificación inversa y una unidad 230 de transformación inversa; un sumador 235; un filtro 240 de desbloqueo; una memoria 250; una unidad 260 de intrapredicción; una unidad 270 de estimación de movimiento; una unidad 280 de compensación de movimiento; y un intra/inter conmutador 290.
El aparato 200 de codificación de imagen recibe, como las señales de entrada, los datos de imagen en unidades de un bloque.
El restador 205 calcula una diferencia, específicamente un error de predicción entre cada una de las señales de entrada y una correspondiente de las señales de predicción.
La unidad 210 de transformación y cuantificación genera coeficientes de transformación en un área de frecuencia transformando el error de predicción en un dominio espacial. Por ejemplo, la unidad 210 de transformación y cuantificación genera coeficientes de transformación realizando una Transformación discreta de coseno (DCT) en el error de predicción. Además, la unidad 210 de transformación y cuantificación genera coeficientes de transformación cuantificando los coeficientes de transformación (este proceso corresponde a la etapa de transformación de frecuencia).
La unidad 220 de codificación de entropía está configurada con la unidad 100 de codificación aritmética que se muestra en la figura 3, y genera la señal codificada realizando una codificación de longitud variable de cada uno de los coeficientes cuantificados. Además, la unidad 220 de codificación de entropía codifica los datos de movimiento (por ejemplo, un vector de movimiento) estimados por la unidad 270 de estimación de movimiento, agrega los datos de movimiento a la señal codificada y emite la señal codificada. Más específicamente, la unidad 100 de codificación aritmética que constituye la unidad 220 de codificación de entropía recibe cada uno de los coeficientes cuantificados como la señal de entrada IS, y realiza la binarización y codificación aritmética del coeficiente cuantificado. Además, la información de tipo de señal SE es información que indica los datos de movimiento mostrados en la figura 12, dirección de intra predicción y/o similar utilizada por la unidad 260 de intrapredicción que se describe más adelante, además de la posición del coeficiente del coeficiente cuantificado.
La unidad 230 de cuantificación inversa y de transformación inversa reconstruye cada uno de los coeficientes de transformación realizando una cuantificación inversa de la salida del coeficiente cuantificado por la unidad 210 de transformación y cuantificación. Además, la unidad 230 de cuantificación inversa y de transformación inversa reconstruye un error de predicción realizando una transformación inversa en el coeficiente de transformación reconstruido. En el presente documento, el error de predicción reconstruido ha sufrido una pérdida parcial de información a través de la cuantificación, y por lo tanto no coincide completamente con el error de predicción generado por el restador 205. En otras palabras, los errores de predicción reconstruidos incluyen un error de cuantificación.
El sumador 235 genera imágenes decodificadas locales al agregar cada uno de los errores de predicción reconstruidos y una señal correspondiente de las señales de predicción.
El filtro 240 de desbloqueo realiza el filtrado de desbloqueo en cada una de las imágenes decodificadas locales generadas.
La memoria 250 es una memoria para almacenar imágenes de referencia para uso en compensación de movimiento. Más específicamente, la memoria 250 almacena imágenes decodificadas locales sujetas al filtrado de desbloqueo.
La unidad 260 de intrapredicción genera señales de predicción (señales de intrapredicción) realizando intrapredicciones. Más específicamente, la unidad 260 de intrapredicción genera una señal de intrapredicción realizando una intrapredicción con referencia a las imágenes que rodean un bloque actual para decodificar (señal de entrada) en la imagen decodificada local generada por el sumador 235.
La unidad 270 de estimación de movimiento estima los datos de movimiento (por ejemplo, el vector de movimiento) entre cada una de las imágenes señales de entrada y la imagen de referencia de la misma almacenados en la memoria 250.
La unidad 280 de compensación de movimiento genera una señal de predicción (una señal entre predicciones) realizando una compensación de movimiento basada en los datos de movimiento estimados.
El conmutador intra/inter 290 selecciona una de la señal de intrapredicción y la señal de interpredicción, y emite la señal seleccionada como la señal de predicción para el restador 205 y el sumador 235.
Con esta estructura, el aparato 200 de codificación de imagen de acuerdo con la Realización 1 codifica por compresión los datos de imagen.
La unidad 100 aritmética de codificación y el procesamiento llevado a cabo de este modo en el aparato de codificación de imágenes y el procedimiento de codificación de imágenes de acuerdo con la realización 1 están configurados para aplicar el mismo contexto a los datos de imagen que tienen las mismas propiedades estadísticas incluso cuando los tamaños de bloque son diferentes. Por lo tanto, se reduce el número de contextos, lo que hace posible reducir el tamaño de la memoria. Además, en general, tamaños de bloque grandes de es menos probable que ocurran 16 x 16 o mayores que los tamaños de bloque pequeños como 4 x 4, 8 x 8 y similares. Por esta razón, es posible aumentar la precisión de las clasificaciones con una baja precisión en la probabilidad de ocurrencia de símbolos PE al compartir el contexto para los tamaños de bloque grandes que tienen menos probabilidades de ocurrir. En otras palabras, es posible reflejar la información estadística más adecuadamente a las probabilidades de ocurrencia de símbolos PE en su conjunto. Por lo tanto, es posible aumentar la eficiencia de codificación.
[Realización 21
La realización 2 de un procedimiento de decodificación de imágenes y un aparato de decodificación de imágenes de acuerdo con la presente invención se describen con referencia a la figura 13 a la figura 16.
El procedimiento de decodificación de imagen de acuerdo con la presente invención se refiere particularmente a un procedimiento de decodificación aritmética como un ejemplo de una decodificación de la entropía, en la decodificación de compuesto de longitud variable de decodificación (tales como decodificación de entropía), la cuantificación inversa y transformación inversa, la predicción y similar en una señal de corriente para decodificar datos de imagen codificados. Además, el aparato de decodificación de imágenes de acuerdo con la presente invención está configurado para incluir una unidad de decodificación aritmética (unidad de decodificación de entropía) que ejecuta el procedimiento de decodificación aritmética mencionado anteriormente, una unidad de transformación y cuantificación y una unidad de predicción. La estructura general del aparato de decodificación de imágenes se describe más adelante.
(Esquema de la realización 2)
En primer lugar, se describe el esquema de un procedimiento de decodificación aritmética y una unidad de decodificación aritmética de acuerdo con la realización 2. En el presente documento, como en la Realización 1, se da una descripción de un caso en el que una señal que indica si uno actual de los coeficientes cuantificados de los componentes de frecuencia generados a través de la transformación y cuantificación es un coeficiente cero o un coeficiente distinto de cero se ingresa como un flujo de entrada IS a la unidad de decodificación aritmética.
Como se describe en la Realización 1, en la Realización 2, (i) en el caso de los flujos de entrada IS de componentes de alta frecuencia en bloques grandes que tienen cada uno un gran tamaño de bloque, el contexto que se establece para la misma condición es parcial o completamente compartido entre los bloques grandes que tienen las mismas propiedades estadísticas incluso cuando los tamaños de bloque son diferentes, y (ii) en el caso del flujo de entrada IS de componentes de baja frecuencia en el bloque que tiene un tamaño de bloque grande y el flujo de entrada IS de componentes de baja frecuencia en el bloque que tienen un tamaño de bloque pequeño, los contextos se establecen para los tamaños y condiciones de bloque respectivos sin compartir el contexto entre los bloques, incluso cuando las condiciones son las mismas.
De esta manera, es posible decodificar apropiadamente los datos de imagen codificados, codificados de manera más eficiente que la imagen codificada en la Realización 1.
En el caso en el que, en la Realización 1, se utiliza un contexto compartido para los flujos de entrada IS cada uno correspondiente a un tamaño de bloque grande independientemente de si cada uno de los flujos de entrada IS corresponde a un componente de baja frecuencia o un componente de alta frecuencia, el procedimiento de decodificación de imagen y el aparato de decodificación de imagen en la Realización 2 pueden usar el contexto compartido para los flujos de entrada IS correspondientes al tamaño de bloque grande. El procedimiento de selección de objetivos para compartir el contexto se establece preferiblemente de acuerdo con el procedimiento de selección en el procedimiento de codificación de imagen y el aparato de codificación de imagen en la Realización 1.
(Estructura de la unidad de decodificación aritmética en la realización 2)
A continuación, se ofrece una descripción de la estructura de la unidad de decodificación aritmética que realiza el procedimiento de decodificación aritmética de acuerdo con la realización 2.
En el presente documento, la figura 13 es un diagrama de bloques que muestra un ejemplo de la estructura de la unidad 300 de decodificación aritmética de acuerdo con la Realización 2.
Como se muestra en la figura 13, la unidad 300 de decodificación aritmética incluye un decodificador 301 aritmético binario, una unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo, una unidad 303 de control de contexto, una unidad 304 de conversión de valores múltiples y una unidad 305 de control de clasificación de bloque de contexto.
La unidad 300 de decodificación aritmética reconstruye los datos de imagen codificados mediante la ejecución de una decodificación aritmética de la corriente de entrada es que es una señal de corriente a ser decodificado de los datos de imagen codificados, y emite los datos de imagen reconstruida codificados. En la Realización 2, la unidad 300 de decodificación aritmética recibe, como entradas, el flujo de entrada IS, la información del tipo de señal SE que indica el tipo del flujo de entrada IS, y una señal de tamaño de bloque BLKS que indica el tamaño de bloque de la señal de entrada IS.
Se supone que el flujo de entrada IS en la Realización 2 es una señal OB que se emite desde la unidad 100 de codificación aritmética en la Realización 1.
Además, la información de tipo de señal SE es información que indica las propiedades del flujo de entrada IS, que es la señal de corriente a decodificar de los datos de imagen codificados. Más específicamente, la información de tipo de señal en la Realización 2 es la misma que la información de tipo de señal SE de acuerdo con la realización 1. En el presente documento, se da una descripción suponiendo un caso en el que la información de tipo de señal SE indica posiciones de coeficientes y condiciones circundantes. La información de tipo de señal SE puede ser datos de movimiento o información que indica una dirección de intrapredicción o similar que es utilizada por la unidad 450 de intrapredicción del aparato 400 de decodificación de imágenes mostrado en la figura 16 descritos más adelante.
Como en la Realización 1, la Realización 2 está configurada para recibir señales de tamaño de bloque BLKS, suponiendo que los contextos están configurados adecuadamente para tamaños de bloque. Sin embargo, es posible configurar una realización que no utiliza tales señales de tamaño de bloque BLKS en el caso de establecer contextos de acuerdo con otras características de los datos de imagen.
El decodificador 301 aritmético binario genera una señal binaria OBIN realizando la decodificación aritmética del flujo de entrada IS usando probabilidad de ocurrencia de símbolo PE que es información de probabilidad decodificada leída de la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo por la unidad 303 de control de contexto descrita más tarde.
La unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo es una unidad de almacenamiento configurada con una memoria no volátil o similar, y almacena una tabla de información de señal y una pluralidad de tablas de contexto. La unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo almacena además una tabla de probabilidad de ocurrencia (no mostrada) que indica un valor de una de las probabilidades de ocurrencia de símbolo PE que corresponde a la información de probabilidad pStateIdx.
La tabla de información de señal es la misma que una tabla de información de señal convencional mostrada en la figura 4, y almacena índices ctxIdx, probabilidades de ocurrencia pStateIdx y símbolos valMPS de manera asociada. En el presente documento, como en la Realización 1, también es bueno usar, como la tabla de información de señal, una tabla en la que los contextos ctxIdx y los valores de las probabilidades de ocurrencia de símbolos PE están directamente asociados uno a uno con cada uno.
Como en la Realización 1, la tabla de contexto está compuesta por una pluralidad de tablas en las que los contextos ctxIds se establecen de acuerdo con las condiciones. Los detalles de la tabla de contexto son los mismos que en la Realización 1.
La unidad 303 de control de contexto ejecuta el procesamiento de control de contexto para identificar una probabilidad de símbolo PE para uso en el decodificador 301 aritmético binario y actualiza procesamiento para la actualización de las probabilidades de ocurrencia de símbolo PE en la unidad 302 de almacenamiento probabilidad símbolo ocurrencia.
Se da una descripción de procesamiento de control de contexto por la unidad 303 de control de contexto. La unidad 303 de control de contexto obtiene una señal CTRS de control que es emitida de una unidad 305 de contexto bloque de control de clasificación que se describe más adelante, y obtiene una tabla para ser utilizada entre las tablas de contexto en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo. Además, la unidad 303 de control de contexto identifica el contexto ctxIdx correspondiente a la condición identificada en base a la información de tipo de señal SE, con referencia a la tabla identificada en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo.
A continuación, la unidad 303 de control de contexto obtiene una probabilidad de ocurrencia pStateIdx correspondiente al índice de ctxIdx con referencia a la tabla de información de la señal. La unidad 303 de control de contexto identifica una probabilidad de ocurrencia de símbolo PE para usar en el decodificador 301 aritmético binario, con referencia a la tabla de probabilidad de ocurrencia almacenada en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo, en base a la probabilidad de ocurrencia pStateIdx. Además, la unidad 303 de control de contexto hace que la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo emita la probabilidad de ocurrencia de símbolo identificada PE al decodificador 301 aritmético binario.
A continuación, se ofrece una descripción de procesamiento de actualización de la unidad 303 de control de contexto. La actualización de procesamiento por la unidad 303 de control de contexto se lleva a cabo basado en el estándar H.264. Más específicamente, la unidad 303 de control de contexto deriva una nueva probabilidad de ocurrencia de símbolo PE y un símbolo valMPS basado en el flujo de entrada IS. La unidad 303 de control de contexto reemplaza, con el valor correspondiente a la nueva probabilidad de ocurrencia de símbolo PE, el valor de la probabilidad de ocurrencia pStateIdx correspondiente al contexto ctxIdx identificado en el procesamiento de control de contexto, en la tabla de información de señal almacenada en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo.
La unidad 304 de conversión de valores múltiples reconstruye los datos de imagen realizando una conversión de valores múltiples en la señal binaria OBIN generada por el decodificador 301 aritmético binario. El esquema de conversión de valores múltiples se determina en base a la información de tipo de señal SE.
Como en la Realización 1, en la Realización 2, la unidad 305 de control de clasificación de bloque de contexto determina una tabla entre las tablas de contexto en la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo en base a la señal de tamaño de bloque BLKS y la información de tipo de señal SE, genera una señal de control CTRS que indica la tabla determinada, y emite la señal de control CTRS a la unidad 103 de control de contexto.
(Procedimiento de procesamiento en la realización 2)
A continuación, se ofrece una descripción de la estructura de un procedimiento de decodificación aritmética realizada por la unidad 300 de decodificación aritmética de acuerdo con la realización 2.
En el presente documento, la figura 14 es un diagrama de flujo que indica un procedimiento de procesamiento en un procedimiento de decodificación aritmética de acuerdo con la presente invención. El procedimiento de decodificación de imágenes de acuerdo con la presente invención está configurado para incluir: una señal de corriente a decodificar obteniendo la etapa de obtener una señal de corriente a decodificar datos de imagen codificados (Etapa S501); una etapa de selección de contexto de seleccionar un contexto de la señal de corriente a decodificar entre una pluralidad de contextos (Etapa S502); una etapa de decodificación aritmética para generar una señal binaria al realizar una decodificación aritmética de la señal de corriente que se va a decodificar mediante el uso de información de probabilidad decodificada asociada con el contexto seleccionado en la etapa de selección de contexto (Etapa S503), una etapa de conversión de valores múltiples de reconstrucción de datos de imagen mediante la conversión de valores múltiples en la señal binaria (Etapa S504); y una etapa de actualización para actualizar la información de probabilidad decodificada asociada con el contexto seleccionado en la etapa de selección de contexto (Etapa S505), y seleccionar, en la etapa de selección de contexto, un contexto para que la señal de corriente se decodifique también como contexto para otro señal a decodificar incluida en una unidad de procesamiento que tiene un tamaño diferente del tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar.
La figura 15 es un diagrama de flujo que indica, con más detalle, el esquema del procedimiento de procesamiento del procedimiento de decodificación aritmética de acuerdo con la Realización 2. El diagrama de flujo de la figura 15 muestra una decodificación aritmética de un flujo de entrada de señal SI (una señal de corriente a decodificar).
Como se muestra en la figura 15, cuando se inicia la decodificación aritmética, la unidad 305 de control de clasificación de bloque de contexto obtiene el tamaño de bloque de la señal de corriente a decodificar, en base a la señal de tamaño de bloque BLKS (Etapa S301).
A continuación, la unidad 305 de control de clasificación de bloque de contexto determina si utilizar o no un contexto compartido para diferentes bloques de tamaños, en función del tamaño del bloque y la información de tipo de señal SE obtenido en la Etapa S301 (Etapa S302).
Cuando la unidad 305 de control de clasificación de bloque de contexto determina usar el contexto para el tamaño de bloque (NO en la etapa S302), la unidad 305 de control de clasificación de bloque de contexto selecciona la tabla en la que se establece el contexto para el tamaño de bloque y genera una señal de control CTRS que indica la tabla a la unidad 303 de control de contexto (Etapa S303).
Por otro lado, cuando la unidad 305 de control de clasificación de bloque de contexto determina usar el contexto compartido para el tamaño de bloque (SÍ en la etapa S302), la unidad 305 de control de clasificación de bloque de contexto selecciona la tabla en la que el contexto compartido para el tamaño de bloque se establece entre las tablas de contexto en la unidad 102 de almacenamiento de probabilidad de ocurrencia de símbolo, y emite una señal de control CTRS que indica la tabla a la unidad 303 de control de contexto (Etapa S304).
Las operaciones detalladas la unidad 305 de control de clasificación de bloque de contexto son los mismos que en los ejemplos de funcionamiento 1 a 3 en la Realización 1.
La unidad 303 de control de contexto determina la tabla de contexto correspondiente a la flujo de entrada IS de entre las tablas de contexto almacenadas en la unidad 302 de símbolo ocurrencia de almacenamiento de probabilidad, en base a los CTRS señal de control (etapa S305).
La unidad 303 de control de contexto determina un contexto ctxIdx basado en una condición determinada en base a la información de tipo de señal SE, con referencia a la tabla de contexto seleccionada (el procesamiento desde la Etapa S302 hasta este punto correspondiente a la etapa de selección de contexto, y la unidad 305 de control de clasificación de bloque de contexto y la unidad 303 de control de contexto que ejecutan las etapas corresponden a la unidad de control de selección de contexto). Además, la unidad 303 de control de contexto identifica una probabilidad de ocurrencia de símbolo PE correspondiente al contexto ctxIdx, con referencia a la tabla de información de señal y la tabla de probabilidad de ocurrencia, lee la probabilidad de ocurrencia de símbolo identificada PE de la unidad 302 de almacenamiento de probabilidad de ocurrencia de símbolo, y emite la probabilidad de ocurrencia de símbolo de lectura PE al decodificador 301 aritmético binario.
El decodificador 301 aritmético binario obtiene la señal de corriente a decodificar del flujo de entrada IS (la señal de corriente a la etapa de obtención decodificada), y obtiene la probabilidad de ocurrencia de símbolo PE (información de probabilidad decodificada) identificada por la unidad 303 de control de contexto. El decodificador 301 aritmético binario genera una señal de salida binaria OBIN ejecutando una decodificación aritmética de la señal de corriente a decodificar usando la probabilidad de ocurrencia de símbolo obtenida PE (información de probabilidad decodificada) de acuerdo con el Estándar H.264 (Etapa S306, la etapa de decodificación aritmética).
La unidad 303 de control de contexto ejecuta la actualización de procesamiento de la actualización de la probabilidad de ocurrencia de símbolo PE en base a la señal binaria OBIN generada por el decodificador 301 aritmético binario (Etapa S307, la etapa de actualización). El procedimiento de ejecución en el proceso de actualización es el mismo que en el proceso de actualización de acuerdo con la Realización 1.
La unidad 304 de conversión de valores múltiples reconstruye los datos de la imagen realizando una conversión de valores múltiples en la señal binaria OBIN (Etapa S308, la etapa de conversión de valores múltiples).
(Ejemplo de variación de la unidad de control de clasificación de bloque de contexto)
Por ejemplo, en el caso en el que el procedimiento de codificación aritmética y el aparato de codificación aritmética de acuerdo con la realización 1 están configurados para segmentar un bloque que tiene un tamaño de bloque grande en subbloques (que tienen un tamaño de bloque pequeño) que tienen el mismo tamaño y use un contexto para tamaños de bloque pequeños que es para cada uno de los subbloques, es preferible que el procedimiento de decodificación aritmética y el aparato de decodificación aritmética de acuerdo con la Realización 2 estén configurados para segmentar un bloque que tiene un tamaño de bloque grande en subbloques (que tiene un tamaño de bloque pequeño) que tiene el mismo tamaño y usar un contexto para tamaños de bloque pequeños que es para cada uno de los subbloques.
Más específicamente, por ejemplo, en el caso en que el aparato de codificación aritmética segmenta un bloque que tiene un tamaño de bloque grande de 16 x 16 en subbloques que tienen un tamaño de bloque pequeño de 4 x 4 y ejecuta la codificación aritmética de cada uno de los subbloques, El contexto que se utiliza para los bloques que tienen el tamaño de bloque pequeño de 4 x 4 se aplica a la decodificación aritmética de cada uno de los subbloques.
En este caso, la unidad 300 de decodificación aritmética ejecuta la decodificación aritmética de cada uno de los subbloques para reconstruir los subbloques que tienen el tamaño de bloque grande, y emite los subbloques reconstruidos a la unidad 420 de cuantificación inversa y de transformación inversa.
Con esta estructura, es posible utilizar la tabla de contexto para tamaños de bloque pequeños también para el tamaño de bloque grande. Como resultado, es posible realizar un intercambio de contexto entre el bloque grande que tiene el tamaño de bloque grande y los bloques pequeños que tienen el tamaño de bloque pequeño.
(Estructura general del aparato de decodificación de imágenes)
La unidad 300 de decodificación aritmética de acuerdo con la realización 2 está incluido en un aparato de decodificación de imágenes que descodifica los datos de imagen de compresión-codificada.
El aparato 400 de decodificación de imagen decodifica los datos de imagen codificados por compresión. Por ejemplo, el aparato 400 de decodificación de imágenes recibe, como señales a decodificar, la imagen codificada en unidades de un bloque. El aparato 400 de decodificación de imagen reconstruye los datos de imagen realizando una decodificación de longitud variable, y cuantificación inversa y transformación inversa en las señales de entrada a decodificar.
En el presente documento, la figura 16 es un diagrama de bloques que muestra un ejemplo de la estructura de la unidad 400 de decodificación aritmética de acuerdo con la Realización 2 de la presente invención. Como se muestra en la figura 16, el aparato 400 de decodificación de imágenes incluye: una unidad 410 de decodificación de entropía, una unidad 420 de cuantificación inversa y de transformación inversa, un sumador 425, un filtro 430 de desbloqueo, una memoria 440, una unidad 450 de intrapredicción, una unidad 460 de compensación de movimiento, y un conmutador intra/inter 470.
El aparato 400 de decodificación de imagen recibe los datos de imagen codificados en unidades de un bloque como una señal de entrada (un flujo de entrada IS).
La unidad 410 de decodificación de entropía está configurada con la unidad 300 de decodificación aritmética mostrada en la figura 13 y reconstruye coeficientes cuantificados mediante la decodificación de longitud variable que implica la decodificación aritmética y la conversión de valores múltiples de las señales de entrada (flujos de entrada IS). En el presente documento, las señales de entrada (flujos de entrada IS) son señales a codificar y corresponden a datos en unidades de un bloque de datos de imagen codificados. Además, la unidad 410 de decodificación de entropía obtiene datos de movimiento de cada una de las señales de entrada, y emite los datos de movimiento obtenidos a la unidad 460 de compensación de movimiento.
La unidad 420 de transformación inversa y cuantificación inversa reconstruye los coeficientes de transformación mediante la realización de la cuantificación inversa de los coeficientes cuantificados reconstruido por la unidad 410 de entropía. Además, la unidad 420 de transformación inversa y cuantificación inversa reconstruye los errores de predicción mediante la realización de transformación inversa en los coeficientes de transformación reconstruidos, y emite los errores de predicción reconstruidos al sumador 425.
El sumador 425 genera una imagen decodificada al agregar el error de predicción reconstruido por la unidad 420 de cuantificación inversa y de transformación inversa y una señal de predicción que se describe más adelante, y emite la imagen decodificada generada al filtro 430 de desbloqueo y la unidad 450 de intrapredicción
El filtro 430 de desbloqueo realiza el desbloqueo de filtrado en la imagen decodificada generada por el sumador 425. La imagen decodificada se somete a la filtración de desbloqueo es emitida como una señal decodificada.
La memoria 440 es una memoria para almacenar imágenes de referencia para uso en compensación de movimiento. Más específicamente, la memoria 440 almacena imágenes decodificadas sujetas al filtrado de desbloqueo.
La unidad 450 de intrapredicción genera una señal de predicción (una señal de intrapredicción) realizando una intrapredicción. Más específicamente, la unidad 450 de intrapredicción genera una señal de intrapredicción al realizar una intrapredicción con referencia a las imágenes que rodean un bloque actual a decodificar (una señal de entrada) en la imagen decodificada generada por el sumador 425.
La unidad 460 de compensación de movimiento genera una señal de predicción (una señal entre predicciones) realizando una compensación de movimiento basada en la salida de datos de movimiento de la unidad 410 de decodificación de entropía.
El conmutador 470 intra/inter selecciona una de las señales intra predicción y la señal inter predicción, y envía la señal seleccionada como la señal de predicción al sumador 425.
Con esta estructura, el aparato 400 de decodificación de imagen de acuerdo con la Realización 2 decodifica los datos de imagen codificados por compresión.
Debe observarse que la Realización 1 puede configurarse para registrar información que indica si se usa o no un contexto compartido para bloques que tienen diferentes tamaños de bloque en una porción inicial (un encabezado de flujo) de un flujo de bits de la señal de salida OB, y que la Realización 2 puede configurarse de modo que la unidad 410 de decodificación de entropía obtenga la información como información de tipo de señal SE, y determine si usar una tabla de contexto para un tamaño de bloque o usar una tabla de contexto compartida. La unidad de grabación en el encabezado de transmisión de flujos se puede decodificar incluso cuando la unidad corresponde a un segmento o una imagen.
Como se describió anteriormente, como con la unidad 100 de codificación aritmética en la Realización 1, el aparato de decodificación de imágenes y el procedimiento de decodificación de imágenes de acuerdo con la realización 2 están configurados para aplicar el mismo contexto para datos de imágenes que tienen las mismas propiedades estadísticas incluso cuando los tamaños de bloque son diferentes y, por lo tanto, decodifican la imagen codificada en la Realización 1 de manera más apropiada y precisa. De acuerdo con lo anterior, el aparato de decodificación de imágenes y el procedimiento de decodificación de imágenes de acuerdo con la realización 2 de la presente invención también hacen posible reducir el número de contextos, aumentar la frecuencia de actualización de cada probabilidad de ocurrencia de símbolos PE que tiene una baja probabilidad de ocurrencia para aumentar la precisión de la probabilidad de ocurrencia del símbolo PE, y de ese modo aumentar la eficiencia de codificación.
Además, también es preferible que un aparato de codificación y decodificación de imágenes esté configurado para incluir el aparato de codificación de imágenes de acuerdo con la realización 1 y el aparato de decodificación de imágenes de acuerdo con la realización 2.
[Realización 31
El procedimiento de codificación de imágenes en movimiento (procedimiento de codificación de imágenes) o el procedimiento de decodificación de imágenes en movimiento (procedimiento de decodificación de imágenes) descrito en cualquiera de las realizaciones puede implementarse simplemente en un sistema informático independiente, grabando, en un medio de grabación, un programa para implementar las configuraciones del procedimiento de codificación de imágenes en movimiento y el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones. Los medios de grabación pueden ser cualquier medio de grabación siempre que se pueda grabar el programa, como un disco magnético, un disco óptico, un disco óptico magnético, una tarjeta IC y una memoria de semiconductores.
Se describirán a continuación, aplicaciones al procedimiento de codificación de imágenes en movimiento y al procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones y sistemas que usan los mismos. Cada uno de los sistemas se caracteriza por incluir un aparato de codificación y decodificación de imágenes compuesto por un aparato de codificación de imágenes que realiza un procedimiento de codificación de imágenes y un aparato de decodificación de imágenes que realiza un aparato de decodificación de imágenes. Los otros elementos estructurales en el sistema pueden modificarse apropiadamente para adaptarse a los casos.
La figura 17 ilustra una estructura general de un sistema que proporciona contenido ex100 para implementar servicios de distribución de contenido. El área para proporcionar servicios de comunicación se divide en celdas del tamaño deseado, y las estaciones base ex106, ex107, ex108, ex109 y ex110, que son estaciones inalámbricas fijas, se colocan en cada una de las celdas.
El sistema de suministro de contenido ex100 está conectado a dispositivos, tales como un ordenador ex111, un asistente digital personal (PDA) ex112, una cámara ex113, un teléfono móvil ex114 y una máquina de juegos ex115, a través de Internet ex101, un servicio de proveedor de Internet ex102, una red telefónica ex104, así como las estaciones base ex106 a ex110.
Sin embargo, la configuración del sistema que proporciona contenido ex100 no se limita a la configuración mostrada en la figura 17, y una combinación en la que cualquiera de los elementos están conectados es aceptable. Además, cada dispositivo puede conectarse directamente a la red telefónica ex104, en lugar de a través de las estaciones base ex106 a ex110, que son las estaciones inalámbricas fijas. Además, los dispositivos pueden estar interconectados entre sí a través de una comunicación inalámbrica de corta distancia y otros.
La cámara ex113, como una cámara de video digital, es capaz de capturar videos. Una cámara ex116, como una cámara de video digital, es capaz de capturar imágenes fijas y videos. Además, el teléfono móvil ex114 puede ser el que cumpla con cualquiera de los estándares, como el Sistema global para comunicaciones móviles (GSM), Acceso múltiple por división de código (CDMA), Acceso múltiple por división de código de banda ancha (W-CDMA), Evolución a largo plazo (LTE) y acceso a paquetes de alta velocidad (HSPA). Alternativamente, el teléfono móvil ex114 puede ser un Sistema de Teléfono Inteligente Personal (PHS).
En el sistema de suministro de contenido ex100, un servidor de transmisión de flujos ex103 está conectado a la cámara ex113 y otros a través de la red telefónica ex104 y la estación base ex109, que permite la distribución de imágenes de un espectáculo en vivo y otros. En dicha distribución, un contenido (por ejemplo, video de un espectáculo de música en vivo) capturado por el usuario usando la cámara ex113 se codifica (es decir, como si el contenido se codificara en el aparato de codificación de imágenes de acuerdo con la presente invención) como se describió anteriormente en cualquiera de las realizaciones, y el contenido codificado se transmite al servidor de transmisión ex103. Por otro lado, el servidor de transmisión ex103 lleva a cabo la distribución de flujo de los datos de contenido transmitidos a los clientes cuando lo solicitan. Los clientes incluyen el ordenador ex111, la PDA ex112, la cámara ex113, el teléfono móvil ex114 y la máquina de juegos ex115 que son capaces de decodificar los datos codificados mencionados anteriormente. Al recibir los datos distribuidos, cada uno de los aparatos decodifica los datos recibidos y reproduce los datos decodificados (es decir, como si el contenido estuviera codificado en el aparato de codificación de imágenes de acuerdo con la presente invención).
Los datos capturados pueden ser codificados por la cámara ex113 o el servidor de transmisión ex103 que transmite los datos, o los procesos de codificación pueden compartirse entre la cámara ex113 y el servidor de transmisión ex103. De manera similar, los datos distribuidos pueden ser decodificados por los clientes o el servidor de transmisión ex103, o los procesos de decodificación pueden compartirse entre los clientes y el servidor de transmisión ex103. Además, los datos de las imágenes fijas y los videos capturados no solo por la cámara ex113 sino también por la cámara ex116 pueden transmitirse al servidor de transmisión ex103 a través del ordenador ex111. Los procesos de codificación pueden ser realizados por la cámara ex116, el ordenador ex111 o el servidor de transmisión de flujos ex103, o compartidos entre ellos.
Además, los procesos de codificación y decodificación pueden realizarse mediante un LSI ex500 generalmente incluido en cada uno de los ordenadores ex111 y los dispositivos. El LSI ex500 puede configurarse con un solo chip o una pluralidad de chips. El software para codificar y decodificar imágenes en movimiento puede integrarse en algún tipo de medio de grabación (como un CD-ROM, un disco flexible, un disco duro) que pueda leer el ordenador ex111 y otros, y los procesos de codificación y decodificación pueden ser realizado usando el software. Además, cuando el teléfono móvil ex114 está equipado con una cámara, los datos de video obtenidos por la cámara pueden transmitirse. Los datos de video son datos codificados por el LSI ex500 incluido en el teléfono móvil ex114.
Además, el servidor de transmisión de flujos ex103 puede estar compuesto por servidores y ordenadores, y puede descentralizar datos y procesar los datos descentralizados, registrar o distribuir datos.
Como se describió anteriormente, los clientes pueden recibir y reproducir los datos codificados en el sistema que proporciona contenido ex100. En otras palabras, los clientes pueden recibir y decodificar la información transmitida por el usuario, y reproducir los datos decodificados en tiempo real en el sistema de suministro de contenido ex100, de modo que el usuario que no tiene ningún derecho y equipo para tales fines pueda disfrutar de la radio transmisión personal.
Además del ejemplo del sistema de suministro de contenido ex100, al menos uno de los aparatos de codificación de imágenes en movimiento y el aparato de decodificación de imágenes en movimiento descritos en cualquiera de las realizaciones se pueden incorporar en un sistema de radiotransmisión digital ex200 como se ilustra en la figura 18. Más específicamente, una estación de radio transmisión ex201 comunica o transmite, a través de ondas de radio a un satélite de transmisión ex202, datos multiplexados obtenidos al multiplexar datos de audio y otros en datos de video. Estos datos de video se codifican de acuerdo con el procedimiento de codificación de imágenes en movimiento en cualquiera de las realizaciones (es decir, datos codificados por el aparato de codificación de imágenes de acuerdo con la presente invención). Al recibir los datos multiplexados, el satélite de radio transmisión ex202 transmite ondas de radio para su transmisión. Luego, una antena de uso doméstico ex204 con una función de recepción de radio transmisión satelital recibe las ondas de radio. A continuación, un dispositivo como un televisor (receptor) ex300 y un decodificador (STB) ex217 decodifica los datos multiplexados recibidos y reproduce los datos decodificados (es decir, como si el contenido estuviera codificado en el aparato de codificación de imágenes de acuerdo con la presente invención).
Además, un lector y grabador ex218 que (i) lee y decodifica los datos multiplexados grabados en un medio de grabación ex215, como un DVD y un BD, o (i) codifica señales de video en el medio de grabación ex215, y en algunos casos, escribe datos obtenidos al multiplexar una señal de audio en los datos codificados puede incluir el aparato de decodificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento como se muestra en cualquiera de las realizaciones. En este caso, las señales de video reproducidas se muestran en el monitor ex219, y pueden ser reproducidas por otro dispositivo o sistema utilizando el medio de grabación ex215 en el que se graban los datos multiplexados. También es posible implementar el aparato de decodificación de imágenes en movimiento en el decodificador ex217 conectado al cable ex203 para un televisor por cable (receptor) o a la antena ex204 para transmisión satelital y/o terrestre, a fin de mostrar las señales de video en El monitor ex219 del televisor (receptor) ex300. El aparato de decodificación de imágenes en movimiento puede incorporarse no en el decodificador sino en el televisor (receptor) ex300.
La figura 19 ilustra el televisor (receptor) ex300 que usa el procedimiento de codificación de imágenes en movimiento y el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones. El televisor (receptor) ex300 incluye: un sintonizador ex301 que obtiene o proporciona datos multiplexados obtenidos al multiplexar datos de audio sobre datos de video, a través de la antena ex204 o el cable ex203, etc. que recibe una radio transmisión; una unidad de modulación y demodulación ex302 que demodula los datos multiplexados recibidos o modula los datos en datos multiplexados para ser suministrados al exterior; y una unidad de multiplexación y demultiplexación ex303 que demultiplexa los datos multiplex modulados en datos de video y audio, o multiplexa datos de video y audio codificados por una unidad de procesamiento de señal ex306 en datos.
Además, el televisor (receptor) ex300 incluye: una unidad de procesamiento de señal ex306 que incluye una unidad de procesamiento de señal de audio ex304 y una unidad de procesamiento de señal de video ex305 que decodifican datos de audio y datos de video o codifican su información, respectivamente (el televisor (receptor) 300 funciona como el aparato de codificación de imágenes o el aparato de decodificación de imágenes de acuerdo con la presente invención); y una unidad de salida ex309 que incluye un altavoz ex307 que proporciona la señal de audio decodificada, y una unidad de visualización ex308, tal como una pantalla, que muestra la señal de video decodificada. Además, el televisor (receptor) ex300 incluye una unidad de interfaz ex317 que incluye una unidad de entrada de operación ex312 que recibe una entrada de una operación de usuario. Además, el televisor (receptor) ex300 incluye una unidad de control ex310 que controla en general cada elemento estructural del televisor (receptor) ex300, y una unidad de circuito de suministro de energía ex311 que suministra energía a cada uno de los elementos. Además de la unidad de entrada de operación ex312, la unidad de interfaz ex317 puede incluir: un puente ex313 que está conectado a un dispositivo externo, como el lector y grabador ex218; una unidad de ranura ex314 para permitir la conexión del medio de grabación ex216, como una tarjeta SD; un controlador ex315 para conectarse a un medio de grabación externo, como un disco duro; y un módem ex316 para conectarse a una red telefónica. En el presente documento, el medio de grabación ex216 puede grabar eléctricamente información usando un elemento de memoria semiconductor no volátil o volátil para almacenamiento. Los elementos estructurales del televisor (receptor) ex300 están conectados entre sí a través de un bus síncrono.
Se describirá primero, la configuración en la que el televisor (receptor) ex300 decodifica datos multiplexados obtenidos desde el exterior a través de la antena ex204 y otros y reproduce los datos decodificados. En el televisor (receptor) ex300, tras una operación del usuario desde un controlador remoto ex220 y otros, la unidad de multiplexación y demultiplexación ex303 demultiplexa los datos multiplexados demodulados por la unidad de modulación y demodulación ex302, bajo el control de la unidad de control ex310 que incluye una CPU. Además, en la televisión (receptor) ex300, la unidad de procesamiento de señal de audio ex304 decodifica los datos de audio demultiplexados, y la unidad de procesamiento de señal de video ex305 decodifica los datos de video demultiplexados, utilizando el procedimiento de decodificación descrito en cualquiera de las realizaciones. La unidad de salida ex309 proporciona la señal de video decodificada y la señal de audio externa, respectivamente. Cuando la unidad de salida ex309 proporciona la señal de video y la señal de audio, las señales pueden almacenarse temporalmente en las memorias intermedias ex318 y ex319, y otras para que las señales de video y las señales de audio se reproduzcan en sincronización entre sí. Además, el televisor (receptor) ex300 puede leer datos multiplexados no a través de una transmisión y otros, sino desde los medios de grabación ex215 y ex216, como un disco magnético, un disco óptico y una tarjeta Sd . A continuación, se describirá una configuración en la que el televisor (receptor) ex300 codifica una señal de audio y una señal de video, y transmite los datos al exterior o los escribe en un medio de grabación. En el televisor (receptor) ex300, tras una operación del usuario desde el controlador remoto ex220 o similar, la unidad de procesamiento de señal de audio ex304 codifica una señal de audio, y la unidad de procesamiento de señal de video ex305 codifica una señal de video, bajo el control de la unidad de control ex310 usando el procedimiento de codificación descrito en cualquiera de las realizaciones. La unidad de multiplexación y demultiplexación ex303 multiplexa la señal de video codificada y la señal de audio, y proporciona las señales resultantes al exterior. Cuando la unidad de multiplexación y demultiplexación ex303 multiplexa la señal de video y la señal de audio, las señales pueden almacenarse temporalmente en las memorias intermedias ex320 y ex321 o similares para que las señales se reproduzcan en sincronización entre sí. En el presente documento, las memorias intermedias ex318, ex319, ex320 y ex321 pueden ser plurales como se ilustra, o al menos una memoria intermedia puede compartirse en el televisor (receptor) ex300. Además, los datos pueden almacenarse en una memoria intermedia para evitar el desbordamiento y el subflujo del sistema entre la unidad de modulación y demodulación ex302 y la unidad de multiplexación y demultiplexación ex303, además de los casos ilustrados.
Además, el televisor (receptor) ex300 puede incluir un elemento estructural para recibir una entrada AV de un micrófono o una cámara que no sea el elemento estructural para obtener datos de audio y video de una radio transmisión o un medio de grabación, y puede codificar los datos obtenidos. Aunque el televisor (receptor) ex300 puede codificar, multiplexar y proporcionar datos externos en la descripción anterior, solo puede recibir, decodificar y proporcionar datos externos, pero no la codificación, multiplexación y proporcionar datos externos.
Además, cuando el lector y grabador ex218 lee o escribe datos multiplexados desde o en un medio de grabación, uno de los televisores (receptores) ex300 y el lector y grabador ex218 pueden decodificar o codificar los datos multiplexados, y los televisores (receptores) ex300 y el lector y grabador ex218 pueden compartir la decodificación o codificación.
Como ejemplo, la figura 20 ilustra una estructura de una unidad de grabación y reproducción de información ex400 cuando los datos se leen o escriben desde o en un disco óptico. La unidad de grabación y reproducción de información ex400 incluye elementos estructurales ex401, ex402, ex403, ex404, ex405, ex406 y ex407 que se describirán más adelante. El cabezal óptico ex401 irradia un punto láser en una superficie de grabación del medio de grabación ex215 que es un disco óptico para escribir información, y detecta la luz reflejada desde la superficie de grabación del medio de grabación ex215 para leer la información. La unidad de grabación de modulación ex402 acciona eléctricamente un láser semiconductor incluido en el cabezal óptico ex401, y modula la luz láser de acuerdo con los datos grabados. La unidad de reproducción y demodulación ex403 amplifica una señal de reproducción obtenida mediante la detección eléctrica de la luz reflejada desde la superficie de grabación utilizando un detector fotográfico incluido en el cabezal óptico ex401, y demodula la señal de reproducción separando un componente de señal grabado en el medio de grabación ex215 para reproducir la información necesaria. La memoria intermedia ex404 contiene temporalmente la información a grabar en el medio de grabación ex215 y la información reproducida desde el medio de grabación ex215. El motor de disco ex405 gira el medio de grabación ex215. La unidad de servocontrol ex406 mueve el cabezal óptico ex401 a una pista de información predeterminada mientras controla el accionamiento de rotación del motor de disco ex405 para seguir el punto láser. La unidad de control del sistema ex407 controla en general la unidad de reproducción y grabación de información ex400. La unidad de control del sistema ex407 puede realizar los procesos de lectura y escritura utilizando diversa información almacenada en el buffer ex404 y generando y agregando nueva información según sea necesario, y mediante la unidad de grabación de modulación ex402, la unidad de demodulación de reproducción ex403 y la unidad de servo control ex406 que registra y reproduce información a través del cabezal óptico ex401 mientras se opera de manera coordinada. La unidad de control del sistema ex407 incluye, por ejemplo, un microprocesador, y ejecuta el procesamiento al hacer que un ordenador ejecute un programa de lectura y escritura.
Aunque el cabezal óptico ex401 irradia un punto láser en la descripción, puede realizar una grabación de alta densidad usando luz de campo cercano.
La figura 21 es un diagrama esquemático del medio de grabación ex215 que es el disco óptico. En la superficie de grabación del medio de grabación ex215, las ranuras de guía se forman en espiral, y una pista de información ex230 registra, por adelantado, información de dirección que indica una posición absoluta en el disco de acuerdo con el cambio en la forma de las ranuras de guía. La información de dirección incluye información para determinar las posiciones de los bloques de grabación ex231 que son una unidad para grabar datos. La reproducción de la pista de información ex230 y la lectura de la información de dirección en un aparato que graba y reproduce datos puede conducir a la determinación de las posiciones de los bloques de grabación. Además, el medio de grabación ex215 incluye un área de grabación de datos ex233, un área de circunferencia interna ex232 y un área de circunferencia externa ex234. El área de grabación de datos ex233 es un área para usar en la grabación de datos del usuario. El área de circunferencia interna ex232 y el área de circunferencia externa ex234 que están dentro y fuera del área de grabación de datos ex233, respectivamente, son para uso específico, excepto para registrar los datos del usuario. La unidad de reproducción y grabación de información 400 lee y escribe audio codificado, datos de video codificados o datos multiplexados obtenidos al multiplexar los datos codificados de audio y video, desde y sobre el área de grabación de datos ex233 del medio de grabación ex215.
Aunque un disco óptico que tiene una capa, tal como un DVD y un BD se describe como un ejemplo en la descripción, el disco óptico no está limitado a tal, y puede ser un disco óptico que tiene una estructura multicapa y es capaz de ser grabado en una parte que no sea la superficie. Además, el disco óptico puede tener una estructura para la grabación y reproducción multidimensional, como la grabación de información utilizando luz de colores con diferentes longitudes de onda en la misma porción del disco óptico y la información de grabación que tiene diferentes capas desde varios ángulos.
Además, en el sistema de radiotransmisión digital ex200, un automóvil ex210 que tiene una antena ex205 puede recibir datos del satélite de radio transmisión ex202 y otros, y reproducir video en un dispositivo de visualización como un sistema de navegación para automóvil ex211 configurado en el automóvil ex210. En el presente documento, el sistema de navegación para automóvil ex211 puede configurarse para incluir además una unidad receptora de GPS además de la configuración ilustrada en la figura 63. Lo mismo es cierto para el ordenador ex111, el teléfono móvil ex114 y similares.
La figura 22A ilustra el teléfono móvil ex114 que usa el procedimiento de codificación de imágenes en movimiento y el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones. El teléfono móvil ex114 incluye: una antena ex350 para transmitir y recibir ondas de radio a través de la estación base ex110; una unidad de cámara ex365 capaz de capturar imágenes en movimiento y fijas; y una unidad de visualización ex358 tal como una pantalla de cristal líquido para visualizar los datos tales como video decodificado capturado por la unidad de cámara ex365 o recibido por la antena ex350. El teléfono móvil ex114 incluye además: una unidad principal del cuerpo que incluye un conjunto de teclas de operación ex366; una unidad de salida de audio ex357 tal como un altavoz para salida de audio; una unidad de entrada de audio ex356 tal como un micrófono para entrada de audio; una unidad de memoria ex367 para almacenar video capturado o imágenes fijas, audio grabado, datos codificados o decodificados del video recibido, las imágenes fijas, correos electrónicos u otros; y una unidad de ranura ex364 que es una unidad de interfaz para un medio de grabación que almacena datos de la misma manera que la unidad de memoria ex367.
A continuación, se describirá, un ejemplo de una estructura del teléfono móvil ex114 con referencia a la figura 22B. En el teléfono móvil ex114, una unidad de control principal ex360 diseñada para controlar en general cada unidad del cuerpo principal, incluida la unidad de pantalla ex358, así como la unidad de tecla de operación ex366, se conectan mutuamente, a través de un bus síncrono ex370, a una unidad de circuito de suministro de energía ex361, una unidad de control de entrada de operación ex362, una unidad de procesamiento de señal de video ex355, una unidad de interfaz de cámara ex363, una unidad de control de pantalla de cristal líquido (LCD) ex359, una unidad de modulación y demodulación ex352, una unidad de multiplexación y demultiplexación ex353, una unidad de procesamiento de señal de audio ex354, la unidad de ranura ex364 y la unidad de memoria ex367.
Cuando la operación de un usuario enciende una tecla de finalización de llamada o una tecla de encendido, la unidad de circuito de suministro de energía ex361 suministra energía a las unidades respectivas desde una batería para activar el teléfono celular ex114.
En el teléfono móvil ex114, la unidad de procesamiento de señal de audio ex354 convierte las señales de audio recogidas por la unidad de entrada de audio ex356 en modo de conversación de voz en señales de audio digital bajo el control de la unidad de control principal ex360 que incluye una CPU, ROM, RAM , o similar. Luego, la unidad de modulación y demodulación ex352 realiza el procesamiento de espectro extendido en las señales de audio digital, y la unidad de transmisión y recepción ex351 realiza la conversión de digital a analógico y la conversión de frecuencia en los datos, y transmite los datos resultantes a través de la antena ex350. Además, el teléfono móvil ex114 amplifica los datos recibidos a través de la antena ex350 en modo de conversación de voz y realiza la conversión de frecuencia y la conversión de analógico a digital en los datos. Luego, la unidad de control de modulación y demodulación ex352 realiza un procesamiento inverso de espectro ensanchado en los datos, la unidad de procesamiento de señal de audio ex354 convierte los datos en señales de audio analógicas y la unidad de salida de audio ex357 emite los datos de audio.
Además, cuando se transmite un correo electrónico en modo de comunicación de datos, los datos de texto del correo electrónico ingresado al operar las teclas de operación ex366 y otros del cuerpo principal se envían a la unidad de control principal ex360 a través de la entrada de operación unidad de control ex362. La unidad de control principal ex360 hace que la unidad de modulación y demodulación ex352 realice un procesamiento de espectro expandido en datos de texto, y la unidad de transmisión y recepción ex351 realiza la conversión de digital a analógico y la conversión de frecuencia en los datos resultantes y transmite los datos al estación base ex110 a través de la antena ex350. Cuando se recibe un correo electrónico, el procesamiento que es aproximadamente inverso al procesamiento para transmitir un correo electrónico se realiza sobre los datos recibidos, y los datos resultantes se proporcionan a la unidad de visualización ex358.
Cuando se transmiten video, imágenes fijas, o video y audio en modo de comunicación de datos, la unidad de procesamiento de señal de video ex355 comprime y las señales de video suministradas desde la unidad de cámara ex365 usando el procedimiento de codificación de imágenes en movimiento mostrado en una cualquiera de las realizaciones (es decir, la unidad de procesamiento de señal de video ex355 funciona como el aparato de codificación de imagen de acuerdo con la presente invención), y transmite los datos de video codificados a la unidad de multiplexación y demultiplexación ex353. Por el contrario, mientras la unidad de cámara ex365 captura video, imágenes fijas y otros, la unidad de procesamiento de señal de audio ex354 codifica las señales de audio recolectadas por la unidad de entrada de audio ex356 y transmite los datos de audio codificados a la unidad de multiplexación y demultiplexación ex353.
La unidad de multiplexación y demultiplexación ex353 multiplexa los datos de video codificados suministrados desde la unidad de procesamiento de señal de video ex355 y los datos de audio codificados suministrados desde la unidad de procesamiento de señal de audio ex354, utilizando un procedimiento predeterminado. Luego, la unidad de modulación y demodulación ex352 realiza un procesamiento de espectro ensanchado en los datos multiplexados resultantes. A continuación, la unidad de transmisión y recepción ex351 realiza la conversión digital a analógica y la conversión de frecuencia en los datos, y transmite los datos resultantes a través de la antena ex350.
Al recibir datos de un archivo de video que está vinculado a una página web y otros en modo de comunicación de datos o al recibir un correo electrónico con video y/o audio adjunto, para decodificar los datos multiplexados recibidos a través de la antena ex350 , la unidad de multiplexación y demultiplexación ex353 demultiplexa los datos multiplexados en un flujo de bits de datos de video y un flujo de bits de datos de audio, y suministra a la unidad de procesamiento de señal de video ex355 los datos de video codificados y la unidad de procesamiento de señal de audio ex354 con los datos de audio codificados, a través del bus síncrono ex370. La unidad de procesamiento de señal de video ex355 decodifica la señal de video usando un procedimiento de decodificación de imágenes en movimiento correspondiente al procedimiento de codificación mostrado en cualquiera de las realizaciones (es decir, la unidad de procesamiento de señal de video ex355 funciona como el aparato de codificación de imagen de acuerdo con la presente invención) , y luego la unidad de visualización ex358 muestra, por ejemplo, el video y las imágenes fijas incluidas en el archivo de video vinculado a la página web a través de la unidad de control LCD ex359. Además, la unidad de procesamiento de señal de audio ex354 decodifica la señal de audio, y la unidad de salida de audio ex357 proporciona el audio.
Además, de manera similar al televisor (receptor) ex300, un terminal como el teléfono móvil ex114 probablemente tenga tres tipos de implementaciones que incluyen no solo (i) un terminal de transmisión y recepción que incluye un aparato de codificación y un aparato de decodificación, sino también (ii) un terminal transmisor que incluye solo un aparato de codificación y (iii) un terminal receptor que incluye solo un aparato de decodificación. Aunque el sistema de radiotransmisión digital ex200 recibe y transmite los datos multiplexados obtenidos al multiplexar datos de audio en datos de video en la descripción, los datos multiplexados pueden ser datos obtenidos al multiplexar no solo datos de audio sino también datos de caracteres relacionados con video en datos de video, y pueden no sean datos multiplexados sino datos de video en sí.
Como tal, cada uno de los aparatos y sistemas descritos anteriormente es capaz de realizar uno de los procedimientos de codificación de imágenes en movimiento y los procedimientos de decodificación de imágenes en movimiento correspondientes descritos en las realizaciones, y de ese modo proporciona los efectos ventajosos descritos en las realizaciones.
Además, la presente invención no se limita a las realizaciones, y son posibles diversas modificaciones y revisiones sin apartarse del alcance de la presente invención.
[Realización 41
Los datos de video pueden generarse cambiando, según sea necesario, entre (i) el procedimiento de codificación de imágenes en movimiento y/o el aparato de codificación de imágenes en movimiento mostrado en cualquiera de las realizaciones y (ii) un procedimiento de codificación de imágenes en movimiento y/o un aparato de codificación de imágenes en movimiento de conformidad con un estándar diferente, como MPEG-2, MPEG-4 AVC y VC-1.
En el presente documento, cuando se genera una pluralidad de datos de video que se ajusta a los diferentes estándares y luego se decodifica, los procedimientos de decodificación deben seleccionarse para cumplir con los diferentes estándares. Sin embargo, en razón a que cada estándar de la pluralidad de datos de video a codificar conformado no se puede detectar, existe el problema de que no se puede seleccionar un procedimiento de decodificación apropiado.
Para resolver este problema, los datos multiplexados obtenidos multiplexando datos de audio y otros en datos de video tienen una estructura que incluye información de identificación que indica a qué estándar se ajustan los datos de video. A continuación, se proporciona una descripción de la estructura específica de los datos multiplexados, incluidos los datos de video generados en el procedimiento de codificación de imágenes en movimiento y por el aparato de codificación de imágenes en movimiento mostrado en cualquiera de las realizaciones. Los datos multiplexados son una transmisión de flujos digitales en el formato de Transmisión de Flujos de Transporte MPEG-2.
La figura 23 ilustra una estructura de los datos multiplexados. Como se ilustra en la figura 23, los datos multiplexados se pueden obtener multiplexando al menos uno de una transmisión de flujos de video, una transmisión de flujos de audio, una transmisión de flujo de gráficos de presentación (PG) y una transmisión de flujos de gráficos interactivos. La transmisión de flujos de video representa el video primario y el video secundario de una película, la transmisión de flujos de audio (IG) representa una parte de audio primaria y una parte de audio secundaria para mezclar con la parte de audio principal de una película, y la secuencia de gráficos de presentación representa subtítulos de película. En el presente documento, el video principal es el video normal que se mostrará en una pantalla, y el video secundario es el video que se mostrará en una ventana más pequeña en el video principal. Además, la secuencia de gráficos interactivos representa transmisión de flujos de gráficos interactivos que se generará organizando los componentes de la GUI en una pantalla. La transmisión de flujos de video se codifica en el procedimiento de codificación de imágenes en movimiento o por el aparato de codificación de imágenes en movimiento mostrado en cualquiera de las realizaciones, o en un procedimiento de codificación de imágenes en movimiento o por un aparato de codificación de imágenes en movimiento de conformidad con cualquiera de los estándares convencionales tales como MPEG-2, MPEG-4 AVC y V C -1. La transmisión de flujos de audio está codificada de acuerdo con un estándar, como Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DTSHD y PCM lineal.
Cada flujo incluido en los datos multiplexados se identifica por PID. Por ejemplo, 0 x 1011 se asigna a la transmisión de flujos de video que se utilizará para el video de una película, 0 x 1100 a 0 x 111F se asignan a la transmisión de flujos de audio, 0 x 1200 a 0 x 121F se asignan a la transmisión de flujos de gráficos de presentación, 0 x 1400 a 0 x 141F se asignan a la transmisión de flujos de gráficos interactivos, 0 x 1B00 a 0 x 1B1F se asignan a las transmisiones de video que se utilizarán para el video secundario de la película, y 0 x 1A00 a 0 x 1A1F se asignan a las transmisiones de flujos de audio para que el video secundario se mezcle con el audio primario.
La figura 24 ilustra esquemáticamente cómo se multiplexan los datos. Primero, una transmisión de flujos de video ex235 compuesto por cuadros de video y un flujo de audio ex238 compuesto de cuadros de audio se transforman en un flujo de paquetes PES ex236 y un flujo de paquetes PES ex239, y luego en paquetes TS ex237 y paquetes TS ex240, respectivamente. De forma similar, los datos de una secuencia de gráficos de presentación ex241 y los datos de una secuencia de gráficos interactivos ex244 se transforman en una transmisión de flujos de paquetes PES ex242 y una transmisión de flujos de paquetes PES ex245, respectivamente, y posteriormente en paquetes TS ex243 y paquetes TS ex246, respectivamente. Estos paquetes TS se multiplexan en un flujo para obtener datos multiplexados ex247.
La figura 25 ilustra cómo se almacena una transmisión de flujos de video en una transmisión de flujos de paquetes PES con más detalle. La primera barra en la figura 25 muestra una transmisión de flujos de marco de video en una transmisión de flujos de video. La segunda barra muestra el flujo de paquetes PES. Como se indica mediante flechas indicadas como yy1, yy2, yy3 e yy4 en la figura 25, el flujo de video se divide en imágenes como imágenes I, imágenes B e imágenes P, cada una de las cuales es una unidad de presentación de video, y las imágenes se almacenan en una carga útil de cada uno de los paquetes PES. Cada uno de los paquetes PES tiene un encabezado PES, y el encabezado PES almacena un Sello de Tiempo de Presentación (PTS) que indica una tiempo de visualización de la imagen, y un sello de tiempo de decodificación (DTS) que indica un tiempo de decodificación de la imagen.
La figura 26 ilustra un formato de paquetes TS que se escribirán finalmente en los datos multiplexados. Cada uno de los paquetes TS es un paquete de longitud fija de 188 bytes que incluye un encabezado TS de 4 bytes que tiene información, como un PID para identificar un flujo y una carga útil TS de 184 bytes para almacenar datos. Los paquetes PES se dividen y almacenan en las cargas útiles de TS, respectivamente. Cuando se usa un BD ROM, cada uno de los paquetes TS recibe un Encabezado Extra TP de 4 bytes, lo que da como resultado paquetes fuente de 192 bytes. Los paquetes fuente se escriben en los datos multiplexados. El Encabezado Extra TP almacena información como un Sello de Tiempo de Venta (ATS). El ATS muestra un tiempo de inicio de transferencia en el que cada uno de los paquetes TS debe transferirse a un filtro PID. Los paquetes fuente están dispuestos como se muestra en la barra inferior de la figura 26. Los números que se incrementan desde el encabezado de los datos multiplexados se denominan números de paquete fuente (SPN).
Cada uno de los paquetes TS incluidos en los datos multiplexados incluye no solo transmisiones de flujos de audio, video, subtítulos y otros, sino también una Tabla de Asociación de Programas (PAT), una Tabla de Mapa de Programas (PMT) y una Referencia de Reloj de Programa (PCR). El PAT muestra lo que indica un PID en un PMT usado en los datos multiplexados, y un PID del PAT mismo se registra como cero. El p Mt almacena los PID de las transmisiones de flujos de video, audio, subtítulos y otros incluidos en los datos multiplexados, y la información de atributos de las transmisiones de flujos correspondientes a los PID. El PMT también tiene varios descriptores relacionados con los datos multiplexados. Los descriptores tienen información tal como información de control de copia que muestra si la copia de los datos multiplexados está permitida o no. El PCR almacena la información de tiempo STC correspondiente a un ATS que muestra cuándo se transfiere el paquete de PCR a un decodificador, para lograr la sincronización entre un reloj de tiempo de llegada (ATC) que es un eje de tiempo de ATS y un reloj de tiempo del sistema (STC) ese es un eje de tiempo de PTS y DTS.
La figura 27 ilustra la estructura de datos de la PMT en detalle. Un encabezado PMT está dispuesto en la parte superior de la PMT. El encabezado PMT describe la longitud, etc. de los datos incluidos en el PMT. Una pluralidad de descriptores relacionados con los datos multiplexados se dispone después del encabezado PMT. Información como la información de control de copia se describe en los descriptores. Después de los descriptores, se dispone una pluralidad de piezas de información de transmisiones de flujos relacionadas con las transmisiones de flujos incluidas en los datos multiplexados. Cada pieza de información de transmisiones de flujos incluye descriptores de transmisiones de flujos, cada uno de los cuales describe información, como un tipo de transmisiones de flujos para identificar un códec de compresión, etc. de una transmisiones de flujo, un PID de transmisiones de flujos y la información de atributos de transmisiones de flujos (como una velocidad de tramas, una relación de aspecto o similar). Los descriptores de transmisiones de flujos son iguales en número al número de transmisiones de flujos en los datos multiplexados.
Cuando los datos multiplexados se graban en un medio de grabación, etc., se graban junto con los archivos de información de datos multiplexados.
Cada uno de los archivos de información de datos multiplexados es información de gestión de los datos multiplexados como se muestra en la figura 28. Los archivos de información de datos multiplexados están en correspondencia uno a uno con los datos multiplexados, y cada uno de los archivos incluye información de datos multiplexados, información de atributos de flujo y un mapa de entrada.
Como se ilustra en la figura 28, los datos multiplexados incluyen una velocidad del sistema, un tiempo de inicio de reproducción y un tiempo de finalización de reproducción. La velocidad del sistema indica la velocidad de transferencia máxima a la que un decodificador objetivo del sistema que se describirá más tarde transfiere los datos multiplexados a un filtro PlD. Los intervalos de los ATS incluidos en los datos multiplexados se establecen en una velocidad no superior a la del sistema. El tiempo de inicio de reproducción indica un PTS en un cuadro de video en la cabecera de los datos multiplexados. Se agrega un intervalo de una trama a un PTS en una trama de video al final de los datos multiplexados, y el PTS se establece en el tiempo de finalización de la reproducción.
Como se muestra en la figura 29, una parte de información de atributo se registra en la información de atributo de transmisiones de flujos, para cada PID de cada transmisiones de flujos incluido en los datos multiplexados. Cada pieza de información de atributo tiene información diferente dependiendo de si la secuencia correspondiente es una transmisión de flujos de video, unas transmisiones de flujos de audio, unas transmisiones de flujos de gráficos de presentación o unas transmisiones de flujos de gráficos interactivos. Cada parte de la información del atributo de transmisiones de flujos de video contiene información que incluye qué tipo de códec de compresión se utiliza para comprimir las transmisiones de flujos de video, y la resolución, la relación de aspecto y la velocidad de fotogramas de los datos de imagen incluidos en las transmisiones de video. Cada parte de la información del atributo de transmisiones de flujos de audio contiene información que incluye qué tipo de códec de compresión se usa para comprimir las transmisiones de flujos de audio, cuántos canales se incluyen en las transmisiones de flujos de audio, qué idioma admite transmisiones de flujos audio y qué tan alta es la frecuencia de muestreo. La información del atributo de transmisiones de flujos de video y la información del atributo de transmisiones de flujos de audio se utilizan para inicializar un decodificador antes de que el reproductor reproduzca la información.
En esta realización, los datos multiplexados que se utilizarán entre los datos multiplexados son de un tipo de flujo incluido en el PMT. Además, cuando los datos multiplexados se graban en un medio de grabación, se utiliza la información del atributo de flujo de video incluida en la información de datos multiplexados. Más específicamente, el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones incluye una etapa o una unidad para asignar información única que indica datos de video generados por el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cualquiera de las realizaciones, al tipo de flujo incluido en la PMT o la información del atributo del flujo de video. Con esta estructura, los datos de video generados por el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones pueden distinguirse de los datos de video que se ajustan a otro estándar.
Además, la figura 30 ilustra las etapas del procedimiento de decodificación de imágenes en movimiento de acuerdo con esta realización. En la etapa exS100, el tipo de flujo incluido en la PMT o la información del atributo del flujo de video se obtiene de los datos multiplexados. A continuación, en la etapa exS101, se determina si el tipo de flujo o la información del atributo del flujo de video indica que los datos multiplexados se generan mediante el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cualquiera de las realizaciones. Cuando se determina que el tipo de transmisión o la información del atributo de transmisión de video indica que los datos multiplexados se generan mediante el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cualquiera de las realizaciones, en la etapa exS102, el tipo de transmisión o el video la información del atributo de flujo se decodifica mediante el procedimiento de decodificación de imágenes en movimiento en cualquiera de las realizaciones. Además, cuando el tipo de transmisión o la información del atributo de transmisión de video indica conformidad con cualquiera de los estándares convencionales tales como MPEG-2, MPEG-4 AVC y VC-1, en la etapa exS103, el tipo de transmisiones de flujos o la información del atributo de transmisión de flujos de video se decodifica mediante un procedimiento de decodificación de imágenes en movimiento de conformidad con cualquiera de los estándares convencionales.
Como tal, asignar un nuevo valor único al tipo de transmisiones de flujos o la información del atributo de las transmisiones de flujos de video permite determinar si el procedimiento de decodificación de imágenes en movimiento o el aparato de decodificación de imágenes en movimiento que se describe en cualquiera de las realizaciones puede realizar la decodificación. Incluso cuando los datos multiplexados se ajustan a un estándar diferente, se puede seleccionar un procedimiento o aparato de decodificación apropiado. Por lo tanto, se hace posible decodificar información sin ningún error. Además, el procedimiento o aparato de codificación de imágenes en movimiento, o el procedimiento o aparato de decodificación de imágenes en movimiento en esta realización se puede usar en los dispositivos y sistemas descritos anteriormente.
[Realización 51
Cada uno de los procedimientos de codificación de imágenes en movimiento, el aparato de codificación de imágenes en movimiento, el procedimiento de decodificación de imágenes en movimiento y el aparato de decodificación de imágenes en movimiento en cualquiera de las formas de realización se consigue típicamente en forma de un circuito integrado o un gran escala integrado. (LSI) circuito. Como ejemplo de la LSI, la figura 31 ilustra una configuración del LSI ex500 que se hace en un chip. El LSI ex500 incluye los elementos ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508 y ex509 que se describen a continuación, y los elementos están conectados entre sí a través de un bus ex510. La unidad de circuito de fuente de alimentación ex505 se activa al suministrar energía a cada uno de los elementos cuando se enciende la unidad de circuito de fuente de alimentación ex505.
Por ejemplo, cuando se realiza la codificación, el LSI ex500 recibe una señal AV de un micrófono ex117, una cámara ex113 y otros a través de una E/S AV ex509 bajo el control de una unidad de control ex501 que incluye una CPU ex502, un controlador de memoria ex503, un controlador de transmisiones de flujos ex504 y una unidad de control de frecuencia de control ex512. La señal AV recibida se almacena temporalmente en una memoria externa ex511, como una SDRAM. Bajo el control de la unidad de control ex501, los datos almacenados se segmentan en porciones de datos de acuerdo con la cantidad de procesamiento y la velocidad a transmitir a una unidad de procesamiento de señales ex507. Entonces, la unidad de procesamiento de señal ex507 codifica una señal de audio y/o una señal de video. En el presente documento, la codificación de la señal de video es la codificación descrita en cualquiera de las realizaciones. Además, la unidad de procesamiento de señal ex507 multiplexa los datos de audio codificados y los datos de video codificados según sea necesario, y una E/S de transmisiones de flujos ex506 emite los datos multiplexados. Los datos multiplexados proporcionados se transmiten a una estación base ex107, o se escriben en el medio de grabación ex215. Antes de la multiplexación, los datos de audio y video preferiblemente se almacenan temporalmente en el buffer ex508 para que los datos de audio y video se sincronicen entre sí.
Aunque la memoria ex511 se describe como un elemento fuera del LSI ex500, puede incluirse en el LSI ex500. La memoria intermedia ex508 no está limitada a una memoria intermedia, sino que puede estar compuesta de memorias intermedias. Además, el LSI ex500 se puede convertir en un solo chip o en una pluralidad de chips.
Además, aunque la unidad de control ex501 incluye la CPU ex502, el controlador de memoria ex503, el controlador de transmisiones de flujos ex504, la unidad de control de frecuencia de control ex512, la configuración de la unidad de control ex501 no se limita a tal. Por ejemplo, la unidad de procesamiento de señal ex507 puede incluir además una CPU. La inclusión de otra CPU en la unidad de procesamiento de señal ex507 puede mejorar la velocidad de procesamiento. Además, como otro ejemplo, la CPU ex502 puede servir o ser parte de la unidad de procesamiento de señal ex507 y, por ejemplo, puede incluir una unidad de procesamiento de señal de audio. En tal caso, la unidad de control ex501 incluye la unidad de procesamiento de señal ex507 o la CPU ex502 que incluye una parte de la unidad de procesamiento de señal ex507.
El nombre usado aquí es LSI, pero también puede llamarse IC, sistema LSI, super LSI o ultra LSI dependiendo del grado de integración.
Además, las formas de lograr la integración no se limitan al LSI, y un circuito especial o un procesador de propósito general y demás también pueden lograr la integración. La matriz de puerta programable de campo (FPGA) que se puede programar después de la fabricación de LSI o un procesador reconfigurable que permite la reconfiguración de la conexión o la configuración de un LSI se puede utilizar para el mismo propósito.
En el futuro, con el avance en la tecnología de semiconductores, una tecnología completamente nueva puede reemplazar a LSI. Los bloques funcionales pueden integrarse utilizando dicha tecnología. La aplicación de la biotecnología es una de esas posibilidades.
[Realización 61
Cuando los datos de video se decodifican en el procedimiento de codificación de imágenes en movimiento o por el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, la cantidad de procesamiento probablemente aumenta en comparación con cuando los datos de video se ajustan a cualquiera de los estándares convencionales tales como MPEG-2, MPEG-4 AVC y VC-1. Por lo tanto, el LSI ex500 debe configurarse a una frecuencia de control superior a la de la CPU ex502 para usarse cuando se decodifican datos de video de conformidad con cualquiera de los estándares convencionales. Sin embargo, cuando la frecuencia de control es más alta, existe el problema de que aumenta el consumo de energía.
Para resolver este problema, el aparato de decodificación de imágenes en movimiento, como el televisor (receptor) ex300, el LSI ex500, o similar está configurado para determinar a qué estándar se ajustan los datos de video, y cambiar entre las frecuencias de control de acuerdo con el estándar determinado. La figura 32 ilustra una estructura de ex800 en esta realización. Una unidad de conmutación de frecuencia de control ex803 establece una frecuencia de control a una frecuencia de control más alta cuando los datos de video se generan mediante el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones. Entonces, la unidad de conmutación de frecuencia de control ex803 ordena a una unidad de procesamiento de decodificación ex801 que ejecute el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones para decodificar los datos de video. Cuando los datos de video se ajustan a cualquiera de los estándares convencionales, la unidad de conmutación de frecuencia de control ex803 establece una frecuencia de control a una frecuencia de control menor que la de los datos de video generados por el procedimiento de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descrito en una cualquiera de las realizaciones. Luego, la unidad de conmutación de frecuencia de control ex803 ordena a la unidad de procesamiento de decodificación ex802 que cumpla con cualquiera de los estándares convencionales para decodificar los datos de video.
Más específicamente, la unidad de conmutación de frecuencia de control ex803 incluye la CPU ex502 y la unidad de control de frecuencia de control ex512 en la figura 31. En el presente documento, cada unidad de procesamiento de decodificación ex801 que ejecuta el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones y la unidad de procesamiento de decodificación ex802 que se ajusta a cualquiera de los estándares convencionales corresponde a la unidad de procesamiento de señal ex507 en la figura 31. La CPU ex502 determina a qué estándar se ajustan los datos de video. Luego, la unidad de control de frecuencia de control ex512 determina una frecuencia de control basada en una señal de la CPU ex502. Además, la unidad de procesamiento de señal ex507 decodifica los datos de video basándose en una señal de la CPU ex502. Por ejemplo, la información de identificación descrita en la Realización 4 probablemente se usa para identificar los datos de video. La información de identificación no se limita a la descrita en la Realización 4, sino que puede ser cualquier información siempre que la información indique a qué estándar se ajustan los datos de video. Por ejemplo, cuando los datos de video estándar se pueden determinar en función de una señal externa para determinar que los datos de video se usan para un televisor (receptor) o un disco, etc., la determinación se puede hacer en función de dicha señal externa. Además, la CPU ex502 selecciona una frecuencia de control basada, por ejemplo, en una tabla de búsqueda en la que los estándares de los datos de video están asociados con las frecuencias de control como se muestra en la figura 34. La frecuencia de control se puede seleccionar almacenando la tabla de búsqueda en la memoria intermedia ex508 y una memoria interna de un LSI y con referencia a la tabla de búsqueda de la CPU ex502.
La figura 33 ilustra las etapas para ejecutar un procedimiento en esta realización. Primero, en la etapa exS200, la unidad de procesamiento de señal ex507 obtiene información de identificación de los datos multiplexados. A continuación, en la etapa exS201, la CPU ex502 determina si los datos de video se generan o no en base a la información de identificación mediante el procedimiento de codificación y el aparato de codificación descrito en cualquiera de las realizaciones. Cuando los datos de video se generan mediante el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, en la etapa exS202, la CPU ex502 transmite una señal para establecer la frecuencia de control a una frecuencia de control más alta a la unidad de control de frecuencia de control ex512. Entonces, la unidad de control de frecuencia de control ex512 establece la frecuencia de control a la frecuencia de control más alta. Por otro lado, cuando la información de identificación indica que los datos de video se ajustan a cualquiera de los estándares convencionales tales como MPEG-2, MPEG-4 AVC y VC-1, en la etapa exS203, la CPU ex502 transmite una señal para la configuración de la frecuencia de control a una frecuencia de control inferior a la unidad de control de frecuencia de control ex512. Entonces, la unidad de control de frecuencia de control ex512 ajusta la frecuencia de control a la frecuencia de control más baja que en el caso en que los datos de video sean generados por el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones.
Además, junto con la conmutación de las frecuencias de control, el efecto de conservación de energía puede mejorarse cambiando el voltaje que se aplicará al LSI ex500 o un aparato que incluye el LSI ex500. Por ejemplo, cuando la frecuencia de control se establece más baja, el voltaje que se aplicará al LSI ex500 o al aparato que incluye el LSI ex500 probablemente se configure a un voltaje más bajo que en el caso en que la frecuencia de control se establezca más alta.
Además, cuando la cantidad de procesamiento para la decodificación es mayor, la frecuencia de control puede establecerse más alta, y cuando la cantidad de procesamiento para la decodificación es menor, la frecuencia de control puede establecerse más baja como el procedimiento para establecer la frecuencia de control. Por lo tanto, el procedimiento de configuración no se limita a los descritos anteriormente. Por ejemplo, cuando la cantidad de procesamiento para decodificar datos de video de conformidad con MPEG-3 AVC es mayor que la cantidad de procesamiento para decodificar datos de video generados por el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, la frecuencia de control probablemente se establece en orden inverso al ajuste descrito anteriormente.
Además, el procedimiento para establecer la frecuencia de control no se limita al procedimiento para establecer la frecuencia de control más baja. Por ejemplo, cuando la información de identificación indica que los datos de video se generan mediante el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, el voltaje que se aplicará al LSI ex500 o al aparato que incluye el LSI ex500 probablemente esté más alto. Cuando la información de identificación indica que los datos de video se ajustan al estándar convencional, como MPEG-2, MPEG-4 AVC y VC-1, el voltaje que se aplicará al LSI ex500 o al aparato que incluye el LSI ex500 probablemente esté configurado inferior. Como otro ejemplo, cuando la información de identificación indica que los datos de video son generados por el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, el control de la CPU ex502 probablemente no tenga que suspenderse. Cuando la información de identificación indica que los datos de video se ajustan al estándar convencional, como MPEG-2, MPEG-4 AVC y VC-1, el control de la c Pu ex502 probablemente se suspende en un momento dado porque la CPU ex502 tiene más capacidad de procesamiento. Incluso cuando la información de identificación indica que los datos de video se generan mediante el procedimiento de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descrito en cualquiera de las realizaciones, en el caso en que la CPU ex502 puede tener un retraso de tiempo, el control de la CPU ex502 probablemente se suspende en un momento dado. En tal caso, el tiempo de suspensión probablemente se establece más corto que en el caso en que la información de identificación indica que los datos de video se ajustan a cualquiera de los estándares convencionales como MPEG-2, MPEG-4 AVC y VC-1 .
De acuerdo con lo anterior, el efecto de ahorro de energía se puede mejorar cambiando entre las frecuencias de control de acuerdo con el estándar al que se ajustan los datos de video. Además, cuando el LSI ex500 o el aparato que incluye el LSI ex500 se controla con una batería, la vida útil de la batería se puede extender con el efecto de ahorro de energía.
[Realización 71
Hay casos en los que se proporciona una pluralidad de datos de video que se ajusta a un estándar diferente a los dispositivos y sistemas, tales como un televisor (receptor) y un teléfono móvil. Para permitir la decodificación de la pluralidad de datos de video que se ajustan a los diferentes estándares, la unidad de procesamiento de señal ex507 del LSI ex500 debe cumplir con los diferentes estándares. Sin embargo, los problemas de aumento en la escala del circuito del LSI ex500 y aumento en el coste surgen con el uso individual de la unidad de procesamiento de señal ex507 que se ajusta a los estándares respectivos.
Lo que se concibe para resolver el problema es una estructura para compartir parcialmente la unidad de procesamiento de decodificación para implementar el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones y la unidad de procesamiento de decodificación que se ajusta a cualquiera de los estándares convencionales tales como MPEG-2, MPEG-4 AVC y VC-1. Un ejemplo de esta estructura se muestra como ex900 en la figura 35A. Por ejemplo, el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones y el procedimiento de decodificación de imágenes en movimiento que se ajusta a MPEG-4 AVC tienen, en parte en común, los detalles de procesos tales como codificación de entropía, cuantificación inversa, filtrado de desbloqueo y predicción de movimiento compensado. Los detalles de los procesos que se compartirán probablemente incluyan el uso de una unidad de procesamiento de decodificación ex902 que se ajuste a MPEG-4 AVC. Por el contrario, una unidad de procesamiento de decodificación dedicada ex901 probablemente se usa para otros procesos que es exclusiva de la presente invención y, por lo tanto, no se ajusta al AVC MPEG-4. En particular, la presente invención se caracteriza por la codificación de entropía. Así, por ejemplo, la unidad de procesamiento de decodificación ex901 se usa para la codificación de entropía, y una unidad de procesamiento de decodificación compartida se puede usar para cualquiera de los procesos, como la cuantificación inversa, el filtrado de desbloqueo y la compensación de movimiento. En cuanto a dicho intercambio de una unidad de procesamiento de decodificación, la unidad de procesamiento de decodificación compartida se usa para realizar procesos compartibles en el procedimiento de decodificación de imágenes en movimiento descrito en cualquiera de las realizaciones, mientras que una unidad de procesamiento de decodificación dedicada se puede usar para procesos exclusivos de MPEG- 4 AVC estándar.
Además, ex1000 en la figura 35B muestra otro ejemplo para compartir parcialmente dichos procesos. Este ejemplo utiliza una estructura que incluye una unidad de procesamiento de decodificación dedicada ex1001 que admite los procesos únicos de la presente invención, una unidad de procesamiento de decodificación dedicada ex1002 que admite los procesos únicos a otro de los estándares convencionales y una unidad de procesamiento de decodificación ex1003 que admite procesamiento para ser compartido entre el procedimiento de decodificación de imágenes en movimiento en la presente invención y el procedimiento convencional de decodificación de imágenes en movimiento. En el presente documento, las unidades de procesamiento de decodificación dedicadas ex1001 y ex1002 no están necesariamente especializadas para el procesamiento de la presente invención y el procesamiento de cualquiera de los estándares convencionales, respectivamente, y pueden ser las capaces de implementar el procesamiento general. Además, la estructura de esta realización puede implementarse mediante el LSI ex500.
Como tal, la escala del circuito de un LSI y el coste pueden reducirse compartiendo la unidad de procesamiento de decodificación para el procesamiento compartible entre el procedimiento de decodificación de imágenes en movimiento en la presente invención y el procedimiento de decodificación de imágenes en movimiento de conformidad con uno cualquiera de los estándares convencionales.
[Aplicabilidad industrial]
Un procedimiento de codificación de imágenes, un procedimiento de decodificación de imágenes, un aparato de codificación de imágenes, un aparato de decodificación de imágenes y un aparato de codificación y decodificación de imágenes son aplicables, por ejemplo, a aparatos de visualización de información y aparatos de captura de imágenes que soportan alta resolución. Ejemplos de tales aparatos incluyen un receptor de televisión, una grabadora de video digital, un sistema de navegación para automóviles, un teléfono móvil, una cámara digital y una cámara de video digital.
[Lista de signos de referencia]
10 Unidad de codificación aritmética
Unidad de binarización
Unidad de almacenamiento de probabilidad de ocurrencia de símbolos Unidad de control de contexto
Codificador aritmético binario
Unidad de codificación aritmética
Unidad de binarización
Unidad de almacenamiento de probabilidad de ocurrencia de símbolos Unidad de control de contexto
Codificador aritmético binario
Unidad de control de clasificación de bloque de contexto
Aparato de codificación de imagen
Restador
Unidad de transformación y cuantificación
Unidad de codificación de entropía
Unidad de cuantificación inversa y transformación inversa
Sumador
Filtro de desbloqueo
Memoria
Unidad de intrapredicción
Unidad de estimación de movimiento
Unidad de compensación de movimiento
Conmutador intra/inter
Unidad de decodificación aritmética
Decodificador aritmético binario
Unidad de almacenamiento de probabilidad de ocurrencia de símbolos Unidad de control de contexto
Unidad de conversión de valores múltiples
Unidad de control de clasificación de bloque de contexto
Aparato de decodificación de imagen
Unidad de decodificación de entropía
Unidad de cuantificación inversa y transformación inversa
Sumador
Filtro de desbloqueo
Memoria
Unidad de intrapredicción
Unidad de compensación de movimiento
Conmutador intra/inter
ex100 Sistema de suministro de contenido ex101 Internet
ex102 Proveedor de servicios de Internet ex103 Servidor de transmisión de flujos
ex104 Red telefónica
ex106, ex107, ex108, ex109, ex110 Estación base ex111 Ordenador
ex112 PDA
ex113, ex116 Cámara
ex114 Teléfono móvil (teléfono celular) con cámara ex115 Máquina de juego
ex117 Micrófono
ex200 Sistema de radio transmisión digital ex201 Estación de radio transmisión
ex202 Satélite de radio transmisión
ex203 Cable
ex204, ex205, ex601 Antena
ex210 Vehículo
ex211 Sistema de navegación para automóvil ex212 Aparato de reproducción
ex213, ex219 Monitor
ex214, ex215, ex216 , ex607 Medio de grabación ex217 Decodificador
ex218 Lector/Grabador
ex220 Controlador remoto
ex230 Pista de información
ex231 Bloque de grabación
ex232 Área de circunferencia interna
ex233 Área de grabación de datos
ex234 Área de circunferencia externa
ex300 Televisión (receptor)
ex301 Sintonizador
ex302 Unidad de modulación y demodulación ex303 Unidad de multiplexación y demultiplexación ex304 Unidad de procesamiento de señal de audio ex305 Unidad de procesamiento de señal de video ex306, ex507 Unidad de procesamiento de señal ex307 Altavoz
ex308, ex602 Unidad de pantalla
ex309 Unidad de salida
x310, ex501 Unidad de control
ex311, ex505, ex710 Unidad de circuito de suministro de energía ex312 Unidad de entrada de operación
ex313 Puente
ex314, ex606 Unidad de ranura
ex315 Controlador
ex316 Módem
ex317 Unidad de interfaz
ex318, ex319, ex320, ex321, ex404, ex508 Memoria intermedia ex400 Unidad de reproducción y grabación de información ex401 Cabezal óptico
ex402 Unidad de grabación de modulación
ex403 Unidad de reproducción y demodulación
ex405 Motor de disco
ex406 Unidad de control servo
ex407 Unidad de control de sistema
ex500 LSI
ex502 CPU
ex503 Controlador de memoria
ex504 Controlador de transmisiones de flujo
ex506 Transmisiones de flujo de E/S
ex509 E/S de AV
ex510 Bus
ex603 Unidad de cámara
ex604 Tecla de funcionamiento
ex605 Unidad de entrada de audio
ex608 Unidad de salida de audio
ex801 Unidad de procesamiento de decodificación
ex802 Unidad de procesamiento de decodificación
ex803 Unidad de conmutación de frecuencia de control

Claims (5)

REIVINDICACIONES
1. Un procedimiento de codificación de imagen para codificar datos de imagen por compresión que incluye una pluralidad de unidades de procesamiento que tienen diferentes tamaños que comprenden un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32, comprendiendo dicho procedimiento de codificación de imagen:
realizar una transformación de frecuencia en los datos de la imagen para generar coeficientes de transformación,
generar (S401) señales de corriente a codificar para cada una de las unidades de procesamiento de los datos de imagen, indicando cada una de dichas señales de corriente a codificar si un coeficiente de transformación cuantificado respectivo es cero o no cero;
generar (S402) una señal binaria realizando binarización en cada una de las señales de corriente a codificar;
almacenar una pluralidad de contextos estando cada uno asociado con una información de probabilidad codificada, que incluye
una pluralidad de primeros contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes posiciones de los coeficientes de transformación, en el que cada primer contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de posiciones diferentes,
una pluralidad de segundos contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada segundo contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de diferentes informaciones de condición circundante, y
una pluralidad de terceros contextos para cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada tercer contexto corresponde a una de una pluralidad de diferentes informaciones de condición circundante;
seleccionar (S403) un contexto para cada una de las señales de corriente a codificar entre la pluralidad de contextos sobre la base de un tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar, información de posición que indica una posición del coeficiente de transformación indicado por la señal de corriente a codificar, e indicando la información de la condición circundante si los coeficientes de transformación que rodean el coeficiente de transformación indicado por la señal de corriente a codificar son cero o no cero;
realizar codificación aritmética (S404) de la señal binaria utilizando información de probabilidad codificada asociada con el contexto seleccionado; y
actualizar (S405) la información de probabilidad codificada asociada con el contexto seleccionado, en función de la señal binaria generada,
en el que, en la etapa de selección, el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar y que corresponde a la información de posición se selecciona (S203) de la pluralidad de primeros contextos si el coeficiente de transformación indicado por el la señal de corriente a codificar se encuentra en un área de baja frecuencia (S202),
caracterizado porque en la etapa de selección,
el contexto que corresponde al tamaño de la unidad de procesamiento, incluida la señal de corriente a codificar y que corresponde a la información de condición circundante se selecciona (S216) de la pluralidad de segundos contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es menor que 16 x 16 (S205);
el contexto que corresponde a la información de condición circundante se selecciona (S207) de la pluralidad de terceros contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si un tamaño de la unidad de procesamiento que incluye la señal de corriente es igual a un tamaño de bloque mayor o igual a 16 x 16 (S205), compartiendo así el contexto entre las unidades de procesamiento que tienen diferentes tamaños de bloque mayores o iguales a 16 x 16.
2. Un procedimiento de decodificación de imagen para reconstruir datos de imagen codificada que incluye una pluralidad de unidades de procesamiento que tienen diferentes tamaños que comprenden un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32 decodificando los datos de imagen codificada, comprendiendo dicho procedimiento de decodificación de imagen:
obtener (S501) señales de corriente a decodificar para cada una de las unidades de procesamiento de los datos de imagen codificada, indicando cada una de dichas señales de corriente a decodificar si un coeficiente de transformación cuantificado respectivo es cero o no cero;
almacenar una pluralidad de contextos estando cada uno asociado con una información de probabilidad codificada, que incluye
una pluralidad de primeros contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes posiciones de los coeficientes de transformación, en el que cada primer contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de posiciones diferentes,
una pluralidad de segundos contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada segundo contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de diferentes informaciones de condición circundante y
una pluralidad de terceros contextos para cada una de la pluralidad de diferentes informaciones de condición circundante, en el que cada tercer contexto corresponde a una de una pluralidad de diferentes informaciones de condición circundante;
seleccionar (S502) un contexto para cada una de las señales de corriente a decodificar entre una pluralidad de contextos en función del tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar, información de posición que indica una posición del coeficiente de transformación indicado por la señal de corriente a decodificar, e indicando la información de condición circundante si los coeficientes de transformación que rodean el coeficiente de transformación indicado por la señal de corriente a decodificar son cero o no cero;
generar (S503) una señal binaria realizando la decodificación aritmética de la señal de corriente a decodificar utilizando información de probabilidad decodificada asociada con el contexto seleccionado en dicha selección;
reconstruir (S504) los datos de imagen codificada realizando una conversión de valores múltiples en la señal binaria; y actualizar (S505) la información de probabilidad decodificada asociada con el contexto seleccionado en dicha selección, en base a la señal binaria,
en el que, en la etapa de selección, el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar y que corresponde a la información de posición se selecciona de la pluralidad de primeros contextos si el coeficiente de transformación indicado por la señal de corriente a decodificar se encuentra en un área de baja frecuencia (S202);
caracterizado porque en la etapa de selección,
el contexto que corresponde al tamaño de la unidad de procesamiento, incluida la señal de corriente a decodificar y que corresponde a la información de condición circundante, se selecciona (S216) de la pluralidad de segundos contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es menor que 16 x 16 (S205);
el contexto que corresponde a la información de condición circundante se selecciona (S207) de la pluralidad de terceros contextos si el coeficiente de transformación indicado por la señal de corriente a decodificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es igual a un tamaño de bloque mayor o igual a 16 x 16 (S205), compartiendo así el contexto entre las unidades de procesamiento que tienen diferentes tamaños de bloque mayores o iguales a 16 x 16.
3. Un aparato de codificación de imagen que codifica por compresión datos de imagen que incluyen una pluralidad de unidades de procesamiento que tienen diferentes tamaños que comprenden un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32, comprendiendo dicho aparato de codificación de imagen:
una unidad de transformación (210) configurada para realizar una transformación de frecuencia en los datos de imagen para generar coeficientes de transformación,
una unidad de binarización configurada para generar señales de corriente a codificar para cada una de la pluralidad de unidades de procesamiento de los datos de imagen, indicando cada una de dichas señales de corriente a codificar si un coeficiente de transformación cuantificado respectivo es cero o no cero, y generar un señal binaria realizando binarización en cada una de las señales de corriente a codificar;
una unidad de almacenamiento configurada para almacenar una pluralidad de contextos cada uno asociado con una información de probabilidad codificada, que incluye
una pluralidad de primeros contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes posiciones de los coeficientes de transformación, en el que cada primer contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de posiciones diferentes,
una pluralidad de segundos contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada segundo contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de diferentes informaciones de condición circundante, y
una pluralidad de terceros contextos para cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada tercer contexto corresponde a una de una pluralidad de diferentes informaciones de condición circundante;
una unidad de control de selección de contexto configurada para seleccionar un contexto para cada una de las señales de corriente a codificar de entre la pluralidad de contextos en función del tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar, indicando la información de posición una posición del coeficiente de transformación indicado por la señal de corriente a codificar, e indicando la información de la condición circundante si los coeficientes de transformación que rodean el coeficiente de transformación indicado por la señal de corriente a codificar son cero o no cero;
una unidad de codificación aritmética configurada para realizar codificación aritmética de la señal binaria utilizando información de probabilidad codificada asociada con el contexto seleccionado; y
una unidad de control de contexto configurada para actualizar la información de probabilidad codificada asociada con el contexto seleccionado, basada en la señal binaria generada,
en el que la unidad de control de selección de contexto está configurada además para
seleccionar (S203) el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar y que corresponde a la información de posición se selecciona de la pluralidad de primeros contextos si el coeficiente de transformación indicado por la señal de corriente a codificar se encuentra en un área de baja frecuencia (S202);
caracterizado porque la unidad de control de selección de contexto está configurada además para
seleccionar (S216) el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a codificar y que corresponde a la información de condición circundante se selecciona (S216) de la pluralidad de segundos contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es menor que 16 x 16 (S205);
seleccionar (S207) el contexto que corresponde a la información de la condición circundante de la pluralidad de terceros contextos si el coeficiente de transformación indicado por la señal de corriente a codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es igual a un tamaño de bloque mayor o igual a 16 x 16 (S205), compartiendo así el contexto entre las unidades de procesamiento que tienen diferentes tamaños de bloque mayores o iguales a 16 x 16.
4. Un aparato de decodificación de imagen que reconstruye datos de imagen codificados que incluyen una pluralidad de unidades de procesamiento que tienen diferentes tamaños que comprenden un tamaño de bloque de 16 x 16 y un tamaño de bloque de 32 x 32 decodificando la imagen codificada, comprendiendo dicho aparato de decodificación de imagen:
una unidad de obtención configurada para obtener señales de corriente a decodificar para cada una de las unidades de procesamiento de los datos de imagen codificados, indicando cada una de dichas señales de corriente a decodificar si un coeficiente de transformación cuantificado respectivo es cero o no cero;
una unidad de almacenamiento configurada para almacenar una pluralidad de contextos cada uno asociado con una información de probabilidad codificada, que incluye
una pluralidad de primeros contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes posiciones de los coeficientes de transformación, en el que cada primer contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de posiciones diferentes,
una pluralidad de segundos contextos para cada una de una pluralidad de diferentes tamaños de las unidades de procesamiento y cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada segundo contexto corresponde a una de la pluralidad de diferentes tamaños y a una de la pluralidad de diferentes informaciones de condición circundante, y
una pluralidad de terceros contextos para cada una de una pluralidad de diferentes informaciones de condición circundante, en el que cada tercer contexto corresponde a una de una pluralidad de diferentes informaciones de condición circundante;
una unidad de control de selección de contexto configurada para seleccionar, entre la pluralidad de contextos, un contexto para cada una de las señales de corriente a decodificar en función del tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar, indicando la información de posición una posición del coeficiente de transformación indicado por la señal de corriente a decodificar, e indicando la información de condición circundante si los coeficientes de transformación que rodean el coeficiente de transformación indicado por la señal de corriente a decodificar son cero o no cero;
una unidad de decodificación aritmética configurada para generar una señal binaria realizando la decodificación aritmética de la señal de corriente a decodificar utilizando información de probabilidad decodificada asociada con el contexto seleccionado en dicha selección; y
una unidad de conversión de valores múltiples configurada para reconstruir los datos de la imagen mediante la conversión de valores múltiples en la señal binaria,
una unidad de control de contexto configurada para ejecutar un proceso de actualización para actualizar la información de probabilidad decodificada asociada con el contexto seleccionado en función de la señal binaria,
en el que la unidad de control de selección de contexto está configurada además para
seleccionar (S203) el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar y que corresponde a la información de posición se selecciona de la pluralidad de primeros contextos si el coeficiente de transformación indicado por la señal de corriente a decodificar se encuentra en un área de baja frecuencia (S202);
caracterizado porque la unidad de control de selección de contexto está configurada además para
seleccionar (S216) el contexto que corresponde al tamaño de la unidad de procesamiento que incluye la señal de corriente a decodificar y que corresponde a la información de condición circundante se selecciona (S216) de la pluralidad de segundos contextos si el coeficiente de transformación indicado por la señal de corriente para codificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente es menor que 16 x 16 (S205);
seleccionar (S207) el contexto que corresponde a la información de condición circundante de la pluralidad de terceros contextos si el coeficiente de transformación indicado por la señal de corriente a decodificar no se encuentra en el área de baja frecuencia (S202) y si el tamaño de la unidad de procesamiento que incluye la señal de corriente que es igual a un tamaño de bloque mayor o igual a 16 x 16 (S205), compartiendo así el contexto entre las unidades de procesamiento que tienen diferentes tamaños de bloque mayores o iguales a 16 x 16.
5. Un aparato de codificación y decodificación de imagen que comprende un aparato de codificación de imagen de acuerdo con la reivindicación 3 y un aparato de decodificación de imagen de acuerdo con la reivindicación 4.
ES12733945T 2011-01-12 2012-01-12 Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen Active ES2802073T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161431912P 2011-01-12 2011-01-12
PCT/JP2012/000148 WO2012096178A1 (ja) 2011-01-12 2012-01-12 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置及び画像符号化復号装置

Publications (1)

Publication Number Publication Date
ES2802073T3 true ES2802073T3 (es) 2021-01-15

Family

ID=46455300

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12733945T Active ES2802073T3 (es) 2011-01-12 2012-01-12 Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen

Country Status (16)

Country Link
US (8) US8755620B2 (es)
EP (1) EP2665264B1 (es)
JP (2) JP6024904B2 (es)
KR (1) KR101854938B1 (es)
CN (2) CN107197263B (es)
AU (1) AU2012206251B2 (es)
BR (1) BR112013003437B1 (es)
CA (1) CA2807957C (es)
ES (1) ES2802073T3 (es)
MX (1) MX2013001594A (es)
MY (1) MY165358A (es)
PL (1) PL2665264T3 (es)
RU (1) RU2595641C2 (es)
SG (1) SG187805A1 (es)
TW (1) TWI572149B (es)
WO (1) WO2012096178A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9076239B2 (en) 2009-04-30 2015-07-07 Stmicroelectronics S.R.L. Method and systems for thumbnail generation, and corresponding computer program product
WO2012114711A1 (ja) * 2011-02-23 2012-08-30 パナソニック株式会社 画像符号化方法および画像復号方法
US9379736B2 (en) 2011-06-03 2016-06-28 Qualcomm Incorporated Context-adaptive coding video data
US8805099B2 (en) * 2011-06-22 2014-08-12 Panasonic Intellectual Property Corporation Of America Image decoding method and image coding method
US20130003858A1 (en) * 2011-06-30 2013-01-03 Vivienne Sze Simplified Context Selection For Entropy Coding of Transform Coefficient Syntax Elements
US20130101047A1 (en) * 2011-10-19 2013-04-25 Sony Corporation Context reduction of significance map coding of 4x4 and 8x8 transform coefficient in hm4.0
CN111683255B (zh) * 2012-01-20 2022-08-02 索尼公司 有效度图编码的复杂度降低
GB2523348B (en) * 2014-02-20 2016-03-30 Gurulogic Microsystems Oy Encoder, decoder and method
FR3023112A1 (fr) * 2014-06-27 2016-01-01 Bcom Procede de codage d'une image numerique, procede de decodage, dispositifs et programmes d'ordinateurs associes
US10250912B2 (en) * 2015-02-17 2019-04-02 Mediatek Inc. Method and apparatus for entropy decoding with arithmetic decoding decoupled from variable-length decoding
MY190934A (en) * 2015-12-14 2022-05-23 Panasonic Ip Corp America Three-dimensional data encoding method, three-dimensional data decoding method, three-dimensional data encoding device, and three-dimensional data decoding device
GB201616777D0 (en) 2016-10-03 2016-11-16 Univ Southampton A frame for an implantable medical device and a method of manufacturing a frame for an implantable medical device
BR112019019702A2 (pt) * 2017-03-21 2020-04-14 Lg Electronics Inc método de transformada em sistema de codificação de imagem e aparelho para o mesmo
EP3503557A1 (en) * 2017-12-22 2019-06-26 Thomson Licensing Method and apparatus for video encoding and decoding based on context switching

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6856701B2 (en) * 2001-09-14 2005-02-15 Nokia Corporation Method and system for context-based adaptive binary arithmetic coding
JP4368575B2 (ja) 2002-04-19 2009-11-18 パナソニック株式会社 可変長復号化方法、可変長復号化装置およびプログラム
JP4090862B2 (ja) 2002-04-26 2008-05-28 松下電器産業株式会社 可変長符号化方法および可変長復号化方法
EP2202989B1 (en) 2002-04-26 2014-04-16 NTT DoCoMo, Inc. Image encoding apparatus, image decoding apparatus, image encoding method, image decoding method, image encoding program, and image decoding program
JP4230188B2 (ja) 2002-06-06 2009-02-25 パナソニック株式会社 可変長符号化方法および可変長復号化方法
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
JP3959039B2 (ja) 2003-02-28 2007-08-15 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法、及び画像復号プログラム
EP1453004A2 (en) 2003-02-28 2004-09-01 NTT DoCoMo, Inc. Image encoding apparatus and method
US6900748B2 (en) 2003-07-17 2005-05-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for binarization and arithmetic coding of a data value
US7379608B2 (en) 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
JP2006019814A (ja) 2004-06-30 2006-01-19 Fujitsu Ltd エントロピ復号器
CN1589023A (zh) * 2004-08-06 2005-03-02 联合信源数字音视频技术(北京)有限公司 一种基于上下文的多码表变长编解码方法及编解码装置
KR100746007B1 (ko) 2005-04-19 2007-08-06 삼성전자주식회사 엔트로피 코딩의 컨텍스트 모델을 적응적으로 선택하는방법 및 비디오 디코더
KR100763181B1 (ko) * 2005-04-19 2007-10-05 삼성전자주식회사 기초계층과 향상계층의 데이터를 바탕으로 예측 정보를코딩하여 코딩율을 향상시키는 방법 및 장치
KR100873636B1 (ko) 2005-11-14 2008-12-12 삼성전자주식회사 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치
JP2007142637A (ja) * 2005-11-16 2007-06-07 Matsushita Electric Ind Co Ltd 画像情報符号化装置
KR100736104B1 (ko) 2006-04-06 2007-07-06 삼성전자주식회사 독립적 파싱을 지원하는 비디오 코딩 방법 및 장치
US7573407B2 (en) * 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
KR101356733B1 (ko) 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
NO328295B1 (no) 2007-12-20 2010-01-25 Tandberg Telecom As VLC-fremgangsmate og -innretning
US8891615B2 (en) 2008-01-08 2014-11-18 Qualcomm Incorporated Quantization based on rate-distortion modeling for CABAC coders
JP4962400B2 (ja) 2008-04-30 2012-06-27 ソニー株式会社 算術復号装置
WO2011002914A1 (en) * 2009-06-30 2011-01-06 Massachusetts Institute Of Technology System and method for providing high throughput entropy coding using syntax element partitioning
WO2011052234A1 (ja) 2009-11-02 2011-05-05 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置及び画像復号装置
EP2559166B1 (en) 2010-04-13 2017-11-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Probability interval partioning encoder and decoder
US8913666B2 (en) * 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
US20120082235A1 (en) 2010-10-05 2012-04-05 General Instrument Corporation Coding and decoding utilizing context model selection with adaptive scan pattern
US9042440B2 (en) 2010-12-03 2015-05-26 Qualcomm Incorporated Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding
US20120163456A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US20120163448A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Coding the position of a last significant coefficient of a video block in video coding
US9479784B2 (en) * 2011-01-06 2016-10-25 Samsung Electronics Co., Ltd. Encoding method and device of video using data unit of hierarchical structure, and decoding method and device thereof

Also Published As

Publication number Publication date
CN107197263A (zh) 2017-09-22
TW201246937A (en) 2012-11-16
US10015494B2 (en) 2018-07-03
CN103053161B (zh) 2017-08-01
US20230388506A1 (en) 2023-11-30
EP2665264A4 (en) 2016-04-27
JP6210396B2 (ja) 2017-10-11
US20120177300A1 (en) 2012-07-12
PL2665264T3 (pl) 2020-11-02
CN103053161A (zh) 2013-04-17
KR20130139224A (ko) 2013-12-20
US9258558B2 (en) 2016-02-09
CA2807957C (en) 2018-07-03
BR112013003437B1 (pt) 2022-03-08
AU2012206251A1 (en) 2013-02-21
MX2013001594A (es) 2013-04-29
KR101854938B1 (ko) 2018-05-04
BR112013003437A2 (pt) 2020-08-04
US8755620B2 (en) 2014-06-17
RU2013106272A (ru) 2015-02-20
EP2665264B1 (en) 2020-03-04
RU2595641C2 (ru) 2016-08-27
US20180278938A1 (en) 2018-09-27
CN107197263B (zh) 2019-11-19
US10638134B2 (en) 2020-04-28
JPWO2012096178A1 (ja) 2014-06-09
WO2012096178A1 (ja) 2012-07-19
JP6024904B2 (ja) 2016-11-16
US20170230665A1 (en) 2017-08-10
US20140241425A1 (en) 2014-08-28
US11770536B2 (en) 2023-09-26
MY165358A (en) 2018-03-21
US20160080741A1 (en) 2016-03-17
EP2665264A1 (en) 2013-11-20
US20220264096A1 (en) 2022-08-18
TWI572149B (zh) 2017-02-21
AU2012206251B2 (en) 2016-02-25
CA2807957A1 (en) 2012-07-19
US9681137B2 (en) 2017-06-13
US11350096B2 (en) 2022-05-31
SG187805A1 (en) 2013-04-30
JP2017034699A (ja) 2017-02-09
US20200221095A1 (en) 2020-07-09

Similar Documents

Publication Publication Date Title
ES2802073T3 (es) Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen
ES2844148T3 (es) Procedimiento de descodificación de imágenes, dispositivo de descodificación de imágenes
ES2807351T3 (es) Procedimiento de codificación de imágenes, procedimiento de descodificación de imágenes, dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y dispositivo de codificación/descodificación de imágenes
ES2800049T3 (es) Procedimientos y aparatos para codificar y decodificar vídeo utilizando una descripción actualizada de memoria intermedia
ES2923648T3 (es) Procedimiento de codificación de imágenes de vídeo, procedimiento de decodificación de imágenes de vídeo
ES2871858T3 (es) Método de codificación de imágenes y dispositivo de codificación de imágenes
ES2754784T3 (es) Procedimiento de decodificación de vídeo, aparato de decodificación de vídeo
ES2669978T3 (es) Método de filtrado, dispositivo de codificación de imágenes dinámicas, dispositivo de decodificación de imágenes dinámicas y dispositivo de codificación/decodificación de imágenes dinámicas
WO2012108205A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法、画像復号装置および画像符号化復号装置
ES2865101T3 (es) Procedimiento de codificación de imágenes, procedimiento de decodificación de imágenes, dispositivo de codificación de imágenes, dispositivo de decodificación de imágenes y dispositivo de codificación/decodificación de imágenes
WO2012096185A1 (ja) 画像符号化方法、画像符号化装置、画像復号方法、画像復号装置、および画像符号化復号装置
ES2782227T3 (es) Procedimiento de codificación de imagen, procedimiento de decodificación de imagen, dispositivo de codificación de imagen, dispositivo de decodificación de imagen y dispositivo de codificación/decodificación de imagen
AU2017225114B2 (en) Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
JP6489337B2 (ja) 算術復号方法および算術符号化方法
ES2874762T3 (es) Procedimiento de codificación de vídeo y procedimiento de decodificación de vídeo
WO2012098868A1 (ja) 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置、及び画像符号化復号装置
WO2011135829A1 (ja) 符号化方法及び復号方法
WO2012105267A1 (ja) 画像符号化方法