ES2608788T3 - Dispositivo de descodificación de video, método de descodificación de video y programa de descodificación de video - Google Patents

Dispositivo de descodificación de video, método de descodificación de video y programa de descodificación de video Download PDF

Info

Publication number
ES2608788T3
ES2608788T3 ES11843126.1T ES11843126T ES2608788T3 ES 2608788 T3 ES2608788 T3 ES 2608788T3 ES 11843126 T ES11843126 T ES 11843126T ES 2608788 T3 ES2608788 T3 ES 2608788T3
Authority
ES
Spain
Prior art keywords
pcm
decoding
block
size
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11843126.1T
Other languages
English (en)
Inventor
Keiichi Chono
Yuzo Senda
Junji Tajime
Hirofumi Aoki
Kenta Senzaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=46145598&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2608788(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by NEC Corp filed Critical NEC Corp
Application granted granted Critical
Publication of ES2608788T3 publication Critical patent/ES2608788T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/156Availability of hardware or computational resources, e.g. encoding based on power-saving criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S358/00Facsimile and static presentation processing
    • Y10S358/906Hand-held camera with recorder in a single unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Television Systems (AREA)

Abstract

Un dispositivo de descodificación de video que comprende: (a) medios (21; 201) de extracción para extraer información del tamaño de bloque PCM de un flujo de bits, indicando la información del tamaño de bloque PCM un umbral (pcmCodingUnitSize) para ser utilizado como un tamaño predeterminado por medios de análisis de cabecera PCM; (b) medios (22; 201) de determinación para determinar el umbral (pcmCodingUnitSize) basándose en la información del tamaño de bloque PCM extraído; (c) los medios (23; 204) de análisis de cabecera PCM para analizar una cabecera PCM de un flujo de bits con respecto a un bloque codificado, únicamente cuando el tamaño de bloque de dicho bloque codificado satisface una limitación basada en el umbral (pcmCodingUnitSize), siendo la cabecera PCM indicativa de la información de si dicho bloque codificado es un bloque que ha sido codificado mediante codificación PCM o no; (d) medios (24; 204) de descodificación de entropía para analizar datos transformados de un dato de error de predicción de una imagen en el flujo de bits; (e) medios (26; 203) de descodificación PCM para descodificar mediante datos PCM de descodificación PCM de la imagen en el flujo de bits; y (f) medios (27; 202) de control de descodificación para controlar los medios (24; 204) de descodificación de entropía y los medios (26; 203) de descodificación PCM basándose en la cabecera PCM analizada.

Description

5
10
15
20
25
30
35
40
45
50
DESCRIPCION
Dispositivo de descodificacion de video, metodo de descodificacion de video y programa de descodificacion de video Campo de la tecnica
La presente invencion se refiere a un dispositivo/metodo/programa de descodificacion de video que usa la codificacion PCM.
Tecnica anterior
La bibliograffa de patentes (PTL) 1 propone un metodo de codificacion de video para incrustar, en un flujo de bits de salida, informacion que indica un tipo de bloque que no esta sujeto a un proceso de transformacion y un proceso de codificacion de entropfa, con el fin de garantizar un cierto tiempo de procesamiento para un dispositivo de codificacion de video o un dispositivo de descodificacion de video.
Un ejemplo del tipo de bloque que no esta sujeto al proceso de transformacion y el proceso de codificacion de entropfa es la modulacion por impulsos codificados (PCM) descrito en la bibliograffa de no patentes (NPL) 1. El termino tipo de bloque significa un tipo de codificacion (mencionado mas adelante como prediccion intra, prediccion inter y PCM) utilizado para un bloque.
Un dispositivo de codificacion de video descrito en NPL 1 tiene una estructura mostrada en la figura 14. El dispositivo de codificacion de video mostrado en la figura 14 se referencia de aqu en adelante como un dispositivo de codificacion de video ffpico.
Mas adelante se describe una estructura y funcionamiento de un dispositivo de codificacion de video ffpico que recibe cada fotograma de video digitalizado como entrada y salidas de un flujo de bits, con referencia a la figura 14.
El dispositivo de codificacion de video mostrado en la figura 14 incluye un transformador/cuantificador 102, un codificador 103 de entropfa, un transformador inverso/cuantificador inverso 104, una memoria intermedia 105, un predictor 106, un codificador 107 de la PCM, un descodificador 108 de la PCM, un selector 109 de datos multiplexor, un multiplexor 110, un conmutador 121 y un conmutador 122.
El dispositivo de codificacion de video mostrado en la figura 14 divide cada fotograma en bloques de tamano 16 x 16 pfxeles llamados macro bloques (MBs), y codifica cada MB secuencialmente desde la parte superior izquierda del fotograma. En una AVC (codificacion de video avanzada) descrita en NPL 1, cada MB se divide ademas en bloques de tamano 4 x 4 pfxeles y cada bloque de tamano 4 x 4 pfxeles se codifica.
La figura 15 es un diagrama explicativo que muestra un ejemplo de division de bloques en el caso en el que el fotograma tiene una resolucion espacial QCIF (formato intermedio comun de un cuarto). A continuacion se describe la funcion de cada unidad si bien atendiendo unicamente a valores de luminancia de pixel en aras de la simplicidad.
Se substrae del bloque dividido de la entrada del video una senal de prediccion proporcionada desde el predictor 106 y el resultado se introduce en el transformador/cuantificador 102. Hay dos tipos de senal de prediccion, nominalmente, una senal de prediccion intra y una senal de prediccion inter. A continuacion se describen cada una de las senales de prediccion.
La senal de prediccion intra es una senal de prediccion generada en base a una imagen de una imagen reconstruida que tiene el mismo tiempo de visualizacion que una imagen actual y se almacena en la memoria intermedia 105. Con referencia a la 8.3.1 Intra_4x4 proceso de prediccion para muestras luma, 8.3.2 Intra_8x8 proceso de prediccion para muestras luma, y 8.3.3 Intra_16x16 proceso de prediccion para muestras luma en NPL 1 la prediccion intra de los tres tamanos de bloque, es decir Intra_4x4, Intra_8x8 e Intra_16x16 estan disponibles.
Intra_4x4 e Intra_8x8 son respectivamente la prediccion intra de tamano de bloque 4x4 y tamano de bloque 8x8, como puede entenderse a partir de (a) y (c) en la figura 16. Cada cffculo (o) en el dibujo representa un pixel de referencia utilizado para la prediccion intra, es decir un pixel de la imagen reconstruida que tiene el mismo tiempo de visualizacion que la imagen actual.
En la prediccion intra de Intra_4x4, los pfxeles perifericos reconstruidos se fijan directamente como pfxeles de referencia, y se utilizan para relleno (extrapolacion) en nueve direcciones mostradas en (b) en la figura 16 para formar la prediccion de senal. En la prediccion intra de Intra_8x8, los pfxeles obtenidos mediante suavizado de pfxeles perifericos de la imagen de la imagen reconstruida por los filtros de paso bajo (1/2, 1/4, 1/2) mostrados bajo la flecha hacia la derecha en (c) en la figura 16 se establecen como senales de referencia, y se utilizan para la extrapolacion en las nueve direcciones mostradas en (b) en la figura 16 para formar la senal de prediccion.
Similarmente, Intra_16x16 es la prediccion intra de tamano de bloque 16 x 16, como se puede entender a partir de (a) en la figura 17. Cada cffculo (o) en el dibujo representa un pixel de referencia utilizado para la prediccion intra, es decir un pixel de la imagen reconstruida que tiene el mismo tiempo de visualizacion que la imagen actual, como en la figura 16. En la prediccion intra de Intra_16x16, los pfxeles perifericos de la imagen reconstruida se fijan
5
10
15
20
25
30
35
40
45
50
55
directamente como p^xeles de referencia, y se utilizan para la extrapolacion en cuatro direcciones mostradas en (b) en la figura 17 para formar la senal de prediccion.
De aqm en adelante, un MB y un bloque codificado utilizando la senal de prediccion intra son referenciados respectivamente como un MB intra y un bloque intra, un tamano de bloque de prediccion intra es referenciado como un tamano de bloque de prediccion intra, y una direccion de extrapolacion es referenciada como una direccion de prediccion intra. El tamano de bloque de prediccion intra y la direccion de prediccion intra son parametros de prediccion relacionados con la prediccion intra.
La senal de prediccion de intertrama es una senal de prediccion generada a partir de una imagen de una imagen reconstruida que tiene un tiempo de visualizacion diferente que el que tiene una imagen actual y se almacena en la memoria intermedia 105. De aqm en adelante, un MB y un bloque codificado utilizando la senal de prediccion de intertrama son referidos respectivamente como un MB inter y un bloque inter. Un tamano de bloque de prediccion inter (tamano de bloque de prediccion inter) se puede seleccionar a partir de , por ejemplo, 16 x 16, 16 x 8, 8 x 16, 8 x 8, 8 x 4, 4 x 8 y 4 x 4.
La figura 18 es un diagrama explicativo que muestra un ejemplo de la prediccion de intertrama utilizando un tamano de bloque de 16 x 16. Un vector de movimiento MV = (mvx, mvy) mostrado en la figura 18 es un parametro de prediccion de la prediccion intertrama, que indica la cantidad de traslacion paralela de un bloque de prediccion intertrama (senal de prediccion intertrama) de una imagen de referencia en relacion con un bloque a codificar . En una AVC, los parametros de prediccion de la prediccion intertrama incluyen no solamente una direccion de prediccion intertrama que representa una direccion de la imagen de referencia de la senal de prediccion intertrama relativa a la imagen a codificar del bloque a codificar, sino tambien un mdice de imagen de referencia para identificar la imagen de referencia utilizada para la prediccion intertrama del bloque a codificar. Esto es porque, en una AVC, pueden ser utilizadas una pluralidad de imagenes de referencia almacenadas en la memoria intermedia 105 para la prediccion intertrama.
La prediccion intertrama se describe con mayor detalle en el proceso de prediccion 8.4 Inter en NPL 1.
Una imagen codificada que incluye solamente MBs intra se denomina imagen I. Una imagen codificada que incluye no solamente MBs intra sino tambien MBs inter se denomina imagen P. Una imagen codificada que incluye MBs inter que utiliza no solamente una imagen de referencia sino dos imagenes de referencia simultaneamente para la prediccion intertrama se denomina imagen B. En la imagen B, la prediccion intertrama en la que la direccion de la imagen de referencia de la senal de prediccion intertrama en relacion con la imagen a codificar del bloque a codificar es el pasado se denomina prediccion hacia delante, prediccion intertrama en la que la direccion de la imagen de referencia de la senal de prediccion intertrama en relacion con la imagen a codificar del bloque a codificar es el futuro se denomina prediccion hacia atras, y la prediccion intertrama que involucra tanto el pasado como el futuro se denomina prediccion bidireccional. La direccion de prediccion intertrama (direccion de prediccion inter) es un parametro de prediccion de la prediccion intertrama.
El transformador /cuantificador 102 de frecuencia transforma la imagen (imagen de error de prediccion) a partir de la cual se ha substrafdo la senal de prediccion.
El transformador/cuantificador 102 cuantifica ademas la imagen de error de prediccion de frecuencia transformada (coeficiente de transformacion de frecuencia), con un ancho Qs de paso de cuantificacion predeterminado. De aqm en adelante, el coeficiente de transformacion de frecuencia cuantificado se refiere a un valor de cuantificacion de transformacion.
El codificador 103 de entropfa codifica la entropfa de los parametros de prediccion y el valor de cuantificacion transformacion. Los parametros de prediccion son la informacion en relacion a MB y prediccion de bloque, tales como un bloque tipo (prediccion intra, prediccion inter y la PCM), tamano de bloque de prediccion intra, direccion de prediccion intra, tamano de bloque de prediccion inter y vector de movimiento mencionado anteriormente.
El transformador inverso/cuantificador inverso 104 cuantifica a la inversa el valor de cuantificacion de transformacion, con el ancho Qs de paso de cuantificacion. El transformador inverso/cuantificador inverso 104 transforma ademas la frecuencia inversa del coeficiente de transformacion de frecuencia obtenido por cuantificacion inversa. La senal de prediccion se anade a la imagen de error de prediccion reconstruida obtenida por transformacion de la frecuencia inversa, y el resultado se suministra al conmutador 122.
El selector 109 de datos multiplexor controla la cantidad de datos de entrada del codificador 103 de entropfa que corresponden al MB a codificar. En el caso en el que el codificador 103 de entropfa es capaz de codificar la entropfa de los datos de entrada dentro del tiempo de procesamiento del MB, el selector 109 de datos multiplexor selecciona los datos de salida del codificador 103 de entropfa, y como resultado suministra los datos seleccionados al multiplexor 110 a traves del conmutador 121. El selector 109 de datos multiplexor selecciona ademas los datos de salida del transformador inverso/cuantificador inverso 104, y como resultado suministra los datos seleccionados a la memoria intermedia 105 a traves del conmutador 122.
En el caso en el que el codificador 103 de entropfa no es capaz de codificar la entropfa de los datos de entrada
5
10
15
20
25
30
35
40
45
50
dentro del tiempo de procesamiento del MB, el selector 109 de datos multiplexor selecciona los datos de salida del codificador 107 de la PCM obtenidos por la PCM que codifica el video del MB, y como resultado suministra los datos seleccionados al multiplexor 110 a traves del conmutador 121. El selector 109 de datos multiplexor selecciona ademas los datos de salida del descodificador 108 de la PCM obtenidos por la PCM que descodifica los datos de salida de la PCM codificador 107, y como resultado los datos seleccionados se suministran a la memoria intermedia 105 a traves del conmutador 122.
La memoria intermedia 105 almacena la imagen reconstruida suministrada a traves del conmutador 122. La imagen reconstruida por trama se referencia como una imagen reconstruida.
El multiplexor 110 multiplexa los datos de salida del codificador 103 de entropfa y el codificador 107 de la PCM, y envfa el resultado del multiplexado.
Basado en la operacion anteriormente descrita, el multiplexor 110 en el dispositivo de codificacion de video genera el flujo de bits.
Lista de referencias
Bibliograffa de patentes
PTL 1: Solicitud de patente japonesa abierta a la inspeccion publica n° 2004-135251 Bibliograffa de no patentes
NPL 1: ISO/IEC 14496-10 Codificacion de video avanzada
NPL 2: “Test Model under Consideration”, documento: JCTVC-B205, Joint Collaborative Team on Video Coding (JCT-VC) de ITU-T SG16 WP3 y ISO/IEC JTC1/SC29/WG11 segunda reunion: Genova, CH, 21-28 julio, 2010
NPL 3: W.-J. Chen, X. Wang y M. Karczewicz, “CE5 Improved coding of inter prediction mode with LCEC,” JCTVC- D370
NPL 4: S. Liu, Y.-W. Huang, S. Lei, “Remove Partition Size NxN,” JCTVC-D432 Resumen de la invencion Problema tecnico
La tecnica ffpica descrita anteriormente garantiza un cierto tiempo de procesamiento para un dispositivo de codificacion de video o un dispositivo de descodificacion de video mediante la utilizacion, en MBs, de la PCM que no incluye un proceso de transformacion y un proceso de codificacion de entropfa.
Sin embargo, la tecnica ffpica descrita anteriormente se basa en la codificacion de video que utiliza MBs de un tamano de unidad de codificacion fijo (tamano CU). En consecuencia, como se describe en NPL 2, cuando la tecnica ffpica descrita anteriormente se aplica a la codificacion de video (de aqu en adelante denominada como esquema de modelo de prueba considerado (esquema TMuC)) que utiliza unidades de codificacion (bloques de codificacion en arbol (CTBs)) de una estructura de arbol de cuatro ramas mostrada en la figura 19 en donde el tamano CU y la informacion (cabecera de PCM) que indica que la PCM esta incrustada en el flujo de bits de salida en CTBs de todas las capas (es decir todas las profundidades), existe un problema que la relacion del numero de bits de la cabecera de la PCM incluido en el flujo de bits aumenta y por lo tanto la calidad del video comprimido disminuye.
En este documento, un CTB maximo se refiere al bloque de codificacion en arbol mas grande (LCTB), y un CTB mmimo se refiere al bloque de codificacion en arbol mas pequeno (SCTB). En esta descripcion, un bloque correspondiente al CTB se refiere a una unidad de codificacion (CU). Ademas, el concepto de una unidad de prediccion (PU) (ver figura 20) como una unidad de prediccion para la CU se introduce en el esquema TMuC. La figura 20 es un diagrama explicativo para describir la PU, en el que solamente las cuadradas de entre las formas mostradas en la figura 20 son compatibles como el tamano de bloque de prediccion intra.
NPL 3 describe mejoras en la senalizacion de prediccion inter. NPL 4 describe mejoras en la senalizacion de prediccion inter y prediccion intra.
Para resolver el problema de la tecnica ffpico descrito anteriormente, se toma en consideracion el punto en el que en una PCM se puede seleccionar una CU de capa superior con el fin de garantizar un cierto tiempo de procesamiento de un dispositivo de codificacion de video o un dispositivo de descodificacion de video. La CU de capa superior es una CU de un valor de profundidad menor, como se puede ver en la figura 19. El numero de CUs de capa superior por trama es menor porque su tamano de bloque es mayor. Ya que el numero de CUs de capa superior es mas pequeno, la relacion del numero de bits de la cabecera de PCM incluido en el flujo de bits se puede reducir.
En la presente invencion, el problema se resuelve mediante la limitacion de la profundidad de la CU para la que la
5
10
15
20
25
30
35
40
45
cabecera de PCM se transmite, en codificacion de video basado en codificacion de PCM. Es dedr, en la presente invencion el tamano de la CU para el cual la cabecera de la PCM se transmite esta limitado a un tamano predeterminado.
Solucion del problema
Mas concretamente, el problema se resuelve por las caractensticas de las reivindicaciones.
Efectos ventajosos de la invencion
De acuerdo con la presente invencion, el tamano de la unidad de codificacion para la que se senala la cabecera de la PCM esta limitado al tamano predeterminado, de modo que la relacion del numero de bits de la cabecera de la PCM en el flujo de bits se puede mantener bajo y la calidad del video comprimido se puede mantener, garantizando un cierto tiempo de procesamiento para el dispositivo de codificacion de video.
Ademas, de acuerdo con la presente invencion, la interoperabilidad del dispositivo de codificacion de video y del dispositivo de descodificacion de video se puede mejorar mediante la incorporacion, en le flujo de bits, de la informacion del tamano de la unidad de codificacion de la PCM para la senalizacion del tamano predeterminado en el dispositivo de descodificacion de video.
Breve descripcion de los dibujos
[Fig. 1] La figura 1 es un diagrama de bloques de un dispositivo de codificacion de video como referencia.
[Fig. 2] La figura 2 es un diagrama explicativo de la lista 1 que indica una cabecera de PCM en la sintaxis de PU.
[Fig. 3] La figura 3 es un diagrama explicativo de la lista 2 que indica informacion de tamano de unidad de codificacion de la PCM en un conjunto de parametros de secuencia.
[Fig. 4] La figura 4 es un diagrama de flujo que muestra una operacion de escritura cabecera PCM .
[Fig. 5] La figura 5 es un diagrama de bloques de un dispositivo de descodificacion de video segun una primera realizacion de la presente invencion.
[Fig. 6] La figura 6 es un diagrama de flujo que muestra una operacion PCM cabecera de analisis.
[Fig. 7] La figura 7 es un diagrama explicativo de la lista 3 que indica la informacion de tamano de la unidad de codificacion PCM en un conjunto de parametros de imagen.
[Fig. 8] La figura 8 es un diagrama explicativo de la lista 4 que indica la informacion de tamano de la unidad de codificacion PCM en una cabecera de seccion.
[Fig. 9] La figura 9 es un diagrama explicativo de la lista 1 que indica una cabecera de PCM en la sintaxis de PU segun otra referencia.
[Fig. 10] La figura 10 es un diagrama de flujo que muestra una operacion de analisis de cabecera PCM segun una segunda realizacion de la presente invencion.
[Fig. 11] La figura 11 es un diagrama de bloques que muestra un ejemplo estructural de un sistema de procesamiento de informacion capaz de realizar funciones de un dispositivo de codificacion de video, y funciones de un dispositivo de descodificacion de video segun la presente invencion.
[Fig. 12] La figura 12 es un diagrama de bloques que muestra una parte principal de un dispositivo de codificacion de video.
[Fig. 13] La figura 13 es un diagrama de bloques que muestra una parte principal de un dispositivo de codificacion de video segun la presente invencion.
[Fig. 14] La figura 14 es un diagrama de bloques de un dispositivo de codificacion de video tfpico.
[Fig. 15] La figura 15 es un diagrama explicativo que muestra un ejemplo de division de bloques.
[Fig. 16] La figura 16 es un diagrama explicativo para describir tipos de prediccion.
[Fig. 17] La figura 17 es un diagrama explicativo para describir tipos de prediccion.
[Fig. 18] La figura 18 es un diagrama explicativo que muestra un ejemplo de prediccion intertrama utilizando tamano de bloque 16 x 16 como ejemplo.
[Fig. 19] La figura 19 es un diagrama explicativo para describir un CTB.
5
10
15
20
25
30
35
40
45
50
55
[Fig. 20] La figura 20 es un diagrama explicativo para describir una PU.
Descripcion de realizacion(es)
Ejemplo de referencia 1
El ejemplo de referencia 1 muestra un dispositivo de codificacion de video que incluye: medios para seleccionar datos de salida de medios de codificacion de entropfa o medios de codificacion de PCM en un tamano establecido de CU desde el exterior; medios para incorporar, en un flujo de bits, una cabecera de PCM en el tamano establecido de CU desde el exterior; y medios para incorporar, en el flujo de bits, informacion relativa al tamano de la unidad de codificacion de la PCM para la senalizacion del tamano establecido de CU desde el exterior a un dispositivo de descodificacion de video.
Para proporcionar la descripcion utilizando ejemplos espedficos, en esta referencia se asume que el tamano de la CU para el cual esta incrustado el encabezado de PCM en le flujo de bits es mayor que o igual al tamano de un PCM de codificacion de tamano de la unidad fijado desde el exterior (pcmCodingUnitSize). Tambien se supone que los tamanos de unidad de codificacion disponibles son 128, 64, 32, 16 y 8, y pcmCodingUnitSize es 16. Ademas se supone que la informacion relacionada con el PCM de codificacion de tamano de la unidad es log (logaritmo) en base 2 de un valor obtenido dividiendo el tamano de la unidad de codificacion de la PCM por el tamano de la unidad de codificacion mmimo, como se describe mas tarde. Por consiguiente, en esta referencia, los tamanos de bloques correspondientes a tamanos de CU para los cuales la cabecera de la PCM se incorpora en el flujo de bits son 128 x 128, 64 x 64, 32 x 32 y 16 x 16. Ademas, un valor espedfico del tamano de la CU incorporado en la informacion relacionada en el flujo de bits es 1 (= log2 (16/8)).
Como se muestra en la figura 1, el dispositivo de codificacion en esta referencia incluye un transformador/cuantificador 102, un codificador 103 de entropfa, un transformador inverso/cuantificador inverso 104, una memoria intermedia 105, un predictor 106, un codificador 107 PCM, un decodificador 108 PCM, un selector 109 de datos multiplexor, un multiplexor 110, un conmutador 121 y un conmutador 122, como el dispositivo de codificacion de video tfpico mostrado en la figura 14. El dispositivo de codificacion de video en esta referencia mostrado en la figura 1 difiere del dispositivo de codificacion de video mostrado en la figura 14 en la que pcmCodingUnitSize se suministra al selector 109 de datos multiplexor con el fin de transmitir la cabecera de la PCM en un tamano de la CU mayor que o igual a pcnCodingUnitSize, y pcmCodingUnitSize se suministra tambien al multiplexor 110 con el fin de senalar pcmCodingUnitSizeal dispositivo de descodificacion de video.
Una senal de prediccion suministrada desde el predictor 106 se substrae de la entrada de video de un tamano de CU y el resultado se introduce en el transformador/cuantificador 102.
El transformador/cuantificador 102 de frecuencia transforma la imagen (imagen de error de prediccion) de la cual se ha substrafdo la senal de prediccion.
El transformador/cuantificador 102 cuantifica ademas de la imagen de error de prediccion de la transformada de frecuencia (frecuencia de coeficiente de la transformada) con un ancho Qs de paso de cuantificacion.
El codificador 103 de entropfa codifica la entropfa split_coding_unit_flag (ver figura 19) para senalizacion del tamano de la CU, parametros de prediccion suministrados desde el predictor 106, y el valor de cuantificacion transformado suministrado desde transformador/cuantificador 102. Los parametros de prediccion son la informacion relacionada con la prediccion de la CU a codificar, tales como tipo de bloque (prediccion intra, prediccion inter y PCM), tamano de bloque de prediccion intra, la direccion de prediccion intra, tamano de bloque de prediccion inter y vector de movimiento.
Basado en el pcmCodingUnitSize establecido desde la salida a traves del selector 109 de datos multiplexor, el codificador 103 de entropfa en esta referencia codifica la entropfa de sintaxis pcm_flag, lo cual indica ON/OFF de la codificacion PCM, como OFF, en el caso en que la CU a codificar tiene un tamano mayor que o igual a pcmCodingUnitSize y tiene tambien un modo de prediccion de prediccion intra.
El transformador inverso/cuantificador inverso 104 cuantifica inverso el valor de cuantificacion a transformar, con el ancho Qs de paso de cuantificacion. El transformador inverso/cuantificador inverso 104 transforma ademas la frecuencia inversa del coeficiente de frecuencia a transformar obtenida mediante la cuantificacion inversa. La senal de prediccion se anade a la imagen de error de prediccion reconstruida obtenida mediante la transformacion de frecuencia inversa y el resultado se suministra al conmutador 122.
El selector 109 de datos multiplexor controla la cantidad de datos de entrada del codificador 103 de entropfa que corresponden a la CU a codificar que es mayor que o igual a pcmCodingUnitSize. En el caso en que el codificador 103 de entropfa es capaz de codificar la entropfa de los datos de entrada dentro del tiempo de procesamiento de la CU a codificar que es mayor que o igual a pcmCodingUnitSize, el selector 109 de datos multiplexor selecciona los datos de salida del codificador 103 de entropfa, y como resultado los datos seleccionados a suministrar al multiplexor 110 a traves del conmutador 121. El selector 109 de datos multiplexor selecciona ademas los datos de salida del transformador inverso/cuantificador inverso 104, y como resultado los datos seleccionados a suministrar a
5
10
15
20
25
30
35
40
45
50
la memoria intermedia 105 a traves del conmutador 122.
En el caso en el que el codificador 103 de entropfa no es capaz de codificar la entrc^a de los datos de entrada dentro del tiempo de procesamiento de la CU a codificar, el selector 109 de datos multiplexor provoca como resultado primero que el codificador 103 de entropfa codifique la entropfa e informacion de salida que indica que el CU mayor que o igual a pcmCodingUnitSize es codificado mediante el codificador PCM. En detalle, el selector 109 de datos multiplexor provoca el codificador 103 de entropfa para codificar la entropfa y salida sintaxis mode_table_idx, que indica un tipo de bloque, como de prediccion intra, y codificador de entropfa y salida la sintaxis pcm_flag, que indica ON/OFF de codificacion de la PCM, como ON, en una cabecera de PU de la Cu.
A continuacion, los bits de salida del codificador 103 de entropfa son alineados por bytes. En detalle, el codificador 103 de entropfa suministra una cantidad predeterminada de sintaxis pcm_alignment_zero_bit al multiplexor 110. Ademas, se inicializa un aparato codificador del codificador 103 de entropfa para la codificacion subsiguiente.
Despues que el aparato se inicializa, el codificador 107 de la PCM codifica mediante la PCM el video de entrada de la CU. Los datos de salida pcm_sample_luma[i] de luminancia del codificador 107 de la PCM tienen una longitud de bit de pixel bit_depth_luma de luminancia del video de entrada. Aqrn, i (0 < i < 255) es un mdice de exploracion de trama dentro del bloque de la CU. Igualmente, los datos de salida pcm_sample_chroma[i] (i: 0 < i < 128) de diferencia de color del codificador 107 de la PCM tiene una longitud de bit de pixel bit_depth_chroma de diferencia de color del video de entrada.
Despues que el video de entrada de la CU esta codificado por codificacion de la PCM, el decodificador 108 PCM decodifica mediante descodificacion PCM pcm_sample_luma[i] y pcm_sample_chroma[i].
Despues de la descodificacion PCM, el selector 109 de datos multiplexor selecciona los datos de salida del codificador 107 PCM, y como resultado los datos seleccionados a suministrar al multiplexor 110 a traves del conmutador 121.
Finalmente, el selector 109 de datos multiplexor selecciona los datos de salida del decodificador 108, y como resultado los datos seleccionados a suministrar a la memoria intermedia 105 a traves del conmutador 122.
A la hora de cumplir con la especificacion de las funciones sintacticas, categonas y descriptores en NPL 1 y sintaxis de la unidad de prediccion 4.1.10 en NPL 2, antes mencionadas sintaxis mode_table_idx, sintaxis pred_mode, sintaxis pcm_flag y sintaxis pcm_alignment_zero_bit se pueden senalar como representadas en la lista 1 mostrada en la figura 2. En la lista 1, una variable pcm_unit_flag que es una condicion de senalizacion de la sintaxis pcm_alignment_zero_bit esta ON solamente en el caso en el que la sintaxis pcm_flag para codificacion PCM este senalado ON. Por otra parte, la variable pcm_unit_flag esta OFF. Esta referencia tiene una caractenstica que, en la lista 1, la sintaxis pcm_flag esta solamente senalada en la cabecera de la PU de la CU del tamano mayor que o igual a pcmCodingUnitSize, de acuerdo con la condicion “ si(currPreUnitSize > pcmCodingUnitSize)”.
El multiplexor 110 multiplexa la informacion (max_pcm_coding_unit_hierarchy_depth) en relacion al tamano de la unidad de codificacion de la PCM y los datos de salida del codificador 103 de entropfa y el codificador 107 de la PCM, y salidas resultado del multiplexado. A la hora de cumplir con la secuencia 4.1.2 del parametro establecida sintaxis RBSP en NPL 2, sintaxis max_pcm_coding_unit_hierarchy_depth log (logaritmo) base 2 del valor obtenido mediante el cociente del tamano de la unidad de codificacion de la PCM por el tamano de la unidad de codificacion mmimo, (“1” en esta referencia) se multiplexa a continuacion la sintaxis log2_min_coding_unit_size_minus3 y la sintaxis max_coding_unit_hierarchy_depth de una secuencia de parametro establecida, como se representa en la lista 2 mostrada en la figura 3. Aqrn, max_pcm_coding_unit_hierarchy_depth se puede llamar
min_pcm_coding_unit_hierarchy_depth. La sintaxis log2_min_coding_unit_size_minus3 y la sintaxis max_coding_unit_hierarchy_depth son informacion para determinar un tamano de SCU (MinCodingUnitSize) y un tamano de LCU (MaxCodingUnitSize), respectivamente. MinCodingUnitSize y MaxCodingUnitSize son computados respectivamente como sigue.
MinCodingUnitSize = 1 << (log2_min_coding_unit_size_minus3 + 3)
MaxCodingUnitSize = 1 << (log2_min_coding_unit_size_minus3 + 3 + max_coding_unit_hierarchy_depth)
La sintaxis max_coding_unit_hierarchy_depth y MinCodingUnitSize tiene la siguiente relacion.
max_pcm_coding_unit_hierarchy_depth = log2 (pcmCodingUnitSize/MinCodingUnitSize)
En base a la operacion anteriormente descrita, el dispositivo de codificacion de video genera el flujo de bits.
A continuacion se describe una operacion de escritura de cabecera de PCM, con referencia al diagrama de flujo de la figura 4.
Como se muestra en la figura 4, en el caso de no ser capaz de codificar la entropfa dentro del tiempo de procesamiento de la CU a codificar, el codificador 103 de entropfa codifica la entropfa del bloque tipo como
5
10
15
20
25
30
35
40
45
50
55
prediccion intra en el paso S101. Esto es, el codificador de entrc^a 103 codifica la entrc^a de la sintaxis mode_table_idx o la sintaxis pre_mode como prediccion intra. En el paso S102, el codificador de entropfa 103 codifica la entropfa de la cabecera PCM. En detalle, el codificador de entropfa 103 codifica la entropfa de la sintaxis pcm_flag como ON. En el paso S103, el codificador de entropfa 103 alinea como bytes los bits de salida mediante el suministro de la cantidad predeterminada de la sintaxis pcm_alignment_zero_bit al multiplexor 110. Esto es, el codificador de entropfa 103 da salida a la cantidad predeterminada de la sintaxis pcm_alignment_zero_bit. El codificador de entropfa 103 tambien arranca el motor de codificacion. En el paso S104, el codificador 107 codifica mediante PCM que codifica el video de entrada de la CU.
El dispositivo de codificacion de video en esta referencia incluye: medios de seleccion de datos multiplexados para la seleccion de datos de salida de los medios de codificacion de la entropfa o medios de codificacion PCM en un tamano de unidad de codificacion establecido desde el exterior; y medios de multiplexado para la insercion, en un flujo de bits, de una cabecera de PCM en el tamano de la unidad de codificacion establecido desde el exterior. Por lo tanto, la relacion entre el numero de bits de la cabecera de PCM en el flujo de bits se puede mantener bajo y la calidad del video comprimido se puede mantener, garantizando mientras tanto un cierto tiempo de procesamiento para el dispositivo de codificacion de video.
Ademas, la multiplexion de medios incrusta, en el flujo de bits, informacion del tamano de la unidad de codificacion PCM para la senalizacion del tamano de la CU establecido desde el exterior al dispositivo de descodificacion de video, donde la informacion del tamano de la CU se puede expresar mediante, por ejemplo, una diferencia de profundidad con respecto a la profundidad de una LCU o SCU. Por ejemplo, en el caso de expresion en relacion a la profundidad de la lCu (LCU_depth), un tamano de CU de una profundidad predeterminada se puede expresar como 1/2(depth - Lcii_depth) del tamano de la LCU (1/4(depth -LCU_depth) cuando de convierte a tamano de bloque). En el caso de expresion en relacion a la profundidad de la SCU (SCU_depth), un tamano de CU de una profundidad predeterminada se puede expresar como 2(SCU-depth -depth) veces el tamano de la SCU (4(SCU_depth -depth) veces cuando se convierte a tamano de bloque).
Mediante la inclusion del multiplexado de los medios que tienen las caractensticas anteriormente mencionadas, la interoperabilidad del dispositivo de codificacion de video puede ser mejorada.
El dispositivo de codificacion de video en esta referencia incluye medios para la insercion, en el flujo de bits, la informacion relativa al tamano de la unidad de codificacion para la que se proporciona la cabecera PCM, con el fin de hacer posible que la cabecera de PCM sea analizada desde el flujo de bits y conmutacion entre la entropfa de los medios de descodificacion y los medios de descodificacion PCM para que se realice igualmente en la descodificacion de video. La interoperabilidad del dispositivo de codificacion de video y el dispositivo de descodificacion de video de este modo puede mejorar.
Realizacion 1
La realizacion 1 muestra un dispositivo de descodificacion de video que decodifica el flujo de bits generado por el dispositivo de codificacion de video en el Ejemplo de Referencia 1.
El dispositivo de descodificacion en este ejemplo de realizacion incluye: medios para el desmultiplexado PCM de la informacion de tamano de la unidad de codificacion multiplexada en el flujo de bits; medios de tamano de bloque para determinar un tamano de bloque predeterminado para el que se analiza un encabezado de PCM, basandose en el desmultiplexado PCM de la informacion de tamano de la unidad de codificacion; medios de analisis para analizar la cabecera PCM del flujo de bits en el tamano de la unidad de codificacion determinada por los medios de tamano de bloque; y medios de control de descodificacion para controlar los medios de descodificacion de entropfa y medios de descodificacion PCM basandose en la cabecera PCM analizada por los medios de analisis.
Como se muestra en la figura 5, el dispositivo de descodificacion de video en este ejemplo de realizacion incluye un desmultiplexor 201, un controlador 202 de descodificacion, un decodificador 203 PCM, un decodificador 204 de entropfa, un transformador inverso/cuantificador inverso 206, un predictor 207, una memoria intermedia 208, un conmutador 221 y un conmutador 222.
El desmultiplexor 201 desmultiplexa el flujo de bits de entrada, y extrae la informacion de tamano de la unidad de codificacion PCM y la entropfa codificada o el flujo de bits del video codificado PCM. El desmultiplexor 201 desmultiplexa la sintaxis max_pcm_coding_unit_hierarchy_depth siguiendo la sintaxis log2_min_coding_unit_size_minus3 y la sintaxis max_coding_unit_hierarchy_depth en los parametros de la secuencia, como se representa en la lista 2 mostrada en la figura 3. El desmultiplexor 201 determina entonces, utilizando los valores de sintaxis desmultiplexados, el tamano de la unidad de codificacion de PCM pcmCodingUnitSize para los que pcm_flag como cabecera de PCM se transmite, como sigue.
pcmCodingUnitSize = 1 << (log2_min_coding_unit_size_minus3 + 3 + max_pcm_coding_unit_hierarchy_depth)
Por lo tanto, el desmultiplexor 201 en este ejemplo de realizacion tambien tiene una funcion de determinar el tamano de bloque de la unidad de codificacion para el que se analiza la cabecera de PCM, basandose en la informacion de tamano de la unidad de codificacion PCM desmultiplexada.
5
10
15
20
25
30
35
40
45
50
El descodificador de entropfa 204 descodifica entrc^a del flujo de bits de video.
En el caso en el que la unidad (CU) de codificacion a ser descodificada entropfa no es una CU codificada PCM, el descodificador de entropfa 204 descodifica entropfa de los parametros de prediccion y el valor de cuantificacion transformada de la CU, y los suministra al transformador inverso/cuantificador inverso 206 y al predictor 207.
Tengase en cuenta que una CU esta codificada PCM en el caso en el que, despues de split_coding_unit_flag (ver la figura 19) esta descodificada entropfa y se determina el tamano de la CU, la sintaxis pcm_flag indicando que PCM codifica ON en la cabecera de la PU esta descodificada la entropfa. Por lo tanto, el descodificador de entropfa 204 en este ejemplo de realizacion tambien tiene una funcion de analisis de la cabecera PCM que incluye la sintaxis pcm_flag del flujo de bits en la CU de tamano mayor que o igual a pcmCodingUnitSize.
El transformador inverso/cuantificador inverso 206 cuantifica inverso el valor de cuantificacion transformado de la luminancia y la diferencia de color, con un ancho de paso de cuantificacion. El transformador inverso/cuantificador inverso 206 transforma ademas la frecuencia inversa del coeficiente de transformacion de frecuencia obtenido mediante la cuantificacion inversa.
Despues de la transformacion de la frecuencia inversa, el predictor 207 genera una senal de prediccion utilizando una imagen de una imagen reconstruida almacenada en la memoria intermedia 208, basandose en los parametros de prediccion de entropfa descodificada.
Despues de la generacion de la senal de prediccion, la senal de prediccion suministrada desde el predictor 207 se anade a la imagen de error de prediccion reconstruida obtenida mediante la transformacion de frecuencia inversa mediante el transformador inverso/cuantificador inverso 206 y el resultado se suministra al conmutador 222.
Despues de la adicion de la senal de prediccion, el controlador 202 de descodificacion conmuta el conmutador 222 para suministrar la imagen de error de prediccion reconstruida a la que la senal de prediccion se ha anadido a la memoria intermedia 208 como la imagen reconstruida.
En el caso en el que la CU es una PCM codificada, el controlador 202 de descodificacion hace que se inicialice un motor de descodificacion del descodificador 204 de entropfa.
A continuacion el controlador 202 de descodificacion hace que el flujo de bits de video que esta en el medio de la descodificacion de entropfa, se alinee por bytes. El controlador 202 de descodificacion hace que pcm_alignment_zero_bit sea analizado a partir del flujo de bits hasta que se alinea por bytes.
A continuacion de esto, el controlador 202 de descodificacion conmuta el conmutador 221 para suministrar el flujo de bits de video alineado por bytes al descodificador 203 PCM.
El descodificador 203 PCM descodifica mediante descodificacion PCM datos de luminancia codificados PCM pcm_sample_luma[i] y datos de diferencia de color pcm_sample_chroma[i] que corresponden al tamano de bloque de la CU, del flujo de bits de video alineados por bytes.
Despues de la descodificacion PCM, el controlador 202 de descodificacion conmuta el conmutador 222 para suministrar la imagen de la unidad de codificacion descodificada PCM a la memoria intermedia 208 como la imagen reconstruida. El controlador 202 de decodificacion conmuta el conmutador 221 al descodificador 204 de entropfa, para la descodificacion del macrobloque siguiente.
La imagen reconstruida almacenada en la memoria 208 intermedia es entonces la salida como una imagen descodificada.
Basandose en la operacion anteriormente descrita, el dispositivo de descodificacion de video en este ejemplo de realizacion genera la imagen descodificada.
A continuacion se describe una operacion de analisis de cabecera PCM que es una caractenstica de la presente invencion, con referencia al diagrama de flujo de la figura 6.
Como se muestra en la figura 6, en el caso en el que la CU esta codificada PCM, el descodificador 204 de entropfa descodifica entropfa split_coding_unit_flag y determina el tamano de la CU en el paso S201. En el paso S202, el descodificador 204 de entropfa descodifica entropfa del bloque tipo. Esto es, el descodificador 204 de entropfa descodifica entropfa de la sintaxis mode_table_idx o de la sintaxis pre_mode. En el paso S203 y S204, el descodificador 204 de entropfa descodifica entropfa de la sintaxis pcm_flag solamente en el caso en el que el tipo de bloque es de prediccion intra y el tamano de la CU es un tamano mayor que o igual a pcmCodingUnitSize. En el caso en el que la sintaxis pcm_flag esta en ON, en el paso S205 el descodificador 204 de entropfa arranca el motor de descodificacion. El descodificador 204 de entropfa tambien alinea por bytes el flujo de bits de video mediante el analisis de la cantidad predeterminada de la sintaxis pcm_alignment_zero_bit desde el descodificador 201. El descodificador 203 PCM descodifica mediante descodificacion PCM los datos de luminancia codificados PCM pcm_sample_luma[i] y los datos de diferencia de color pcm_sample_chroma[i] correspondientes al tamano de bloque de la CU, desde el flujo de bits de video alineados por bytes. En el caso en el que la CU no es una CU
5
10
15
20
25
30
35
40
45
50
55
codificada PCM (paso S203) o en el caso en el que el descodificador 204 de entropfa no descodifica la entropfa de la sintaxis pcm_flag que indica la codificacion PCM en OFF en la cabecera de la PU (paso S204), el descodificador 204 de entropfa descodifica la entropfa de los parametros de prediccion y el valor de la cuantificacion transformada de la siguiente CU, y los suministra al transformador inverso/cuantificador inverso 206 y al predictor 207.
El dispositivo de descodificacion de video en este ejemplo de realizacion puede analizar, basado en la informacion del tamano de la unidad de codificacion PCM desmultiplexada, la cabecera PCM del flujo de bits en la unidad de codificacion del tamano de la unidad de codificacion PCM predeterminado, y conmutar entre los medios de descodificacion de entropfa y los medios de descodificacion PCM. Por lo tanto, el flujo de bits en el que la relacion del numero de bits de la cabecera del PCM es baja para mantener de ese modo la calidad del video se puede descodificar garantizando mientras tanto un cierto tiempo de procesamiento para el dispositivo de descodificacion de video.
Tengase en cuenta que el dispositivo de codificacion de video puede multiplexar la informacion del tamano de la unidad de codificacion PCM (max_pcm_coding_unit_hierarchy_depth) utilizado en el ejemplo de referencia 1, en un conjunto de parametros de imagen o una cabecera de seccion como se representa en la lista 3 mostrada en la figura 7 o en la lista 4 mostrada en la figura 8. Similarmente, el dispositivo de descodificacion de video puede desmultiplexar la sintaxis max_pcm_coding_unit_hierarchy_depth a partir de un conjunto de parametros de imagen o la cabecera de la seccion.
Por otra parte, la sintaxis max_pcm_coding_unit_hierarchy_depth puede ser log (logaritmo) base 2 de un valor obtenido dividiendo el tamano de la unidad de codificacion maximo (MaxCodingUnitSize) por el tamano de la unidad de codificacion PCM (pcmCodingUnitSize). Es decir, se puede utilizar la siguiente expresion.
max_pcm_coding_unit_hierarchy_depth = log2 (MaxCodingUnitSize/pcmCodingUnitSize)
En este caso, en el dispositivo de descodifcacion de video, el tamano de la unidad de codificacion PCM se puede calcular basandose en la sintaxis max_pcm_coding_unit_hierarchy_depth como sigue.
pcmCodingUnitSize = 1 << (log2_min_coding_unit_size_minus3 + 3 max_coding_unit_hierarchy_depth -
max_pcm_coding_unit_hierarchy_depth)
Tengase en cuenta que el dispositivo de codificacion de video puede concatenar y codificar la sintaxis pcm_flag con la sintaxis mode_table_idx o la sintaxis pred_mode. Por ejemplo, en un tamano de CU mayor que o igual al tamano de la unidad de codificacion PCM, mode_table_idx = 0 (contrasena 1) se puede establecer como prediccion inter, mode_table_idx = 1 (contrasena 00) como prediccion intra con pcm_flag = OFF, y mode_table_idx = 2 (contrasena 01) como PCM. En una CU de tamano menor que el tamano de la unidad de codificacion PCM, mode_table_idx = 0 (contrasena = 0) se puede establecer como prediccion inter, y mode_table_idx = 1 (contrasena = 1) como prediccion intra con pcm_flag = OFF.
En este caso, en el tamano de la CU mayor que o igual al tamano de la unidad de codificacion PCM, el dispositivo de descodificacion de video interpreta contrasena 1 (mode_table_idx = 0) como prediccion inter, contrasena 00 (mode_table_idx = 1) como prediccion intra con pcm_flag = OFF, y contrasena 01 (mode_table_idx = 2) como PCM. En la CU del tamano menor que el tamano de la unidad de codificacion PCM, el dispositivo de descodificacion de video interpreta contrasena 0 (mode_table_idx = 0) como prediccion inter, y contrasena 1 (mode_table_idx = 1) como prediccion intra con pcm_flag = OFF.
Ejemplo de referencia 2
En el ejemplo de referencia 1 y la realizacion 1 anteriormente descritos, PCM se selecciona en una CU de capa superior con el fin de garantizar un cierto tiempo de procesamiento para el dispositivo de codificacion de video o dispositivo de descodificacion de video. Sin embargo, en el caso de tomar en consideracion que PCM tiende a ser seleccionada en un bloque de imagen que tiene baja correlacion entre pfxeles, es decir PCM tiende a ser seleccionada en una CU de capa inferior de una zona pequena dividida, tambien es importante limitar un tamano predeterminado o menor que el tamano de CU para el que se selecciona la PCM. Basandose en tal consideracion, la relacion en el numero de bits de la cabecera de PCM en el flujo de bits tambien se puede reducir. La CU de capa inferior mencionada aqrn es una CU que tiene un valor de profundidad mayor, como se puede ver a partir de la figura 19.
En el ejemplo de referencia 2, un dispositivo de codificacion de video limita el tamano de la CU para la que se ha seleccionado la PCM, el tamano predeterminado o menor. El dispositivo de codificacion de video tiene la misma estructura como se muestra en la figura 1.
En el caso de limitar el tamano de la CU para el que se selecciona PCM a un tamano predeterminado o menor, el tamano de la CU para la cual la cabecera de PCM se incrusta en el flujo de bits se ajusta para que sea menor que o igual al tamano de la unidad de codificacion de la PCM establecido desde el exterior (pcmCodingUnitSize), como un ejemplo. Tambien se supone que los tamanos de la unidad de codificacion disponibles son 128, 64, 32, 16 y 8, y pcmCodingUnitSize es 16.
5
10
15
20
25
30
35
40
45
50
55
En el dispositivo de codificacion de video, el selector 109 de datos multiplexor controla la cantidad de datos de entrada del codificador 103 de entropfa correspondiente a la CU a codificar que es menor que o igual a pcmCodingUnitSize. En el caso en el que el codificador 103 de entropfa es capaz de codificar la entropfa de los datos de entrada dentro de un tiempo de procesamiento de la CU a codificar que es menor que o igual a pcmCodingUnitSize, el selector 109 de datos multiplexor selecciona los datos de salida del codificador 103 de entropfa, y genera los datos seleccionados para ser suministrados al multiplexor 110 a traves del conmutador 121. En el caso en el que el codificador 103 de entropfa no es capaz de codificar la entropfa de los datos de entrada dentro del tiempo de procesamiento de la CU a codificar, el selector 109 de datos multiplexor provoca primero que el codificador 103 de entropfa codifique la entropfa y la informacion de salida que indica que el tamano de aquella CU es menor que o igual a pcmCodingUnitSize es con codificacion PCM. En detalle, el selector 109 de datos multiplexor hace que el codificador 103 de entropfa codifique la entropfa y la salida de la sintaxis mode_table_idx o la sintaxis pred_mode, que indica el tipo de bloque, como prediccion intra, y codifica la entropfa y la sintaxis de salida pcm_flag, que indica oN/OFF de la codificacion PCM, como ON, en la cabecera de la PU de la Cu.
En esta referencia, a la hora de cumplir con la especificacion de las funciones de sintaxis, categonas y descriptores en NPL 1 y la sintaxis de la unidad 4.1.10 de prediccion en NPL 2, el dispositivo de codificacion de video puede senalar lo mencionado anteriormente sintaxis mode_table_idx, sintaxis pred_mode, sintaxis pcm_flag y sintaxis pcm_alignment_zero_bit como se representa en la lista 1 mostrada en la figura 9. En la lista 1 mostrada en la figura 9, la variable pcm_unit_flag que es una condicion de senalizacion de la sintaxis pcm_alignment_zero_bit esta en ON solamente en el caso en el que la sintaxis pcm_flag se senaliza para la codificacion PCM ON. De lo contrario, la variable pcm_unit_flag esta en OFF. Esta referencia tiene una caractenstica que, en la lista 1, la sintaxis pcm_flag se senala solamente en la cabecera de la PU de la CU cuyo tamano es inferior o igual a pcmCodingUnitSize, de acuerdo con la condicion “if (currPreUnitSize <= pcmCodingUnitSize)”. Los otros procesos del dispositivo de codificacion de video son los mismos que los procesos en el ejemplo de referencia 1. Ademas, los contenidos de la lista 1 en esta referencia son los mismos que los contenidos de la lista 1 mostrados en la figura 2 en el ejemplo de referencia 1.
Realizacion 2
La Realizacion 2 muestra un dispositivo de descodificacion de video que descodifica el flujo de bits generado por el dispositivo de codificacion en el ejemplo de referencia 2.
El dispositivo de descodificacion de video en la Realizacion 2 tiene la misma estructura mostrada en la figura 5 que representa la Realizacion 1 de la presente invencion. En la Realizacion 2, sin embargo, el dispositivo de descodificacion de video realiza una operacion de analisis de cabecera PCM como se muestra en el diagrama de flujo de la figura 10. En el caso en el que la CU esta codificada PCM, el descodificador de entropfa 204 descodifica la entropfa de splits_coding_unit_flag y determina el tamano de la CU en el paso S201. En el paso S202, el descodificador de entropfa 204 descodifica la entropfa del tipo de bloque. Es decir, el descodificador de entropfa 204 descodifica la entropfa de la sintaxis mode_table_idx o la sintaxis pred_mode. En los pasos S203B y S204, el descodificador 204 de entropfa de la sintaxis pcm_flag solamente en el caso en el que el tipo de bloque es prediccion intra y el tamano de la CU es un tamano menor que o igual a pcmCodingUnitSize. En el caso en el que la sintaxis pcm_flag esta en ON, en el paso S205 el descodificador 204 de entropfa inicializa el motor de descodificacion. El descodificador 204 de entropfa tambien alinea por bytes el flujo de bits mediante el analisis de la cantidad predeterminada de la sintaxis pcm_alignment_zero_bit a partir del desmultiplexador 201. El descodificador 203 PCM descodifica mediante descodificacion PCM los datos de luminancia pcm_sample_luma[i] con codificacion PCM y los datos de diferencia de color pcm_sample_chroma[i] que corresponden al tamano de bloque CU, procedentes del flujo de bits de video alineados por bytes. Los otros procesos de dispositivo de descodificacion de video son los mismos que los de la Realizacion 1 preferente.
En el caso de limitar al tamano predeterminado o menos el tamano de CU para el que se selecciona la PCM, el descodificador 204 de entropfa en el dispositivo de decodificacion de video tambien tiene una funcion de analisis de la cabecera PCM que incluye la sintaxis pcm_flag del flujo de bits en la CU cuyo tamano es menor que o igual a pcmCodingUnitSize.
En esta realizacion ejemplar, el flujo de bits en el que la relacion del numero de bits de la cabecera PCM es bajo para mantener de ese modo la calidad del video se puede descodificar garantizando mientras tanto un cierto tiempo de procesamiento para el dispositivo de descodificacion de video.
Tengase en cuenta que el dispositivo de codificacion de video en el ejemplo de referencia 2 puede concatenar y codificar la sintaxis pcm_flag con la sintaxis mode_table_idx o la sintaxis pred_mode. Por ejemplo, en una CU de un tamano menor que o igual al tamano de la unidad de codificacion PCM, mode_table_idx = 0 (contrasena 0) se puede establecer como prediccion intra con pcm_flag = OFF, mode_table_idx = 1 (contrasena 10) como prediccion inter, y mode_table_idx = 2 (contrasena 11) como PCM. En una CU de un tamano mayor que el tamano de la unidad de codificacion PCM, mode_table_idx = 0 (contrasena 0) se puede establecer como prediccion intra con pcm_flag = OFF, y mode_table_idx = 1 (contrasena 1) como prediccion inter.
En este caso, en la CU del tamano menor que o igual al tamano de la unidad de codificacion PCM, el dispositivo de
5
10
15
20
25
descodificacion de video en la Realizacion 3 interpreta la contrasena 0 (mode_table_idx = 0) como prediccion intra con pcm_flag = OFF, contrasena 10 (mode_table_idx = 1) como prediccion inter, y contrasena 11 (mode_table_idx = 2) como PCM. En la CU del tamano mayor que el tamano de la unidad de codificacion PCM, el dispositivo de descodificacion de video interpreta contrasena 0 (model_table_idx = 0) como prediccion intra con pcm_flag = OFF, y contrasena 1 (mode_table_idx = 1) como prediccion inter.
La sintaxis pcm_flag se puede concatenar y codificar con la sintaxis pred_mode, de la misma manera que en el ejemplo de la sintaxis mode_table_idx.
En el caso de limitacion del tamano de la unidad de codificacion PCM al tamano de la unidad de codificacion maximo, la informacion de tamano de bloque PCM no necesita ser embebida explfcitamente en el flujo de bits. Esto es porque la informacion relacionada con el tamano de la unidad de codificacion maximo incluye implfcitamente la informacion del tamano de bloque PCM en tal caso.
En el caso de limitacion del tamano de la unidad de codificacion PCM al tamano de la unidad de codificacion mmimo, la informacion del tamano de bloque PCM no necesita ser embebida explfcitamente en el flujo de bits. Esto es porque la informacion relacionada con el tamano de la unidad de codificacion mmimo incluye implfcitamente la informacion del tamano de bloque PCM en tal caso.
La sintaxis pcm_flag se puede concatenar y codificar con la sintaxis pred_mode, de la misma manera que en el ejemplo anteriormente mencionado de la sintaxis mode_table_idx. Por ejemplo, en una seccion intra, la sintaxis y la contrasena pueden asociarse de la siguiente manera, como se describe en NPL 3 (tengase en cuenta que esto se basa en la suposicion de que no existe N x particion N (prediccion intra y prediccion inter) en una unidad de codificacion que no sea una unidad de codificacion minima como se describe en NPL 4).
[Correspondencia entre la sintaxis y la contrasena en la unidad de codificacion minima que incluye codificacion PCM]
Sintaxis
N x N intra PCM
Contrasena
01
00
2N x 2N intra 1
[Correspondencia entre la sintaxis y la contrasena en una CU que no sea una unidad de codificacion minima que incluye codificacion PCM]
Sintaxis 2N x 2N intra PCM
Contrasena
1
0
[Correspondencia entre la sintaxis y la contrasena en la unidad de codificacion minima que no incluye codificacion PCM]
Sintaxis Contrasena
2N x 2N intra 1
N x N intra 0
[Correspondencia entre la sintaxis y la contrasena en la unidad de codificacion minima que no incluye codificacion PCM]
Sintaxis Contrasena
2N x 2N intra ninguna
Tengase en cuenta que “CU incluyendo la codificacion PCM” es una CU del tamano de la unidad de codificacion PCM, y “CU no incluyendo la codificacion PCM” es una CU de tamano de la unidad de no codificacion PCM. En este caso, por ejemplo en la unidad de codificacion minima incluyendo codificacion PCM en la seccion intra, el dispositivo de descodificacion de video interpreta la contrasena 1 como prediccion intra 2N x 2N, la contrasena 01 como prediccion intra N x N y la contrasena 00 como PCM.
Asimismo, en una seccion no intra, la sintaxis y la contrasena pueden estar asociadas como sigue.
[Correspondencia entre la sintaxis y la contrasena comun a todas las CU's]
Sintaxis
Contrasena
Dividir
1
Omitir
01
2N x 2N_MRG inter
001
2N x 2N inter
0001
Otros
0000
[Correspondencia entre la sintaxis y la contrasena en la unidad de codificacion mmima que incluye codificacion PCM, siguiendo a otros]
Sintaxis
Contrasena
2N x N inter
0
N x 2N inter
01
N x N inter
001
2N x 2N intra
0001
N x N intra
00001
PCM
00000
[Correspondencia entre la sintaxis y la contrasena en la CU que no sea una unidad de codificacion minima que 5 incluye la codificacion PCM, siguiendo a otros]
Sintaxis 2N x N inter N x 2N inter 2N x 2N intra PCM
Contrasena
0
01
001
000
[Correspondencia entre la sintaxis y la contrasena en la unidad de codificacion minima que no incluye la codificacion PCM, siguiendo a otros]
Sintaxis
Contrasena
2N x N inter
0
N x 2N inter
01
N x N inter
001
2N x 2N intra
0001
N x N intra
0000
[Correspondencia entre la sintaxis y la contrasena en la CU aparte de la unidad de codificacion minima que no incluye la codificacion PCM, siguiendo a otros]
Sintaxis 2N x N inter N x 2N inter 2N x 2N intra
Contrasena
0
01
00
10 En este caso, por ejemplo en la unidad de codificacion minima que incluye codificacion PCM, el dispositivo de descodificacion de video interpreta la contrasena 0 siguiendo a otros como 2N x N prediccion inter, la contrasena 01 como N x 2N prediccion inter, la contrasena 001 como N x N prediccion inter, la contrasena 0001 como 2N x 2N prediccion intra, la contrasena 00001 como N x N prediccion intra y la contrasena 00000 como PCM.
5
10
15
20
25
30
35
40
45
50
55
Tengase en cuenta que la seccion intra es una seccion compuesta de unidades de codificacion unicamente codificadas por prediccion intra, y la seccion no intra es una seccion que incluye unidades de codificacion codificadas por prediccion inter.
Cada una de las realizaciones y las referencias descritas anteriormente se pueden realizar mediante hardware, o pueden realizarse mediante un programa informatico.
Un sistema de procesamiento de la informacion mostrado en la figura 11 incluye un procesador 1001, una memoria 1002 de programa, un medio 1003 de almacenamiento para almacenar los datos de video y un medio 1004 de almacenamiento para almacenar un flujo de bits. El medio 1003 de almacenamiento y el medio 1004 de almacenamiento pueden ser medios de almacenamiento separados, o pueden ser areas de almacenamiento incluidas en el mismo medio de almacenamiento. Como medio de almacenamiento, es aplicable un medio de almacenamiento magnetico tal como un disco duro.
En el sistema de procesamiento de la informacion mostrado en la figura 11, un programa para realizar las funciones de los bloques (excepto el bloque de la memoria intermedia) mostrado en cada una de las figuras 1 y 5 es almacenado en la memoria 1002 de programa. El procesador 1001 realiza las funciones del dispositivo de codificacion de video o del dispositivo de descodificacion de video mostrado en la figura 1 o 5, mediante la ejecucion del procesamiento de acuerdo con el programa almacenado en la memoria 1002 de programa.
La figura 12 es un diagrama de bloques que muestra una parte principal de un dispositivo de codificacion de video. Como se muestra en la figura 12 el dispositivo de codificacion de video incluye: medios 11 de transformacion (por ejemplo, el transformador/cuantificador 102 mostrado en la figura 1) para la transformacion de un bloque de imagen; medios 12 de codificacion de entropfa (por ejemplo el codificador 103 de entropfa mostrado en la figura 1) para la codificacion de entropfa de datos transformados del bloque de imagen transformada por los medios 11 de transformacion; los medios 13 de codificacion PCM (por ejemplo el codificador 107 PCM mostrado en la figura 1) para la codificacion mediante codificacion PCM del bloque de imagen; medios 14 de seleccion de datos multiplexor (por ejemplo el selector 109 de datos multiplexor y el conmutador 121) para seleccion de datos de salida de los medios 12 de codificacion de entropfa (por ejemplo el codificador 103 de entropfa mostrado en la figura 1) o los medios 13 de codificacion PCM, en un bloque de un tamano de bloque establecido desde el exterior; y medios 15 de multiplexado (por ejemplo el multiplexor 110 mostrado en la figura 1) para incorporar una cabecera de PCM en un flujo de bits, en el bloque de tamano de bloque establecido desde el exterior.
La figura 13 es un diagrama de bloques que muestra la parte principal de un dispositivo de descodificacion de video de acuerdo con la presente invencion. Como se muestra en la figura 13, el dispositivo de descodificacion de video de acuerdo con la presente invencion incluye: medios 21 de desmultiplexado (por ejemplo el desmultiplexor 201 mostrado en la figura 5) para desmultiplexar un flujo de bits incluyendo informacion del tamano de bloque PCM; medios 22 para la determinacion del tamano de bloque PCM (por ejemplo el desmultiplexor 201 mostrado en la figura 5) para determinar un tamano de bloque PCM para el que se analiza una cabecera de PCM, basandose en la informacion del tamano de bloque PCM desmultiplexado mediante los medios 21 de desmultiplexado; medios 23 de analisis de cabecera de PCM (por ejemplo el descodificador 204 de entropfa mostrado en la figura 5) para analizar la cabecera de PCM del flujo de bits, en un bloque del tamano de bloque de PCM determinado por los medios 22 de determinacion del tamano de bloque de PCM; medios 24 de descodificacion de entropfa (por ejemplo el descodificador 204 de entropfa mostrado en la figura 5) para la descodificacion de entropfa de los datos transformados de una imagen en el flujo de bits; medios 25 de transformacion inversa (por ejemplo el transformador inverso/cuantificador inverso 206 mostrado en la figura 5) para transformacion inversa de los datos transformados descodificados de entropfa mediante los medios 24 de descodificacion de entropfa; medios 26 de descodificacion de PCM (por ejemplo el descodificador 203 de PCM mostrado en la figura 5) para descodificar mediante datos PCM de descodificacion PCM de la imagen en el flujo de bits; y medios 27 de control de descodificacion (por ejemplo el controlador 202 de descodificacion mostrado en la figura 5) para controlar los medios 24 de descodificacion de entropfa y los medios 26 de descodificacion de PCM, basandose en la cabecera de PCM analizada mediante los medios 23 de analisis de cabecera de PCM.
Aunque la presente invencion ha sido descrita con referencia a los ejemplos de realizaciones anteriores, la presente invencion no se limita a los ejemplos de realizaciones anteriores. Se pueden hacer varios cambios comprensibles para los expertos en la tecnica dentro del alcance de la presente invencion a las estructuras y detalles de la presente invencion.
Esta solicitud reivindica prioridad basada en la Solicitud de Patente Japonesa n° 2010-264320 presentada el 26 de noviembre de 2010 y la Solicitud de Patente Japonesa n° 2011-026331 presentada el 9 de febrero de 2011.
Lista de signos de referencia
11 medios de transformacion
12 medios de codificacion de entropfa
13 medios de codificacion PCM
5
10
15
20
25
30
14 medios de seleccion de datos multiplexor
15 medios de multiplexado
21 medios de desmultiplexado
22 medios de determinacion del tamano de bloque
23 medios de analisis de cabecera de PCM
24 medios de descodificacion de entropfa
25 medios de transformacion inversa
26 medios de descodificacion PCM
27 medios de control de descodificacion
102 transformador / cuantificador
103 codificador de entropfa
104 transformador inverso / cuantificador inverso
105 memoria
106 predictor
107 codificador PCM
108 descodificador PCM
109 selector de datos multiplexor
110 multiplexor
121 conmutador
122 conmutador
201 desmultiplexor
202 controlador de descodificacion
203 descodificador PCM
204 descodificador de entropfa
206 transformador inverso / cuantificador inverso
207 predictor
208 memoria
221 conmutador
222 conmutador
1001 procesador
1002 memoria de programa
1003 medio de almacenamiento
1004 medio de almacenamiento

Claims (3)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
    REIVINDICACIONES
    1. - Un dispositivo de descodificacion de video que comprende:
    (a) medios (21; 201) de extraccion para extraer informacion del tamano de bloque PCM de un flujo de bits, indicando la informacion del tamano de bloque PCM un umbral (pcmCodingUnitSize) para ser utilizado como un tamano predeterminado por medios de analisis de cabecera PCM;
    (b) medios (22; 201) de determinacion para determinar el umbral (pcmCodingUnitSize) basandose en la informacion del tamano de bloque PCM extrafdo;
    (c) los medios (23; 204) de analisis de cabecera PCM para analizar una cabecera PCM de un flujo de bits con respecto a un bloque codificado, unicamente cuando el tamano de bloque de dicho bloque codificado satisface una limitacion basada en el umbral (pcmCodingUnitSize), siendo la cabecera PCM indicativa de la informacion de si dicho bloque codificado es un bloque que ha sido codificado mediante codificacion PCM o no;
    (d) medios (24; 204) de descodificacion de entropfa para analizar datos transformados de un dato de error de prediccion de una imagen en el flujo de bits;
    (e) medios (26; 203) de descodificacion PCM para descodificar mediante datos PCM de descodificacion PCM de la imagen en el flujo de bits; y
    (f) medios (27; 202) de control de descodificacion para controlar los medios (24; 204) de descodificacion de entropfa y los medios (26; 203) de descodificacion PCM basandose en la cabecera PCM analizada.
  2. 2. - Un metodo de descodificacion de video que comprende:
    (a) un paso de extraccion de informacion del tamano de bloque PCM de un flujo de bits, indicando la informacion del tamano de bloque PCM un umbral (pcmCodingUnitSize) para ser utilizado como un tamano predeterminado en el paso subsiguiente de analisis de cabecera PCM;
    (b) un paso de determinacion del umbral (pcmCodingUnitSize) basandose en la informacion del tamano de bloque pCm extrafdo;
    (c) el paso de analisis de una cabecera PCM del flujo de bits respecto un bloque codificado, unicamente cuando el tamano de bloque de dicho bloque codificado satisface una limitacion basada en el umbral (pcmCodingUnitSize), siendo la informacion de cabecera PCM indicativa de si dicho bloque codificado es un bloque que ha sido codificado mediante codificacion PCM o no;
    (d) un paso de control de un proceso de descodificacion de entropfa y un proceso de descodificacion PCM basandose en la cabecera PCM analizada;
    (e) un paso de analisis de datos transformados de un dato de error de prediccion de una imagen en el flujo de bits estando controlado el proceso de descodificacion de la entropfa; y
    (f) un paso de descodificacion mediante descodificacion PCM de datos PCM de la imagen en el flujo de bits estando controlado el proceso de descodificacion PCM.
  3. 3. - Un programa de descodificacion de video para hacer que un ordenador ejecute:
    (a) un proceso de extraccion para extraer informacion del tamano de bloque PCM de un flujo de bits, indicando la informacion del tamano de bloque PCM un umbral (pcmCodingUnitSize) a utilizar como un tamano predeterminado en el subsiguiente proceso de analisis de cabecera PCM;
    (b) un proceso de determinacion para determinar el umbral (pcmCodingUnitSize) basandose en la informacion del tamano de bloque PCM extrafdo;
    (c) el proceso de analisis de una cabecera PCM para analizar una cabecera de PCM a partir del flujo de bits respecto un bloque codificado, unicamente cuando el tamano de bloque de dicho bloque codificado satisface una limitacion basada en el umbral (pcmCodingUnitSize), siendo la informacion de cabecera PCM de si dicho bloque codificado es un bloque que ha sido codificado mediante codificacion PCM o no;
    (d) un proceso de control de un proceso de descodificacion de entropfa y un proceso de descodificacion PCM basandose en la cabecera PCM analizada;
    (e) en el que el ordenador esta dispuesto para ejecutar un proceso de analisis de datos transformados de un dato de error de prediccion de una imagen en el flujo de bits estando controladoel proceso de descodificacion de la entropfa; y
    (f) en el que el ordenador esta dispuesto para ejecutar un proceso de descodificacion mediante descodificacion PCM de datos PCM de la imagen en el flujo de bits estando controlado el proceso de descodificacion PCM.
ES11843126.1T 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa de descodificación de video Active ES2608788T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2010264320 2010-11-26
JP2010264320 2010-11-26
JP2011026331 2011-02-09
JP2011026331 2011-02-09
PCT/JP2011/006509 WO2012070232A1 (ja) 2010-11-26 2011-11-22 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム

Publications (1)

Publication Number Publication Date
ES2608788T3 true ES2608788T3 (es) 2017-04-17

Family

ID=46145598

Family Applications (5)

Application Number Title Priority Date Filing Date
ES16162277.4T Active ES2687421T3 (es) 2010-11-26 2011-11-22 Dispositivo de decodificación de vídeo, método de decodificación de vídeo y programa
ES16162304.6T Active ES2688379T3 (es) 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa
ES11843126.1T Active ES2608788T3 (es) 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa de descodificación de video
ES16162279.0T Active ES2688086T3 (es) 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa
ES13169315.2T Active ES2589702T3 (es) 2010-11-26 2011-11-22 Dispositivo, método y programa de descodificación de video

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES16162277.4T Active ES2687421T3 (es) 2010-11-26 2011-11-22 Dispositivo de decodificación de vídeo, método de decodificación de vídeo y programa
ES16162304.6T Active ES2688379T3 (es) 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES16162279.0T Active ES2688086T3 (es) 2010-11-26 2011-11-22 Dispositivo de descodificación de video, método de descodificación de video y programa
ES13169315.2T Active ES2589702T3 (es) 2010-11-26 2011-11-22 Dispositivo, método y programa de descodificación de video

Country Status (14)

Country Link
US (5) US10154267B2 (es)
EP (6) EP3057322B1 (es)
JP (6) JP5321753B2 (es)
KR (5) KR101519488B1 (es)
CN (6) CN103647974B (es)
AU (1) AU2011333238B2 (es)
BR (3) BR112013012814B1 (es)
CA (2) CA2897373C (es)
ES (5) ES2687421T3 (es)
HK (4) HK1221842A1 (es)
MX (4) MX338475B (es)
PL (3) PL3057323T3 (es)
RU (5) RU2562432C2 (es)
WO (1) WO2012070232A1 (es)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX338475B (es) * 2010-11-26 2016-04-18 Nec Corp Dispositivo de codificacion de video, dispositivo de decodificacion de video, metodo de codificacion de video, metodo de decodificacion de video, y programa.
JP5850214B2 (ja) 2011-01-11 2016-02-03 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP5341277B2 (ja) * 2011-02-22 2013-11-13 パナソニック株式会社 画像符号化方法および画像符号化装置
KR102112241B1 (ko) 2011-02-22 2020-05-19 타지반 투 엘엘씨 필터 방법, 동화상 부호화 장치, 동화상 복호 장치 및 동화상 부호화 복호 장치
CN107277510B (zh) 2011-07-19 2019-05-28 太格文-Ii有限责任公司 编码解码装置
US20150181213A1 (en) * 2012-06-26 2015-06-25 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
JP6315911B2 (ja) * 2013-07-09 2018-04-25 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US9774879B2 (en) 2013-08-16 2017-09-26 Sony Corporation Intra-block copying enhancements for HEVC in-range-extension (RExt)
JP5850272B2 (ja) * 2014-01-10 2016-02-03 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
KR102402881B1 (ko) 2015-06-05 2022-05-27 한화테크윈 주식회사 감시 시스템
US10390020B2 (en) 2015-06-08 2019-08-20 Industrial Technology Research Institute Video encoding methods and systems using adaptive color transform
JP6670670B2 (ja) * 2015-06-08 2020-03-25 財團法人工業技術研究院Industrial Technology Research Institute 適応色変換を用いた映像符号化方法およびシステム
KR102282454B1 (ko) 2015-07-13 2021-07-27 한화테크윈 주식회사 감시 시스템
JP6115619B2 (ja) * 2015-11-25 2017-04-19 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP6115620B2 (ja) * 2015-11-25 2017-04-19 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
WO2017141594A1 (ja) 2016-02-18 2017-08-24 株式会社デンソー ヘッドアップディスプレイ装置
KR102477660B1 (ko) 2016-04-06 2022-12-14 한화테크윈 주식회사 감시 시스템
WO2017191782A1 (en) * 2016-05-04 2017-11-09 Sharp Kabushiki Kaisha Systems and methods for coding transform data
JP6299901B2 (ja) * 2017-03-03 2018-03-28 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
JP6332502B2 (ja) * 2017-03-03 2018-05-30 ソニー株式会社 画像処理装置および方法、プログラム、並びに記録媒体
WO2020101385A1 (ko) * 2018-11-14 2020-05-22 엘지전자 주식회사 비디오 데이터를 처리하기 위한 방법 및 장치
EP3868094A4 (en) 2018-11-22 2022-02-23 Beijing Bytedance Network Technology Co., Ltd. PULSE CODE MODULATION TECHNIQUE IN VIDEO PROCESSING
DE102019121204A1 (de) 2019-02-27 2020-08-27 Schaeffler Technologies AG & Co. KG Torsionsschwingungsdämpfer mit einer Rotationsachse für einen Antriebsstrang
WO2020215338A1 (zh) * 2019-04-26 2020-10-29 深圳市大疆创新科技有限公司 视频编解码的方法和装置

Family Cites Families (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4922537A (en) 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US6119091A (en) 1998-06-26 2000-09-12 Lsi Logic Corporation DVD audio decoder having a direct access PCM FIFO
KR100336280B1 (ko) * 1999-05-21 2002-05-13 유혁 중간 데이터 기반의 비디오/오디오 스트리밍 방법
CN1286575A (zh) * 1999-08-25 2001-03-07 松下电器产业株式会社 噪声检测方法、噪声检测装置及图象编码装置
EP1087627A3 (en) 1999-09-24 2004-02-18 SANYO ELECTRIC Co., Ltd. Autostereoscopic image display device
GB0119243D0 (en) 2001-08-07 2001-10-03 Pharma Mar Sa Antitumoral analogs of ET-743
JP4102973B2 (ja) 2002-04-24 2008-06-18 日本電気株式会社 動画像の符号化方法および復号化方法、これを用いた装置とプログラム
JP4240283B2 (ja) 2002-10-10 2009-03-18 ソニー株式会社 復号装置及び復号方法
US7688895B2 (en) 2003-07-22 2010-03-30 Lsi Corporation Method and/or circuit for binary arithmetic decoding decisions before termination
US7362804B2 (en) 2003-11-24 2008-04-22 Lsi Logic Corporation Graphical symbols for H.264 bitstream syntax elements
US7599435B2 (en) * 2004-01-30 2009-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
US20050187742A1 (en) 2004-02-19 2005-08-25 Collodi David J. Physics engine
US7689051B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Predictive lossless coding of images and video
KR100945985B1 (ko) * 2004-12-28 2010-03-09 닛본 덴끼 가부시끼가이샤 동화상 부호화 방법 및 이것을 이용한 장치와, 컴퓨터프로그램
KR100695158B1 (ko) * 2005-08-03 2007-03-14 삼성전자주식회사 영상 부호화장치 및 방법과 그 복호화장치 및 방법
US7983335B2 (en) * 2005-11-02 2011-07-19 Broadcom Corporation AVC I—PCM data handling and inverse transform in a video decoder
EP1997318A4 (en) * 2006-03-22 2011-04-06 Korea Electronics Telecomm METHOD AND DEVICE FOR CODING AND DECODING THE COMPENSATED LIGHTING CHANGE
KR20070098428A (ko) 2006-03-30 2007-10-05 엘지전자 주식회사 비디오 신호 디코딩/인코딩 방법 및 장치
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
JP4584871B2 (ja) * 2006-06-09 2010-11-24 パナソニック株式会社 画像符号化記録装置および画像符号化記録方法
CN101198051B (zh) 2006-12-07 2011-10-05 深圳艾科创新微电子有限公司 基于h.264的熵解码器的实现方法及装置
JP5045950B2 (ja) 2006-12-14 2012-10-10 日本電気株式会社 映像符号化方法、映像符号化装置および映像符号化プログラム
EP3107294B1 (en) * 2007-03-20 2018-08-15 Fujitsu Limited Video encoding method and apparatus, and video decoding apparatus
CN101822063A (zh) * 2007-08-16 2010-09-01 诺基亚公司 用于编码和解码图像的方法和装置
CN101933331B (zh) * 2007-09-06 2014-04-09 日本电气株式会社 视频编码装置、视频编码方法、视频解码方法
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
JP2009100125A (ja) * 2007-10-15 2009-05-07 Toshiba Corp 符号化装置
EP2141927A1 (en) * 2008-07-03 2010-01-06 Panasonic Corporation Filters for video coding
CN101340584B (zh) * 2008-08-11 2010-09-29 中国科学院计算技术研究所 一种视频解码方法和装置
JP5116704B2 (ja) * 2009-02-02 2013-01-09 パナソニック株式会社 画像符号化装置及び画像符号化方法
KR101665547B1 (ko) * 2009-02-06 2016-10-12 톰슨 라이센싱 비디오 인코더 및 디코더에 대한 암묵적 및 반-암묵적 인트라 모드의 신호 발신을 위한 방법 및 장치
JP2010193398A (ja) 2009-02-20 2010-09-02 Canon Inc 画像符号化装置及び画像符号化方法
TWI433542B (zh) * 2009-05-25 2014-04-01 Mstar Semiconductor Inc 反量化處理方法與裝置
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101664125B1 (ko) * 2009-09-22 2016-10-10 삼성전자주식회사 랜덤 액세스 가능한 영상 인코딩 시스템 및 방법
US20110292247A1 (en) * 2010-05-27 2011-12-01 Sony Corporation Image compression method with random access capability
HUE030382T2 (en) * 2010-07-09 2017-05-29 Samsung Electronics Co Ltd A method and apparatus for encoding / decoding a transformation coefficient
JP5057314B2 (ja) 2010-09-01 2012-10-24 国立大学法人東京工業大学 歩容評価システム及び歩容評価方法
US8965139B2 (en) * 2010-09-29 2015-02-24 Panasonic Intellectual Property Corporation Of America Image decoding method, image coding method, image decoding apparatus, image coding apparatus and integrated circuit for generating a code stream with a hierarchical code structure
JP5855570B2 (ja) * 2010-09-30 2016-02-09 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラムおよび集積回路
US20120087411A1 (en) 2010-10-12 2012-04-12 Apple Inc. Internal bit depth increase in deblocking filters and ordered dither
MX338475B (es) 2010-11-26 2016-04-18 Nec Corp Dispositivo de codificacion de video, dispositivo de decodificacion de video, metodo de codificacion de video, metodo de decodificacion de video, y programa.
KR102427824B1 (ko) * 2010-12-08 2022-08-02 엘지전자 주식회사 인트라 예측 방법과 이를 이용한 부호화 장치 및 복호화 장치

Also Published As

Publication number Publication date
EP3057321B1 (en) 2018-06-20
BR122015017254A2 (pt) 2019-03-19
HK1221842A1 (zh) 2017-06-09
HK1221843A1 (zh) 2017-06-09
JP2016028522A (ja) 2016-02-25
BR112013012814A2 (pt) 2019-01-15
JP5900694B2 (ja) 2016-04-06
WO2012070232A1 (ja) 2012-05-31
CN105872557A (zh) 2016-08-17
AU2011333238B2 (en) 2015-06-11
CN105681804B (zh) 2018-11-02
CA2819014C (en) 2016-12-13
US11659188B2 (en) 2023-05-23
CN103229503A (zh) 2013-07-31
JPWO2012070232A1 (ja) 2014-05-19
US10154267B2 (en) 2018-12-11
MX338475B (es) 2016-04-18
BR122015017252B1 (pt) 2019-10-08
CN105681804A (zh) 2016-06-15
JP2016187207A (ja) 2016-10-27
KR101454418B1 (ko) 2014-10-28
EP3057322B1 (en) 2018-06-20
EP2645714A2 (en) 2013-10-02
PL3057321T3 (pl) 2018-12-31
JP6183502B2 (ja) 2017-08-23
KR101616667B1 (ko) 2016-04-28
CN103647974B (zh) 2017-05-31
CN105611297A (zh) 2016-05-25
KR20150014990A (ko) 2015-02-09
KR20140092409A (ko) 2014-07-23
BR122015017254B1 (pt) 2019-10-08
HK1186030A1 (zh) 2014-02-28
HK1221844A1 (zh) 2017-06-09
MX341942B (es) 2016-09-08
EP3057321A1 (en) 2016-08-17
EP3057323A1 (en) 2016-08-17
US10742991B2 (en) 2020-08-11
ES2687421T3 (es) 2018-10-25
RU2644131C1 (ru) 2018-02-07
KR20160066015A (ko) 2016-06-09
CN105611296B (zh) 2018-08-14
US11659189B2 (en) 2023-05-23
US20220232223A1 (en) 2022-07-21
EP2645714B1 (en) 2016-06-29
CA2897373A1 (en) 2012-05-31
CA2897373C (en) 2017-11-14
US11310510B2 (en) 2022-04-19
CN105611296A (zh) 2016-05-25
EP2688298B1 (en) 2016-09-21
RU2606306C2 (ru) 2017-01-10
US20160249055A1 (en) 2016-08-25
EP2688298A4 (en) 2014-06-25
RU2633170C1 (ru) 2017-10-11
PL3057323T3 (pl) 2018-11-30
US20130223514A1 (en) 2013-08-29
JP2013179689A (ja) 2013-09-09
EP3379831A1 (en) 2018-09-26
JP2016040932A (ja) 2016-03-24
EP3057323B1 (en) 2018-07-04
ES2589702T3 (es) 2016-11-15
JP5900414B2 (ja) 2016-04-06
KR101519488B1 (ko) 2015-05-12
CA2819014A1 (en) 2012-05-31
ES2688086T3 (es) 2018-10-30
CN105872557B (zh) 2018-12-04
US20200322615A1 (en) 2020-10-08
EP2688298A1 (en) 2014-01-22
JP5900693B2 (ja) 2016-04-06
BR122015017252A2 (pt) 2019-05-14
MX353197B (es) 2018-01-05
CN103229503B (zh) 2016-06-29
KR20130095287A (ko) 2013-08-27
KR20150063594A (ko) 2015-06-09
JP5321753B2 (ja) 2013-10-23
US20220191510A1 (en) 2022-06-16
EP3057322A1 (en) 2016-08-17
MX2013005652A (es) 2013-09-13
RU2562432C2 (ru) 2015-09-10
JP2016028523A (ja) 2016-02-25
ES2688379T3 (es) 2018-11-02
RU2647682C1 (ru) 2018-03-16
KR101629153B1 (ko) 2016-06-09
AU2011333238A1 (en) 2013-05-02
CN103647974A (zh) 2014-03-19
BR112013012814B1 (pt) 2019-10-08
EP2645714A3 (en) 2013-11-06
RU2015117981A (ru) 2015-10-27
CN105611297B (zh) 2018-09-07
JP5958634B2 (ja) 2016-08-02
PL3057322T3 (pl) 2018-12-31
KR101671156B1 (ko) 2016-10-31
RU2013128978A (ru) 2015-01-10

Similar Documents

Publication Publication Date Title
ES2608788T3 (es) Dispositivo de descodificación de video, método de descodificación de video y programa de descodificación de video
ES2928097T3 (es) Dispositivo, método y programa de descodificación de video
AU2016250413B2 (en) Image encoding device, image decoding device, image encoding method, image decoding method, and program
AU2015202105B2 (en) Image encoding device, image decoding device, image encoding method, image decoding method, and program