ES2874762T3

ES2874762T3 - Procedimiento de codificación de vídeo y procedimiento de decodificación de vídeo

Info

Publication number: ES2874762T3
Application number: ES12747108T
Authority: ES
Inventors: Viktor Wahadaniah; Chong Soon Lim; Sue Mon Thet Naing; Takahiro Nishi; Youji Shibahara; Hisao Sasai; Toshiyasu Sugio
Original assignee: Sun Patent Trust Inc
Current assignee: Sun Patent Trust Inc
Priority date: 2011-02-16
Filing date: 2012-02-16
Publication date: 2021-11-05
Anticipated expiration: 2032-02-16
Also published as: EP2677751A1; KR20130140133A; US20130315315A1; US20180103267A1; WO2012111331A1; US10397605B2; CN103650508A; US20190335198A1; CN107426575A; CN103650508B; EP2677751B1; JPWO2012111331A1; JP2019022227A; US20220264145A1; US9961362B2; US11303926B2; JP6422036B2; KR101954465B1; JP2016123135A; JP6065299B2

Abstract

Un procedimiento de codificación de vídeo para codificar una pluralidad de imágenes en una secuencia de bits temporalmente escalable usando una estructura de codificación jerárquica que asigna uno de una pluralidad de niveles temporales a cada una de la pluralidad de imágenes, comprendiendo el procedimiento de codificación de vídeo: escribir un parámetro que especifica un nivel temporal de cada una de la pluralidad de imágenes en una secuencia de bits; evaluar, para cada una de la pluralidad de imágenes, si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros, en el que se evalúa la instantánea para que sea una instantánea clave si y únicamente si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros; evaluar si una instantánea actual es un punto de conmutación temporal, en el que se evalúa que la instantánea actual sea un punto de conmutación temporal si y únicamente si hay una instantánea clave de manera que la instantánea actual es la primera instantánea en tiempo de visualización de las imágenes que tienen el mismo nivel temporal que la instantánea actual y que siguen a dicha instantánea clave en tiempo de visualización; seleccionar únicamente imágenes clave como imágenes de referencia válidas para la instantánea actual, de todas las imágenes de referencia en una memoria de instantánea de referencia, cuando la instantánea actual es una instantánea clave o un punto de conmutación temporal; y seleccionar las imágenes clave e imágenes no clave, de entre todas las imágenes de referencia incluidas en la memoria de instantánea de referencia, como las imágenes de referencia válidas cuando la instantánea actual no es ni un punto de conmutación temporal ni una instantánea clave, en el que la instantánea no clave se selecciona únicamente si la instantánea no clave sigue a la última instantánea clave de las imágenes clave que preceden a la instantánea actual en tiempo de visualización, precede a la primera instantánea clave de las imágenes clave que siguen a la instantánea actual en tiempo de visualización y tiene un nivel temporal inferior o igual a un nivel temporal de la instantánea actual; construir una lista de imágenes de referencia que incluye una o más de las imágenes de referencia válidas, siendo la lista de imágenes de referencia para la instantánea actual; y codificar la instantánea actual en la secuencia de bits realizando predicción de movimiento en la instantánea actual usando la una o más imágenes de referencia válidas en la lista de imágenes de referencia.

Description

DESCRIPCIÓN

Procedimiento de codificación de vídeo y procedimiento de decodificación de vídeo

rCampo técnico!

Una o más realizaciones ilustrativas desveladas en el presente documento se refieren, en general, a la codificación de datos multimedia, y se refieren, en particular, a un procedimiento de codificación de vídeo y a un procedimiento de decodificación de vídeo que utilizan más de una instantánea de referencia para predicción de inter-instantánea.

Antecedentes

Antecedentes de la técnica!

Un procedimiento de codificación de vídeo más reciente, tal como MPEG-4 AVC/H. 264 (consúltese ITU-T H.264 03/2010) y una codificación de vídeo de alta eficacia (HEVC) de la generación futura, soportan la predicción de inter instantánea que utiliza predicción de movimiento compensado a partir de más de una instantánea de referencia. En el caso en el que haya más de una instantánea de referencia, se crea una o más listas de instantáneas de referencia para la predicción de inter-instantánea, y las instantáneas de referencia que se encuentran temporalmente más cerca de una instantánea actual se ordenan en la parte superior de las listas mediante un esquema predeterminado. De la parte superior a la parte inferior de la lista de instantáneas de referencia, las instantáneas de referencia se identifican de manera inequívoca por un índice de referencia que tiene un valor incremental.

Los avances recientes, tales como el desarrollo en cuso de una norma de codificación de vídeo HEVC, pueden utilizar una estructura de codificación jerárquica en las actividades de diseño, experimento y evaluación. Las ventajas de la estructura de codificación jerárquica incluyen la eficacia de codificación mejorada y la calidad de instantánea mejorada. En la estructura de codificación jerárquica, las instantáneas están dispuestas en niveles temporales en los que el nivel más bajo representa una velocidad de fotogramas más baja y la inclusión de subsiguientes niveles altos (el nivel temporal es 1 o 2) representa velocidades de fotograma superiores. Se muestran ejemplos de la estructura de codificación jerárquica en la Figura 1 y en la Figura 2. Puede obtenerse una cierta cantidad de ganancia de codificación codificando instantáneas a niveles temporales inferiores con mejor calidad (por ejemplo, aplicando menos cuantificación) que las instantáneas en niveles temporales superiores. En la HEVC, el nivel temporal se indica por medio de un parámetro de sintaxis temporaljd ubicado en un encabezado de una unidad de capa de abstracción de red (NAL) de un corte codificado de una instantánea.

Los niveles temporales también se usan para posibilitar una característica de escalabilidad temporal de una secuencia de bits de vídeo codificado. Se posibilita la conmutación de un nivel temporal superior (velocidad de fotogramas superior) a un nivel temporal inferior (velocidad de fotogramas inferior) restringiendo la referencia de la instantánea de modo que una instantánea actual únicamente hace referencia a instantáneas de referencia en los mismos niveles temporales o inferiores. Por otra parte, se posibilita la conmutación del nivel temporal inferior al nivel temporal superior usando un esquema de anidación temporal. Sin embargo, cuando se decodifica una instantánea que tiene un nivel temporal inferior en un orden de codificación, ya no pueden usarse más las instantáneas de referencia que tienen niveles temporales superiores para la predicción.

El documento JCTVC-D200 (Jill Boyce y col., "High layer syntax to improve support for temporal scalability", Joint Collaborative Team on Video Coding of ISO/IEC JTC1/SC29/WG11 y ⁱT^u-T SG.16, Daegu, KR, 20-28 de enero de 2011) propone añadir una temporal_switching_point_flag al encabezado de la unidad de NAL para indicar si una instantánea particular representa un punto de conmutación temporal.

El documento EP 1809042 A1 desvela una estructura de GOP de la instantánea B jerárquica, en la que únicamente se usa el fotograma clave del GOP anterior para codificar el siguiente GOP, y en el que los fotogramas en el mismo nivel temporal no se hacen referencia entre sí, excepto para fotogramas clave.

rSumario de la invención!

rProblema técnico!

Cuando existe un desajuste entre un procedimiento de codificación y un procedimiento de decodificación, tal como en el caso de transmisión con pérdidas errónea, la predicción inter-instantánea puede propagar el error a través de un gran número de instantáneas, como se ilustra en (a) de la Figura 1. En (a) de la Figura 1, el error tiene lugar en una instantánea B2 (el número 2 indica el orden de salida). Se usa la instantánea B2 como una instantánea de referencia para un procedimiento de predicción inter-instantánea en una instantánea B3 y una instantánea B6, de modo que el error se propaga a la instantánea B3 y a la instantánea B6. El uso posterior de la instantánea B3 y la instantánea B6 como instantáneas de referencia propaga adicionalmente este error. Tal propagación de error es un problema principal para una cierta aplicación, tal como la transmisión de vídeo de retardo bajo a través de una red pública.

Típicamente, se establece un nivel de calidad diferente para cada instantánea que corresponde al nivel temporal como se ha descrito anteriormente, para mejorar de esta manera el resultado totalmente subjetivo y objetivo. El problema con la técnica anterior es de tal manera que una instantánea de referencia que está temporalmente alejada y tiene calidad baja normalmente es menos útil que una instantánea de referencia que está temporalmente alejada y tiene calidad alta. Por lo tanto, la instantánea de referencia que está temporalmente alejada y tiene calidad baja está incluida en la lista de instantáneas de referencia, lo que da como resultado una eficacia de codificación subóptima, ya que un índice de referencia que corresponde a la instantánea de referencia que está temporalmente alejada y tiene calidad alta puede requerir más bits de señalización.

La conmutación de un nivel temporal inferior a uno superior puede realizarse en cualquier momento usando un esquema de anidación temporal de acuerdo con una técnica convencional. Sin embargo, un esquema de este tipo introduce alguna pérdida en la eficacia de codificación debido a su estructura de referencia altamente restrictiva. Es un objeto de la presente invención proporcionar un procedimiento nuevo para un esquema de referencia de instantánea resistente. Es un objeto adicional de la presente invención proporcionar un esquema de referencia de instantánea nuevo que permita una predicción inter-insantánea más eficaz con resistencia al error mejorada, y que proporcione puntos de conmutación de velocidades de fotograma inferiores a superiores en una secuencia de bits de vídeo codificado temporalmente escalable.

Esto se consigue mediante las características de las reivindicaciones independientes. Las realizaciones preferidas son la materia objeto de las reivindicaciones dependientes.

La invención se define mediante las reivindicaciones adjuntas. Cualesquiera referencias a realizaciones que no caen bajo el ámbito de las reivindicaciones han de entenderse como ejemplos útiles para entender la invención.

Lo que es novedoso acerca de la presente divulgación es que se define una instantánea de límite para limitar una referencia de instantánea en la predicción inter-instantánea, permitiendo de esta manera la recuperación en un procedimiento de decodificación cuando tiene lugar un desajuste entre un procedimiento de codificación y el procedimiento de decodificación. Adicionalmente, un esquema predeterminado para la construcción de la lista de instantáneas de referencia usando la presente divulgación permite que se realice una estructura de codificación jerárquica que minimiza eficazmente un bit de una señal para realizar la reordenación en la lista de referencia. Finalmente, la secuencia de bits de vídeo codificado generada usando la presente divulgación contiene intrínsecamente puntos de conmutación de escalabilidad temporales.

rBreve descripción de los dibujos!

[FIG. 1] La Figura 1 es un diagrama que muestra un ejemplo de propagación de error cuando tiene lugar un desajuste entre un procedimiento de codificación y un procedimiento de decodificación, y el efecto de acuerdo con la presente divulgación que restringe la propagación del error.

[FIG. 2] La Figura 2 es un diagrama que muestra un ejemplo de puntos de conmutación de niveles temporales inferiores a superiores en una secuencia de bits de vídeo codificado que soporta escalabilidad temporal.

[FIG. 3] La Figura 3 es un diagrama de flujo que muestra un procedimiento de codificación de vídeo que usa la presente divulgación.

[FIG. 4] La Figura 4 es un diagrama de flujo que muestra un procedimiento de decodificación de vídeo que usa la presente divulgación.

[FIG. 5] La Figura 5 es un diagrama de bloques que muestra un ejemplo de un aparato de codificación de vídeo que usa la presente divulgación.

[FIG. 6] La Figura 6 es un diagrama de bloques que muestra un ejemplo de un aparato de decodificación de vídeo que usa la presente divulgación.

[FIG. 7] La Figura 7 es un diagrama que muestra una ubicación de un parámetro que indica si se usa o no un esquema de referencia de instantánea resistente, en un encabezado de una secuencia de bits de vídeo codificado.

[FIG. 8] La Figura 8 es un diagrama de flujo que muestra un procedimiento de codificación de vídeo que usa una primera realización de un esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 9] La Figura 9 es un diagrama de flujo que muestra el procedimiento de codificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 10] La Figura 10 es un diagrama de flujo que muestra una primera realización de un procedimiento para determinar una clasificación que indica si una instantánea es o no una instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 11] La Figura 11 es un diagrama de flujo que muestra una primera realización de un procedimiento para determinar una clasificación que indica si una instantánea es o no una instantánea clave en el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 12] La Figura 12 es un diagrama que muestra una ubicación de una bandera que indica una clasificación sobre si una instantánea codificada es o no la instantánea clave en un encabezado de un corte codificado de la instantánea codificada, de acuerdo con la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 13] La Figura 13 es un diagrama de flujo que muestra una segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 14] La Figura 14 es un diagrama de flujo que muestra una segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 15] La Figura 15 es un diagrama que muestra una ubicación de un parámetro para especificar un nivel temporal de una instantánea codificada en un encabezado de un corte codificado de la instantánea codificada, de acuerdo con la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 16] La Figura 16 es un diagrama de flujo que muestra una tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 17] La Figura 17 es un diagrama de flujo que muestra la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 18] La Figura 18 es un diagrama que muestra una ubicación de un parámetro para especificar un periodo de instantáneas clave en un encabezado de una secuencia de bits de vídeo codificado, de acuerdo con la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 19] La Figura 19 es un diagrama de bloques que muestra un ejemplo de un aparato de codificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 20] La Figura 20 es un diagrama de bloques que muestra un ejemplo de un aparato de decodificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 21] La Figura 21 es un diagrama de flujo que muestra el procedimiento de codificación de vídeo que usa una segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 22] La Figura 22 es un diagrama de flujo que muestra el procedimiento de decodificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 23] La Figura 23 es un diagrama de flujo que muestra un procedimiento para construir una lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa una segunda realización o una tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 24] La Figura 24 es un diagrama de flujo que muestra una primera realización de un segundo esquema predeterminado para realizar la ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda realización o la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 25] La Figura 25 es un diagrama de flujo que muestra una segunda realización del segundo esquema predeterminado para realizar la ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda realización o la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 26] La Figura 26 es un diagrama de flujo que muestra una tercera realización del segundo esquema predeterminado para realizar la ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda realización o la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 27] La Figura 27 es un diagrama de bloques que muestra un ejemplo del aparato de codificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 28] La Figura 28 es un diagrama de bloques que muestra un ejemplo del aparato de decodificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 29] La Figura 29 es un diagrama de flujo que muestra el procedimiento de codificación de vídeo que usa la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 30] La Figura 30 es un diagrama de bloques que muestra un ejemplo del aparato de codificación de vídeo que usa la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación.

[FIG. 31] La Figura 31 es un diagrama que muestra una ubicación de un parámetro para especificar una etapa de reordenación de lista de referencias en un encabezado de corte de una secuencia de bits de vídeo codificado. [FIG. 32] La Figura 32 es un diagrama que muestra una configuración global de un sistema de suministro de contenido para implementar servicios de distribución de contenido.

[FIG. 33] La Figura 33 es un diagrama que muestra una configuración global de un sistema de difusión digital. [FIG. 34] La Figura 34 es un diagrama de bloques que muestra un ejemplo de configuración de una televisión. [FIG. 35] La Figura 35 es un diagrama de bloques que muestra un ejemplo de configuración de una unidad de reproducción/grabación de información que lee y escribe información desde y en un medio de grabación que es un disco óptico.

[FIG. 36] La Figura 36 es un diagrama que muestra un ejemplo de configuración de un medio de grabación que es un disco óptico.

[FIG. 37A] La Figura 37A es un diagrama que muestra un ejemplo de un teléfono celular.

[FIG. 37B] La Figura 37B es un diagrama de bloques que muestra un ejemplo de configuración de un teléfono celular.

[FIG. 38] La Figura 38 es un diagrama que muestra una estructura de datos multiplexados.

[FIG. 39] La Figura 39 es un diagrama que muestra esquemáticamente cómo se multiplexa cada bloque en datos multiplexados.

[FIG. 40] La Figura 40 es un diagrama que muestra cómo se almacena un flujo de vídeo en un flujo de paquetes de PES en más detalle.

[FIG. 41] La Figura 41 es un diagrama que muestra una estructura de paquetes de TS y paquetes de origen en los datos multiplexados.

[FIG. 42] La Figura 42 es un diagrama que muestra una estructura de datos de una PMT.

[FIG. 43] La Figura 43 es un diagrama que muestra una estructura interna de información de datos multiplexados.

[FIG. 44] La Figura 44 es un diagrama que muestra una estructura interna de información de atributo de flujo. [FIG. 45] La Figura 45 es un diagrama que muestra etapas para identificar datos de vídeo.

[FIG. 46] La Figura 46 es un diagrama de bloques que muestra un ejemplo de configuración de un circuito integrado para implementar el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento de acuerdo con cada una de las realizaciones.

[FIG. 47] La Figura 47 es un diagrama que muestra una configuración para conmutar entre frecuencias de accionamiento.

[FIG. 48] La Figura 48 es un diagrama que muestra etapas para identificar datos de vídeo y conmutar entre frecuencias de accionamiento.

[FIG. 49] La Figura 49 es un diagrama que muestra un ejemplo de una tabla de correspondencia en la que están asociadas normas de datos de vídeo con frecuencias de accionamiento.

[FIG. 50A] La Figura 50A es un diagrama que muestra un ejemplo de una configuración para compartir un módulo de una unidad de procesamiento de señal.

[FIG. 50B] La Figura 50B es un diagrama que muestra otro ejemplo de una configuración para compartir un módulo de la unidad de procesamiento de señal.

Descripción de las realizaciones!

[Realización 1]

En lo sucesivo, se describen en detalle ciertas realizaciones ilustrativas con referencia a los dibujos adjuntos. Cada una de las realizaciones ilustrativas descritas a continuación muestra un ejemplo general o específico. Los valores numéricos, formas, materiales, elementos estructurales, la disposición y conexión de los elementos estructurales, etapas, el orden de procesamiento de las etapas, etc., mostrados en las siguientes realizaciones de ejemplo son meros ejemplos, y, por lo tanto, no limitan el ámbito de las reivindicaciones adjuntas y sus equivalentes. La presente divulgación se especifica por el ámbito de las reivindicaciones. Por lo tanto, entre los elementos estructurales en las siguientes realizaciones ilustrativas, los elementos estructurales no indicados en una cualquiera de las reivindicaciones independientes se describe como elementos estructurales arbitrarios, pero no indispensables para conseguir la presente divulgación.

De acuerdo con una realización ilustrativa se desvela en el presente documento, un procedimiento de codificación de vídeo para codificar una instantánea actual en un vídeo que usa una o más instantáneas de referencia, el procedimiento de codificación de vídeo puede incluir: seleccionar si ha de usarse o no un esquema temporalmente escalable para codificar el vídeo; determinar una clasificación de una instantánea en el vídeo usando un resultado de la selección con respecto al esquema temporalmente escalable; determinar si la instantánea es o no una instantánea clave, teniendo la instantánea clave un nivel temporal predeterminado; elegir, cuando se determina la clasificación de la instantánea actual como una clasificación predeterminada que indica una instantánea usable como un punto de conmutación de niveles temporales, una o más instantáneas de referencia válidas, cada una de las cuales la instantánea clave, de todas las instantáneas de referencia en una memoria de instantánea de referencia, para la instantánea actual; construir una lista de instantáneas de referencia que incluye al menos una de la una o más instantáneas de referencia válidas; y codificar la instantánea actual en una secuencia de bits realizando predicción de movimiento en la instantánea actual usando la una o más instantáneas de referencia válidas en la lista de instantáneas de referencia.

Por ejemplo, el procedimiento de codificación de vídeo puede incluir adicionalmente escribir información de clasificación que indica la clasificación de la instantánea actual en un encabezado de la secuencia de bits.

Por ejemplo, en la escritura, puede escribirse adicionalmente un parámetro de nivel temporal que indica un nivel temporal de la instantánea actual en el encabezado de la secuencia de bits.

Por ejemplo, en la determinación, puede determinarse si un parámetro de nivel temporal de la instantánea es o no cero; en la selección de la una o más instantáneas de referencia válidas, cuando se determina la clasificación de la instantánea actual que tiene el parámetro de nivel temporal mayor que cero como la clasificación predeterminada, puede seleccionarse una o más de las instantáneas clave.

Por ejemplo, en la escritura, puede escribirse adicionalmente información de selección e información de referencia en el encabezado de la secuencia de bits, indicando la información de selección el resultado de la selección con respecto al esquema temporalmente escalable, e indicando la información de referencia las instantáneas de referencia en la memoria de instantánea de referencia.

Por ejemplo, la instantánea clave puede ser una instantánea inter-prevista.

Por ejemplo, en la selección de la una o más instantáneas de referencia válidas, cuando no se determina la clasificación de la instantánea actual como la clasificación predeterminada, puede seleccionarse una instantánea no clave como una de la una o más instantáneas de referencia válidas.

Por ejemplo, en la selección de la una o más instantáneas válidas, cuando no se determina la clasificación de la instantánea actual como la clasificación predeterminada, todas las instantáneas de referencia en la memoria de instantánea de referencia pueden seleccionarse como la una o más instantáneas de referencia válidas, la construcción puede incluir adicionalmente: construir una primera lista de instantáneas de referencia que incluye una o más instantáneas de referencia en la memoria de instantánea de referencia, usando una distancia temporal entre cada una de la una o más instantáneas de referencia y la instantánea actual; construir una segunda lista de instantáneas de referencia que incluye la una o más instantáneas de referencia válidas, usando la distancia temporal entre cada una de la una o más instantáneas de referencia y la instantánea actual y la clasificación de cada una de la una o más instantáneas de referencia; reordenar la primera lista de instantáneas de referencia para hacer que la primera lista de instantáneas de referencia sea equivalente a la segunda lista de instantáneas de referencia; y en la codificación, se predice la instantánea actual, usando la primera lista reordenada de instantáneas de referencia. Por ejemplo, el procedimiento de codificación de vídeo puede incluir adicionalmente: seleccionar un primer grupo de instantáneas de referencia que incluye una o más instantáneas clave de la memoria de instantánea de referencia; identificar, cuando no se determina la clasificación de la instantánea actual como la clasificación predeterminada, (i) una primera instantánea de límite como una instantánea clave que tiene una instancia temporal más cercana a la instantánea actual entre instantáneas clave presentadas visualmente más anteriormente que la instantánea actual, y (ii) una segunda instantánea de límite como una instantánea clave que tiene una instancia temporal más cercana a la instantánea actual entre instantáneas clave presentadas visualmente más posteriormente que la instantánea actual; realizar, cuando no está presente la segunda instantánea de límite, (i) la selección de un segundo grupo de instantáneas de referencia que incluye una instantánea de referencia no clave presentada visualmente más posteriormente que la primera instantánea de límite, y (ii) la adición del segundo grupo de instantáneas de referencia al primer grupo de instantáneas de referencia; realizar, cuando está presente la segunda instantánea de límite, (i) la selección de un tercer grupo de instantáneas de referencia que incluye una instantánea de referencia no clave presentada visualmente más posteriormente que la primera instantánea de límite y más anteriormente que la segunda instantánea de límite, y (ii) la adición del tercer grupo de instantáneas de referencia al primer grupo de instantáneas de referencia; y colocar el primer grupo de instantáneas de referencia en la lista de instantáneas de referencia que se almacena de acuerdo con un esquema predeterminado, usando la distancia temporal a la instantánea actual y la clasificación.

Un aparato de codificación de vídeo que codifica una instantánea actual en un vídeo usando una o más instantáneas de referencia, el aparato de codificación de vídeo puede incluir: una unidad de selección configurada para seleccionar si ha de usarse o no un esquema temporalmente escalable para codificar el vídeo; una unidad de determinación de clasificación configurada para determinar una clasificación de una instantánea en el vídeo usando un resultado con respecto a la selección del esquema temporalmente escalable; una unidad de evaluación configurada para evaluar si la instantánea es o no una instantánea clave, teniendo la instantánea clave un nivel temporal predeterminado; una unidad de selección de instantánea de referencia válida configurada para seleccionar una o más instantáneas de referencia válidas, cada una de las cuales es la instantánea clave, de todas las instantáneas de referencia en una memoria de instantánea de referencia para la instantánea actual, cuando se determina la clasificación de la instantánea actual como una clasificación predeterminada que indica una instantánea usable como un punto de conmutación de niveles temporales; una unidad de construcción de lista de instantáneas de referencia configurada para construir una lista de instantáneas de referencia que incluye al menos una de la una o más instantáneas de referencia válidas; y una unidad de codificación configurada para codificar la instantánea actual en una secuencia de bits realizando predicción de movimiento en la instantánea actual usando la una o más instantáneas de referencia válidas en la lista de instantáneas de referencia.

Un procedimiento de decodificación de vídeo para decodificar una secuencia de bits que corresponde a una instantánea actual en un vídeo usando una o más instantáneas de referencia, el procedimiento de decodificación de vídeo puede incluir: determinar si ha de usarse o no un esquema temporalmente escalable para decodificar el vídeo; obtener una clasificación de una instantánea en el vídeo, determinándose la clasificación usando un resultado de la determinación con respecto al esquema temporalmente escalable; determinar si la instantánea es o no una instantánea clave, teniendo la instantánea clave un nivel temporal predeterminado; seleccionar, cuando la clasificación de la instantánea actual es una clasificación predeterminada que indica una instantánea usable como un punto de conmutación de niveles temporales, una o más instantáneas de referencia válidas, cada una de las cuales la instantánea clave, de todas las instantáneas de referencia en una memoria de instantánea de referencia, para la instantánea actual; construir una lista de instantáneas de referencia que incluye al menos una de la una o más instantáneas de referencia válidas; y decodificar la instantánea actual realizando predicción de movimiento en la instantánea actual usando la una o más instantáneas de referencia válidas en la lista de instantáneas de referencia. Por ejemplo, el procedimiento de decodificación de vídeo puede incluir adicionalmente obtener información de clasificación que indica la clasificación de la instantánea actual, de un encabezado de la secuencia de bits.

Por ejemplo, el procedimiento de decodificación de vídeo puede incluir adicionalmente obtener un parámetro de nivel temporal que indica un nivel temporal de la instantánea actual, del encabezado de la secuencia de bits.

Por ejemplo, en la determinación, puede determinarse si un parámetro de nivel temporal de la instantánea es o no cero; en la selección de la una o más instantáneas de referencia válidas, cuando la clasificación de la instantánea actual que tiene el parámetro de nivel temporal mayor que cero es la clasificación predeterminada, puede seleccionarse una o más de las instantáneas clave.

Por ejemplo, el procedimiento de decodificación de vídeo puede incluir adicionalmente obtener información de selección e información de referencia del encabezado de la secuencia de bits, indicando la información de selección si se usa o no el esquema temporalmente escalable para decodificar el vídeo, e indicando la información de referencia las instantáneas de referencia en la memoria de instantánea de referencia.

Por ejemplo, la instantánea clave puede ser una instantánea inter-prevista.

Por ejemplo, en la selección de la una o más instantáneas de referencia válidas, cuando la clasificación de la instantánea actual no es la clasificación predeterminada, puede seleccionarse una instantánea no clave como una de la una o más instantáneas de referencia válidas.

Por ejemplo, en la selección de la una o más instantáneas válidas, cuando la clasificación de la instantánea actual no es la clasificación predeterminada, todas las instantáneas de referencia en la memoria de instantánea de referencia pueden seleccionarse como la una o más instantáneas de referencia válidas, la construcción puede incluir adicionalmente: construir una primera lista de instantáneas de referencia que incluye una o más instantáneas de referencia en la memoria de instantánea de referencia, usando una distancia temporal entre cada una de la una o más instantáneas de referencia y la instantánea actual; construir una segunda lista de instantáneas de referencia que incluye la una o más instantáneas de referencia válidas, usando la distancia temporal entre cada una de la una o más instantáneas de referencia y la instantánea actual y la clasificación de cada una de la una o más instantáneas de referencia; reordenar la primera lista de instantáneas de referencia para hacer que la primera lista de instantáneas de referencia sea equivalente a la segunda lista de instantáneas de referencia; y en la decodificación, se predice la instantánea actual, usando la primera lista reordenada de instantáneas de referencia.

Por ejemplo, el procedimiento de decodificación de vídeo puede incluir adicionalmente: seleccionar un primer grupo de instantáneas de referencia que incluye una o más instantáneas clave de la memoria de instantánea de referencia; identificar, cuando la clasificación de la instantánea actual no es la clasificación predeterminada, (i) una primera instantánea de límite como una instantánea clave que tiene una instancia temporal más cercana a la instantánea actual entre instantáneas clave presentadas visualmente más anteriormente que la instantánea actual, y (ii) una segunda instantánea de límite como una instantánea clave que tiene una instancia temporal más cercana a la instantánea actual entre instantáneas clave presentadas visualmente más posteriormente que la instantánea actual; realizar, cuando no está presente la segunda instantánea de límite, (i) la selección de un segundo grupo de instantáneas de referencia que incluye una instantánea de referencia no clave presentada visualmente más posteriormente que la primera instantánea de límite, y (ii) la adición del segundo grupo de instantáneas de referencia al primer grupo de instantáneas de referencia; realizar, cuando está presente la segunda instantánea de límite, (i) la selección de un tercer grupo de instantáneas de referencia que incluye una instantánea de referencia no clave presentada visualmente más posteriormente que la primera instantánea de límite y más anteriormente que la segunda instantánea de límite, y (ii) la adición del tercer grupo de instantáneas de referencia al primer grupo de instantáneas de referencia; y colocar el primer grupo de instantáneas de referencia en la lista de instantáneas de referencia que se almacena de acuerdo con un esquema predeterminado, usando una distancia temporal a la instantánea actual y la clasificación.

Un aparato de vídeo que decodifica una secuencia de bits que corresponde a una instantánea actual en un vídeo usando una o más instantáneas de referencia, el aparato de decodificación de vídeo puede incluir: una unidad de determinación configurada para determinar si ha de usarse o no un esquema temporalmente escalable para decodificar el vídeo; una unidad de obtención configurada para obtener una clasificación de una instantánea en el vídeo, determinándose la clasificación usando un resultado de la determinación con respecto al esquema temporalmente escalable; una unidad de evaluación configurada para evaluar si la instantánea es o no una instantánea clave, teniendo la instantánea clave un nivel temporal predeterminado; una unidad de selección de instantánea de referencia válida configurada para seleccionar una o más instantáneas de referencia válidas, cada una de las cuales es la instantánea clave, de todas las instantáneas de referencia en una memoria de instantánea de referencia para la instantánea actual, cuando la clasificación de la instantánea actual es una clasificación predeterminada que indica una instantánea usable como un punto de conmutación de niveles temporales; una unidad de construcción de lista de instantáneas de referencia configurada para construir una lista de instantáneas de referencia que incluye al menos una de la una o más instantáneas de referencia válidas; y una unidad de decodificación configurada para decodificar la instantánea actual realizando predicción de movimiento en la instantánea actual usando la una o más instantáneas de referencia válidas en la lista de instantáneas de referencia.

Para la consistencia de las descripciones, esta memoria descriptiva usa una convención en la que las instantáneas primarias a la velocidad de fotogramas más baja con un valor más bajo del nivel temporal (por ejemplo, el valor 0) y los subsiguientes valores superiores del nivel temporal (por ejemplo, los valores 1, 2 y 3) indican subsiguientes conjuntos de instantáneas que producen velocidades de fotograma superiores (dobles) cuando se añaden en una parte superior de los niveles temporales inferiores. Se usa la misma convención en los esquemas de codificación de vídeo recientes, tales como HEVC, la extensión MVC de H.264 y una extensión SVC de H.264, en los que se indica el nivel temporal usando el parámetro de sintaxis temporaljd. Será evidente para los expertos en la materia que una convención alternativa en la que un valor mayor del nivel temporal indica una velocidad de fotogramas inferior sirve para el mismo fin.

La Figura 1 muestra un ejemplo de propagación de error cuanto tiene lugar un desajuste entre el procedimiento de codificación y el procedimiento de decodificación, tal como debido a la pérdida de transmisión. En la técnica anterior como se muestra en (a) de la Figura 1, el error puede propagarse a través de un gran número de instantáneas, apareciendo a menudo como artefactos visuales persistentes en una instantánea reconstruida. En (a) de la Figura 1, las instantáneas afectadas por el error se indican usando sombreado en tramas. Como se muestra en (b) de la Figura 1, en la presente divulgación, se definen las instantáneas clave y la referencia de instantánea se restringe a compartir bordes con las instantáneas clave más cercanas, de modo que no está permitida la predicción inter instantánea de instantáneas no clave ubicadas temporalmente más allá de las instantáneas clave más cercanas. Por simplicidad, la Figura 1 muestra un ejemplo de codificación de retardo bajo en el que únicamente existe predicción hacia delante. Sin embargo, la restricción de la referencia de instantánea para compartir bordes con las instantáneas clave más cercanas deberá aplicarse tanto en las direcciones de predicción hacia delante como hacia atrás. Usando la presente divulgación, se detiene la propagación de error en una instantánea clave (instantánea B4) y las subsiguientes instantáneas (instantáneas B5, B6, B7 y así sucesivamente) pueden reconstruirse perfectamente sin error.

La Figura 2 muestra un ejemplo que ilustra los efectos de la presente divulgación al crear el punto de conmutación de niveles inferiores a superiores en la secuencia de bits de vídeo temporalmente escalable. En la técnica anterior, cuando se desactiva la anidación temporal como se muestra en (a) de la Figura 2, no se soporta la conmutación de niveles inferiores a superiores. Por ejemplo, la conmutación a la velocidad de fotogramas más alta (que corresponde a un nivel temporal 2) no puede realizarse en la instantánea B5 puesto que la instantánea B1 y la instantánea B3 son necesarias para la decodificación de la instantánea B5.

Cuando se activa la anidación temporal en la técnica anterior como se muestra en (b) de la Figura 2, puede realizarse la conmutación de niveles temporales inferiores a superiores en cualquier punto (según se indica en las instantáneas mediante sombreado en tramas). Por ejemplo, puede realizarse la conmutación al nivel temporal 2 en la instantánea B5 puesto que se predice la instantánea B5 a partir de únicamente una instantánea 10 y una instantánea B4. Sin embargo, cuando se posibilita la anidación temporal, la referencia de instantánea se vuelve altamente restrictiva y tiende a introducir pérdida en la eficacia de codificación. Por otra parte, en la aplicación práctica de la codificación escalable temporal, puede no proporcionarse necesariamente el punto de conmutación en cada instantánea.

Como se ha descrito anteriormente, de acuerdo con la presente divulgación, la referencia de instantánea está restringida a compartir bordes con las instantáneas clave. Como resultado, puede usarse la primera instantánea de cada uno de los niveles temporales que sigue a la instantánea clave como el punto de conmutación. Por ejemplo, una instantánea B2 es un punto de conmutación válido a un nivel temporal 1 y la instantánea B1 es un punto de conmutación válido al nivel temporal 2. Las instantáneas subsiguientes en un nivel temporal arbitrario (tal como la instantánea B3 en el nivel temporal 2) no pueden usarse como el punto de conmutación. Sin embargo, la referencia de instantánea para cada una de estas instantáneas subsiguientes es menos restrictiva (por ejemplo, una instantánea B11 está permitida a usar una instantánea B9 como la referencia de predicción), de modo que está permitida una codificación más eficaz. Por lo tanto, la presente divulgación proporciona un mismo equilibrio práctico entre la propiedad de escalabilidad temporal y la eficacia de codificación.

La Figura 3 es un diagrama de flujo que muestra el procedimiento de codificación de vídeo que usa la presente divulgación. Debería observarse que un módulo descrito en la memoria descriptiva de la presente solicitud es un módulo de software o un módulo de hardware. Un módulo 300 selecciona si se usa o no un esquema de referencia de instantánea resistente. Un módulo 302 a continuación escribe un parámetro en un encabezado de una secuencia de bits de vídeo codificado que indica la selección. A continuación, un módulo 304 realiza la codificación en una instantánea usando la predicción inter-instantánea usando el resultado de la selección. Cuando se usa el esquema de referencia de instantánea resistente, se realiza un procedimiento de selección de instantánea de referencia y un proceso de ordenación de una manera en que la referencia de instantánea está restringida a compartir el límite con las instantáneas clave, como se ha descrito anteriormente. En esta memoria descriptiva, lo siguiente deberá describir, en detalle, realizaciones del esquema de referencia de instantánea resistente.

La Figura 4 es un diagrama de flujo que muestra un procedimiento de decodificación de vídeo que usa la presente divulgación. Un módulo 400 analiza un parámetro que indica si se usa o no el esquema de referencia de instantánea resistente, a partir del encabezado de la secuencia de bits de vídeo codificado. A continuación, un módulo 402 evalúa si se usa o no el esquema de referencia de instantánea resistente.

Cuando se usa el esquema de referencia de instantánea resistente, un módulo 404 realiza decodificación parcial en la secuencia de bits de vídeo codificado usando el esquema de referencia de instantánea resistente. En la decodificación parcial, se usa el esquema de referencia de instantánea resistente de la misma manera que el procedimiento de codificación. En la decodificación parcial, se omite el procedimiento de decodificación en algunas instantáneas codificadas sin influenciar el procedimiento de decodificación en otras instantáneas codificadas.

Cuando no se usa el esquema de referencia de instantánea resistente, un módulo 406 realiza una decodificación completa en una secuencia de bits de vídeo codificado sin usar el esquema de referencia de instantánea resistente. La Figura 5 es un diagrama de bloques que muestra un ejemplo de un aparato de codificación de vídeo que usa la presente divulgación. El aparato de codificación de vídeo incluye una unidad 500 de selección de esquema de referencia, una unidad 502 de codificación, una unidad 504 de escritura y una unidad 506 de memoria.

Como se muestra en la Figura 5, la unidad 500 de selección de esquema de referencia selecciona si se usa o no el esquema de referencia de instantánea resistente. La unidad 502 de codificación usa una selección D501 de esquema que es un resultado de selección por la unidad 500 de selección de esquema de referencia y una instantánea D511 de referencia almacenada en la unidad 506 de memoria, para codificar una imagen D503 original descomprimida usando la predicción inter-instantánea. Como resultado, se obtienen los datos D505 de instantánea codificados y los datos D507 de instantánea de referencia. La unidad 504 de escritura a continuación toma los datos de la instantánea D505 codificada y la selección D501 de esquema para producir una secuencia de bits D509 de vídeo codificado. Los datos D507 de instantánea de referencia que incluyen una muestra reconstruida de la imagen D503 original se almacenan en la unidad 506 de memoria. En una posible implementación de la presente divulgación que usa la primera realización del esquema de referencia de instantánea resistente, los datos D507 de instantánea de referencia incluyen adicionalmente una señal de marcaje de instantánea para marcar la instantánea de referencia almacenada en la unidad 506 de memoria como usada para referencia o como no usada para referencia.

La Figura 6 es un diagrama de bloques que ilustra un ejemplo de un aparato de decodificación de vídeo que usa la presente divulgación. El aparato de decodificación de vídeo incluye una unidad 600 de análisis, una primera unidad 602 de conmutación, una primera unidad 604 de decodificación, una segunda unidad 606 de codificación, una segunda unidad 608 de conmutación y una unidad 610 de memoria.

Como se muestra en la Figura 6, la unidad 600 de análisis analiza un encabezado de una secuencia de bits D601 de vídeo codificado para obtener un parámetro D603 que indica una selección de si se usa o no el esquema de referencia de instantánea resistente. Basándose en el parámetro D603 analizado, la unidad 602 de conmutación envía la secuencia de bits D601 de vídeo codificado a la primera unidad D604 de decodificación o a la segunda unidad D606 de decodificación.

Cuando se usa una instantánea D615 de referencia almacenada en la unidad 610 de memoria, la primera unidad D604 de decodificación realiza la decodificación parcial en la secuencia de bits D605 de vídeo codificado usando el esquema de referencia de instantánea resistente. En la decodificación parcial, se omiten los procedimientos de decodificación de algunas instantáneas codificadas sin influenciar el procedimiento de decodificación de otras instantáneas codificadas. En una posible implementación de la presente divulgación que usa la primera realización del esquema de referencia de instantánea resistente, la primera unidad D604 de decodificación envía una señal D616 de marcaje de instantánea para marcar instantáneas de referencia almacenadas en la unidad 610 de memoria como usadas para referencia o como no usadas para referencia.

Por otra parte, usando la instantánea D615 de referencia almacenada en la unidad 610 de memoria, la segunda unidad D606 de decodificación realiza decodificación completa de una secuencia de bits D609 de vídeo codificado sin usar el esquema de referencia de instantánea resistente. Basándose en el parámetro D603 analizado, la segunda unidad 608 de conmutación conmuta una instantánea reconstruida para que se envíe, como la salida D613 del procedimiento de decodificación, entre una instantánea D607 reconstruida de la primera unidad D604 de decodificación y una instantánea D611 reconstruida de la segunda unidad 606 de decodificación. La instantánea reconstruida que sirve como la salida D613 del procedimiento de decodificación también se almacena en la unidad 610 de memoria para que se use en un procedimiento de decodificación previsto inter-instantánea de instantáneas codificadas subsiguientes.

La Figura 7 es un diagrama que muestra una ubicación de un parámetro que indica si se usa o no el esquema de referencia de instantánea resistente, en un encabezado de una secuencia de bits de vídeo codificado. Ejemplos del parámetro incluyen una bandera con un valor 1 que indica que se usa el esquema de referencia de instantánea resistente y un valor 0 que indica que no se usa el esquema de referencia de instantánea resistente. Un dibujo (a) de la Figura 7 muestra una ubicación del parámetro en un encabezado de secuencia de una secuencia de bits de vídeo comprimido. Un dibujo (b) de la Figura 7 muestra una ubicación del parámetro en un encabezado de instantánea de la secuencia de bits de vídeo comprimido. Un dibujo (c) de la Figura 7 muestra una ubicación del parámetro en un encabezado de corte de la secuencia de bits de vídeo comprimido. Un dibujo (d) de la Figura 7 muestra que el parámetro también puede derivarse a partir de una tabla de correspondencia predeterminada basándose en un parámetro de perfil, un parámetro de nivel o tanto en parámetros de perfil como de nivel que están ubicados en un encabezado de secuencia de la secuencia de bits de vídeo comprimido.

La Figura 8 es un diagrama de flujo que muestra un procedimiento de codificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 800 determina una clasificación que indica si una instantánea es o no una instantánea clave. Lo siguiente deberá describir, en detalle, realizaciones de la clasificación que indican si una instantánea es o no una instantánea clave. Un módulo 802 evalúa si una instantánea actual es o no una instantánea clave. Cuando la instantánea actual es la instantánea clave, un módulo 804 marca una instantánea de referencia no clave almacenada en una memoria de instantánea como no usada para referencia.

A continuación, independientemente de si la instantánea actual es o no la instantánea clave, se realiza un procedimiento de estimación de movimiento en un bloque de una muestra de imagen usando la instantánea de referencia marcada como usada para referencia en el módulo 804, y se realiza un procedimiento de predicción de movimiento en el bloque de la muestra de la imagen usando la instantánea de referencia marcada como usada para referencia en un módulo 808.

La Figura 9 es un diagrama de flujo que muestra un procedimiento de decodificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 900 determina una clasificación que indica si una instantánea es o no la instantánea clave. A continuación, un módulo 902 evalúa si la instantánea actual es o no la instantánea clave. Cuando la instantánea actual es la instantánea clave, un módulo 904 marca la instantánea de referencia no clave almacenada en la memoria de instantánea como no usada para referencia.

A continuación, independientemente de si la instantánea actual es o no la instantánea clave, se realiza el procedimiento de predicción de movimiento en el bloque de la muestra de imagen usando la instantánea de referencia (distinta de la instantánea de referencia marcada como no usada para referencia) marcada como usada para referencia en el módulo 906.

La Figura 10 es un diagrama de flujo que muestra la primera realización del procedimiento para determinar una clasificación que indica si una instantánea es o no una instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En un módulo 1000, se escribe una bandera que indica una clasificación sobre si la instantánea codificada es o no la instantánea clave en un encabezado de un corte codificado de una instantánea codificada.

La Figura 11 es un diagrama de flujo que muestra la primera realización del procedimiento para determinar una clasificación que indica si una instantánea es o no una instantánea clave en un procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En un módulo 1100, se analiza una bandera que indica la clasificación sobre si la instantánea codificada es o no la instantánea clave a partir de un encabezado de un corte codificado de una instantánea codificada.

La Figura 12 es un diagrama que muestra una ubicación de una bandera que indica una clasificación sobre si una instantánea codificada es o no la instantánea clave en un encabezado de un corte codificado de una instantánea codificada, de acuerdo con la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En una secuencia de bits de vídeo codificado, se representa una instantánea codificada en una o más unidades de capa de abstracción de red de corte (NALU). La bandera que indica la clasificación de las instantáneas está ubicada en el encabezado de NALU de la NALU de corte.

La Figura 13 es un diagrama de flujo que muestra una segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 1300 escribe un parámetro en un encabezado de un corte codificado de una instantánea codificada para especificar un nivel temporal de la instantánea codificada. Ejemplos del parámetro para especificar el nivel temporal incluyen el parámetro de sintaxis temporaljd en el esquema de codificación de vídeo de HEVC. A continuación, un módulo 1302 evalúa si el parámetro tiene un valor igual a un valor predeterminado. Ejemplos del valor predeterminado incluyen el valor 0 que indica el nivel temporal más bajo que corresponde a la representación de velocidad de fotogramas más baja. Cuando el valor de parámetro es igual al valor predeterminado, un módulo 1304 clasifica la instantánea codificada como la instantánea clave. Cuando el valor de parámetro no es igual al valor predeterminado, un módulo 1306 clasifica la instantánea codificada como una instantánea no clave.

La Figura 14 es un diagrama de flujo que muestra la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 1400 analiza un parámetro a partir de encabezado de un corte codificado de una instantánea codificada para especificar el nivel temporal de la instantánea codificada. A continuación, un módulo 1402 evalúa si el parámetro tiene un valor igual a un valor predeterminado. Cuando el valor de parámetro es igual al valor predeterminado, un módulo 1404 clasifica la instantánea codificada como la instantánea clave. Cuando el valor de parámetro no es igual al valor predeterminado, un módulo 1406 clasifica la instantánea codificada como la instantánea no clave.

La Figura 15 es un diagrama que muestra una ubicación del parámetro para especificar el nivel temporal de la instantánea codificada en un encabezado de un corte codificado de una instantánea codificada, de acuerdo con la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un dibujo (a) de la Figura 15 muestra una ubicación del parámetro que representa una instantánea codificada en un encabezado de NALU de una NALU de corte. Un dibujo (b) de la Figura 15 muestra la ubicación del parámetro en un encabezado de corte de una secuencia de bits de vídeo comprimido.

La Figura 16 es un diagrama de flujo que muestra una tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 1600 escribe un parámetro en un encabezado de una secuencia de bits de vídeo codificado para especificar un periodo de instantánea clave. A continuación, un módulo 1602 evalúa si el número de instantáneas de la instantánea (en un orden de salida) es igual a un múltiplo entero del periodo de instantáneas clave. Cuando el número de instantáneas de la instantánea es igual a un múltiplo entero del periodo de instantáneas clave, un módulo 1604 clasifica la instantánea como la instantánea clave. Cuando el número de instantáneas de la instantánea no es igual a un múltiplo entero del periodo de instantáneas clave, un módulo 1606 clasifica la instantánea como la instantánea no clave. Ejemplos del valor de parámetro que especifica el periodo de instantáneas clave incluyen el valor 4 que indica que cada una de las instantáneas clave tiene lugar cada 4 instantáneas. En este caso, las instantáneas que tienen números de instantánea 0, 4, 8, 12 y así sucesivamente, de acuerdo con el orden de salida se clasifican como la instantánea clave, mientras que todas las demás instantáneas se clasifican como la instantánea no clave.

La Figura 17 es un diagrama de flujo que muestra una tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 1700 analiza un parámetro a partir de un encabezado de una secuencia de bits de vídeo codificado para especificar el periodo de instantáneas clave. A continuación, un módulo 1702 evalúa si el número de instantáneas de las instantáneas codificadas (en el orden de salida) es igual a un múltiplo entero del periodo de instantáneas clave. Cuando el número de instantáneas de la instantánea codificada es igual al múltiplo entero del periodo de instantáneas clave, un módulo 1704 clasifica la instantánea codificada como la instantánea clave. Cuando el número de instantáneas de la instantánea codificada no es igual al múltiplo entero del periodo de instantáneas clave, un módulo 1706 clasifica la instantánea codificada como la instantánea no clave.

La Figura 18 es un diagrama que muestra la ubicación del parámetro para especificar el periodo de instantáneas clave en un encabezado de una secuencia de bits de vídeo codificado, de acuerdo con la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa el esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un dibujo (a) de la Figura 18 muestra una ubicación del parámetro en un encabezado de secuencia de una secuencia de bits de vídeo comprimido. Un dibujo (b) de la Figura 18 muestra una ubicación del parámetro en un encabezado de instantánea de la secuencia de bits de vídeo comprimido. Un dibujo (c) de la Figura 18 muestra una ubicación del parámetro en un encabezado de corte de la secuencia de bits de vídeo comprimido. Un dibujo (d) de la Figura 18 muestra que el parámetro también puede derivarse a partir de una tabla de correspondencia predeterminada basándose en un parámetro de perfil, un parámetro de nivel o tanto en parámetros de perfil como de nivel que están ubicados en el encabezado de secuencia de la secuencia de bits de vídeo comprimido.

La Figura 19 es un diagrama de bloques que ilustra un ejemplo de un aparato de codificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. El aparato de codificación de vídeo incluye una unidad 1900 de determinación de clasificación, una unidad 1902 de memoria, una primera unidad 1904 de conmutación, una unidad 1906 de marcaje, una segunda unidad 1908 de conmutación, una unidad 1910 de creación de lista, una unidad 1912 de estimación de movimiento, una unidad 1914 de predicción de movimiento y una unidad 1916 de escritura.

Como se muestra en la Figura 19, la unidad 1912 de estimación de movimiento lee un bloque D1919 de una muestra de imagen, una o más listas D1917 de instantáneas de referencia y emite un conjunto D1921 de vectores de movimiento. La unidad 1914 de predicción de movimiento lee el conjunto D1921 de vectores de movimiento y la lista de instantáneas de referencia D1917 de las instantáneas de referencia y emite un bloque D1923 de muestra prevista.

La unidad 1900 de determinación de clasificación lee datos D1901 de entrada y realiza el procesamiento en los mismos para producir una señal D1903 de clasificación que indica si una instantánea es o no la instantánea clave y emite los datos D1925. Los datos D1925 de salida se escriben por la unidad 1916 de escritura en una secuencia de bits D1927 de vídeo codificado.

En una posible implementación de la presente divulgación que usa la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 10, los datos D1901 de entrada son una bandera que indica una clasificación sobre si la instantánea codificada es o no la instantánea clave. De acuerdo con esta realización, la unidad 1900 de determinación de clasificación simplemente pasa la bandera como ambas de sus salidas, es decir, la señal D1903 de clasificación y los datos D1925 de salida.

En otra posible implementación de la presente divulgación que usa la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 13, los datos D1901 de entrada son el nivel temporal de una instantánea codificada. Usando el nivel temporal de la instantánea codificada, la unidad 1900 de determinación de clasificación determina y emite la señal D1903 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con esta realización, la unidad 1900 de determinación de clasificación también envía, como los datos D1925 de salida, el nivel temporal de la instantánea codificada a la unidad 1916 de escritura. En otra posible implementación de la presente divulgación que usa la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe en la Figura 16, los datos D1901 de entrada pueden ser el periodo de instantáneas clave. Usando el periodo de instantáneas clave, la unidad 1900 de determinación de clasificación determina y emite la señal D1903 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con esta realización, la unidad 1900 de determinación de clasificación también envía, como los datos D1925 de salida, el periodo de instantáneas clave a la unidad 1916 de escritura.

La primera unidad 1904 de conmutación usa la señal D1903 de clasificación como una señal de control para conmutar el destino de las instantáneas D1905 de referencia a partir de la unidad 1902 de memoria, entre la segunda unidad 1908 de conmutación cuando una señal D1903 de clasificación indica la instantánea no clave y la unidad 1906 de marcaje cuando la señal D1903 de clasificación indica la instantánea clave. La unidad 1906 de marcaje comprueba las instantáneas D1909 de referencia de entrada, a continuación, envía una señal D1911 de marcaje para marcar una instantánea de referencia no clave en la unidad 1902 de memoria como no usada para referencia, y para emitir una instantánea de referencia marcada como no usada para la instantánea D1913 de referencia. La segunda unidad 1908 de conmutación conmuta la selección entre la instantánea D1907 de referencia y la instantánea D1913 de referencia basándose en la señal D1903 de clasificación. La unidad 1910 de creación de lista lee la instantánea D1915 de referencia y emite una o más listas D1917 de instantáneas de referencia.

La Figura 20 es un diagrama de bloques que muestra un ejemplo de un aparato de decodificación de vídeo que usa la primera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. El aparato de decodificación de vídeo incluye una unidad 2000 de determinación de clasificación, una unidad 2002 de memoria, una primera unidad 2004 de conmutación, una unidad 2006 de marcaje, una segunda unidad 2008 de conmutación, una unidad 2010 de creación de lista y una unidad 2012 de predicción de movimiento.

Como se muestra en la Figura 20, la unidad 2012 de predicción de movimiento lee un conjunto D2019 de vectores de movimiento decodificados, una o más listas D2017 de instantáneas de referencia y emite un bloque D202 de muestra prevista.

La unidad 2000 de determinación de clasificación lee los datos D2001 de entrada y realiza procesamiento en los mismos para producir una señal D2003 de clasificación que indica si una instantánea es o no la instantánea clave.

En una posible implementación de la presente divulgación que usa la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 11, los datos D2001 de entrada analizados son una bandera analizada que indica una clasificación sobre si la instantánea codificada es o no la instantánea clave. De acuerdo con esta realización, la unidad 2000 de determinación de clasificación simplemente emite la bandera analizada como la señal D2003 de clasificación.

En otra posible implementación de la presente divulgación que usa la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 14, los datos D2001 de entrada analizados son el nivel temporal de la instantánea codificada. Usando el nivel temporal de la instantánea codificada, la unidad 2000 de determinación de clasificación determina y emite la señal D2003 de clasificación que indica si una instantánea es o no la instantánea clave.

En otra posible implementación más de la presente divulgación que usa la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave como se describe haciendo referencia a la Figura 17, los datos D2001 de entrada analizados son un periodo analizado de instantáneas clave. Usando el periodo analizado de instantáneas clave, la unidad 2000 de determinación de clasificación determina y emite la señal D2003 de clasificación que indica si una instantánea es o no la instantánea clave.

La primera unidad 2004 de conmutación usa la señal D2003 de clasificación como una señal de control para conmutar el destino de una instantánea de referencia D2005 a partir de la unidad 2002 de memoria, entre la segunda unidad 2008 de conmutación cuando la señal D2003 de clasificación indica la instantánea no clave y la unidad 2006 de marcaje cuando la señal D2003 de clasificación indica la instantánea clave. La unidad 2006 de marcaje comprueba las instantáneas D2009 de referencia de entrada, a continuación, envía una señal D2011 de marcaje para marcar la instantánea de referencia no clave en la memoria 2002 de instantánea como no usada para referencia y emite una instantánea D2013 de referencia marcada como usada para referencia. La segunda unidad 2008 de conmutación conmuta la selección entre la instantánea D2007 de referencia y la instantánea D2013 de referencia basándose en la señal D2003 de clasificación. La unidad 2010 de creación de lista lee la instantánea D2015 de referencia y emite una o más listas D2017 de instantáneas de referencia.

La Figura 21 es un diagrama de flujo que muestra un procedimiento de codificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 2100 determina una clasificación que indica si una instantánea es o no la instantánea clave. Se proporcionan realizaciones detalladas de la etapa para determinar la clasificación que indica si una instantánea es o no la instantánea clave en descripciones anteriores en esta memoria descriptiva. Un módulo 2102 a continuación construye una lista de instantáneas de referencia usando una distancia temporal a la instantánea actual y la clasificación que indica si una instantánea es o no la instantánea clave. A continuación, se realiza el procedimiento de estimación de movimiento en el bloque de la muestra de imagen usando la lista de instantáneas de referencia en un módulo 2104, y se realiza un procedimiento de predicción de movimiento en el bloque de la muestra de imagen usando la lista de instantáneas de referencia en el módulo 2106.

La Figura 22 es un diagrama de flujo que muestra un procedimiento de decodificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 2200 determina una clasificación que indica si una instantánea es o no la instantánea clave. Un módulo 2202 a continuación construye una lista de instantáneas de referencia usando la distancia temporal a la instantánea actual y la clasificación que indica si una instantánea es o no la instantánea clave. A continuación, se realiza un procedimiento de predicción de movimiento en el bloque de la muestra de imagen usando la lista de las instantáneas de referencia en un módulo 2204.

La Figura 23 es un diagrama de flujo que muestra el procedimiento para construir una lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda o tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Como se muestra en la Figura 23, un módulo 2300 selecciona un primer grupo de instantáneas de referencia que incluye una instantánea clave. Un módulo 2302 a continuación crea una lista de instantáneas de referencia que incluye el primer grupo de instantáneas de referencia ordenado por un primer esquema predeterminado que usa la distancia temporal a la instantánea actual. A continuación, un módulo 2304 evalúa si la instantánea actual es o no la instantánea clave.

Cuando la instantánea actual es la instantánea clave, el procedimiento de construcción de lista de referencia está completado. De otra manera, cuando la instantánea actual no es la instantánea clave, un módulo 2306 identifica una primera instantánea de límite clave como una instantánea de referencia clave que tiene una instancia temporal más anterior y más cercana a la instantánea actual. A continuación, un módulo 2308 evalúa si está presente o no una segunda instantánea de límite, mientras que la segunda instantánea de límite se identifica como la instantánea de referencia clave que tiene una instancia temporal más posterior que y más cercana a la instantánea actual.

Cuando la segunda instantánea de límite no está presente de acuerdo con la evaluación por el módulo 2308, un módulo 2314 selecciona un segundo grupo de instantáneas de referencia que incluye una instantánea de referencia no clave que tiene una instancia temporal más posterior que la primera instantánea de límite y un módulo 2316 añade el segundo grupo de instantáneas de referencia en la lista de instantáneas de referencia.

Cuando la segunda instantánea de límite está presente de acuerdo con la evaluación por el módulo 2308, un módulo 2310 selecciona un tercer grupo de instantáneas de referencia que incluye la instantánea de referencia no clave que tiene una instancia temporal más posterior que la primera instantánea de límite y más anterior que la segunda instantánea de límite, y un módulo 2312 añade el tercer grupo de instantáneas de referencia en la lista de instantáneas de referencia.

A continuación, independientemente de si está presente o no la segunda instantánea de límite, se almacena la lista de instantáneas de referencia resultante (después de añadir el segundo o tercer grupo de instantáneas de referencia) por un módulo 2138 usando un segundo esquema predeterminado que usa la distancia temporal a la instantánea actual y la clasificación que indica si una instantánea es o no la instantánea clave.

La Figura 24 es un diagrama de flujo que muestra la primera realización del segundo esquema predeterminado para un procedimiento de realización de ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda o tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 2400 coloca la instantánea de referencia clave en la parte superior de la lista de instantáneas de referencia de acuerdo con la distancia temporal a la instantánea actual. A continuación, un módulo 2402 coloca la instantánea de referencia no clave en la lista después de la instantánea de referencia clave de acuerdo con la distancia temporal a la instantánea actual. En una posible implementación del segundo esquema de ordenación predeterminado, las etapas de colocación de instantáneas de referencia en la lista de acuerdo con la distancia temporal dan como resultado instantáneas de referencia ordenadas en el orden de distancia temporal creciente a la instantánea actual. La Figura 25 es un diagrama de flujo que muestra la segunda realización del segundo esquema predeterminado para un procedimiento de realización de ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación de vídeo que usa la segunda o tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. En primer lugar, un módulo 2500 selecciona un primer conjunto de instantáneas de referencia que incluye una o más instantáneas clave. A continuación, un módulo 2502 selecciona un segundo conjunto de instantáneas de referencia que incluye instantáneas de referencia no incluidas en el primer conjunto de instantáneas de referencia. Un módulo 2504 a continuación coloca el primer conjunto de instantáneas de referencia en la parte superior de una lista de instantáneas de referencia de acuerdo con la distancia temporal a la instantánea actual. Finalmente, un módulo 2506 coloca el segundo conjunto de instantáneas de referencia en la lista detrás del primer conjunto de instantáneas de referencia de acuerdo con la distancia temporal a la instantánea actual. En una posible implementación del segundo esquema de ordenación predeterminado, las etapas de colocación de instantáneas de referencia en la lista de acuerdo con la distancia temporal dan como resultado las instantáneas de referencia almacenadas en el orden de distancia temporal creciente a la instantánea actual.

La Figura 26 es un diagrama de flujo que muestra la tercera realización del segundo esquema predeterminado para el procedimiento de realización de ordenación en la lista de instantáneas de referencia en el procedimiento de codificación de vídeo y el procedimiento de decodificación que usa la segunda o tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 2600 coloca instantáneas de referencia en la lista de instantáneas de referencia de acuerdo con la distancia temporal a la instantánea actual, independientemente de la clasificación de si una instantánea es o no la instantánea clave. En una posible implementación del segundo esquema de ordenación predeterminado, las etapas de colocación de instantáneas de referencia en la lista de acuerdo con la distancia temporal dan como resultado las instantáneas de referencia almacenadas en el orden de distancia temporal creciente a la instantánea actual.

La Figura 27 es un diagrama de bloques que muestra un ejemplo de un aparato de codificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. El aparato de codificación de vídeo incluye una unidad 2700 de determinación de clasificación, una unidad 2702 de memoria, una primera unidad 2704 de selección, una segunda unidad 2714 de selección, una tercera unidad 2716 de selección, una unidad 2706 de creación de lista, una primera unidad 2708 de conmutación, una segunda unidad 2724 de conmutación, una unidad 2710 de identificación de límite, una tercera unidad 2712 de conmutación, una cuarta unidad 2718 de conmutación, una unidad 2720 de adición de lista, una unidad 2722 de ordenación de lista, una unidad 2726 de estimación de movimiento, una unidad 2728 de predicción de movimiento y una unidad 2730 de escritura.

Como se muestra en la Figura 27, la unidad 2726 de estimación de movimiento lee un bloque D2735 de una muestra de imagen y una o más listas D2733 de instantáneas de referencia y emite un conjunto D2737 de vectores de movimiento. La unidad 2728 de predicción de movimiento lee el conjunto D2737 de vectores de movimiento y la lista D2733 de instantáneas de referencia y emite un bloque D2739 de una muestra prevista.

La unidad 2700 de determinación de clasificación lee los datos D2701 de entrada y realiza el procesamiento en los mismos para producir una señal D2703 de clasificación que indica si una instantánea es o no la instantánea clave y emite los datos D2741. Los datos D2741 de salida se escriben por la unidad 2730 de escritura en una secuencia de bits D2743 de vídeo codificado.

En una posible implementación de la presente divulgación que usa la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 10, los datos D2701 de entrada son una bandera que indica la clasificación sobre si la instantánea codificada es o no la instantánea clave. De acuerdo con la presente realización, la unidad 2700 de determinación de clasificación simplemente pasa la bandera como ambas de sus salidas, es decir, la señal D2703 de clasificación y los datos D2741 de salida.

En otra posible implementación de la presente divulgación que usa la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 13, los datos D2701 de entrada son el nivel temporal de la instantánea codificada. Usando el nivel temporal de la instantánea codificada, la unidad 2700 de determinación de clasificación determina y emite la señal D2703 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con esta realización, la unidad 2700 de determinación de clasificación también envía, como los datos D2741 de salida, el nivel temporal de una instantánea codificada.

En otra posible implementación de la presente divulgación que usa la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 16, los datos D2701 de entrada pueden ser el periodo de instantáneas clave. Usando el periodo de instantáneas clave, la unidad 2700 de determinación de clasificación determina y emite la señal D2703 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con esta realización, la unidad 2700 de determinación de clasificación también envía, como los datos D2741 de salida, el periodo de instantáneas clave.

La primera unidad 2704 de selección lee instantáneas D2705 de referencia almacenadas a partir de la unidad 2702 de memoria y pasa una instantánea D2707 de referencia clave a la unidad 2706 de creación de lista, que crea una o más listas D2709 de instantáneas de referencia. La primera unidad 2708 de conmutación usa la señal D2703 de clasificación como una señal de control para conmutar el destino de las listas D2709 de instantáneas de referencia entre la segunda unidad 2724 de conmutación cuando la señal D2703 de clasificación indica la instantánea clave y la unidad 2720 de adición de lista cuando la señal D2703 de clasificación indica la instantánea no clave.

La unidad 2720 de adición de lista añade un grupo D2727 de instantáneas de referencia no clave seleccionado a la lista D2713 de instantáneas de referencia y emite una lista D2729 de instantáneas de referencia ampliada. La unidad 2722 de ordenación de lista a continuación ordena la lista D2729 de instantáneas de referencia ampliada y emite una lista D2731 de instantáneas de referencia ordenada. Basándose en la señal D2703 de control, la segunda unidad 2724 de conmutación conmuta la lista de instantáneas de referencia para que se envíe como una lista D2733 de instantáneas de referencia final, entre la lista D2711 de instantáneas de referencia y la lista D2731 de instantáneas de referencia.

La unidad 2710 de identificación de límite lee la instantánea D2707 de referencia clave e identifica dos instantáneas D2717 de límite que incluye una primera y una segunda instantáneas de límite. La unidad 2710 de identificación de límite también emite una señal D2715 de control que indica si está presente o no la segunda instantánea de límite. Cuando la señal D2715 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 2712 de conmutación realiza la conmutación para enviar la instantánea D2717 de límite a la segunda unidad 2714 de selección. La segunda unidad 2714 de selección lee una instantánea D2705 de referencia almacenada desde la unidad 2702 de memoria y una instantánea D2719 de límite, a continuación, emite un grupo D2723 de instantáneas de referencia no clave seleccionado. Cuando la señal D2715 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 2712 de conmutación realiza la conmutación para enviar las instantáneas D2717 de límite a la segunda unidad 2716 de selección. La tercera unidad 2716 de selección lee las instantáneas D2705 de referencia almacenadas desde la unidad 2702 de memoria y las instantáneas D2721 de límite, a continuación, emite un grupo D2725 de instantáneas de referencia no clave seleccionadas. La cuarta unidad 2718 de conmutación usa la señal D2715 de control para realizar la conmutación de una salida para que se envíe como el grupo D2727 de instantáneas de referencia no clave seleccionado, entre la salida de la segunda unidad 2714 de selección y la salida de la tercera unidad 2716 de selección.

La Figura 28 es un diagrama de bloques que muestra un ejemplo de un aparato de decodificación de vídeo que usa la segunda realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. El aparato de decodificación de vídeo incluye una unidad 2800 de determinación de clasificación, una unidad 2802 de memoria, una primera unidad 2804 de selección, una segunda unidad 2814 de selección, una tercera unidad 2816 de selección, una unidad 2806 de creación de lista, una primera unidad 2808 de conmutación, una segunda unidad 2824 de conmutación, una unidad 2810 de identificación de límite, una tercera unidad 2812 de conmutación, una cuarta 2818 unidad de conmutación, una unidad 2820 de adición de lista, una unidad 2822 de ordenación de lista y una unidad 2826 de predicción de movimiento.

Como se muestra en la Figura 28, la unidad 2826 de predicción de movimiento lee un conjunto de vectores de movimiento decodificado D2835, una o más listas D2833 de instantáneas de referencia y emite un bloque D2837 de una muestra prevista.

La unidad 2800 de determinación de clasificación lee los datos D2801 de entrada y realiza procesamiento en los mismos para producir una señal D2803 de clasificación que indica si una instantánea es o no la instantánea clave.

En una posible implementación de la presente divulgación que usa la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 11, los datos D2801 de entrada analizados son una bandera analizada que indica una clasificación sobre si la instantánea codificada es o no la instantánea clave. De acuerdo con esta realización, la unidad 2800 de determinación de clasificación simplemente emite la bandera analizada como la señal D2803 de clasificación.

En otra posible implementación de la presente divulgación que usa la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 14, los datos D2801 de entrada analizados son el nivel temporal de la instantánea codificada. Usando el nivel temporal analizado de la instantánea codificada, la unidad 2800 de determinación de clasificación determina y emite la señal D2803 de clasificación que indica si una instantánea es o no la instantánea clave.

En otra posible implementación más de la presente divulgación que usa la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave como se describe haciendo referencia a la Figura 17, los datos de entrada analizados D2801 son el periodo analizado de instantáneas clave. Usando el periodo analizado de instantáneas clave, la unidad 2800 de determinación de clasificación determina y emite la señal D2803 de clasificación que indica si una instantánea es o no la instantánea clave.

La primera unidad 2804 de selección lee una instantánea D2805 de referencia almacenada a partir de la unidad 2802 de memoria y pasa unas instantáneas D2807 de referencia clave a la unidad 2806 de creación de lista, que crea una o más listas D2809 de instantáneas de referencia. La primera unidad 2808 de conmutación usa la señal D2803 de clasificación como una señal de control para conmutar el destino de las listas D2809 de instantáneas de referencia entre la segunda unidad 2824 de conmutación cuando la señal D2803 de clasificación indica la instantánea clave y la unidad 2820 de adición de lista cuando la señal D2803 de clasificación indica la instantánea no clave. La unidad 2820 de adición de lista añade un grupo D2827 de instantáneas de referencia no clave seleccionado a una lista D2813 de instantáneas de referencia y emite una lista D2829 de instantáneas de referencia ampliada. La unidad 2822 de ordenación de lista a continuación ordena la lista D2829 de instantáneas de referencia ampliada y emite una lista D2831 de instantáneas de referencia ordenada. Basándose en la señal D2803 de control, la segunda unidad 2824 de conmutación realiza la conmutación de una lista de instantáneas de referencia para que se envíe como una lista D2833 de instantáneas de referencia final entre la lista D2811 de instantáneas de referencia y la lista D2813 de instantáneas de referencia.

La unidad 2810 de identificación de límite lee la instantánea D2807 de referencia clave e identifica dos instantáneas D2817 de límite que incluye una primera y una segunda instantáneas de límite. La unidad 2810 de identificación de límite también emite una señal D2815 de control que indica si está presente o no la segunda instantánea de límite. Cuando la señal D2815 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 2812 de conmutación realiza la conmutación para enviar la instantánea D2817 de límite a la segunda unidad 2814 de selección. La segunda unidad 2814 de selección lee la instantánea D2805 de referencia almacenada desde la unidad 2802 de memoria y una instantánea D2819 de límite, a continuación, emite un grupo D2823 de instantáneas de referencia no clave seleccionado. Cuando la señal D2815 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 2812 de conmutación realiza la conmutación para enviar las instantáneas D2817 de límite a la segunda unidad 2816 de selección. La tercera unidad 2816 de selección lee la instantánea D2805 de referencia almacenada desde la unidad 2802 de memoria y unas instantáneas D2821 de límite, a continuación, emite un grupo D2825 de instantáneas de referencia no clave seleccionado. La cuarta unidad 2818 de conmutación usa la señal D2815 de control para realizar la conmutación de una salida para que se envíe como el grupo D2827 de instantáneas de referencia no clave seleccionado, entre la salida de la segunda unidad 2814 de selección y la salida de la tercera unidad 2816 de selección.

La Figura 29 es un diagrama de flujo que muestra un procedimiento de codificación de vídeo que usa la tercera realización de un esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. Un módulo 2900 determina la clasificación que indica si una instantánea es o no la instantánea clave. Se proporcionan realizaciones detalladas de la etapa para determinar la clasificación que indica si una instantánea es o no la instantánea clave en descripciones anteriores en esta memoria descriptiva. Un módulo 2902 a continuación construye una lista de instantáneas de referencia usando la distancia temporal a la instantánea actual y la clasificación que indica si una instantánea es o no la instantánea clave. Un módulo 2904 construye una segunda lista de instantáneas de referencia usando la distancia temporal a la instantánea actual y la clasificación que indica si una instantánea es o no la instantánea clave. Las realizaciones detalladas de la etapa para construir una lista de instantáneas de referencia usando la distancia temporal a la instantánea actual y la clasificación se proporcionan en descripciones anteriores en esta memoria descriptiva. Un módulo 2906 a continuación reordena la primera lista de instantáneas de referencia para que sea equivalente a la segunda lista de instantáneas de referencia. A continuación, un módulo 2908 escribe una pluralidad de parámetros que especifican las etapas para realizar una reordenación en la primera lista de instantáneas de referencia en un encabezado de un corte codificado de la instantánea actual. A continuación, se realiza un procedimiento de estimación de movimiento en un bloque de una muestra de imagen usando la lista de instantáneas de referencia en un módulo 2910, y se realiza un procedimiento de predicción de movimiento en el bloque de la muestra de imagen usando la lista de instantáneas de referencia en el módulo 2912.

La Figura 30 es un diagrama de bloques que muestra un ejemplo de un aparato de codificación de vídeo que usa la tercera realización del esquema de referencia de instantánea resistente de acuerdo con la presente divulgación. El aparato de codificación de vídeo incluye una unidad 3000 de determinación de clasificación, una unidad 3002 de memoria, una primera unidad 3004 de selección, una segunda unidad 3014 de selección, una tercera unidad 3016 de selección, una primera unidad 3030 de creación de lista, una segunda unidad 3006 de creación de lista, una primera unidad 3008 de conmutación, una segunda unidad 3024 de conmutación, una unidad 3010 de identificación de límite, una tercera unidad 3012 de conmutación, una cuarta unidad 3018 de conmutación, una unidad 3020 de adición de lista, una unidad 3022 de ordenación de lista, una unidad 3026 de estimación de movimiento, una unidad 3028 de predicción de movimiento, una unidad 3032 de reordenación de lista y una unidad 3034 de escritura.

Como se muestra en la Figura 30, la unidad 3026 de estimación de movimiento lee un bloque D3035 de una muestra de imagen y una o más listas D3043 de instantáneas de referencia y emite un conjunto D3037 de vectores de movimiento. La unidad 3028 de predicción de movimiento lee el conjunto D3037 de vectores de movimiento, la lista D3043 de instantáneas de referencias y emite un bloque D3039 de una muestra prevista.

La unidad 3000 de determinación de clasificación lee datos D3001 de entrada y realiza el procesamiento en los mismos para producir una señal D3003 de clasificación que indica si una instantánea es o no la instantánea clave y emite los datos D3042.

En una posible implementación de la presente divulgación que usa la primera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo como se describe haciendo referencia a la Figura 10, los datos D2701 de entrada son una bandera que indica la clasificación sobre si la instantánea codificada es o no la instantánea clave. De acuerdo con esta realización, la unidad 3000 de determinación de clasificación simplemente pasa la bandera como ambas de sus salidas, es decir, la señal D3003 de clasificación y los datos D3042 de salida.

En otra posible implementación de la presente divulgación que usa la segunda realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de decodificación de vídeo como se describe haciendo referencia a la Figura 13, los datos D3001 de entrada son el nivel temporal de la instantánea codificada. Usando el nivel temporal de la instantánea codificada, la unidad 3000 de determinación de clasificación determina y emite la señal D3003 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con esta realización, la unidad 3000 de determinación de clasificación también envía, como los datos D3042 de salida, el nivel temporal de la instantánea codificada.

En otra posible implementación de la presente divulgación que usa la tercera realización del procedimiento para determinar la clasificación que indica si una instantánea es o no la instantánea clave en el procedimiento de codificación de vídeo como se describe haciendo referencia a la Figura 16, los datos de entrada D3001 pueden ser el periodo de instantáneas clave. Usando el periodo de instantáneas clave, la unidad 3000 de determinación de clasificación determina y emite la señal D3003 de clasificación que indica si una instantánea es o no la instantánea clave. De acuerdo con la presente realización, la unidad 3000 de determinación de clasificación también envía, como los datos D3042 de salida, el periodo de instantáneas clave.

La primera unidad 3030 de creación de lista lee una instantánea D3005 de referencia almacenada desde la unidad 3002 de memoria y crea una o más listas D3041 de instantáneas de referencia iniciales. La unidad 3032 de reordenación de lista toma las listas D3041 de instantáneas de referencia iniciales y la lista D3033 de instantáneas de referencia modificada, a continuación, produce una lista D3043 de instantáneas de referencia reordenadas para su uso por la unidad 3026 de estimación de movimiento y la unidad 3028 de predicción de movimiento. La unidad 3032 de reordenación de lista también emite una etapa D3045 de reordenación realizada en las listas D3041 de referencia iniciales para que se haga equivalente como la lista D3033 de instantáneas de referencia modificada. La unidad 3034 de escritura escribe datos D3042 de salida desde la unidad 3000 de determinación de clasificación y las etapas D3045 de reordenación en una secuencia de bits D3047 de vídeo codificado.

La construcción de la lista D3033 de instantáneas de referencia modificada se realiza como sigue. La primera unidad 3004 de selección lee la instantánea D3005 de referencia almacenada a partir de la unidad 3002 de memoria y pasa las instantáneas D3007 de referencia clave a la segunda unidad 3006 de creación de lista, que crea una o más listas D3009 de instantáneas de referencia. La primera unidad 3008 de conmutación usa la señal D3003 de clasificación como una señal de control para conmutar el destino de las listas D3009 de instantáneas de referencia entre la segunda unidad 3024 de conmutación cuando la señal D3003 de clasificación indica la instantánea clave y la unidad 3020 de adición de lista cuando la señal D3003 de clasificación indica la instantánea no clave. La unidad 3020 de adición de lista añade un grupo D3027 de instantáneas de referencia seleccionado a una lista D3013 de instantáneas de referencia y emite una lista D3029 de instantáneas de referencia ampliada. La unidad 3022 de ordenación de lista a continuación ordena la lista D3029 de instantáneas de referencia ampliada y emite una lista D3031 de instantáneas de referencia ordenada. Basándose en la señal D3003 de control, la segunda unidad 3024 de conmutación realiza la conmutación de una lista de instantáneas de referencia para que se envíe como una lista D3033 de instantáneas de referencia modificada, entre la lista D3011 de instantáneas de referencia y la lista D3031 de instantáneas de referencia ordenada.

La unidad 3010 de identificación de límite lee la instantánea D3007 de referencia clave e identifica dos instantáneas D3017 de límite que incluye una primera y una segunda instantáneas de límite. La unidad 3010 de identificación de límite también emite una señal D3015 de control que indica si está presente o no la segunda instantánea de límite. Cuando la señal D3015 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 3012 de conmutación realiza la conmutación para enviar la instantánea D3017 de límite a la segunda unidad 3014 de selección. La segunda unidad 3014 de selección lee la instantánea D3005 de referencia almacenada desde la unidad 3002 de memoria y una instantánea D3019 de límite, a continuación, emite un grupo D3023 de instantáneas de referencia no clave seleccionado. Cuando la señal D3015 de control indica que no está presente la segunda instantánea de límite, la tercera unidad 3012 de conmutación envía la instantánea D3017 de límite a la tercera unidad 3016 de selección. La tercera unidad 3016 de selección lee la instantánea D3005 de referencia almacenada desde la unidad 3002 de memoria y una instantánea D3021 de límite, a continuación, emite un grupo D3025 de instantáneas de referencia no clave seleccionado. La cuarta unidad 3018 de conmutación usa la señal D3015 de control para realizar la conmutación de una salida para que se envíe como un grupo D3037 de instantáneas de referencia no clave seleccionado, entre la salida de la segunda unidad 3014 de selección y la salida de la tercera unidad 3016 de selección.

La Figura 31 es un diagrama que muestra una ubicación de los parámetros para especificar una etapa de reordenación de lista de referencias en un encabezado de corte de una secuencia de bits de vídeo codificado. Usando la pluralidad de parámetros de reordenación de lista de referencia que se analizan desde una secuencia de bits de vídeo codificado, un aparato de decodificación de vídeo compatible reordena una lista predeterminada de instantáneas de referencia y produce una lista de instantáneas de referencia modificada equivalente para que se use en el procedimiento de codificación.

[Cuarta realización]

El procesamiento descrito en cada una de las realizaciones puede implementarse simplemente en un sistema informático independiente, grabando, en un medio de grabación, un programa para que implementa las configuraciones del procedimiento de codificación de instantáneas en movimiento (procedimiento de codificación de imágenes) y el procedimiento de decodificación de instantáneas en movimiento (procedimiento de decodificación de imágenes) descritos en cada una de las realizaciones. El medio de grabación puede ser cualquier medio de grabación siempre que el programa pueda grabarse, tal como un disco magnético, un disco óptico, un disco óptico magnético, una tarjeta de Cⁱ, y una memoria de semiconductores.

Posteriormente en el presente documento, se describirán las aplicaciones al procedimiento de codificación de instantáneas en movimiento (procedimiento de codificación de imágenes) y al procedimiento de decodificación de instantáneas en movimiento (procedimiento de decodificación de imágenes) descritos en cada una de las realizaciones, y sistemas que usan los mismos. El sistema tiene una característica de tener un aparato de codificación y de decodificación de imágenes que incluye un aparato de codificación de imágenes que usa el procedimiento de codificación de imágenes y un aparato de decodificación de imágenes que usa el procedimiento de decodificación de imágenes. Pueden cambiarse otras configuraciones en el sistema según sea apropiado, dependiendo de los casos.

La Figura 32 ilustra una configuración global de un sistema de suministro de contenido ex100 para implementar servicios de distribución de contenido. El área para proporcionar servicios de comunicación se divide en células de tamaño deseado, y las estaciones base ex106, ex107, ex108, ex109 y ex110 que son estaciones inalámbricas fijas se colocan en cada una de las células.

El sistema de provisión de contenido ex100 está conectado a dispositivos, tales como a un ordenador ex111, un asistente digital personal (PDA) ex112, una cámara ex113, un teléfono celular ex114 y una máquina de juegos ex115, mediante Internet ex101, un proveedor de servicios de Internet ex102, una red de telefonía ex104, así como a las estaciones base ex106 a ex110, respectivamente.

Sin embargo, la configuración del sistema de provisión de contenido ex100 no se limita a la configuración mostrada en la Figura 32, y es aceptable una combinación en la que está conectado cualquiera de los elementos. Además, cada dispositivo puede estar directamente conectado a la red de telefonía ex104, en lugar de mediante las estaciones base ex106 a ex110 que son las estaciones inalámbricas fijas. Adicionalmente, los dispositivos pueden interconectarse entre sí mediante una comunicación inalámbrica de corta distancia y otras.

La cámara ex113, tal como una cámara de vídeo digital, puede capturar vídeo. Una cámara ex116, tal como una cámara digital, puede capturar tanto imágenes fijas como vídeo. Adicionalmente, el teléfono celular ex114 puede ser el que cumple cualquiera de las normas tales como el Sistema Global para Comunicación Móvil (GSM) (marca registrada), Acceso Múltiple por División de Código (CDMA), Acceso Múltiple por División de Código de Banda Ancha (W-CDMA), Evolución a Largo Plazo (LTE) y Acceso por Paquetes a Alta Velocidad (HSPA). Como alternativa, el teléfono celular ex114 puede ser un Sistema Móvil Personal (PHS).

En el sistema de provisión de contenido ex100, un servidor de envío por flujo continuo ex103 está conectado a la cámara ex113 y a otros mediante la red de telefonía ex104 y la estación base ex109, que posibilita la distribución de imágenes de un espectáculo en directo y otros. En una distribución de este tipo, un contenido (por ejemplo, vídeo de un espectáculo en directo de música) capturado por el usuario que usa la cámara ex113 se codifica como se ha descrito anteriormente en cada una de las realizaciones (es decir, la cámara funciona como el aparato de codificación de imágenes de acuerdo con un aspecto de la presente divulgación), y el contenido codificado se transmite al servidor de flujo continuo ex103. Por otra parte, el servidor de flujo continuo ex103 lleva a cabo distribución de flujo en los datos de contenido transmitidos a los clientes tras sus solicitudes. Los clientes incluyen el ordenador ex111, el PDA ex112, la cámara ex113, el teléfono celular ex114, y la máquina de juegos ex115 que pueden decodificar los datos codificados anteriormente mencionados. Cada uno de los dispositivos que han recibido los datos distribuidos decodifican y reproducen los datos codificados (es decir, funciona como el aparato de decodificación de imágenes de acuerdo con un aspecto de la presente divulgación).

Los datos capturados pueden codificarse por la cámara ex113 o el servidor de flujo continuo ex103 que transmite los datos, o los procedimientos de codificación pueden compartirse entre la cámara ex113 y el servidor de flujo continuo ex103. De manera similar, los datos distribuidos pueden decodificarse por los clientes o el servidor de flujo continuo ex103, o los procedimientos de decodificaciones pueden compartirse entre los clientes y el servidor de flujo continuo ex103. Adicionalmente, los datos de las imágenes fijas y el vídeo capturado no únicamente por la cámara ex113 sino también por la cámara ex116 pueden transmitirse al servidor de flujo continuo ex103 a través del ordenador ex111. Los procedimientos de codificación pueden realizarse por la cámara ex116, el ordenador ex111, o el servidor de flujo continuo ex103, o compartirse entre ellos.

Adicionalmente, los procedimientos de codificación y decodificación pueden realizarse por un LSI ex500 generalmente incluido en cada uno del ordenador ex111 y los dispositivos. El LSI ex500 puede estar configurado de un único chip o una pluralidad de chips. El software para codificar y decodificar vídeo puede estar integrado en algún tipo de un medio de grabación (tal como un CD-ROM, un disco flexible y un disco duro) que es legible por el ordenador ex111 y otros, y los procedimientos de codificación y decodificación pueden realizarse usando el software. Adicionalmente, cuando el teléfono celular ex114 está equipado con una cámara, los datos de vídeo obtenidos por la cámara pueden transmitirse. Los datos de vídeo son datos codificados por el LSI ex500 incluido en el teléfono celular ex114.

Adicionalmente, el servidor de flujo continuo ex103 puede estar compuesto por servidores y ordenadores, y puede descentralizar los datos y procesar los datos descentralizados, registrar o distribuir los datos.

Como se ha descrito anteriormente, los clientes pueden recibir y reproducir los datos codificados en el sistema de provisión de contenido ex100. En otras palabras, los clientes pueden recibir y decodificar información transmitida por el usuario, y reproducir los datos decodificados en tiempo real en el sistema de provisión de contenido ex100, de modo que el usuario que no tiene ningún derecho y equipo particular puede implementar difusión personal.

Además del ejemplo del sistema de provisión de contenido ex100, al menos uno del aparato de codificación de instantáneas en movimiento (aparato de codificación de imágenes) y el aparato de decodificación de instantáneas en movimiento (aparato de decodificación de imágenes) descritos en cada una de las realizaciones pueden implementarse en un sistema de difusión digital ex200 ilustrado en la Figura 33. Más específicamente, una estación de difusión ex201 comunica o transmite mediante ondas de radio a un satélite de difusión ex202, datos multiplexados obtenidos multiplexando datos de audio y otros en datos de vídeo. Los datos de vídeo son datos codificados por el procedimiento de codificación de instantáneas en movimiento descrito en cada una de las realizaciones (es decir, datos codificados por el aparato de codificación de imágenes de acuerdo con un aspecto de la presente divulgación). Tras la recepción de los datos multiplexados, el satélite de difusión ex202 transmite ondas de radio para difusión. A continuación, una antena de uso doméstico ex204 con una función de recepción de difusión por satélite recibe las ondas de radio. A continuación, un dispositivo tal como una televisión (receptor) ex300 y un decodificador de salón (STB) ex217 decodifica los datos multiplexados recibidos, y reproduce los datos decodificados (es decir, funciona como el aparato de decodificación de imágenes de acuerdo con un aspecto de la presente divulgación).

Adicionalmente, un lector/grabador ex218 (i) lee y decodifica los datos multiplexados grabados en un medio de grabación ex215, tal como un DVD y un BD, o (i) codifica señales de vídeo en el medio de grabación ex215, y en algunos casos, escribe datos obtenidos multiplexando una señal de audio en los datos codificados. El lector/grabador ex218 puede incluir el aparato de decodificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento como se muestra en cada una de las realizaciones. En este caso, las señales de vídeo reproducidas se visualizan en el monitor ex219, y pueden reproducirse por otro dispositivo o sistema usando el medio de grabación ex215 en el que se graban los datos multiplexados. Es también posible implementar el aparato de decodificación de instantáneas en movimiento en el decodificador de salón ex217 conectado al cable ex203 para una televisión por cable o a la antena ex204 para difusión por satélite y/o terrestre, para visualizar las señales de vídeo en el monitor ex219 de la televisión ex300. El aparato de decodificación de instantáneas en movimiento puede implementarse no en el decodificador de salón sino en la televisión ex300.

La Figura 34 ilustra la televisión (receptor) ex300 que usa el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento descritos en cada una de las realizaciones. La televisión ex300 incluye: un sintonizador ex301 que obtiene o proporciona datos multiplexados obtenidos multiplexando datos de audio a datos de vídeo, a través de la antena ex204 o el cable ex203, etc. que recibe una difusión; una unidad de modulación/demodulación ex302 que demodula los datos multiplexados recibidos o modula datos en datos multiplexados a suministrarse al exterior; y una unidad de multiplexación/demultiplexación ex303 que demultiplexa los datos multiplexados modulados en datos de vídeo y datos de audio, o multiplexa datos de vídeo y datos de audio codificados por una unidad de procesamiento de señal en datos ex306.

La televisión ex300 incluye adicionalmente: una unidad de procesamiento de señales ex306 que incluye una unidad de procesamiento de señales de audio ex304 y una unidad de procesamiento de señales de vídeo ex305 que decodifican datos de audio y datos de vídeo y codifican datos de audio y datos de vídeo, respectivamente (que funciona como el aparato de codificación de imágenes y el aparato de decodificación de imágenes de acuerdo con los aspectos de la presente divulgación); y una unidad de salida ex309 que incluye un altavoz ex307 que proporciona la señal de audio decodificada, y una unidad de visualización ex308 que visualiza la señal de vídeo decodificada, tal como una pantalla. Adicionalmente, la televisión ex300 incluye una unidad de interfaz ex317 que incluye una unidad de entrada de operación ex312 que recibe una entrada de una operación de usuario. Adicionalmente, la televisión ex300 incluye una unidad de control ex310 que controla de manera global cada elemento constituyente de la televisión ex300, y una unidad de circuito de fuente de alimentación ex311 que suministra potencia a cada uno de los elementos. Además de la unidad de entrada de operación ex312, la unidad de interfaz ex317 puede incluir: un puente ex313 que se conecta a un dispositivo externo, tal como el lector/grabador ex218; una unidad de ranura ex314 para posibilitar la conexión del medio de grabación ex216, tal como una tarjeta de SD; un controlador ex315 para conectarse a un medio de grabación externo, tal como un disco duro; y un módem ex316 para conectarse a una red de telefonía. En este punto, el medio de grabación ex216 puede grabar eléctricamente información usando un elemento de memoria de semiconductores no volátil/volátil para almacenamiento. Los elementos constituyentes de la televisión ex300 están conectados entre sí a través de un bus síncrono.

En primer lugar, se describirá la configuración en la que la televisión ex300 decodifica datos multiplexados obtenidos desde el exterior a través de la antena ex204 y otros y reproduce los datos decodificados. En la televisión ex300, después de la operación de un usuario a través de un controlador remoto ex220 y otros, la unidad de multiplexación/demultiplexación ex303 demultiplexa los datos multiplexados demodulados por la unidad de modulación/demodulación ex302, bajo el control de la unidad de control ex310 que incluye una CPU. Adicionalmente, la unida ex304 de procesamiento de señal de audio decodifica los datos de audio demultiplexados, y la unidad de procesamiento de señal de vídeo ex305 decodifica los datos de vídeo demultiplexados, usando el procedimiento de decodificación descrito en cada una de las realizaciones, en la televisión ex300. La unidad de salida ex309 proporciona la señal de vídeo decodificada y la señal de audio al exterior, respectivamente. Cuando la unidad de salida ex309 proporciona la señal de vídeo y la señal de audio, las señales pueden almacenarse temporalmente en las memorias intermedias ex318 y ex319, y otros de modo que las señales se reproducen en sincronización entre sí. Adicionalmente, la televisión ex300 puede leer datos multiplexados no a través de una difusión y otros sino desde el medio de grabación ex215 y ex216, tal como un disco magnético, un disco óptico, y una tarjeta de SD. A continuación, se describirá una configuración en la que la televisión ex300 codifica una señal de audio y una señal de vídeo, y transmite los datos al exterior o escribe los datos en un medio de grabación. En la televisión ex300, después de una operación de usuario a través del controlador remoto ex220 y otros, la unidad de procesamiento de señal de audio ex304 codifica una señal de audio, y la unidad de procesamiento de señal de vídeo ex305 codifica una señal de vídeo, bajo el control de la unidad de control ex310 usando el procedimiento de codificación descrito en cada una de las realizaciones. La unidad de multiplexación/demultiplexación ex303 multiplexa la señal de vídeo y la señal de audio codificadas, y proporciona la señal resultante al exterior. Cuando la unidad de multiplexación/demultiplexación ex303 multiplexa la señal de vídeo y la señal de audio, las señales pueden almacenarse temporalmente en las memorias intermedias ex320 y ex321, y otros de modo que las señales se reproducen en sincronización entre sí. En este punto, las memorias intermedias ex318, ex319, ex320 y ex321 pueden ser varias como se ilustra, o al menos una memoria intermedia puede compartirse en la televisión ex300. Adicionalmente, se pueden almacenar datos en una memoria intermedia de modo que puede evitarse el desbordamiento y subdesbordamiento del sistema entre la unidad de modulación/demodulación ex302 y la unidad de multiplexación/demultiplexación ex303, por ejemplo.

Adicionalmente, la televisión ex300 puede incluir una configuración para recibir una entrada de AV desde un micrófono o una cámara distinta de la configuración para obtener datos de audio y de vídeo desde una difusión o de un medio de grabación, y puede codificar los datos obtenidos. Aunque la televisión ex300 puede codificar, multiplexar y proporcionar datos al exterior en la descripción, puede únicamente recibir, decodificar y proporcionar datos al exterior pero no codificar, multiplexar y proporcionar datos al exterior.

Adicionalmente, cuando el lector/grabador ex218 lee o escribe datos multiplexados desde o en un medio de grabación, una de la televisión ex300 y el lector/grabador ex218 pueden decodificar o codificar los datos multiplexados, y la televisión ex300 y el lector/grabador ex218 puede compartir la decodificación o codificación.

Como un ejemplo, la Figura 35 ilustra una configuración de una unidad de reproducción/grabación de información ex400 cuando se leen o escriben datos desde o en un disco óptico. La unidad de reproducción/grabación de información ex400 incluye los elementos constituyentes ex401, ex402, ex403, ex404, ex405, ex406 y ex407 que se describen en lo sucesivo. El cabezal óptico ex401 irradia un punto láser en una superficie de grabación del medio de grabación ex215 que es un disco óptico para escribir información, y detecta luz reflejada desde la superficie de grabación del medio de grabación ex215 para leer la información. La unidad de grabación de modulación ex402 acciona eléctricamente un láser de semiconductores incluido en el cabezal óptico ex401, y modula la luz de láser de acuerdo con datos grabados. La unidad de demodulación de reproducción ex403 amplifica una señal de reproducción obtenida detectando eléctricamente la luz reflejada desde la superficie de grabación usando un fotodetector incluido en el cabezal óptico ex401, y demodula la señal de reproducción separando un componente de señal grabado en el medio de grabación ex215 para reproducir la información necesaria. La memoria intermedia ex404 mantiene temporalmente la información a grabarse en el medio de grabación ex215 y la información reproducida desde el medio de grabación ex215. El motor de disco ex405 gira el medio de grabación ex215. La unidad de servocontrol ex406 mueve el cabezal óptico ex401 a una pista de información predeterminada mientras controla el mecanismo de rotación del motor de disco ex405 para seguir el punto láser. La unidad de control de sistema ex407 controla la totalidad de la unidad de reproducción/grabación de información ex400. Los procedimientos de lectura y escritura pueden implementarse por la unidad de control de sistema ex407 usando diversa información almacenada en la memoria intermedia ex404 y generando y añadiendo nueva información según sea necesaria, y por la unidad de grabación de modulación ex402, la unidad de demodulación de reproducción ex403, y la unidad de servocontrol ex406 que graban y reproducen información a través del cabezal óptico ex401 mientras se operan de una manera coordinada. La unidad de control de sistema ex407 incluye, por ejemplo, un microprocesador y ejecuta procesamiento provocando que un ordenador ejecute un programa para lectura y escritura.

Aunque el cabezal óptico ex401 irradia un punto láser en la descripción, puede realizar grabación de alta densidad usando luz de campo cercano.

La Figura 36 ilustra el medio de grabación ex215 que es el disco óptico. En la superficie de grabación del medio de grabación ex215, se forman de manera espiral surcos de guía, y una pista de información ex230 graba, con antelación, información de dirección que indica una posición absoluta en el disco de acuerdo con el cambio en una forma de las ranuras de guía. La información de dirección incluye información para determinar posiciones de bloques de grabación ex231 que son una unidad para grabar datos. Reproducir la pista de información ex230 y leer la información de dirección en un aparato que graba y reproduce datos puede conducir a la determinación de las posiciones de los bloques de grabación. Adicionalmente, el medio de grabación ex215 incluye un área de grabación de datos ex233, un área de circunferencia interna ex232, y un área de circunferencia externa ex234. El área de grabación de datos ex233 es un área para su uso al grabar los datos de usuario. El área de circunferencia interna ex232 y el área de circunferencia externa ex234 que están en el interior y el exterior del área de grabación de datos ex233, respectivamente son para uso específico excepto para la grabación de los datos de usuario. La unidad de reproducción/grabación de información 400 lee y escribe datos de audio codificado, datos de vídeo codificado, o datos multiplexados obtenidos multiplexando los datos de audio y vídeo codificados, desde y en el área de grabación de datos ex233 del medio de grabación ex215.

Aunque se describe un disco óptico que tiene una capa, tal como un DVD y un BD como un ejemplo en la descripción, el disco óptico no se limita a esto, y puede ser un disco óptico que tiene una estructura de múltiples capas y que puede grabarse en una parte distinta de la superficie. Adicionalmente, el disco óptico puede tener una estructura para grabación/reproducción multidimensional, tal como grabación de información usando luz de colores con diferentes longitudes de onda en la misma porción del disco óptico y para grabar información que tiene diferentes capas desde diferentes ángulos.

Adicionalmente, un coche ex210 que tiene una antena ex205 puede recibir datos desde el satélite ex202 y otros, y reproducir vídeo en un dispositivo de visualización tal como un sistema de navegación de coche ex211 establecido en el coche ex210, en el sistema de difusión digital ex200. En este punto, una configuración del sistema de navegación de automóvil ex211 será una configuración, por ejemplo, que incluye una unidad de recepción de GPS a partir de la configuración ilustrada en la Figura 34. Lo mismo se cumplirá para la configuración del ordenador ex111, el teléfono celular ex114, y otros.

La Figura 37A ilustra el teléfono celular ex114 que usa el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento descritos en las realizaciones. El teléfono celular ex114 incluye: una antena ex350 para transmitir y recibir ondas de radio a través de la estación base ex110; una unidad de cámara ex365 capaz de capturar imágenes en movimiento y fijas; y una unidad de visualización ex358 tal como un visualizador de cristal líquido para visualizar datos tales como vídeo decodificado capturado por la unidad de cámara ex365 o recibido por la antena ex350. El teléfono celular ex114 incluye adicionalmente: una unidad de cuerpo principal que incluye una unidad de teclas de operación ex366; una unidad de salida de audio ex357 tal como un altavoz para la salida de audio; una unidad de entrada de audio ex356 tal como un micrófono para la entrada de audio; una unidad de memoria ex367 para almacenar vídeo capturado o instantáneas fijas, audio grabado, datos codificados o des codificados del vídeo recibido, las instantáneas fijas, correos electrónicos, u otros; y una unidad de ranura ex364 que es una unidad de interfaz para un medio de grabación que almacena datos de la misma forma que la unidad de memoria ex367.

A continuación, se describirá un ejemplo de una configuración del teléfono celular ex114 con referencia a la Figura 37B. En el teléfono celular ex114, una unidad de control principal ex360 diseñada para controlar en general cada unidad del cuerpo principal que incluye la unidad de visualización ex358 así como la unidad de teclas de operación ex366 se conecta mutuamente, a través de un bus síncrono ex370, a una unidad de circuito de fuente de alimentación ex361, una unidad de control de entrada de operación ex362, una unidad de procesamiento de señales de vídeo ex355, una unidad de interfaz de cámara ex363, una unidad de control de pantalla de cristal líquido (LCD) ex359, una unidad de modulación/demodulación ex352, una unidad de multiplexación/demultiplexación ex353, una unidad de procesamiento de señales de audio ex354, la unidad de ranura ex364 y la unidad de memoria ex367.

Cuando una tecla de fin de llamada o una tecla de alimentación es activada por una operación de un usuario, la unidad de circuito de fuente de alimentación ex361 abastece a las unidades respectivas con alimentación procedente de un paquete de batería con el fin de activar el teléfono celular ex114.

En el teléfono celular ex114, la unidad de procesamiento de señales de audio ex354 convierte las señales de audio recogidas por la unidad de entrada de audio ex356 en modo de conversación por voz en señales de audio digital bajo el control de la unidad de control principal ex360 que incluye una CPU, ROM y RAM. Entonces, la unidad de modulación/demodulación ex352 realiza un procesamiento de espectro ensanchado sobre las señales de audio digital, y la unidad de transmisión y de recepción ex351 realiza una conversión de analógico a digital y una conversión en frecuencia sobre los datos, con el fin de transmitir los datos resultantes por medio de la antena ex350. Asimismo, en el teléfono celular ex114, la unidad de transmisión y de recepción ex351 amplifica los datos recibidos por la antena ex350 en modo de conversación por voz y realiza la conversión en frecuencia y la conversión de digital a analógico sobre los datos. Entonces, la unidad de modulación/demodulación ex352 realiza un procesamiento de espectro ensanchado inverso sobre los datos, y la unidad de procesamiento de señales de audio ex354 los convierte en señales de audio analógico, con el fin de emitir las mismas por medio de la unidad de salida de audio ex357.

Además, cuando se transmite un correo electrónico en modo de comunicación de datos, datos de texto del correo electrónico introducido al operar la unidad de teclas de operación ex366 y otros del cuerpo principal se envían fuera a la unidad de control principal ex360 por medio de la unidad de control de entrada de operación ex362. La unidad de control principal ex360 da lugar a que la unidad de modulación/demodulación ex352 realice un procesamiento de espectro ensanchado sobre los datos de texto, y la unidad de transmisión y de recepción ex351 realiza la conversión de analógico a digital y la conversión en frecuencia sobre los datos resultantes para transmitir los datos a la estación base ex110 por medio de la antena ex350. Cuando se recibe un correo electrónico, un procesamiento que es aproximadamente inverso al procesamiento para transmitir un correo electrónico se realiza sobre los datos recibidos, y los datos resultantes se proporcionan a la unidad de visualización ex358.

Cuando se transmite o transmiten vídeo, imágenes fijas o vídeo y audio en modo de comunicación de datos, la unidad de procesamiento de señales de vídeo ex355 comprime y codifica señales de vídeo suministradas desde la unidad de cámara ex365 usando el procedimiento de codificación de instantáneas en movimiento mostrado en cada una de las realizaciones (es decir, funciona como el aparato de codificación de imágenes de acuerdo con el aspecto de la presente divulgación), y transmite los datos de vídeo codificados a la unidad de multiplexación/demultiplexación ex353. En contraposición, durante cuando la unidad de cámara ex365 captura vídeo, imágenes fijas, y otros, la unidad de procesamiento de señales de audio ex354 codifica las señales de audio recogidas por la unidad de entrada de audio ex356, y transmite los datos de audio codificados a la unidad de multiplexación/demultiplexación ex353.

La unidad de multiplexación/demultiplexación ex353 multiplexa los datos de vídeo codificados suministrados desde la unidad de procesamiento de señales de vídeo ex355 y los datos de audio codificados suministrados desde la unidad de procesamiento de señales de audio ex354, usando un procedimiento predeterminado. Entonces, la unidad de modulación/demodulación (unidad de circuito de modulación/demodulación) ex352 realiza un procesamiento de espectro ensanchado sobre los datos multiplexados, y la unidad de transmisión y de recepción ex351 realiza una conversión de analógico a digital y una conversión en frecuencia sobre los datos con el fin de transmitir los datos resultantes por medio de la antena ex350.

Cuando se reciben datos de un archivo de vídeo que está vinculado a una página web y otros en modo de comunicación de datos o cuando se recibe un correo electrónico con vídeo y/o audio adjunto, para decodificar los datos multiplexados recibidos a través de la antena ex350, la unidad de multiplexación/demultiplexación ex353 demultiplexa los datos multiplexados en una secuencia de bits de datos de vídeo y una secuencia de bits de datos de audio, y suministra a la unidad de procesamiento de señales de vídeo ex355 los datos de vídeo codificados y la unidad de procesamiento de señales de audio ex354 con los datos de audio codificados, a través del bus síncrono ex370. La unidad de procesamiento de señales de vídeo ex355 decodifica la señal de vídeo usando un procedimiento de decodificación de instantáneas en movimiento que se corresponde con el procedimiento de codificación de instantáneas en movimiento mostrado en cada una de las realizaciones (es decir, funciona como el aparato de decodificación de imágenes de acuerdo con el aspecto de la presente divulgación) y, entonces, la unidad de visualización ex358 visualiza, por ejemplo, el vídeo y las imágenes fijas incluidos en el archivo de vídeo vinculado a la página Web por medio de la unidad de control de LCD ex359. Además, la unidad de procesamiento de señales de audio ex354 decodifica la señal de audio, y la unidad de salida de audio ex357 proporciona el audio.

Adicionalmente, de manera similar a la televisión ex300, es posible que un terminal tal como el teléfono celular ex114 tenga 3 tipos de configuraciones de implementación que incluyen no únicamente (i) un terminal de transmisión y recepción que incluye tanto un aparato de codificación como un aparato de decodificación, sino también (ii) un terminal de transmisión que incluye únicamente un aparato de codificación y (iii) un terminal de recepción que incluye únicamente un aparato de decodificación. Aunque el sistema de difusión digital ex200 recibe y transmite los datos multiplexados obtenidos multiplexando datos de audio en datos de vídeo en la descripción, los datos multiplexados pueden ser datos obtenidos multiplexando no datos de audio sino datos de caracteres relacionados con vídeo en datos de vídeo, y pueden no ser datos multiplexados sino los mismos datos de vídeo.

En este sentido, el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento en cada una de las realizaciones se pueden usar en cualquiera de los dispositivos y sistemas descritos. Por lo tanto, se pueden obtener las ventajas descritas en cada una de las realizaciones.

Además, la presente divulgación no se limita a las realizaciones, y son posibles diversas modificaciones y revisiones sin apartarse del ámbito de la presente divulgación.

[Quinta realización]

Los datos de vídeo se pueden generar conmutando, según sea necesario, entre (i) el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento mostrados en cada una de realizaciones y (ii) un procedimiento de codificación de instantáneas en movimiento o un aparato de codificación de instantáneas en movimiento cumpliendo con una norma diferente, tal como MPEG-2, AVC de MPEG-4 y VC-1. En este punto, cuando se genera una pluralidad de datos de vídeo que cumple con las diferentes normas y se decodifican a continuación, necesitan seleccionarse los procedimientos de decodificación para cumplir con las diferentes normas. Sin embargo, puesto que no puede detectarse con qué norma cumple cada uno de la pluralidad de datos de vídeo a decodificarse, existe un problema de que no puede seleccionarse un procedimiento de decodificación apropiado.

En vista de lo anterior, los datos multiplexados obtenidos multiplexando datos de audio y otros en datos de vídeo tienen una estructura que incluye información de identificación que indica con qué norma cumplen los datos de vídeo. Se describirá en lo sucesivo la estructura específica de los datos multiplexados que incluyen los datos de vídeo generados en el procedimiento de codificación de instantáneas en movimiento y por el aparato de codificación de instantáneas en movimiento mostrados en cada una de las realizaciones. Los datos multiplexados son un flujo digital en el formato de Flujo de Transporte de MPEG-2.

La Figura 38 ilustra una estructura de los datos multiplexados. Como se ilustra en la Figura 38, los datos multiplexados pueden obtenerse multiplexando al menos uno de un flujo de vídeo, un flujo de audio, un flujo de gráficos de presentación (PG), y un flujo de gráficos interactivo. El flujo de vídeo representa vídeo primario y vídeo secundario de una película, el flujo de audio (IG) representa una parte de audio primario y una parte de audio secundario a mezclarse con la parte de audio primario, y el flujo de gráficos de presentación representa subtítulos de la película. En este punto, el vídeo primario es vídeo normal a visualizarse en una pantalla, y el vídeo secundario es vídeo a visualizarse en una ventana más pequeña en el vídeo primario. Adicionalmente, el flujo de gráficos interactivo representa una pantalla interactiva a generarse disponiendo los componentes de la GUI en una pantalla. El flujo de vídeo se codifica en el procedimiento de codificación de instantáneas en movimiento o por el aparato de codificación de instantáneas en movimiento mostrado en cada una de las realizaciones, o en un procedimiento de codificación de instantáneas en movimiento o por un aparato de codificación de instantáneas en movimiento cumpliendo con una norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1. El flujo de audio se codifica de acuerdo con una norma, tal como Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD y PCM lineal.

Cada flujo incluido en los datos multiplexados se identifica por PID. Por ejemplo, se asigna 0x1011 al flujo de vídeo a usar para vídeo de una película, se asigna 0x1100 a 0x111F a los flujos de audio, se asigna 0x1200 a 0x121F al flujo de gráficos de presentación, se asigna 0x1400 a 0x141F al flujo de gráficos interactivo, se asigna 0x1B00 a 0x1B1F a los flujos de vídeo a usar para vídeo secundario de la película, y se asigna 0x1A00 a 0x1A1F a los flujos de audio a usar para el audio secundario a mezclarse con el audio principal.

La Figura 39 ilustra esquemáticamente cómo se multiplexan datos. En primer lugar, un flujo de vídeo ex235 compuesto por tramas de vídeo y un flujo de audio ex238 compuesto por tramas de audio se transforman en un flujo de paquetes de PES ex236 y un flujo de paquetes de PES ex239, y adicionalmente en paquetes de TS ex237 y paquetes de TS ex240, respectivamente. De manera similar, los datos de un flujo de gráficos de presentación ex241 y los datos de un flujo de gráficos interactivo ex244 se transforman en un flujo de paquetes de PES ex242 y un flujo de paquetes de PES ex245, y adicionalmente en paquetes de TS ex243 y paquetes de TS ex246, respectivamente. Estos paquetes de TS se multiplexan en un flujo para obtener datos multiplexados ex247.

La Figura 40 ilustra cómo se almacena un flujo de vídeo en un flujo de paquetes de PES en más detalle. La primera barra en la Figura 40 muestra un flujo de tramas de vídeo en un flujo de vídeo. La segunda barra muestra el flujo de paquetes de PES. Como se indica por las flechas indicadas como yy1, yy2, yy3 e yy4 en la Figura 40, el flujo de vídeo se divide en instantáneas como instantáneas I, instantáneas B e instantáneas P cada una de las cuales es una unidad de presentación de vídeo, las instantáneas se almacenan en una cabida útil de cada uno de los paquetes de PES. Cada uno de los paquetes de PES tiene un encabezado de PES, y el encabezado de PES almacena una Indicación de Tiempo de Presentación (PTS) que indica un tiempo de visualización de la instantánea, y una Indicación de Tiempo de decodificación (DTS) que indica un tiempo de decodificación de la instantánea.

La Figura 41 ilustra un formato de paquetes de TS a escribir finalmente en los datos multiplexados. Cada uno de los paquetes de TS es un paquete de longitud fija de 188 bytes que incluye un encabezamiento de TS de 4 bytes que tiene información, tal como un PID para identificar un flujo y una cabida útil de TS de 184 bytes para almacenar datos. Los paquetes de PES se dividen y se almacenan en las cabidas útiles de TS, respectivamente. Cuando se usa un BD ROM, a cada uno de los paquetes de TS se le proporciona un TP_Encabezamiento_Adicional de 4 bytes, dando como resultado por lo tanto paquetes de origen de 192 bytes. Los paquetes de origen se escriben en los datos multiplexados. El TP_Encabezamiento_Adicional almacena información tal como una Indicación_Tiempo_Llegada (ATS). La ATS muestra un tiempo de inicio de transferencia en el que se ha de transferir cada uno de los paquetes de TS a un filtro de PID. Los paquetes de origen se disponen en los datos multiplexados como se muestra en la parte inferior de la Figura 41. Los números que incrementan desde la cabecera de los datos multiplexados se denominan números de paquete de origen (SPN).

Cada uno de los paquetes de TS incluidos en los datos multiplexados incluye no únicamente flujos de audio, vídeo, subtítulos y otros, sino también una Tabla de Asociación de Programa (PAT), una Tabla de Mapa de Programa (PMT), y una Referencia de Reloj de Programa (PCR). La PAT muestra qué indica un PID en una PMT usada en los datos multiplexados, y un PID de la misma PAT se registra como cero. La PMT almacena los PID de los flujos de vídeo, audio, subtítulos y otros incluidos en los datos multiplexados, y la información de atributo de los flujos que se corresponden con los PID. La PMT también tiene diversos descriptores relacionados con los datos multiplexados. Los descriptores tienen información tal como información de control de copia que muestra si se permite o no el copiado de los datos multiplexados. La PCR almacena información de tiempo de STC que se corresponde con una ATS que muestra cuándo se transfiere el paquete de PCR a un decodificador, para conseguir sincronización entre un Reloj de Tiempo de Llegada (ATC) que es el eje de tiempo de las ATS, y un Reloj de Tiempo de Sistema (STC) que es un eje de tiempo de las PTS y DTS.

La Figura 42 ilustra la estructura de datos de la PMT en detalle un encabezado de PMT que está dispuesto en la parte superior de la PMT. El encabezado de la PMT describe la longitud de datos incluidos en la PMT y otros. Una pluralidad de descriptores relacionados con los datos multiplexados están dispuestos después del encabezado de PMT. La información tal como la información de control de copia se describe en los descriptores. Después de los descriptores, está dispuesta una pluralidad de fragmentos de la información de flujo relacionados con los flujos incluidos en los datos multiplexados. Cada fragmento de la información de flujo incluye descriptores de flujo que cada uno describe información, tal como un tipo de flujo para identificar un códec de compresión de un flujo, un PID de flujo, e información de atributo de flujo (tal como una velocidad de tramas o una relación de aspecto). Los descriptores de flujo son iguales en número al número de flujos en los datos multiplexados.

Cuando los datos multiplexados se graban en un medio de grabación y otros, se registran juntos con archivos de información de datos multiplexados.

Cada uno de los archivos de información de datos multiplexados es información de gestión de los datos multiplexados como se muestra en la Figura 43. Los archivos de información de datos multiplexados están en una correspondencia uno a uno con los datos multiplexados, y cada uno de los archivos incluye información de datos multiplexados, información de atributo de flujo y un mapa de entrada.

Como se ilustra en la Figura 43, la información de datos multiplexados incluye una velocidad de sistema, un tiempo de inicio de reproducción y un tiempo de fin de reproducción. La velocidad de sistema indica la velocidad de trasferencia máxima a la que un decodificador objetivo de sistema que se va a describir más adelante transfiere los datos multiplexados a un filtro de PID. Los intervalos de las ATS incluidas en los datos multiplexados se establecen para que no sean superiores a una velocidad de sistema. El tiempo de inicio de reproducción indica una PTS en una trama de vídeo en la cabecera de los datos multiplexados. Un intervalo de una trama se añade a una PTS en una trama de vídeo al final de los datos multiplexados, y la PTS se establece al tiempo de fin de reproducción.

Como se muestra en la Figura 44, se registra un fragmento de información de atributo en la información de atributo de flujo, para cada PID de cada flujo incluido en los datos multiplexados. Cada fragmento de información de atributo tiene diferente información dependiendo de si el correspondiente flujo es un flujo de vídeo, un flujo de audio, un flujo de gráficos de presentación, o un flujo de gráficos interactivo. Cada fragmento de información de atributo de flujo de vídeo lleva información que incluye qué tipo de códec de compresión se usa para comprimir el flujo de vídeo, y la resolución, relación de aspecto y velocidad de tramas de los fragmentos de datos de instantánea que se incluyen en el flujo de vídeo. Cada fragmento de información de atributo de flujo de audio lleva información que incluye qué clase de códec de compresión se usa para comprimir el flujo de audio, cuántos canales están incluidos en el flujo de audio, qué idioma soporta el flujo de audio, y cómo de alta es la frecuencia de muestreo. La información de atributo de flujo de vídeo y la información de atributo de flujo de audio se usan para inicialización de un decodificador antes de que el reproductor reproduzca la información.

En la presente realización, los datos multiplexados a usar son de un tipo de flujo incluido en la PMT. Adicionalmente, cuando los datos multiplexados se graban en un medio de grabación, se usa la información de atributo de flujo de vídeo incluida en la información de datos multiplexados. Más específicamente, el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones incluyen una etapa o una unidad para asignar información única que indica datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones, al tipo de flujo incluido en la PMT o la información de atributo de flujo de vídeo. Con la configuración, los datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones pueden distinguirse de los datos de vídeo que se ajustan a otra norma.

Adicionalmente, la Figura 45 ilustra etapas del procedimiento de decodificación de instantáneas en movimiento de acuerdo con la presente realización. En la etapa exS100, el tipo de flujo incluido en la PMT o la información de atributo de flujo de vídeo incluido en la información de datos multiplexados se obtiene desde los datos multiplexados. A continuación, en la etapa exS101, se determina si el tipo de flujo o la información de atributo de flujo de vídeo indica o no que los datos multiplexados se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones. Cuando se determina que el tipo de flujo o la información de atributo de flujo de vídeo indica que los datos multiplexados se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones, en la etapa exS102, se realiza la decodificación seleccionando una instantánea de referencia o un vector de movimiento de los candidatos de acuerdo con el procedimiento de decodificación de instantáneas en movimiento en cada una de las realizaciones. Adicionalmente, cuando el tipo de flujo o la información de atributo de flujo de vídeo indica conformidad con las normas convencionales, tales como MPEG-2, MPEG-4 AVC y VC-1, en la etapa exS103, se realiza la decodificación mediante un procedimiento de decodificación de instantáneas en movimiento de conformidad con las normas convencionales. Por ejemplo, cuando la información de atributo muestra que el flujo es conforme a la norma MPEG-4 AVC, el flujo se decodifica en una base bloque a bloque usando un vector de movimiento no seleccionado de los candidatos, pero calculado a partir de un vector de movimiento de al menos un bloque que está espacial o temporalmente adyacente a un bloque actual.

En este sentido, asignar un nuevo valor único al tipo de flujo o la información de atributo de flujo de vídeo posibilita la determinación de si el procedimiento de decodificación de instantáneas en movimiento o el aparato de decodificación de instantáneas en movimiento que se describen en cada una de las realizaciones puede realizar o no la decodificación. Incluso cuando se introducen datos multiplexados que se ajustan a una norma diferente, puede seleccionarse un procedimiento o aparato de decodificación apropiado. Por lo tanto, se hace posible decodificar información sin error alguno. Adicionalmente, el procedimiento o aparato de codificación de instantáneas en movimiento, o el procedimiento o aparato de decodificación de instantáneas en movimiento en la presente realización se puede usar en los dispositivos y sistemas anteriormente descritos.

[Sexta realización]

Cada uno del procedimiento de codificación de instantáneas en movimiento, el aparato de codificación de instantáneas en movimiento, el procedimiento de decodificación de instantáneas en movimiento, y el aparato de decodificación de instantáneas en movimiento en cada una de las realizaciones se consigue típicamente en forma de un circuito integrado o un circuito Integrado a Gran Escala (LSI). Como un ejemplo del LSI, la Figura 46 ilustra una configuración del LSI ex500 que se hace en un chip. El LSI ex500 incluye los elementos ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, y ex509 que se van a describir a continuación, y los elementos están conectados entre sí a través de un bus ex510. La unidad de circuito de fuente de alimentación ex505 se activa suministrando a cada uno de los elementos con potencia cuando se activa la unidad de circuito de fuente de alimentación ex505.

Por ejemplo, cuando se realiza codificación, el LSI ex500 recibe una señal de AV desde un micrófono ex117, una cámara ex113, y otros a través de una ES de AV ex509 bajo el control de una unidad de control ex501 que incluye una CPU ex502, un controlador de memoria ex503, un controlador de flujo ex504, y una unidad de control de frecuencia de accionamiento ex512. La señal de AV recibida se almacena temporalmente en una memoria externa ex511, tal como una SDRAM. Bajo el control de la unidad de control ex501, los datos almacenados se segmentan en porciones de datos de acuerdo con la cantidad de procesamiento y velocidad a transmitir a una unidad de procesamiento de señal ex507. A continuación, la unidad de procesamiento de señal ex507 codifica una señal de audio y/o una señal de vídeo. En este punto, la codificación de la señal de vídeo es la codificación descrita en cada una de las realizaciones. Adicionalmente, la unidad de procesamiento de señal ex507 multiplexa en ocasiones los datos de audio codificados y los datos de vídeo codificados, y una ES de flujo ex506 proporciona los datos multiplexados al exterior. Los datos multiplexados proporcionados se transmiten a la estación base ex107, o se escriben en el medio de grabación ex215. Cuando se multiplexan conjuntos de datos, los datos deberían almacenarse temporalmente en la memoria intermedia ex508 de modo que los conjuntos de datos se sincronizan entre sí.

Aunque la memoria ex511 es un elemento fuera del LSI ex500, puede incluirse en el LSI ex500. La memoria intermedia ex508 no se limita a una memoria intermedia, sino que puede estar compuesta por memorias intermedias. Adicionalmente, el LSI ex500 puede estar fabricado en un chip o una pluralidad de chips.

Adicionalmente, aunque la unidad de control ex501 incluye la CPU ex502, el controlador de memoria ex503, el controlador de flujo ex504, la unidad de control de frecuencia de accionamiento ex512, la configuración de la unidad de control ex501 no se limita a esto. Por ejemplo, la unidad de procesamiento de señal ex507 puede incluir adicionalmente una CPU. La inclusión de otra CPU en la unidad de procesamiento de señal ex507 puede mejorar la velocidad de procesamiento. Adicionalmente, como otro ejemplo, la CPU ex502 puede servir como o ser una parte de la unidad de procesamiento de señal ex507, y, por ejemplo, puede incluir una unidad de procesamiento de señal de audio. En un caso de este tipo, la unidad de control ex501 incluye la unidad de procesamiento de señal ex507 o la CPU ex502 que incluye una parte de la unidad de procesamiento de señal ex507.

El nombre usado en el presente documento es LSI, pero puede denominarse también CI, sistema LSI, súper LSI o ultra LSI dependiendo del grado de integración.

Además, las maneras para conseguir la integración no se limitan al LSI, y un circuito especializado o un procesador de fin general y así sucesivamente pueden conseguir también la integración. El Campo de Matriz de Puertas Programables (FPGA) que puede programarse después de la fabricación de LSI o un procesador reconfigurable que permite la re-configuración de la conexión o configuración de un LSI puede usarse para el mismo fin. Un dispositivo lógico programable de este tipo puede ejecutar habitualmente el procedimiento de codificación de instantáneas en movimiento y/o el procedimiento de decodificación de instantáneas en movimiento de acuerdo con cualquiera de las realizaciones anteriores, cargando o leyendo de una memoria o similar uno o más programas que se incluyen en software o firmware.

En el futuro, con el avance de la tecnología de semiconductores, una tecnología nueva puede sustituir a la LSI. Los bloques funcionales pueden integrarse usando una tecnología de este tipo. La posibilidad es que la presente divulgación se aplique a biotecnología.

[Séptima realización]

Cuando se decodifican datos de vídeo generados en el procedimiento de codificación de instantáneas en movimiento o por el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, es posible que la cantidad de procesamiento aumente en comparación con cuando se decodifican datos de vídeo que se ajustan a una norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1. Por lo tanto, el LSI ex500 necesita establecer una frecuencia de accionamiento más alta que la de la CPU ex502 a usar cuando se decodifican datos de vídeo de conformidad con la norma convencional. Sin embargo, cuando la frecuencia de accionamiento se establece más alta, existe un problema de que el consumo de potencia aumenta.

En vista de lo anterior, el aparato de decodificación de instantáneas en movimiento, tal como la televisión ex300 y el LSI ex500 están configurados para determinar a qué norma se ajustan los datos de vídeo, y conmutar entre las frecuencias de accionamiento de acuerdo con la norma determinada. La Figura 47 ilustra una configuración ex800 en la presente realización. Una unidad de conmutación de frecuencia de accionamiento ex803 establece una frecuencia de accionamiento a una frecuencia de accionamiento superior cuando se generan datos de vídeo por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones. A continuación, la unidad de conmutación de frecuencia de accionamiento ex803 ordena a la unidad de procesamiento de decodificación ex801 que ejecute el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones para decodificar los datos de vídeo. Cuando los datos de vídeo se ajustan a la norma convencional, la unidad de conmutación de frecuencia de accionamiento ex803 establece una frecuencia de accionamiento a una frecuencia de accionamiento inferior a la de los datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones. A continuación, la unidad de conmutación de frecuencia de accionamiento ex803 ordena a la unidad de procesamiento de decodificación ex802 que se ajusta a la norma convencional que decodifique los datos de vídeo.

Más específicamente, la unidad de conmutación de frecuencia de accionamiento ex803 incluye la CPU ex502 y la unidad de control de frecuencia de accionamiento ex512 en la Figura 46. En este punto, cada una de la unidad de procesamiento de decodificación ex801 que ejecuta el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones y la unidad de procesamiento de decodificación ex802 que se ajusta a la norma convencional se corresponden con la unidad de procesamiento de señal ex507 en la Figura 46. La CPU ex502 determina a qué norma se ajustan los datos de vídeo. A continuación, la unidad de control de frecuencia de accionamiento ex512 determina una frecuencia de accionamiento basándose en una señal desde la CPU ex502. Adicionalmente, la unidad de procesamiento de señal ex507 decodifica los datos de vídeo basándose en la señal desde la CPU ex502. Por ejemplo, es posible que la información de identificación descrita en la quinta realización se use para identificar los datos de vídeo. La información de identificación no se limita a la descrita en la quinta realización, sino que puede ser cualquier información siempre que la información indique a qué norma se ajustan los datos de vídeo. Por ejemplo, cuando a qué norma se ajustan los datos de vídeo puede determinarse basándose en una señal externa para determinar que los datos de vídeo se usan para una televisión o un disco, etc., la determinación puede realizarse basándose en una señal externa de este tipo. Adicionalmente, la CPU ex502 selecciona una frecuencia de accionamiento basándose en, por ejemplo, una tabla de correspondencia en la que las normas de los datos de vídeo están asociadas con las frecuencias de accionamiento como se muestra en la Figura 49. La frecuencia de accionamiento puede seleccionarse almacenando la tabla de búsqueda en la memoria intermedia ex508 y en una memoria interna de un LSI, y con referencia a la tabla de búsqueda por la CPU ex502.

La Figura 48 ilustra etapas para ejecutar un procedimiento en la presente realización. En primer lugar, en la etapa exS200, la unidad de procesamiento de señal ex507 obtiene información de identificación desde los datos multiplexados. A continuación, en la etapa exS201, la CPU ex502 determina si los datos de vídeo se generan o no por el procedimiento de codificación y el aparato de codificación descritos en cada una de las realizaciones, basándose en la información de identificación. Cuando los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, en la etapa exS202, la CPU ex502 transmite una señal para establecer la frecuencia de accionamiento a una frecuencia de accionamiento superior a la de la unidad de control de frecuencia de accionamiento ex512. A continuación, la unidad de control de frecuencia de accionamiento ex512 establece la frecuencia de accionamiento a la frecuencia de accionamiento más alta. Por otra parte, cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1, en la etapa exS203, la CPU ex502 transmite una señal para establecer la frecuencia de accionamiento a una frecuencia de accionamiento inferior a la unidad de control de frecuencia de accionamiento ex512. A continuación, la unidad de control de frecuencia de accionamiento ex512 establece la frecuencia de accionamiento a la frecuencia de accionamiento inferior que la de en el caso en el que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones.

Adicionalmente, junto con la conmutación de las frecuencias de accionamiento, el efecto de conservación de potencia puede mejorarse cambiando la tensión a aplicarse al LSI ex500 o a un aparato que incluye el LSI ex500. Por ejemplo, cuando la frecuencia de accionamiento se establece más baja, es posible que la tensión a aplicarse al LSI ex500 o al aparato que incluye el LSI ex500 se establezca a una tensión inferior que en el caso en el que la frecuencia de accionamiento se establece más alta.

Adicionalmente, cuando la cantidad de procesamiento para decodificación es mayor, la frecuencia de accionamiento puede establecerse más alta, y cuando la cantidad de procesamiento para decodificación es más pequeña, la frecuencia de accionamiento puede establecerse más baja que el procedimiento para establecer la frecuencia de accionamiento. Por lo tanto, el procedimiento de ajuste no se limita a los anteriormente descritos. Por ejemplo, cuando la cantidad de procesamiento para decodificar datos de vídeo cumpliendo con AVC de MPEG-4 es mayor que la cantidad de procesamiento para decodificar datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, es posible que la frecuencia de accionamiento se establezca en orden inverso al ajuste anteriormente descrito.

Adicionalmente, el procedimiento para establecer la frecuencia de accionamiento no se limita al procedimiento para establecer la frecuencia de accionamiento más baja. Por ejemplo, cuando la información de identificación indica que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, es posible que la tensión a aplicarse al LSI ex500 o al aparato que incluye el LSI ex500 se establezca más alta. Cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1, es posible que la tensión a aplicarse al LSI ex500 o al aparato que incluye el LSI ex500 se establezca más baja. Como otro ejemplo, es posible que, cuando la información de identificación indica que los datos de vídeo son generados por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, no se suspenda el accionamiento de la CPU ex502, y cuando la información de identificación indica que los datos de vídeo cumplen con la norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1, se suspenda el accionamiento de la CPU ex502 en un tiempo dado debido a que la CPU ex502 tiene una capacidad de procesamiento adicional. Es posible que, incluso cuando la información de identificación indica que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, en el caso en el que la CPU ex502 tiene capacidad de procesamiento adicional, el accionamiento de la CPU ex502 se suspenda en un tiempo dado. En un caso de este tipo, es posible que el tiempo de suspensión se establezca más corto que en el caso cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1.

Por consiguiente, el efecto de conservación de potencia puede mejorarse conmutando entre las frecuencias de accionamiento de acuerdo con la norma a la que se ajustan los datos de vídeo. Adicionalmente, cuando el LSI ex500 o el aparato que incluye el LSI ex500 se accionan usando una batería, la duración de la batería puede ampliarse con el efecto de conservación de potencia.

[Octava realización]

Existen casos en los que una pluralidad de datos de vídeo que se ajustan a diferentes normas, se proporcionan a los dispositivos y sistemas, tales como una televisión y un teléfono celular. Para posibilitar la decodificación de la pluralidad de datos de vídeo que se ajustan a las diferentes normas, la unidad de procesamiento de señal ex507 del LSI ex500 necesita ajustarse a las diferentes normas. Sin embargo, los problemas de aumento en la escala del circuito del LSI ex500 y el aumento en el coste surgen con el uso individual de las unidades de procesamiento de señal ex507 que se ajustan a las normas respectivas.

En vista de lo anterior, lo que se concibe es una configuración en la que la unidad de procesamiento de decodificación para implementar el procedimiento de decodificación de instantáneas en movimiento descrita en cada una de las realizaciones y la unidad de procesamiento de decodificación que se ajusta a la norma convencional, tal como MPEG-2, AVC de MPEG-4 y VC-1 se comparten parcialmente. Ex900 en la Figura 50A muestra un ejemplo de la configuración. Por ejemplo, el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones y el procedimiento de decodificación de instantáneas en movimiento que se ajusta a AVC de MPEG-4 tienen, parcialmente en común, los detalles de procesamiento, tal como codificación de entropía, cuantificación inversa, filtrado por desbloqueo y predicción con compensación de movimiento. Es posible que una unidad de procesamiento de decodificación ex902 que cumple con AVC de MPEG-4 sea compartida por operaciones de procesamiento común, y que una unidad de procesamiento de decodificación dedicada ex901 se use para un procesamiento que es único de un aspecto de la presente divulgación y no cumple con AVC de MPEG-4. En particular, puesto que el aspecto de la presente divulgación está caracterizado por la cuantificación inversa, es posible, por ejemplo, que la unidad de procesamiento de decodificación especializada ex901 se use para cuantificación inversa, y que la unidad de procesamiento de decodificación se comparta por cualquiera de todo el otro procesamiento, tal como la decodificación por entropía, la filtración de desbloqueo y la compensación de movimiento. La unidad de procesamiento de decodificación para implementar el procedimiento de decodificación de instantáneas en movimiento descrita en cada una de las realizaciones puede compartirse para el procesamiento a compartirse, y una unidad de procesamiento de decodificación especializada puede usarse para procesamiento único al de MPEG-4 AVC.

Adicionalmente, ex1000 en la figura 50B muestra otro ejemplo en el que el procesamiento se comparte parcialmente. Este ejemplo usa una configuración que incluye una unidad de procesamiento de decodificación especializada ex1001 que soporta el procesamiento único para un aspecto de la presente divulgación, una unidad de procesamiento de decodificación especializada ex1002 que soporta el procesamiento único para otra norma convencional y una unidad de procesamiento de decodificación ex1003 que soporta que se comparta el procesamiento entre el procedimiento de decodificación de instantáneas en movimiento de acuerdo con el aspecto de la presente divulgación y el procedimiento de decodificación de instantáneas en movimiento convencional. En este punto, las unidades de procesamiento de decodificación especializadas ex1001 y ex1002 no están necesariamente especializadas para el procesamiento de acuerdo con el aspecto de la presente divulgación y el procesamiento de la norma convencional, respectivamente, y pueden ser las que puedan implementar el procesamiento general. Adicionalmente, la configuración de la presente realización puede implementarse por el LSI ex500.

Como tal, es posible reducir la escala del circuito de un LSI y reducir el coste compartiendo la unidad de procesamiento de decodificación para que se comparta el procesamiento entre el procedimiento de decodificación de instantáneas en movimiento de acuerdo con el aspecto de la presente divulgación y el procedimiento de decodificación de instantáneas en movimiento de conformidad con la norma convencional.

rAplicabilidad industrial!

La presente divulgación es aplicable a un aparato de codificación de imagen, un aparato de decodificación de imagen y similares.

[Lista de signos de referencia!

500 unidad de selección de esquema de referencia

502 unidad de codificación

504, 1916, 2730, 3034 unidad de escritura

506, 610, 1902, 2002, 2702, 2802, 3002 unidad de memoria

600 unidad de análisis

602, 1904, 2004, 2708, 2808, 3008 primera unidad de conmutación

604 primera unidad de decodificación

606 segunda unidad de decodificación

608, 1908, 2008, 2724, 2824, 3024 segunda unidad de conmutación 1900 2000, 2700, unidad de determinación de clasificación 1906 2006 unidad de marcaje

1910 2010, 2706, unidad de creación de lista

1912 2726, 3026 unidad de estimación de movimiento 1914 2012, 2728,

unidad de predicción de movimiento 2704 2804, 3004 primera unidad de selección

2710 2810, 3010 unidad de identificación de límite 2712 2812, 3012 tercera unidad de conmutación 2714 2814, 3014 segunda unidad de selección 2716 2816, 3016 tercera unidad de selección

2718 2818, 3018 cuarta unidad de conmutación 2720 2820, 3020 unidad de adición de lista

2722 2822, 3022 unidad de ordenación de lista 3006 segunda unidad de creación de lista 3030 primera unidad de creación de lista 3032 unidad de reordenación de lista

Claims

REIVINDICACIONES

1. Un procedimiento de codificación de vídeo para codificar una pluralidad de imágenes en una secuencia de bits temporalmente escalable usando una estructura de codificación jerárquica que asigna uno de una pluralidad de niveles temporales a cada una de la pluralidad de imágenes, comprendiendo el procedimiento de codificación de vídeo:

escribir un parámetro que especifica un nivel temporal de cada una de la pluralidad de imágenes en una secuencia de bits;

evaluar, para cada una de la pluralidad de imágenes, si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros, en el que se evalúa la instantánea para que sea una instantánea clave si y únicamente si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros;

evaluar si una instantánea actual es un punto de conmutación temporal, en el que se evalúa que la instantánea actual sea un punto de conmutación temporal si y únicamente si hay una instantánea clave de manera que la instantánea actual es la primera instantánea en tiempo de visualización de las imágenes que tienen el mismo nivel temporal que la instantánea actual y que siguen a dicha instantánea clave en tiempo de visualización; seleccionar únicamente imágenes clave como imágenes de referencia válidas para la instantánea actual, de todas las imágenes de referencia en una memoria de instantánea de referencia, cuando la instantánea actual es una instantánea clave o un punto de conmutación temporal; y

seleccionar las imágenes clave e imágenes no clave, de entre todas las imágenes de referencia incluidas en la memoria de instantánea de referencia, como las imágenes de referencia válidas cuando la instantánea actual no es ni un punto de conmutación temporal ni una instantánea clave, en el que la instantánea no clave se selecciona únicamente si la instantánea no clave sigue a la última instantánea clave de las imágenes clave que preceden a la instantánea actual en tiempo de visualización, precede a la primera instantánea clave de las imágenes clave que siguen a la instantánea actual en tiempo de visualización y tiene un nivel temporal inferior o igual a un nivel temporal de la instantánea actual;

construir una lista de imágenes de referencia que incluye una o más de las imágenes de referencia válidas, siendo la lista de imágenes de referencia para la instantánea actual; y

codificar la instantánea actual en la secuencia de bits realizando predicción de movimiento en la instantánea actual usando la una o más imágenes de referencia válidas en la lista de imágenes de referencia.

2. El procedimiento de codificación de vídeo de acuerdo con la reivindicación 1, que comprende adicionalmente escribir un parámetro de nivel temporal que indica un nivel temporal de la instantánea actual en un encabezado de la secuencia de bits.

3. El procedimiento de codificación de vídeo de acuerdo con la reivindicación 1 o 2, en el que la instantánea clave es una instantánea inter-prevista.

4. Un aparato de codificación de vídeo para codificar una pluralidad de imágenes en una secuencia de bits temporalmente escalable usando una estructura de codificación jerárquica que asigna uno de una pluralidad de niveles temporales a cada una de la pluralidad de imágenes, comprendiendo el aparato de codificación de vídeo:

una unidad de escritura configurada para escribir un parámetro que especifica un nivel temporal de cada una de la pluralidad de imágenes en una secuencia de bits;

una primera unidad de evaluación configurada para evaluar, para cada una de la pluralidad de imágenes, si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros, en el que se evalúa la instantánea para que sea una instantánea clave si y únicamente si el nivel temporal de la instantánea es el nivel temporal más bajo de la pluralidad de niveles temporales especificados en los parámetros;

una segunda unidad de evaluación configurada para evaluar si una instantánea actual es un punto de conmutación temporal, en el que se evalúa que la instantánea actual sea un punto de conmutación temporal si y únicamente si hay una instantánea clave de manera que la instantánea actual es la primera instantánea en tiempo de visualización de las imágenes que tienen el mismo nivel temporal que la instantánea actual y que siguen a dicha instantánea clave en tiempo de visualización;

una unidad de selección de instantánea de referencia válida configurada para seleccionar únicamente imágenes clave como imágenes de referencia válidas para la instantánea actual, de todas las imágenes de referencia en una memoria de instantánea de referencia, cuando la instantánea actual es una instantánea clave o un punto de conmutación temporal, y para seleccionar las imágenes clave e imágenes no clave, de entre todas las imágenes de referencia incluidas en la memoria de instantánea de referencia, como las imágenes de referencia válidas cuando la instantánea actual no es ni un punto de conmutación temporal ni una instantánea clave, en el que la instantánea no clave se selecciona únicamente si la instantánea no clave sigue a la última instantánea clave de las imágenes clave que preceden a la instantánea actual en tiempo de visualización, precede a la primera instantánea clave de las imágenes clave que siguen a la instantánea actual en tiempo de visualización y tiene un nivel temporal inferior o igual a un nivel temporal de la instantánea actual;

una unidad de construcción de lista de imágenes de referencia configurada para construir una lista de imágenes de referencia que incluye una o más de las imágenes de referencia válidas, siendo la lista de imágenes de referencia para la instantánea actual; y

una unidad de codificación configurada para codificar la instantánea actual en la secuencia de bits realizando predicción de movimiento en la instantánea actual usando la una o más imágenes de referencia válidas en la lista de imágenes de referencia.

5. Un procedimiento de decodificación de vídeo para decodificar una pluralidad de imágenes de una secuencia de bits temporalmente escalable usando una estructura de codificación jerárquica que asigna uno de una pluralidad de niveles temporales a cada una de la pluralidad de imágenes, comprendiendo el procedimiento de decodificación de vídeo:

leer un parámetro que especifica un nivel temporal de cada una de la pluralidad de imágenes de una secuencia de bits;

evaluar si una instantánea actual es un punto de conmutación temporal, en el que se evalúa que la instantánea actual sea un punto de conmutación temporal si y únicamente si hay una instantánea clave de manera que la instantánea actual es la primera instantánea en tiempo de visualización de las imágenes que tienen el mismo nivel temporal que la instantánea actual y que siguen a dicha instantánea clave en tiempo de visualización; seleccionar únicamente imágenes clave como imágenes de referencia válidas para la instantánea actual, de todas las imágenes de referencia en una memoria de instantánea de referencia, cuando la instantánea actual es una instantánea clave o un punto de conmutación temporal, y

decodificar la instantánea actual realizando predicción de movimiento en la instantánea actual usando la una o más imágenes de referencia válidas en la lista de imágenes de referencia.

6. El procedimiento de decodificación de vídeo de acuerdo con la reivindicación 5, que comprende adicionalmente obtener un parámetro de nivel temporal que indica un nivel temporal de la instantánea actual del encabezado de la secuencia de bits.

7. El procedimiento de decodificación de vídeo de acuerdo con la reivindicación 5 o 6, en el que la instantánea clave es una instantánea inter-prevista.

8. Un aparato de decodificación de vídeo para decodificar una pluralidad de imágenes de una secuencia de bits temporalmente escalable usando una estructura de codificación jerárquica que asigna uno de una pluralidad de niveles temporales a cada una de la pluralidad de imágenes, comprendiendo el aparato de decodificación de vídeo:

una unidad de lectura configurada para leer un parámetro que especifica un nivel temporal de cada una de la pluralidad de imágenes en una secuencia de bits;

una unidad de selección de instantánea de referencia válida configurada para seleccionar únicamente imágenes clave como imágenes de referencia válidas para la instantánea actual, de todas las imágenes de referencia en una memoria de instantánea de referencia, cuando la instantánea actual es una instantánea clave o un punto de conmutación temporal, y para seleccionar la instantánea clave e imágenes no clave, de entre todas las imágenes de referencia incluidas en la memoria de instantánea de referencia, como las imágenes de referencia válidas cuando la instantánea actual no es ni un punto de conmutación ni una instantánea clave, en el que la instantánea no clave se selecciona únicamente si la instantánea no clave sigue a la última instantánea clave de las imágenes clave que preceden a la instantánea actual en tiempo de visualización, precede a la primera instantánea clave de las imágenes clave que siguen a la instantánea actual en tiempo de visualización y tiene un nivel temporal inferior o igual a un nivel temporal de la instantánea actual;

una unidad de decodificación configurada para decodificar la instantánea actual realizando predicción de movimiento en la instantánea actual usando la una o más imágenes de referencia válidas en la lista de imágenes de referencia.