ES2410562T3 - Aparato de codificación de imágenes y aparato de decodificación de imágenes - Google Patents

Aparato de codificación de imágenes y aparato de decodificación de imágenes Download PDF

Info

Publication number
ES2410562T3
ES2410562T3 ES09179003T ES09179003T ES2410562T3 ES 2410562 T3 ES2410562 T3 ES 2410562T3 ES 09179003 T ES09179003 T ES 09179003T ES 09179003 T ES09179003 T ES 09179003T ES 2410562 T3 ES2410562 T3 ES 2410562T3
Authority
ES
Spain
Prior art keywords
image
rau
images
unit
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09179003T
Other languages
English (en)
Inventor
Tadamasa Toma
Tomoyuki Okada
Sam Liu
Philip M. Walker
Paul Boerger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Hewlett Packard Development Co LP
Original Assignee
Panasonic Corp
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Hewlett Packard Development Co LP filed Critical Panasonic Corp
Application granted granted Critical
Publication of ES2410562T3 publication Critical patent/ES2410562T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/587Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal sub-sampling or interpolation, e.g. decimation or subsequent interpolation of pictures in a video sequence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un aparato de codificación de imágenes (400) que genera una señal de imagen codificada codificando imágenes en unidades de acceso, incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho aparato de codificación de imágenes: una unidad de codificación (412) configurada para codificar una imagen que ha de ser codificada para generar una imagen independiente, en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial, estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen; na unidad de generación de información (413) configurada para generar información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y una unidad de escritura (411) configurada para escribir la información suplementaria generada por dicha unidad de generación de información (413) en la unidad de acceso de la señal de imagen codificada.

Description

Aparato de codificación de imágenes y aparato de decodificación de imágenes
Campo técnico
La presente invención se refiere a un aparato de codificación de imágenes que codifica una imagen en movimiento, un flujo que es generado por un procedimiento de codificación de imágenes que usa el aparato de codificación de imágenes, y un aparato de decodificación de imágenes que decodifica el flujo.
Técnica antecedente
Recientemente, con la llegada de la era de los multimedia que trata integralmente audio, vídeo y valores de píxeles, los medios de información existentes, por ejemplo, periódicos, revistas, televisión, radio y teléfono, y otros medios a través de los cuales se transmite información a la gente, han caído bajo el ámbito de los multimedia. En general, multimedia se refiere a una representación en la que no sólo los caracteres sino también símbolos gráficos, audio y especialmente imágenes y similares están relacionados entre sí. Sin embargo, para incluir los medios de información existentes mencionados anteriormente en el ámbito de los multimedia, parece un requisito previo representar tal información en forma digital.
Sin embargo, al estimar la cantidad de información contenida en cada uno de los medios de información mencionados anteriormente en forma digital, la cantidad de información por carácter requiere de 1 a 2 bytes mientras que el audio requiere más de 64 Kbits por segundo (calidad telefónica), y una imagen en movimiento requiere más de 100 Mbits por segundo (calidad de recepción de televisión actual). Por lo tanto, no es realista tratar la vasta cantidad de información directamente en forma digital a través de los medios de información mencionados anteriormente. Por ejemplo, ya se ha puesto en uso práctico un videoteléfono a través de la red digital de servicios integrados (RDSI) con una velocidad de transmisión de 64 Kbits/s a 1,5 Mbits/s, sin embargo, es imposible transmitir una imagen captada por una cámara de TV. Por lo tanto, esto requiere técnicas de compresión de información y, por ejemplo, en el caso de un videoteléfono, se emplean técnicas de compresión de vídeo conformes a los estándares H.261 y H.263 recomendados por la Unión Internacional de Telecomunicaciones-Sector de Estandarización (ITU-T). Según las técnicas de compresión de información conformes con el estándar MPEG-1, la información de imagen así como la información de audio pueden ser almacenadas en un CD (disco compacto) de música corriente.
Aquí, el Grupo de Expertos en Imágenes en Movimiento (MPEG) es un estándar internacional para una compresión de señales de imágenes en movimiento y el MPEG-1 es un estándar que comprime señales de vídeo hasta 1,5 Mbit/s, concretamente, para comprimir la información incluida en las señales de TV aproximadamente hasta una centésima. La calidad que es el objetivo del estándar MPEG-1 era de calidad media para producir una velocidad de transmisión principalmente de aproximadamente 1,5 Mbits/s, por lo tanto, el MPEG-2, estandarizado con vistas a cumplir los requisitos de imagen de calidad incluso más alta, produce una calidad de emisión de TV para transmitir señales de imágenes en movimiento a una velocidad de transmisión de 2 a 15 Mbits/s.
En las circunstancias actuales, un grupo de trabajo (ISO/IEC JTC1/SC29/WG11) previamente a cargo de la estandarización del MPEG-1 y el MPEG-2 ha estandarizado además el MPEG-4 que logra una tasa de compresión superior a la lograda por el MPEG-1 y el MPEG-2, permite operaciones de codificación/decodificación según un criterio basado en objeto y produce una nueva función requerida por la era de los multimedia. Al principio, en el proceso de estandarización del MPEG-4, el objetivo era estandarizar una codificación de baja velocidad de transmisión de bits, sin embargo, el objetivo se amplia actualmente a una codificación más versátil que incluye una codificación de alta velocidad de transmisión de bits para imágenes entrelazadas y otras. Por otra parte, el ISO/IEC y el ITU-T han desarrollado conjuntamente, como procedimiento de codificación de imágenes de la próxima generación, una estandarización de Codificación Avanzada de Vídeo (AVC) de MPEG-4 con mayor tasa de compresión, y actualmente la Sociedad de Ingenieros de Imágenes en Movimiento y Televisión (SMPTE) intenta estandarizar un VC-1 (estándar SMPTE propuesto para televisión: formato y procedimiento de codificación de flujo de bits de vídeo comprimido VC-1, borrador 1 final del comité, revisión 6, 13 de julio de 2005). Un objetivo del VC-1 es extender una herramienta de codificación y similares, basada en los procedimientos de los estándares MPEG-2 y MPEG-4. Se espera que el VC-1 se use para dispositivos periféricos de disco óptico de la siguiente generación, como un disco Blu-Ray (BD) y un DVD de alta definición (HD).
En general, en la codificación de una imagen en movimiento, la compresión del volumen de información se realiza eliminando la redundancia en direcciones tanto espaciales como temporal. Por lo tanto, una codificación por predicción entre imágenes, cuyo propósito es reducir la redundancia temporal, estima un movimiento y genera una imagen predicha basándose en bloque por bloque con referencia a las imágenes anterior y posterior, y luego codifica un valor diferencial entre la imagen predicha obtenida y una imagen actual que ha de ser codificada. Aquí, "imagen" es un término para representar una sola pantalla y representa un marco cuando se usa para una imagen progresiva mientras que representa un marco o campos cuando se usa para una imagen entrelazada. Aquí, la imagen entrelazada es una imagen en la que un marco individual está constituido por dos campos que tienen tiempo diferente respectivamente. Para codificar y decodificar una imagen entrelazada, son posibles tres maneras: procesar un marco individual como un marco, como dos campos o como una estructura de marco/campo dependiendo de un bloque del marco.
Una imagen en la que se realiza una predicción entre imágenes sin imágenes de referencia se denomina una "imagen I". Una imagen en la que se realiza codificación por predicción entre imágenes con referencia a una imagen individual se denomina una "imagen P". Una imagen en la que se realiza codificación por predicción entre imágenes haciendo referencia simultáneamente a dos imágenes se denomina una "imagen B". La imagen B puede hacer referencia a dos imágenes, seleccionadas arbitrariamente de las imágenes cuyo momento de visualización está adelantado o atrasado respecto al de una imagen actual que ha de ser codificada, como una combinación arbitraria. Sin embargo, las imágenes de referencia ya tienen que estar codificadas o decodificadas como condición para codificar o decodificar estas imágenes I, P y B.
Las imágenes 1A y 1B son diagramas que muestran una estructura del flujo MPEG-2 convencional. Como se muestra en la FIG. 1B, el flujo según el estándar MPEG-2 tiene un sistema estratificado. El flujo está formado por una pluralidad de Grupos de Imágenes (GOP). Es posible editar una imagen en movimiento y realizar acceso aleatorio sobre ella usando el GOP como unidad básica usada en el procesamiento de codificación. Esto significa que una imagen inicial en el GOP es un punto de acceso aleatorio. El GOP está constituido por una pluralidad de imágenes, siendo cada una una imagen I, una imagen P y una imagen B. El flujo, el GOP y la imagen incluyen respectivamente una señal síncrona (sync) que indica un límite entre unidades respectivas y una cabecera que son datos incluidos comúnmente en las unidades respectivas.
Las FIGS. 2A y 2B son ejemplos de una estructura de predicción de imágenes según el estándar MPEG-2. Las imágenes sombreadas de la FIG. 2A son imágenes de referencia a las que se hace referencia para predecir otras imágenes. Como se muestra en la FIG. 2A, en el estándar MPEG-2, la imagen P (imagen P0, P6, P9, P12 o P15) puede ser predicha a partir de una imagen, bien la imagen I o la imagen P, cuyo momento de visualización precede inmediatamente al de la imagen P. La imagen B (imagen B1, B2, B4, B5, B7, B8, B10, B11, B13, B14, B16, B17, B19 o B20) puede ser predicha a partir de una imagen cuyo momento de visualización precede inmediatamente a la imagen B
o una imagen cuyo momento de visualización sigue inmediatamente a la imagen B, las dos puede ser imagen I o imagen
P.
Las posiciones de las imágenes B están dispuestas en el flujo, inmediatamente después de la imagen I o la imagen P. Por lo tanto, en el momento de realizar el acceso aleatorio, todas las imágenes posteriores a la imagen I pueden ser decodificadas y visualizadas, cuando la decodificación comienza desde la imagen I. Con respecto a una estructura del GOP, las imágenes desde la I3 a la B14 pueden considerarse como un GOP, como se muestra en la FIG. 2B, por ejemplo.
La FIG. 3 es un diagrama que muestra una estructura de un flujo según el VC-1. El flujo según el VC-1 también tiene la misma estructura que se describe para el estándar MPEG-2. Sin embargo, un punto de acceso aleatorio se denomina como un "punto de entrada" que se añade con una cabecera de punto de entrada (HDR de punto de entrada). Los datos desde el punto de entrada hasta un punto de entrada siguiente son una unidad de acceso aleatorio (RAU), que es equivalente a un GOP según el estándar MPEG-2. En lo sucesivo, la RAU según el VC-1 se denomina como "punto de acceso aleatorio (RAU)". Obsérvese que la RAU puede almacenar imágenes con respecto a datos de usuario en la RAU (datos de usuario a nivel de punto de entrada), y la RAU está dispuesta inmediatamente después de la cabecera de punto de entrada.
Aquí, se describen tipos de imágenes según el VC-1. En el VC-1, también se definen la imagen I, la imagen P y la imagen B. Estas imágenes I, P y B tienen la misma estructura de predicción que la descrita para el estándar MPEG-2. En el VC-1, además de los tres tipos de imagen anteriores, hay dos tipos definidos más, que son imagen omitida e imagen BI. La imagen omitida es una imagen que no incluye ningún dato de píxeles, y se trata como una imagen P que tiene los mismos datos de píxeles de una imagen de referencia anterior en el orden de decodificación. Por ejemplo, en los ejemplos de (1) y (2), una imagen S5 se considera la misma imagen que la imagen P3, de manera que se realiza la misma operación de decodificación del flujo tanto en (1) como en (2).
(1)
Orden de visualización: Imagen I0, Imagen B2, Imagen P1, Imagen B4, Imagen P3, Imagen B6, Imagen S5 (Obsérvese que la imagen representada por un símbolo que incluye I es una imagen I, la imagen representada por un símbolo que incluye P es una imagen P, la imagen representada por un símbolo que incluye B es una imagen B, y la imagen representada por un símbolo que incluye S es una imagen omitida. Por ejemplo, la imagen S6 es una imagen omitida. Los números adjuntos a los símbolos de las imágenes representan el orden de decodificación).
(2)
Orden de visualización: Imagen I0, Imagen B2, Imagen P1, Imagen B4, Imagen P3, Imagen B6, Imagen P5 (P5 tiene los mismos datos de píxeles que P3).
La imagen omitida es especialmente útil cuando las imágenes están fijas. Por ejemplo, en un caso en el que las imágenes están fijas en mitad de la RAU, se usan imágenes omitidas donde las imágenes están fijas, por ejemplo, donde hay imagen I0, imagen P1, imagen P2, imagen P3, imagen S4, imagen S5, imagen S6..., para reducir la cantidad de datos que han de ser codificados.
Además, la imagen BI es una imagen que tiene características de la imagen B y la imagen I. Más específicamente, la imagen BI tiene las características de la imagen B en la que el orden de decodificación es diferente del orden de visualización (es necesaria reordenación de la imagen BI y una imagen I o P). Por ejemplo, la imagen BI precede en el orden de visualización a una imagen inicial intracodificada en una RAU y sigue en el orden de decodificación a la imagen inicial intracodificada en la RAU), y la imagen no es una imagen de referencia para otras imágenes. Además, la imagen BI tiene las características de la imagen I en que todos los macrobloques están intracodificados y la imagen no es predicha a partir de ninguna otra imagen.
A continuación, se describe el procedimiento para distinguir la imagen I, la imagen P, la imagen B, la imagen omitida, y las imágenes BI. Básicamente, los tipos de imágenes pueden distinguirse basándose en los tipos de imágenes incluidos en una capa de imagen en un flujo. Sin embargo, los tipos de imágenes indicados por la capa de imagen se definen de la siguiente manera, dependiendo de los perfiles.
Por ejemplo, en un perfil simple, los tipos de imágenes se indican como imagen I e imagen P. En un perfil principal, los tipos de imágenes se indican como imagen I, imagen P, e imagen B o BI. En un perfil avanzado, los tipos de imágenes se indican como imagen I, imagen P, imagen B, imagen BI, e imagen omitida.
Aquí, tanto en el perfil simple como en el perfil principal, es imposible distinguir la imagen omitida usando los tipos de imágenes de la capa de imagen, así que, en un caso en que una imagen arbitraria tiene un tamaño de un byte o menos, la imagen se defina como la imagen omitida. Además, en el perfil principal, un tipo de imagen indica que una imagen es una imagen B o una imagen BI, de manera que es imposible distinguir la imagen B de la imagen BI, basándose en el tipo de imagen.
La FIG. 4 es un diagrama de bloques que muestra un aparato de codificación de imágenes para llevar a cabo el procedimiento de codificación de imágenes convencional-
Un aparato de codificación de imágenes 800 realiza codificación comprimida, codificación de longitud variable, y similares, para una señal de imagen introducida Vin, transformando así la señal de imagen Vin en un flujo de bits (flujo) Str que ha de ser generado. El aparato de codificación de imágenes 800 incluye una unidad de estimación de movimiento 801, una unidad de compensación de movimiento 802, un sustractor 803, una unidad de transformación ortogonal 804, una unidad de cuantificación 805, una unidad de cuantificación inversa 806, una unidad de transformación ortogonal inversa 807, un sumador 808, una memoria de imagen 809, un conmutador 810, una unidad de codificación de longitud variable 811, y una unidad de determinación de estructura de predicción 812.
La señal de imagen Vin es introducida en el sustractor 803 y la unidad de estimación de movimiento 801. El sustractor 803 calcula un diferencial entre la señal de imagen introducida Vin y una imagen predicha, y genera el diferencial para la unidad de transformación ortogonal 804. La unidad de transformación ortogonal 804 transforma el diferencial en un coeficiente de frecuencia, y genera el coeficiente de frecuencia dentro de la unidad de cuantificación 805. La unidad de cuantificación 805 cuantifica el coeficiente de frecuencia introducido, y genera el valor de cuantificación resultante Qc dentro de la unidad de codificación de longitud variable 811.
La unidad de cuantificación inversa 806 cuantifica inversamente el valor de cuantificación Qc para restaurar el coeficiente de frecuencia original, y genera el coeficiente de frecuencia resultante para la unidad de transformación ortogonal inversa
807.
La unidad de transformación ortogonal inversa 807 realiza transformación de frecuencia inversa sobre el coeficiente de frecuencia que ha de ser transformado en un diferencial de píxeles, y genera el diferencial de píxeles para el sumador
808.
El sumador 808 suma el diferencial de píxeles con una imagen predicha que es generada desde la unidad de compensación de movimiento 802, y genera una imagen decodificada. El conmutador 810 está encendido cuando se ordena que la imagen decodificada sea almacenada, y la imagen decodificada es almacenada dentro de la memoria de imagen 809.
Por otra parte, la unidad de estimación de movimiento 801, en la que la señal de imagen Vin es introducida en unidades de macrobloques, busca las imágenes decodificadas (imágenes de referencia) que están almacenadas en la memoria de imagen 809, detecta una imagen que tiene la imagen más similar a un macrobloque indicada por la señal de imagen Vin, y determina un vector de movimiento MV para indicar una ubicación de la imagen.
La unidad de compensación de movimiento 802, usando el vector de movimiento determinado y similares, recupera la imagen más adecuada para una imagen predicha, a partir de la imagen decodificada almacenada en la memoria de imagen 809.
Una unidad de determinación de estructura de predicción 812 determina, basándose en una imagen de comienzo de RAU Uin, que una imagen que ha de ser codificada está en una posición de comienzo de RAU, luego ordena, usando un tipo de imagen Pt, a la unidad de estimación de movimiento 801 y la unidad de compensación de movimiento 802 que codifiquen (codificación entre imágenes) la imagen como una imagen accesible aleatoriamente especial, y además ordena a la unidad de codificación de longitud variable 811 que codifique el tipo de imagen Pt.
La unidad de codificación de longitud variable 811 realiza codificación de longitud variable sobre el valor de cuantificación Qc, el tipo de imagen Pt, y el vector de movimiento MV para generar un flujo Str.
La FIG. 5 es un diagrama de bloques que muestra un aparato de decodificación de imágenes 900 para llevar a cabo el procedimiento de decodificación de imágenes convencional. Los números de referencia de la FIG. 4 se asignan a unidades idénticas de la FIG. 5, y esas unidades funcionan de la misma manera que la descrita para el aparato de codificación de imágenes para llevar a cabo el procedimiento de codificación de imágenes convencional de la FIG. 4, de manera que los detalles de esas unidades no se describen en lo sucesivo.
La unidad de decodificación de longitud variable 901 decodifica el flujo Str, y genera el valor de cuantificación Qc, una información de especificación de imagen de referencia Ind, el tipo de imagen Pt, el vector de movimiento MV y similares. La memoria de imagen 809 obtiene el vector de movimiento MV, la unidad de compensación de movimiento 802 obtiene el tipo de imagen Pt, el vector de movimiento MV, y la información de especificación de imagen de referencia Ind, y la unidad de cuantificación inversa 806 obtiene el valor de cuantificación Qc. La decodificación es realizada por la memoria de imagen 809, la unidad de compensación de movimiento 802, y la unidad de cuantificación inversa 806, la unidad de transformación ortogonal inversa 807, y el sumador 808. La operación de la decodificación ha sido descrita con referencia al diagrama de bloques de la FIG. 4 que muestra el aparato de codificación de imágenes 800 para llevar a cabo el procedimiento de codificación convencional.
Una memoria intermedia 902 es una memoria para almacenar una imagen decodificada Vout que es generada desde el sumador 808, y una unidad de visualización 903 obtiene la imagen decodificada Vout de la memoria intermedia 902 y visualiza una imagen según la imagen decodificada Vout. Obsérvese que la memoria intermedia 809 y la memoria de imagen 902 pueden compartir la misma memoria.
La FIG. 6 es un organigrama que muestra la decodificación durante una reproducción especial, como reproducción a alta velocidad, realizada por el aparato de decodificación de imágenes convencional 900. En primer lugar, el aparato de decodificación de imágenes convencional 900 detecta, a partir del flujo Str, una cabecera de una imagen que ha de ser decodificada en la etapa S1001. Luego, en la etapa 1002, el aparato de decodificación de imágenes convencional 900 examina, basándose en un tipo de imagen en la cabecera incluida en la capa de imagen, si la imagen inicial tiene que ser decodificada o no. En la etapa S1003, el aparato de decodificación de imágenes convencional 900 determina si la imagen que es examinada ha de ser decodificada o no en la etapa S1002, y si la decodificación tiene que ser decodificada, entonces el procesamiento pasa a la etapa S1004, mientras que si la imagen no tiene que se decodificada, entonces el procesamiento para a la etapa S1005. Por último, en la etapa S1005, el aparato de decodificación de imágenes convencional 900 determina si se termina el procesamiento o no incluso para una última imagen que ha de ser reproducida, como una última imagen en una RAU o un flujo, y si todavía hay imágenes que han de ser procesadas, el procesamiento repite las etapas desde la etapa S1001 hasta la S1005, y si se procesa la última imagen, se termina el procesamiento.
Sin embargo, en el aparato de codificación de imágenes 800 y el aparato de decodificación de imágenes 900 convencionales anteriores, hay un problema de una gran cantidad de carga de procesamiento, durante la codificación del flujo Str que incluye imágenes omitidas, y especialmente durante la reproducción especial, como la reproducción a alta velocidad. Además, en la decodificación del flujo Str que incluye imágenes BI, especialmente en la reproducción especial como la reproducción realizada desde la mitad de todos los datos (denominada en lo sucesivo reproducción a saltos), hay el mismo problema que el descrito anteriormente de que se requiere una gran cantidad de carga de procesamiento.
La FIG. 7 es un diagrama que muestra el problema del aparato de codificación de imágenes 800 y el aparato de decodificación de imágenes 900 convencionales descritos anteriormente.
En (a) de la FIG. 7, se muestra una estructura de la RAU convencional que incluye las imágenes omitidas. La RAU incluye veinticuatro imágenes en las que las imágenes están fijas en la cuarta imagen y las siguientes imágenes en orden de decodificación, de manera que la quinta imagen y las siguientes imágenes son todas imágenes omitidas. Cuando tal RAU es reproducida a triple velocidad, el aparato de decodificación de imágenes convencional 900 intenta decodificar las imágenes 1ª, 4ª, 10ª, 13ª, 16ª, 19ª y 22ª, secuencialmente para ser reproducidas. Sin embargo, las imágenes que han de ser decodificadas en la práctica sólo son la primera imagen I y la cuarta imagen P como se muestra en (c) de la FIG. 7.
Esto significa que, en una RAU del flujo convencional Str, el aparato de decodificación de imágenes 900 no puede determinar si las imágenes han de ser decodificadas o no, a menos que se busque un encabezamiento de cada imagen (capa de imagen) para obtener un tipo de imagen, ya que cada capa de imagen incluye un tipo de imagen de la imagen. Por lo tanto, como se muestra en (b) de la FIG. 7, el aparato de decodificación de imágenes 900 tiene que analizar las imágenes omitidas 7ª, 10ª, 13ª, 16ª, 19ª y 22ª para obtener los tipos de imágenes.
Como se describió anteriormente, para la reproducción a alta velocidad de la RAU convencional, el aparato de codificación de imágenes y el aparato de decodificación de imágenes convencionales tienen que analizar incluso imágenes que no tienen que ser decodificadas, lo que finalmente tiene como resultado una gran cantidad de datos para decodificar.
Además, cuando se realiza reproducción a saltos a partir de una RAU que incluye imágenes BI, el aparato de codificación de imágenes 800 y el aparato de decodificación de imágenes 900 convencionales requieren una gran cantidad de procesamiento al decodificar.
Esto significa que, en el aparato de codificación de imágenes convencional 800, cuando se genera una RAU de tipo GOP abierto, existe una posibilidad de que una imagen (denominada en lo sucesivo imagen reordenada) sea codificada como una imagen B o una imagen BI. Obsérvese que la imagen reordenada está colocada en un orden de visualización antes de una imagen I inicial que está colocada en un orden de decodificación como la primera imagen en la RAU, pero la imagen reordenada está colocada en el orden de decodificación después de la imagen I inicial. Aquí, cuando se realiza reproducción a saltos desde la RAU de tipo GOP abierto, si la imagen reordenada anterior es una imagen B, hay un caso en que es imposible decodificar ni visualizar la imagen B. Sin embargo, si la imagen reordenada es una imagen BI, es posible decodificar y visualizar la imagen BI.
Por lo tanto, el aparato de decodificación de imágenes convencional 900 analiza cada imagen reordenada incluida en la RAU en el flujo Str, determinando así si la imagen reordenada es una imagen B o una imagen BI. Si la imagen reordenada es una imagen B, entonces el aparato de decodificación de imágenes 900 no decodifica la imagen reordenada. Por otra parte, si la imagen reordenada es una imagen B, entonces el aparato de decodificación de imágenes 900 decodifica la imagen reordenada.
Sin embargo, la determinación anterior de si la imagen reordenada es una imagen B o una imagen BI requiere una gran cantidad de procesamiento, lo que a veces tiene como resultado retraso del proceso. Por lo tanto, cuando se realiza reproducción a saltos a partir de la RAU de tipo GOP abierto, el aparato de decodificación de imágenes convencional 900 no decodifica ni visualiza la imagen reordenada, independientemente de si la imagen reordenada es una imagen B o una imagen BI, sin ninguna necesidad específica. Como resultado, cuando la imagen reordenada es una imagen BI, ha sido imposible reproducir eficazmente tal imagen BI.
De este modo, la presente invención trata los problemas anteriores y un objeto de la presente invención es proporcionar un aparato de codificación de imágenes y un aparato de decodificación de imágenes que puedan reducir la carga al decodificar.
Exposición de la invención
Para solucionar los problemas anteriores, la presente invención proporciona un aparato de codificación de imágenes que genera una señal de imagen codificada codificando cada imagen en cada unidad de acceso que incluye una o más imágenes, comprendiendo dicho aparato de codificación de imágenes: una unidad de codificación utilizable para codificar una imagen que ha de ser codificada para generar una imagen independiente que está colocada en un orden de visualización antes de una imagen inicial en la unidad de acceso de la señal de imagen codificada y que puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen, cuando la unidad de acceso es una unidad de acceso de tipo abierto que puede ser codificada haciendo referencia a otra unidad de acceso; una unidad de generación de información utilizable para generar información suplementaria que indica para la unidad de acceso de la señal de imagen codificada si la imagen independiente está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial; y una unidad de escritura utilizable para escribir información suplementaria generada por dicha unidad de generación de información dentro de la unidad de acceso de la señal de imagen codificada.
De ese modo, como una RAU como la unidad de acceso almacena la información suplementaria (mapa de RAU), el aparato de decodificación de imágenes puede determinar fácilmente, haciendo referencia al mapa de RAU, si una imagen BI como la imagen independiente está colocada o no en el orden de visualización inmediatamente antes de una imagen I inicial como la imagen inicial en el orden de decodificación en la RAU, durante la reproducción a saltos, por ejemplo. Como resultado, si la imagen BI no está colocada inmediatamente antes de la imagen inicial, el aparato de decodificación de imágenes puede extraer rápidamente, de las imágenes incluidas en la RAU, también la imagen BI como la imagen que ha de ser decodificada.
Por lo tanto, el aparato de decodificación de imágenes no tiene que analizar convencionalmente cada capa de imagen de las imágenes incluidas en la RAU ni determinar si una imagen de la capa es una imagen B o una imagen BI, de manera que es posible reducir la carga del procesamiento de decodificación. Además, cuando la imagen BI está colocada en el orden de visualización inmediatamente antes de la imagen I inicial, la imagen BI puede ser decodificada y visualizada fácilmente, de manera que es posible usar la imagen BI eficazmente.
Además, dicha unidad de generación de información puede generar la información suplementaria que incluye un indicador que indica si la imagen independiente está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial, y el número de imágenes independientes consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen inicial.
De ese modo, como el mapa de RAU como información suplementaria incluye el indicador y el número de imágenes consecutivas, el aparato de decodificación de imágenes puede determinar fácilmente haciendo referencia al indicador y el número incluidos en la RAU sin hay o no una o más imágenes independientes consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen inicial en la RAU del flujo. Como resultado, cuando se hace la determinación de que hay una o más imágenes independientes consecutivas, el aparato de decodificación de imágenes puede extraer rápidamente de las imágenes incluidas en la unidad de acceso la una o más imágenes BI consecutivas y las imágenes colocadas en el orden de visualización después de las imágenes BI, como las imágenes que han de ser decodificadas. Por otra parte, cuando se hace la determinación de que no existen una o más imágenes independientes consecutivas, el aparato de decodificación de imágenes puede extraer rápidamente de las imágenes incluidas en la unidad de acceso la imagen I inicial y las imágenes colocadas en el orden de visualización después de la imagen I inicial, como las imágenes que han de ser decodificadas.
Aún más, dicha unidad de generación de información puede generar la información suplementaria que indica en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada.
De ese modo, ya que el mapa de RAU como la información suplementaria incluye un tipo de imagen de cada imagen, el aparato de decodificación de imágenes puede determinar fácilmente, haciendo referencia al tipo de imagen indicado por el mapa de RAU, si hay o no una o más imágenes independientes consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen inicial en la RAU del flujo. Como resultado, cuando se hace la determinación de que hay una o más imágenes independientes consecutivas, el aparato de decodificación de imágenes puede extraer rápidamente de las imágenes incluidas en la unidad de acceso la una o más imágenes BI consecutivas y las imágenes colocadas en el orden de visualización después de las imágenes BI, como las imágenes que han de ser decodificadas. Por otra parte, cuando se hace la determinación de que no existe la una o más imágenes independientes consecutivas, el aparato de decodificación de imágenes puede extraer rápidamente de las imágenes incluidas en la unidad de acceso la imagen I inicial y las imágenes colocadas en el orden de visualización después de la imagen I inicial, como las imágenes que han de ser decodificadas.
Aún más, dicha unidad de escritura puede escribir la información suplementaria en una posición anterior a cualquier imagen incluida en la unidad de acceso de la señal de imagen codificada.
De ese modo, ya que el mapa de RAU como la información suplementaria es escrito en una posición anterior a cualquier imagen de la RAU, el aparato de decodificación de imágenes puede detectar fácil y rápidamente el mapa de RAU obteniendo datos de la RAU desde el comienzo de la RAU, de manera que es posible reducir la carga del procesamiento de decodificación.
Aquí, para lograr el objeto anterior, la presente invención proporciona un aparato de decodificación de imágenes que decodifica una señal de imagen codificada en la que cada unidad de acceso incluye una o más imágenes, la unidad de acceso de la señal de imagen codificada almacenando información suplementaria que indica si una imagen independiente está colocada o no en un orden de visualización inmediatamente antes de una imagen inicial en la unidad de acceso, y estando la imagen independiente colocada en un orden de visualización antes de la imagen inicial y pudiendo ser decodificada independientemente sin hacer referencia a ninguna otra imagen, comprendiendo dicho aparato de decodificación de imágenes: una unidad de determinación de tipo utilizable para determinar si la unidad de acceso es o no una unidad de acceso de tipo abierto que puede ser decodificada haciendo referencia a otra unidad de acceso; una unidad de obtención de información utilizable para obtener la información suplementaria de la unidad de acceso, cuando dicha unidad de determinación de tipo determina que la unidad de acceso es la unidad de acceso de tipo abierto; una unidad de extracción utilizable para extraer de la unidad de acceso una imagen que ha de ser decodificada haciendo referencia a la información suplementaria obtenida por dicha unidad de obtención de información; y una unidad de decodificación utilizable para decodificar la imagen extraída por dicha unidad de extracción.
De ese modo, cuando la RAU como la unidad de acceso es la RAU de tipo GOP abierto, el aparato de decodificación de imágenes obtiene el mapa de RAU como la información suplementaria y hace referencia al mapa de RAU, de manera que el aparato de decodificación de imágenes puede determinar fácilmente si la imagen BI como la imagen independiente está colocada o no en el orden de visualización antes de la imagen I inicial que está colocada en el orden de decodificación como la primera imagen. Como resultado, cuando la imagen BI está colocada inmediatamente antes de la imagen I inicial, el aparato de decodificación de imágenes puede extraer rápidamente la imagen BI como una imagen que ha de ser decodificada. Por otra parte, cuando la imagen BI no está colocada inmediatamente antes de la imagen I inicial, el aparato de decodificación de imágenes puede determinar rápidamente que la imagen BI no es una imagen que ha de ser decodificada. Como resultado, es posible reducir la carga del procesamiento de decodificación.
Obsérvese que la presente invención puede llevarse a cabo no sólo como el aparato de codificación de imágenes y de decodificación de imágenes descritos anteriormente, y la señal de codificación de imágenes, sino también como un procedimiento de codificación de imágenes, un procedimiento de decodificación de imágenes, un programa, un medio de almacenamiento que almacena el programa, y un circuito integrado que incluye los dispositivos anteriores.
Breve descripción de los dibujos
Estos y otros objetos, ventajas y características de la invención resultarán evidentes a partir de la siguiente descripción de la misma tomada conjuntamente con los dibujos adjuntos que ilustran realizaciones específicas de la presente invención. En los dibujos:
las FIGS. 1A y 1B son diagramas que muestran una estructura del flujo MPEG 2;
las FIGS. 2A y 2B son diagramas que muestran ejemplos de una estructura de predicción entre imágenes usada en el estándar MPEG 2; la FIG. 3 es un diagrama que muestra una estructura del flujo VC-1 convencional;
la FIG. 4 es un diagrama de bloques que muestra una estructura del aparato de codificación de imágenes convencional; la FIG. 5 es un diagrama de bloques que muestra una estructura del aparato de decodificación de imágenes convencional;
la FIG. 6 es un organigrama que muestra operaciones que son realizadas por el aparato de codificación de imágenes
convencional; la FIG. 7 es un diagrama que muestra un problema en un flujo que es generado por el aparato de codificación de imágenes convencional, durante la reproducción a alta velocidad;
la FIG. 8 es un diagrama que muestra un ejemplo de una estructura de una RAU que está incluida en un flujo VC-1 según la primera realización de la presente invención; la FIG. 9A es un diagrama que muestra un ejemplo de una sintaxis de un mapa de RAU MI; la FIG. 9B es un diagrama que muestra otro ejemplo de la sintaxis del mapa de RAU MI; la FIG. 9C es un diagrama que muestra aún otro ejemplo de la sintaxis del mapa de RAU MI;
la FIG. 9D es un diagrama que muestra aún un ejemplo más de la sintaxis del mapa de RAU MI; la FIG. 10 es un diagrama de bloques que muestra una estructura del aparato de decodificación de imágenes según la primera realización de la presente invención;
la FIG. 11 es un organigrama que muestra operaciones que son realizadas por el aparato de decodificación de imágenes
según la primera realización de la presente invención; la FIG. 12 es un organigrama que muestra operaciones de análisis de un mapa de RAU que son realizadas por el aparato de decodificación de imágenes según la primera realización de la presente invención;
la FIG. 13A es un diagrama que muestra una RAU que es reproducida a una alta velocidad por el aparato de decodificación de imágenes según la primera realización de la presente invención;
la FIG. 13B es un diagrama que muestra un mapa de RAU MI según la FIG. 13A; la FIG. 13C es un organigrama que muestra operaciones de reproducción a una alta velocidad de un flujo STR que tiene la RAU de la FIG. 13A, que es realizada por el aparato de decodificación de imágenes según la primera realización de la presente invención;
la FIG. 14 es un diagrama ejemplar que muestra un procedimiento de reproducción que es realizado por un aparato de
decodificación de imágenes según la primera variación de la primera realización; la FIG. 15 es un organigrama que muestra el procedimiento de reproducción que es realizado por el aparato de decodificación de imágenes según la primera variación de la primera realización;
la FIG. 16A es un diagrama que muestra una RAU que incluye una secuencia de imágenes fijas completa según la
segunda variación de la primera realización; la FIG. 16B es un diagrama que muestra una RAU que incluye una secuencia de imágenes fijas refrescadas gradualmente según la segunda variación de la primera realización;
la FIG. 16C es un diagrama que muestra una RAU que incluye otra secuencia de imágenes fijas refrescadas
gradualmente según la segunda variación de la primera realización; la FIG. 17 es un diagrama de bloques que muestra una estructura de un aparato de codificación de imágenes según la segunda realización de la presente invención;
la FIG. 18 es un organigrama que muestra operaciones que son realizadas por el aparato de codificación de imágenes según la segunda realización de la presente invención;
las FIGS. 19A y 19B son diagramas que muestran una estructura de predicción de una imagen B-skip;
la FIG. 20A es un diagrama explicativo que muestra reproducción a saltos usando imagen BI según la tercera realización de la presente invención;
la FIG. 20B es un diagrama explicativo que muestra otra reproducción a saltos usando imagen BI según la tercera realización de la presente invención;
la FIG. 20C es un diagrama explicativo que muestra aún otra reproducción a saltos usando imagen BI según la tercera realización de la presente invención;
la FIG. 21 es un diagrama que muestra otro ejemplo de una sintaxis del mapa de RAU según la tercera realización de la presente invención;
la FIG. 22 es un diagrama de bloques que muestra un aparato de decodificación de imágenes según la tercera realización de la presente invención;
la FIG. 23 es un organigrama que muestra operaciones que son realizadas por el aparato de decodificación de imágenes 300 según la tercera realización de la presente invención;
la FIG. 24 es un diagrama explicativo que muestra las operaciones realizadas por el aparato de decodificación de imágenes según una variación de la tercera realización de la presente invención;
la FIG. 25 es un diagrama de bloques que muestra un aparato de codificación de imágenes según la cuarta realización de la presente invención;
la FIG. 26 es un organigrama que muestra operaciones que son realizadas por el aparato de codificación de imágenes según la cuarta realización de la presente invención; y
las FIGS. 27A, 27B y 27C son diagramas explicativos que muestran un medio de almacenamiento que almacena un programa para llevar a cabo un procedimiento de codificación de imágenes y un procedimiento de decodificación de imágenes según la presente invención.
Mejor modo para llevar a cabo la invención
Lo que viene a continuación describe realizaciones según la presente invención con referencia a los dibujos.
(Primera realización)
Un mapa de RAU es almacenado al comienzo de una RAU en un flujo VC-1 según la primera realización de la presente invención, y un aparato de decodificación de imágenes según la primera realización especifica una secuencia de imágenes fijas en la RAU analizando el mapa de RAU.
La FIG. 8 es un diagrama que muestra un ejemplo de una estructura de la RAU que está incluida en el flujo VC-1 según la primera realización.
La estructura de la RAU incluye una cabecera de punto de entrada (HDR de punto de entrada) y datos de usuario que están colocados al comienzo de la RAU y una pluralidad de imágenes que siguen a los datos de usuario. Obsérvese que, en el estándar VC-1, la RAU se denomina un segmento de punto de entrada (EPS).
Más específicamente, la RAU según la primera realización se diferencia de la RAU convencional en que la RAU incluye un mapa de RAU MI que está dispuesto en los datos de usuario (datos de usuario a nivel de punto de entrada) e indica si están presentes imágenes omitidas en la RAU, también especifica una secuencia de imágenes fijas en la RAU.
Por lo tanto, el aparato de decodificación de imágenes según la primera realización puede examinar, haciendo referencia al mapa de RAU MI, si la RAU incluye o no alguna imagen omitida y puede especificar la secuencia de imágenes fijas, de manera que es posible especificar, sin analizar cada capa de imagen de la RAU, imágenes que no tienen que ser decodificadas, lo que tiene como resultado la reducción de una cantidad de datos que han de ser decodificados.
La FIG. 9A es un diagrama que muestra un ejemplo de una sintaxis del mapa de RAU MI.
num_pic_in_RAU representa el número de imágenes de la RAU. frame_field_flag representa si cada imagen de la RAU está codificada en una estructura de campo o en una estructura de marco. pic_type representa un tipo de imagen (incluyendo un tipo de imagen omitida) de cada imagen. Obsérvese que la información respecto a cada imagen está indicada en el orden de decodificación. Esto significa que el mapa de RAU MI especifica una secuencia de imágenes fijas en la RAU, indicando los tipos de imágenes (incluyendo un tipo de imagen omitida) de las imágenes de cada RAU. Aquí, la secuencia de imágenes fijas en la primera realización significa una posición y un intervalo desde una imagen de referencia hasta una última imagen omitida, en un caso en el que una secuencia de una pluralidad de imágenes omitidas sigue a la imagen de referencia (imagen I o imagen P) en el orden de decodificación.
Por ejemplo, el mapa de RAU MI indica que todas las imágenes desde la segunda imagen hasta la última imagen de la RAU son imágenes omitidas. En el caso anterior, haciendo referencia a pic_type en el mapa de RAU MI, el aparato de decodificación de imágenes determina decodificar la imagen inicial y visualizar el resultado repetidamente, sin decodificar la segunda imagen y las siguientes.
Obsérvese que el mapa de RAU MI puede incluir información adicional sobre avance de 3:2 que indica a cuántos campos es equivalente un marco al ser visualizado, o si la decodificación del marco comienza desde un campo superior de un campo inferior, y similares, para cada imagen.
La FIG. 9B es un diagrama que muestra otro ejemplo de la sintaxis del mapa de RAU MI.
En el perfil avanzado en el estándar VC-1, los tipos de imágenes del primer campo y el segundo campo para un marco de estructura de campo están indicados por un tipo de imagen de campo que está incluido en la capa de imagen. El tipo de imagen de campo (tipos de imágenes de la primera imagen y la segunda imagen) está definido por ocho patrones que son (I, I), (I, P), (P, I), (P, P), (B, B), (B, BI), (BI, B), y (BI, BI). Por lo tanto, en un caso en el que una imagen está constituida por campos, es posible indicar tipos de imágenes tanto del primer campo como del segundo campo que están incluidos en un marco, indicando el tipo de imagen de campo.
Por lo tanto, la sintaxis del mapa de RAU MI mostrada en la FIG. 9B también indica un tipo de imagen de campo de una imagen, en un caso en el que la imagen está constituida por campos. Más específicamente, num_frame_in_RAU representa el número de marcos de la RAU. field_coding_flag representa si la imagen está constituida por campos o no. En un caso en el que la imagen está constituida por campos, un tipo de imagen de campo de la imagen está representado por field_type_flag, y en un caso en el que la imagen no está constituida por campos, un tipo de imagen de la imagen está representado por picture_type.
Es decir, el mapa de RAU MI, de la misma manera que el mapa de RAU MI mostrado en la FIG. 9A, especifica una secuencia de imágenes fijas en una RAU, indicando tipos de imágenes de todas las imágenes de cada RAU.
Por otra parte, en un caso en el que la RAU incluye sólo imágenes I e imágenes omitidas, o sólo imágenes I, imágenes P e imágenes omitidas, una parte o todas las partes de la RAU se convierten en una secuencia de imágenes fijas. En este caso, dependiendo de si una parte procesada es la secuencia de imágenes fijas o una secuencia de imágenes en movimiento normales, el aparato de codificación de imágenes cambia el procesamiento de decodificación y visualización, de manera que el mapa de RAU MI puede incluir información adicional respecto a si la RAU incluye o no alguna secuencia de imágenes fijas.
La FIG. 9C es un diagrama que muestra aún otro ejemplo de la sintaxis del mapa de RAU MI.
En esta sintaxis, motionless_flag representa si la RAU incluye o no alguna secuencia de imágenes fijas, y start_pic_num y end_pic_num especifican la secuencia de imágenes fijas de la RAU. Más específicamente, en un caso en el que motionless_flag es 1, el mapa de RAU MI indica que la RAU incluye una secuencia de imágenes fijas. Además, en un caso en el que motionless_flag es 1, el mapa de RAU MI indica que la secuencia de imágenes fijas comienza con una imagen I o una imagen P que está representada por start_pic_num, y termina con una imagen omitida que está representada por end_pic_num.
Obsérvese que es posible establecer motionless_flag como 1, sólo en un caso en el que todas las partes de la RAU son una secuencia de imágenes fijas o donde la RAU incluye una secuencia de imágenes fijas que continúa durante más tiempo que un cierto periodo de tiempo.
La FIG. 9D es un diagrama que muestra otro ejemplo de sintaxis del mapa de RAU MI.
En esta sintaxis, number_of_pictures_in_EPS representa el número de imágenes incluidas en el EPS. picture_structure representa si una imagen es un campo o un marco, o representa a cuántos campos es equivalente un marco al ser visualizado. picture_type representa a qué tipo de imagen, concretamente imagen I, imagen P, imagen B, imagen omitida, o similar, pertenece la imagen. Además, stuffing_bits se usa para alinear todos los bits de stuffing_bits, picture_structure, y picture_type, por multiplicación integral de ocho bits. Además, en esta sintaxis, stuffing_bits, picture_structure, y picture_type están indicados en el orden de decodificación, respecto a las imágenes respectivas incluidas en el EPS.
Tal mapa de RAU MI, de la misma manera que el mapa de RAU MI mostrado en la FIG. 9A, especifica una secuencia de imágenes fijas en las imágenes de una RAU, indicando tipos de imágenes de las imágenes de cada RAU (EPS).
Obsérvese que el mapa de RAU MI puede almacenar información respecto a imágenes respectiva en un orden de visualización de las imágenes. Obsérvese también que el mapa de RAU MI puede almacenar información adicional que indica si la información respecto a imágenes respectivas es almacenada en el orden de decodificación o en el orden de visualización.
Obsérvese también que el mapa de RAU MI puede ser almacenado en datos de usuario en una capa que es diferente de una capa de punto de entrada, por ejemplo, en datos de usuario para una imagen inicial. Obsérvese también que, en un caso en el que la RAU no incluye ninguna imagen omitida, no tiene que generarse el mapa de RAU MI. En tal caso, es posible indicar si la RAU incluye o no alguna imagen omitida, examinando la existencia del mapa de RAU MI.
La FIG. 10 es un diagrama de bloques que muestra un aparato de decodificación de imágenes 100 en la primera realización.
El aparato de decodificación de imágenes 100 de la primera realización que decodifica el flujo STR incluye la RAU mostrada en la FIG. 8 incluye: la unidad de decodificación de longitud variable 101, la memoria de imagen 102, la unidad de compensación de movimiento 103, la unidad de cuantificación inversa 104, la unidad de transformación ortogonal inversa 105, la memoria intermedia 106, la unidad de visualización 107, el sumador 108, una unidad de extracción de flujo 109, y una unidad de obtención de información 110.
Este aparato de decodificación de imágenes 100 se diferencia del aparato de decodificación de imágenes convencional 900 en que se añaden la unidad de extracción de flujo 109 y la unidad de obtención de información 110.
La unidad de obtención de información 110 obtiene el mapa de RAU MI de la unidad de decodificación de longitud variable 101, y también obtiene, del exterior, una señal de modo de reproducción TM para ordenar detalles de reproducción especial como reproducción a alta velocidad. Luego, la unidad de obtención de información 110 analiza el mapa de RAU MI basándose en le señal de modo de reproducción TM, y determina (selecciona) imágenes que han de ser decodificadas. La unidad de obtención de información 110 genera una señal de instrucción de imagen de decodificación SP indica los resultados de la determinación, para la unidad de extracción de flujo 109.
Por ejemplo, en un caso en el que el mapa de RAU MI incluye la sintaxis mostrada en la FIG. 9C, la unidad de obtención de información 110 determina, basándose en motionless_flag, si la RAU que ha de ser reproducida incluye o no alguna secuencia de imágenes fijas. Luego, si se hace la determinación de que la RAU incluye una secuencia de imágenes fijas, la unidad de obtención de información 110 especifica el área fija, basándose en start_pic_num y end_pic_num. Después de especificar la secuencia de imágenes fijas, la unidad de obtención de información 110 determina, a partir de las imágenes que han de ser reproducidas que son indicadas por la señal de modo de reproducción TM, sólo las imágenes que no están incluidas en la secuencia de imágenes fijas, como imágenes que han de ser decodificadas, y la unidad de obtención de información 110 genera los resultados de la determinación para la señal de instrucción de imagen de decodificación SP. Sin embargo, si las imágenes que han de ser reproducidas que son indicadas por la señal de modo de reproducción TM incluyen una imagen de la secuencia de imágenes fijas, se determina que la imagen inicial de la secuencia de imágenes fijas es la imagen que ha de ser decodificada.
Además, si el mapa de RAU MI incluye la sintaxis mostrada en la FIG. 9D, la unidad de obtención de información 110 especifica una secuencia de imágenes fijas, basándose en picture_type, que es indicada para cada imagen de la RAU. Luego, la unidad de obtención de información 110 determina, a partir de las imágenes que han de ser reproducidas que son indicadas por la señal de modo de reproducción TM, sólo las imágenes que no están incluidas en la secuencia de imágenes fijas, como imágenes que han de ser decodificadas, y la unidad de obtención de información 110 genera los resultados de la determinación para la señal de instrucción de imagen de decodificación SP. Sin embargo, como se describió anteriormente, si las imágenes que han de ser reproducidas que son indicadas por la señal de modo de reproducción TM incluyen una imagen de la secuencia de imágenes fijas, se determina que la imagen inicial de la secuencia de imágenes fijas es la imagen que ha de ser decodificada.
Después de obtener el flujo STR, la unidad de extracción de flujo 109 en primer lugar detecta, para cada RAU, el mapa de RAU MI codificado que está colocado al comienzo de la RAU, y genera el mapa de RAU MI para la unidad de decodificación de longitud variable 101. Después de obtener la señal de instrucción de imagen de decodificación SP que es generada desde la unidad de obtención de información 110 basándose en el mapa de RAU MI, la unidad de extracción de flujo 109 extrae, del flujo STR, datos de las imágenes que han de ser decodificadas que están indicadas por la señal de instrucción de imagen de decodificación SP, y genera los datos para la unidad de decodificación de longitud variable 101.
Cuando la unidad de decodificación de longitud variable 101 obtiene el mapa de RAU MI de la unidad de extracción de flujo 109, la unidad de decodificación de longitud variable 101 realiza decodificación de longitud variable sobre el mapa de RAU MI codificado, y genera el mapa de RAU MI decodificado para la unidad de obtención de información 110. Además, cuando la unidad de decodificación de longitud variable 101 obtiene, de la unidad de extracción de flujo 109, los datos de las imágenes que están incluidas en el flujo STR, la unidad de decodificación de longitud variable 101 realiza decodificación de longitud variable sobre los datos, y genera un valor de cuantificación Qc, una información de especificación de imagen de referencia Ind, un tipo de imagen Pt, y un vector de movimiento MV.
La unidad de compensación de movimiento 103 recupera una imagen que está indicada por el vector de movimiento MV, de la imagen decodificada (imagen de referencia) que está almacenada en la memoria de imagen 102 e indicada por la información de especificación de imagen de referencia Ind, y genera la imagen como una imagen predicha para el sumador 108.
La unidad de cuantificación inversa 104 cuantifica inversamente el valor de cuantificación Qc que ha de ser restaurado como un coeficiente de frecuencia, y genera el coeficiente de frecuencia dentro de la unidad de transformación ortogonal inversa 105. La unidad de transformación ortogonal inversa 105 realiza transformación de frecuencia inversa sobre el coeficiente de frecuencia que ha de ser transformado en un diferencial de píxeles, y genera el diferencial de píxeles para el sumador 108. El sumador 108 suma el diferencial de píxeles con la imagen predicha que es generada desde la unidad de compensación de movimiento 103, y genera una imagen decodificada Vout. Luego, el sumador 108 almacena la imagen decodificada Vout dentro de la memoria de imagen 102 y la memoria intermedia 106. La unidad de visualización 107 obtiene la imagen decodificada Vout de la memoria intermedia 106, y visualiza una imagen que corresponde a la imagen decodificada Vout. Obsérvese que la memoria de imagen 102 y la memoria intermedia 106 pueden compartir una sola memoria.
Obsérvese también que la unidad de extracción de flujo 109 puede generar datos de todas las imágenes que están incluidas en la RAU, dentro de la unidad de decodificación de longitud variable 101. En este caso, la unidad de decodificación de longitud variable 101 selecciona, de todas las imágenes incluidas en la RAU, imágenes que tienen que ser decodificadas, basándose en la señal de instrucción de imagen de decodificación SP que es generada desde la unidad de obtención de información 110. Luego, la unidad de decodificación de longitud variable 101 realiza decodificación de longitud variable sobre los datos de las imágenes seleccionadas. Obsérvese que la unidad de obtención de información 110 puede especificar la imagen que ha de ser decodificada sólo para reproducción especial, como reproducción a alta velocidad y reproducción inversa. En caso de reproducción normal, puede determinarse decodificar todas las imágenes sin analizar el mapa de RAU.
La FIG. 11 es un organigrama que muestra operaciones que son realizadas por el aparato de decodificación de imágenes 100 según la primera realización.
Cuando el aparato de decodificación de imágenes 100 recibe una instrucción para comenzar la reproducción especial, el aparato de decodificación de imágenes 100 en primer lugar determina si el mapa de RAU MI está almacenado o no en los datos de usuario en una capa de punto de entrada (etapa S100). En otras palabras, el aparato de decodificación de imágenes 100 determina si se detecta o no el mapa de RAU MI. Si el aparato de decodificación de imágenes 100 detectael mapa de RAU MI (SÍ en la etapa S100), entonces el procesamiento pasa a la etapa S102, y si no (NO en la etapa S100), entonces el procesamiento salta directamente a la etapa S106.
Más específicamente, si el aparato de decodificación de imágenes 100 detecta el mapa de RAU MI (SÍ en la etapa S100), el aparato de decodificación de imágenes 100 analiza el mapa de RAU MI (etapa S102), y determina (selecciona), de las imágenes de la RAU que han de ser reproducidas durante la reproducción especial, imágenes que han de ser decodificadas, basándose en el resultado del análisis (etapa S104).
Obsérvese que, cuando comienza la reproducción especial de la RAU, el aparato de decodificación de imágenes 100 siempre detecta el mapa de RAU MI en la etapa S100, y especifica imágenes en la RAU que ha de ser decodificada. En otras palabras, cuando comienza la reproducción especial de la RAU, el aparato de decodificación de imágenes 100 de la primera realización selecciona, basándose en el mapa de RAU MI, de las imágenes que están incluidas en la RAU y que han de ser reproducidas durante la reproducción especial, imágenes excepto imágenes omitidas, como las imágenes que han de ser decodificadas.
En caso de que el mapa de RAU MI no sea detectado en la etapa S100, o después de que las imágenes que han de ser decodificadas son especificadas en la etapa S104, el aparato de decodificación de imágenes 100 detecta una cabecera de la imagen (código de comienzo) en las imágenes que están en la RAU y han de ser reproducidas durante la reproducción especial (etapa S106).
A continuación, el aparato de decodificación de imágenes 100 examina si la imagen cuya cabecera ha sido detectada en la etapa S106 y que es una imagen que ha de ser reproducida durante la reproducción especial está o no entre las imágenes que se ha especificado que han de ser decodificadas en la etapa S104 (etapa S108). Aquí, si se hace la determinación de que la imagen está entre las imágenes que se ha especificado que han de ser decodificadas (SÍ en la etapa S108), el aparato de decodificación de imágenes 100 decodifica la imagen (etapa S110).
En caso de que se haga la determinación de que la imagen no está entre las imágenes que se ha especificado que han de ser decodificadas en la etapa S104 (NO en la etapa S108), o después de que la imagen sea decodificada en la etapa S110, el aparato de decodificación de imágenes 100 examina si todavía hay o no alguna imagen que haya de ser procesada (etapa S112).
Si no se encuentra ninguna imagen que haya de ser procesada (NO en la etapa S112), entonces el aparato de decodificación de imágenes 100 termina todas las operaciones, y si todavía hay imágenes que hayan de ser procesadas (SÍ en la etapa S112), entonces el aparato de decodificación de imágenes 100 repite las operaciones desde la etapa S100. Por ejemplo, en un caso en el que el mapa de RAU MI ha sido detectado en la etapa S100 en el procesamiento previo, y el siguiente procesamiento pasa a la etapa S100 para la misma RAU, el aparato de decodificación de imágenes 100 no tiene que detectar el mapa de RAU MI en S100 (NO en la etapa S100), sino que realiza la operación en la etapa S106, concretamente, detecta una cabecera de la siguiente imagen que ha de ser reproducida durante la reproducción especial.
Como se describió anteriormente, el procedimiento de decodificación de imágenes de la primera realización se diferencia del procedimiento de decodificación de imágenes convencional en que están incluidas las operaciones desde la etapa S100 a la etapa S104.
La FIG. 12 es un organigrama que muestra operaciones de análisis del mapa de RAU MI que son realizadas por el aparato de decodificación de imágenes 100 según la primera realización.
Por ejemplo, en un caso en el que el mapa de RAU MI incluye la sintaxis mostrada en la FIG. 9D, el aparato de decodificación de imágenes 100 en primer lugar analiza el mapa de RAU MI, y especifica imágenes I, imágenes P, e imágenes omitidas, de las imágenes que están incluidas en la RAU y que han de ser reproducidas durante la reproducción especial (etapa S120).
A continuación, en un caso en el que la imagen que ha de ser reproducida durante la reproducción especial es una imagen omitida, el aparato de decodificación de imágenes 100 determina usar un resultado de decodificar una imagen I o una imagen P que está inmediatamente antes de la imagen omitida en el orden de decodificación, como imagen que corresponde a la imagen omitida (etapa S122).
Obsérvese que, incluso en la reproducción normal que no es la reproducción especial, es posible especificar, haciendo referencia al mapa de RAU MI, la imagen omitida y similares, cuando comienza la reproducción de la RAU.
Cuando se visualiza la imagen omitida incluida en la RAU, el aparato de decodificación de imágenes 100 visualiza el resultado de decodificar la imagen I o la imagen P que es especificada en la etapa S122 y está inmediatamente antes de la imagen omitida.
Aquí, con referencia a las FIGS. 13A, 13B y 13C, se muestran operaciones de reproducción a alta velocidad que son realizadas por el aparato de decodificación de imágenes según la primera realización.
La FIG. 13A es un diagrama que muestra una RAU que es reproducida a alta velocidad.
La primera imagen contada desde el comienzo de las imágenes es una imagen I, la segunda y tercera imágenes son imágenes B, y la cuarta imagen es una imagen P. La quinta imagen y las siguientes son todas imágenes omitidas. Obsérvese que todas las imágenes son marcos.
La FIG. 13B es un diagrama que muestra un mapa de RAU MI que corresponde a la FIG. 13A. El mapa de RAU MI incluye la sintaxis mostrada en la FIG. 9A. Aquí, todas las imágenes son marcos, de manera que frame_field_flag se establecen como 1 para todas las imágenes. Además, pic_type se establece como imagen I, imagen P, imagen B o imagen omitida, para cada imagen. Obsérvese que, en la FIG. 13B, pic_type es establece como "I", "P", "B" u "Omitida", pero, en la práctica real, pic_type también puede establecerse como un valor numérico que representa el tipo de imagen.
La FIG. 13C es un organigrama que muestra operaciones de reproducción a alta velocidad de un flujo STR que incluye la RAU de la FIG. 13A, que es realizada por el aparato de decodificación de imágenes 100 según la primera realización.
En primer lugar, el aparato de decodificación de imágenes 100 determina reproducir a triple velocidad la RAU de la FIG. 13A que está incluida en el flujo STR (etapa S130). Obsérvese que la reproducción a triple velocidad es una reproducción a alta velocidad común, y es el mismo procesamiento por el que sólo son reproducidas imágenes I e imágenes P, en un caso en el que una estructura de flujo de la RAU incluye imagen I, imagen B, imagen B, imagen P, imagen B, imagen B, imagen P, imagen B imagen B,...en el orden de decodificación.
A continuación, el aparato de decodificación de imágenes 100 determina, basándose en un resultado del análisis del mapa de RAU MI mostrado en la FIG. 13B, que todas las imágenes desde la quinta imagen hasta la imagen vigesimocuarta son imágenes omitidas y que un intervalo desde la cuarta imagen hasta la imagen vigesimocuarta es una secuencia de imágenes fijas. Luego, el aparato de decodificación de imágenes 100 determina decodificar sólo la primera y la cuarta imágenes, puesto que un resultado de decodificar la cuarta imagen se usa como imágenes que han de visualizarse para la quinta imagen y las siguientes (etapa S132). Posteriormente, el aparato de decodificación de imágenes 100 decodifica y visualiza la primera y la cuarta imágenes (etapa S134). Además, el aparato de decodificación de imágenes 100 visualiza el resultado de decodificar la cuarta imagen repetidamente en vez de los resultados de decodificar las imágenes séptima, décima, decimotercera, decimosexta, decimonovena, y vigesimosegunda.
Obsérvese que la primera realización ha descrito que cada RAU del flujo VC-1 incluye un mapa de RAU y que el aparato de decodificación de imágenes 100 decodifica el flujo, pero es posible aplicar cualquier procedimiento de codificación para codificar el flujo, además de los estándares MPEG-4AVC y MPEG-2, siempre que el flujo incluya el mapa de RAU. Aquí, aunque se aplica un procedimiento de codificación en el que no está definido el mismo tipo de imagen que la imagen omitida, el procedimiento puede distinguir una imagen de otras imágenes considerando la imagen como una imagen omitida en el mapa de RAU, siempre que un tipo de la imagen sea realmente el mismo que la imagen omitida.
(Primera variación)
Lo que viene a continuación describe la primera variación de un procedimiento de reproducción que es realizado por el aparato de decodificación de imágenes 100 según la primera realización.
Por ejemplo, habría un caso en el que la decodificación de la imagen inicial de la secuencia de imágenes fijas no se termina dentro de un periodo de tiempo de decodificación comprendido entre una marca de tiempo de decodificación (DTS) y una marca de tiempo de presentación (PTS). Por lo tanto, en la variación de la primera realización, aunque la decodificación de la imagen inicial no haya sido terminada por la PTS, la imagen inicial es visualizada después de que se termina la decodificación.
La FIG. 14 es un diagrama explicativo que muestra el procedimiento de reproducción que es realizado por el aparato de decodificación de imágenes según la primera variación de la primera realización.
DTS2 representa una marca de tiempo de decodificación que está incluida en una cabecera de un paquete (denominado paquete PES) que tiene un código de una imagen inicial pic2 en una secuencia de imágenes fijas pic2. PTS2 representa una marca de tiempo de presentación que está incluida en la cabecera del paquete que tiene el código de la imagen inicial pic2, en otras palabras, represente un tiempo de presentación (salida o visualización) de la imagen inicial pic2. DTS1, PTS1 y PTS3 representan tiempos respectivos de la misma manera que se describió anteriormente.
Por ejemplo, el aparato de decodificación de imágenes 100, como se muestra en la FIG. 14, comienza a decodificar la imagen inicial pic2 en la DTS2. Sin embargo, hay un caso en que un tiempo de terminación de decodificación es posterior a PST2. Por lo tanto, en un caso en el que un tiempo de terminación de decodificación para la imagen inicial de la secuencia de imágenes fijas es posterior a PST2, el aparato de decodificación de imágenes 100 según la primera variación de la primera realización comienza la presentación en un momento de una cuadrícula de marco que es inmediatamente posterior al momento de terminación de decodificación.
De este modo, en un caso en el que la decodificación comienza en una marca de tiempo de decodificación que está incluida en la imagen inicial codificada, pero la decodificación no ha sido terminada por una marca de tiempo de presentación, el aparato de decodificación de imágenes 100 según la variación de la primera realización añade un margen a la marca de tiempo de presentación y visualiza la imagen inicial decodificada en tal marca de tiempo de presentación con el margen.
La FIG. 15 es un organigrama que muestra el procedimiento de reproducción que es realizado por el aparato de decodificación de imágenes 100 según la primera variación de la primera realización.
El aparato de decodificación de imágenes 100 según la primera variación de la primera realización comienza a decodificar una imagen inicial en una DTS de la imagen inicial de la secuencia de imágenes fijas (etapa S140). Luego, el aparato de decodificación de imágenes 100 determina si la decodificación ha sido terminada o no por una PTS de laimagen inicial (etapa S142). Aquí, si se hace la determinación de que se ha terminado la decodificación (SÍ en la etapa S142), entonces el aparato de decodificación de imágenes 100 visualiza la imagen inicial decodificada, en la PTS (etapa S144). Por otra parte, si se hace la determinación de que la decodificación aún no se ha terminado (NO en la etapa S142), entonces el aparato de decodificación de imágenes 100 visualiza la imagen inicial decodificada, en un momento posterior a la PTS, concretamente, en un momento de una cuadrícula de marco inmediatamente después de terminar la decodificación (etapa S146).
De este modo, según el procedimiento de reproducción que es realizado por el aparato de decodificación de imágenes 100 de la variación de la primera realización, en un caso en el que la decodificación de la imagen inicial de la secuencia de imágenes fijas se retrasa y no ha sido terminada por la PTS, también puede retrasarse un momento de visualización de la imagen inicial, de manera que es posible mejorar la calidad de imagen en la secuencia de imágenes fijas, comparada con un caso en el que no se visualiza la imagen inicial.
(Segunda variación)
Aquí, se describe la segunda variación del procedimiento de reproducción realizado por el aparato de decodificación de imágenes 100 según la primera realización.
El aparato de decodificación de imágenes 100 según la segunda variación puede reducir la carga de la decodificación de imágenes fijas usada en una aplicación como un disco Blu-ray (BD).
Para un flujo, hay dos clases de procedimientos para generar una secuencia en la que las imágenes están fijas. Mediante un procedimiento, una o más imágenes, cada una de las cuales proporciona un resultado decodificado idéntico, están colocadas consecutivamente. Mediante el otro procedimiento, las imágenes que siguen a una imagen inicial están colocadas posteriormente para mejorar la calidad de imagen de la imagen idéntica cada procesamiento de decodificación. Para distinguir las secuencias generadas por ambos procedimientos, la primera se denomina una secuencia de imágenes fijas completa, y la segunda se denomina una secuencia de imágenes fijas refrescadas gradualmente.
Aquí, en la secuencia de imágenes fijas completa, es posible comenzar la reproducción desde cualquier posición deseada en la secuencia decodificando una imagen inicial de la secuencia. Por otra parte, en la secuencia de imágenes fijas refrescada gradualmente, es imposible comenzar la reproducción desde cualquier posición deseada en la secuencia decodificando sólo una imagen inicial, ya que la imagen inicial es decodificada para proporcionar un resultado diferente de los resultados decodificando otras imágenes que siguen a la imagen inicial en la secuencia. Por lo tanto, cuando comienza la reproducción desde una imagen en mitad de la secuencia de imágenes fijas refrescada gradualmente, la imagen de la posición inicial de reproducción es decodificada decodificando secuencialmente la imagen inicial y las imágenes que siguen a la imagen inicial en la secuencia. Como se describió anteriormente, la secuencia de imágenes fijas completa y la secuencia de imágenes fijas refrescada gradualmente necesitan diferente procesamiento para la reproducción especial, por ejemplo, cuando se realiza reproducción a saltos, o cuando la reproducción a alta velocidad se vuelve a cambiar a la reproducción normal, de manera que es necesario distinguir estas secuencias.
De este modo, el mapa de RAU según la segunda variación indica una secuencia respecto a imágenes fijas en a RAU y también indica si la secuencia es una secuencia de imágenes fijas completa o una secuencia de imágenes fijas refrescada gradualmente. Entonces el aparato de decodificación de imágenes 100 según la segunda variación hace referencia al mapa de RAU especificando así fácilmente una imagen que ha de ser decodificada, para realizar el procesamiento de decodificación. Como resultado, es posible reducir la carga de procesamiento de decodificación.
La FIG. 16A es un diagrama que muestra una RAU que incluye la secuencia de imágenes fijas completa.
Por ejemplo, un mapa de RAU indica que la RAU tiene una estructura de la secuencia de imágenes fijas completa indicando un tipo de imagen de cada imagen incluida en la RAU como se muestra en la FIG. 9D.
Por lo tanto, el aparato de decodificación de imágenes 100, haciendo referencia a tal mapa de RAU, puede especificar fácilmente, en la secuencia de imágenes fijas completa de la RAU, sólo una imagen I inicial como imagen que ha de ser decodificada.
La FIG. 16B es un diagrama que muestra una RAU que incluye una secuencia de imágenes fijas refrescada gradualmente.
Por ejemplo, un mapa de RAU indica que la RAU tiene una estructura de la secuencia de imágenes fijas refrescada gradualmente indicando un tipo de imagen de cada imagen incluida en la RAU como se muestra en la FIG. 9D. La secuencia de imágenes fijas refrescada gradualmente mostrada en la FIG. 16B tiene una estructura de una imagen I al comienzo de la RAU y una pluralidad de imágenes P que siguen a la imagen I (imágenes siguientes). En tal secuencia de imágenes fijas refrescada gradualmente, cada vez que cada siguiente imagen P es decodificada secuencialmente, se mejora la calidad de imagen de la imagen que es un resultado decodificado de la imagen I inicial. Esto significa que tal secuencia de imágenes fijas refrescada gradualmente es adecuada para mejorar la calidad de imagen de las imágenes fijas hasta la última imagen de la RAU.
Por lo tanto, cuando se pretende que la reproducción comience desde alguna imagen P de la secuencia de imágenes fijas refrescada gradualmente en la RAU, el aparato de decodificación de imágenes 100 puede especificar fácilmente, haciendo referencia a tal mapa de RAU, como imagen que ha de ser decodificada, la imagen I inicial de la secuencia de imágenes fijas refrescada gradualmente y cada imagen P entre la imagen I y una imagen P en una posición de comienzo de reproducción.
La FIG. 16C es un diagrama que muestra una RAU que incluye otra secuencia de imágenes fijas refrescada gradualmente.
Por ejemplo, un mapa de RAU indica que la RAU tiene una estructura de la secuencia de imágenes fijas refrescada gradualmente indicando un tipo de imagen de cada imagen incluida en la RAU como se muestra en la FIG. 9D. La secuencia de imágenes fijas refrescada gradualmente mostrada en la FIG. 16C tiene una estructura de una imagen I al comienzo de la RAU, dos imágenes P que siguen a la imagen I (imágenes siguientes), y una pluralidad de imágenes omitidas. En tal secuencia de imágenes fijas refrescada gradualmente, cada vez que las dos imágenes P son decodificadas secuencialmente, se mejora la calidad de imagen de la imagen que es un resultado decodificado de la imagen I inicial, y luego se mantiene la calidad de imagen por las imágenes omitidas.
Por lo tanto, cuando se pretende que la reproducción comience desde alguna imagen P de la secuencia de imágenes fijas refrescada gradualmente en la RAU, el aparato de decodificación de imágenes 100 puede especificar fácilmente, haciendo referencia a tal mapa de RAU, como imágenes que han de ser decodificadas, la imagen I inicial de la secuencia de imágenes fijas refrescada gradualmente y cada imagen P entre la imagen I y una imagen P desde la cual ha de comenzarse la reproducción. Además, cuando se pretende que la reproducción comience desde alguna imagen omitida de la secuencia de imágenes fijas refrescada gradualmente en la RAU, el aparato de decodificación de imágenes 100 puede especificar fácilmente, haciendo referencia a tal mapa de RAU, como imágenes que han de ser decodificadas, la imagen I inicial y las dos imágenes P de la secuencia de imágenes fijas refrescada gradualmente.
Obsérvese que la segunda variación ha descrito que el mapa de RAU anterior está colocado en un flujo, por ejemplo, en un comienzo de la RAU, pero el mapa de RAU puede ser almacenado en un mapa de tiempo de información de gestión
o similar.
Obsérvese también que la segunda variación ha descrito que cuando se pretende que la reproducción comience desde alguna imagen en mitad de la secuencia de imágenes fijas refrescada gradualmente, la imagen I inicial y cada imagen P entre la imagen I y una imagen P en una posición de comienzo de reproducción son especificadas como imágenes que han de ser decodificadas, pero no es necesario especificar todas las imágenes como imágenes que han de ser decodificadas. Más especialmente, es posible especificar, como imágenes que han de ser decodificadas, sólo la imagen I inicial o sólo la imagen I inicial y el número predeterminado de imágenes P. En este caso, aunque no puede lograrse la calidad de imagen original de una imagen en una posición de comienzo de reproducción, es posible reducir la carga de procesamiento en la reproducción.
(Segunda realización)
La FIG. 17 es un diagrama de bloques que muestra un aparato de codificación de imágenes según la segunda realización de la presente invención.
El aparato de codificación de imágenes 200 según la segunda realización incluye: una unidad de estimación de movimiento 201, una unidad de compensación de movimiento 202, un sustractor 203, una unidad de transformación ortogonal 204, una unidad de cuantificación 205, una unidad de cuantificación inversa 206, una unidad de transformación ortogonal inversa 207, un sumador 208, una memoria de imagen 209, un conmutador 210, una unidad de codificación de longitud variable 211, una unidad de determinación de estructura de predicción 212, y una unidad de generación de información 213.
La unidad de estimación de movimiento 201 obtiene una señal de imagen Vin en unidades de macrobloques. Después, la unidad de estimación de movimiento 201 busca imágenes decodificadas (imágenes de referencia) que están almacenadas en la memoria de imagen 209, y detecta una imagen que tiene la imagen más similar a un macrobloque indicado por la señal de imagen Vin. La unidad de estimación de movimiento 201 determina un vector de movimiento MV que indica una ubicación de la imagen y genera el vector MV. La unidad de estimación de movimiento 201 genera una información de especificación de imagen de referencia Ind que indica una imagen decodificada que se ha usado para detectar el vector de movimiento MV.
La unidad de compensación de movimiento 202 recupera la imagen que es indicada por el vector de movimiento MV, de las imágenes decodificadas que están almacenadas en la memoria de imagen 209 e indicada por la información de especificación de imagen de referencia Ind, y genera la imagen como una imagen predicha.
Una unidad de determinación de estructura de predicción de imágenes 212 determina, basándose en una imagen de comienzo de RAU Uin, que una imagen que ha de ser codificada está en una posición de comienzo de RAU, luego ordena, usando un tipo de imagen Pt, a la unidad de estimación de movimiento 801 y la unidad de compensación de movimiento 802 que codifiquen (codificación entre imágenes) la imagen como una imagen accesible aleatoriamente, y además ordena a la unidad de codificación de longitud variable 811 que codifique el tipo de imagen Pt. Más específicamente, la unidad de determinación de estructura de predicción 212 especifica un tipo de imagen, por ejemplo, imagen I, imagen P, imagen B, imagen omitida, o similar, para cada imagen que ha de ser codificada que está incluida en la señal de imagen Vin.
El sustractor 203 obtiene la señal de imagen Vin y la imagen predicha, luego calcula un diferencial entre la señal de imagen Vin y la imagen predicha, y genera el diferencial para la unidad de transformación ortogonal 204. La unidad de transformación ortogonal 204 transforma el diferencial en un coeficiente de frecuencia, y genera el coeficiente de frecuencia dentro de la unidad de cuantificación 205. La unidad de cuantificación 205 cuantifica el coeficiente de frecuencia que es introducido desde la unidad de transformación ortogonal 204, y genera el valor de cuantificación resultante Qc dentro de la unidad de codificación de longitud variable 211.
La unidad de cuantificación inversa 206 cuantifica inversamente el valor de cuantificación Qc para restaurar el coeficiente de frecuencia original, y genera el coeficiente de frecuencia resultante para la unidad de transformación ortogonal inversa
207.
La unidad de transformación ortogonal inversa 207 realiza transformación de frecuencia inversa sobre el coeficiente de frecuencia que ha de ser transformado en un diferencial de píxeles, y genera el diferencial de píxeles para el sumador
208.
El sumador 808 suma el diferencial de píxeles con la imagen predicha que es generada desde la unidad de compensación de movimiento 202, y genera una imagen decodificada. El conmutador 210 está encendido cuando se
ordena que la imagen decodificada sea almacenada, y la imagen decodificada es almacenada dentro de la memoria de imagen 209.
La unidad de generación de información 213 genera un mapa de RAU MI como se muestra en una de las FIGS. 9A a 9D, según el tipo de imagen Pt determinado por la unidad de determinación de estructura de predicción 212, y genera el mapa RAU MI generado para la unidad de codificación de longitud variable 211.
La unidad de codificación de longitud variable 211 realiza codificación de longitud variable sobre el valor de cuantificación Qc, el tipo de imagen Pt, el mapa de RAU MI, el vector de movimiento MV, y similares, para generar un flujo STR.
Como se describió anteriormente, el aparato de codificación de imágenes 200 según la segunda realización se diferencia del aparato de codificación de imágenes convencional 800 en que está incluida la unidad de generación de información
213.
La FIG. 18 es un organigrama que muestra operaciones que son realizadas por el aparato de codificación de imágenes 200 según la segunda realización.
En primer lugar, el aparato de codificación de imágenes 200 determina, usando la unidad de determinación de estructura de predicción 212, si una imagen que ha de ser codificada es o no una imagen inicial de una RAU (etapa S200). Aquí, sise hace la determinación de que la imagen es la imagen inicial de la RAU (SÍ en la etapa S200), el aparato de codificación de imágenes 200 realiza, usando la unidad de codificación de longitud variable 211, el procesamiento de inicialización para generar el mapa de RAU MI, y obtiene un área para almacenar el mapa de RAU MI en unos datos de usuario de una capa de punto de entrada (etapa S202).
Además, el aparato de codificación de imágenes 200 determina, usando la unidad de determinación de estructura de predicción 212, si la imagen que ha de ser codificada es o no una imagen omitida (etapa S204). Aquí, si se hace la determinación de que la imagen no es una imagen omitida (NO en la etapa S204), entonces el aparato de codificación de imágenes codifica datos de píxeles de la imagen que ha de ser codificada (etapa S206).
Luego, el aparato de codificación de imágenes 200 genera y actualiza, mediante la unidad de generación de información 213, un mapa de RAU MI, basándose en un resultado de la determinación en la etapa S204 (etapa S208).
Por ejemplo, el aparato de codificación de imágenes 200 genera el mapa de RAU MI como se muestra en la FIG. 9D, para incluir un tipo de imagen de la imagen que es codificada en la etapa S206, información que indica si la imagen es un campo o un marco, y similares. El aparato de codificación de imágenes 200 también puede generar el mapa de RAU MI como se muestra en la FIG. 9C, para incluir una indicación de una secuencia de imágenes fijas.
A continuación, el aparato de codificación de imágenes 200 determina si la imagen determinada en la etapa S204 es o no una última imagen en la RAU (etapa S210). En otras palabras, el aparato de codificación de imágenes 200 determina si el procesamiento se ha realizado o no para todas las imágenes que están incluidas en la RAU. Aquí, si se hace la determinación de que la imagen es una última imagen (SÍ en S210), entonces el aparato de codificación de imágenes 200 especifica y codifica el mapa de RAU MI, usando la unidad de codificación de longitud variable 211, y escribe el mapa de RAU MI dentro del área que se obtiene en la etapa S202 (etapa S212).
Luego, el aparato de codificación de imágenes 200 determina si todavía hay o no imágenes que han de ser procesadas, entre las imágenes incluidas en el flujo STR (etapa S214). Aquí, si se hace la determinación de que todavía hay una imagen que ha de ser procesada (SÍ en la etapa S214), entonces el aparato de codificación de imágenes 200 repite las operaciones desde la etapa S200, y si se hace la determinación de que no se encuentra ninguna imagen que haya de ser procesada (NO en la etapa S214), entonces el aparato de codificación de imágenes 200 termina todas las operaciones de codificación.
Obsérvese que, en un caso en el que no se conoce la información respecto al mapa de RAU MI, o un caso en el que se añade una memoria intermedia para almacenar de manera intermedia datos de imágenes que están incluidas en la RAU, es posible omitir la etapa S202. En este caso, el área de almacenamiento para el mapa de RAU MI se obtiene en la etapa S212, y el mapa de RAU MI es almacenado en los datos de usuario de la capa de punto de entrada.
Obsérvese también que el aparato de codificación de imágenes 200 puede generar el flujo STR que incluye imágenes omitidas, con una velocidad de transmisión de bits fija. La cantidad para codificar una imagen omitida es aproximadamente 1 byte, y es necesario ajusta un tamaño del flujo STR insertando datos de relleno, cuando se codifica la señal de imagen Vin con una velocidad de transmisión de bits fija. Aquí, los datos de relleno pueden insertarse sólo en imágenes omitidas. De ese modo, es posible decodificar la imagen sin consumir tiempo para procesar los datos de relleno que son insertados en una franja de los datos en la imagen.
Obsérvese también que en primer lugar tienen que leerse una capa de secuencia y la información de la capa de punto de entrada durante la reproducción especial, así que es deseable reducir el tamaño de los datos lo máximo posible. Por lo tanto, puede determinarse que no se inserten los datos de relleno entre la capa de secuencia y la capa de punto de entrada.
También es posible multiplexar y grabar el flujo STR que es generado por el procedimiento de codificación según la segunda realización, junto con datos de audio. Ejemplos del procedimiento de multiplexación son un procedimiento que está estandarizado para cada medio empaquetado y similares, como un procedimiento que usa un paquete de flujo de transporte del sistema MPEG-2 o un paquete que está definido en el disco Blu-ray (BD).
Por otra parte, en el perfil simple y el perfil principal, la imagen omitida no puede ser identificada por el tipo de imagen de la capa de imagen.
Por lo tanto, aunque el tipo de imagen de la capa de imagen para cada imagen sea imagen I, imagen P, imagen B, o imagen BI, el aparato de codificación de imágenes 200 según la segunda realización puede examinar, basándose en un tamaño de la imagen, si la imagen es una imagen omitida o no, y si la imagen es una imagen omitida, entonces puede ser generado el mapa de RAU MI para indicar que la imagen es una imagen omitida. Esto significa que el mapa de RAU MI en el flujo STR que es generado por el aparato de codificación de imágenes 200 indica tipos de imágenes de imágenes respectivas que incluyen imágenes omitidas, incluso en el perfil simple y el perfil principal.
Por la misma razón, en el perfil principal, también es imposible distinguir una imagen B y una imagen BI por el tipo de imagen en la capa de imagen.
Por lo tanto, el aparato de codificación de imágenes 200 según la segunda realización genera el mapa de RAU MI que indica tipos de imágenes de imágenes respectivas que están incluidas en la RAU, basándose en los tipos de imágenes Pt que son especificados distinguiendo una imagen B y una imagen BI mediante la unidad de determinación de estructura de predicción 212. Esto significa que el mapa de RAU MI en el flujo STR que es generado por el aparato de codificación de imágenes 200 puede distinguir imágenes B e imágenes BI, incluso en el perfil principal. La imagen BI, no como la imagen B, puede ser decodificada independientemente, de manera que la distinción de imagen BI e imagen B incrementa la flexibilidad para seleccionar imágenes que han de ser decodificadas y reproducidas durante la reproducción especial.
En un caso en que está presente una capa de secuencia, es posible que la RAU incluya la capa de secuencia, por ejemplo, añadiendo siempre la capa de secuencia a la capa de punto de entrada. Además, los datos de usuario de la capa de punto de entrada pueden incluir información adicional además del mapa de RAU MI.
En la reproducción especial, es importante especificar una imagen que ha de ser decodificada y acceder eficazmente a tal imagen. Por lo tanto, el mapa de RAU MI puede indicar información de dirección respecto a cada imagen. Aquí, la información de dirección puede ser información respecto a una posición de byte contada desde el comienzo de la RAU o información para especificar un paquete en el que es almacenada cada imagen cuando los datos codificados son empaquetados por un paquete de flujo de transporte, y similares. Obsérvese que la información de dirección puede ser añadida, no para todas las imágenes, sino sólo para imágenes que han de ser decodificadas durante la reproducción especial, como imágenes I o imágenes P.
<Variación>
Lo que viene a continuación describe una variación de imagen omitida según la segunda realización.
En la segunda realización, se genera una imagen omitida para que sea una imagen P que tenga los mismos datos de píxeles de la imagen de referencia inmediatamente antes de la imagen omitida en el orden de decodificación. De ese modo, la imagen omitida no puede usarse en lugar de una imagen B.
Por lo tanto, la variación de la segunda realización genera la imagen omitida como una imagen B que no es predicha a partir de ninguna otra imagen, y como una imagen que tiene los mismos datos de píxeles que una imagen que es la imagen de referencia inmediatamente anterior a la imagen omitida en el orden de visualización (denominada en lo sucesivo imagen B-skip). Más específicamente, en la variación de la segunda realización, introduciendo nuevamente la imagen B-skip, es posible formar una estructura de GOP, como imagen I, imagen B, imagen B, imagen P, imagen B, imagen B, imagen P, imagen B, imagen B,..., que se usa comúnmente en el estándar MPEG-2, de manera que la reproducción IP (reproducción especial para reproducir sólo imágenes I e imágenes P) puede llevarse a cabo fácilmente en el aparato de decodificación de imágenes.
Las FIGS. 19A y 19B muestran ejemplos en los que se usan las imágenes B-skip. Obsérvese que, en las FIGS. 19A y 19B, "I", "B", "P" y "B-skip" que están incluidas en códigos "I2", "B0", "P5" y "B-skip6" y similares, representan tipos de imágenes de imágenes respectivas, y los números que se añaden a los tipos de imágenes indican un orden de visualización. Obsérvese que, en la FIG. 19A, las imágenes de la RAU están dispuestas en orden de decodificación, y en la FIG. 19B, las imágenes de la RAU están dispuestas en orden de visualización. Una imagen B-skip6 y una imagen Bskip7 son predichas a partir de solamente una imagen P5 que es una imagen de referencia inmediatamente anterior a las imágenes en el orden de visualización, y no predichas a partir de una imagen P8. El aparato de codificación de imágenes 200 según la variación de la segunda realización genera un flujo STR que tiene la RAU mostrada en la FIG. 19A y 19B.
Aquí, si una imagen es o no una imagen B-skip está indicado por un tipo de imagen en el mapa de RAU MI. Por otra parte, aunque la imagen sea una imagen B-skip, un tipo de imagen o un tipo de imagen de campo que está incluida en una capa de imagen de la imagen es una imagen B. Por lo tanto, tal flujo STR puede mantener la compatibilidad con el flujo convencional, de manera que incluso el decodificador convencional que no puede analizar el mapa de RAU MI puede tratar la imagen B-skip como una imagen B, y realizar reproducción especial.
Obsérvese que la capa de imagen puede indicar si una imagen es o no una imagen B-skip. También es posible generar una imagen B-skip como una imagen que tiene los mismos datos de píxeles de una imagen de referencia inmediatamente anterior a la imagen B-skip en el orden de visualización. En tal caso, el mapa de RAU MI puede indicar si la imagen B-skip es predicha a partir de una imagen de referencia inmediatamente anterior a la imagen B-skip o una imagen de referencia inmediatamente posterior a la imagen B-skip, en el orden de visualización.
(Tercera realización)
Un aparato de decodificación de imágenes según la tercera realización hace referencia a un mapa de RAU que indica imágenes BI, y de ese modo determina si hay o no una o más imágenes BI que han de estar colocadas en el orden de visualización inmediatamente antes de la imagen I inicial en una RAU de tipo GOP abierto. Si se hace la determinación de que una o más imágenes BI han de estar colocadas inmediatamente antes de la imagen I inicial, el aparato de decodificación de imágenes comienza a decodificar desde la primera imagen de las imágenes BI.
Aquí, en la tercera realización, la imagen I inicial es una imagen colocada en el orden de decodificación al comienzo de la RAU y que ha de ser colocada en el orden de visualización como la primera imagen I de la RAU. Por otra parte, la imagen reordenada es una imagen colocada en el orden de decodificación después de la imagen I inicial de la RAU pero ha de ser colocada en el orden de visualización antes de la imagen I inicial. Además, la imagen BI es una imagen que tiene características de una imagen B y una imagen I (es necesaria la reordenación de la imagen BI y una imagen I o P). Más específicamente, la imagen BI tiene las características de la imagen B en las que la imagen BI sigue en el orden de decodificación a una imagen I o P aunque la imagen BI precede en el orden de visualización a la imagen I o P, y la imagen no es una imagen de referencia para otras imágenes. Además, la imagen BI tiene las características de la imagen I en las que todos los macrobloques están intracodificados y la imagen no hace referencia a ninguna otra imagen. Por otra parte, en un perfil avanzado y similar, una capa de imagen de la imagen BI en el flujo STR puede incluir información de tipo de imagen que indica que una imagen de la capa es una imagen BI.
Lo que viene a continuación describe la tercera realización más detalladamente.
Hay un tipo de GOP abierto y un tipo de GOP cerrado en la RAU según el VC-1 así como el estándar MPEG-2. La RAU de tipo de GOP abierto es una RAU en la que una imagen puede hacer referencia a una imagen de otra RAU colocada en el orden de decodificación inmediatamente antes de la RAU actual. Por otra parte, la RAU de tipo de GOP cerrado es una RAU en la que una imagen sólo hace referencia a una imagen de la misma RAU. Obsérvese que es posible, usando una indicación en un nivel de punto de entrada o una base de datos para reproducción especial fuera del flujo, para determinar si la RAU es del tipo de GOP abierto o el tipo de GOP cerrado.
Aquí, cuando se realiza reproducción a saltos desde el comienzo de la RAU de tipo de GOP abierto, si hay una imagen B colocada en el orden de decodificación después de una imagen inicial (imagen I) de la RAU pero ha de estar colocada en el orden de visualización antes de la imagen inicial (imagen I), la imagen B no puede hacer referencia a una imagen de otra RAU inmediatamente anterior a la RAU actual, de manera que es imposible decodificar la imagen B. Por lo tanto, la imagen B no es decodificada durante la reproducción a saltos.
Por otra parte, incluso cuando se realiza reproducción a saltos desde el comienzo de la RAU de tipo de GOP abierto, si hay una imagen BI colocada en el orden de decodificación después de la imagen inicial (imagen I) de la RAU pero ha de estar colocada en el orden de visualización antes de la imagen inicial (imagen I), la imagen BI puede ser decodificada sin hacer referencia a ninguna otra imagen, de manera que la reproducción puede comenzar desde la imagen BI.
Lo que viene a continuación describe detalladamente un ejemplo en el que las imágenes BI han de estar colocadas en el orden de visualización antes de la imagen I inicial en la RAU de tipo de GOP abierto.
La FIG. 20A es un diagrama explicativo que muestra la reproducción a saltos usando la imagen BI.
Por ejemplo, el aparato de decodificación de imágenes según la tercera realización realiza reproducción a alta velocidad decodificando sólo la imagen I inicial en el orden de visualización en cada RAU y visualizando la imagen decodificada, y luego vuelve a cambiar la reproducción a alta velocidad a reproducción normal, como se muestra en la FIG. 20A. Más específicamente, el aparato de decodificación de imágenes realiza reproducción a alta velocidad decodificando sólo cada imagen I inicial de la primera a la novena RAU, y volviendo a cambiar la reproducción a alta velocidad a la reproducción normal desde la décima RAU en la FIG. 20A.
Aquí, aunque la décima RAU es una RAU de tipo de GOP abierto, las imágenes colocadas en el orden de visualización antes de la imagen I que es la primera imagen en el orden de decodificación son imágenes BI, de manera que el aparato de decodificación de imágenes puede comenzar la reproducción desde una imagen inicial en la décima RAU (la primera imagen BI en el orden de visualización).
Como se describió anteriormente, estableciendo como imágenes BI, las imágenes reordenadas que han de ser visualizadas antes que la imagen I inicial de la RAU de tipo de GOP abierto, es posible llevar a cabo un cambio suave de la reproducción a alta velocidad a la reproducción normal.
La FIG. 20B es un diagrama explicativo que muestra otra reproducción a saltos usando imagen BI.
Por ejemplo, como se muestra en la FIG. 20B, en una RAU, una imagen B y una imagen BI están colocadas secuencialmente en el orden de visualización antes de una imagen I inicial.
Aquí, la imagen B no puede ser decodificada durante la reproducción especial (la reproducción a saltos, por ejemplo), ya que la imagen B hace referencia a una imagen de otra RAU inmediatamente antes de la RAU actual, de manera que el aparato de decodificación de imágenes puede determinar que la visualización debe comenzar desde la imagen BI.
La FIG. 20C es un diagrama explicativo que muestra aún otra reproducción a saltos usando la imagen BI.
Por ejemplo, como se muestra en la FIG. 20C, en una RAU, una imagen BI y una imagen B están colocadas secuencialmente en el orden de visualización antes de una imagen I inicial.
En este caso, la imagen BI seguramente puede ser decodificada, pero la imagen B que sigue a la imagen BI no podría ser decodificada. Por lo tanto, si la RAU tiene una imagen B que está colocada en el orden de visualización entre una imagen BI como la primera imagen y una imagen I inicial que es la primera imagen en el orden de decodificación, el aparato de decodificación de imágenes puede determinar que la visualización debe comenzar desde la imagen I.
El aparato de decodificación de imágenes según la tercera realización hace referencia a un mapa de RAU MIa para realizar suavemente la reproducción especial anterior. El mapa de RAU MIa es almacenado en los datos de usuario en la RAU como se muestra en la FIG. 8 según la primera realización.
Obsérvese que la sintaxis del mapa de RAU MIa según la tercera realización tiene la misma estructura de la sintaxis según la primera realización mostrada en la FIG. 9D. Más específicamente, el mapa de RAU MIa incluye información de number_of_pictures_in_EPS, picture_structure, y picture_type. picture_type indica a qué tipo de imagen pertenece cada imagen en el orden de decodificación de la RAU: una imagen I, una imagen P, una imagen B, o una imagen BI.
Es decir, el mapa de RAU MIa según la tercera realización indica si hay o no una o más imágenes BI consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen I inicial, indicando un tipo de imagen de cada imagen en el orden de decodificación de la RAU.
Por lo tanto, cuando se realiza reproducción a saltos desde la RAU de tipo de GOP abierto, el aparato de decodificación de imágenes según la tercera realización puede determinar fácilmente desde qué imagen debe comenzar la reproducción, haciendo referencia al mapa de RAU MIa almacenado en la RAU. Como resultado, el aparato de decodificación de imágenes según la tercera realización puede realizar suavemente la reproducción a saltos como se muestra en las FIGS. 20A a 20C.
Obsérvese que, en la tercera realización, el mapa de RAU MIa incluye información de tipo de imagen respecto a imágenes en el orden de decodificación como se muestra en la FIG. 9D, pero puede incluir información de tipo de imagen respecto a imágenes en el orden de visualización. Por otra parte, en el mapa de RAU MIa, la información de tipo de imagen respecto a las imágenes o similares puede incluir información que indica en qué orden es almacenada la información de tipo de imagen, concretamente en el orden de decodificación o en el orden de visualización.
La FIG. 21 es un diagrama que muestra otro ejemplo de sintaxis del mapa de RAU MIa según la tercera realización.
La sintaxis de este mapa de RAU MIa indica el uso de independent_decodable_flag si una imagen BI está colocada en el orden de visualización inmediatamente antes de la imagen I inicial de la RAU. Además, cuando independent_decodable_flag es 1, en otras palabras, cuando la imagen BI está colocada en el orden de visualización inmediatamente antes de la imagen I inicial, la sintaxis indica el número de imágenes BI consecutivas colocadas inmediatamente antes de la imagen I inicial, usando num_decodable_pictures.
Cuando se realiza reproducción a saltos desde la RAU de tipo de GOP abierto, el aparato de decodificación de imágenes según la tercera realización hace referencia al mapa de RAU MIa almacenado en la RAU. Luego, el aparato de decodificación de imágenes determina si independent_decodable_flag incluido en el mapa de RAU MIa es 1 o cero. Si se hace la determinación de que independent_decodable_flag es 1, entonces el aparato de decodificación de imágenes además especifica el número de imágenes indicadas por num_decodable_pictures incluido en el mapa de RAU MIa como el número de imágenes consecutivas (número consecutivo), y realiza la reproducción desde una imagen BI que está colocada en el orden de visualización por el número consecutivo inmediatamente antes de la imagen I inicial. Si sólo hay una imagen BI inmediatamente antes de la imagen I inicial, el aparato de codificación de imágenes realiza la reproducción desde la imagen BI. Por otra parte, si hay una pluralidad de imágenes BI consecutivas inmediatamente antes de la imagen I inicial, el aparato de codificación de imágenes realiza la reproducción desde la primera imagen de las imágenes BI consecutivas.
Obsérvese que el mapa de RAU MIa puede ser almacenado en los datos de usuario de una capa diferente de una capa de punto de entrada, por ejemplo, en los datos de usuario de la imagen inicial de la RAU. Obsérvese también que cuando no hay imagen BI en la RAU, no es necesario crear el mapa de RAU MIa. En tal caso, la existencia del mapa de RAU MIa puede usarse para indicar si la RAU tiene o no alguna imagen BI inmediatamente antes de la imagen I inicial.
La FIG. 22 es un diagrama de bloques que muestra el aparato de decodificación de imágenes 300 según la tercera realización.
El aparato de decodificación de imágenes 300 según la tercera realización incluye una unidad de decodificación de longitud variable 301, una memoria de imagen 302, una unidad de compensación de movimiento 303, una unidad de cuantificación inversa 304, una unidad de transformación ortogonal inversa 305, y una memoria intermedia 306, una unidad de visualización 307, un sumador 308, una unidad de extracción de flujo 309, y una unidad de obtención de información de BI 310.
Este aparato de decodificación de imágenes 300 se diferencia del aparato de decodificación de imágenes convencional 900 en que se añaden la unidad de extracción de flujo 309 y la unidad de obtención de información de BI 310.
La unidad de obtención de información de BI 310 obtiene de la unidad de decodificación de longitud variable 301 información de tipo de grupo GT que indica si una RAU que ha de ser decodificada es de tipo de GOP abierto o de tipo de GOP cerrado. Si la información de tipo de grupo GT indica que la RAU es de tipo de GOP abierto, entonces la unidad de obtención de información de BI 310 además obtiene de la unidad de decodificación de longitud variable 301 un mapa de RAU MIa de la RAU que ha de ser decodificada. Además, la unidad de obtención de información de BI 310 obtiene del exterior una señal de modo de reproducción TM para indicar detalles de la reproducción especial, como reproducción a saltos. Luego, la unidad de obtención de información de BI 310 analiza el mapa de RAU MIa y la información de tipo de grupo GT basándose en la señal de modo de reproducción TM, y especifica (selecciona) una imagen que ha de ser decodificada y visualizada.
Por ejemplo, cuando la información de tipo de grupo GT de la RAU que ha de ser decodificada indica que la RAU es de tipo de GOP cerrado, la unidad de obtención de información de BI 310 especifica, como las imágenes que han de ser decodificadas y visualizadas, todas las imágenes de la RAU que ha de ser decodificada.
Por otra parte, cuando la información de tipo de grupo GT de la RAU que ha de ser decodificada indica que la RAU es de tipo de GOP abierto, la unidad de obtención de información de BI 310 especifica las imágenes que han de ser decodificadas y visualizadas basándose en el mapa de RAU MIa.
Por ejemplo, cuando el mapa de RAU MIa tiene la sintaxis mostrada en la FIG. 21, la unidad de obtención de información de BI 310 determina, basándose en independent_decodable_flag, si hay o no una o más imágenes BI consecutivas inmediatamente en el orden de visualización antes de la imagen I inicial de la RAU que ha de ser reproducida. Si se hace la determinación de que hay tal imagen BI, entonces la unidad de obtención de información de BI 310 especifica, basándose en num_decodable_pictures, una posición de comienzo de reproducción, concretamente la primera imagen BI en el orden de visualización de la RAU. Si se hace la determinación de que no hay tal imagen BI, entonces la unidad de obtención de información de BI 310 especifica la imagen I inicial de la RAU como la posición de comienzo de reproducción.
Además, cuando el mapa de RAU MIa tiene la sintaxis mostrada en la FIG. 9D, la unidad de obtención de información de BI 310 determina, basándose en el picture_type para cada imagen de la RAU, si hay o no una o más imágenes BI consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen I inicial de la RAU que ha de ser reproducida. Si se hace la determinación de que hay tal imagen BI, entonces la unidad de obtención de información de BI 310 especifica como posición de comienzo de reproducción la primera imagen BI en el orden de visualización de la RAU. Si se hace la determinación de que no hay tal imagen BI, entonces la unidad de obtención de información de BI 310 especifica como la posición de comienzo de reproducción la imagen I inicial de la RAU.
Después de especificar la posición de comienzo de reproducción como se describió anteriormente, la unidad de obtención de información de BI 310 selecciona, como imagen que ha de ser decodificada y visualizada, imágenes que existen en el orden de visualización desde la posición de comienzo de reproducción, entre las imágenes de la RAU desde las que se realiza la reproducción a saltos indicada por la señal de modo de reproducción TM.
Luego, la unidad de obtención de información de BI 310 genera una señal de instrucción de imagen de decodificación SP que indica los resultados anteriores para la unidad de extracción de flujo 309.
Después de obtener el flujo STR, la unidad de extracción de flujo 309 en primer lugar detecta, para cada RAU, una cabecera de punto de entrada codificada y un mapa de RAU MIa colocado al comienzo de la RAU, y genera esos datos para la unidad de decodificación de longitud variable 301. Después de obtener la señal de instrucción de imagen de decodificación SP que es generada desde la unidad de obtención de información de BI 310 basándose en el mapa de RAU MIa, la unidad de extracción de flujo 309 extrae, del flujo STR, datos de las imágenes que han de ser decodificadas que son indicadas por la señal de instrucción de imagen de decodificación SP, y genera los datos para la unidad de decodificación de longitud variable 301.
Cuando la unidad de decodificación de longitud variable 301 obtiene la cabecera de punto de entrada codificada y el mapa de RAU MIa de la unidad de extracción de flujo 309, la unidad de decodificación de longitud variable 301 realiza decodificación de longitud variable sobre la cabecera de punto de entrada codificada y el mapa de RAU MIa. Luego, la unidad de decodificación de longitud variable 301 genera la información de tipo de grupo GT almacenada en la cabecera de punto de entrada decodificada para la unidad de obtención de información de BI 310. Por otra parte, la unidad de decodificación de longitud variable 301 genera el mapa de RAU MIa decodificado para la unidad de obtención de información de BI 310 en respuesta a una solicitud procedente de la unidad de obtención de información de BI. Además, cuando la unidad de decodificación de longitud variable 301 obtiene, de la unidad de extracción de flujo 309, los datos de las imágenes que están incluidas en el flujo STR, la unidad de decodificación de longitud variable 301 realiza decodificación de longitud variable sobre los datos, y genera un valor de cuantificación Qc, una información de especificación de imagen de referencia Ind, un tipo de imagen Pt, y un vector de movimiento MV.
La unidad de compensación de movimiento 303 recupera un área de imagen que es indicada por el vector de movimiento MV, de la imagen decodificada (imagen de referencia) que está almacenada en la memoria de imagen 302 e indicada por la información de especificación de imagen de referencia Ind, y genera el área de imagen como una imagen predicha para el sumador 308.
La unidad de cuantificación inversa 304 cuantifica inversamente el valor de cuantificación Qc que ha de ser restaurado como un coeficiente de frecuencia, y genera el coeficiente de frecuencia dentro de la unidad de transformación ortogonal inversa 305. La unidad de transformación ortogonal inversa 305 realiza transformación de frecuencia inversa sobre el coeficiente de frecuencia que ha de volver a ser transformado en un diferencial de píxeles, y genera el diferencial de píxeles para el sumador 308. El sumador 308 suma el diferencial de píxeles con la imagen predicha que es generada desde la unidad de compensación de movimiento 303, y genera una imagen decodificada Vout. Luego, el sumador 308 almacena la imagen decodificada Vout dentro de la memoria de imagen 302 y la memoria intermedia 306. La unidad de visualización 307 obtiene la imagen decodificada Vout de la memoria intermedia 306, y visualiza una imagen que corresponde a la imagen decodificada Vout. Obsérvese que la memoria de imagen 302 y la memoria intermedia 306 pueden compartir una sola memoria.
Obsérvese también que la unidad de extracción de flujo 309 puede generar, dentro de la unidad de decodificación de longitud variable 301, datos de todas las imágenes incluidas en la RAU, sin depender de la señal de modo de reproducción TM, el mapa de RAU MIa, o la información de tipo de grupo GT. En este caso, la unidad de decodificación de longitud variable 301 selecciona, de todas las imágenes incluidas en la RAU, imágenes que han de ser decodificadas y visualizadas, basándose en la señal de instrucción de imagen de decodificación SP que es generada desde la unidad de obtención de información de BI 310. Luego, la unidad de decodificación de longitud variable 301 realiza decodificación de longitud variable sobre los datos de las imágenes seleccionadas. Obsérvese que la unidad de obtención de información 310 puede especificar la imagen que ha de ser decodificada sólo para la reproducción especial, como la reproducción a saltos, la reproducción inversa, y volver a cambiar de la reproducción a alta velocidad. Para la reproducción normal, la unidad de obtención de información 310 puede especificar todas las imágenes como imágenes que han de ser decodificadas y visualizadas sin analizar el mapa de RAU MIa y similares. Especialmente, en caso de cambio de reproducción especial a reproducción normal como se describe en la tercera realización, es suficiente analizar el mapa de RAU MIa de la primera RAU desde la que comienza la reproducción normal.
La FIG. 23 es un organigrama que muestra operaciones que son realizadas por el aparato de decodificación de imágenes 300 según la tercera realización.
En primer lugar, el aparato de decodificación de imágenes 300 determina si una RAU que ha de ser decodificada es o no de tipo de GOP abierto o de tipo de GOP cerrado basándose en la información de tipo de grupo GT almacenada en la cabecera de punto de entrada de la RAU que ha de ser decodificada (etapa S300).
Aquí, si se hace la determinación de que la RAU es de tipo de GOP abierto (SÍ en la etapa S300), entonces el aparato de decodificación de imágenes 300 obtiene un mapa de RAU MIa almacenado en la RAU que ha de ser decodificada (etapa S302).
Luego, el aparato de decodificación de imágenes 300 determina, basándose en el mapa de RAU MIa, si hay o no una o más imágenes BI consecutivas que han de estar colocadas en el orden de visualización inmediatamente antes de una imagen I inicial de la RAU que ha de ser decodificada (etapa S304).
Si se hace la determinación de que hay tal imagen BI (SÍ en la etapa S304), el aparato de decodificación de imágenes 300 especifica, como imágenes que han de ser decodificadas y visualizadas, tales imágenes BI consecutivas e imágenes colocadas en el orden de visualización después de las imágenes BI consecutivas (etapa S306). Esto significa que cuando sólo hay una única imagen BI, no una pluralidad de imágenes BI consecutivas, colocada en el orden de visualización inmediatamente antes de la imagen I inicial, el aparato de decodificación de imágenes 300 especifica, como imágenes que han de ser decodificadas, la imagen BI y las imágenes colocadas en el orden de visualización después de la imagen BI.
Además, cuando hay una pluralidad de imágenes BI consecutivas colocadas en el orden de visualización inmediatamente antes de la imagen I inicial, el aparato de decodificación de imágenes 300 especifica, como imágenes que han de ser decodificadas, las imágenes BI y las imágenes colocadas en el orden de visualización después de las imágenes BI consecutivas.
Por otra parte, si se hace la determinación de que no hay tal imagen BI (NO en la etapa S308), entonces el aparato de decodificación de imágenes 300 especifica, como imágenes que han de ser decodificadas y visualizadas, la imagen I inicial y las imágenes colocadas en el orden de visualización después de la imagen I inicial, entre las imágenes incluidas en la RAU que ha de ser decodificada.
Además, cuando en la etapa S300 se hace la determinación de que la RAU que ha de ser decodificada es de tipo de GOP cerrado (NO en la etapa S300), el aparato de decodificación de imágenes 300 especifica, como imágenes que han de ser decodificadas y visualizadas, la imagen I inicial y las imágenes colocadas en el orden de visualización después de la imagen I inicial, entre las imágenes incluidas en la RAU que ha de ser decodificada, de la misma manera que la descrita anteriormente (etapa S308). En este caso, el aparato de decodificación de imágenes 300 determina todas las imágenes incluidas en la RAU que ha de ser decodificada como las imágenes que han de ser decodificadas y visualizadas.
Luego el aparato de decodificación de imágenes 300 decodifica las imágenes especificadas en las etapas S306 y S308 (etapa S310).
Obsérvese que la imagen que ha de ser decodificada siempre puede ser determinada basándose en el resultado de analizar el mapa de RAU comenzando el procesamiento desde la etapa S302, sin procesar la etapa S300 para determinar si la RAU es o no una RAU de tipo de GOP abierto.
De este modo, en la tercera realización, cuando se realiza la reproducción especial como la reproducción a saltos desde la RAU, el aparato de decodificación de imágenes 300 puede determinar fácilmente, haciendo referencia al mapa de RAU MIa, si hay o no una imagen BI independiente colocada en el orden de visualización inmediatamente antes de la imagen I inicial que es la primera imagen en el orden de decodificación. Como resultado, cuando una imagen BI no está colocada inmediatamente antes de la imagen inicial, el aparato de decodificación de imágenes 300 puede extraer rápidamente, como imágenes que han de ser decodificadas, la imagen I inicial y las imágenes colocadas en el orden de visualización después de la imagen I inicial, entre las imágenes incluidas en la RAU. Además, cuando una imagen BI está colocada inmediatamente antes de la imagen inicial, el aparato de decodificación de imágenes 300 también puede extraer rápidamente la imagen BI como una imagen que ha de ser decodificada, entre las imágenes incluidas en la RAU.
Por lo tanto, el aparato de decodificación de imágenes 300 según la tercera realización no tiene que analizar convencionalmente cada capa de imagen de las imágenes incluidas en la RAU ni determinar si una imagen es una imagen B o una imagen BI para determinar las imágenes que han de ser decodificadas, de manera que es posible reducir la carga del procesamiento de decodificación. Además, cuando una imagen BI está colocada en el orden de visualización inmediatamente antes de la imagen I inicial, la imagen BI puede ser decodificada y visualizada fácilmente, de manera que es posible usar la imagen BI eficazmente.
Obsérvese que la tercera realización ha descrito que el mapa de RAU MIa indica si una imagen colocada en el orden de visualización antes de la imagen inicial es o no una imagen BI, pero puede usarse otro procedimiento excepto el mapa de RAU MIa para indicar lo mismo. Por ejemplo, puede usarse información indicadora de una capa de punto de entrada, un mapa de tiempo de información de gestión, o datos de usuario de un flujo VC-1.
<Variación>
Aquí se describe una variación del aparato de decodificación de imágenes 300 según la tercera realización.
El aparato de decodificación de imágenes 300 según la variación puede mejorar la función de la reproducción especial usando la imagen BI.
La FIG. 24 es un diagrama ejemplar que muestra operaciones realizadas por el aparato de decodificación de imágenes 300 según la variación. Por ejemplo, como se muestra en la FIG. 24, un flujo tiene dos imágenes B y una imagen BI colocadas en el orden de visualización entre una imagen I y una imagen P o entre dos imágenes P.
En el caso anterior, el aparato de decodificación de imágenes 300 según la variación puede realizar reproducción a cuádruple velocidad decodificando sólo una imagen I y una imagen P como se muestra en (1) de la FIG. 24. Además, el aparato de decodificación de imágenes 300 según la variación puede realizar reproducción a doble velocidad decodificando una imagen BI además de la imagen I y la imagen P como se muestra en (2) de la FIG. 24.
Como se describió anteriormente, el aparato de decodificación de imágenes 300 según la variación puede mejorar la función de la reproducción especial para el flujo, si las imágenes BI están colocadas con un ciclo predeterminado.
Por otra parte, el aparato de decodificación de imágenes 300 según la variación puede determinar dónde está colocada una imagen BI en el orden de decodificación o en el orden de visualización en la RAU que ha de ser decodificada, haciendo referencia al mapa de RAU MIa que tiene la sintaxis como la mostrada en la FIG. 9D, por ejemplo. Además, el aparato de decodificación de imágenes 300 puede determinar dónde están colocadas una imagen I y una imagen P. Esto significa que el aparato de decodificación de imágenes 300 según la variación puede especificar rápidamente las imágenes que han de ser decodificadas y visualizadas durante la reproducción especial, haciendo referencia al mapa de RAU MIa o similar.
Obsérvese que incluso cuando hay una imagen B que ha de ser visualizada antes de la imagen I inicial, si la imagen B no hace referencia a una imagen de otra RAU inmediatamente antes de la RAU actual, el mapa de RAU o un indicador en un nivel de punto de entrada pueden indicar que la RAU es una RAU de tipo de GOP cerrado.
Obsérvese también que la variación de la tercera realización ha descrito que el mapa de RAU MIa está almacenado en cada RAU del flujo VC-1 y el aparato de decodificación de imágenes 300 decodifica el flujo, pero siempre que el mapa de RAU MIa esté almacenado en una RAU, el procedimiento de codificación puede ser otros procedimientos excepto el VC1, como el MPEG-4AVC y el MPEG-2. En tal caso, una imagen BI del VC-1 corresponde a una imagen B cuyos macrobloques están todos intracodificados.
(Cuarta realización)
La FIG. 25 es un diagrama de bloques que muestra un aparato de codificación de imágenes según la cuarta realización.
El aparato de codificación de imágenes 400 según la cuarta realización incluye una unidad de estimación de movimiento 401, una unidad de compensación de movimiento 402, un sustractor 403, una unidad de transformación ortogonal 404, una unidad de cuantificación 405, una unidad de cuantificación inversa 406, una unidad de transformación ortogonal inversa 407, un sumador 408, una memoria de imagen 409, un conmutador 410, una unidad de codificación de longitud variable 412, y una unidad de generación de información de BI 413.
La unidad de estimación de movimiento 401 obtiene una señal de imagen Vin en unidades de macrobloques. Luego, la unidad de estimación de movimiento 401 busca imágenes decodificadas (imágenes de referencia) almacenadas en la memoria de imagen 409 y detecta un área de imagen que tiene la imagen más similar a un macrobloque indicado por la señal de imagen Vin. La unidad de estimación de movimiento 401 determina un vector de movimiento MV para indicar una ubicación del área de imagen y genera el vector de movimiento MV. La unidad de estimación de movimiento 401 además genera una información de especificación de imagen de referencia Ind para indicar la imagen decodificada usada para detectar el vector de movimiento MV.
La unidad de compensación de movimiento 402 recupera el área de imagen indicada por el vector de movimiento MV, de la imagen decodificada que está almacenada en la memoria de imagen 409 y es indicada por la información de especificación de imagen de referencia Ind, y luego genera la imagen recuperada como una imagen predicha.
La unidad de determinación de estructura de predicción 412 determina, basándose en una imagen de comienzo de RAU Uin, que existe una imagen que ha de ser codificada en una posición de comienzo de RAU, luego ordena a la unidad de estimación de movimiento 401 y a la unidad de compensación de movimiento 402 que codifiquen (codificación entre imágenes) la imagen como una imagen accesible aleatoriamente especial, y además ordena a la unidad de codificación de longitud variable 411 que codifique el tipo de imagen Pt. Más específicamente, la unidad de determinación de estructura de predicción 412 determina un tipo de imagen Pt, por ejemplo una imagen I, una imagen P, una imagen B, o una imagen BI, de cada imagen que ha de ser codificada que está incluida en la señal de imagen Vin.
Además, la unidad de determinación de estructura de predicción 412 determina información de tipo de grupo GT respecto a la RAU que ha de ser codificada, y hace que la unidad de codificación de longitud variable 411 codifique la información de tipo de grupo GT. El sustractor 403 obtiene la señal de imagen Vin y la imagen predicha, luego calcula un diferencial entre la señal de imagen Vin y la imagen predicha, y genera el diferencial para la unidad de transformación ortogonal 404. La unidad de transformación ortogonal 404 transforma el diferencial en un coeficiente de frecuencia, y genera el coeficiente de frecuencia dentro de la unidad de cuantificación 405. La unidad de cuantificación 405 cuantifica el coeficiente de frecuencia que es introducido desde la unidad de transformación ortogonal 404, y genera el valor de cuantificación resultante Qc dentro de la unidad de codificación de longitud variable 411.
La unidad de cuantificación inversa 406 cuantifica inversamente el valor de cuantificación Qc para restaurar el coeficiente de frecuencia original, y genera el coeficiente de frecuencia resultante para la unidad de transformación ortogonal inversa
407. La unidad de transformación ortogonal inversa 407 realiza transformación de frecuencia inversa sobre el coeficiente de frecuencia que ha de volver a ser transformado en un diferencial de píxeles, y genera el diferencial de píxeles para el sumador 408. El sumador 408 suma el diferencial de píxeles con la imagen predicha que es generada desde la unidad de compensación de movimiento 402, y genera una imagen decodificada. El conmutador 410 está encendido cuando se ordena que la imagen decodificada sea almacenada, y la imagen decodificada es almacenada dentro de la memoria de imagen 409.
La unidad de generación de información de BI 413 genera un mapa de RAU MIa que tiene sintaxis como la mostrada en la FIG. 9D o la FIG. 21, según el tipo de imagen Pt determinado por la unidad de determinación de estructura de predicción 412, y genera el mapa RAU MIa generado para la unidad de codificación de longitud variable 411.
La unidad de codificación de longitud variable 411 realiza codificación de longitud variable sobre el valor de cuantificación Qc, el tipo de imagen Pt, el mapa de RAU MIa, el vector de movimiento MV, y similares, para generar un flujo STR. Más específicamente, la unidad de codificación de longitud variable 411 escribe el mapa de RAU MIa generado por la unidad de generación de información de BI 413 dentro de datos de usuario colocados antes de cualquier imagen, como se muestra en la FIG. 8. Además, la unidad de codificación de longitud variable 411 aplica la codificación de longitud variable sobre la información de tipo de grupo GP, y añade la información de tipo de grupo codificada GP a una cabecera de punto de entrada de la RAU.
Como se describió anteriormente, el aparato de codificación de imágenes 400 según la cuarta realización se diferencia del aparato de codificación de imágenes convencional 800 en que se añade la unidad de generación de información de BI 413.
La FIG. 26 es un organigrama que muestra operaciones que son realizadas por el aparato de codificación de imágenes 400 según la cuarta realización.
En primer lugar, el aparato de codificación de imágenes 400 determina, usando la unidad de determinación de estructura de predicción 412, si una imagen que ha de ser codificada es o no una imagen inicial de una RAU (etapa S400). Aquí, sise hace la determinación de que la imagen es la imagen inicial de la RAU (SÍ en la etapa S400), el aparato de codificación de imágenes 400 realiza, usando la unidad de codificación de longitud variable 411, el procesamiento de inicialización para generar un mapa de RAU MIa, y obtiene un área para almacenar el mapa de RAU MIa en datos de usuario de una capa de punto de entrada (etapa S402).
Además, el aparato de codificación de imágenes 400 determina, usando la unidad de determinación de estructura de predicción 412, si la imagen que ha de ser codificada es o no una imagen BI (etapa S404). Aquí, si se hace ladeterminación de que la imagen ha de ser una imagen BI (SÍ en la etapa S404), entonces el aparato de codificación de imágenes 400 codifica la imagen que ha de ser codificada como una imagen BI (etapa S406). Esto significa que, cuando la RAU que ha de ser codificada es una RAU de tipo de GOP abierto en la que se permite que las imágenes hagan referencia a imágenes de otras unidades de acceso, el aparato de codificación de imágenes 400 codifica una imagen que ha de ser codificada generando así una imagen BI que está colocada en el orden de visualización antes de una imagen I inicial en la RAU del flujo STR y que no hace referencia a ninguna otra imagen. Por otra parte, si se hace la determinación de que la imagen no ha de ser una imagen BI (NO en la etapa S404), entonces el aparato de codificación de imágenes 400 codifica la imagen que ha de ser codificada como una imagen de un tipo de imagen diferente (etapa S408).
Luego, el dispositivo de codificación de imágenes 400, usando la unidad de generación de información de BI 413, genera y actualiza el mapa de RAU MIa basándose en el resultado de la determinación en la etapa S404 (etapa S410).
Por ejemplo, el aparato de codificación de imágenes 400 genera el mapa de RAU MIa que tiene sintaxis como se muestra en la FIG. 9D de manera que el mapa de RAU MIa puede incluir: información de tipo de imagen respecto a la imagen codificada en la etapa S406 o S408; información que indica si la imagen es codificada en una estructura de campo o en una estructura de marco; y similares. Como otro ejemplo, el aparato de codificación de imágenes 400 genera el mapa de RAU MIa como se muestra en la FIG. 21 de manera que el mapa de RAU MIa puede indicar claramente un indicador que indica si hay o no una o más imágenes BI consecutivas colocadas en el orden de visualización antes de la imagen I inicial, y el número de tales imágenes BI. En caso de crear el mapa de RAU MIa mostrado en la FIG. 21, el mapa de RAU puede ser terminado después de que se determina la codificación de una imagen I inicial de la RAU, en otras palabras, se determina la codificación de todas las imágenes BI que preceden en el orden de visualización a la imagen I inicial y siguen en el orden de decodificación a la imagen I inicial.
A continuación, el aparato de codificación de imágenes 400 determina si la imagen determinada en la etapa S404 es o no una última imagen en la RAU (etapa S412). En otras palabras, el aparato de codificación de imágenes 400 determina si el procesamiento se ha realizado o no para todas las imágenes que están incluidas en la RAU. Aquí, si se hace la determinación de que la imagen es una última imagen (SÍ en S412), entonces el aparato de codificación de imágenes 400 especifica y codifica el mapa de RAU MIa usando la unidad de codificación de longitud variable 411, y escribe el mapa de RAU MIa dentro del área obtenida en la etapa S402 (etapa S414).
Luego, el aparato de codificación de imágenes 400 determina si todavía hay o no imágenes que han de ser procesadas, entre las imágenes incluidas en el flujo STR (etapa S416). Aquí, si se hace la determinación de que todavía hay una imagen que ha de ser procesada (SÍ en la etapa S416), entonces el aparato de codificación de imágenes 400 repite las operaciones desde la etapa S400. Por otra parte, si se hace la determinación de que no se encuentra ninguna imagen que haya de ser procesada (NO en la etapa S416), entonces el aparato de codificación de imágenes 400 termina todas las operaciones de codificación.
Obsérvese que, en las operaciones de la FIG. 26, el área de almacenamiento de mapa de RAU se obtiene previamente, pero, por ejemplo, si hay una memoria suficiente para almacenar de manera intermedia datos como la RAU, los datos del mapa de RAU y los datos de imágenes pueden ser almacenados en la memoria y esos datos pueden ser escritos en los medios de almacenamiento después de determinar el mapa de RAU.
(Quinta realización)
Además, grabando un programa para llevar a cabo el aparato de codificación de imágenes y el aparato de decodificación de imágenes descritos en las realizaciones anteriores, en un medio de grabación, como un disco flexible, es posible implementar fácilmente el procesamiento descrito en las realizaciones anteriores mediante un sistema informático independiente.
Las FIGS. 27A, 27B y 27C son diagrama explicativos que muestran un caso en el que el aparato de codificación de imágenes y el aparato de decodificación de imágenes descritos en las realizaciones anteriores se llevan a cabo mediante un sistema informático, usando un programa que está grabado en un medio de grabación, como un disco flexible.
La FIG. 27B muestra una vista externa frontal del disco flexible, una estructura transversal del disco flexible, y un cuerpo del cuerpo del disco flexible. La FIG. 27A muestra un ejemplo de un formato físico del cuerpo del disco flexible que es un cuerpo principal del medio de grabación. El cuerpo del disco flexible FD está equipado en una caja F, y sobre una superficie del disco está formada una pluralidad de pistas Tr desde una circunferencia hacia una circunferencia interna en forma de círculos concéntricos, y cada pista está segmentada en dieciséis sectores Se en una dirección angular. Por lo tanto, respecto al disco flexible que almacena el programa anterior, el programa anterior es grabado en un área asignada en el cuerpo del disco flexible FD.
Además, la FIG. 27C muestra una estructura mediante la cual el cuerpo del disco flexible FD graba y reproduce el programa. Cuando el programa anterior para llevar a cabo el aparato de codificación de imágenes y el aparato de decodificación de imágenes es grabado sobre el cuerpo del disco flexible FD, el programa es escrito desde un sistema informático por medio de una unidad de disco flexible FDD. Además, cuando el procesamiento realizado por el aparato de codificación de imágenes y el aparato de decodificación de imágenes es estructurado en el sistema de programa en el disco flexible, el programa es leído del disco flexible por medio de la unidad de disco flexible, y transferido al sistema informático Cs.
Obsérvese que la explicación anterior ha descrito el uso del disco flexible como medio de grabación, pero es posible usar un disco óptico en su lugar. Obsérvese también que el medio de grabación no está limitad a los anteriores, sino que puede ser cualquier cosa que permita grabar el programa, como una tarjeta IC y un casete ROM.
Como se describió anteriormente, según la presente invención, el aparato de codificación de imágenes añade el mapa de RAU a la cabecera de la RAU, y el aparato de decodificación de imágenes hace referencia al mapa de RAU añadido antes de decodificar cada imagen, de manera que es posible reducir las operaciones de decodificación, y especialmente mejorar la calidad de reproducción de unos medios empaquetados, en los que una función de reproducción especial es crucial. Por lo tanto, la presente invención tiene un valor práctico elevado.
Como se describió anteriormente, la presente invención se ha descrito usando las realizaciones anteriores y las variaciones respectivas, pero la presente invención no está limitada a lo anterior. Esto significa que, para llevar a cabo la presente invención, una persona con experiencia normal en la materia puede combinar las realizaciones y variaciones anteriores, o puede combinar la presente invención con otras técnicas bien conocidas, siempre que la combinación sea razonable.
Obsérvese que cada bloque funcional mostrado en los diagramas de bloques (FIGS. 10 y 17, por ejemplo) se lleva a cabo como una integración a gran escala (LSI) que es un circuito integrado típico. Estos bloques funcionales pueden ser integrados por separado, o una parte o todos ellos pueden ser integrados en un solo chip (por ejemplo, los bloques funcionales excepto una memoria pueden ser integrados como un chip individual).
El circuito integrado puede denominarse un IC, un sistema LSI, un super LSI o un ultra LSI dependiendo de sus grados de integración.
La técnica de circuito integrado no está limitada al LSI, y puede implementarse como un circuito dedicado o un procesador de propósito general. También es posible usar una matriz de puertas programable in situ (FPGA) que puede programarse después de fabricar el LSI, o un procesador reconfigurable en el que puede configurarse la conexión y ajuste de células de circuitos dentro del LSI.
Además, si debido al progreso de las tecnologías de semiconductores o sus derivados, aparecen nuevas tecnologías para circuitos integrados para ser sustituidas por los LSIs, es posible, por supuesto, usar tales tecnologías para implementar los bloques funcionales adjuntos como un circuito integrado. Por ejemplo, la biotecnología, la tecnología de química orgánica, y similares pueden aplicarse al modo de realización anterior.
5 Obsérvese que, entre los bloques funcionales, sólo las unidades para almacenar datos que han de ser codificados o decodificados no están integradas dentro del chip, sino que se llevan a cabo como una función diferente.
Aplicabilidad industrial
10 El aparato de codificación de imágenes y el aparato de decodificación de imágenes según la presente invención pueden aplicarse, al reproducir el flujo VC-1 y similares, a todos los dispositivos que tienen una función de reproducción especial, como reproducción a alta velocidad, y son especialmente útiles para dispositivos periféricos de disco óptico en los que la función de reproducción especial es crítica.

Claims (7)

  1. REIVINDICACIONES
    1. Un aparato de codificación de imágenes (400) que genera una señal de imagen codificada codificando imágenes en unidades de acceso, incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho aparato de codificación de imágenes:
    una unidad de codificación (412) configurada para codificar una imagen que ha de ser codificada para generar una imagen independiente, en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
    estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
    en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen;
    una unidad de generación de información (413) configurada para generar información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y
    una unidad de escritura (411) configurada para escribir la información suplementaria generada por dicha unidad de generación de información (413) en la unidad de acceso de la señal de imagen codificada.
  2. 2.
    El aparato de codificación de imágenes (400) según la reivindicación 1,
    en el que dicha unidad de escritura (411) está configurada para escribir la información suplementaria en una posición anterior a cualquier imagen incluida en la unidad de acceso de la señal de imagen codificada.
  3. 3.
    Un procedimiento de codificación de imágenes de generación de una señal de imagen codificada codificando imágenes de unidades de acceso, incluyendo una unidad de acceso una o más imágenes, comprendiendo dicho procedimiento de codificación de imágenes:
    generar (S400, S402, S404, S406, S408) una imagen independiente codificando una imagen que ha de ser codificada,
    en el que la imagen independiente está colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
    estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
    en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen;
    generar (S410) de información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y
    (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada; y
    escribir (S414) la información suplementaria generada en dicha generación de la información suplementaria en la unidad de acceso de la señal de imagen codificada.
  4. 4. Un aparato de decodificación de imágenes que decodifica una señal de imagen codificada generada por el aparato de codificación de imágenes según la reivindicación 1, comprendiendo dicho aparato de decodificación de imágenes:
    una unidad de obtención de información (310) configurada para obtener la información suplementaria de la unidad de acceso;
    una unidad de extracción (309) configurada para extraer de la unidad de acceso una imagen que ha de ser decodificada haciendo referencia a la información suplementaria obtenida por dicha unidad de obtención de información; y
    una unidad de decodificación (302, 303, 304, 305, 308) configurada para decodificar la imagen extraída por dicha unidad de extracción.
  5. 5. Un procedimiento de decodificación de imágenes de decodificación de una señal de imagen codificada generada por el procedimiento de codificación de imágenes según la reivindicación 3, comprendiendo dicho procedimiento de decodificación de imágenes:
    obtener (S302) la información suplementaria de la unidad de acceso;
    extraer (S310) de la unidad de acceso una imagen que ha de ser decodificada haciendo referencia a la información suplementaria obtenida en dicha obtención; y decodificar la imagen extraída en dicha extracción.
  6. 6. Un medio de grabación en el que una señal de imagen codificada es grabada, generándose la señal de imagen codificada codificando imágenes en la unidad de acceso, incluyendo una o más imágenes,
    en el que la señal de imagen codificada incluye:
    una imagen independiente colocada, en la unidad de acceso de la señal de imagen codificada, en un orden de visualización antes de una imagen inicial,
    estando la imagen inicial colocada en un orden de decodificación como una primera imagen de la unidad de acceso, y
    en el que la imagen independiente además puede ser decodificada independientemente sin hacer referencia a ninguna otra imagen; e
    información suplementaria que indica (i) si la imagen independiente de la unidad de acceso de la señal de imagen codificada está colocada o no en el orden de visualización inmediatamente antes de la imagen inicial y (ii) en un orden de decodificación o en el orden de visualización un tipo de imagen de cada imagen incluida en la unidad de acceso de la señal de imagen codificada.
  7. 7. Un procedimiento de grabación de grabar una señal de imagen codificada en un medio de grabación, comprendiendo dicho procedimiento de grabación:
    el procedimiento de codificación de imágenes según la reivindicación 3; y
    la grabación en el medio de grabación de la señal de imagen codificada generada por el procedimiento de codificación de imágenes.
ES09179003T 2005-01-10 2006-01-06 Aparato de codificación de imágenes y aparato de decodificación de imágenes Active ES2410562T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US64214705P 2005-01-10 2005-01-10
US642147P 2005-01-10

Publications (1)

Publication Number Publication Date
ES2410562T3 true ES2410562T3 (es) 2013-07-02

Family

ID=36647876

Family Applications (2)

Application Number Title Priority Date Filing Date
ES09179003T Active ES2410562T3 (es) 2005-01-10 2006-01-06 Aparato de codificación de imágenes y aparato de decodificación de imágenes
ES06702551T Active ES2339587T3 (es) 2005-01-10 2006-01-06 Aparato de codificacion de imagenes y aparato de decodificacion de imagenes.

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES06702551T Active ES2339587T3 (es) 2005-01-10 2006-01-06 Aparato de codificacion de imagenes y aparato de decodificacion de imagenes.

Country Status (11)

Country Link
US (1) US9497483B2 (es)
EP (2) EP1839444B1 (es)
JP (1) JP4838251B2 (es)
KR (1) KR101240089B1 (es)
CN (1) CN100593336C (es)
DE (1) DE602006013272D1 (es)
ES (2) ES2410562T3 (es)
HK (1) HK1111031A1 (es)
MY (1) MY139897A (es)
TW (1) TWI380238B (es)
WO (1) WO2006073207A2 (es)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8155207B2 (en) * 2008-01-09 2012-04-10 Cisco Technology, Inc. Processing and managing pictures at the concatenation of two video streams
US8873932B2 (en) 2007-12-11 2014-10-28 Cisco Technology, Inc. Inferential processing to ascertain plural levels of picture interdependencies
CN101321284B (zh) * 2007-06-10 2012-01-04 华为技术有限公司 一种编解码方法、设备及***
US8886022B2 (en) 2008-06-12 2014-11-11 Cisco Technology, Inc. Picture interdependencies signals in context of MMCO to assist stream manipulation
US8699578B2 (en) 2008-06-17 2014-04-15 Cisco Technology, Inc. Methods and systems for processing multi-latticed video streams
US8971402B2 (en) 2008-06-17 2015-03-03 Cisco Technology, Inc. Processing of impaired and incomplete multi-latticed video streams
US8949883B2 (en) 2009-05-12 2015-02-03 Cisco Technology, Inc. Signalling buffer characteristics for splicing operations of video streams
US20130089152A1 (en) * 2011-10-05 2013-04-11 Qualcomm Incorporated Signaling picture identification for video coding
CA2850268A1 (en) 2011-10-14 2013-04-18 Open Text S.A. System and method for secure content sharing and synchronization
US9264717B2 (en) * 2011-10-31 2016-02-16 Qualcomm Incorporated Random access with advanced decoded picture buffer (DPB) management in video coding
JP6045222B2 (ja) * 2012-06-28 2016-12-14 株式会社Nttドコモ 動画像予測復号装置、方法及びプログラム
US9351011B2 (en) * 2012-11-28 2016-05-24 Intel Corporation Video pipeline with direct linkage between decoding and post processing
JP2017073798A (ja) * 2016-11-15 2017-04-13 株式会社Nttドコモ 動画像予測復号装置及び動画像予測復号方法
JP6665913B2 (ja) * 2018-10-17 2020-03-13 日本電気株式会社 映像解析装置、監視装置、監視システムおよび映像解析方法
KR102323174B1 (ko) 2019-10-22 2021-11-09 주식회사 브레인포커스 피부 트러블 개선용 화장료 조성물
JP6967653B2 (ja) * 2019-12-19 2021-11-17 株式会社Nttドコモ 動画像予測復号方法
JP2020043613A (ja) * 2019-12-19 2020-03-19 株式会社Nttドコモ 動画像予測復号方法
JP7026762B2 (ja) * 2020-12-23 2022-02-28 株式会社Nttドコモ 動画像予測復号方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5539466A (en) * 1991-07-30 1996-07-23 Sony Corporation Efficient coding apparatus for picture signal and decoding apparatus therefor
JP4061511B2 (ja) * 1997-04-15 2008-03-19 ソニー株式会社 符号化装置及び符号化方法
KR100357689B1 (ko) * 2000-11-13 2002-10-19 삼성전자 주식회사 일관된 화질을 가지는 실시간 가변 비트율 엠펙 비디오전송 시스템
US7068719B2 (en) * 2001-06-01 2006-06-27 General Instrument Corporation Splicing of digital video transport streams
CN1692654A (zh) * 2003-01-17 2005-11-02 松下电器产业株式会社 动态图像编码方法和动态图像解码方法
TWI220479B (en) * 2003-07-09 2004-08-21 Mediatek Inc Digital signal processor based on jumping floating point arithmetic
US8064520B2 (en) * 2003-09-07 2011-11-22 Microsoft Corporation Advanced bi-directional predictive coding of interlaced video
EP1968063B1 (en) 2004-04-28 2010-06-16 Panasonic Corporation Moving picture stream generation apparatus, moving picture coding apparatus, moving picture multiplexing apparatus and moving picture decoding apparatus
WO2006038716A1 (en) 2004-10-07 2006-04-13 Matsushita Electric Industrial Co., Ltd. Picture coding apparatus and picture decoding apparatus
JP2006157846A (ja) * 2004-10-29 2006-06-15 Matsushita Electric Ind Co Ltd 情報記録媒体、画像符号化方法、および画像復号方法

Also Published As

Publication number Publication date
EP1839444A2 (en) 2007-10-03
JP2008527762A (ja) 2008-07-24
TWI380238B (en) 2012-12-21
EP2164262A3 (en) 2011-09-21
MY139897A (en) 2009-11-30
US20090285284A1 (en) 2009-11-19
TW200630906A (en) 2006-09-01
EP2164262A2 (en) 2010-03-17
HK1111031A1 (en) 2008-07-25
WO2006073207B1 (en) 2007-08-16
ES2339587T3 (es) 2010-05-21
WO2006073207A3 (en) 2007-02-08
CN101103631A (zh) 2008-01-09
DE602006013272D1 (de) 2010-05-12
CN100593336C (zh) 2010-03-03
WO2006073207A2 (en) 2006-07-13
JP4838251B2 (ja) 2011-12-14
EP2164262B1 (en) 2013-03-20
KR101240089B1 (ko) 2013-03-06
EP1839444B1 (en) 2010-03-31
US9497483B2 (en) 2016-11-15
KR20070103374A (ko) 2007-10-23

Similar Documents

Publication Publication Date Title
ES2410562T3 (es) Aparato de codificación de imágenes y aparato de decodificación de imágenes
ES2400955T3 (es) Aparato de codificación de imágenes y aparato de decodificación de imágenes
ES2383654T3 (es) Aparato de generación de flujos de imágenes en movimiento, aparato de codificaicón de imágenes en movimiento, aparato multiplexador de imágenes en movimiento y aparato de descodificación de imágenes en movimiento
US7046910B2 (en) Methods and apparatus for transcoding progressive I-slice refreshed MPEG data streams to enable trick play mode features on a television appliance
US8050328B2 (en) Image decoding method
ES2356745T3 (es) Aparato de codificación de imagen y aparato de decodificación de imagen.
US20100086053A1 (en) Motion estimation device, motion estimation method, and motion estimation program
JPH10191324A (ja) 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
US20050141620A1 (en) Decoding apparatus and decoding method
JP3860319B2 (ja) 画像再生方法及び装置
JP2006157855A (ja) 情報記録媒体、画像符号化方法、および画像復号方法
JP2002232887A (ja) 画像符号化方法および画像符号化装置並びに画像復号化方法および画像復号化装置
JP3655115B2 (ja) 復号化装置
JP2000308054A (ja) 画像符号化方法および画像符号化装置並びに画像符号化プログラムを記録した記録媒体
JP2002232886A (ja) 画像符号化方法および画像符号化装置並びに画像復号化方法および画像復号化装置
JP2002165215A (ja) 画像復号化方法および画像復号化装置並びに画像復号化プログラムを記録した記録媒体