BR112015011910B1

BR112015011910B1 - Dispositivo e método de decodificação, dispositivo de codificação, e, mídia legível por computador

Info

Publication number: BR112015011910B1
Application number: BR112015011910-7A
Authority: BR
Inventors: Shinobu Hattori; Hiroaki Eto; Takumi Tsuru; Kenichi Kanai; Toshiya Hamada
Original assignee: Sony Corporation
Priority date: 2013-10-15
Filing date: 2014-10-07
Publication date: 2023-06-27

Abstract

DISPOSITIVO E MÉTODO DE DECODIFICAÇÃO, DISPOSITIVO DE CODIFICAÇÃO, E, MÍDIA LEGÍVEL POR COMPUTADOR É provido um dispositivo de decodificação incluindo conjunto de circuitos configurados para receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos de modo a gerar a imagem, em que a conversão usa uma função de joelho.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS

[001] Este pedido reivindica o benefício do Pedido de Patente de Prioridade Japonês JP 2013-215060 depositado em 15 de outubro de 2013, Pedido de Patente de Prioridade Japonês JP 2013-272945 depositado em 27 de dezembro de 2013, e Pedido de Patente de Prioridade Japonês JP 2014042174 depositado em 4 de março de 2014, os conteúdos inteiros de cada um de quais estão incorporados aqui por referência.

Campo Técnico

[002] A descrição presente relaciona-se a um dispositivo de decodificação e um método de decodificação, e um dispositivo de codificação e um método de codificação, e particularmente a um dispositivo de decodificação e um método de decodificação, e um dispositivo de codificação e um método de codificação capazes de converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

Fundamento da Invenção

[003] Em recentes anos, aparelhos que se conformam a um método tal como Grupo de Peritos de Quadros em Movimento (MPEG) foram espalhados amplamente para ambas de entrega de informação em estações de radiodifusão ou similar e recepção de informação em residências. MPEG comprime a informação de imagem por transformada ortogonal tal como transformada de coseno discreta e compensação de movimento usando redundância única para a informação de imagem.

[004] Particularmente, um método de MPEG2 (ISO/IEC 13818-2) está definido como uma método de codificação de imagem de uso geral, e é atualmente usado amplamente em aplicações extensas para uso profissional e uso de consumidor como um padrão cobrindo ambas uma imagem de varredura entrelaçada e uma imagem de varredura progressiva, e uma imagem de resolução padrão e uma imagem de alta definição. Pelo uso do método de MPEG2, é possível realizar uma alta relação de compressão e boa qualidade de imagem, por exemplo, nomeando uma taxa de bit de 4 Mbps a 8 Mbps para uma imagem de varredura entrelaçada de uma resolução padrão tendo 720 x 480 pixels e nomeando uma taxa de bit de 18 Mbps a 22 Mbps para uma imagem de varredura entrelaçada de uma alta resolução tendo 1920 x 1088 pixels.

[005] MPEG2 visou principalmente codificação de alta qualidade de imagem satisfatória para radiodifusão, mas não operou um método de codificação a uma taxa de bit mais baixa do que aquela em MPEG1, isso é, a uma relação de compressão mais alta. Com o uso amplo de terminais portáteis, o desejo para um tal método de codificação foi considerado aumentar, e assim um método de codificação de MPEG4 foi padronizado de modo a corresponder a isso. Em relação a um método de codificação de imagem de MPEG4, um padrão disso foi aprovado como um padrão internacional intitulado ISO/IEC 14496-2 em dezembro de 1998.

[006] Além disso, em recentes anos, padronização de um padrão chamado H.26L (ITU-T Q6/16 VCEG) progrediu para o propósito original de codificação de imagem para uso de videoconferência. H.26L usa uma quantidade de cálculo maior devido à codificação e decodificação do que o método de codificação da arte relacionada tal como MPEG2 ou MPEG4, mas é conhecido realizar eficiência de codificação mais alta.

[007] Adicionalmente, como parte de atividades de MPEG4, Modelo Conjunto de Codificação de Vídeo de Compressão Aprimorada está sendo padronizado atualmente a fim de realizar eficiência de codificação mais alta também incorporando funções que não são suportadas por H.26L, na base de H.26L. Como para o programa de padronização disso, o método de codificação se tornou um padrão internacional sob o nome de H.26L e MPEG-4 Parte 10 ((Codificação de Vídeo Avançada (AVC)) em março de 2003.

[008] Além disso, como uma extensão do método de AVC, Extensão de Gama de Fidelidade (FRExt) que inclui ferramentas de codificação para uso em negócio tal como RGB ou YUS422 e YUV444 e também inclui DCT 8x8 ou matriz de quantização definida em MPEG2 foi padronizada em fevereiro de 2005. Isto realiza um método de codificação no qual até mesmo ruído de filme incluído em um filme pode ser expresso favoravelmente usando o método de AVC, e assim conduz a uso para várias aplicações tal como um disco de Blu-ray (BD) (marca registrada).

[009] Porém, recentemente, houve demandas crescentes par codificação de relação de compressão mais alta, tal como uma demanda para compressão de uma imagem com cerca de 4000 x 2000 pixels, que é quatro vezes o tamanho de uma imagem de alta visão ou uma demanda para entrega de uma imagem de alta visão em circunstâncias de capacidade de transmissão limitadas tal como a Internet. Por esta razão, estudo de melhoria de eficiência de codificação está sendo executado atualmente no Grupo de Peritos de Codificação de Vídeo (VCEG) afiliado à ITU-T anterior.

[0010] Além disso, atualmente, para o propósito de melhoria em eficiência de codificação mais alta do que aquela de AVC, padronização de um método de codificação chamado Codificação de Vídeo de Alta Eficiência (HEVC) está em progresso por de Equipe de Colaboração Conjunta - Codificação de Vídeo (JCTVC), que é uma organização de padronização conjunta de ITU-T e ISO/IEC. NPL 1 foi publicado atualmente como uma minuta em agosto de 2013.

[0011] Enquanto isso, recentemente, com o progresso de técnicas, uma exibição de alta gama dinâmica (HDR) com a luminância máxima de 500 nit ou 1000 nit foi começada a ser vendida no mercado.

[0012] Em um caso onde uma exibição de gama dinâmica padrão (SDR) e uma exibição de HDR estão misturadas, é necessário codificar cada uma de uma imagem de SDR e uma imagem de HDR no método de AVC ou no método de HEVC, e assim uma quantidade de dados aumenta. Portanto, um método é considerado no qual a imagem de SDR e a imagem de HDR são codificadas, e então uma gama dinâmica é convertida depois que decodificação é executada como necessário, por esse meio gerando a outra. Lista de Citação Literatura Não Patente NPL 1 Benjamim Bross, Gary J. Sullivan, Ye-Kui Wang, "Editors' proposed corrections to HEVC version 1", JCTVC-M0432_v3, 18-4/26/4/2013.

Resumo Problema Técnico

[0013] Porém, conversão em uma imagem que é planejada por um produtor não é considerada quando conversão de uma gama dinâmica é convertida.

[0014] É desejável converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

Solução para o Problema

[0015] De acordo com uma modalidade da descrição presente, é provido um dispositivo de decodificação incluindo: conjunto de circuitos configurados para receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos de modo a gerar a imagem, em que a conversão usa uma função de joelho.

[0016] Um método de decodificação de fazer um dispositivo de decodificação executar: receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos de modo a gerar a imagem, em que a conversão usa uma função de joelho.

[0017] Um dispositivo de codificação incluindo: conjunto de circuitos configurados para estabelecer informação de conversão pertencendo a uma conversão de gama dinâmica de uma luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; e codificar a imagem tendo luminância na primeira gama dinâmica de modo a gerar dados codificados, em que a conversão usa uma função de joelho.

[0018] Um meio legível por computador não transitório tendo armazenado nele dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica, em que um dispositivo de decodificação decodifica dados codificados, gera a imagem baseada nos dados decodificados, e converte a gama dinâmica baseada na informação de conversão incluindo um cotovelo.

[0019] De acordo com uma modalidade da descrição presente, é provido um dispositivo de decodificação incluindo uma unidade de extração que extrai dados codificados e informação de conversão de um fluxo codificado incluindo os dados codificados de uma primeira imagem, que é uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão relativa à conversão de uma gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e uma unidade de decodificação que decodifica os dados codificados extraídos pela unidade de extração de modo a gerar a primeira imagem.

[0020] Um método de decodificação de acordo com uma modalidade da descrição presente corresponde ao dispositivo de decodificação de acordo com a modalidade da descrição presente.

[0021] De acordo com uma modalidade da descrição presente, dados codificados e informação de conversão são extraídos de um fluxo codificado incluindo os dados codificados de uma primeira imagem, que é uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão, que é informação relativa à conversão de uma gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica, e os dados codificados extraídos são decodificados de forma que a primeira imagem seja gerada.

[0022] De acordo com outra modalidade da descrição presente, é provido um dispositivo de codificação incluindo uma unidade de estabelecimento que estabelece informação de conversão, que é informação relativa à conversão de uma gama dinâmica de luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; uma unidade de codificação que codifica uma primeira imagem, que é a imagem tendo luminância na primeira gama dinâmica de modo a gerar dados codificados; e uma unidade de transmissão que transmite um fluxo codificado incluindo a informação de conversão estabelecida pela unidade de estabelecimento e os dados codificados da primeira imagem gerada pela unidade de codificação.

[0023] Um método de codificação de outra modalidade da descrição presente corresponde ao dispositivo de codificação de acordo com outra modalidade da descrição presente.

[0024] De acordo com uma modalidade da descrição presente, informação de conversão é estabelecida, que é informação relativa à conversão de uma gama dinâmica de luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica, uma primeira imagem que é a imagem tendo luminância na primeira gama dinâmica é codificada de forma que dados codificados sejam gerados, e um fluxo codificado incluindo a informação de conversão e os dados codificados da primeira imagem é transmitido.

[0025] Além disso, o dispositivo de decodificação e o dispositivo de codificação de acordo com as concretizações podem ser implementados executando um programa em um computador.

[0026] Adicionalmente, o programa executado no computador a fim de implementar o dispositivo de decodificação e o dispositivo de codificação de acordo com uma modalidade pode ser provido transmitindo o programa por um meio de transmissão ou gravando o programa em um meio de gravação.

[0027] O dispositivo de decodificação e o dispositivo de codificação de acordo com concretizações podem ser dispositivos independentes, e podem ser um bloco interno formando um único aparelho.

Efeitos Vantajosos da Invenção

[0028] De acordo com uma modalidade da descrição presente, é possível decodificar dados codificados de uma imagem. Além disso, de acordo com a modalidade da descrição presente, é possível converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

[0029] De acordo com outra modalidade da descrição presente, é possível codificar uma imagem. Além disso, de acordo com outra modalidade da descrição presente, é possível codificar uma imagem de forma que uma imagem decodificada possa ser convertida em uma imagem desejada com uma gama dinâmica diferente durante decodificação.

[0030] Além disso, os efeitos descritos aqui não estão limitados necessariamente, e pode haver qualquer um dos efeitos descritos na descrição presente.

Breve Descrição dos Desenhos

[0031] Figura 1 é um diagrama ilustrando uma imagem de SDR.

[0032] Figura 2 é um diagrama ilustrando uma imagem de HDR.

[0033] Figura 3 é um diagrama ilustrando um panorama de codificação em uma modalidade da descrição presente.

[0034] Figura 4 é um diagrama ilustrando um panorama de decodificação em uma modalidade da descrição presente.

[0035] Figura 5 é um diagrama ilustrando descompressão de joelho.

[0036] Figura 6 é um diagrama de bloco ilustrando um exemplo de configuração de uma modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[0037] Figura 7 é um diagrama ilustrando um exemplo de sintaxe de knee_function_info SEI.

[0038] Figura 8 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 7.

[0039] Figura 9 é um diagrama ilustrando um exemplo de informação de conversão estabelecida na knee_function_info SEI.

[0040] Figura 10 é um diagrama ilustrando um exemplo de informação de conversão estabelecida na knee_function_info SEI.

[0041] Figura 11 é um fluxograma ilustrando um processo de geração de fluxo executado pelo dispositivo de codificação.

[0042] Figura 12 é um diagrama de bloco ilustrando um exemplo de configuração de uma modalidade de um dispositivo de decodificação ao qual a descrição presente é aplicada.

[0043] Figura 13 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação da Figura 12.

[0044] Figura 14 é um diagrama ilustrando outro exemplo de sintaxe da knee_function_info SEI.

[0045] Figura 15 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 14.

[0046] Figura 16 é um diagrama de bloco ilustrando um exemplo de configuração de uma primeira modalidade de um dispositivo de codificação ao qual uma modalidade da descrição presente é aplicada.

[0047] Figura 17 é um diagrama ilustrando um primeiro exemplo de sintaxe de knee_function_info SEI estabelecido por uma unidade de estabelecimento da Figura 16.

[0048] Figura 18 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 17.

[0049] Figura 19 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 17.

[0050] Figura 20 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 17.

[0051] Figura 21 é um fluxograma ilustrando um processo de geração de fluxo executado pelo dispositivo de codificação da Figura 16.

[0052] Figura 22 é um diagrama de bloco ilustrando um exemplo de configuração de uma segunda modalidade de um dispositivo de decodificação ao qual a descrição presente é aplicada.

[0053] Figura 23 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação da Figura 22.

[0054] Figura 24 é um diagrama ilustrando outro exemplo de informação de conversão de DR da Figura 17.

[0055] Figura 25 é um diagrama ainda ilustrando ainda outro exemplo de informação de conversão de DR da Figura 17.

[0056] Figura 26 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI incluindo a DR informação de conversão da Figura 17.

[0057] Figura 27 é um diagrama ilustrando outro exemplo de sintaxe de tone_mapping_info_SEI incluindo a informação de conversão de DR da Figura 17.

[0058] Figura 28 é um diagrama ilustrando um segundo exemplo de sintaxe de knee_function_info SEI estabelecido pela unidade de estabelecimento da Figura 16.

[0059] Figura 29 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 28.

[0060] Figura 30 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 28.

[0061] Figura 31 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 28.

[0062] Figura 32 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI incluindo a informação de conversão de DR da Figura 28.

[0063] Figura 33 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 28 em um caso onde o número de cotovelos está restringido.

[0064] Figura 34 é um diagrama ilustrando um exemplo da knee_function_info SEI da Figura 28 em um caso onde o número de cotovelos está restringido.

[0065] Figura 35 é um diagrama ilustrando um exemplo da tone_mapping_info_SEI da Figura 32 em um caso onde o número de cotovelos está restringido.

[0066] Figura 36 é um diagrama ilustrando um terceiro exemplo de sintaxe de knee_function_info SEI estabelecido pela unidade de estabelecimento da Figura 16.

[0067] Figura 37 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 36.

[0068] Figura 38 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 36.

[0069] Figura 39 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI incluindo a informação de conversão de DR da Figura 36.

[0070] Figura 40 é um diagrama ilustrando um quarto exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento da Figura 16.

[0071] Figura 41 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 40.

[0072] Figura 42 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 40.

[0073] Figura 43 é um diagrama ilustrando um exemplo de informação de conversão de DR da Figura 40.

[0074] Figura 44 é um diagrama ilustrando uma operação do dispositivo de decodificação em um caso onde a knee_function_info SEI da Figura 40 está estabelecida em uma pluralidade.

[0075] Figura 45 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI incluindo a informação de conversão de DR da Figura 40.

[0076] Figura 46 é um diagrama ilustrando uma caixa de MP4 na qual informação de conversão de DR está disposta.

[0077] Figura 47 é um diagrama ilustrando um exemplo de sintaxe de ToneMapInfo.

[0078] Figura 48 é um diagrama ilustrando que semântica em uma primeira configuração de uma terceira modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada é diferente daquela na segunda modalidade.

[0079] Figura 49 é um diagrama de bloco ilustrando um primeiro exemplo de configuração de uma modalidade de um sistema de decodificação ao qual a descrição presente é aplicada.

[0080] Figura 50A é um diagrama ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida por knee_function_info SEI que é recebida pelo sistema de decodificação da Figura 49.

[0081] Figura 50B é um diagrama ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida por knee_function_info SEI que é recebida pelo sistema de decodificação da Figura 49.

[0082] Figura 51 é um diagrama ilustrando um exemplo de uma função aproximada da conversão de joelho da Figura 50.

[0083] Figura 52 é um diagrama ilustrando um exemplo de uma função aproximada da conversão de joelho da Figura 50.

[0084] Figura 53 é um fluxograma ilustrando um processo de decodificação executado pelo dispositivo de decodificação da Figura 49.

[0085] Figura 54 é um fluxograma ilustrando um processo de exibição executado por um dispositivo de exibição da Figura 49.

[0086] Figura 55 é um diagrama ilustrando um exemplo de sintaxe de knee_function_info SEI em uma segunda configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada.

[0087] Figura 56 é um diagrama ilustrando uma diferença em semântica da Figura 55 da segunda modalidade.

[0088] Figura 57A é um diagrama ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida por knee_function_info SEI da Figura 55.

[0089] Figura 57B é um diagrama ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida por knee_function_info SEI da Figura 55.

[0090] Figura 58 é um diagrama ilustrando um exemplo de uma função aproximada da conversão de joelho da Figura 57.

[0091] Figura 59 é um diagrama ilustrando um exemplo de uma função aproximada da conversão de joelho da Figura 57.

[0092] Figura 60 é um diagrama ilustrando um exemplo de sintaxe de approximate_knee_function_info SEI.

[0093] Figura 61 é um diagrama ilustrando uma relação entre um sinal elétrico de entrada e luminância de exibição de um CRT.

[0094] Figura 62 é um diagrama ilustrando um sinal elétrico que é proporcional à luminância.

[0095] Figura 63 é um diagrama ilustrando uma relação entre um sinal elétrico de entrada e luminância de exibição.

[0096] Figura 64 é um diagrama ilustrando uma função com uma característica contrária a uma função da Figura 61.

[0097] Figura 65 é um diagrama ilustrando um exemplo de um fluxo de um processo até que uma imagem seja exibida de captura da imagem.

[0098] Figura 66 é um diagrama ilustrando OETF para uso em uma imagem de SDR.

[0099] Figura 67 é um diagrama ilustrando OETF para uso em uma imagem de HDR.

[00100] Figura 68 é um diagrama ilustrando uma panorama de um processo de conversão fotoelétrica em uma quarta modalidade.

[00101] Figura 69 é um diagrama ilustrando uma panorama de uma conversão eletro-óptica na quarta modalidade.

[00102] Figura 70 é um diagrama de bloco ilustrando um exemplo de configuração da quarta modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[00103] Figura 71 é um fluxograma ilustrando um processo de geração de fluxo executado pelo dispositivo de codificação da Figura 70.

[00104] Figura 72 é um diagrama de bloco ilustrando um exemplo de configuração da quarta modalidade de um dispositivo de decodificação ao qual a descrição presente é aplicada.

[00105] Figura 73 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação da Figura 72.

[00106] Figura 74 é um diagrama de bloco ilustrando um exemplo de configuração de hardware de um computador.

[00107] Figura 75 é um diagrama ilustrando um exemplo de um método de codificação de imagem de múltiplos pontos de vista.

[00108] Figura 76 é um diagrama ilustrando um exemplo de configuração de um dispositivo de codificação de imagem de multi-visão ao qual a descrição presente é aplicada.

[00109] Figura 77 é um diagrama ilustrando um exemplo de configuração de um dispositivo de decodificação de imagem de multi-visão ao qual a descrição presente é aplicada.

[00110] Figura 78 é um diagrama ilustrando um exemplo de um método de codificação de imagem de camada.

[00111] Figura 79 é um diagrama ilustrando um exemplo de codificação graduável espacialmente.

[00112] Figura 80 é um diagrama ilustrando um exemplo de uma codificação graduável temporalmente.

[00113] Figura 81 é um diagrama ilustrando um exemplo de codificação graduável de uma relação de S/N.

[00114] Figura 82 é um diagrama ilustrando um exemplo de configuração de um dispositivo de codificação de imagem de camada ao qual a descrição presente é aplicada.

[00115] Figura 83 é um diagrama ilustrando um exemplo de configuração de um dispositivo de decodificação de imagem de camada ao qual a descrição presente é aplicada.

[00116] Figura 84 é um diagrama de bloco ilustrando um exemplo de configuração esquemática de um aparelho de televisão ao qual a descrição presente é aplicada.

[00117] Figura 85 é um diagrama de bloco ilustrando um exemplo de configuração esquemática de um telefone móvel ao qual a descrição presente é aplicada.

[00118] Figura 86 é um diagrama de bloco ilustrando um exemplo de configuração esquemática de um aparelho de gravação/reprodução ao qual a descrição presente é aplicada.

[00119] Figura 87 é um diagrama de bloco ilustrando um exemplo de configuração esquemática de um aparelho de formação de imagem ao qual a descrição presente é aplicada.

[00120] Figura 88 é um diagrama de bloco ilustrando um exemplo de usar codificação graduável.

[00121] Figura 89 é um diagrama de bloco ilustrando outro exemplo de usar codificação graduável.

[00122] Figura 90 é um diagrama de bloco ilustrando ainda outro exemplo de usar codificação graduável.

[00123] Figura 91 é um diagrama ilustrando um exemplo de configuração esquemática de um aparelho de vídeo ao qual a descrição presente é aplicada.

[00124] Figura 92 é um diagrama ilustrando um exemplo de configuração esquemática de um processador de vídeo ao qual a descrição presente é aplicada.

[00125] Figura 93 é um diagrama ilustrando outro exemplo de configuração esquemática de um processador de vídeo ao qual a descrição presente é aplicada.

Descrição das Concretizações Base da Descrição Presente Descrição de Imagem de SDR

[00126] Figura 1 é um diagrama ilustrando uma imagem de SDR.

[00127] Como ilustrado na Figura 1, uma imagem de SDR é, por exemplo, uma imagem cuja qualidade de imagem é ajustada de modo a corresponder a um dispositivo de exibição com a luminância máxima de 100 nit (candela por metro quadrado). Desde que a luminância máxima no sistema natural alcança 20000 nit ou mais em alguns casos, na imagem de SDR, uma gama dinâmica de brilho está grandemente comprimida.

Descrição de Imagem de HDR

[00128] A Figura 2 é um diagrama ilustrando uma imagem de HDR.

[00129] Como ilustrado na Figura 2, uma imagem de HDR é uma imagem na qual uma gama dinâmica de luminância é maior que 0 a 100%. Na especificação presente, a menos que caso contrário descrito, uma gama dinâmica de uma luminância da imagem de HDR é 0 a 400%. Por exemplo, como ilustrado na Figura 2, em um caso onde uma imagem de HDR na qual uma gama dinâmica de luminância é 0 a 800% (800 nit) está codificada, e é gravada em um disco de Blu-ray (marca registrada) (BD) ou similar, informação de atributo indicando a luminância também é gravada junto com a imagem de HDR. Além disso, a informação de atributo é entrada a um dispositivo de exibição junto com uma imagem de HDR decodificada, e a imagem de HDR é exibida como uma imagem na qual uma gama dinâmica de luminância é 0 a 800%.

[00130] Adicionalmente, em um caso onde a luminância máxima do dispositivo de exibição é 1000 nit, por exemplo, luminância de uma imagem de HDR é graduada a 1000 nit e é exibida. Até mesmo em um caso em onde a graduação é executada deste modo, uma imagem de HDR tem uma gama dinâmica de luminância de 0 a 800%, e assim deterioração de qualidade de imagem disso devido à graduação é menor que aquela de uma imagem de SDR.

Primeira Modalidade Panorama de Codificação na Primeira Modalidade

[00131] A Figura 3 é um diagrama ilustrando uma panorama de codificação em uma primeira modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[00132] Na Figura 3, o eixo transversal expressa um valor de luminância (valor de código de entrada), e o eixo longitudinal expressa luminância (nível de vídeo de saída). Além disso, o valor de luminância do eixo transversal da Figura 3 é um valor obtido estabelecendo o número de bits do valor de luminância a 10 bits e estabelecendo luminância de branco tendo sofrida conversão de joelho a 100%, mas um valor de luminância convertida em luminância na prática é um valor que é normalizado a 0 ou mais e 1 ou menos. Isto também é o mesmo para a Figura 5 descrita mais tarde.

[00133] Como ilustrado na Figura 3, na primeira modalidade, 80% a 400% de uma imagem de HDR na qual uma gama dinâmica de luminância é 0 a 400% é comprimido em joelho a 80% a 100%, de forma que uma imagem de SDR na qual uma gama dinâmica de luminância é 0 a 100% seja gerada e é então codificada.

Panorama de Decodificação na Primeira Modalidade

[00134] A Figura 4 é um diagrama ilustrando uma panorama de decodificação na primeira modalidade de um dispositivo de decodificação ao qual a descrição presente é aplicada.

[00135] Como ilustrado na Figura 4, na primeira modalidade, dados codificados da imagem de SDR na qual uma gama dinâmica de luminância é 0 a 100%, gerados como descrito na Figura 3, são decodificados. Em um caso onde uma unidade de vídeo é uma exibição de SDR, a imagem de SDR que é obtida como resultado da decodificação é entrada e é exibida na unidade de exibição sem mudança. Por outro lado, em um caso onde a unidade de exibição é uma exibição de HDR, a imagem de SDR obtida como resultado da decodificação é graduada a uma imagem de HDR, e é entrada e é exibida na unidade de exibição.

[00136] Especificamente, como ilustrado na Figura 5, 80% a 100% da imagem de SDR na qual uma gama dinâmica de luminância é descomprimida em joelho 0 a 100% a 80% a 400%, e assim uma imagem de HDR na qual uma gama dinâmica de luminância é 0 a 400% é gerada. Além disso, a imagem de HDR gerada é exibida.

[00137] Além disso, neste momento, a fim de gerar uma imagem de HDR desejada, informação relativa à conversão de uma imagem de SDR na imagem de HDR desejada, tal como uma gama (80% a 100% no exemplo da Figura 5) de luminância de uma imagem de SDR que é descomprimida em joelho, e uma gama (80% a 400% no exemplo da Figura 5) de luminância de uma imagem de HDR correspondendo à gama, é necessária. Portanto, na primeira modalidade, informação de conversão relativa à conversão de uma imagem de SDR em uma imagem de HDR é transmitida do dispositivo de codificação para o dispositivo de decodificação, e assim uma imagem de HDR desejada pode ser gerada de uma imagem de SDR decodificada no dispositivo de decodificação.

Exemplo de Configuração da Primeira Modalidade de Dispositivo de Codificação

[00138] A Figura 6 é um diagrama de bloco ilustrando um exemplo de configuração da primeira modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[00139] Um dispositivo de codificação 10 da Figura 6 inclui uma unidade de estabelecimento 11, uma unidade de codificação 12, uma unidade de transmissão 13 e uma unidade de conversão 14, e codifica uma imagem de SDR que é convertida de uma imagem de HDR em um método se conformando ao método de HEVC.

[00140] Especificamente, a unidade de estabelecimento 11 do dispositivo de codificação 10 estabelece um conjunto de parâmetros de seqüência (SPS), um conjunto de parâmetros de quadro (PPS), VUI, e similar. Além disso, a unidade de estabelecimento 11 estabelece Informação de Aprimoramento Suplementar (SEI) knee_function_info incluindo informação de conversão em resposta a um comando de um usuário (produtor). A unidade de estabelecimento 11 provê os jogos de parâmetros incluindo o SPS, PPS, VUI, knee_function_info SEI, e similar estabelecidos à unidade de codificação 12.

[00141] A unidade de codificação 12 codifica a imagem de SDR provida da unidade de conversão 14 no método de HEVC. A unidade de codificação 12 gera um fluxo codificado de dados codificados que são obtidos como resultado da codificação e os conjuntos de parâmetros que são providos da unidade de estabelecimento 11, e transmite o fluxo codificado gerado à unidade de transmissão 13.

[00142] A unidade de transmissão 13 transmite o fluxo codificado provido da unidade de codificação 12 para um dispositivo de decodificação descrito mais tarde. Além disso, a unidade de transmissão 13 pode transmitir o fluxo codificado para um dispositivo de gravação que grava o fluxo codificado em um meio de gravação tal como um BD. Neste caso, o fluxo codificado é transmitido para o dispositivo de decodificação pelo meio de gravação.

[00143] A unidade de conversão 14 converte uma imagem de HDR entrada de um dispositivo externo em uma imagem de SDR por compressão de joelho, e provê a imagem de SDR para a unidade de codificação 12.

Exemplo de Sintaxe de knee_function_info SEI

[00144] A Figura 7 é um diagrama ilustrando um exemplo de sintaxe de knee_function_info SEI, e Figura 8 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 7.

[00145] Como ilustrado na Figura 7, informação de posição de joelho de entrada (knee_point_of_input), informação de posição de joelho de saída (knee_point_of_input), informação de gama de luminância de saída (output_white_level_range), informação de luminância de saída (output_white_level_range_luminace), e similar são estabelecidas na knee_function_info SEI como informação de conversão.

[00146] A informação de posição de joelho de entrada é informação indicando o valor mínimo (cotovelo) de luminância que é descompressão de joelho de uma imagem de SDR que é uma imagem não convertida. A informação de posição de joelho de entrada é uma 'permillage' de um cotovelo quando o valor máximo de luminância de uma imagem de SDR é estabelecido a 1000 permil.

[00147] A informação de posição de joelho de saída é informação indicando a luminância de uma imagem de HDR que é uma imagem convertida, correspondendo ao valor mínimo (cotovelo) de luminância, que é um objetivo de descompressão de joelho de uma imagem de SDR que é uma imagem não convertida. A informação de posição de joelho de saída é uma 'permillage' de luminância correspondendo a um cotovelo quando o valor máximo de luminância de uma imagem de HDR é estabelecido a 1000 permil.

[00148] A informação de gama de luminância de saída é informação indicando luminância de branco de uma imagem de HDR que é uma imagem convertida. Além disso, a informação de luminância de saída é informação indicando brilho (luminância) da unidade de exibição, correspondendo a branco da imagem de HDR que é uma imagem convertida.

Exemplo de Informação de Conversão

[00149] As Figuras 9 e 10 são diagramas ilustrando exemplos de informação de conversão estabelecida na knee_function_info SEI.

[00150] No exemplo da Figura 9, o usuário estabelece uma imagem de HDR que é obtida como resultado de descomprimir em joelho 80% a 100% de luminância de uma imagem de SDR a 80% a 400% é usada como uma imagem de HDR desejada. Neste caso, na knee_function_info SEI, 800 como a informação de posição de joelho de entrada (knee_point_of_input), e 200 é estabelecido como a informação de posição de joelho de saída (knee_point_of_output).

[00151] Portanto, um dispositivo de decodificação descrito mais tarde pode descomprimir em joelho 80% a 100% de luminância de uma imagem de SDR que é obtida como resultado de decodificar a 80% a 400% na base da informação de posição de joelho de entrada e da informação de posição de joelho de saída. Como resultado, o dispositivo de decodificação pode converter a imagem de SDR obtida como resultado da decodificação em uma imagem de HDR desejada.

[00152] Além disso, no exemplo da Figura 9, a informação de gama de luminância de saída (output_white_level_range) é 400, e a informação de luminância de saída (output_white_level_range_luminace) é 800 (candela por metro quadrado).

[00153] No exemplo da Figura 10, o usuário estabelece uma imagem de HDR que é obtida como resultado de descomprimir em joelho 80% a 100% de luminância de uma imagem de SDR a 100% a 400% como uma imagem de HDR desejada. Neste caso, na knee_function_info SEI, 800 é estabelecido como a informação de posição de joelho de entrada (knee_point_of_input), e 200 é estabelecido como a informação de posição de joelho de saída (knee_point_of_output).

[00154] Portanto, o dispositivo de decodificação descrito mais tarde pode descomprimir em joelho 80% a 100% de luminância de uma imagem de SDR que é obtida como resultado de decodificar a 100% a 400% na base da informação de posição de joelho de entrada e da informação de posição de joelho de saída. Como resultado, o dispositivo de decodificação pode converter a imagem de SDR obtida como resultado da decodificação em uma imagem de HDR desejada.

[00155] Além disso, no exemplo da Figura 10, a informação de gama de luminância de saída (output_white_level_range) é 400, e a informação de luminância de saída (output_white_level_range_luminace) é 800 (candela por metro quadrado).

Descrição do Processo no Dispositivo de Codificação

[00156] A Figura 11 é um fluxograma ilustrando um processo de geração de fluxo executado pelo dispositivo de codificação 10.

[00157] Na etapa S10 da Figura 11, a unidade de conversão 14 do dispositivo de codificação 10 converte uma imagem de HDR que é entrada de um dispositivo externo, em uma imagem de SDR que é então provida à unidade de codificação 12.

[00158] Na etapa S11, a unidade de estabelecimento 11 estabelece um SPS. Na etapa S12, a unidade de estabelecimento 11 estabelece VUI. Na etapa S13, a unidade de estabelecimento 11 estabelece um PPS.

[00159] Na etapa S14, a unidade de estabelecimento 11 estabelece knee_function_info SEI em resposta a uma instrução ou similar de um usuário. A unidade de estabelecimento 11 provê os conjuntos de parâmetros incluindo o SPS, PPS, VUI, knee_function_info SEI, e similar estabelecidos à unidade de codificação 12.

[00160] Na etapa S15, a unidade de codificação 12 codifica a imagem de SDR provida da unidade de conversão 14 no método de HEVC. Na etapa S16, a unidade de codificação 12 gera um fluxo codificado de dados codificados que são obtidos como resultado da codificação e os conjuntos de parâmetros que são providos da unidade de estabelecimento 11, e transmite o fluxo codificado gerado para a unidade de transmissão 13.

[00161] Na etapa S17, a unidade de transmissão 13 transmite o fluxo codificado provido da unidade de codificação 12 para o dispositivo de decodificação descrito mais tarde, e então termina o processo.

[00162] Como mencionado acima, o dispositivo de codificação 10 estabelece e transmite knee_function_info SEI incluindo informação de conversão, e assim o dispositivo de decodificação descrito mais tarde pode converter uma imagem de SDR obtida como resultado de decodificação em uma imagem de HDR desejada na base da informação de conversão. Portanto, pode ser dito que o dispositivo de codificação 10 pode codificar uma imagem de SDR de forma que uma imagem de SDR decodificada possa ser convertida em uma imagem de HDR desejada durante decodificação.

[00163] Além disso, desde que a informação de conversão é estabelecida, o dispositivo de codificação 10 pode gerar um fluxo codificado de uma imagem correspondendo a uma exibição de HDR e uma exibição de SDR só codificando uma imagem de SDR. Portanto, é possível adicionalmente reduzir uma quantidade de dados de um fluxo codificado do que em um caso de codificar ambas uma imagem de HDR e uma imagem de SDR.

Exemplo de Configuração da Primeira Modalidade de Dispositivo de Decodificação

[00164] A Figura 12 é um diagrama de bloco ilustrando um exemplo de configuração de uma modalidade de um dispositivo de decodificação que decodifica um fluxo codificado transmitido do dispositivo de codificação 10 da Figura 6 e ao qual a descrição presente é aplicada.

[00165] Um dispositivo de decodificação 50 da Figura 12 inclui uma unidade de recepção 51, uma unidade de extração 52, uma unidade de decodificação 53, uma unidade de conversão 54, uma unidade de controle de exibição 55 e uma unidade de exibição 56.

[00166] A unidade de recepção 51 do dispositivo de decodificação 50 recebe o fluxo codificado transmitido da dispositivo de codificação 10 da Figura 6, e provê o fluxo codificado para a unidade de extração 52.

[00167] A unidade de extração 52 extrai os conjuntos de parâmetros e os dados codificados da imagem de SDR do fluxo codificado que é provido da unidade de recepção 51. A unidade de extração 52 provê os conjuntos de parâmetros e os dados codificados para a unidade de decodificação 53. Além disso, a unidade de extração 52 provê a knee_function_info SEI entre os conjuntos de parâmetros, para a unidade de conversão 54.

[00168] A unidade de decodificação 53 decodifica os dados codificados da imagem de SDR providos da unidade de extração 52 no método de HEVC. Neste momento, a unidade de decodificação 53 também se refere aos conjuntos de parâmetros providos da unidade de extração 52, como necessário. A unidade de decodificação 53 provê a imagem de SDR que é obtida como resultado de decodificação à unidade de conversão 54.

[00169] A unidade de conversão 54 converte a imagem de SDR provida da unidade de decodificação 53 em uma imagem de HDR por descompressão de joelho na base da informação de conversão incluída na knee_function_info SEI provida da unidade de extração 52, e provê a imagem de HDR para a unidade de controle de exibição 55.

[00170] A unidade de controle de exibição 55 exibe a imagem de HDR provida da unidade de conversão 54 na unidade de exibição 56. A unidade de exibição 56 é uma exibição de HDR.

Descrição do Processo de Dispositivo de Decodificação

[00171] A Figura 13 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação 50 da Figura 12.

[00172] Na etapa S51 da Figura 13, a unidade de recepção 51 do dispositivo de decodificação 50 recebe o fluxo codificado transmitido do dispositivo de codificação 10 da Figura 6, e provê o fluxo codificado para a unidade de extração 52.

[00173] Na etapa S52, a unidade de extração 52 extrai os conjuntos de parâmetros e os dados codificados da imagem de SDR do fluxo codificado que é provido da unidade de recepção 51. A unidade de extração 52 provê os conjuntos de parâmetros e os dados codificados da imagem de SDR para a unidade de decodificação 53. Além disso, a unidade de extração 52 provê a knee_function_info SEI entre os conjuntos de parâmetros, para a unidade de conversão 54.

[00174] Na etapa S53, a unidade de decodificação 53 decodifica os dados codificados da imagem de SDR providos da unidade de extração 52 no método de HEVC. Neste momento, a unidade de decodificação 53 também se refere aos conjuntos de parâmetros providos da unidade de extração 52, como necessário. A unidade de decodificação 53 provê a imagem de SDR que é obtida como resultado de decodificação à unidade de conversão 54.

[00175] Na etapa S54, a unidade de conversão 54 adquire a informação de conversão da knee_function_info SEI que é provida da unidade de extração 52.

[00176] Na etapa S55, a unidade de conversão 54 converte a imagem de SDR provida da unidade de decodificação 53 em uma imagem de HDR na base da informação de conversão, e provê a imagem de HDR para a unidade de controle de exibição 55.

[00177] Na etapa S56, a unidade de controle de exibição 55 exibe a imagem de HDR provida da unidade de conversão 54 na unidade de exibição 56, e termina o processo.

[00178] Como mencionado acima, o dispositivo de decodificação 50 converte a imagem de SDR obtida como resultado de decodificação na imagem de HDR na base da informação de conversão, e assim pode converter a imagem de SDR obtida como resultado de decodificação em uma imagem de HDR desejada.

Outro Exemplo de Sintaxe de knee_function_info SEI

[00179] A Figura 14 é um diagrama ilustrando outro exemplo de sintaxe de knee_function_info SEI, e Figura 15 é um diagrama ilustrando cada pedaço de conjunto de informação estabelecido na knee_function_info SEI da Figura 14.

[00180] A knee_function_info SEI da Figura 14 é igual à knee_function_info SEI da Figura 7, exceto que a informação de gama de luminância (white_level_range) e informação de luminância (white_level_range_luminance) estão estabelecidas em vez da informação de gama de luminância de saída (output_white_level_range) e da informação de luminância de saída (output_white_level_range_luminance).

[00181] A informação de gama de luminância é informação de gama de luminância de saída quando informação de posição de joelho de entrada (knee_point_of_input) é igual a ou mais que a informação de posição de joelho de saída (knee_point_of_output), quer dizer, quando descompressão de joelho é executada em um lado de decodificação da mesma maneira como na primeira modalidade.

[00182] Por outro lado, quando a informação de posição de joelho de entrada é menos que a informação de posição de joelho de saída, isso é, quando a compressão de joelho é executada no lado de decodificação, a informação de gama de luminância é informação indicando luminância de branco de uma imagem não convertida (por exemplo, uma imagem de HDR).

[00183] Semelhantemente, a informação de luminância (white_level_range_luminance) é informação de luminância de saída quando informação de posição de joelho de entrada é igual a ou mais que a informação de posição de joelho de saída da mesma maneira como na primeira modalidade, e é informação indicando luminância de branco (valor) de uma imagem não convertida (por exemplo, uma imagem de HDR) quando a informação de posição de joelho de entrada é menos que a informação de posição de joelho de saída.

[00184] Além disso, na primeira modalidade, só uma imagem de SDR é codificada no dispositivo de codificação 10, mas só uma imagem de HDR convertida da imagem de SDR pode ser codificada. Neste caso, informação relativa à conversão da imagem de SDR na imagem de HDR é estabelecida em SEI e é transmitida para o dispositivo de decodificação 50. Especificamente, a knee_function_info SEI ilustrada na Figura 7 ou Figura 15 na qual uma imagem não convertida é estabelecida como uma imagem de HDR, e uma imagem convertida é estabelecida como uma imagem de SDR é transmitida para o dispositivo de decodificação 50. Além disso, o dispositivo de decodificação 50 converte uma imagem de HDR em uma imagem de SDR original com alta precisão na base da knee_function_info SEI.

[00185] Além disso, na primeira modalidade, a unidade de exibição 56 é uma exibição de HDR, mas a unidade de exibição 56 pode ser uma exibição de SDR. Neste caso, a unidade de conversão 54 provê uma imagem de SDR para a unidade de controle de exibição 55 sem conversão em uma imagem de HDR. Por conseguinte, a imagem de SDR é exibida na unidade de exibição 56.

[00186] Além disso, uma imagem desejada pode ser uma imagem de HDR que é entrada ao dispositivo de codificação 10.

[00187] Além disso, na primeira modalidade, o dispositivo de codificação 10 converte uma imagem de HDR que é entrada de um dispositivo externo em uma imagem de SDR que é então codificada, mas pode codificar uma imagem de SDR que é entrada do dispositivo externo sem conversão.

Segunda Modalidade Exemplo de Configuração da Segunda Modalidade de Dispositivo de Codificação

[00188] A Figura 16 é um diagrama de bloco ilustrando um exemplo de configuração de uma segunda modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[00189] Entre elementos constituintes ilustrados na Figura 16, os mesmos elementos constituintes como os elementos constituintes da Figura 6 são dados os mesmos numerais de referência. Descrição repetida será omitida como apropriado.

[00190] Uma configuração de um dispositivo de codificação 70 da Figura 16 é diferente da configuração do dispositivo de codificação 10 da Figura 6 visto que uma unidade de estabelecimento 71, uma unidade de codificação 72 e uma unidade de conversão 73 são providas em vez da unidade de estabelecimento 11, da unidade de codificação 12 e da unidade de conversão 14. O dispositivo de codificação 70 codifica uma imagem de HDR que é entrada de um dispositivo externo, ou codifica uma imagem de SDR que é convertida de uma imagem de HDR, em um método se conformando ao método de HEVC.

[00191] Especificamente, a unidade de estabelecimento 71 do dispositivo de codificação 70 estabelece um SPS, um PPS, VUI, e similar. Além disso, a unidade de estabelecimento 71 estabelece SEI como knee_function_info SEI incluindo informação de conversão de DR em resposta a um comando de um usuário (produtor). A informação de conversão de DR é informação relativa à conversão de uma gama dinâmica de luminância de uma imagem que é um objetivo de codificação em uma gama dinâmica diferente. A unidade de estabelecimento 71 provê os conjuntos de parâmetros incluindo o SPS, PPS, VUI, knee_function_info SEI estabelecidos, e similar à unidade de codificação 72.

[00192] A unidade de codificação 72 estabelece uma imagem de HDR ou uma imagem de SDR provida da unidade de conversão 73 como uma imagem visada de codificação, e codifica a imagem visada de codificação no método de HEVC. A unidade de codificação 72 gera um fluxo codificado de dados codificados que são obtidos como resultado da codificação e os conjuntos de parâmetros que são providos da unidade de estabelecimento 71, e transmite o fluxo codificado gerado para a unidade de transmissão 13.

[00193] A unidade de conversão 73 comprime em joelho a luminância de uma imagem de HDR que é entrada de um dispositivo externo de modo a gerar uma imagem de SDR que é então provida à unidade de codificação 72, ou provê uma imagem de HDR que é entrada do dispositivo externo para a unidade de codificação 72 sem compressão.

Primeiro Exemplo da Sintaxe de knee_function_info SEI

[00194] A Figura 17 é um diagrama ilustrando um primeiro exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento 71 da Figura 16, e Figura 18 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 17.

[00195] Como ilustrado na Figura 17, um ID de conversão de joelho (knee_function_id) e uma bandeira de cancelamento de conversão de joelho (knee_function_cancel_flag) são estabelecidos na knee_function_info SEI.

[00196] O ID de conversão de joelho é um ID único para o propósito de conversão de joelho, que é compressão de joelho ou descompressão de joelho como ilustrado na Figura 18. Além disso, a bandeira de cancelamento de conversão de joelho é uma bandeira ilustrando se ou não persistência de knee_function_info SEI prévia está cancelada. A bandeira de cancelamento de conversão de joelho é estabelecida a 1 ao indicar que persistência de knee_function_info SEI prévia está cancelada, e é estabelecida a 0 quando a persistência não está cancelada.

[00197] Se a bandeira de cancelamento de conversão de joelho for 0, como ilustrado na Figura 17, um único pedaço de informação de posição de pré-conversão (input_knee_point), um único pedaço de informação de posição de pós-conversão (output_knee_point), informação de gama de luminância de HDR (d_range), e informação de luminância de exibição (d_range_disp_luminance) são estabelecidas na knee_function_info SEI como informação de conversão de DR.

[00198] A informação de posição de pré-conversão é informação indicando um cotovelo de uma imagem visada de codificação que é uma imagem não convertida em conversão correspondendo à informação de conversão de DR, e é uma 'permillage' de um cotovelo quando o valor máximo de luminância da imagem visada de codificação é estabelecido a 1000 permil. O cotovelo é luminância (que é um valor obtido normalizando valores de RGB lineares na gama de 0,0 a 1,1) diferente de 0, que é um ponto de começo de uma gama de luminância que é convertida em joelho à mesma relação de conversão como aquela de uma gama dinâmica de luminância da imagem visada de codificação.

[00199] A informação de posição de pós-conversão é informação indicando um ponto de começo de uma gama de luminância correspondendo a uma gama de luminância convertida em joelho que tem um cotovelo como um ponto de começo em uma imagem depois que de ser convertida (em seguida, chamada uma imagem convertida) em conversão correspondendo à informação de conversão de DR. Especificamente, a informação de posição de pós-conversão é uma 'permillage' de luminância de uma imagem convertida correspondendo a um cotovelo quando o valor máximo de luminância da imagem convertida é estabelecido a 1000 permil.

[00200] A informação de gama de luminância de HDR é informação indicando uma 'permillage' do valor máximo de luminância de uma imagem de HDR que é uma imagem visada de codificação ou uma imagem convertida. Além disso, a informação de luminância de exibição é informação indicando um valor esperado de brilho (luminância) da unidade de exibição correspondendo ao valor máximo de luminância de uma imagem de HDR. Primeiro Exemplo de Informação de Conversão de DR

[00201] As Figuras 19 e 20 são diagramas ilustrando exemplos da informação de conversão de DR estabelecida na knee_function_info SEI da Figura 17.

[00202] No exemplo da Figura 19, uma imagem visada de codificação é uma imagem de SDR, e um usuário estabelece uma imagem de HDR que é obtida como resultado de descomprimir em joelho 80% a 100% de luminância da imagem de SDR a 80% a 400%, como uma imagem convertida desejada. Neste caso, na knee_function_info SEI, 800 é estabelecido como a informação de posição de pré-conversão (input_knee_point), e 200 é estabelecido como a informação de posição de pós-conversão (output_knee_point).

[00203] Além disso, no exemplo da Figura 19, a informação de gama de luminância de HDR (d_range) é 4000, e a informação de gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado).

[00204] Como no caso da Figura 19, em um caso onde uma imagem visada de codificação é uma imagem de SDR, e uma imagem convertida é uma imagem de HDR, um cotovelo input_knee_point_PER (%) e output_knee_point_PER (%)de luminância de uma imagem convertida correspondendo ao cotovelo estão definidos pela seguinte Equação (1).

[00205] Portanto, um dispositivo de decodificação descrito mais tarde reconhece que o input_knee_point_PER de cotovelo e o output_knee_point_PER de luminância são 80% de acordo com a Equação (1). Além disso, o dispositivo de decodificação descrito mais tarde reconhece que conversão de joelho correspondendo à informação de conversão de DR é descompressão de joelho desde que a informação de posição de pré-conversão é igual a ou mais que a informação de posição de pós-conversão. Adicionalmente, o dispositivo de decodificação descrito mais tarde reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR.

[00206] Como mencionado acima, o dispositivo de decodificação descrito mais tarde descomprime em joelho 80% a 100% de luminância da imagem de SDR que é obtida como resultado de decodificar a 80% a 400%. Portanto, o dispositivo de decodificação pode converter a imagem de SDR obtida como resultado de decodificação em uma imagem de HDR desejada.

[00207] No exemplo da Figura 20, uma imagem visada de codificação é uma imagem de HDR, e o usuário estabelece uma imagem de SDR que é obtida como resultado de comprimir em joelho 80% a 400% de luminância da imagem de HDR a 80% a 100%, como uma imagem convertida desejada. Neste caso, na knee_function_info SEI, 200 é estabelecido como a informação de posição de pré-conversão (input_knee_point), e 800 é estabelecido como a informação de posição de pós-conversão (output_knee_point).

[00208] Além disso, no exemplo da Figura 20, a informação de gama de luminância de HDR (d_range) é 4000, e a informação de gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado).

[00209] Como no caso da Figura 20, em um caso onde uma imagem visada de codificação é uma imagem de HDR, e uma imagem convertida é uma imagem de SDR, um cotovelo input_knee_point_PER (%) e output_knee_point_PER (%)de luminância de uma imagem convertida correspondendo ao cotovelo estão definidos pela seguinte Equação (2).

[00210] Portanto, o dispositivo de decodificação descrito mais tarde reconhece que o cotovelo input_knee_point_PER e o output_knee_point_PER de luminância são 80% de acordo com a Equação (2). Além disso, o dispositivo de decodificação descrito mais tarde reconhece que conversão de joelho correspondendo à informação de conversão de DR é compressão de joelho desde que a informação de posição de pré-conversão é menos que a informação de posição de pós-conversão. Adicionalmente, o dispositivo de decodificação descrito mais tarde reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR.

[00211] Como mencionado acima, o dispositivo de decodificação descrito mais tarde comprime em joelho 80% a 400% de luminância da imagem de SDR que é obtida como resultado de decodificação, a 80% a 100%. Portanto, o dispositivo de decodificação pode converter a imagem de HDR obtida como resultado de decodificação em uma imagem de SDR desejada. Descrição do Processo de Dispositivo de Codificação

[00212] A Figura 21 é um fluxograma ilustrando um processo de geração de fluxo executado pela dispositivo de codificação 70 da Figura 16.

[00213] Na etapa S71 da Figura 21, a unidade de conversão 73 do dispositivo de codificação 70 determina se ou não, por exemplo, uma imagem visada de codificação é uma imagem de SDR em resposta a uma instrução ou similar do usuário. Se for determinado que uma imagem visada de codificação é uma imagem de SDR na etapa S71, o processo procede à etapa S72.

[00214] Na etapa S72, a unidade de conversão 73 converte uma imagem de HDR que é entrada de um dispositivo externo em uma imagem de SDR por compressão de joelho de luminância da imagem de HDR, e provê a imagem de SDR para a unidade de codificação 72.

[00215] Por outro lado, se for determinado que uma imagem visada de codificação não é uma imagem de SDR na etapa S71, quer dizer, uma imagem visada de codificação é uma imagem de HDR, a unidade de conversão 73 provê uma imagem de HDR que é entrada de um dispositivo externo para a unidade de codificação 72 sem mudança, e o processo procede à etapa S73.

[00216] Na etapa S73, a unidade de estabelecimento 71 estabelece um SPS. Na etapa S74, a unidade de estabelecimento 71 estabelece VUI. Na etapa S75, a unidade de estabelecimento 71 estabelece um PPS.

[00217] Na etapa S76, a unidade de estabelecimento 71 estabelece knee_function_info SEI em resposta a uma instrução ou similar de um usuário. A unidade de estabelecimento 71 provê os conjuntos de parâmetros incluindo o SPS, PPS, VUI, knee_function_info SEI, e similar estabelecidos à unidade de codificação 72.

[00218] Na etapa S77, a unidade de codificação 72 codifica uma imagem de SDR ou uma imagem de HDR provida da unidade de conversão 73 como uma imagem visada de codificação no método de HEVC. Na etapa S78, a unidade de codificação 72 gera um fluxo codificado de dados codificados que são obtidos como resultado da codificação e os conjuntos de parâmetros que são providos da unidade de estabelecimento 71, e transmite o fluxo codificado gerado à unidade de transmissão 13.

[00219] Na etapa S79, a unidade de transmissão 13 transmite o fluxo codificado provido da unidade de codificação 72 para o dispositivo de decodificação descrito mais tarde, e então termina o processo.

[00220] Como mencionado acima, o dispositivo de codificação 70 estabelece e transmite knee_function_info SEI incluindo informação de conversão de DR, e assim o dispositivo de decodificação descrito mais tarde pode converter uma imagem visada de codificação obtida como resultado de decodificação em uma imagem convertida desejada na base da informação de conversão de DR. Portanto, pode ser dito que o dispositivo de codificação 70 pode codificar uma imagem de forma que uma imagem decodificada possa ser convertida em uma imagem convertida desejada durante decodificação.

[00221] Além disso, desde que a informação de conversão de DR é estabelecida, o dispositivo de codificação 70 pode gerar um fluxo codificado de uma imagem correspondendo a uma exibição de HDR e uma exibição de SDR só codificando uma imagem de SDR ou uma imagem de HDR. Portanto, é possível adicionalmente reduzir uma quantidade de dados de um fluxo codificado do que em um caso de codificar ambas uma imagem de HDR e uma imagem de SDR. Exemplo de Configuração da Segunda Modalidade de Dispositivo de Decodificação

[00222] A Figura 22 é um diagrama de bloco ilustrando um exemplo de configuração de uma segunda modalidade de um dispositivo de decodificação que decodifica um fluxo codificado transmitido do dispositivo de codificação 70 da Figura 16 e ao qual a descrição presente é aplicada.

[00223] Entre os elementos constituintes ilustrados na Figura 22, os mesmos elementos constituintes como os elementos constituintes da Figura 12 são dados os mesmos numerais de referência. Descrição repetida será omitida como apropriado.

[00224] Uma configuração de um dispositivo de decodificação 90 da Figura 22 é diferente da configuração do dispositivo de decodificação 50 da Figura 12 visto que uma unidade de extração 91, uma unidade de decodificação 92, uma unidade de conversão 93, uma unidade de controle de exibição 94 e uma unidade de exibição 95 são providas em vez da unidade de extração 52, da unidade de decodificação 53, da unidade de conversão 54, da unidade de controle de exibição 55 e da unidade de exibição 56. O dispositivo de decodificação 90 converte uma imagem decodificada em uma imagem convertida de acordo com o tipo de unidade de exibição 95, e exibe a imagem convertida na unidade de exibição 95.

[00225] Especificamente, a unidade de extração 91 do dispositivo de decodificação 90 extrai conjuntos de parâmetros e dados codificados de um fluxo codificado que é provido da unidade de recepção 51. A unidade de extração 91 provê os conjuntos de parâmetros e os dados codificados para a unidade de decodificação 92. Além disso, a unidade de extração 91 provê knee_function_info SEI entre os conjuntos de parâmetros para a unidade de conversão 93.

[00226] A unidade de decodificação 92 decodifica os dados codificados providos da unidade de extração 91 no método de HEVC. Neste momento, a unidade de decodificação 92 também se refere aos conjuntos de parâmetros providos da unidade de extração 91, como necessário. A unidade de decodificação 92 provê uma imagem decodificada para a unidade de conversão 93.

[00227] Em um caso onde uma gama dinâmica de luminância correspondendo à unidade de exibição 95 é uma gama dinâmica de luminância da imagem decodificada, a unidade de conversão 93 provê a imagem decodificada, que é provida da unidade de decodificação 92, para a unidade de controle de exibição 94 sem mudança. Por outro lado, em um caso onde uma gama dinâmica de luminância correspondendo à unidade de exibição 95 não é uma gama dinâmica de luminância da imagem decodificada, a unidade de conversão 93 converte a imagem decodificada em uma imagem convertida por conversão de joelho na base de informação de conversão de DR incluída na knee_function_info SEI provida da unidade de extração 91. Além disso, a unidade de conversão 93 provê a imagem convertida para a unidade de controle de exibição 94 como uma imagem de exibição.

[00228] Especificamente, em um caso onde a unidade de exibição 95 é uma exibição de HDR, e a imagem decodificada é uma imagem de HDR, ou em um caso onde a unidade de exibição 95 é uma exibição de SDR, e a imagem decodificada é uma imagem de SDR, a unidade de conversão 93 provê a imagem decodificada para a unidade de controle de exibição 94 sem mudança. Por outro lado, em um caso onde a unidade de exibição 95 é uma exibição de SDR, e a imagem decodificada é uma imagem de HDR, ou em um caso onde a unidade de exibição 95 é uma exibição de HDR, e a imagem decodificada é uma imagem de SDR, a unidade de conversão 93 executa conversão de joelho na imagem decodificada na base da informação de conversão de DR para gerar uma imagem convertida. Além disso, a unidade de conversão 93 provê a imagem convertida para a unidade de controle de exibição 94 como uma imagem de exibição.

[00229] A unidade de controle de exibição 94 exibe a imagem de exibição provida da unidade de conversão 93 na unidade de exibição 95. Por conseguinte, em um caso onde a unidade de exibição 95 é uma exibição de HDR, uma imagem de HDR é exibida na unidade de exibição 95, e em um caso onde a unidade de exibição 95 é uma exibição de SDR, uma imagem de SDR é exibida na unidade de exibição 95. A unidade de exibição 95 é uma exibição de HDR ou uma exibição de SDR, e exibe uma imagem de exibição provida da unidade de controle de exibição 94.

Descrição do Processo no Dispositivo de Decodificação

[00230] A Figura 23 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação 90 da Figura 22.

[00231] Na etapa S91 da Figura 23, a unidade de recepção 51 do dispositivo de decodificação 90 recebe um fluxo codificado transmitido do dispositivo de codificação 70 da Figura 16, e provê o fluxo codificado para a unidade de extração 91.

[00232] Na etapa S92, a unidade de extração 91 extrai conjuntos de parâmetros e dados codificados do fluxo codificado que é provido da unidade de recepção 51. A unidade de extração 91 provê os conjuntos de parâmetros e os dados codificados para a unidade de decodificação 92. Além disso, a unidade de extração 91 provê knee_function_info SEI entre os conjuntos de parâmetros, para a unidade de conversão 93.

[00233] Na etapa S93, a unidade de decodificação 92 decodifica os dados codificados providos da unidade de extração 91 no método de HEVC. Neste momento, a unidade de decodificação 92 também se refere aos conjuntos de parâmetros providos da unidade de extração 91, como necessário. A unidade de decodificação 92 provê uma imagem decodificada para a unidade de conversão 93.

[00234] Na etapa S94, a unidade de conversão 93 adquire a informação de conversão de DR da knee_function_info SEI que é provida da unidade de extração 91.

[00235] Na etapa S95, a unidade de conversão 93 determina se ou não uma gama dinâmica de luminância correspondendo à unidade de exibição 95 é uma gama dinâmica de luminância da imagem decodificada. Se for determinado que uma gama dinâmica de luminância correspondendo à unidade de exibição 95 não é uma gama dinâmica de luminância da imagem decodificada, o processo procede à etapa S96.

[00236] Na etapa S96, a unidade de conversão 93 converte a imagem decodificada provida da unidade de decodificação 92 em uma imagem convertida na base da informação de conversão de DR, e provê a imagem convertida para a unidade de controle de exibição 94 como uma imagem de exibição. Além disso, o processo procede à etapa S97.

[00237] Por outro lado, é determinado na etapa S95 que uma gama dinâmica de luminância correspondendo à unidade de exibição 95 é uma gama dinâmica de luminância da imagem decodificada, a unidade de conversão 93 provê a imagem decodificada que é provida da unidade de decodificação 92, para a unidade de controle de exibição 94 como uma imagem de exibição sem mudança. Além disso, o processo procede à etapa S97.

[00238] Na etapa S97, a unidade de controle de exibição 94 exibe a imagem de exibição provida da unidade de conversão 93 na unidade de exibição 95, e termina o processo.

[00239] Como mencionado acima, o dispositivo de decodificação 90 converte a imagem decodificada na imagem convertida na base da informação de conversão de DR, e assim pode converter uma imagem decodificada a uma imagem convertida desejada.

[00240] Além disso, na segunda modalidade, uma de uma imagem de SDR e uma imagem de HDR é uma imagem visada de codificação, e a outra é uma imagem convertida, mas uma imagem de SDR pode ser substituída com uma imagem de desenvolvimento dessensibilizada de uma imagem de HDR na qual um valor esperado de brilho da unidade de exibição correspondendo ao valor máximo de luminância é maior do que aquele da imagem de SDR. Segundo Exemplo da Informação de Conversão de DR

[00241] As Figuras 24 e 25 são diagramas ilustrando exemplos de informação de conversão de DR estabelecida em knee_function_info SEI em um caso onde uma de uma imagem de desenvolvimento dessensibilizada e uma imagem de HDR é uma imagem visada de codificação e a outra é uma imagem convertida.

[00242] Além disso, nos exemplos das Figuras 24 e 25, a imagem de desenvolvimento dessensibilizada é uma imagem na qual uma gama dinâmica de luminância é 0 a 200%, obtida executando desenvolvimento dessensibilizado de 1 EV (valor de descrição) em uma imagem de HDR. Adicionalmente, um valor esperado de brilho da unidade de exibição correspondendo ao valor máximo de luminância da imagem de desenvolvimento dessensibilizada é 400 (candela por metro quadrado) mais alto que 200 (candela por metro quadrado) que é um valor está esperado de brilho correspondendo ao valor máximo de luminância em uma imagem de SDR.

[00243] Informação indicando que uma imagem visada de codificação ou uma imagem convertida é uma imagem obtida executando desenvolvimento dessensibilizado em uma imagem de HDR, e uma gama dinâmica de luminância da imagem de desenvolvimento dessensibilizada são estabelecidas em tone_mapping_info_SEI pela unidade de estabelecimento 71.

[00244] No exemplo da Figura 24, uma imagem visada de codificação é uma imagem de desenvolvimento dessensibilizada, e o usuário estabelece uma imagem de HDR que é obtida como resultado de descomprimir em joelho 160% a 200% de luminância da imagem de desenvolvimento dessensibilizada a 160% a 400%, como uma imagem convertida desejada. Neste caso, na knee_function_info SEI, 800 é estabelecido como a informação de posição de pré-conversão (input_knee_point), e 400 é estabelecido como a informação de posição de pós-conversão (output_knee_point).

[00245] Além disso, no exemplo da Figura 24, a informação de gama de luminância de HDR (d_range) é 4000, e a gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado).

[00246] Como no caso da Figura 24, em um caso onde uma imagem visada de codificação é uma imagem de desenvolvimento dessensibilizada, e uma imagem convertida é uma imagem de HDR, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela Equação (1) anterior.

[00247] Portanto, o dispositivo de decodificação 90 reconhece que o cotovelo input_knee_point_PER e a luminância output_knee_point_PER são 160% de acordo com a Equação (1). Além disso, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR. Adicionalmente, o dispositivo de decodificação 90 reconhece que uma gama dinâmica de luminância da imagem visada de codificação é 0 a 200% da tone_mapping_info_SEI. Além disso, em um caso onde a unidade de exibição 95 é uma exibição de HDR, 160% a 200% de luminância de uma imagem de desenvolvimento dessensibilizada que é obtida como resultado de decodificação é descomprimida em joelho a 160% a 400% de modo a ser exibida como uma imagem de exibição.

[00248] Por outro lado, em um caso onde a unidade de exibição 95 é uma exibição de SDR, o dispositivo de decodificação 90 exibe uma imagem de desenvolvimento dessensibilizada como uma imagem de exibição sem mudança. Neste momento, um valor esperado de brilho da unidade de exibição correspondendo ao valor máximo de luminância da imagem de desenvolvimento dessensibilizada é maior que aquele de uma imagem de SDR, e assim brilho da imagem de exibição é insuficiente.

[00249] Porém, recentemente, uma exibição de SDR (em seguida, chamada uma exibição de SDR de luminância alta) de qual o brilho correspondendo ao valor máximo de luminância é relativamente alto 300 (candela por metro quadrado) ou similar foi desenvolvida. Em um caso onde a unidade de exibição 95 é uma exibição de SDR de luminância alta, o brilho de uma imagem de exibição pode ser mantido suficientemente até mesmo se uma imagem de desenvolvimento dessensibilizada for exibida como a imagem de exibição sem mudança. Além disso, desde que uma relação de compressão de compressão de joelho durante geração de uma imagem visada de codificação é mais baixa do que em um caso onde uma imagem visada de codificação é uma imagem de SDR, a qualidade de uma imagem de exibição pode ser melhorada.

[00250] No exemplo da Figura 25, uma imagem visada de codificação é uma imagem de HDR, e o usuário estabelece uma imagem de desenvolvimento dessensibilizada que é obtida como resultado de comprimir em joelho 160% a 400% de luminância da imagem de HDR a 160% a 200%, como uma imagem convertida desejada. Neste caso, na knee_function_info SEI, 400 é estabelecido como a informação de posição de pré-conversão (input_knee_point), e 800 é estabelecido como a informação de posição de pós-conversão (output_knee_point).

[00251] Além disso, no exemplo da Figura 25, a informação de gama de luminância de HDR (d_range) é 4000, e a gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado).

[00252] Como no caso da Figura 25, em um caso onde uma imagem visada de codificação é uma imagem de HDR, e uma imagem convertida é uma imagem de desenvolvimento dessensibilizada, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela Equação (2) anterior.

[00253] Portanto, o dispositivo de decodificação 90 reconhece que o cotovelo input_knee_point_PER e a luminância output_knee_point_PER são 160% de acordo com a Equação (2). Além disso, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem visada de codificação é 400% da informação de gama de luminância de HDR. Adicionalmente, o dispositivo de decodificação 90 reconhece que uma gama dinâmica de luminância da imagem convertida é 0 a 200% da tone_mapping_info_SEI.

[00254] Além disso, em um caso onde a unidade de exibição 95 é uma exibição de SDR, o dispositivo de decodificação 90 comprime em joelho 160% a 400% de luminância de uma imagem de HDR que é obtida como resultado de decodificação a 160% a 200% de modo a exibir um resultado comprimido como uma imagem de exibição. Neste caso, como descrito acima, o brilho da imagem de exibição é insuficiente. Porém, em um caso onde a unidade de exibição 95 é uma exibição de SDR de luminância alta, o brilho de uma imagem de exibição pode ser mantido suficientemente como descrito acima. Além disso, a qualidade de uma imagem de exibição pode ser melhorada.

[00255] Por outro lado, em um caso onde a unidade de exibição 95 é uma exibição de HDR, o dispositivo de decodificação 90 exibe uma imagem de HDR que é obtida como resultado de decodificação como uma imagem de exibição sem mudança.

[00256] Além disso, a informação de conversão de DR da Figura 17 pode ser incluída em SEI tal como tone_mapping_info_SEI diferente de knee_function_info SEI.

Primeiro Exemplo da Sintaxe de tone_mapping_info_SEI

[00257] Figura 26 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI em um caso onde a informação de conversão de DR da Figura 17 está incluída na tone_mapping_info_SEI.

[00258] A tone_mapping_info_SEI é SEI relativa à conversão de luminância. Como ilustrado na Figura 26, em um caso onde a informação de conversão de DR da Figura 17 está incluída na tone_mapping_info_SEI, tone_map_model_id indicando um modelo de conversão de luminância é estabelecido a, por exemplo, 5. Além disso, na tone_mapping_info_SEI, informação de posição de pré-conversão (input_knee_point), informação de posição de pós-conversão (output_knee_point), informação de gama de luminância de HDR (d_range), e informação de luminância de exibição (d_range_disp_luminance) estão estabelecidas na tone_mapping_info_SEI como informação de conversão de DR.

[00259] Além disso, a informação de gama de luminância de HDR (d_range) e a informação de luminância de exibição (d_range_disp_luminance) estão incluídas em tone_mapping_info_SEI quando tone_map_model_id é 4. Portanto, como ilustrado na Figura 27, a informação de gama de luminância de HDR (d_range) e a informação de luminância de exibição (d_range_disp_luminance) podem não estar incluídas na tone_mapping_info_SEI. Adicionalmente, só uma da informação de gama de luminância de HDR (d_range) e da informação de luminância de exibição (d_range_disp_luminance) pode estar incluída.

Segundo Exemplo da Sintaxe de knee_function_info SEI

[00260] A Figura 28 é um diagrama ilustrando um segundo exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento 71 da Figura 16, e Figura 29 é um diagrama ilustrando cada pedaço de informação estabelecida na knee_function_info SEI da Figura 28.

[00261] Uma pluralidade de cotovelos está estabelecida na knee_function_info SEI da Figura 28. Especificamente, da mesma maneira como no caso da Figura 17, um ID de conversão de joelho (knee_function_id) e uma bandeira de cancelamento de conversão de joelho (knee_function_cancel_flag) estão estabelecidos na knee_function_info SEI da Figura 28.

[00262] Além disso, se a bandeira de cancelamento de conversão de joelho for 0, como ilustrado na Figura 28, a informação de conversão de DR está estabelecida na knee_function_info SEI. A informação de conversão de DR é igual como no caso da Figura 17, exceto que uma bandeira de compressão (compression_flag) e um número de cotovelo (num_knee_point_minus1) estão incluídos, e informação de posição de pré- conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) estão estabelecidas para cada cotovelo. Descrição da mesma parte como no caso da Figura 17 é repetida e assim será omitida como apropriado.

[00263] Como ilustrado na Figura 29, a bandeira de compressão é uma bandeira indicando se ou não a conversão de joelho é compressão de joelho. Em outras palavras, em um caso onde o número de cotovelos é um, quando a informação de posição de pré-conversão (input_knee_point) é igual a ou mais que a informação de posição de pós-conversão (output_knee_point), pode ser determinado que a conversão de joelho é descompressão de joelho, e quando a informação de posição de pré-conversão (input_knee_point) é menos que a informação de posição de pós-conversão (output_knee_point), pode ser determinado que a conversão de joelho é compressão de joelho.

[00264] Porém, em um caso onde há vários cotovelos, não pode ser determinado precisamente se a conversão de joelho é descompressão de joelho ou compressão de joelho usando a correlação de magnitude entre a informação de posição de pré-conversão e a informação de posição de pós- conversão, e assim a bandeira de compressão é estabelecida. Além disso, até mesmo em um caso onde o número de cotovelos é um, a bandeira de compressão pode ser estabelecida. A bandeira de compressão é estabelecida a 1 quando a conversão de joelho é compressão de joelho, e é estabelecida a 0 quando a conversão de joelho é descompressão de joelho.

[00265] O número de cotovelo é um valor obtido subtraindo 1 do número de cotovelos. Além disso, uma ordem i (onde i é um inteiro de 0 ou mais) em que informação de posição de pré-conversão e informação de posição de pós-conversão de cotovelos são estabelecidas é uma ordem na qual a informação de posição de pré-conversão está reduzida. Terceiro Exemplo da Informação de Conversão de DR

[00266] As Figuras 30 e 31 são diagramas ilustrando exemplos de informação de conversão de DR estabelecida na knee_function_info SEI da Figura 28.

[00267] No exemplo da Figura 30, uma imagem visada de codificação é uma imagem de SDR. Além disso, o usuário estabelece uma imagem de HDR que é obtida como resultado de converter respectivamente 0 a 60%, 60% a 80%, 80% a 90%, e 90% a 100% de uma imagem de SDR em 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400%, como uma imagem convertida desejada.

[00268] Neste caso, na knee_function_info SEI, 600 é estabelecido como informação de posição de pré-conversão (input_knee_point [0]) do 0- ésimo cotovelo, e 100 é estabelecido como informação de posição de pós- conversão (output_knee_point [0]) disso. 800 é estabelecido como informação de posição de pré-conversão (input_knee_point[1]) do primeiro cotovelo, e 250 é estabelecido como informação de posição de pós-conversão (output_knee_point[1]) disso. 900 é estabelecido como informação de posição de pré-conversão (input_knee_point[2]) do segundo cotovelo, e 450 é estabelecido como informação de posição de pós-conversão (output_knee_point[2]) disso.

[00269] Além disso, no exemplo da Figura 30, a informação de gama de luminância de HDR (d_range) é 4000, a gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado), e o sinal de compressão (compression_flag) é 0.

[00270] Como descrito acima, em um caso onde uma imagem visada de codificação é uma imagem de SDR, e uma imagem convertida é uma imagem de HDR, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela Equação (1) anterior.

[00271] Portanto, o dispositivo de decodificação 90 reconhece que o 0- ésimo a segundo cotovelos input_knee_point_PER são respectivamente 60%, 80%, e 90% de acordo com a Equação (1). Além disso, o dispositivo de decodificação 90 reconhece que a 0-ésima a segunda luminâncias output_knee_point_PER são respectivamente 40%, 100%, e 180%. Adicionalmente, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR.

[00272] Além disso, o dispositivo de decodificação 90 converte respectivamente em joelho 0 a 60%, 60% a 80%, 80% a 90%, e 90% a 100% de uma imagem de SDR que é obtida como resultado de decodificação em 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400%, de acordo com uma linha reta de conversão na qual os cotovelos estão conectados um ao outro em uma ordem estabelece. Portanto, o dispositivo de decodificação 90 pode converter a imagem de SDR que é obtida como resultado de decodificação em uma imagem de HDR desejada.

[00273] No exemplo da Figura 31, uma imagem visada de codificação é uma imagem de HDR. Além disso, o usuário estabelece uma imagem de SDR que é obtida como resultado de converter respectivamente 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400% de luminância de uma imagem de HDR em 0 a 60%, 60% a 80%, 80% a 90%, e 90% a 100%, como uma imagem convertida desejada.

[00274] Neste caso, na knee_function_info SEI, 100 é estabelecido como informação de posição de pré-conversão (input_knee_point [0]) do 0- ésimo cotovelo, e 600 é estabelecido como informação de posição de pós- conversão (output_knee_point [0]). 250 é estabelecido como informação de posição de pré-conversão (input_knee_point[1]) do primeiro cotovelo, e 800 é estabelecido como informação de posição de pós-conversão (output_knee_point[1]). 450 é estabelecido como informação de posição de pré-conversão (input_knee_point[2]) do segundo cotovelo, e 900 é estabelecido como informação de posição de pós-conversão (output_knee_point[2]).

[00275] Além disso, no exemplo da Figura 31, a informação de gama de luminância de HDR (d_range) é 4000, a gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado), e o sinal de compressão (compression_flag) é 1.

[00276] Como descrito acima, em um caso onde uma imagem visada de codificação é uma imagem de HDR, e uma imagem convertida é uma imagem de SDR, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela Equação (2) anterior.

[00277] Portanto, o dispositivo de decodificação 90 reconhece que o 0- ésimo a segundo cotovelos input_knee_point_PER são respectivamente 40%, 100%, e 180% de acordo com a Equação (2). Além disso, a 0-ésima a segunda luminâncias output_knee_point_PER (%) são respectivamente 60%, 80%, e 90%. Além disso, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR.

[00278] Adicionalmente, o dispositivo de decodificação 90 converte em joelho 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400% de uma imagem de HDR que é obtida como resultado de decodificação em 0 a 60%, 60% a 80%, 80% a 90%, e 90% a 100% conectando os cotovelos um ao outro em uma ordem estabelece. Portanto, o dispositivo de decodificação 90 pode converter a imagem de HDR que é obtida como resultado de decodificação em uma imagem de SDR desejada.

[00279] Como mencionado acima, em um caso onde uma pluralidade de cotovelos está estabelecida, uma relação de compressão pode ser estabelecida mais finamente do que em um caso onde um único cotovelo está estabelecido. Portanto, é possível executar conversão de joelho com precisão mais alta.

[00280] Além disso, a informação de conversão DR da Figura 28 pode ser incluída em SEI tal como tone_mapping_info_SEI diferente de knee_function_info SEI. Segundo Exemplo da Sintaxe de tone_mapping_info_SEI

[00281] A Figura 32 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI em um caso onde a informação de conversão de DR da Figura 28 está incluída na tone_mapping_info_SEI.

[00282] Como ilustrado na Figura 32, em um caso onde a informação de conversão de DR da Figura 28 está incluída na tone_mapping_info_SEI, o tone_map_model_id é estabelecido a, por exemplo, 5. Além disso, na tone_mapping_info_SEI, a bandeira de compressão (compression_flag (mapping_flag)), informação de gama de luminância de HDR (d_range), informação de luminância de exibição (d_range_disp_luminance), um número de cotovelo (num_knee_point_minus1), e informação de posição de pré- conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) de cada cotovelo estão estabelecidas na tone_mapping_info_SEI como informação de conversão de DR.

[00283] Além disso, da mesma maneira como na tone_mapping_info_SEI da Figura 27, a informação de gama de luminância de HDR (d_range) e a informação de luminância de exibição (d_range_disp_luminance) pode não estar incluída na tone_mapping_info_SEI da Figura 32. Adicionalmente, só uma da informação de gama de luminância de HDR (d_range) e da informação de luminância de exibição (d_range_disp_luminance) pode estar incluída.

[00284] Além disso, o número de cotovelo (num_knee_point_minus1) pode ser qualquer um de 0, 1, e 2 como ilustrado nas Figuras 33 a 35. Em outras palavras, o número de cotovelo (num_knee_point_minus1) pode ser limitado a 2 ou menos. Neste caso, como ilustrado nas Figuras 33 a 35, o número de bits do número de cotovelo (num_knee_point_minus1) incluído na knee_function_info SEI ou na tone_mapping_info_SEI é fixado a 2 bits (u(2)).

[00285] Como mencionado acima, o valor máximo do número de cotovelo (num_knee_point_minus1) é determinado, e assim uma quantidade de informação de conversão de DR pode ser reduzida. Por conseguinte, a informação de conversão de DR pode ser transmitida com um pacote pequeno como em AVI InfoFrame da Interface de Multimídia de Alta Definição (HDMI (marca registrada)). Terceiro Exemplo da Sintaxe de knee_function_info SEI

[00286] A Figura 36 é um diagrama ilustrando um terceiro exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento 71 da Figura 16, e Figura 37 é um diagrama ilustrando cada pedaço de informação estabelecido na knee_function_info SEI da Figura 36.

[00287] Uma pluralidade de cotovelos e um cotovelo (em seguida, chamado um cotovelo representativo) que é usado representativamente estão estabelecidos na knee_function_info SEI da Figura 36.

[00288] Especificamente, da mesma maneira como no caso da Figura 17, um ID de conversão de joelho (knee_function_id) e uma bandeira de cancelamento de conversão de joelho (knee_function_cancel_flag) estão estabelecidos na knee_function_info SEI da Figura 36.

[00289] Além disso, se a bandeira de cancelamento de conversão de joelho for 0, como ilustrado na Figura 36, a informação de conversão de DR está estabelecida na knee_function_info SEI. A informação de conversão de DR é igual como no caso da Figura 28, exceto que informação de posição de pré-conversão representativa (representative_input_knee_point) e informação de posição de pós-conversão representativa (representative_output_knee_point) estão incluídas. Descrição da mesma parte como no caso da Figura 28 é repetida e assim será omitida como apropriado.

[00290] Como ilustrado na Figura 37, a informação de posição de pré- conversão representativa é informação indicando um cotovelo representativo de uma imagem visada de codificação que é uma imagem não convertida em conversão correspondendo à informação de conversão de DR, e é uma 'permillage' do cotovelo representativo quando o valor máximo de luminância da imagem visada de codificação está estabelecida a 1000 permil.

[00291] A informação de posição de pré-conversão representativa é informação indicando luminância correspondendo a um cotovelo representativo de uma imagem convertida em conversão correspondendo à informação de conversão de DR, e é uma 'permillage' de luminância correspondendo a um cotovelo quando o valor máximo de luminância da imagem convertida está estabelecido a 1000 permil.

[00292] Além disso, o cotovelo representativo pode ser um de cotovelos correspondendo a uma pluralidade de pedaços de informação de posição de pré-conversão incluídos na informação de conversão de DR, e pode ser um cotovelo que é completamente diferente do cotovelo.

Quarto Exemplo da Informação de Conversão de DR

[00293] A Figura 38 é um diagrama ilustrando um exemplo de informação de conversão de DR estabelecida na knee_function_info SEI da Figura 36.

[00294] No exemplo da Figura 38, uma imagem visada de codificação é uma imagem de SDR. Além disso, o usuário estabelece uma imagem de HDR que é obtida como resultado de converter respectivamente 0 a 60%, 60% a 80%, 80% a 90%, e 90% a 100% de uma imagem de SDR em 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400%, como uma imagem convertida desejada quando o dispositivo de decodificação 90 executa a conversão de joelho com precisão alta. Adicionalmente, o usuário estabelece uma imagem de HDR que é obtida descomprimindo em joelho 80% a 100% de luminância de uma imagem de SDR a 80% a 400%, como uma imagem convertida desejada quando o dispositivo de decodificação 90 executa conversão de joelho simples com baixa precisão.

[00295] Neste caso, na knee_function_info SEI, os mesmos valores como na Figura 30 estão estabelecidos como informação de posição de pré- conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) do 0-ésimo a segundo cotovelos. Além disso, a informação de posição de pré-conversão representativa (representative_input_knee_point) é 800, e a informação de posição de pós- conversão representativa (representative_output_knee_point) é 200.

[00296] Além disso, no exemplo da Figura 38, a informação de gama de luminância de HDR (d_range) é 4000, a gama de luminância de exibição (d_range_disp_luminance) é 800 (candela por metro quadrado), e o sinal de compressão (compression_flag) é 0.

[00297] Como ilustrado na Figura 38, em um caso onde o dispositivo de decodificação 90 executa conversão de joelho simples com baixa precisão, o dispositivo de decodificação 90 reconhece que o cotovelo representativo representative_input_knee_point_PER (%) e luminância representative_output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo representativo são 80% de acordo com a Equação (1) anterior. Além disso, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de HDR. Adicionalmente, o dispositivo de decodificação 90 descomprime em joelho 80% a 100% de luminância de uma imagem de SDR que é obtida como resultado de decodificação a 80% a 400%. Portanto, o dispositivo de decodificação 90 pode converter a imagem de SDR que é obtida como resultado de decodificação em uma imagem de HDR desejada.

[00298] Por outro lado, em um caso onde o dispositivo de decodificação 90 executa conversão de joelho com precisão alta, o dispositivo de decodificação 90 executa o mesmo processo como na Figura 30, e converte uma imagem de SDR que é obtida como resultado de decodificação em uma imagem de HDR desejada.

[00299] Como mencionado acima, a informação de posição de pré- conversão representativa (representative_input_knee_point) e a informação de posição de pós-conversão representativa (representative_output_knee_point) estão incluídas na informação de conversão de DR da Figura 36. Portanto, até mesmo em um caso onde uma taxa de processamento ou um recurso tal como uma capacidade de memória não pode ser assegurado suficientemente no dispositivo de decodificação 90, a conversão de joelho pode ser executada na base de um cotovelo representativo. Além disso, desde que a informação de posição de pré-conversão representativa e a informação de posição de pós- conversão representativa são transmitidas para o dispositivo de decodificação 90, o dispositivo de decodificação 90 não tem que gerar informação de posição de pré-conversão representativa e informação de posição de pós- conversão representativa na base de informação de posição de pré-conversão e informação de posição de pós-conversão de uma pluralidade de cotovelos.

[00300] Além disso, a informação de conversão de DR da Figura 36 pode ser incluída em SEI tal como tone_mapping_info_SEI diferente de knee_function_info SEI. Terceiro Exemplo da Sintaxe de tone_mapping_info_SEI

[00301] A Figura 39 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI em um caso onde a informação de conversão de DR da Figura 36 está incluída na tone_mapping_info_SEI.

[00302] Como ilustrado na Figura 39, em um caso onde a informação de conversão de DR da Figura 36 está incluída na tone_mapping_info_SEI, tone_map_model_id é estabelecido a, por exemplo, 5. Além disso, na tone_mapping_info_SEI, uma bandeira de compressão (compression_flag), informação de posição de pré-conversão representativa (representative_input_knee_point), informação de posição de pós-conversão representativa (representative_output_knee_point), informação de gama de luminância de HDR (d_range), informação de luminância de exibição (d_range_disp_luminance), um número de cotovelo (num_knee_point_minus1), e informação de posição de pré-conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) de cada cotovelo estão estabelecidas na tone_mapping_info_SEI como informação de conversão de DR.

[00303] Além disso, da mesma maneira como na tone_mapping_info_SEI da Figura 27, a informação de gama de luminância de HDR (d_range) e a informação de luminância de exibição (d_range_disp_luminance) podem não estar incluídas na tone_mapping_info_SEI da Figura 39. Adicionalmente, só uma da informação de gama de luminância de HDR (d_range) e da informação de luminância de exibição (d_range_disp_luminance) pode estar incluída.

Quarto Exemplo da Sintaxe de knee_function_info SEI

[00304] A Figura 40 é um diagrama ilustrando um quarto exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento 71 da Figura 16, e Figura 41 é um diagrama ilustrando (semântica de) cada pedaço de informação estabelecido na knee_function_info SEI da Figura 40.

[00305] Na knee_function_info SEI da Figura 40, imagens diferentes de uma imagem de SDR podem ser empregadas como uma de uma imagem visada de codificação e uma imagem convertida.

[00306] Especificamente, da mesma maneira como no caso da Figura 17, um ID de conversão de joelho (knee_function_id) e uma bandeira de cancelamento de conversão de joelho (knee_function_cancel_flag) estão estabelecidos na knee_function_info SEI da Figura 40.

[00307] Além disso, se a bandeira de cancelamento de conversão de joelho for 0, como ilustrado na Figura 40, a informação de conversão de DR está estabelecida na knee_function_info SEI. A informação de conversão de DR é igual como no caso da Figura 28, exceto que a bandeira de persistência de conversão de joelho (knee_function_persistence_flag) está incluída recentemente, e a informação de gama de exibição não convertida (input_d_range), informação de luminância de exibição não convertida (input_disp_luminance), informação de gama de exibição convertida (output_d_range), e informação de luminância de exibição convertida (output_disp_luminance) estão incluídas em vez da informação de gama de luminância de HDR (d_range) e da informação de luminância de exibição (d_range_disp_luminance). Descrição da mesma parte como no caso da Figura 28 é repetida e assim será omitida como apropriado.

[00308] Como ilustrado na Figura 41, a bandeira de persistência de conversão de joelho é uma bandeira indicando se ou não a informação de conversão de DR é aplicada a uma pluralidade de quadros que estão localizados continuamente. A bandeira de persistência de conversão de joelho está estabelecida a 1 quando a informação de conversão de DR é aplicada a uma pluralidade de quadros que estão localizados continuamente, e está estabelecida a 0 quando a informação de conversão de DR é aplicada a só um quadro. A bandeira de persistência de conversão de joelho também pode ser estabelecida na knee_function_info SEI das Figuras 17, 28, 34 e 36.

[00309] Além disso, a informação de gama de luminância não convertida é informação indicando uma 'permillage' do valor máximo de luminância de uma imagem visada de codificação que é uma imagem não convertida em conversão correspondendo à informação de conversão de DR, e a informação de gama de luminância convertida é informação indicando um valor de 'permillage' máxima de luminância de uma imagem convertida.

[00310] Além disso, a informação de luminância de exibição não convertida é informação indicando um valor esperado de brilho da unidade de exibição correspondendo ao valor máximo de luminância de uma imagem visada de codificação, e a informação de luminância de exibição convertida é informação indicando um valor esperado de brilho da unidade de exibição correspondendo ao valor máximo de luminância de uma imagem convertida.

Quinto Exemplo da Informação de Conversão de DR

[00311] As Figuras 42 e 43 são diagramas ilustrando exemplos de informação de conversão de DR estabelecida na knee_function_info SEI da Figura 40.

[00312] No exemplo da Figura 42, uma imagem visada de codificação é uma imagem de HDR (em seguida, chamada uma imagem de HDR de 200%) cuja gama dinâmica é 0 a 200%. Além disso, o usuário estabelece uma imagem de HDR de 400% que é obtida como resultado de converter respectivamente em joelho 0 a 120%, 120% a 160%, 160% a 180%, e 180% a 200% de luminância de uma imagem de HDR de 200% em 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400%, como uma imagem convertida desejada. A imagem de HDR de 400% é uma imagem de HDR cuja gama dinâmica é 0 a 400%.

[00313] Neste caso, na knee_function_info SEI, os mesmos valores como na Figura 30 estão estabelecidos como informação de posição de pré- conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) do 0-ésimo a segundo cotovelos. Além disso, 2000 está estabelecido como a informação de gama de luminância não convertida (input_d_range), e 4000 está estabelecido como a informação de gama de luminância convertida (output_d_range).

[00314] Adicionalmente, no exemplo da Figura 42, a informação de luminância de exibição não convertida (input_disp_luminance) é 400 (candela por metro quadrado), e a informação de luminância de exibição convertida (output_disp_luminance) é 800 (candela por metro quadrado). A bandeira de compressão (compression_flag) é 0.

[00315] Como ilustrado na Figura 42, em um caso onde uma imagem visada de codificação é uma imagem com uma gama dinâmica correspondendo à informação de gama de luminância não convertida, e uma imagem convertida é uma imagem com uma gama dinâmica correspondendo à informação de gama de luminância convertida, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela seguinte Equação (3).

[00316] Portanto, o dispositivo de decodificação 90 reconhece que o 0- ésimo a segundo cotovelos input_knee_point_PER são respectivamente 120%, 160%, e 180% de acordo com a Equação (3). Além disso, o dispositivo de decodificação 90 reconhece que a 0-ésima a segunda luminâncias output_knee_point_PER são respectivamente 40%, 100%, e 180%. Adicionalmente, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem visada de codificação é 200% da informação de gama de luminância de entrada, e o valor máximo de luminância da imagem convertida é 400% da informação de gama de luminância de saída.

[00317] Além disso, o dispositivo de decodificação 90 converte respectivamente em joelho 0 a 120%, 120% a 160%, 160% a 180%, e 180% a 200% de uma imagem de HDR de 200% que é obtida como resultado de decodificação em 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400%, de acordo com uma linha reta de conversão na qual os cotovelos estão conectados um ao outro em uma ordem estabelece. Então, o dispositivo de decodificação 90 pode converter a imagem de HDR de 200% que é obtida como resultado de decodificação, em uma imagem de HDR de 400% desejada.

[00318] No exemplo da Figura 43, uma imagem visada de codificação é uma imagem de HDR de 400%. Além disso, o usuário estabelece uma imagem de HDR de 200% que é obtida como resultado da respectivamente converter em joelho 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400% de luminância de uma imagem de HDR de 400%, em 0 a 120%, 120% a 160%, 160% a 180%, e 180% a 200% como uma imagem convertida desejada.

[00319] Neste caso, na knee_function_info SEI, os mesmos valores como na Figura 31 estão estabelecidos como informação de posição de pré- conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) do 0-ésimo a segundo cotovelos. Além disso, 4000 está estabelecido como a informação de gama de luminância não convertida (input_d_range), e 2000 está estabelecido como a informação de gama de luminância convertida (output_d_range).

[00320] Adicionalmente, no exemplo da Figura 43, a informação de luminância de exibição não convertida (input_disp_luminance) é 800 (candela por metro quadrado), e a informação de luminância de exibição convertida (output_disp_luminance) é 400 (candela por metro quadrado). A bandeira de compressão (compression_flag) é 1.

[00321] Como descrito acima, em um caso onde uma imagem visada de codificação é uma imagem com uma gama dinâmica correspondendo à informação de gama de luminância não convertida, e uma imagem convertida é uma imagem com uma gama dinâmica correspondendo à informação de gama de luminância convertida, um cotovelo input_knee_point_PER (%) e luminância output_knee_point_PER (%) de uma imagem convertida correspondendo ao cotovelo estão definidos pela Equação (3) anterior.

[00322] Portanto, o dispositivo de decodificação 90 reconhece que o 0- ésimo a segundo cotovelos input_knee_point_PER são respectivamente 40%, 100%, e 180% de acordo com a Equação (3). Além disso, o dispositivo de decodificação 90 reconhece que a 0-ésima a segunda luminâncias output_knee_point_PER (%) são respectivamente 120%, 160%, e 180%. Adicionalmente, o dispositivo de decodificação 90 reconhece que o valor máximo de luminância da imagem visada de codificação é 400% da informação de gama de luminância de entrada, e o valor máximo de luminância da imagem convertida é 200% da informação de gama de luminância de saída.

[00323] Além disso, o dispositivo de decodificação 90 converte em joelho respectivamente 0 a 40%, 40% a 100%, 100% a 180%, e 180% a 400% de uma imagem de HDR de 400%, que é obtida como resultado de decodificação em 0 a 120%, 120% a 160%, 160% a 180%, e 180% a 200%, conectando os cotovelos um ao outro em uma ordem estabelece,. Portanto, o dispositivo de decodificação 90 pode converter a imagem de HDR de 400% que é obtida como resultado de decodificação em uma imagem de HDR de 200% desejada.

[00324] Como mencionado acima, de acordo com a informação de conversão de DR da Figura 40, não só conversão entre uma imagem de SDR e uma imagem de HDR, mas também conversão entre imagens de HDR com gamas dinâmicas diferentes pode ser executada como desejado por um usuário no dispositivo de decodificação 90. Uma gama dinâmica de uma imagem de HDR pode ser maior que 0 a 100%, e pode ser 0 a 400%, 0 a 800%, 0 a 1300%, e similar. Além disso, um valor esperado de brilho da exibição correspondendo ao valor máximo de luminância de uma imagem de HDR pode ser maior que 100 (candela por metro quadrado), e pode ser 800 (candela por metro quadrado), 4000 (candela por metro quadrado), 1500 (candela por metro quadrado), e similar.

Descrição de Operação do Dispositivo de Decodificação

[00325] A Figura 44 é um diagrama ilustrando uma operação do dispositivo de decodificação 90 em um caso onde a knee_function_info SEI da Figura 40 está estabelecida em uma pluralidade.

[00326] Em um exemplo da Figura 44, uma imagem visada de codificação é uma imagem de HDR de 400%. Além disso, knee_function_info SEI (em seguida, chamada imagem de HDR de 800% knee_function_info SEI) para estabelecer uma imagem convertida desejada a uma imagem de HDR de 800% cuja gama dinâmica é 0 a 800%, e knee_function_info SEI (em seguida, chamada imagem de SDR knee_function_info SEI) para estabelecer uma imagem convertida desejada a uma imagem de SDR, são estabelecidas. Neste caso, IDs de conversão de joelho diferentes são dados à imagem de HDR de 800% knee_function_info SEI e à imagem de SDR knee_function_info SEI.

[00327] Em um caso onde a unidade de exibição 95 é uma exibição de HDR que pode exibir uma imagem de HDR de 800%, o dispositivo de decodificação 90 descomprime em joelho luminância de uma imagem de HDR de 400% que é uma imagem decodificada na base do imagem de HDR de 800% knee_function_info SEI, para gerar uma imagem de HDR de 800% desejada como uma imagem de exibição.

[00328] Por outro lado, em um caso onde a unidade de exibição 95 é uma exibição de HDR que pode exibir uma imagem de HDR de 400%, o dispositivo de decodificação 90 usa uma imagem de HDR de 400% que é uma imagem decodificada como uma imagem de exibição sem mudança. Além disso, em um caso onde a unidade de exibição 95 é uma exibição de SDR, o dispositivo de decodificação 90 comprime em joelho luminância de uma imagem de HDR de 400% que é uma imagem decodificada na base da imagem de SDR knee_function_info SEI, para gerar uma imagem de SDR desejada como uma imagem de exibição.

[00329] Além disso, a informação de conversão de DR da Figura 40 pode ser incluída em SEI como tone_mapping_info_SEI diferente de knee_function_info SEI.

Quarto Exemplo da Sintaxe de tone_mapping_info_SEI

[00330] A Figura 45 é um diagrama ilustrando um exemplo de sintaxe de tone_mapping_info_SEI em um caso onde a informação de conversão de DR da Figura 40 está incluída na tone_mapping_info_SEI.

[00331] Como ilustrado na Figura 45, em um caso onde a informação de conversão de DR da Figura 40 está incluída na tone_mapping_info_SEI, tone_map_model_id é estabelecido a, por exemplo, 5. Além disso, na tone_mapping_info_SEI, uma bandeira de compressão (compression_flag), informação de gama de luminância de entrada (input_d_range), gama de luminância de exibição de entrada (input_d_range_disp_luminance), informação de gama de luminância de saída (output_d_range), gama de luminância de exibição de saída (output_d_range_disp_luminance), um número de cotovelo (num_knee_point_minus1), e informação de posição de pré-conversão (input_knee_point) e informação de posição de pós-conversão (output_knee_point) de cada cotovelo estão estabelecidas na tone_mapping_info_SEI como informação de conversão de DR.

[00332] Além disso, pelo menos um da informação de gama de luminância de entrada (input_d_range), da gama de luminância de exibição de entrada (input_d_range_disp_luminance), da informação de gama de luminância de saída (output_d_range), e da gama de luminância de exibição de saída (output_d_range_disp_luminance) podem não estar incluída na tone_mapping_info_SEI da Figura 45.

[00333] Além disso, na descrição anterior, a informação de conversão de DR está disposta em SEI, mas pode estar disposta em uma camada de sistema. Exemplo de Dispor Informação de Conversão de DR em Caixa de MP4 DESCRIÇÃO de Caixa de MP4 na qual Informação de Conversão de DR Está Disposta

[00334] A Figura 46 é um diagrama ilustrando uma caixa de MP4 como uma camada de sistema na qual informação de conversão de DR está disposta.

[00335] Como ilustrado na Figura 46, em um caso onde informação de conversão de DR está disposta em uma caixa de MP4, uma caixa de tinf (Caixa de Informação de Mapeamento de Tom) que armazena informação de conversão de DR como ToneMapInfo está definida recentemente. A caixa de tinf é armazenada em uma caixa de trilha (caixa de trilha ) (uma caixa de stbl armazenada nisso) ou uma caixa de traf (caixa de fragmento de trilha).

Exemplo da Sintaxe de ToneMapInfo

[00336] A Figura 47 é um diagrama ilustrando um exemplo de sintaxe de ToneMapInfo.

[00337] ToneMapInfo da Figura 47 tem a mesma configuração como aquela da tone_mapping_info_SEI da Figura 32, exceto que padding_value para alinhamento de byte está inserido nisso.

[00338] Além disso, embora não ilustrado, ToneMapInfo pode ter a mesma configuração como aquela da tone_mapping_info_SEI da Figura 26, 27, 39, ou 45, exceto que padding_value para alinhamento de byte está inserido nisso.

[00339] Além disso, da mesma maneira como na segunda modalidade, a informação de conversão na primeira modalidade pode estar disposta em uma camada de sistema.

[00340] Além disso, uma imagem de HDR desejada por um usuário pode ser uma imagem de HDR que é entrada ao dispositivo de codificação 70.

[00341] Adicionalmente, na segunda modalidade, uma imagem de HDR é entrada ao dispositivo de codificação 70, mas uma imagem de SDR pode ser introduzida a isso. Neste caso, quando uma imagem visada de codificação é uma imagem de HDR, o dispositivo de codificação 70 converte uma imagem de SDR que é entrada de um dispositivo externo em uma imagem de HDR que é então estabelecida como uma imagem visada de codificação.

[00342] Além disso, uma pluralidade de cotovelos é estabelecida na knee_function_info SEI da Figura 40. Portanto, conversão de joelho de uma função mais suave e mais complexa pode ser definida do que em um caso onde só um cotovelo está estabelecido. Como resultado, a unidade de conversão 93 pode executar a conversão ótima de joelho.

[00343] Porém, se o número de cotovelos aumentar, uma quantidade de informação de conversão de DR aumenta. Portanto, por exemplo, em um caso onde uma imagem decodificada e informação de conversão de DR são transmitidas com HDMI, uma quantidade da informação de conversão de DR é igual a ou maior que 27 bytes, que é um tamanho de um pacote de AVI InfoFrame de HDMI, e assim a informação de conversão de DR pode não estar incluída em AVI InfoFrame.

[00344] Portanto, em uma terceira modalidade descrita mais tarde, um dispositivo de decodificação executa afinamento de um cotovelo ótimo em um caso onde uma quantidade de informação de conversão de DR está reduzida, tal como um caso onde a informação de conversão de DR é transmitida com HDMI.

Terceira Modalidade Primeiro Exemplo de Semântica

[00345] Uma primeira configuração de uma terceira modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada é igual à configuração do dispositivo de codificação 70 da Figura 16, exceto para a ordem i de cotovelos e semântica indicada pela knee_function_info SEI da Figura 40 estabelecida pela unidade de estabelecimento 71. Portanto, em seguida, só a ordem i de cotovelos e semântica indicada pela knee_function_info SEI da Figura 40 serão descritas.

[00346] Na primeira configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada, a ordem i de cotovelos é estabelecida em uma ordem na qual prioridades para representar uma função desejada de conversão de joelho é mais alta na knee_function_info SEI da Figura 40.

[00347] Além disso, Figura 48 é um diagrama ilustrando que semântica na primeira configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada é diferente daquela na segunda modalidade.

[00348] Como ilustrado na Figura 48, na semântica da Figura 40 na primeira configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada, informação de posição de pré-conversão (input_knee_point[i]) de um i-ésimo cotovelo pode ser igual a ou menos que informação de posição de pré-conversão (input_knee_point[i-1]) de um (i-1)- ésimo cotovelo. Em outras palavras, a ordem i (onde i é um inteiro de 0 ou mais) em que a informação de posição de pré-conversão e a informação de posição de pós-conversão de um cotovelo são estabelecidas pode não ser uma ordem na qual a informação de posição de pós-conversão é menos.

[00349] Além disso, uma função (função de joelho) de conversão de joelho é uma linha reta que conecta cotovelos um ao outro em uma ordem (ordem ascendente) em que a informação de posição de pré-conversão (input_knee_point) é menor.

[00350] Adicionalmente, uma imagem decodificada pode ser convertida em joelho usando uma função aproximada de conversão de joelho. A função aproximada de conversão de joelho é uma linha reta que conecta o 0-ésimo a N-ésimo (onde N é igual a ou maior que 0 e igual ou menor do que num_knee_point_minus1) cotovelos um ao outro em uma ordem na qual a informação de posição de pré-conversão é menos. Desde que a ordem i de cotovelos está estabelecida em uma ordem na qual uma prioridade para representar uma função desejada de conversão de joelho é mais alta, uma função aproximada de conversão de joelho é mais aproximada a uma função desejada de conversão de joelho como N é maior. Primeiro Exemplo de Configuração de Uma Modalidade de Sistema de Decodificação

[00351] A Figura 49 é um diagrama de bloco ilustrando um primeiro exemplo de configuração de uma modalidade de um sistema de decodificação ao qual a descrição presente é aplicada e que decodifica um fluxo codificado transmitido da primeira configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada.

[00352] Entre elementos constituintes ilustrados na Figura 49, os mesmos elementos constituintes como os elementos constituintes de Figuras 12 e 22 são dados os mesmos numerais de referência. Descrição repetida será omitida como apropriado.

[00353] Um sistema de decodificação 110 da Figura 49 inclui um dispositivo de decodificação 111 e um dispositivo de exibição 112. O dispositivo de decodificação 111 inclui uma unidade de recepção 51, uma unidade de extração 91, uma unidade de decodificação 92, uma unidade de seleção 121 e uma unidade de transmissão 122.

[00354] A unidade de seleção 121 do dispositivo de decodificação 111 adquire knee_function_info SEI entre conjuntos de parâmetros extraídos pela unidade de extração 91. A unidade de seleção 121 seleciona informação de conversão de DR do número (por exemplo, 3) de cotovelos incluídos em um único pacote de AVI InfoFrame de HDMI em uma ordem na qual a ordem i é mais baixa dentre pedaços de informação de conversão de DR de uma pluralidade de cotovelos incluídos na knee_function_info SEI. A unidade de seleção 121 provê a informação de conversão de DR selecionada do cotovelo à unidade de transmissão 122.

[00355] A unidade de transmissão 122 dispõe a informação de conversão de DR selecionada pela unidade de seleção 121 em um único pacote de AVI InfoFrame de HDMI, e transmite um resultado disso para o dispositivo de exibição 112 com HDMI junto com uma imagem decodificada gerada pela unidade de decodificação 92.

[00356] O dispositivo de exibição 112 inclui uma unidade de recepção 131, uma unidade de conversão 93, uma unidade de controle de exibição 94 e uma unidade de exibição 95.

[00357] A unidade de recepção 131 do dispositivo de exibição 112 recebe AVI InfoFrame e a imagem decodificada que são transmitidos da unidade de transmissão 122 com HDMI. A unidade de recepção 131 provê a informação de conversão de DR disposta em AVI InfoFrame e a imagem decodificada à unidade de conversão 93.

Descrição do Primeiro Método de Seleção de Cotovelo

[00358] A Figura 50 é um diagrama ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida pela knee_function_info SEI que é recebida pelo sistema de decodificação 110 da Figura 49.

[00359] Além disso, no exemplo da Figura 50, um número de cotovelo (number_knee_point_minus1) estabelecido na knee_function_info SEI é 8.

[00360] Como ilustrado na Figura 50A, entre oito cotovelos estabelecidos na knee_function_info SEI, informação de posição de pré- conversão (input_knee_point [0]) do cotovelo de 0-ésimo é 200, e informação de posição de pós-conversão (output_knee_point [0]) disso é 433. Além disso, informação de posição de pré-conversão (input_knee_point[1]) do primeiro cotovelo é 600, e informação de posição de pós-conversão (output_knee_point[1]) disso é 774, e informação de posição de pré- conversão (input_knee_point[2]) do segundo cotovelo é 100, e informação de posição de pós-conversão (output_knee_point[2]) disso é 290.

[00361] Adicionalmente, informação de posição de pré-conversão (input_knee_point[3]) do terceiro cotovelo é 400, e informação de posição de pós-conversão (output_knee_point[3]) disso é 628, e informação de posição de pré-conversão (input_knee_point[4]) do quarto cotovelo é 800, e informação de posição de pós-conversão (output_knee_point[4]) disso é 894.

[00362] Além disso, informação de posição de pré-conversão (input_knee_point[5]) do quinto cotovelo é 300, e informação de posição de pós-conversão (output_knee_point[5]) disso é 540, e informação de posição de pré-conversão (input_knee_point[6]) do sexto cotovelo é 500, e informação de posição de pós-conversão (output_knee_point[6]) disso é 705.

[00363] Além disso, informação de posição de pré-conversão (input_knee_point[7]) do sétimo cotovelo é 700, e informação de posição de pós-conversão (output_knee_point[7]) disso é 836, e informação de posição de pré-conversão (input_knee_point[8]) do oitavo cotovelo é 900, e informação de posição de pós-conversão (output_knee_point[8]) disso é 949.

[00364] Neste caso, os cotovelos respectivos estão conectados um ao outro em uma ordem na qual a informação de posição de pré-conversão é menos, e assim uma função de conversão de joelho é como ilustrada na Figura 50B. Em outras palavras, uma linha reta que conecta os cotovelos um ao outro em uma ordem do segundo, 0-ésimo, quinto, terceiro, sexto, primeiro, sétimo, quarto e oitavo cotovelos, serve como uma função de conversão de joelho. Além disso, o eixo transversal da Figura 50B expressa luminância de uma imagem visada de codificação, e o eixo longitudinal expressa luminância de uma imagem convertida. Isto também é o mesmo para as Figuras 51, 52, e 57 a 59 descritas mais tarde.

[00365] Em um caso onde a unidade de seleção 121 seleciona pedaços de informação de conversão de DR de três cotovelos dos pedaços de informação de conversão de DR dos cotovelos definidos pela knee_function_info SEI da Figura 50A, uma função aproximada de conversão de joelho tendo os cotovelos selecionados é como ilustrada na Figura 51.

[00366] Em outras palavras, neste caso, a unidade de seleção 121 seleciona pedaços de informação de conversão de DR do 0-ésimo a segundo cotovelos dentre os pedaços de informação de conversão de DR do 0-ésimo a oitavo cotovelos definidos pela knee_function_info SEI. Portanto, uma função de conversão de joelho tendo os cotovelos selecionados é uma linha reta que conecta o 0-ésimo a segundo cotovelos um ao outro em uma ordem na qual a informação de posição de pré-conversão é menos, quer dizer, em uma ordem do segundo, 0-ésimo e primeiro cotovelos.

[00367] Enquanto isso, em um caso onde a unidade de seleção 121 seleciona pedaços de informação de conversão de DR de cinco cotovelos dentre os pedaços de informação de conversão de DR dos cotovelos definidos pela knee_function_info SEI da Figura 50A, uma função aproximada de conversão de joelho tendo os cotovelos selecionados é como ilustrada na Figura 52.

[00368] Em outras palavras, neste caso, a unidade de seleção 121 seleciona pedaços de informação de conversão de DR do 0-ésimo a quarto cotovelos dentre os pedaços de informação de conversão de DR do 0-ésimo a oitavo cotovelos definidos pela knee_function_info SEI. Portanto, uma função de conversão de joelho tendo os cotovelos selecionados é uma linha reta que conecta o 0-ésimo a quarto cotovelos um ao outro em uma ordem na qual a informação de posição de pré-conversão é menos, quer dizer, em uma ordem do segundo, 0-ésimo, terceiro, primeiro e quartos cotovelos.

[00369] A ordem i dos cotovelos é estabelecida em uma ordem de uma prioridade para representar a função da Figura 50B, que é uma função desejada de conversão de joelho é mais alta, e pedaços de informação de conversão de DR de um número predeterminado de cotovelos são selecionados da ordem mais baixa i. Portanto, como ilustrado nas Figuras 51 e 52, uma função aproximada de conversão de joelho é mais aproximada à função da Figura 50B do que em um caso onde outros cotovelos do mesmo número são selecionados.

[00370] Além disso, um número maior de cotovelos conduz a uma função mais suave e mais complexa. Portanto, uma função aproximada de conversão de joelho da Figura 52 na qual o número de cotovelos é cinco é mais aproximada à função de conversão de joelho da Figura 50B do que uma função aproximada de conversão de joelho da Figura 51 na qual o número de cotovelos é três.

Descrição do Processo de Sistema de Decodificação

[00371] A Figura 53 é um fluxograma ilustrando um processo de decodificação executado pelo dispositivo de decodificação 111 do sistema de decodificação 110 da Figura 49.

[00372] Na etapa S111 da Figura 53, a unidade de recepção 51 do dispositivo de decodificação 111 recebe um fluxo codificado transmitido do dispositivo de codificação 70 da Figura 16, e provê o fluxo codificado para a unidade de extração 91.

[00373] Na etapa S112, a unidade de extração 91 extrai conjuntos de parâmetros e dados codificados do fluxo codificado que é provido da unidade de recepção 51. A unidade de extração 91 provê os conjuntos de parâmetros e os dados codificados para a unidade de decodificação 92. Além disso, a unidade de extração 91 provê knee_function_info SEI entre os conjuntos de parâmetros à unidade de seleção 121.

[00374] Na etapa S113, a unidade de decodificação 92 decodifica os dados codificados providos da unidade de extração 91 no método de HEVC. Neste momento, a unidade de decodificação 92 também se refere aos conjuntos de parâmetros providos da unidade de extração 91, como necessário. A unidade de decodificação 92 provê a imagem decodificada para a unidade de transmissão 122.

[00375] Na etapa S114, a unidade de seleção 121 seleciona informação de conversão de DR do número de cotovelos incluídos em um único pacote de AVI InfoFrame de HDMI em uma ordem na qual a ordem i é mais baixa dentre pedaços de informação de conversão de DR de uma pluralidade de cotovelos incluídos na knee_function_info SEI da unidade de extração 91. A unidade de seleção 121 provê a informação de conversão de DR selecionada do cotovelo à unidade de transmissão 122.

[00376] Na etapa S115, a unidade de transmissão 122 dispõe a informação de conversão de DR selecionada pela unidade de seleção 121 em um único pacote de AVI InfoFrame de HDMI, e transmite um resultado disso ao dispositivo de exibição 112 com HDMI junto com uma imagem decodificada gerada pela unidade de decodificação 92. Além disso, o processo é terminado.

[00377] A Figura 54 é um fluxograma ilustrando um processo de exibição executado pelo dispositivo de exibição 112 do sistema de decodificação 110.

[00378] Na etapa S131 da Figura 54, a unidade de recepção 131 do dispositivo de exibição 112 recebe a informação de conversão de DR disposta em AVI InfoFrame e a imagem decodificada que são transmitidas da unidade de transmissão 122 com HDMI. A unidade de recepção 131 provê a informação de conversão de DR e a imagem decodificada para a unidade de conversão 93.

[00379] Processos nas etapas S132 a S134 são iguais aos processos nas etapas S95 e S97 da Figura 23, e assim descrição disso não será repetida.

[00380] Como mencionado acima, na primeira configuração da terceira modalidade à qual a descrição presente é aplicada, a informação de conversão de DR do cotovelo no qual a ordem é estabelecida em uma ordem na qual uma prioridade para representar uma conversão de joelho desejada é mais alta é estabelecida na knee_function_info SEI e é transmitida. Portanto, o dispositivo de decodificação 111 seleciona informação de conversão de DR do número de cotovelos incluídos em um único pacote de AVI InfoFrame em uma ordem em qual a ordem i é mais baixa, e assim pode dispor informação de conversão de DR do cotovelo indicando uma função aproximada de conversão de joelho que é mais aproximada a uma função desejada de conversão de joelho em um único pacote de AVI InfoFrame.

Exemplo da Sintaxe de knee_function_info SEI

[00381] Uma segunda configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada é igual à configuração do dispositivo de codificação 70 da Figura 16, exceto para a knee_function_info SEI estabelecida pela unidade de estabelecimento 71 e semântica. Portanto, em seguida, só a knee_function_info SEI e semântica serão descritas.

[00382] A Figura 55 é um diagrama ilustrando um exemplo de sintaxe de knee_function_info SEI estabelecida pela unidade de estabelecimento 71 na segunda configuração da terceira modalidade do dispositivo de codificação ao qual a descrição presente é aplicada.

[00383] A knee_function_info SEI da Figura 55 é igual à knee_function_info SEI da Figura 40, exceto que um índice de cotovelo aproximado (approximate_knee_point_index) (informação de prioridade) indicando a ordem i está estabelecido em uma ordem na qual uma prioridade para representar uma função desejada de conversão de joelho é mais alta.

[00384] Na knee_function_info SEI da Figura 55, a ordem i de cotovelos é uma ordem na qual a informação de posição de pré-conversão é menos da mesma maneira como no caso da Figura 40, mas o índice de cotovelo aproximado (approximate_knee_point_index) está estabelecido recentemente. Um valor do índice de cotovelo aproximado (approximate_knee_point_index) é igual a ou menos que o número de cotovelo (number_knee_point_minus1).

Segundo Exemplo de Semântica

[00385] A Figura 56 é um diagrama ilustrando que semântica da Figura 55 é diferente daquela da segunda modalidade.

[00386] Como ilustrado na Figura 56, na semântica da Figura 55, uma imagem decodificada pode ser convertida em joelho usando uma função aproximada de conversão de joelho. Esta função aproximada de conversão de joelho é uma linha reta que conecta cotovelos em que a ordem i é 0-ésimo a N-ésimo (onde N é igual a ou maior que 0 e igual ou menor que num_knee_point_minus1) índice de cotovelo aproximado (approximate_knee_point_index [0] para approximate_knee_point_index[N]) em uma ordem em qual a ordem i é mais baixa. Uma ordem j dos índices de cotovelo aproximado é uma ordem na qual uma prioridade para representar uma função desejada de conversão de joelho é mais alta, e assim uma função aproximada de conversão de joelho é mais aproximada a uma função desejada de conversão de joelho como N é maior.

Exemplo de Configuração de Uma Modalidade de Sistema de Codificação

[00387] Uma segunda configuração de uma modalidade do sistema de decodificação ao qual a descrição presente é aplicada é igual à configuração do sistema de decodificação 110 da Figura 49, exceto que a seleção pela unidade de seleção 121 é executada não na base da ordem i de cotovelos, mas na ordem j dos índices de cotovelo aproximado. Portanto, em seguida, só a seleção pela unidade de seleção 121 será descrita.

Descrição do Segundo Método de Seleção de Cotovelo

[00388] As Figuras 57A e 57B são diagramas ilustrando um exemplo de um cotovelo e uma função de conversão de joelho definida pela knee_function_info SEI da Figura 55.

[00389] Além disso, no exemplo de Figuras 57A e 57B, um número de cotovelo (number_knee_point_minus1) estabelecido na knee_function_info SEI é 8 da mesma maneira como nas Figuras 50A e 50B, e cotovelos também são iguais como nas Figuras 50A e 50B. Porém, na knee_function_info SEI da Figura 55, a ordem i de cotovelos é uma ordem na qual a informação de posição de pré-conversão é menos, e é assim diferente daquela das Figuras 50A e 50B.

[00390] Como ilustrado na Figura 57A, entre oito cotovelos estabelecidos na knee_function_info SEI, informação de posição de pré- conversão (input_knee_point [0]) do cotovelo de 0-ésimo é 100, e informação de posição de pós-conversão (output_knee_point [0]) disso é 290. Além disso, informação de posição de pré-conversão (input_knee_point[1]) do primeiro cotovelo é 200, e informação de posição de pós-conversão (output_knee_point[1]) disso é 433, e informação de posição de pré- conversão (input_knee_point[2]) do segundo cotovelo é 300, e informação de posição de pós-conversão (output_knee_point[2]) disso é 540.

[00391] Adicionalmente, informação de posição de pré-conversão (input_knee_point[3]) do terceiro cotovelo é 400, e informação de posição de pós-conversão (output_knee_point[3]) disso é 628, e informação de posição de pré-conversão (input_knee_point[4]) do quarto cotovelo é 500, e informação de posição de pós-conversão (output_knee_point[4]) disso é 705.

[00392] Além disso, a informação de posição de pré-conversão (input_knee_point[5]) do quinto cotovelo é 600, e informação de posição de pós-conversão (output_knee_point[5]) disso é 774, e informação de posição de pré-conversão (input_knee_point[6]) do sexto cotovelo é 700, e informação de posição de pós-conversão (output_knee_point[6]) disso é 836.

[00393] Além disso, a informação de posição de pré-conversão (input_knee_point[7]) do sétimo cotovelo é 800, e informação de posição de pós-conversão (output_knee_point[7]) disso é 894, e informação de posição de pré-conversão (input_knee_point[8]) do oitavo cotovelo é 900, e informação de posição de pós-conversão (output_knee_point[8]) disso é 949.

[00394] Neste caso, os cotovelos respectivos estão conectados um ao outro em uma ordem na qual a ordem i é mais baixa, e assim uma função de conversão de joelho é como ilustrada na Figura 57B.

[00395] Além disso, como ilustrado na Figura 57A, os índices de cotovelo aproximados (approximate_knee_point_index) em que a ordem j é 0 a 8 são 1, 5, 0, 3, 7, 2, 4, 6, e 8 em ordem.

[00396] Em um caso onde a unidade de seleção 121 seleciona pedaços de informação de conversão de DR de três cotovelos dentre os pedaços de informação de conversão de DR dos cotovelos definidos pela knee_function_info SEI da Figura 57A, uma função de conversão de joelho tendo os cotovelos selecionados é como ilustrada na Figura 58.

[00397] Em outras palavras, neste caso, a unidade de seleção 121 seleciona pedaços de informação de conversão de DR dos cotovelos em que a ordem i é o 0-ésimo a segundo índices de cotovelo aproximados (approximate_knee_point_index) dentre os pedaços de informação de conversão de DR do 0-ésimo a oitavo cotovelos definidos pela knee_function_info SEI. Em outras palavras, a unidade de seleção 121 seleciona os pedaços de informação de conversão de DR do primeiro, quinto e 0-ésimo cotovelos. Portanto, uma função de conversão de joelho tendo os cotovelos selecionados é uma linha reta que conecta o primeiro, quinto e 0- ésimo cotovelos um ao outro em uma ordem na qual a ordem é mais baixa, isso é, em uma ordem do 0-ésimo, primeiro e quinto cotovelos.

[00398] Enquanto isso, em um caso onde a unidade de seleção 121 seleciona pedaços de informação de conversão de DR de cinco cotovelos dentre os pedaços de informação de conversão de DR dos cotovelos definidos pela knee_function_info SEI da Figura 57A, uma função de conversão de joelho tendo os cotovelos selecionados é como ilustrada na Figura 59.

[00399] Em outras palavras, neste caso, a unidade de seleção 121 seleciona pedaços de informação de conversão de DR dos cotovelos em que a ordem i é o 0-ésimo a quarto índices de cotovelo aproximados (approximate_knee_point_index) dentre os pedaços de informação de conversão de DR do 0-ésimo a oitavo cotovelos definidos pela knee_function_info SEI. Em outras palavras, a unidade de seleção 121 seleciona os pedaços de informação de conversão de DR do primeiro, quinto, 0-ésimo, terceiro e sétimo cotovelos. Portanto, uma função de conversão de joelho tendo os cotovelos selecionados é uma linha reta que conecta o primeiro, quinto, 0-ésimo, terceiro e sétimo cotovelos um ao outro em uma ordem na qual a ordem i é mais baixa, isso é, em uma ordem do 0-ésimo, primeiro, terceiro, quinto e sétimo cotovelos.

[00400] A ordem j dos índices de cotovelo aproximado é estabelecida em uma ordem de prioridades para representar a função da Figura 57B, que é uma função desejada de conversão de joelho é mais alta, e pedaços de informação de conversão de DR de cotovelos com um número predeterminado de índices de cotovelo aproximados na ordem i são selecionados da ordem mais baixa j. Portanto, como ilustrado nas Figuras 58 e 59, uma função aproximada de conversão de joelho é mais aproximada à função da Figura 57B do que em um caso onde outros cotovelos do mesmo número são selecionados.

[00401] Além disso, um número maior de cotovelos conduz a uma função mais suave e mais complexa. Portanto, uma função aproximada de conversão de joelho da Figura 59 na qual o número de cotovelos é cinco é mais aproximada à função de conversão de joelho da Figura 57B do que uma função aproximada de conversão de joelho da Figura 58 na qual o número de cotovelos é três.

[00402] Além disso, como ilustrado na Figura 60, o índice de cotovelo aproximado (approximate_knee_point_index) pode ser estabelecido em approximate_knee_function_info SEI diferente de knee_function_info SEI.

[00403] Neste caso, um ID de conversão de joelho aproximada (approximate_knee_function_id) e uma bandeira de cancelamento de conversão de joelho aproximada (approximate_knee_function_cancel_flag) são estabelecidos na approximate_knee_function_info SEI.

[00404] O ID de conversão de joelho aproximada é um ID único para o propósito de conversão de joelho usando uma função aproximada. Além disso, a bandeira de cancelamento de conversão de joelho aproximada é uma bandeira ilustrando se ou não persistência de approximate_knee_function_info SEI prévia está cancelada. A bandeira de cancelamento de conversão de joelho aproximada é estabelecida a 1 ao indicar que persistência de approximate_knee_function_info prévio SEI está cancelada, e é estabelecida a 0 quando a persistência não está cancelada.

[00405] Em um caso onde a bandeira de cancelamento de conversão de joelho aproximada é 0, um ID de conversão de joelho de referência (ref_knee_function_id) é estabelecido na approximate_knee_function_info SEI. O ID de conversão de joelho de referência é um ID de conversão de joelho de knee_function_info SEI incluindo informação de DR de um cotovelo indicando uma função de conversão de joelho que é aproximada usando um índice de cotovelo aproximado da approximate_knee_function_info SEI.

[00406] Além disso, um número de índice de cotovelo aproximado (num_approximate_knee_point_indices_minus1) que é um valor obtido subtraindo 1 do número de índices de cotovelo aproximados, e um aproximadamente índice de cotovelo (approximate_knee_point_index) são estabelecidos.

[00407] Como mencionado acima, também em um caso onde o índice de cotovelo aproximado (approximate_knee_point_index) está estabelecido na approximate_knee_function_info SEI, semântica é igual como a semântica descrita na Figura 56.

[00408] Além disso, na descrição anterior, só a knee_function_info SEI incluindo informação de DR de um cotovelo indicando uma função de conversão de joelho é estabelecida, mas knee_function_info SEI incluindo informação de DR de um cotovelo indicando uma função aproximada de conversão de joelho pode ser estabelecida. Neste caso, por exemplo, informação de DR de um cotovelo indicando uma função de conversão de joelho é estabelecida a knee_function_info SEI em que uma conversão de joelho ID é 0, e informação de DR de um cotovelo indicando uma função aproximada de conversão de joelho é estabelecida a knee_function_info SEI em que um ID de conversão de joelho é 1. Adicionalmente, em um caso onde informação de DR é transmitida com HDMI, o dispositivo de decodificação dispõe a informação de DR incluída na knee_function_info SEI em que o ID de conversão de joelho é 1, em um único pacote de AVI InfoFrame, e transmite a informação de DR.

[00409] Além disso, um ID único é estabelecido em brilho predeterminado como a informação de luminância de exibição não convertida (input_disp_luminance) e a informação de gama de luminância convertida (output_d_range), e assim é possível reduzir uma quantidade de informação de DR. Neste caso, por exemplo, 0 pode ser nomeado a 400 candela por metro quadrado, e 1 pode ser nomeado a 800 candela por metro quadrado, como um ID. Uma relação de correspondência entre um ID e brilho nomeado com o ID é estabelecido em comum a um lado de codificação e um lado de exibição, e assim o lado de exibição pode reconhecer o brilho do ID.

[00410] Na terceira modalidade, um cotovelo é selecionado em uma ordem na qual prioridades para representar uma função desejada de conversão de joelho são mais altas, mas um cotovelo pode ser selecionado em outras ordens.

[00411] Além disso, na terceira modalidade, o número de cotovelos selecionados é o número que pode ser incluído em um único pacote de AVI InfoFrame, mas não está limitado a isso. Por exemplo, em um caso onde a dispositivo de decodificação 111 tem uma função do dispositivo de exibição 112, o número de cotovelos selecionados pode ser o número de cotovelos correspondendo à conversão de joelho que pode ser processada pela unidade de conversão 93, ou similar.

Quarta Modalidade Base da Quarta Modalidade

[00412] Como ilustrado na Figura 61, em um tubo de raios catódicos (CRT) usado em uma exibição de CRT, um sinal elétrico de entrada e luminância de exibição não têm nenhuma relação proporcional, e é necessário introduzir um sinal elétrico mais alto a fim de exibir luminância alta. Portanto, se um sinal elétrico que é proporcional à luminância de uma imagem for entrado à exibição de CRT como ilustrado na Figura 62, a luminância de exibição é mais baixa do que a luminância original da imagem como ilustrado na Figura 63. Portanto, a fim de exibir uma imagem com a luminância original da imagem, como ilustrado na Figura 64, é necessário converter a luminância de uma imagem em um sinal elétrico usando uma função tendo uma característica contrária àquela da função da Figura 61.

[00413] Além disso, nas Figuras 61 e 63, o eixo transversal expressa um valor obtido normalizando um sinal elétrico de entrada quando um valor do sinal elétrico de entrada para exibir com a luminância máxima na exibição de CRT está estabelecido a 1, e o eixo longitudinal expressa um valor obtido normalizando a luminância de exibição quando o valor máximo da luminância de exibição da exibição de CRT está estabelecido a 1. Nas Figuras 62 e 64, o eixo transversal expressa um valor obtido normalizando a luminância de uma imagem visada de exibição quando o valor máximo da luminância de uma imagem visada de exibição está estabelecido a 1, e o eixo longitudinal expressa um valor obtido normalizando um sinal elétrico quando um valor do sinal elétrico correspondendo ao valor máximo da luminância de uma imagem visada de exibição está estabelecido a 1.

[00414] Uma função para converter uma sinal elétrico de entrada em luminância de exibição como ilustrado na Figura 61 é chamada função de transferência eletro-óptica (EOTF), e uma função para converter a luminância de uma imagem em um sinal elétrico como ilustrado na Figura 64 é chamada uma função de transferência óptico-elétrica (OETF).

[00415] Outras exibições tal como um painel de diodo emissor de luz (LED) tem características diferentes das características da exibição de CRT. Porém, a fim de não mudar procedimentos de geração de um sinal elétrico de entrada dependendo de exibições, processos usando a EOTF e a OETF também são executados da mesma maneira como na exibição de CRT em um caso de executar exibição com outras exibições.

[00416] A Figura 65 é um diagrama ilustrando um exemplo de um fluxo de um processo até que uma imagem seja exibida de captura da imagem.

[00417] Além disso, no exemplo da Figura 65, um sinal elétrico é um valor de código de 10 bits (0 a 1023), e a OETF e a EOFT estão definidas em BT.709.

[00418] Como ilustrado na Figura 65, quando uma imagem é capturada por uma câmera ou similar, um processo de conversão fotoelétrica de converter luminância (luz) em um sinal elétrico (valor de código) usando a OETF é executado na imagem capturada. Então, o sinal elétrico é codificado, e o sinal elétrico codificado é decodificado. Além disso, um processo de conversão eletro-óptica de converter um sinal elétrico em luminância usando a EOTF é executado no sinal elétrico decodificado.

[00419] Enquanto isso, o senso visual humano tem uma característica de ser sensível a uma diferença de luminância à baixa luminância e ser insensível a uma diferença de luminância à alta luminância. Portanto, como ilustrado na Figura 65, a OETF de BT.709 é uma função na qual mais valores de código são nomeados a uma parte de baixa luminância do que uma parte de alta luminância. Como resultado, qualidade de imagem subjetivamente suficiente é percebida.

[00420] Em um caso onde a luminância máxima de uma imagem é cerca de 100 candela por metro quadrado, valores de código satisfatórios podem ser nomeados a uma parte de baixa luminância usando a OETF de BT.709. Porém, a luminância máxima de exibições tendeu recentemente a aumentar, e é esperado ser acelerada no futuro. Se a luminância máxima de uma imagem aumentar de acordo com isso, valores de código a serem nomeados a uma parte de baixa luminância são insuficientes na OETF de BT.709, e assim qualidade de imagem satisfatória não pode ser obtida.

[00421] Portanto, é considerado que uma nova OETF para uso em uma imagem de HDR na qual uma relação de valores de código nomeados a uma parte de baixa luminância é aumentada seja gerada, e assim qualidade de imagem satisfatória é obtida em uma imagem de HDR. Porém, neste caso, a fim de executar um processo de conversão fotoelétrica e um processo de conversão eletro-óptica, é necessário preparar uma OETF e uma EOTF para uma imagem de HDR e uma OETF e uma EOTF para uma imagem de SDR.

[00422] Por outro lado, em um caso onde a conversão eletro-óptica é executada em uma imagem de SDR usando uma OETF para uma imagem de HDR, expressão de escala de cinza de luminância é grosseira.

[00423] Por exemplo, como ilustrado na Figura 66, em um caso onde a conversão fotoelétrica é executada em uma imagem de SDR usando uma OETF de BT.709 para uma imagem de SDR tendo a luminância máxima de 100 candela por metro quadrado, a luminância da imagem de SDR é expressa em códigos de 1024 incluindo 0 a 1023. Em contraste, como ilustrado na Figura 67, em um caso onde a conversão fotoelétrica é executada em uma imagem de SDR usando uma OETF para uma imagem de HDR tendo a luminância máxima de 400 candela por metro quadrado, a luminância da imagem de SDR é expressa, por exemplo, em 502 valores de código incluindo 0 a 501.

[00424] Portanto, uma OETF e uma EOTF são preferivelmente variáveis a fim de nomear valores de código suficientes a uma parte de baixa luminância em ambas uma imagem de HDR tendo alta luminância máxima e uma imagem de SDR tendo baixa luminância máxima. Portanto, na quarta modalidade, conversão de joelho é executada antes da OETF de BT.709 e depois da EOTF de BT.709, e assim valores de código suficientes podem ser nomeados a uma parte de baixa luminância. Panorama do Processo de Conversão Fotoelétrica na Quarta Modalidade

[00425] A Figura 68 é um diagrama ilustrando uma panorama de um processo de conversão fotoelétrica na quarta modalidade.

[00426] Como ilustrado na parte esquerda da Figura 68, na quarta modalidade, primeiro, conversão de joelho predeterminada é executada em luminância (luminância de entrada) de uma imagem capturada. Em um exemplo da Figura 68, pela conversão de joelho, 10% de uma parte de baixa luminância da luminância de entrada é convertido em 90% da parte de baixa luminância de luminância de entrada, e 90% de uma parte de alta luminância da luminância de entrada é convertido em 10% da parte de alta luminância da luminância de entrada. Por conseguinte, há uma geração da luminância de entrada na qual mais valores são nomeados à parte de baixa luminância do que à parte de alta luminância.

[00427] A seguir, como ilustrado na parte central da Figura 68, um processo de conversão fotoelétrica usando a OETF de BT.709 é executado na luminância de entrada de modo a gerar um valor de código de um número predeterminado de bits (10 bits no exemplo da Figura 68). Como descrito acima, desde que, na luminância de entrada, mais valores são nomeados à parte de baixa luminância do que à parte alta de luminância, como ilustrado na parte direita da Figura 68, mais valores são nomeados em valores de código convertidos da luminância de entrada devido à parte de baixa luminância da luminância de entrada do que na OETF de BT.709. No exemplo da Figura 68, 10% da parte de baixa luminância da luminância de entrada é nomeado a 94% de valores de código.

[00428] Como mencionado acima, na quarta modalidade, uma extensão de nomear valores de código a uma parte de baixa luminância (parte escura) e uma extensão de nomear os valores de código a uma parte de alta luminância (parte luminosa) é ajustada usando uma função de conversão de joelho como um parâmetro.

[00429] Além disso, informação sobre um cotovelo de conversão de joelho executada na luminância de entrada é estabelecida na knee_function_info SEI da Figura 40 e é transmitida para um lado de decodificação.

Panorama do Processo de Conversão Eletro-Óptica na Quarta Modalidade

[00430] A Figura 69 é um diagrama ilustrando uma panorama de um processo de conversão eletro-óptica na quarta modalidade.

[00431] Como ilustrado na parte esquerda da Figura 69, na quarta modalidade, primeiro, um processo de conversão eletro-óptica usando a EOTF de BT.709 é executado em valores de código de uma imagem decodificada de modo a gerar luminância (luminância de saída). A seguir, como ilustrado na parte central da Figura 69, conversão de joelho predeterminada é executada na luminância de saída. Em um exemplo da Figura 68, pela conversão de joelho, 90% de uma parte baixa de luminância da luminância de saída é convertido em 10% de uma parte de baixa luminância de luminância de saída, e 10% de uma parte de luminância alta da luminância de saída é convertido em 90% de uma parte alta de luminância da luminância de saída.

[00432] Por conseguinte, como ilustrado na parte direita da Figura 69, valores de código nos quais mais valores são nomeados devido à parte de baixa luminância da luminância de entrada do que na EOTF de BT.709 podem ser convertidos na mesma luminância de saída como a luminância de entrada correspondendo aos valores de código.

[00433] Como mencionado acima, na quarta modalidade, valores de código em que uma extensão de nomeação para uma parte baixa de luminância (parte escura) e uma extensão de nomeação para uma parte alta de luminância (parte luminosa) são ajustadas são convertidos em luminância usando uma função de conversão de joelho como um parâmetro.

[00434] Além disso, informação sobre um cotovelo de conversão de joelho executada na luminância de saída é determinada na base de informação estabelecida na knee_function_info SEI ou similar transmitida de um lado de codificação.

Exemplo de Configuração da Quarta Modalidade de Dispositivo de Codificação

[00435] A Figura 70 é um diagrama de bloco ilustrando um exemplo de configuração da quarta modalidade de um dispositivo de codificação ao qual a descrição presente é aplicada.

[00436] Entre elementos constituintes ilustrados na Figura 70, os mesmos elementos constituintes como os elementos constituintes da Figura 6 ou 16 são dados os mesmos numerais de referência. Descrição repetida será omitida como apropriado.

[00437] Uma configuração de um dispositivo de codificação 150 da Figura 70 é diferente da configuração da Figura 16 visto que uma unidade de quantização 151 é provida em vez da unidade de conversão 73. O dispositivo de codificação 150 executa um processo de conversão fotoelétrica em uma imagem capturada que é entrada de um dispositivo externo de modo a executar codificação.

[00438] Especificamente, a unidade de quantização 151 do dispositivo de codificação 150 converte em joelho luminância da imagem capturada que é entrada do dispositivo externo. Informação sobre um cotovelo da conversão de joelho é estabelecida em knee_function_info SEI pela unidade de estabelecimento 71. A unidade de quantização 151 executa um processo de conversão fotoelétrica usando a OETF de BT.709 na luminância convertida em joelho de modo a gerar um valor de código. A unidade de quantização 151 provê o valor de código gerado para a unidade de codificação 72 como uma imagem visada de codificação.

Descrição do Processo no Dispositivo de Codificação

[00439] A Figura 71 é um fluxograma ilustrando um processo de geração de fluxo executado pelo dispositivo de codificação 150 da Figura 70.

[00440] Na etapa S150 da Figura 71, a unidade de quantização 151 do dispositivo de codificação 150 converte em joelho a luminância de uma imagem capturada que é entrada de um dispositivo externo. Na etapa S152, a unidade de quantização 151 executa um processo de conversão fotoelétrica usando a EOTF de BT.709 na luminância convertida em joelho de modo a gerar um valor de código. A unidade de quantização 151 provê o valor de código gerado para a unidade de codificação 72 como uma imagem visada de codificação.

[00441] Processos nas etapas S152 a S154 são iguais aos processos nas etapas S73 a S75 da Figura 21, e assim descrição disso será omitida.

[00442] Na etapa S155, a unidade de estabelecimento 71 estabelece knee_function_info SEI incluindo informação sobre um cotovelo da conversão de joelho executada devido ao processo na etapa S150. A unidade de estabelecimento 71 provê conjuntos de parâmetros como o SPS, PPS, VUI e knee_function_info SEI estabelecidos para a unidade de codificação 72.

[00443] Na etapa S156, a unidade de codificação 72 codifica a imagem visada de codificação que é provida da unidade de conversão 73 no método de HEVC. Processos nas etapas S157 e S158 são iguais aos processos nas etapas S78 e S79 da Figura 21, e assim descrição disso será omitida.

[00444] Como mencionado acima, o dispositivo de codificação 150 executa a conversão de joelho antes da OETF de BT.709, e assim pode executar um processo de conversão fotoelétrica satisfatório para ambas uma imagem de SDR e uma imagem de HDR usando a OETF de BT.709.

Exemplo da Configuração da Quarta Modalidade de Dispositivo de Decodificação

[00445] A Figura 72 é um diagrama de bloco ilustrando um exemplo de configuração da quarta modalidade de um dispositivo de decodificação ao qual a descrição presente é aplicada e que decodifica um fluxo codificado transmitido do dispositivo de codificação 150 da Figura 70.

[00446] Entre elementos constituintes ilustrados na Figura 72, os mesmos elementos constituintes como os elementos constituintes da Figura 12 ou 22 são dados os mesmos numerais de referência. Descrição repetida será omitida como apropriado.

[00447] Uma configuração de um dispositivo de decodificação 170 da Figura 72 é diferente da configuração do dispositivo de decodificação 90 da Figura 22 visto que uma unidade de conversão 171 é provida em vez da unidade de conversão 93. O dispositivo de decodificação 170 decodifica um fluxo codificado, e executa um processo de conversão eletro-óptica em uma imagem decodificada que é obtida como resultado disso.

[00448] Especificamente, a unidade de conversão 171 do dispositivo de decodificação 170 executa um processo de conversão eletro-óptica usando a EOTF de BT.709 em um valor de código como uma imagem decodificada provida da unidade de decodificação 92, de modo a gerar luminância. A unidade de conversão 171 executa conversão de joelho na luminância na base de knee_function_info SEI da unidade de extração 91. A unidade de conversão 171 provê luminância que é obtida como resultado da conversão de joelho à unidade de controle de exibição 94 como uma imagem de exibição.

Descrição do Processo de Dispositivo de Decodificação

[00449] A Figura 73 é um fluxograma ilustrando um processo de geração de imagem executado pelo dispositivo de decodificação 170 da Figura 72.

[00450] Processos nas etapas S171 a S173 da Figura 73 são iguais aos processos nas etapas S91 a S93 da Figura 23, e assim descrição disso será omitida.

[00451] Na etapa S174, a unidade de conversão 171 do dispositivo de decodificação 170 executa um processo de conversão eletro-óptica usando a EOTF de BT.709 em um valor de código como uma imagem decodificada provida da unidade de decodificação 92 de modo a gerar luminância.

[00452] Na etapa S175, a unidade de conversão 171 executa conversão de joelho na luminância gerada na base de knee_function_info SEI da unidade de extração 91. A unidade de conversão 171 provê luminância que é obtida como resultado da conversão de joelho à unidade de controle de exibição 94 como uma imagem de exibição.

[00453] Na etapa S176, a unidade de controle de exibição 94 exibe a imagem de exibição provida da unidade de conversão 93 na unidade de exibição 95, e termina o processo.

[00454] Como mencionado acima, o dispositivo de decodificação 170 executa a conversão de joelho depois da EOTF de BT.709, e assim pode executar um processo de conversão eletro-óptica satisfatório para ambas uma imagem de SDR e uma imagem de HDR usando a EOTF de BT.709.

[00455] Além disso, a luminância máxima de uma imagem visada de codificação pode ser incluída em um fluxo codificado junto com dados codificados e pode ser transmitida para o dispositivo de decodificação 170 do dispositivo de codificação 150, e pode ser determinado com antecedência como um valor comum ao dispositivo de codificação 150 e ao dispositivo de decodificação 170. Adicionalmente, knee_function_info SEI pode ser estabelecida para cada item da luminância máxima de uma imagem visada de codificação.

[00456] Além disso, na quarta modalidade, a knee_function_info SEI da primeira a terceira concretizações pode ser estabelecida. Neste caso, o lado de decodificação executa conversão de joelho usando informação de conversão de DR, e assim é possível executar conversão em uma imagem que é satisfatória para várias exibições de luminância.

[00457] Além disso, o dispositivo de decodificação 170 na quarta modalidade pode ser dividido em um dispositivo de decodificação e um dispositivo de exibição da mesma maneira como na terceira modalidade.

[00458] Adicionalmente, na quarta modalidade, uma extensão de nomear valores de código a uma parte de baixa luminância e uma extensão de nomear os valores de código a uma parte de alta luminância são ajustadas usando uma função de conversão de joelho como um parâmetro, mas podem ser ajustadas usando funções diferentes de a função de conversão de joelho como um parâmetro.

[00459] Além disso, a descrição presente pode ser aplicada ao método de AVC.

Quinta Modalidade Descrição do Computador ao qual Descrição Presente é Aplicada

[00460] A série descrita acima de processos pode ser executada por hardware ou software. Quando a série descrita acima de processos é executada pelo software, programas constituindo o software são instalados em um computador. Aqui, o computador inclui um computador incorporado em hardware dedicado, ou um computador pessoal de propósito geral ou similar que pode executar vários tipos de funções instalando vários tipos de programas.

[00461] A Figura 74 é um diagrama de bloco ilustrando um exemplo de configuração de hardware de um computador que executa a série descrita acima de processos de acordo com um programa.

[00462] No computador, uma unidade de processamento central (CPU) 201, uma memória só de leitura (ROM) 202 e uma memória de acesso aleatório (RAM) 203 estão conectadas uma a outra por um barramento 204.

[00463] O barramento 204 também está conectado a uma interface de entrada e saída 205. A interface de entrada e saída 205 está conectada a uma unidade de entrada 206, uma unidade de saída 207, uma unidade de armazenamento 208, uma unidade de comunicação 209 e uma unidade de disco 210.

[00464] A unidade de entrada 206 inclui um teclado, um mouse, um microfone, e similar. A unidade de saída 207 inclui uma exibição, um alto- falante, e similar. A unidade de armazenamento 208 inclui um disco rígido, uma memória não volátil, ou similar. A unidade de comunicação 209 inclui uma interface de rede ou similar. A unidade de disco 210 aciona um meio removível 211 tal como um disco magnético, um disco óptico, um disco magneto-óptico, ou similar.

[00465] No computador configurado deste modo, a CPU 201 executa a série descrita acima de processos, por exemplo, carregando o programa armazenado na unidade de armazenamento 208 à RAM 203 pela interface de entrada e saída 205 e o barramento 204 e executando o programa.

[00466] O programa executado pelo computador (CPU 201) pode ser gravado no meio removível 211, por exemplo, como um meio de pacote, e pode ser provido. Além disso, o programa pode ser provido por um meio de transmissão por fios ou sem fio tal como uma rede local, a Internet, ou uma radiodifusão de satélite digital.

[00467] No computador, o programa pode ser instalado na unidade de armazenamento 208 pela interface de entrada e saída 205 instalando o meio removível 211 na unidade de disco 210. Além disso, o programa pode ser recebido pela unidade de comunicação 209 por um meio de transmissão por fios ou sem fio e pode ser instalado na unidade de armazenamento 208. Adicionalmente, o programa pode ser instalado na ROM 202 ou na unidade de armazenamento 208 com antecedência.

[00468] Além disso, o programa executado pelo computador pode ser um programa que executa processos em uma série de tempo de acordo com a ordem descrita na especificação presente, e pode ser um programa que executa processos em paralelo ou a uma temporização necessária tal como quando acessado.

Sexta Modalidade Aplicação à Codificação de Imagem de Multi-Visão e Decodificação de Imagem de Multi-Visão

[00469] A série descrita acima de processos pode ser aplicada à codificação de imagem de multi-visão e decodificação de imagem de multi- visão. Figura 75 é um diagrama ilustrando um exemplo de um método de codificação de imagem de multi-visão.

[00470] Como ilustrado na Figura 75, imagens de multi-visão incluem imagens a uma pluralidade de visões. A pluralidade de visões das imagens de multi-visão inclui uma visão básica na qual codificação/decodificação é executada usando só uma imagem a sua própria visão, e uma visão não básica na qual codificação/decodificação é executada usando imagens a outras visões. A visão não básica pode usar uma imagem de visão básica e pode usar outras imagens de visão não básica.

[00471] Em um caso de codificar/decodificar imagens de multi-visão como na Figura 75, cada imagem de visão é codificada/decodificada, e o método descrito acima da primeira modalidade pode ser aplicado para codificação/decodificação de cada visão. Deste modo, uma imagem decodificada pode ser convertida em uma imagem desejada com uma gama dinâmica diferente.

[00472] Além disso, na codificação/decodificação de cada visão, a bandeira ou o parâmetro usado no método da primeira modalidade pode ser compartilhado. Mais especificamente, por exemplo, o elemento de sintaxe ou similar da knee_function_info SEI pode ser compartilhado na codificação/decodificação de cada visão. Certamente, informação necessária diferente destes elementos pode ser compartilhada na codificação/decodificação de cada visão.

[00473] Deste modo, é possível minimizar a transmissão de informação redundante e assim reduzir quantidade de informação transmitida (taxa de bit) (quer dizer, é possível minimizar uma redução em eficiência de codificação). Dispositivo de Codificação de Imagem de Multi-visão

[00474] Figura 76 é um diagrama ilustrando um dispositivo de codificação de imagem de multi-visão que executa a codificação de imagem de multi-visão descrita acima. Como ilustrado na Figura 76, o dispositivo de codificação de imagem de multi-visão 600 inclui uma unidade de codificação 601, uma unidade de codificação 602 e um multiplexador 603.

[00475] A unidade de codificação 601 codifica uma imagem de visão básica de modo a gerar um fluxo codificado de imagem de visão básica. A unidade de codificação 602 codifica uma imagem de visão não básica de modo a gerar um fluxo codificado de imagem de visão de não básica. O multiplexador 603 multiplexa o fluxo codificado de imagem de visão básica gerado na unidade de codificação 601 e o fluxo codificado de imagem de visão não básica gerado na unidade de codificação 602, para gerar um fluxo codificado de imagem de multi-visão.

[00476] O dispositivo de codificação 10 (Figura 6) é aplicável à unidade de codificação 601 e à unidade de codificação 602 do dispositivo de codificação de imagem de multi-visão 600. Em outras palavras, na codificando de cada visão, uma imagem pode ser codificada de forma que uma imagem decodificada possa ser convertida em uma imagem desejada com uma gama dinâmica diferente durante decodificação. Além disso, a unidade de codificação 601 e a unidade de codificação 602 podem executar codificação (quer dizer, uma bandeira ou um parâmetro pode ser compartilhado) usando mutuamente as mesmas bandeiras ou parâmetros (por exemplo, um elemento de sintaxe ou similar relativo a um processo de imagens), e assim é possível minimizar uma redução em eficiência de codificação.

Dispositivo de Decodificação de Imagem de Multi-visão

[00477] A Figura 77 é um diagrama ilustrando um dispositivo de decodificação de imagem de multi-visão que executa a decodificação de imagem de multi-visão descrita acima. Como ilustrado na Figura 77, o dispositivo de decodificação de imagem de multi-visão 610 inclui um desmultiplexador 611, uma unidade de decodificação 612 e uma unidade de decodificação 613.

[00478] O desmultiplexador 611 desmultiplexa o fluxo codificado de imagem de multi-visão no qual o fluxo codificado de imagem de visão básica e o fluxo codificado de imagem de visão não básica estão multiplexados, de modo a extrair o fluxo codificado de imagem de visão básica e o fluxo codificado de imagem de visão não básica. A unidade de decodificação 612 decodifica o fluxo codificado de imagem de visão básica extraído pelo desmultiplexador 611 para obter uma imagem de visão básica. A unidade de decodificação 613 decodifica o fluxo codificado de imagem de visão não básica extraído pelo desmultiplexador 611 para obter uma imagem de visão não básica.

[00479] O dispositivo de decodificação 50 (Figura 12) é aplicável à unidade de decodificação 612 e à unidade de decodificação 613 do dispositivo de decodificação de imagem de multi-visão 610. Em outras palavras, na decodificação de cada visão, uma imagem decodificada pode ser convertida em uma imagem desejada com uma gama dinâmica diferente. Além disso, a unidade de decodificação 612 e a unidade de decodificação 613 podem executar codificação (quer dizer, uma bandeira ou um parâmetro pode ser compartilhado) usando mutuamente as mesmas bandeiras ou parâmetros (por exemplo, um elemento de sintaxe ou similar relativo a um processo de imagens), e assim é possível minimizar uma redução em eficiência de codificação.

Sétima Modalidade Aplicação à Codificação de Imagem de Camada e Decodificação de Imagem de Camada

[00480] A série descrita acima de processos pode ser aplicada à codificação de imagem de camada e decodificação de imagem de camada. Figura 78 ilustra um exemplo de um método de codificação de imagem de camada.

[00481] A codificação de imagem de camada (codificação graduável) é para gerar uma pluralidade de camadas de uma imagem e codificar cada camada de forma que dados de imagem tenham uma função graduável com respeito a um parâmetro predeterminado. A decodificação de imagem de camada (decodificação graduável) é decodificação correspondendo à codificação de imagem de camada.

[00482] Como ilustrado na Figura 78, na formação de camadas de uma imagem, uma única imagem é dividida em uma pluralidade de imagens (camadas) com um parâmetro predeterminado tendo uma função graduável como uma referência. Em outras palavras, imagens em camadas (imagens de camada) incluem imagens de uma pluralidade de camadas nas quais valores do parâmetro predeterminado são diferentes um do outro. Uma pluralidade de camadas das imagens de camada inclui uma camada básica na qual codificação/decodificação é executada usando só uma imagem de sua própria camada e uma camada não básica (também chamada uma camada de aprimoramento) em que codificação/decodificação é executada usando imagens de outras camadas. A camada não básica pode usar uma imagem de camada básica e pode usar outras imagens de camada não básica.

[00483] Geralmente, a camada não básica é formada por sua própria imagem e dados (dados de diferença) em uma imagem de diferença com imagens de outras camadas. Por exemplo, em um caso onde uma única imagem é gerada como duas camadas incluindo uma camada básica e uma camada não básica (também chamada uma camada de aprimoramento), uma imagem com qualidade mais baixa que aquela de uma imagem original é obtida só usando dados da camada básica, e assim dados da camada básica e dados da camada não básica são combinados entre si de modo a obter a imagem original (quer dizer, imagem de alta qualidade).

[00484] Uma imagem é formada em camadas como mencionado acima, e assim várias imagens de qualidade podem ser obtidas facilmente dependendo de circunstâncias. Por exemplo, informação de compressão de imagem de só uma camada básica é transmitida para um terminal tendo baixo desempenho de processamento, tal como um telefone móvel, de forma que uma imagem em movimento da qual resolução espacial e temporal é baixa ou qualidade de imagem é baixa seja reproduzida, e informação de compactação de imagem de uma camada de aprimoramento como também uma camada básica é transmitida para um terminal com desempenho de processamento alto, tal como um aparelho de televisão ou um computador pessoal, de forma que uma imagem em movimento da qual resolução espacial e temporal é alta ou qualidade de imagem é alta seja reproduzida. Deste modo, informação de compressão de imagem pode ser transmitida de um servidor dependendo de um desempenho de terminal ou rede sem executar um processo de transcodificação.

[00485] Uma imagem de camada como no exemplo da Figura 78 está codificada/decodificada, uma imagem de cada camada é codificada/decodificada, o método descrito acima da primeira modalidade pode ser aplicado à codificação/decodificação de cada camada. Deste modo, uma imagem decodificada pode ser convertida em uma imagem desejada com uma gama dinâmica diferente.

[00486] Além disso, na codificação/decodificação de cada camada, a bandeira ou o parâmetro usado no método da primeira modalidade pode ser compartilhado. Mais especificamente, por exemplo, o elemento de sintaxe ou similar da knee_function_info SEI pode ser compartilhado na codificação/decodificação de cada camada. Certamente, informação necessária diferente de estes elementos pode ser compartilhada na codificação/decodificação de cada camada.

[00487] Deste modo, é possível minimizar transmissão de informação redundante e assim reduzir quantidade de informação transmitida (taxa de bit) (quer dizer, é possível minimizar uma redução em eficiência de codificação). Parâmetros Graduáveis

[00488] Em tal codificação de imagem de camada e decodificação de imagem de camada (codificação graduável e decodificação graduável), um parâmetro tendo uma função graduável é arbitrário. Por exemplo, uma resolução espacial como ilustrada na Figura 79 pode ser um parâmetro (capacidade de graduação espacial). Em um caso da capacidade de graduação espacial, uma resolução de uma imagem é diferente para cada camada. Em outras palavras, neste caso, como ilustrado na Figura 79, cada quadro é gerado como duas camadas incluindo uma camada básica da qual uma resolução espacial é mais baixa que aquela de uma imagem original, e uma camada de aprimoramento que permite a uma resolução espacial original ser obtida por combinação com a camada básica. Certamente, o número de camadas é um exemplo, e qualquer número de camadas pode ser gerado.

[00489] Além disso, como um parâmetro que dá tal capacidade de graduação, por exemplo, uma resolução temporal pode ser empregada (capacidade de graduação temporal) como ilustrado na Figura 80. Em um caso da capacidade de graduação temporal, uma taxa de quadro é diferente para cada camada. Em outras palavras, neste caso, como ilustrado na Figura 80, cada quadro é gerado como duas camadas incluindo uma camada básica da qual uma taxa de quadro é mais baixa que aquela de uma imagem em movimento original, e uma camada de aprimoramento que permite a uma taxa de quadro original ser obtida por combinação com a camada básica. Certamente, o número de camadas é um exemplo, e qualquer número de camadas pode ser gerado.

[00490] Adicionalmente, como um parâmetro que dá tal capacidade de graduação, por exemplo, um relação de sinal para ruído (SNR) pode ser empregada (capacidade de graduação de SNR). Em um caso da capacidade de graduação de SNR, uma SNR é diferente para cada camada. Em outras palavras, neste caso, como ilustrado na Figura 81, cada quadro é gerado como duas camadas incluindo uma camada básica da qual uma SNR é mais baixa que aquela de uma imagem original, e uma camada de aprimoramento que permite a uma SNR original ser obtida por combinação com a camada básica. Certamente, o número de camadas é um exemplo, e qualquer número de camadas pode ser gerado.

[00491] Parâmetros que dão capacidade de graduação podem usar parâmetros diferentes dos exemplos descritos acima. Por exemplo, como um parâmetro que dá capacidade de graduação, uma profundidade de bit pode ser usada (capacidade de graduação de profundidade de bit). Em um caso da capacidade de graduação de profundidade de bit, uma profundidade de bit é diferente para cada camada. Neste caso, por exemplo, uma camada básica é formada por uma imagem de 8 bits, e uma camada de aprimoramento é adicionada a isso de forma que uma imagem de 10 bits possa ser obtida.

[00492] Além disso, como um parâmetro que dá capacidade de graduação, um formato de croma pode ser usado (capacidade de graduação de croma). Em um caso do capacidade de graduação de croma, um formato de croma é diferente para cada camada. Neste caso, por exemplo, uma camada básica é formada por uma imagem de componente com um formato 4:2:0, e uma camada de aprimoramento é adicionada a isso de forma que uma imagem de componente com um formato 4:2:2 possa ser obtida.

[00493] Adicionalmente, como um parâmetro que dá capacidade de graduação, uma gama dinâmica de luminância pode ser usada (capacidade de graduação de DR). Em um caso da capacidade de graduação de DR, uma gama dinâmica de luminância é diferente para cada camada. Neste caso, por exemplo, uma camada básica é formada por uma imagem de SDR, e uma camada de aprimoramento é adicionada a isso de forma que uma imagem de HDR possa ser obtida.

[00494] Em um caso de aplicar a série descrita acima de processos à capacidade de graduação de gama dinâmica, por exemplo, informação relativa à descompressão de joelho de uma imagem de SDR para uma imagem de HDR é estabelecida em um fluxo codificado de uma imagem de camada básica como informação de conversão de DR. Além disso, informação relativa à compressão de joelho de uma gama dinâmica de luminância de uma imagem de HDR é estabelecida em um fluxo codificado de uma imagem de camada de aprimoramento como informação de conversão de DR.

[00495] Além disso, um dispositivo de decodificação que pode decodificar só um fluxo codificado de uma imagem de camada básica e inclui uma exibição de HDR, converte uma imagem de SDR que é uma imagem decodificada em uma imagem de HDR na base da informação de conversão de DR, e estabelece a imagem de HDR como uma imagem de exibição. Por outro lado, um dispositivo de decodificação que também pode decodificar um fluxo codificado de uma imagem de camada de aprimoramento e inclui uma exibição de HDR que pode exibir uma imagem de HDR com uma baixa gama dinâmica, comprime em joelho uma gama dinâmica de luminância de uma imagem de HDR que é uma imagem decodificada na base da informação de conversão de DR, e estabelece um resultado disso como uma imagem de exibição.

[00496] Adicionalmente, informação sobre descompressão de uma gama dinâmica de luminância de uma imagem de HDR pode ser estabelecida em um fluxo codificado de uma imagem de camada de aprimoramento como informação de conversão de DR. Neste caso, um dispositivo de decodificação, que também pode decodificar um fluxo codificado de uma imagem de camada de aprimoramento e inclui uma exibição de HDR que pode exibir uma imagem de HDR com uma gama dinâmica alta, descomprime em joelho uma gama dinâmica de luminância de uma imagem de HDR que é uma imagem decodificada na base da informação de conversão de DR, e estabelece um resultado disso como uma imagem de exibição.

[00497] Como mencionado acima, a informação de conversão de DR é estabelecida em um fluxo codificado de uma imagem de camada básica ou uma imagem de camada de aprimoramento, e assim é possível exibir uma imagem que é mais satisfatória para desempenho de exibição.

Dispositivo de Codificação de Imagem de Camada

[00498] A Figura 82 é um diagrama ilustrando um dispositivo de codificação de imagem em camada que executa a codificação de imagem de camada descrita acima. Como ilustrado na Figura 82, o dispositivo de codificação de imagem em camada 620 inclui uma unidade de codificação 621, uma unidade de codificação 622 e um multiplexador 623.

[00499] A unidade de codificação 621 codifica uma imagem de camada básica de modo a gerar um fluxo codificado de imagem de camada básica. A unidade de codificação 622 codifica uma imagem de camada não básica de modo a gerar um fluxo codificado de imagem de camada não básica. O multiplexador 623 multiplexa o fluxo codificado de imagem de camada básica gerado na unidade de codificação 621 e o fluxo codificado de imagem de camada não básica gerado na unidade de codificação 622, de modo a gerar um fluxo codificado de imagem de camada.

[00500] O dispositivo de codificação 10 (Figura 6) é aplicável à unidade de codificação 621 e à unidade de codificação 622 do dispositivo de codificação de imagem em camada 620. Em outras palavras, na codificação de cada camada, uma imagem pode ser codificada de forma que uma imagem decodificada possa ser convertida em uma imagem desejada com uma gama dinâmica diferente durante decodificação. Além disso, a unidade de codificação 621 e a unidade de codificação 622 podem executar controle ou similar de um processo de filtro de intra-predição (quer dizer, uma bandeira ou um parâmetro pode ser compartilhado) usando as mutuamente mesmas bandeiras ou parâmetros (por exemplo, um elemento de sintaxe ou similar relativo a um processo de imagens), e assim é possível minimizar uma redução em eficiência de codificação.

Dispositivo de Decodificação de Imagem de Camada

[00501] A Figura 83 é um diagrama ilustrando um dispositivo de decodificação de imagem de camada que executa a decodificação de imagem de camada descrita acima. Como ilustrado na Figura 83, o dispositivo de decodificação de imagem de camada 630 inclui um desmultiplexador 631, uma unidade de decodificação 632 e uma unidade de decodificação 633.

[00502] O desmultiplexador 631 desmultiplexa o fluxo codificado de imagem de camada no qual o fluxo codificado de imagem de camada básica e o fluxo codificado de imagem de camada não básica estão multiplexados, de modo a extrair o fluxo codificado de imagem de camada básica e o fluxo codificado de imagem de camada não básica. A unidade de decodificação 632 decodifica o fluxo codificado de imagem de camada básica extraído pelo desmultiplexador 631 para obter uma imagem de camada básica. A unidade de decodificação 633 decodifica o fluxo codificado de imagem de camada não básica extraído pelo desmultiplexador 631, de modo a obter uma imagem de camada não básica.

[00503] O dispositivo de decodificação 50 (Figura 12) é aplicável à unidade de decodificação 632 e à unidade de codificação 633 do dispositivo de decodificação de imagem de camada 630. Em outras palavras, na decodificação de cada camada, uma imagem decodificada pode ser convertida em uma imagem desejada com uma gama dinâmica diferente. Além disso, a unidade de decodificação 612 e a unidade de decodificação 613 podem executar codificação (quer dizer, uma bandeira ou um parâmetro pode ser compartilhado) usando as mutuamente mesmas bandeiras ou parâmetros (por exemplo, um elemento de sintaxe ou similar relativo a um processo de imagens), e assim é possível minimizar uma redução em eficiência de codificação.

Oitava Modalidade Exemplo de Configuração de Aparelho de Televisão

[00504] A Figura 84 exemplifica um aparelho de televisão ao qual a tecnologia presente é aplicada. O aparelho de televisão 900 inclui uma antena 901, um sintonizador 902, um desmultiplexador 903, um decodificador 904, uma unidade de processamento de sinal de vídeo 905, uma unidade de exibição 906, uma unidade de processamento de sinal de áudio 907, um alto- falante 908 e uma unidade de interface externa 909. Além disso, o aparelho de televisão 900 inclui uma unidade de controle 910, uma interface de usuário 911, e similar.

[00505] O sintonizador 902 seleciona um canal desejado de um sinal difundido que é recebido pela antena 901, demodula o canal selecionado, e produz um fluxo de bits codificado que é obtido por demodulação, para o desmultiplexador 903.

[00506] O desmultiplexador 903 extrai um pacote de vídeo ou um áudio de um programa que é um objetivo de visão do fluxo de bits codificado, e produz os dados no pacote extraído para o decodificador 904. Além disso, o desmultiplexador 903 provê um pacote de dados tal como guia de programa eletrônico (EPG) para a unidade de controle 910. Adicionalmente, o desmultiplexador ou similar pode executar desembaralhamento quando o fluxo codificado está embaralhado.

[00507] O decodificador 904 decodifica o pacote, e produz dados de vídeo e dados de áudio gerados pela decodificação à unidade de processamento de sinal de vídeo 905 e à unidade de processamento de sinal de áudio 907, respectivamente.

[00508] A unidade de processamento de sinal de vídeo 905 executa remoção de ruído ou um processo de vídeo ou similar conforme as colocações de usuário nos dados de vídeo. A unidade de processamento de sinal de vídeo 905 gera dados de vídeo de um programa que é exibido na unidade de exibição 906, ou dados de imagem ou similar por um processo baseado em um aplicativo que é provido por uma rede. Além disso, a unidade de processamento de sinal de vídeo 905 gera dados de vídeo para exibir uma tela de menu tal como seleção de itens, e sobrepõe os dados de vídeo sobre os dados de vídeo de um programa. A unidade de processamento de sinal de vídeo 905 gera um sinal de excitação na base dos dados de vídeo gerados deste modo, de modo a gerar a unidade de exibição 906.

[00509] A unidade de exibição 906 excita um dispositivo de exibição (por exemplo, um elemento de exibição de cristal líquido) na base do sinal de excitação da unidade de processamento de sinal de vídeo 905 de modo a exibir um vídeo de um programa ou similar.

[00510] A unidade de processamento de sinal de áudio 907 executa um processo tal como remoção de ruído nos dados de áudio, e executa conversão D/A ou amplificação nos dados de áudio processados que são então providos ao alto-falante 908, por esse meio produzindo sons.

[00511] A unidade de interface externa 909 é uma interface para conexão a um aparelho externo ou à rede, e transmite e recebe dados tais como dados de vídeo ou dados de áudio.

[00512] A unidade de controle 901 está conectada à unidade de interface de usuário 911. A unidade de interface de usuário 911 está constituída por uma chave de operação, uma porção de recepção de sinal de controle remoto, e similar, e provê um sinal de operação correspondendo à operação de um usuário à unidade de controle 910.

[00513] A unidade de controle 910 é formada usando uma unidade de processamento central (CPU), memórias, e similar. As memórias armazenam um programa executado pela CPU, uma variedade de dados que são necessários na CPU executando um processo, dados de EPG, dados adquiridos pela rede, e similar. O programa armazenado nas memórias é lido e executado pela CPU, por exemplo, quando o aparelho de televisão 900 é iniciado. A CPU executa o programa, e assim controla cada unidade de forma que o aparelho de televisão 900 execute uma operação respondendo à operação de um usuário.

[00514] Além disso, o aparelho de televisão 900 é provido com um barramento 912 que conecta o sintonizador 902, o desmultiplexador 903, a unidade de processamento de sinal de vídeo 905, a unidade de processamento de sinal de áudio 907, a unidade de interface externa 909 e a unidade de controle 910, entre si.

[00515] No aparelho de televisão tendo a configuração, uma função do dispositivo de decodificação (método de decodificação) do pedido presente é provida no decodificador 904. Por esta razão, é possível converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

Nona Modalidade Exemplo de Configuração de Telefone Móvel

[00516] A Figura 85 exemplifica uma configuração esquemática de um telefone móvel ao qual a descrição presente é aplicada. O telefone móvel 920 inclui uma unidade de comunicação 922, um codec de áudio 923, uma unidade de câmera 926, uma unidade de processamento de imagem 927, um multiplexador/desmultiplexador 928, uma unidade de gravação/reprodução 929, uma unidade de exibição 930 e uma unidade de controle 931. Estes elementos constituintes estão conectados um ao outro por um barramento 933.

[00517] Além disso, a unidade de comunicação 922 está conectada a uma antena 921, e o codec de áudio 923 está conectado a um alto-falante 924 e um microfone 925. Adicionalmente, a unidade de controle 931 está conectada a uma unidade de operação 932.

[00518] O telefone móvel 920 executa várias operações tais como transmissão e recepção de sinais de áudio, transmissão e recepção de correios eletrônicos ou dados de imagem, captura de uma imagem, e gravação de dados em vários modos de operação tal como um modo de fala e um modo de comunicação de dados.

[00519] No modo de fala, um sinal de áudio gerado pelo microfone 925 sofre conversão em dados de áudio ou compressão de dados no codec de áudio 923, e é então provido à unidade de comunicação 922. A unidade de comunicação 922 executa um processo de modulação ou um processo de conversão de freqüência nos dados de áudio de modo a gerar um sinal de transmissão. Adicionalmente, a unidade de comunicação 922 transmite o sinal de transmissão à antena 921 de modo a transmitir o sinal de transmissão para uma estação base (não ilustrada). Além disso, a unidade de comunicação 922 executa amplificação, um processo de conversão de freqüência, e um processo de demodulação em um sinal que é recebido pela antena 921, e provê os dados de áudio gerados para o codec de áudio 923. O codec de áudio 923 executa descompressão de dados nos dados de áudio ou converte os dados de áudio em um sinal de áudio analógico, e produz o sinal de áudio gerado para o alto-falante 924.

[00520] Adicionalmente, no modo de comunicação de dados, em um caso de transmitir um correio, a unidade de controle 931 recebe dados de texto de entrada usando a unidade de operação 932, e exibe o texto de entrada na unidade de exibição 930. Além disso, a unidade de controle 931 gera dados de correio em resposta a uma instrução feita pelo usuário usando a unidade de operação 932, e provê os dados de correio gerados para a unidade de comunicação 922. A unidade de comunicação 922 executa um processo de modulação ou um processo de conversão de freqüência nos dados de correio, e transmite o sinal de transmissão gerado da antena 921. Adicionalmente, a unidade de comunicação 922 executa amplificação, um processo de conversão de freqüência, e um processo de demodulação em um sinal que é recebido pela antena 921, de modo a recuperar dados de correio. Os dados de correio são providos à unidade de exibição 930, e assim conteúdo do correio é exibido.

[00521] Além disso, o telefone móvel 920 pode armazenar os dados de correio recebidos em um meio de gravação usando a unidade de gravação/reprodução 929. O meio de gravação é qualquer meio de gravação regravável. Por exemplo, o meio de gravação é uma memória de semicondutor tal como uma RAM ou uma memória flash embutida, ou um meio removível tal como um disco rígido, um disco magnético, um disco magneto-óptico, um disco óptico, uma memória de barramento serial universal (USB), ou um cartão de memória.

[00522] Em um caso onde dados de imagem são transmitidos no modo de comunicação de dados, dados de imagem gerados pela unidade de câmera 926 são providos à unidade de processamento de imagem 927. A unidade de processamento de imagem 927 executa um processo de codificação nos dados de imagem de modo a gerar dados codificados.

[00523] Adicionalmente, o multiplexador/desmultiplexador 928 multiplexa o fluxo de imagem que foi gerado pela unidade de processamento de imagem 927 e os dados de áudio que são providos do codec de áudio 923, e provê os dados multiplexados para a unidade de comunicação 922. A unidade de comunicação 922 executa um processo de modulação ou um processo de conversão de freqüência nos dados multiplexados, e transmite um sinal de transmissão obtido à antena 921. Além disso, a unidade de comunicação 922 executa um processo de amplificação, um processo de conversão de freqüência, e um processo de demodulação em um sinal que é recebido pela antena 921 de modo a recuperar dados multiplexados. Os dados multiplexados são providos ao multiplexador/desmultiplexador 928. O multiplexador/desmultiplexador 928 desmultiplexa os dados multiplexados, e provê dados codificados à unidade de processamento de imagem 927 e dados de áudio para o codec de áudio 923. A unidade de processamento de imagem 927 decodifica os dados codificados de modo a gerar dados de imagem. Os dados de imagem são providos à unidade de exibição 930 de modo a permitir exibir a imagem recebida. O codec de áudio 923 converte os dados de áudio em um sinal de áudio analógico que é então provido ao alto-falante 924 de modo a produzir um som recebido.

[00524] No aparelho de telefone móvel tendo a configuração, funções do dispositivo de codificação e do dispositivo de decodificação (o método de codificação e o método de decodificação) do pedido presente são providas na unidade de processamento de imagem 927. Por esta razão, uma imagem pode ser codificada de forma que uma imagem decodificada possa ser convertida em uma imagem desejada com uma gama dinâmica diferente durante decodificação. Além disso, é possível converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente. Décima Modalidade

Exemplo de Configuração de Aparelho de Gravação/Reprodução

[00525] A Figura 86 exemplifica uma configuração esquemática de um aparelho de gravação/reprodução ao qual a tecnologia presente é aplicada. O aparelho de gravação/reprodução 940 grava, por exemplo, dados de áudio e dados de vídeo de um programa radiodifundido recebido em um meio de gravação, e provê os dados gravados para um usuário a uma temporização respondendo a uma instrução do usuário. Além disso, o aparelho de gravação/reprodução 940 pode adquirir, por exemplo, dados de áudio e dados de imagem de outros aparelhos, e pode gravar os dados no meio de gravação. Adicionalmente, o aparelho de gravação/reprodução 940 codifica e produz os dados de áudio ou dados de vídeo gravados no meio de gravação de forma que exibição de imagem ou saída de som possa ser executada em um dispositivo de monitor.

[00526] O aparelho de gravação/reprodução 940 inclui um sintonizador 941, uma unidade de interface externa 942, um codificador 943, uma unidade de disco rígido (HDD) 944, uma unidade de disco 945, um seletor 946, um decodificador 947, uma unidade de exibição em tela (OSD) 948, uma unidade de controle 949 e uma unidade de interface de usuário 950.

[00527] O sintonizador 941 seleciona um canal desejado de um sinal radiodifundido que é recebido por uma antena (não ilustrada). Além disso, o sintonizador 941 produz um fluxo de bits codificado que é obtido demodulando o sinal recebido do canal desejado, para o seletor 946.

[00528] A unidade de interface externa 942 inclui qualquer uma de uma interface de IEEE1394, uma interface de rede, uma interface de USB, uma interface de memória flash, ou similar. A unidade de interface externa 942 é uma interface que está conectada a um aparelho externo, uma rede, um cartão de memória, ou similar, e recebe dados tais como dados de vídeo ou dados de áudio a serem gravados.

[00529] O codificador 943 codifica dados de vídeo ou dados de áudio em um método predeterminado em um caso onde os dados de vídeo e os dados de áudio providos da unidade de interface externa 942 não estão codificados, e produz um fluxo de bits codificado para o seletor 946.

[00530] A unidade de HDD 944 grava dados de conteúdo tais como um vídeo e um som, vários programas, e outros dados em um disco rígido embutido, e lê os dados do disco rígido quando o vídeo e o som são reproduzidos.

[00531] A unidade de disco 945 grava e reproduz dados no e de um disco óptico que está instalado nela. O disco óptico pode ser, por exemplo, um disco de DVD (DVD-Vídeo, DVD-RAM, DVD-R, DVD-RW, DVD+R, DVD+RW, ou similar), um disco de Blu-ray (marca registrada), ou similar.

[00532] Quando um vídeo e um som são gravados, o seletor 946 seleciona um fluxo de bits codificado que é entrado do sintonizador 941 ou do codificador 943, e produz o fluxo de bits codificado selecionado para a unidade de HDD 944 ou a unidade de disco 945. Além disso, quando um vídeo e um som são reproduzidos, o seletor 946 produz um fluxo de bits codificado que é produzido da unidade de HDD 944 ou da unidade de disco 945 para o decodificador 947.

[00533] O decodificador 947 decodifica o fluxo de bits codificado. Além disso, o decodificador 947 provê dados de vídeo gerados pelo processo de decodificação para a unidade de OSD 948. Adicionalmente, o decodificador 947 produz dados de áudio gerados pelo processo de decodificação.

[00534] A unidade de OSD 948 gera dados de vídeo para exibir uma tela de menu tal como seleção de itens, e sobrepõe e produz os dados de vídeo sobre dados de vídeo que são produzidos do decodificador 947.

[00535] A unidade de controle 949 está conectada à unidade de interface de usuário 950. A unidade de interface de usuário 950 é constituída por uma chave de operação, uma porção de recepção de sinal de controle remoto, e similar, e provê um sinal de operação correspondendo à operação de um usuário à unidade de controle 949.

[00536] A unidade de controle 949 é formada usando uma unidade de processamento central (CPU), memórias, e similar. As memórias armazenam um programa executado pela CPU, uma variedade de dados que são necessários na CPU executando um processo, dados de EPG, dados adquiridos pela rede, e similar. O programa armazenado nas memórias é lido e executado pela CPU a uma temporização predeterminada, por exemplo, quando o aparelho de gravação/reprodução 940 é iniciado. A CPU executa o programa, e assim controla cada unidade de forma que o aparelho de gravação/reprodução 940 execute uma operação respondendo à operação de um usuário.

[00537] No aparelho de gravação/reprodução tendo a configuração, uma função do dispositivo de decodificação (método de decodificação) do pedido presente é provida no decodificador 947. Por esta razão, é possível converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

Décima Primeira Modalidade Exemplo de Configuração de Aparelho de Formação de Imagem

[00538] A Figura 87 exemplifica uma configuração esquemática de um aparelho de formação de imagem ao qual a tecnologia presente é aplicada. O aparelho de formação de imagem 960 captura uma imagem de um tema, e exibe a imagem do tema em uma unidade de exibição ou grava a imagem em um meio de gravação como dados de imagem.

[00539] O aparelho de formação de imagem 960 inclui um bloco óptico 961, uma unidade de formação de imagem 962, uma unidade de processamento de sinal de câmera 963, uma unidade de processamento de dados de imagem 964, uma unidade de exibição 965, uma unidade de interface externa 966, uma unidade de memória 967, uma unidade de meio 968, uma unidade de OSD 969 e uma unidade de controle 970. Além disso, a unidade de controle 970 está conectada a uma interface de usuário 971. Adicionalmente, a unidade de processamento de dados de imagem 964, a unidade de interface externa 966, a unidade de memória 967, a unidade de meio 968, a unidade de OSD 969, a unidade de controle 970, e similar estão conectadas entre si por um barramento 972.

[00540] O bloco óptico 961 inclui uma lente de foco, um mecanismo de diafragma, e similar. O bloco óptico 961 forma uma imagem óptica de um tema sobre uma superfície de geração de imagem da unidade de formação de imagem 962. A unidade de formação de imagem 962 inclui um sensor de imagem tal como um CCD ou um CMOS, e gera um sinal elétrico correspondendo à imagem óptica por conversão fotoelétrica, e provê o sinal elétrico para a unidade de processamento de sinal de câmera 963.

[00541] A unidade de processamento de sinal de câmera 963 executa vários processos de sinal de câmera tais como correção de joelho, correção de gama, e correção de cor, no sinal de imagem que é entrado da unidade de formação de imagem 962. A unidade de processamento de sinal de câmera 963 provê os dados de imagem tendo sofrido os processos de sinal de câmera para a unidade de processamento de dados de imagem 964.

[00542] A unidade de processamento de dados de imagem 964 codifica os dados de imagem que são providos da unidade de processamento de sinal de câmera 963. A unidade de processamento de dados de imagem 964 provê dados codificados gerados pelo processo de codificação à unidade de interface externa 966 ou ao meio de acionamento 968. Adicionalmente, a unidade de processamento de dados de imagem 964 decodifica os dados codificados que são providos da unidade de interface externa 966 ou da unidade de meio 968. Além disso, a unidade de processamento de dados de imagem 964 provê dados de imagem gerados pelo processo de decodificação à unidade de exibição 965. Além disso, a unidade de processamento de dados de imagem 964 provê dados de imagem que são providos da unidade de processamento de sinal de câmera 963 para a unidade de exibição 965, ou sobrepõe dados de exibição que são adquiridos da unidade de OSD 969 sobre dados de imagem que são então produzidos à unidade de exibição 965.

[00543] A unidade de OSD 969 gera e produz dados de exibição tal como uma tela de menu formada por símbolos, caracteres, ou figuras, ou um ícone, para a unidade de processamento de dados de imagem 964.

[00544] A unidade de interface externa 966 é formada, por exemplo, por um terminal de entrada e saída de USB, e é conectada a uma impressora quando uma imagem é impressa. Além disso, a unidade de interface externa 966 está conectada a uma unidade de disco como necessário. Um meio removível tal como um disco magnético ou um disco óptico é instalado na unidade de disco como apropriado, e um programa de computação lido do meio removível é instalado nisso como necessário. Adicionalmente, a unidade de interface externa 966 inclui uma interface de rede que está conectada a uma rede predeterminada tal como uma LAN ou a Internet. A unidade de controle 970 pode ler dados codificados da unidade de meio 968, por exemplo, em resposta a uma instrução da interface de usuário 971, e pode prover os dados codificados para outros aparelhos que estão conectados a isso pela rede, da unidade de interface externa 966. Além disso, a unidade de controle 970 pode adquirir dados codificados ou imagem que é provida de outros aparelhos pela rede, pela unidade de interface externa 966, e pode prover os dados à unidade de processamento de dados de imagem 964.

[00545] Um meio de gravação acionado pela unidade de meio 968 pode ser qualquer meio removível legível e gravável tal como um disco magnético, um disco magneto-óptico, um disco óptico, ou uma memória de semicondutor. Além disso, o meio de gravação pode ser qualquer tipo de meio removível, pode ser um dispositivo de fita, pode ser um disco, e pode ser um cartão de memória. Certamente, um cartão de circuito integrado sem contato (CI) ou similar pode ser usado.

[00546] Adicionalmente, a unidade de meio e um meio de gravação podem ser formados integralmente de modo a ser constituído por uma unidade de armazenamento não portátil tal como uma unidade de disco rígido embutida ou uma unidade de estado sólido (SSD).

[00547] A unidade de controle 970 é formada usando uma CPU. A unidade de memória 967 armazena um programa executado pela unidade de controle 970, uma variedade de dados que são necessários na unidade de controle 970 executando um processo, e similar. O programa armazenado na unidade de memória 967 é lido e executado pela unidade de controle 970, a uma temporização predeterminada, por exemplo, quando o aparelho de formação de imagem 960 é iniciado. A unidade de controle 970 executa o programa, e assim controla cada unidade de forma que o aparelho de formação de imagem 960 execute uma operação que responde à operação de um usuário.

[00548] No aparelho de formação de imagem tendo a configuração, funções do dispositivo de codificação e do dispositivo de decodificação (o método de codificação e o método de decodificação) do pedido presente são providas na unidade de processamento de dados de imagem 964. Por esta razão, uma imagem pode ser codificada de forma que uma imagem decodificada possa ser convertida em uma imagem desejada com uma gama dinâmica diferente durante decodificação. Além disso, é possível converter uma imagem decodificada em uma imagem desejada com uma gama dinâmica diferente.

Exemplos de Aplicação de Codificação Graduável Primeiro Sistema

[00549] A seguir, descrição será feita de um exemplo específico de usar dados codificados graduáveis (camada codificada) que são codificados de forma graduável. A codificação graduável é usada, por exemplo, para selecionar dados a serem transmitidos como em um exemplo ilustrado na Figura 88.

[00550] Em um sistema de transmissão de dados 1000 ilustrado na Figura 88, um servidor de entrega 1002 lê os dados codificados graduáveis armazenados na unidade de armazenamento de dados codificados graduáveis 1001, e entrega os dados codificados graduáveis para aparelhos terminais tais como um computador pessoal 1004, um aparelho de AV 1005, um dispositivo de tablete 1006 e um telefone móvel 1007 por uma rede 1003.

[00551] Neste momento, o servidor de entrega 1002 seleciona e transmite dados codificados com qualidade apropriada na base de desempenhos dos aparelhos terminais, circunstâncias de comunicação, ou similar. Se o servidor de entrega 1002 transmitir desnecessariamente dados de alta qualidade, não pode ser dito que uma imagem de alta qualidade é obtida no aparelho terminal, e há uma preocupação que atraso ou transbordamento pode ocorrer. Além disso, há uma preocupação que dados de alta qualidade podem ocupar uma banda de comunicação desnecessariamente, e podem aumentar desnecessariamente uma carga no aparelho terminal. Reciprocamente, se o servidor de entrega 1002 transmitir desnecessariamente dados de baixa qualidade, há uma preocupação que uma imagem com qualidade de imagem suficiente não pode ser obtida no aparelho terminal. Por esta razão, o servidor de entrega 1002 lê e transmite dados codificados com qualidade (camada) que é satisfatória para os desempenhos dos aparelhos terminais ou as circunstâncias de comunicação da unidade de armazenamento de dados codificados graduáveis 1001.

[00552] Aqui, é assumido que a unidade de armazenamento de dados codificados graduáveis 1001 armazena dados codificados graduáveis (BL+EL) 1011 que estão codificados de modo graduável. Os dados codificados graduáveis (BL+EL) 1011 são dados codificados incluindo ambas uma camada básica e uma camada de aprimoramento, e são dados que permitem obter ambas uma imagem de camada básica e uma imagem de camada de aprimoramento por decodificação.

[00553] O servidor de entrega 1002 seleciona uma camada apropriada na base de um desempenho de um aparelho terminal para qual dados são transmitidos ou circunstâncias de comunicação, e lê dados da camada. Por exemplo, o servidor de entrega 1002 lê os dados codificados graduáveis (BL+EL) 1011 codificados com alta qualidade da unidade de armazenamento de dados codificados graduáveis 1001, e transmite os dados como estão, em relação ao computador pessoal 1004 ou ao dispositivo de tablete 1006 tendo um alto desempenho de processamento. Em contraste, por exemplo, em relação ao aparelho de AV 1005 ou ao telefone móvel 1007 tendo um baixo desempenho de processamento, o servidor de entrega 1002 extrai dados de camada básica dos dados codificados graduáveis (BL+EL) 1011, e transmite os dados como dados codificados graduáveis (BL) 1012 que são os mesmos dados de conteúdo como os dados codificados graduáveis (BL+EL) 1011 em termos de conteúdo, mas têm qualidade mais baixa do que os dados codificados graduáveis (BL+EL) 1011

[00554] Como mencionado acima, desde que uma quantidade de dados pode ser ajustada facilmente usando os dados codificados graduáveis, é possível minimizar a ocorrência de atraso ou transbordamento ou minimizar um aumento desnecessário em uma carga em um aparelho terminal ou um meio de comunicação. Além disso, redundância entre camadas é reduzida nos dados codificados graduáveis (BL+EL) 1011, e assim uma quantidade de dados disso pode ser reduzida adicionalmente do que em um caso onde dados codificados de cada camada são usados como dados separados. Portanto, uma região de armazenamento da unidade de armazenamento de dados codificados graduáveis 1001 pode ser usada mais eficientemente.

[00555] Além disso, vários aparelhos tais como o computador pessoal 1004 para o telefone móvel 1007 podem ser empregados como aparelhos terminais e assim desempenhos de hardware dos aparelhos terminais são diferentes dependendo dos aparelhos. Adicionalmente, há vários aplicativos que são executados pelos aparelhos terminais, e assim também há vários desempenhos de software disso. Além disso, todas as redes de linha de comunicação incluindo uma rede por fios, uma rede sem fio, ou ambas as redes tal como, por exemplo, a Internet ou uma rede local (LAN) podem ser empregadas como a rede 1003, que é um meio de comunicação, e há vários desempenhos de transmissão de dados. Além disso, há uma preocupação que um desempenho de transmissão de dados pode variar dependendo de outras circunstâncias de comunicação ou similar.

[00556] Portanto, antes de começar a transmissão de dados, o servidor de entrega 1002 pode executar comunicação com um aparelho terminal que é um destino de transmissão dos dados, de modo a obter informação relativa a desempenhos do aparelho terminal tal como um desempenho de hardware do aparelho terminal e um desempenho de uma aplicativo (software) executado pelo aparelho terminal, e informação relativa a circunstâncias de comunicação tal como uma largura de banda disponível da rede 1003. Além disso, o servidor de entrega 1002 pode selecionar uma camada apropriada na base da informação obtida aqui.

[00557] Adicionalmente, a extração de uma camada pode ser executada pelo aparelho terminal. Por exemplo, o computador pessoal 1004 pode decodificar os dados codificados graduáveis transmitidos (BL+EL) 1011 de modo a exibir uma imagem de camada básica e exibir uma imagem de camada de aprimoramento. Além disso, por exemplo, o computador pessoal 1004 pode extrair os dados codificados graduáveis de camada básica (BL) 1012 dos dados codificados graduáveis transmitidos (BL+EL) 1011 de modo a armazenar os dados, transmitir os dados para outros dispositivos, ou decodificar os dados para exibição de uma imagem de camada básica.

[00558] Certamente, o número de unidades de memória de dados codificados graduáveis 1001, o número de servidores de entrega 1002, o número de redes 1003, e o número de aparelhos terminais são todos arbitrários. Além disso, na descrição anterior, uma descrição foi feita de um exemplo no qual o servidor de entrega 1002 transmite dados para o aparelho terminal, mas um exemplo de uso não está limitado a isso. O sistema de transmissão de dados 1000 é aplicável a qualquer sistema contanto que o sistema selecione e transmita uma camada apropriada na base de um desempenho de um aparelho terminal, circunstâncias de comunicação, ou similar quando dados codificados são codificados de modo graduável e transmitidos para o aparelho terminal.

Segundo Sistema

[00559] A codificação graduável é usada, por exemplo, para transmissão usando uma pluralidade de meios de comunicação como em um exemplo ilustrado na Figura 89.

[00560] Em um sistema de transmissão de dados 1100 ilustrado na Figura 89, uma estação de radiodifusão 1101 transmite dados codificados graduáveis de camada básica (BL) 1121 usando uma radiodifusão terrestre 1111. Além disso, a estação de radiodifusão 1101 transmite (por exemplo, empacota e transmite) dados codificados graduáveis de camada de aprimoramento (EL) 1122 por qualquer rede 1112 formada por uma rede por fios, uma rede sem fio, ou ambas as redes.

[00561] Um aparelho terminal 1102 tem uma função de recepção da radiodifusão terrestre 1111 que é radiodifundida pela estação de radiodifusão 1101, e recebe os dados codificados graduáveis de camada básica (BL) 1121 que são transmitidos pela radiodifusão terrestre 1111. Além disso, o aparelho terminal 1102 tem adicionalmente uma função de comunicação de executar comunicação usando a rede 1112, e recebe os dados codificados graduáveis de camada de aprimoramento (EL) 1122 que são transmitidos pela rede 1112.

[00562] O aparelho terminal 1102 pode decodificar os dados codificados graduáveis de camada básica (BL) 1121 que são adquiridos pela radiodifusão terrestre 1111, por exemplo, em resposta a uma instrução de um usuário, de modo a obter uma imagem de camada básica, armazenar a imagem, e transmitir a imagem para outros aparelhos.

[00563] Além disso, por exemplo, em resposta a uma instrução de um usuário, o aparelho terminal 1102 pode combinar os dados codificados graduáveis de camada básica (BL) 1121 que são adquiridos pela radiodifusão terrestre 1111 com os dados codificados graduáveis de camada não básica (EL) 1122 que são adquiridos pela rede 1112 de modo a obter dados codificados graduáveis (BL+EL), e pode decodificar os dados de modo a obter uma imagem de camada básica, armazenar a imagem, e transmitir a imagem para outros aparelhos.

[00564] Como mencionado acima, os dados codificados graduáveis podem ser transmitidos por um meio de comunicação que é diferente para cada camada, por exemplo. Neste caso, uma carga pode ser distribuída, e assim é possível minimizar a ocorrência de atraso ou transbordamento.

[00565] Além disso, um meio de comunicação usado para transmissão pode ser selecionado para cada camada dependendo de circunstâncias. Por exemplo, os dados codificados graduáveis de camada básica (BL) 1121 tendo uma quantidade relativamente grande de dados podem ser transmitidos por um meio de comunicação tendo uma largura de banda larga, e os dados codificados graduáveis de camada de aprimoramento (EL) 1122 tendo uma quantidade relativamente pequena de dados podem ser transmitidos por um meio de comunicação tendo uma largura de banda estreita. Além disso, por exemplo, um meio de comunicação para transmitir os dados codificados graduáveis de camada de aprimoramento (EL) 1122 podem ser mudados entre a rede 1112 e a radiodifusão terrestre 1111 dependendo de uma largura de banda disponível da rede 1112. Certamente, isto também é o mesmo para dados de qualquer camada.

[00566] O controle é executado como mencionado acima, e assim é possível adicionalmente minimizar um aumento em uma carga em transmissão de dados.

[00567] Certamente, o número de camadas é arbitrário, e o número de meios de comunicação usados para transmissão também é arbitrário. Adicionalmente, o número de aparelhos terminais 1102 servindo como um destino de transmissão de dados também é arbitrário. Além disso, na descrição anterior, a descrição foi feita de radiodifusão da estação de radiodifusão 1101 como um exemplo, mas um exemplo de uso não está limitado a isso. O sistema de transmissão de dados 1100 é aplicável a qualquer de sistema contanto que o sistema divida dados codificados que são codificados de modo graduável em uma pluralidade de itens de dados na unidade de camadas e transmita os itens de dados por uma pluralidade de linhas.

Terceiro Sistema

[00568] A codificação graduável é usada, por exemplo, para armazenar dados codificados como em um exemplo ilustrado na Figura 90.

[00569] Em um sistema de formação de imagem 1200 ilustrado na Figura 90, um aparelho de formação de imagem 1201 codifica de modo graduável dados de imagem que são obtidos visualizando um tema 1211, e provê dados resultantes para um dispositivo de armazenamento de dados codificados graduáveis 1202 como dados codificados graduáveis (BL+EL) 1221.

[00570] O dispositivo de armazenamento de dados codificados graduáveis 1202 armazena os dados codificados graduáveis (BL+EL) 1221 que são providos do aparelho de formação de imagem 1201, com qualidade baseada em circunstâncias. Por exemplo, em um caso do tempo normal, o dispositivo de armazenamento de dados codificados graduáveis 1202 extrai dados de camada básica dos dados codificados graduáveis (BL+EL) 1221, e armazena os dados como dados codificados graduáveis de camada básica (BL) 1222 tendo uma quantidade pequena de dados com baixa qualidade. Em contraste, por exemplo, em um caso do tempo de notificação, o dispositivo de armazenamento de dados codificados graduáveis 1202 armazena os dados codificados graduáveis (BL+EL) 1221 tendo uma quantidade grande de dados com qualidade alta como estão.

[00571] Por conseguinte, desde que o dispositivo de armazenamento de dados codificados graduáveis 1202 pode preservar uma imagem de alta qualidade como necessário somente, é possível minimizar um aumento em uma quantidade de dados enquanto minimizando uma redução no valor de uma imagem devido à deterioração de qualidade de imagem, e assim melhorar a eficiência de uso de uma região de armazenamento.

[00572] Por exemplo, o aparelho geração de imagem 1201 é assumido ser uma câmera de monitoração. Em um caso (um caso do tempo normal) onde um objetivo de monitoração (por exemplo, um transgressor) não é refletido em uma imagem capturada, há uma alta probabilidade que conteúdo da imagem capturada pode não ser importante, e assim uma redução em uma quantidade de dados é priorizada, e os dados de imagem (dados codificados graduáveis) são armazenados com baixa qualidade. Em contraste, em um caso (um caso do tempo de notificação) onde um objetivo de monitoração é refletido em uma imagem capturada como o tema 1211, há uma alta probabilidade que conteúdo da imagem capturada pode ser importante, e assim qualidade de imagem é priorizada, e os dados de imagem (dados codificados graduáveis) são armazenados com alta qualidade.

[00573] Além disso, o tempo normal e o tempo de notificação podem ser determinados, por exemplo, pelo dispositivo de armazenamento de dados codificados graduáveis 1202 analisando uma imagem. Adicionalmente, o tempo normal e o tempo de notificação podem ser determinados, por exemplo, pelo aparelho de formação de imagem 1201, e um resultado de determinação pode ser transmitido para o dispositivo de armazenamento de dados codificados graduáveis 1202.

[00574] Além disso, um critério de determinação do tempo normal e do tempo de notificação é arbitrário, e conteúdo de uma imagem capturada que é usada como um critério de determinação é arbitrário. Certamente, condições diferentes de o conteúdo de uma imagem capturada podem ser usadas como um critério de determinação. Por exemplo, o tempo normal e o tempo de notificação podem ser mudados na base da magnitude, uma forma de onda, ou similar de um som gravado, e podem ser mudados, por exemplo, para cada intervalo de tempo predeterminado, ou por uma instrução externa tal como uma instrução de um usuário.

[00575] Além disso, na descrição anterior, um exemplo de mudar dois estados incluindo o tempo normal e o tempo de notificação foi descrito, mas o número de estados é arbitrário, e, por exemplo, três ou mais estados tais como o tempo normal, o tempo de notificação ligeiro, o tempo de notificação, o tempo de notificação grande, podem ser mudados. Aqui, um número de limite superior de estados mudados depende do número de camadas de dados codificados graduáveis.

[00576] Além disso, o aparelho de formação de imagem 1201 pode determinar o número de camadas codificadas graduáveis na base de um estado. Por exemplo, em um caso do tempo normal, o aparelho de formação de imagem 1201 pode gerar os dados codificados graduáveis de camada básica (BL) 1222 tendo uma quantidade pequena de dados com baixa qualidade, e pode prover os dados ao dispositivo de armazenamento de dados codificados graduáveis 1202. Adicionalmente, por exemplo, em um caso do tempo de notificação, o aparelho de formação de imagem 1201 pode gerar os dados codificados graduáveis de camada básica e camada não básica (BL+EL) 1221 tendo uma quantidade grande de dados com alta qualidade, e pode prover os dados ao dispositivo de armazenamento de dados codificados graduáveis 1202.

[00577] Na descrição anterior, a descrição foi feita da câmera de monitoração como um exemplo, mas uso do sistema de formação de imagem 1200 é arbitrário e não está limitado a uma câmera de monitoração.

Décima Segunda Modalidade Outros Exemplos

[00578] Na descrição anterior, exemplos de aparelhos ou sistemas aos quais a tecnologia presente é aplicada foram descritos, mas a tecnologia presente não está limitada a isso, e pode ser realizada por todas as configurações montadas em um dispositivo formando o aparelho ou o sistema, por exemplo, um processador como integração em larga escala de sistema (LSI) ou similar, um módulo usando uma pluralidade de processadores, uma unidade usando uma pluralidade de módulos, um aparelho no qual outras funções estão adicionadas à unidade, e similar (uma configuração de uma parte de um aparelho).

Exemplo de Configuração de Aparelho de Vídeo

[00579] Com referência à Figura 91, descrição será feita de um exemplo no qual a tecnologia presente é realizada por um aparelho. Figura 91 ilustra um exemplo de uma configuração esquemática de um aparelho de vídeo ao qual a tecnologia presente é aplicada.

[00580] Multi-funcionamento de um aparelho eletrônico progrediu recentemente, e assim há muitos casos onde, quando uma configuração parcial é vendida ou provida em desenvolvimento ou fabricação disso, não só uma configuração tendo uma única função é realizada, mas também um aparelho tendo uma pluralidade de funções por combinação de uma pluralidade de configurações tendo funções relacionadas é implementada.

[00581] Um aparelho de vídeo 1300 ilustrado na Figura 91 tem uma configuração multifuncional, e é um no qual um dispositivo tendo uma função relativa à codificação ou decodificação (uma ou ambas da codificação ou decodificação podem ser usadas) de uma imagem é combinado com um dispositivo tendo outras funções relacionadas à função.

[00582] Como ilustrado na Figura 91, o aparelho de vídeo 1300 inclui um grupo de módulo tal como um módulo de vídeo 1311, uma memória externa 1312, um módulo de administração de energia 1313 e um módulo de extremidade dianteira 1314, e dispositivos tendo funções relacionadas, tais como uma conectividade 1321, uma câmera 1322 e um sensor 1323.

[00583] O módulo é um componente tendo uma função unificada colecionando várias funções de componente mutuamente relacionadas. Uma configuração física específica do módulo é arbitrária, e, por exemplo, uma pluralidade de processadores tendo cada função, elementos de circuito eletrônico tais como resistores e capacitores, outros dispositivos, e similar podem ser dispostos sobre uma placa de fiação elétrica e formados integralmente. Além disso, um módulo pode ser combinado com outros módulos, processadores, ou similar, de modo a formar um novo módulo.

[00584] Em um caso do exemplo da Figura 91, o módulo de vídeo 1311 é uma combinação de configurações tendo funções relativas a processamento de imagem, e inclui um processador de aplicativo, um processador de vídeo, um modem de banda larga 1333 e um módulo de RF 1334.

[00585] O processador é um no qual configurações tendo funções predeterminadas estão integradas em um chip de semicondutor usando um sistema sobre um chip (SoC), e pode haver um processador que é chamado, por exemplo, integração em larga escala de sistema (LSI). As configurações tendo funções predeterminadas podem ser conjunto de circuitos lógicos (configuração de hardware), podem ser uma CPU, uma ROM, uma RAM, e similar, e programas (configuração de software) executados usando as configurações, e podem ser uma combinação de ambos disso. Por exemplo, o processo inclui um circuito lógico, uma CPU, uma ROM, uma RAM, e similar, algumas funções podem ser realizadas pelo circuito lógico (configuração de hardware), e outras funções podem ser realizadas pelo programa (configuração de software) executado pela CPU.

[00586] O processador de aplicativo 1331 da Figura 91 é um processador que executa um aplicativo relacionado a processamento de imagem. O aplicativo executado pelo processador de aplicativo 1331 pode executar um processo de cálculo a fim de realizar uma função predeterminada, e também pode controlar elementos constituintes dentro e fora do módulo de vídeo 1311, tal como o processador de vídeo 1332.

[00587] O processador de vídeo 1332 é um processador tendo uma função relacionada à codificação/decodificação (uma ou ambas disso) de uma imagem.

[00588] O modem de banda larga 1333 é um processador (ou um módulo) que executa um processo relacionado à comunicação de banda larga por fios ou sem fio (ou ambos disso) que é executada por uma linha de banda larga tal como a Internet ou uma linha de telefone público. Por exemplo, o modem de banda larga 1333 modula dados digitalmente (sinal digital) a serem transmitidos, para conversão em um sinal analógico, ou demodula um sinal analógico recebido para conversão em dados (sinal digital). Por exemplo, o modem de banda larga 1333 pode modular/demodular digitalmente qualquer informação tais como dados de imagem processados pelo processador de vídeo 1332, um fluxo no qual os dados de imagem estão codificados, um programa aplicativo, ou dados de estabelecimento.

[00589] O módulo de RF 1334 é um módulo que executa conversão de freqüência, modulação/demodulação, amplificação, filtragem, e similar em um sinal de radiofreqüência (RF) que é transmitido e recebido por uma antena. Por exemplo, o módulo de RF 1334 executa conversão de freqüência ou similar em um sinal de banda base gerado pelo modem de banda larga 1333 de modo a gerar um sinal de RF. Além disso, por exemplo, o módulo de RF 1334 executa conversão de freqüência ou similar em um sinal de RF que é recebido pelo módulo de extremidade dianteira 1314, de modo a gerar um sinal de banda base.

[00590] Adicionalmente, na Figura 91, como indicado por uma linha pontilhada 1341, o processador de aplicativo 1331 e o processador de vídeo 1332 podem ser formados integralmente de modo a configurar um único processador.

[00591] A memória externa 1312 é um módulo que é provido fora do módulo de vídeo 1311 e inclui um dispositivo de armazenamento usado pelo módulo de vídeo 1311. O dispositivo de armazenamento da memória externa 1312 pode ser implementado por qualquer configuração física, mas é geralmente usado para armazenar um grande volume de dados tais como dados de imagem de unidades de quadro, e é assim implementado preferivelmente por uma memória de semicondutor de grande capacidade que é relativamente barata, tal como uma memória de acesso aleatório dinâmica (DRAM).

[00592] O módulo de administração de energia 1313 administra e controla a energia que é provida ao módulo de vídeo 1311 (cada elemento constituinte no módulo de vídeo 1311).

[00593] O módulo de extremidade dianteira 1314 é um módulo que provê uma função de extremidade dianteira (um circuito de uma extremidade de transmissão e recepção de um lado de antena) para o módulo de RF 1334. Como ilustrado na Figura 91, o módulo de extremidade dianteira 1314 inclui, por exemplo, uma porção de antena 1351, um filtro 1352 e uma porção de amplificação 1353.

[00594] A porção de antena 1351 inclui uma antena e elementos constituintes periféricos que transmitem e recebem um sinal sem fio. A porção de antena 1351 transmite um sinal que é provido da porção de amplificação 1353 como um sinal sem fio, e provê o sinal sem fio recebido ao filtro 1352 como um sinal elétrico (sinal de RF). O filtro 1352 executa um processo de filtro no sinal de RF recebido que é recebido pela porção de antena 1351, e provê um sinal de RF processado ao módulo de RF 1334. A porção de amplificação 1353 amplifica o sinal de RF provido do módulo de RF 1334, e provê o sinal amplificado à porção de antena 1351.

[00595] A conectividade 1321 é um módulo tendo uma função relacionada à conexão a um dispositivo externo. Uma configuração física da conectividade 1321 é arbitrária. Por exemplo, a conectividade 1321 inclui um elemento constituinte tendo uma função de comunicação diferente de um padrão de comunicação suportado pelo modem de banda larga 1333, uma entrada externa e terminal de saída, e similar.

[00596] Por exemplo, a conectividade 1321 pode incluir um módulo tendo uma função de comunicação se conformando a um padrão de comunicação sem fio tal como Bluetooth (marca registrada) ou IEEE 802.11 (por exemplo, Fidelidade Sem fio (Wi-Fi, marca registrada), comunicação de campo próximo (NFC), ou Associação de Dados de Infravermelho (IrDA)), uma antena que transmite e recebe um sinal se conformando ao padrão, e similar. Além disso, por exemplo, a conectividade 1321 pode incluir um módulo tendo uma função de comunicação se conformando a um padrão de comunicação por fios tal como Barramento Serial Universal (USB) ou Interface de Multimídia de Alta Definição (HDMI) (marca registrada), ou um terminal se conformando ao padrão. Adicionalmente, por exemplo, a conectividade 1321 pode ter outras funções de transmissão de dados (sinal) em um terminal de entrada e saída analógica ou similar.

[00597] Além disso, a conectividade 1321 pode incluir um dispositivo de um destino de transmissão de dados (sinal). Por exemplo, a conectividade 1321 pode incluir uma unidade de disco (incluindo não só uma unidade de meio removível, mas também um disco rígido, uma unidade de estado sólido (SSD), e um armazenamento conectado à rede (NSA)) que executa leitura ou escrita de dados de ou para um meio de gravação tal como um disco magnético, um disco óptico, um disco magneto-óptico, ou uma memória de semicondutor. Adicionalmente, a conectividade 1321 pode incluir um dispositivo de saída de imagem ou som (um monitor, um alto-falante, ou similar).

[00598] A câmera 1322 é um módulo tendo uma função de capturar uma imagem de um tema, e adquirir dados de imagem do tema. Os dados de imagem adquiridos pela câmera 1322 capturando uma imagem do tema são providos, por exemplo, ao processador de vídeo 1332, e são codificados.

[00599] O sensor 1323 é um módulo tendo qualquer função de sensor, tal como um sensor de áudio, um sensor ultra-sônico, um sensor óptico, um sensor de iluminância, um sensor de infravermelho, um sensor de imagem, um sensor de rotação, um sensor de ângulo, um sensor de velocidade angular, um sensor de velocidade, um sensor de aceleração, um sensor de inclinação, um sensor de identificação magnética, um sensor de impacto, ou um sensor de temperatura. Dados detectados pelo sensor 1323 são providos, por exemplo, ao processador de aplicativo 1331, e são usados por um aplicativo ou similar.

[00600] Na descrição anterior, uma configuração descrita como um módulo pode ser realizada como um processador, e, reciprocamente, uma configuração descrita como um processador pode ser realizada como um módulo.

[00601] No aparelho de vídeo 1300 tendo a configuração descrita acima, a descrição presente é aplicável ao processador de vídeo 1332 como descrito mais tarde. Portanto, o aparelho de vídeo 1300 pode ser implementado como um aparelho ao qual a tecnologia presente é aplicada.

Exemplo de Configuração de Processador de Vídeo

[00602] A Figura 92 ilustra um exemplo de uma configuração esquemática do processador de vídeo 1332 (Figura 91) ao qual a tecnologia presente é aplicada.

[00603] Em um caso do exemplo da Figura 92, o processador de vídeo 1332 tem uma função de receber um sinal vídeo e um sinal de áudio e codificar os sinais em um método predeterminado, e uma função de decodificar dados de vídeo codificados e dados de áudio de modo a reproduzir um sinal vídeo e um sinal de áudio.

[00604] Como ilustrado na Figura 92, o processador de vídeo 1332 inclui uma porção de processamento de entrada de vídeo 1401, uma primeira porção de ampliação/redução de imagem 1402, uma segunda porção de ampliação/redução de imagem 403, uma porção de processamento de saída de vídeo 1404, uma memória de quadro 1405, e uma porção de controle de memória 1406. Além disso, o processador de vídeo 1332 inclui uma máquina de codificação/decodificação 1407, buffers de fluxo elementar de vídeo (ES) 1408A e 1408B, e buffers de ES de áudio 1409A e 1409B. Adicionalmente, o processador de vídeo 1332 inclui um codificador de áudio 1410, um decodificador de áudio 1411, um multiplexador (MUX) 1412, um desmultiplexador (DMUX) 1413 e uma buffer de fluxo 1414.

[00605] A porção de processamento de entrada de vídeo 1401 adquire um sinal de vídeo que é entrado, por exemplo, da conectividade 1321 (Figura 91) ou similar, e converte o sinal de vídeo em dados de imagem digitais. A primeira porção de ampliação/redução de imagem 1402 executa conversão de formato ou um processo de amplificação ou redução de imagem nos dados de imagem. A segunda porção de ampliação/redução de imagem 1403 executa um processo de amplificação ou redução de imagem conforme um formato a um destino de um vídeo que é produzido pela porção de processamento de saída de vídeo 1404 nos dados de imagem, ou executa a mesma conversão de formato ou processo de ampliação ou redução de imagem como na primeira porção de ampliação/redução de imagem 1402 nos dados de imagem. A porção de processamento de saída de vídeo 1404 executa conversão de formato, conversão em um sinal analógico, ou similar nos dados de imagem, e produz um sinal convertido para, por exemplo, a conectividade 1321 (Figura 91) ou similar como um sinal de vídeo reproduzido.

[00606] A memória de quadro 1405 é uma memória para dados de imagem, compartilhados pela porção de processamento de entrada de vídeo 1401, pela primeira porção de ampliação/redução de imagem 1402, pela segunda porção de ampliação/redução de imagem 1403, pela porção de processo de saída de vídeo 1404, e pela máquina de codificação/decodificação 1407. A memória de quadro 1405 é implementada por uma memória de semicondutor tal como uma DRAM.

[00607] A porção de controle de memória 1406 recebe um sinal de sincronização da máquina de codificação/decodificação 1407, e controla acesso de escrita/leitura à memória de quadro 1405 de acordo com um programa para acesso à memória de quadro 1405, escrito em uma tabela de administração de acesso 1406A. A tabela de administração de acesso 1406A é atualizada pela porção de controle de memória 1406 conforme processos executados pela máquina de codificação/decodificação 1407, pela primeira porção de ampliação/redução de imagem 1402, pela segunda porção de ampliação/redução de imagem 1403, e similar.

[00608] A máquina de codificação/decodificação 1407 executa um processo de codificação em dados de imagem, e um processo de decodificação em um fluxo de vídeo que são dados codificados de dados de imagem. Por exemplo, a máquina de codificação/decodificação 1407 codifica dados de imagem lidos da memória de quadro 1405, e escreve sequencialmente os dados de imagem codificados à buffer de ES de vídeo 1408A como um fluxo de vídeo. Além disso, por exemplo, fluxos de vídeo são lidos sequencialmente da buffer de ES de vídeo 1408B de modo a serem decodificados, e são escritos sequencialmente à memória de quadro 1405 como dados de imagem. A máquina de codificação/decodificação 1407 usa a memória de quadro 1405 como uma área de trabalho na codificação ou decodificação. Adicionalmente, a máquina de codificação/decodificação 1407 produz um sinal de sincronização para a porção de controle de memória 1406, por exemplo, a uma temporização de começar um processo em cada macrobloco.

[00609] A buffer de ES de vídeo 1408A armazena temporariamente um fluxo de vídeo gerado pela máquina de codificação/decodificação 1407, e provê o fluxo vídeo armazenado temporariamente para o multiplexador (MUX) 1412. A buffer de ES de vídeo 1408B armazena temporariamente um fluxo de vídeo provido do desmultiplexador (DMUX) 1413, e provê o fluxo de vídeo armazenado temporariamente para a máquina de codificação/decodificação 1407.

[00610] A buffer de ES de áudio 1409A armazena temporariamente um fluxo de áudio gerado pelo codificador de áudio 1410, e provê o fluxo de áudio armazenado temporariamente para o multiplexador (MUX) 1412. A buffer de ES de áudio 1409B armazena temporariamente um fluxo de áudio provido do desmultiplexador (DMUX) 1413, e provê o fluxo de áudio armazenado temporariamente para o decodificador de áudio 1411.

[00611] O codificador de áudio 1410, por exemplo, converte digitalmente um sinal de áudio que é entrado, por exemplo, da conectividade 1321 (Figura 91) ou similar, e codifica o sinal de áudio convertido em um método predeterminado tal como um método de áudio de MPEG ou AudioCode número 3 (AC3). O codificador de áudio 1410 escreve sequencialmente um fluxo de áudio que são dados codificados do sinal de áudio à buffer de ES de áudio 1409A. O decodificador de áudio 1411 decodifica um fluxo de áudio provido da buffer de ES de áudio 1409B para executar conversão em um sinal analógico, ou similar, e provê o sinal analógico para, por exemplo, a conectividade 1321 (Figura 91) ou similar como um sinal de áudio reproduzido.

[00612] O multiplexador (MUX) 1412 multiplexa o fluxo de vídeo e o fluxo de áudio. Um método da multiplexação (quer dizer, um formato de fluxo de bit gerado pela multiplexação) é arbitrário. Além disso, durante a multiplexação, o multiplexador (MUX) 1412 pode adicionar informação de cabeçalho predeterminada ao fluxo de bit. Em outras palavras, o multiplexador (MUX) 1412 pode converter um formato do fluxo pela multiplexação. Por exemplo, o multiplexador (MUX) 1412 multiplexa o fluxo de vídeo e o fluxo de áudio de modo a executar conversão em um fluxo de transporte que é fluxo de bit com um formato de transmissão. Adicionalmente, por exemplo, o multiplexador (MUX) 1412 multiplexa o fluxo de vídeo e o fluxo de áudio para executar conversão em dados (dados de arquivo) com um formato de arquivo de gravação.

[00613] O desmultiplexador (DMUX) 1413 desmultiplexa o fluxo de bit no qual um fluxo de vídeo e um fluxo de áudio estão multiplexados, em um método correspondendo à multiplexação pelo multiplexador (MUX) 1412. Em outras palavras, o desmultiplexador (DMUX) 1413 extrai um fluxo de vídeo e um fluxo de áudio de fluxo de bit que é lido da buffer de fluxo 1414 (separa o fluxo vídeo e o fluxo de áudio disso). Quer dizer, o desmultiplexador (DMUX) 1413 pode converter um formato do fluxo pela desmultiplexação (conversão inversa da conversão no multiplexador (MUX) 1412). Por exemplo, o desmultiplexador (DMUX) 1413 pode adquirir um fluxo de transporte que é provido, por exemplo, da conectividade 1321 ou do modem de banda larga 1333 (Figura 91), pela buffer de fluxo 1414, e desmultiplexa o fluxo de transporte de modo a executar conversão em um fluxo de vídeo e um fluxo de áudio. Além disso, por exemplo, o desmultiplexador (DMUX) 1413 pode adquirir dados de arquivo que são lidos de vários meios de gravação, por exemplo, a conectividade 1321 (Figura 91), pelo buffer de fluxo 1414, e desmultiplexa o fluxo de transporte de modo a executar conversão em um fluxo de vídeo e um fluxo de áudio.

[00614] A buffer de fluxo 1414 armazena temporariamente um fluxo de bit. Por exemplo, a buffer de fluxo 1414 armazena temporariamente um fluxo de transporte provido do multiplexador (MUX) 1412, e provê o fluxo de transporte armazenado para, por exemplo, a conectividade 1321 ou o modem de banda larga 1333 (Figura 91) a uma temporização predeterminada, ou na base de um pedido ou similar de um dispositivo externo.

[00615] Além disso, por exemplo, a buffer de fluxo 1414 armazena temporariamente dados de arquivo providos do multiplexador (MUX) 1412, e provê os dados de arquivo armazenados temporariamente para, por exemplo, a conectividade 1321 (Figura 91) de modo a gravar os dados de arquivo em vários meios de gravação a uma temporização predeterminada, ou na base de um pedido ou similar de um dispositivo externo.

[00616] Adicionalmente, a buffer de fluxo 1414 armazena temporariamente um fluxo de transporte que é adquirido, por exemplo, pela conectividade 1321 ou pelo modem de banda larga 1333 (Figura 91), e provê o fluxo de transporte armazenado temporariamente ao desmultiplexador (DMUX) 1413 a uma temporização predeterminada, ou na base de um pedido ou similar de um dispositivo externo.

[00617] Além disso, a buffer de fluxo 1414 armazena temporariamente dados de arquivo que são lidos de vários meios de gravação na conectividade 1321 (Figura 91) ou similar, e provê o fluxo de transporte armazena temporariamente ao desmultiplexador (DMUX) 1413 a uma temporização predeterminada, ou na base de um pedido ou similar de um dispositivo externo.

[00618] A seguir, um exemplo de uma operação do processador de vídeo 1332 tendo a configuração será descrito. Por exemplo, um sinal de vídeo que é entrado ao processador de vídeo 1332 da conectividade 1321 (Figura 91) ou similar é convertido em dados de imagem digitais em um esquema predeterminado tal como um esquema de Y/Cb/Cr 4:2:2 pela porção de processamento de entrada de vídeo 1401, e é escrito sequencialmente à memória de quadro 1405. Os dados de imagem digitais são lidos à primeira porção de ampliação/redução de imagem 1402 ou à segunda porção de ampliação/redução de imagem 1403, e sofrem conversão de formato e um processo de ampliação ou redução em um esquema predeterminado tal como um esquema de Y/Cb/Cr 4:2:0 de modo a serem escritos à memória de quadro 1405 novamente. Os dados de imagem são codificados pela máquina de codificação/decodificação 1407 e são então escritos à buffer de ES de vídeo 1408A como um fluxo de vídeo.

[00619] Além disso, um sinal de áudio que é entrado ao processador de vídeo 1332 da conectividade 1321 (Figura 91) ou similar é codificado pelo codificador de áudio 1410, e é escrito à buffer de ES de áudio 1409A como um fluxo de áudio.

[00620] A fluxo de vídeo da buffer de ES de vídeo 1408A e o fluxo de áudio da buffer de ES de áudio 1409A são lidos ao multiplexador (MUX) 1412 para serem multiplexados e serem convertidos em um fluxo de transporte, dados de arquivo, ou similar. O fluxo de transporte gerado pelo multiplexador (MUX) 1412 é armazenado temporariamente na buffer de fluxo 1414, e é então produzido a uma rede externa, por exemplo, pela conectividade 1321 ou pelo modem de banda larga 1333 (Figura 91). Além disso, os dados de arquivo gerados pelo multiplexador (MUX) 1412 são armazenados temporariamente na buffer de fluxo 1414, e são produzidos então para, por exemplo, a conectividade 1321 (Figura 91) de modo a serem gravados em vários meios de gravação.

[00621] Adicionalmente, um fluxo de transporte que é entrado ao processador de vídeo 1332 de uma rede externa, por exemplo, pela conectividade 1321 ou pelo modem de banda larga 1333 (Figura 91) é armazenado temporariamente na buffer de fluxo 1414, e é então desmultiplexado pelo desmultiplexador (DMUX) 1413. Além disso, por exemplo, dados de arquivo que são lidos de vários meios de gravação, por exemplo, na conectividade 1321 (Figura 91) e são entrados ao processador de vídeo 1332 são armazenados temporariamente na buffer de fluxo 1414, e são então desmultiplexados pelo desmultiplexador (DMUX) 1413. Em outras palavras, o fluxo de transporte ou os dados de arquivo que são entrados ao processador de vídeo 1332 são separados em um fluxo de vídeo e um fluxo de áudio pelo desmultiplexador (DMUX) 1413.

[00622] O fluxo de áudio é provido ao decodificador de áudio 1411 pela buffer de ES de áudio 1409B de modo a ser decodificado e reproduzido como um sinal de áudio. Além disso, o fluxo de vídeo que é escrito à buffer de ES de vídeo 1408B é então lido sequencialmente pela máquina de codificação/decodificação 1407 de modo a ser decodificado e ser escrito à memória de quadro 1405. Os dados de imagem decodificados sofrem um processo de ampliação ou redução na segunda porção de ampliação/redução de imagem 1403 de modo a serem escritos à memória de quadro 1405. Adicionalmente, os dados de imagem decodificados são lidos à porção de processamento de saída de vídeo 1404 de modo a sofrerem conversão de formato em um esquema predeterminado tal como um esquema de Y/Cb/Cr 4:2:2 e adicionalmente sofrerem conversão em um sinal analógico, e assim um sinal de vídeo é reproduzido e produzido.

[00623] Em um caso onde a tecnologia presente é aplicada ao processador de vídeo 1332 tendo a configuração, a descrição presente relacionada a cada modalidade descrita acima pode ser aplicada à máquina de codificação/decodificação 1407. Em outras palavras, por exemplo, a máquina de codificação/decodificação 1407 pode ter a função do dispositivo de codificação ou do dispositivo de decodificação relacionado à primeira modalidade. Por conseguinte, o processador de vídeo 1332 pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13.

[00624] Além disso, na máquina de codificação/decodificação 1407, a tecnologia presente (quer dizer, a função do dispositivo de codificação de imagem ou do dispositivo de decodificação de imagem relacionado a cada modalidade descrita acima) pode ser realizada através de hardware tal como um circuito lógico, pode ser realizada através de software tal como um programa embutido, e pode ser realizada por ambos disso.

Outro exemplo de Configuração de Processador de Vídeo

[00625] A Figura 93 ilustra outro exemplo de configuração esquemática do processador de vídeo 1332 (Figura 91) ao qual a tecnologia presente é aplicada. Em um caso do exemplo da Figura 93, o processador de vídeo 1332 tem uma função de codificar e decodificar dados de vídeo em um método predeterminado.

[00626] Mais especificamente, como ilustrado na Figura 93, o processador de vídeo 1332 inclui uma porção de controle 1511, uma interface de exibição 1512, uma máquina de exibição 1513, uma máquina de processamento de imagem 1514 e uma memória interna 1515. Além disso, o processador de vídeo 1332 inclui uma máquina de codec 1516, uma interface de memória 1517, um multiplexador/desmultiplexador (MUX DEMUX) 1518, uma interface de rede 1519 e uma interface de vídeo 1520.

[00627] A porção de controle 1511 controla uma operação de cada porção de processamento do processador de vídeo 1332, tal como a interface de exibição 1512, a máquina de exibição 1513, a máquina de processamento de imagem 1514 e a máquina de codec 1516.

[00628] Como ilustrado na Figura 93, a porção de controle 1511 inclui, por exemplo, uma CPU principal 1531, uma sub-CPU 1532 e um controlador de sistema 1533. A CPU principal 1531 executa um programa ou similar para controlar uma operação de cada porção de processo do processador de vídeo 1332. A CPU principal 1531 gera um sinal de controle de acordo com o programa ou similar, e provê o sinal de controle para cada porção de processamento (quer dizer, controla uma operação de cada porção de processamento). A sub-CPU 1532 ajuda a CPU principal 1531. Por exemplo, a sub-CPU 1532 executa um processo de criança, uma sub-rotina, ou similar de um programa executado pela CPU principal 1531. O controlador de sistema 1533 controla as operações da CPU principal 1531 e da sub-CPU 1532 designando um programa que é para ser executado pela CPU principal 1531 e pela sub-CPU 1532.

[00629] A interface de exibição 1512 produz dados de imagem, por exemplo, para a conectividade 1321 (Figura 91) sob o controle da porção de controle 1511. Por exemplo, a interface de exibição 1512 converte dados de imagem digitais em um sinal analógico e produz o sinal analógico para um dispositivo de monitor ou similar da conectividade 1321 (Figura 91), ou produz os dados de imagem digitais para o dispositivo de monitor como estão.

[00630] A máquina de exibição 1513 executa vários processos de conversão tais como conversão de formato, conversão de tamanho e conversão de série de cor em dados de imagem, de modo a ser satisfatório para uma especificação de hardware de um dispositivo de monitor ou similar que exibe uma imagem, sob o controle da porção de controle 1511.

[00631] A máquina de processamento de imagem 1514 executa um processo de imagem predeterminado tal como um processo de filtro para melhorar a qualidade de imagem, nos dados de imagem, sob o controle da porção de controle 1511.

[00632] A memória interna 1515 é uma memória que é compartilhada pela máquina de exibição 1513, pela máquina de processamento de imagem 1514 e pela máquina de codec 1516, e é provida no processador de vídeo 1332. A memória interna 1515 é usada para transmitir e receber dados entre, por exemplo, a máquina de exibição 1513, a máquina de processamento de imagem 1514 e a máquina de codec 1516. Por exemplo, a memória interna 1515 armazena dados providos da máquina de exibição 1513, da máquina de processamento de imagem 1514, ou da máquina de codec 1516, e provê os dados para a máquina de exibição 1513, a máquina de processamento de imagem 1514, ou a máquina de codec 1516 como necessário (por exemplo, em resposta a um pedido). A memória interna 1515 pode ser realizada por qualquer dispositivo de armazenamento, mas é geralmente usado freqüentemente para armazenar um volume pequeno de dados tais como dados de imagem da unidade de bloco ou um parâmetro, e é assim implementada preferivelmente por uma memória de semicondutor que tem uma capacidade relativamente pequena (por exemplo, comparada à memória externa 1312), mas tem uma velocidade de resposta alta, tal como uma memória de acesso aleatório estática (SRAM).

[00633] A máquina de codec 1516 executa um processo relativo à codificação ou decodificação de dados de imagem. Um método de codificação ou decodificação suportado pela máquina de codec 1516 é arbitrário, e o número disso pode ser um, e pode ser vários. Por exemplo, a máquina de codec 1516 pode ter funções de codec de uma pluralidade de métodos de codificação/decodificação, e pode executar codificação de dados de imagem ou decodificação de dados codificados em um método selecionado dentre os métodos.

[00634] No exemplo ilustrado na Figura 93, a máquina de codec 1516 inclui, por exemplo, Vídeo de MPEG-2 1541, AVC/H.264 1542, HEVC/H.265 1543, HEVC/H.265 (Graduável) 1544, HEVC/H.265 (Multi- visão) 1545 e MPEG-DASH 1551, como blocos funcionais de processos relativos a codec.

[00635] O Vídeo de MPEG-2 1541 é um bloco funcional que codifica ou decodifica dados de imagem no método de MPEG-2. O AVC/H.264 1542 é um bloco funcional que codifica ou decodifica dados de imagem no método de AVC. O HEVC/H.265 1543 é um bloco funcional que codifica ou decodifica dados de imagem no método de HEVC. O HEVC/H.265 (Graduável) 1544 é um bloco funcional que codifica ou decodifica de modo graduável dados de imagem no método de HEVC. HEVC/H.265 (Multi- visão) 1545 é um bloco funcional que codifica em multi-visão ou decodifica em multi-visão dados de imagem no método de HEVC.

[00636] O MPEG-DASH 1551 é um bloco funcional que transmite e recebe dados de imagem no método de Transmissão em Fluxo Adaptável Dinâmico de MPEG através de HTTP (MPEG-DASH). O MPEG-DASH é uma técnica de executar transmissão em fluxo de um vídeo usando Protocolo de Transferência de Hiper-Texto (HTTP), tem uma de características nas quais dados apropriados são selecionados na unidade de segmento dentre uma pluralidade de itens de dados codificados que são preparados com antecedência e têm resoluções ou similar diferentes entre si, e são transmitidos. O MPEG-DASH 1551 executa geração de um fluxo se conformando a um padrão, controle de transmissão do fluxo, ou similar, e usa o Vídeo de MPEG-2 1541 descrito acima, ou HEVC/H.265 (Multi-visão) 1545 para codificação/decodificação de dados de imagem.

[00637] A interface de memória 1517 é uma interface para uso na memória externa 1312. Dados providos da máquina de processamento de imagem 1514 ou da máquina de codec 1516 são providos à memória externa 1312 pela interface de memória 1517. Além disso, dados lidos da memória externa 1312 são providos ao processador de vídeo 1332 (a máquina de processamento de imagem 1514 ou a máquina de codec 1516) pela interface de memória 1517.

[00638] O multiplexador/desmultiplexador (MUX DEMUX) 1518 multiplexa ou desmultiplexa vários itens de dados relativos a uma imagem, tal como fluxo de bit de dados codificados, dados de imagem, e um sinal de vídeo. Um método de multiplexação e desmultiplexação é arbitrário. Por exemplo, durante multiplexação, o multiplexador/desmultiplexador (MUX DEMUX) 1518 pode não só colecionar uma pluralidade de itens de dados em um único item de dados, mas também pode adicionar informação de cabeçalho predeterminada ou similar aos dados. Além disso, durante desmultiplexação, o multiplexador/desmultiplexador (MUX DEMUX) 1518 pode não só dividir um único item de dados em uma pluralidade de uma pluralidade de itens de dados, mas também pode adicionar informação de cabeçalho predeterminada ou similar a cada item de dados dividido. Em outras palavras, o multiplexador/desmultiplexador (MUX DEMUX) 1518 pode converter um formato de dados pela multiplexação e desmultiplexação. Por exemplo, o multiplexador/desmultiplexador (MUX DEMUX) 1518 multiplexa uma carreira de bits de modo a executar conversão em um fluxo de transporte que é uma carreira de bits com um formato de transmissão ou dados (dados de arquivo) com um formato de arquivo de gravação. Certamente, conversão inversa disso pode ser executada por desmultiplexação.

[00639] A interface de rede 1519 é uma interface dedicada, por exemplo, para o modem de banda larga 1333 ou a conectividade 1321 (Figura 91). A interface de vídeo 1520 é uma interface dedicada, por exemplo, para a conectividade 1321 ou a câmera 1322 (Figura 91).

[00640] A seguir, um exemplo de uma operação do processador de vídeo 1332 será descrito. Por exemplo, quando um fluxo de transporte é recebido de uma rede externa, por exemplo, pela conectividade 1321 ou pelo modem de banda larga 1333 (Figura 91), o fluxo de transporte é provido ao multiplexador/desmultiplexador (MUX DEMUX) 1518 pela interface de rede 1519 de modo a ser desmultiplexado, e é então decodificado pela máquina de codec 1516. Dados de imagem que são obtidos pela codificação na máquina de codec 1516 sofrem um processo de imagem predeterminado, por exemplo, pela máquina de processamento de imagem 1514 de modo a sofrerem conversão predeterminada, e são então providos para, por exemplo, a conectividade 1321 (Figura 91) pela interface de exibição 1512, e uma imagem disso é exibida em um monitor. Além disso, por exemplo, os dados de imagem obtidos pela codificação na máquina de codec 1516 são decodificados novamente pela máquina de codec 1516 de modo a serem multiplexados pelo multiplexador/desmultiplexador (MUX DEMUX) 1518 e serem convertidos em dados de arquivo, e são então produzidos para, por exemplo, a conectividade 1321 (Figura 91) pela interface de vídeo 1520 de modo a serem gravados em vários meios de gravação.

[00641] Adicionalmente, por exemplo, dados de arquivo de dados codificados que são dados de imagem codificados e são lidos de um meio de gravação (não ilustrado) pela conectividade 1321 (Figura 91) são providos ao multiplexador/desmultiplexador (MUX DEMUX) 1518 pela interface de vídeo 1520, e são então decodificados pela máquina de codec 1516. Os dados de imagem obtidos pela decodificação na máquina de codec 1516 sofrem um processo de imagem predeterminado pela máquina de processamento de imagem 1514 de modo a sofrerem conversão predeterminada pela máquina de exibição 1513, e são providos então para, por exemplo, a conectividade 1321 (Figura 91) pela interface de exibição 1512, e uma imagem disso é exibida no monitor. Além disso, por exemplo, os dados de imagem obtidos pela decodificação na máquina de codec 1516 são codificados novamente pela máquina de codec 1516 de modo a serem multiplexados pelo multiplexador/desmultiplexador (MUX DEMUX) 1518 e serem convertidos em um fluxo de transporte, e são então produzidos para, por exemplo, a conectividade 1321 ou o modem de banda larga 1333 (Figura 91) pela interface de rede 1519 de modo a serem providos a outros aparelhos (não ilustrados).

[00642] Adicionalmente, transmissão e recepção de dados de imagem ou outros dados entre as porções de processamento respectivas do processador de vídeo 1332 são executadas usando, por exemplo, a memória interna 1515 ou a memória externa 1312. Além disso, o módulo de administração de energia 1313 controla a provisão de energia para, por exemplo, a porção de controle 1511.

[00643] Se a tecnologia presente for aplicada ao processador de vídeo 1332 tendo a configuração, a tecnologia presente relacionada a cada modalidade descrita acima pode ser aplicada à máquina de codec 1516. Em outras palavras, por exemplo, a máquina de codec 1516 pode incluir um bloco funcional para realizar o dispositivo de codificação ou o dispositivo de decodificação relacionado à primeira modalidade. Além disso, por exemplo, se a máquina de codec 1516 incluir o bloco funcional descrito acima, o processador de vídeo 1332 pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13.

[00644] Além disso, na máquina de codec 1516, a tecnologia presente (quer dizer, a função do dispositivo de codificação de imagem ou do dispositivo de decodificação de imagem relacionado a cada modalidade descrita acima) pode ser realizada através de hardware tal como um circuito lógico, pode ser realizada através de software tal como um programa embutido, e pode ser realizada por ambos disso.

[00645] Como mencionado acima, as duas configurações exemplares do processador de vídeo 1332 foram descritas, mas o processador de vídeo 1332 pode ter qualquer configuração, e pode ter configurações diferentes das duas configurações exemplares. Além disso, o processador de vídeo 1332 pode ser configurado por um único chip de semicondutor, e pode ser configurado por uma pluralidade de chips de semicondutor. Por exemplo, um LSI empilhado tridimensional no qual uma pluralidade de semicondutores está empilhada pode ser usado. Adicionalmente, o processador de vídeo 1332 pode ser implementado por uma pluralidade de LSIs.

Exemplos de Aplicação a Aparelho

[00646] O aparelho de vídeo 1300 pode ser incorporado em vários aparelhos que processam dados de imagem. Por exemplo, o aparelho de vídeo 1300 pode ser incorporado no aparelho de televisão 900 (Figura 84), no telefone móvel 920 (Figura 85), no aparelho de gravação/reprodução 940 (Figura 86), no aparelho de formação de imagem 960 (Figura 87), e similar. O aparelho de vídeo 1300 está incorporado no aparelho, e assim o aparelho pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13.

[00647] Além disso, o aparelho de vídeo 1300 pode ser incorporado, por exemplo, nos aparelhos terminais tais como o computador pessoal 1004, o aparelho de AV 1005, o dispositivo de tablete 1006 e o telefone móvel 1007 do sistema de transmissão de dados 1000 da Figura 88, a estação de radiodifusão 1101 e o aparelho terminal 1102 do sistema de transmissão de dados 1100 da Figura 89, o aparelho de formação de imagem 1201 e o dispositivo de armazenamento de dados codificados graduáveis 1202 do sistema de formação de imagem 1200 da Figura 90, e similar. O aparelho de vídeo 1300 está incorporado no aparelho, e assim o aparelho pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13.

[00648] Além disso, até mesmo se só algumas das configurações descritas acima do aparelho de vídeo 1300 incluírem o processador de vídeo 1332, as configurações podem ser implementadas como configurações às quais a tecnologia presente é aplicada. Por exemplo, só o processador de vídeo 1332 pode ser implementado como um processador vídeo ao qual a tecnologia presente é aplicada. Além disso, por exemplo, como descrito acima, o processador, o módulo de vídeo 1311, ou similar indicado pela linha pontilhada 1341 pode ser implementado como um processador, um módulo, ou similar ao qual a tecnologia presente é aplicada. Adicionalmente, uma combinação do módulo de vídeo 1311, da memória externa 1312, do módulo de administração de energia 1313 e do módulo de extremidade dianteira 1314 pode ser implementada como a unidade de exibição 1361 à qual a tecnologia presente é aplicada. Qualquer configuração pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13.

[00649] Em outras palavras, qualquer configuração incluindo o processador de vídeo 1332 pode ser incorporada em vários aparelhos que processam dados de imagem da mesma maneira como no aparelho de vídeo 1300. Por exemplo, o processador de vídeo 1332, o processador indicado pela linha pontilhada 1341, o módulo de vídeo 1311, ou a unidade de exibição 1361 podem ser incorporados na aparelho de televisão 900 (Figura 84), no telefone móvel 920 (Figura 85), no aparelho de gravação/reprodução 940 (Figura 86), no aparelho de formação de imagem 960 (Figura 87), nos aparelhos terminais tais como o computador pessoal 1004, o aparelho de AV 1005, o dispositivo de tablete 1006, e o telefone móvel 1007 do sistema de transmissão de dados 1000 da Figura 88, a estação de radiodifusão 1101 e o aparelho terminal 1102 do sistema de transmissão de dados 1100 da Figura 89, o aparelho de formação de imagem 1201 e o dispositivo de armazenamento de dados codificados graduáveis 1202 do sistema de formação de imagem 1200 da Figura 90, e similar. Qualquer uma das configurações às quais a tecnologia presente é aplicada está incorporada no aparelho, e assim o aparelho pode alcançar os mesmos efeitos como os efeitos descritos com referência às Figuras 6 a 13 da mesma maneira como no aparelho de vídeo 1300.

[00650] Além disso, na especificação presente, descrição foi feita de um exemplo no qual vários pedaços de informação tal como informação de conversão, informação de conversão de DR, e um índice de cotovelo aproximado estão multiplexados em dados codificados, e são transmitidos de um lado de codificação para um lado de decodificação. Porém, um método de transmitir a informação não está limitado a este exemplo. Por exemplo, a informação pode ser transmitida ou gravada como dados separados associados com dados codificados sem serem multiplexados nos dados codificados. Aqui, o termo "associado" indica que uma imagem (que pode ser uma parte da imagem, tal como uma fatia ou um bloco) incluída em fluxo de bit é feita ser ligada à informação correspondendo à imagem durante decodificação. Em outras palavras, a informação pode ser transmitida em um caminho de transmissão diferente daquele dos dados codificados. Além disso, a informação pode ser gravada em um meio de gravação (ou uma área de gravação diferente do mesmo meio de gravação) diferente daquele dos dados codificados. Adicionalmente, a informação e os dados codificados podem ser associados entre si em qualquer unidade tal como uma pluralidade de quadros, um único quadro, ou uma parte de um quadro.

[00651] Além disso, na especificação presente, o sistema indica um conjunto de uma pluralidade de elementos constituintes (dispositivos, módulos (componentes), ou similar), e não importa se ou não todos os elementos constituintes estão localizados na mesma cobertura. Portanto, uma pluralidade de dispositivos que estão armazenados em coberturas separadas e estão conectados um ao outro por uma rede, um único dispositivo no qual uma pluralidade de módulos está armazenada em uma única cobertura, são todos um sistema.

[00652] Os efeitos descritos na especificação presente são só um exemplo e não estão limitados, e pode haver outros efeitos.

[00653] Além disso, concretizações da descrição presente não estão limitadas às concretizações descritas acima, e podem ter várias modificações dentro da extensão sem partir do espírito da descrição presente.

[00654] Por exemplo, a descrição presente pode ter uma configuração de computação de nuvem na qual uma única função é distribuída para uma pluralidade de dispositivos por uma rede e é processada em cooperação entre si.

[00655] Adicionalmente, cada etapa descrita no fluxograma anterior pode ser executada por um único dispositivo, e também pode ser executada por uma pluralidade de dispositivos de uma maneira de distribuição.

[00656] Além disso, em um caso onde uma pluralidade de processos está incluída em um única etapa, a pluralidade de processos incluída na única etapa pode ser executada por um único dispositivo, e também pode ser executada por uma pluralidade de dispositivos de uma maneira de distribuição.

[00657] A descrição presente pode ter as configurações seguintes. (1) Um dispositivo de decodificação incluindo: conjunto de circuitos configurados para receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos para gerar a imagem, em que a conversão usa uma função de joelho. (2) O dispositivo de decodificação de acordo com o anterior (1), em que a conversão usa um cotovelo. (3) O dispositivo de decodificação de acordo com o anterior (1) ou (2), em que a conversão usa a função de joelho para mapear a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica, e a função de joelho está definida pelo cotovelo. (4) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (3), em que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de função de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segunda gama dinâmica que corresponde à gama de luminância que é o objetivo de função de joelho na primeira gama dinâmica. (5) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (4), em que a informação de pré-conversão indica a gama de luminância que é convertida através de função de joelho a uma mesma relação de conversão como uma gama de conversão da primeira gama dinâmica. (6) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (5), em que a conversão usa a função de joelho que está definida por uma pluralidade de cotovelos. (7) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (6), em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão. (8) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (7), em que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica, e uma pluralidade de segmentos adjacentes da primeira gama dinâmica da luminância é mapeada a uma pluralidade correspondente de segmentos adjacentes da segunda gama dinâmica da luminância baseado em limites entre segmentos adjacentes definidos por uma pluralidade de cotovelos. (9) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (8), em que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica a uma primeira relação de conversão para um ponto definido pelo cotovelo e a uma segunda relação de conversão do ponto definido pelo cotovelo. (10) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (9), em que a função de joelho é especificada por uma mensagem de SEI. (11) O dispositivo de decodificação de acordo com qualquer do anterior (1) a (10), em que a mensagem de SEI inclui uma estabelecimento de um knee_function_id. (12) Um método de decodificação de fazer um dispositivo de decodificação executar: receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos para gerar a imagem, em que a conversão usa uma função de joelho. (13) O método de decodificação de acordo com o anterior (12), em que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de função de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segundo gama dinâmica que corresponde à gama de luminância que é o objetivo de função de joelho na primeira gama dinâmica. (14) O método de decodificação de acordo com o anterior (12) ou (13), em que a informação de pré-conversão indica a gama de luminância que é convertida através de função de joelho a uma mesma relação de conversão como uma gama de conversão da primeira gama dinâmica. (15) O método de decodificação de acordo com qualquer do anterior (12) a (14), em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão. (16) O método de decodificação de acordo com qualquer do anterior (12) a (15), em que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica a uma primeira relação de conversão para um ponto definido pelo cotovelo e a uma segunda relação de conversão do ponto definido pelo cotovelo. (17) Um dispositivo de codificação incluindo: conjunto de circuitos configurados para estabelecer informação de conversão pertencendo a uma conversão de gama dinâmica de uma luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; e codificar a imagem tendo luminância na primeira gama dinâmica para gerar dados codificados, em que a conversão usa uma função de joelho. (18) O dispositivo de codificação de acordo com o anterior (17), em que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de função de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segunda gama dinâmica que corresponde à gama de luminância que é o objetivo de função de joelho na primeira gama dinâmica. (19) O dispositivo de codificação de acordo com o anterior (17) ou (18), em que a informação de pré-conversão indica a gama de luminância que é convertida através de função de joelho a uma mesma relação de conversão como uma gama de conversão da primeira gama dinâmica. (20) O dispositivo de codificação de acordo com qualquer do anterior (17) a (19), em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão. (21) O dispositivo de codificação de acordo com qualquer do anterior (17) a (20), em que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica a uma primeira relação de conversão para um ponto definido pelo cotovelo e a uma segunda relação de conversão do ponto definido pelo cotovelo. (22) Um meio legível por computador não transitório tendo armazenado nele dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica, em que um dispositivo de decodificação decodifica dados codificados, gera a imagem baseada nos dados decodificados, e converte a gama dinâmica baseado na informação de conversão incluindo um cotovelo. (23) O meio legível por computador não transitório de acordo com o anterior (22), em que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de função de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segunda gama dinâmica que corresponde à gama de luminância que é o objetivo de função de joelho na primeira gama dinâmica. (24) O meio legível por computador não transitório de acordo com o anterior (22) ou (23), em que a informação de pré-conversão indica a gama de luminância que é convertida através de função de joelho a uma mesma relação de conversão como uma gama de conversão da primeira gama dinâmica. (25) O meio legível por computador não transitório de acordo com qualquer do anterior (22) a (24), em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão. (26) O meio legível por computador não transitório de acordo com qualquer do anterior (22) a (25), em que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica a uma primeira relação de conversão para um ponto definido pelo cotovelo e a uma segunda relação de conversão do ponto definido pelo cotovelo. (27) Um dispositivo de decodificação incluindo uma unidade de extração que extrai codificaram dados e informação de conversão de um fluxo codificado incluindo os dados codificados de uma primeira imagem que é uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão relativa à conversão de uma gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e uma unidade de decodificação que decodifica os dados codificados extraídos pela unidade de extração para gerar a primeira imagem. (28) O dispositivo de decodificação de acordo com o anterior (27), adicionalmente incluindo uma unidade de conversão que converte a primeira imagem que é gerada pela unidade de decodificação em uma segunda imagem que é a imagem tendo luminância na segunda gama dinâmica na base da informação de conversão pela unidade de extração. (29) O dispositivo de decodificação de acordo com o anterior (27) ou (28), em que a conversão é executada convertendo em joelho a luminância da primeira imagem. (30) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (29), em que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de conversão de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segunda gama dinâmica, correspondendo à gama. (31) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (30), em que a informação de pré-conversão indica uma gama de luminância que é convertida em joelho à mesma relação de conversão como uma gama de conversão da primeira gama dinâmica, e em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e a informação de pós-conversão. (32) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (31), adicionalmente incluindo uma unidade de seleção que seleciona um número predeterminado de pares dentre a pluralidade de pares incluídos na informação de conversão que é extraída pela unidade de extração, em uma ordem na qual os pares são incluídos na informação de conversão. (33) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (31), adicionalmente incluindo uma unidade de seleção que seleciona um número predeterminado de pares dentre a pluralidade de pares incluídos na informação de conversão na base de informação de prioridade indicando uma ordem na qual uma prioridade do par é mais alta na qual a unidade de extração extrai a informação de prioridade incluída no fluxo codificado. (34) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (33), adicionalmente incluindo uma unidade de transmissão que transmite o número predeterminado de pares selecionados pela unidade de seleção. (35) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (34), em que a informação de conversão inclui pelo menos um de um valor máximo da luminância da primeira imagem e um valor máximo da luminância da segunda imagem. (36) O dispositivo de decodificação de acordo com qualquer um do anterior (27) a (35) em que a informação de conversão inclui um de um valor esperado de brilho de uma unidade de exibição que exibe pelo menos a primeira imagem e um valor esperado de brilho de uma unidade de exibição que exibe a segunda imagem. (37) Um método de decodificação de fazer um dispositivo de decodificação executar extrair dados codificados e informação de conversão de um fluxo codificado incluindo os dados codificados de uma primeira imagem que é uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão que é informação relativa à conversão de uma gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados para gerar a primeira imagem. (38) Um dispositivo de codificação incluindo uma unidade de estabelecimento que estabelece informação de conversão que é informação relativa à conversão de uma gama dinâmica de luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; uma unidade de codificação que codifica uma primeira imagem que é a imagem tendo luminância na primeira gama dinâmica para gerar dados codificados; e uma unidade de transmissão que transmite um fluxo codificado incluindo a informação de conversão estabelecida pela unidade de estabelecimento e os dados codificados da primeira imagem gerados pela unidade de codificação. (39) O dispositivo de codificação de acordo com o anterior (38), em que a conversão é executada convertendo em joelho a luminância da primeira imagem. (40) O dispositivo de codificação de acordo com o anterior (38) ou (39), em que a informação de conversão inclui informação de pré- conversão indicando uma gama de luminância que é um objetivo de conversão de joelho na primeira gama dinâmica e informação de pós- conversão indicando uma gama de luminância na segunda gama dinâmica, correspondendo à gama. (41) O dispositivo de codificação de acordo com qualquer um do anterior (38) a (40), em que a informação de pré-conversão indica uma gama de luminância que é convertida em joelho à mesma relação de conversão como uma gama de conversão da primeira gama dinâmica, e em que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão. (42) O dispositivo de codificação de acordo com qualquer um do anterior (38) a (41), em que a informação de conversão inclui a pluralidade de pares de informação de pré-conversão e informação de pós-conversão em uma ordem na qual uma prioridade é mais alta. (43) O dispositivo de codificação de acordo com qualquer um do anterior (38) a (42), em que a unidade de transmissão transmite informação de prioridade indicando uma ordem na qual uma prioridade do par é mais alta. (44) O dispositivo de codificação de acordo com qualquer um do anterior (38) a (43), em que a informação de conversão inclui pelo menos um de um valor máximo da luminância da primeira imagem e um valor máximo da luminância da segunda imagem. (45) O dispositivo de codificação de acordo com qualquer um do anterior (38) a (44), em que a informação de conversão inclui um de um valor esperado de brilho de uma unidade de exibição que exibe pelo menos a primeira imagem e um valor esperado de brilho de uma unidade de exibição que exibe a segunda imagem. (46) Um método de codificação de fazer um dispositivo de codificação executar informação de conversão de estabelecimento que é informação relativa à conversão de uma gama dinâmica de luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; codificar uma primeira imagem que é a imagem tendo luminância na primeira gama dinâmica para gerar dados codificados; e transmitir um fluxo codificado incluindo a informação de conversão estabelecida e os dados codificados gerados da primeira imagem.

[00658] Deveria ser entendido por aqueles qualificados na arte que várias modificações, combinações, sub-combinações e alterações podem ocorrer, dependendo de exigências de projeto e outros fatores até onde eles estão dentro da extensão das reivindicações anexas ou dos equivalentes disso. Lista de Sinais de Referência Dispositivo de codificação Unidade de estabelecimento Unidade de codificação Unidade de transmissão Unidade de conversão Dispositivo de decodificação Unidade de extração Unidade de decodificação Unidade de conversão Dispositivo de codificação Unidade de estabelecimento Unidade de codificação Dispositivo de decodificação Unidade de extração Unidade de decodificação Unidade de conversão Sistema de decodificação Dispositivo de decodificação Dispositivo de exibição Unidade de seleção Unidade de transmissão

Claims

1. Dispositivo de decodificação (50, 90, 111), caracterizado pelo fato de compreender: conjunto de circuitos configurados para: receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos de modo a gerar a imagem, em que a conversão usa uma função de joelho, e a informação de conversão inclui a informação de persistência de conversão que indica se a informação de conversão é ou não aplicada a uma pluralidade de imagens contínuas.

2. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 1, caracterizado pelo fato de que a conversão usa um joelho.

3. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 2, caracterizado pelo fato de que a conversão usa a função de joelho para mapear a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica, e a função de joelho está definida pelo joelho.

4. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 3, caracterizado pelo fato de que a informação de conversão inclui informação de pré-conversão indicando uma gama de luminância que é um objetivo de função de joelho na primeira gama dinâmica e informação de pós-conversão indicando uma gama de luminância na segunda gama dinâmica que corresponde à gama de luminância que é o objetivo de função de joelho na primeira gama dinâmica.

5. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 4, caracterizado pelo fato de que a informação de pré-conversão indica a gama de luminância que é convertida através de função de joelho a uma mesma relação de conversão como uma gama de conversão da primeira gama dinâmica.

6. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 1, caracterizado pelo fato de que a conversão usa a função de joelho que está definida por uma pluralidade de joelhos.

7. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 6, caracterizado pelo fato de que a informação de conversão inclui uma pluralidade de pares da informação de pré-conversão e da informação de pós-conversão.

8. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 1, caracterizado pelo fato de que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica, e uma pluralidade de segmentos adjacentes da primeira gama dinâmica da luminância é mapeada a uma pluralidade correspondente de segmentos adjacentes da segunda gama dinâmica da luminância baseado em limites entre segmentos adjacentes definidos por uma pluralidade de joelhos.

9. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 3, caracterizado pelo fato de que a conversão usa a função de joelho mapeando a gama dinâmica da luminância da imagem da primeira gama dinâmica na segunda gama dinâmica a uma primeira relação de conversão para um ponto definido pelo joelhoe a uma segunda relação de conversão do ponto definido pelo joelho.

10. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 1, caracterizado pelo fato de que a função de joelho é especificada por uma mensagem de SEI.

11. Dispositivo de decodificação (50, 90, 111) de acordo com reivindicação 10, caracterizado pelo fato de que a mensagem de SEI inclui um estabelecimento de um knee_function_id.

12. Método de decodificação, caracterizado pelo fato de ser para fazer um dispositivo de decodificação (50, 90, 111) executar: receber dados codificados e informação de conversão, os dados codificados pertencendo a uma imagem tendo luminância em uma primeira gama dinâmica e a informação de conversão pertencendo a uma conversão de gama dinâmica da luminância da imagem da primeira gama dinâmica em uma segunda gama dinâmica; e decodificar os dados codificados recebidos para gerar a imagem, em que a conversão usa uma função de joelho, e a informação de conversão inclui a informação de persistência que indica se a informação de conversão é ou não aplicada a uma pluralidade de imagens contínuas.

13. Dispositivo de codificação (10, 70), caracterizado pelo fato de compreender: conjunto de circuitos configurados para: estabelecer informação de conversão pertencendo a uma conversão de gama dinâmica de uma luminância de uma imagem de uma primeira gama dinâmica em uma segunda gama dinâmica; e codificar a imagem tendo luminância na primeira gama dinâmica para gerar dados codificados, em que a conversão usa uma função de joelho.

14. Mídia legível por computador não transitória caracterizada pelo fato de que tem armazenada nela instruções legíveis por computador que, quando lidas por um computador, fazem com que o computador execute o método como definido na reivindicação 12.