BR112021010167A2

BR112021010167A2 - medidas de atividade espacial baseadas em blocos para imagens

Info

Publication number: BR112021010167A2
Application number: BR112021010167-5A
Authority: BR
Inventors: Velibor Adzic; Hari Kalva; Borivoje Furht
Original assignee: Op Solutions, Llc
Priority date: 2018-11-27
Filing date: 2019-11-27
Publication date: 2021-08-17
Also published as: EP3888365A4; JP7253053B2; MX2021006200A; SG11202105604UA; JP2022508246A; CN113170133A; CN113170133B; EP3888365A1; KR20210093336A; US11546597B2; US20210289206A1; WO2020113073A1; PH12021551222A1

Abstract

MEDIDAS DE ATIVIDADE ESPACIAL BASEADAS EM BLOCOS PARA IMAGENS. Trata-se de um codificador que inclui conjunto de circuitos configurado para receber um quadro de vídeo, particionar o quadro de vídeo em uma pluralidade de blocos, determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos e usar uma matriz de transformação, codificar o quadro de vídeo usando a medida de atividade espacial. Aparelho relacionado, sistemas, técnicas e artigos são também descritos.

Description

RELATÓRIO DESCRITIVO MEDIDAS DE ATIVIDADE ESPACIAL BASEADAS EM BLOCOS PARA IMAGENS REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS

[001] Esse pedido reivindica o benefício de prioridade de pedido provisório de patente nº de série U.S 62/771.909, depositado em 27 de novembro de 2018 e intitulado "Block-Based Spatial Activity Measure for Pictures", que é incorporado a título de referência no presente documento em sua totalidade.

CAMPO DA INVENÇÃO

[002] A presente invenção refere-se geralmente ao campo da compressão de vídeo. Em particular, a presente invenção se refere a medidas de atividade espacial baseadas em blocos para imagens.

ANTECEDENTES

[003] Um codec de vídeo pode incluir um circuito eletrônico ou software que compacta ou descompacta vídeo digital. Ele pode converter vídeo não compactado em um formato compactado ou vice-versa. No contexto da compactação de vídeo, um dispositivo que compacta vídeo (e/ou executa alguma função do mesmo) pode normalmente ser chamado de codificador, e um dispositivo que descompacta vídeo (e/ou executa alguma função do mesmo) pode ser chamado de decodificador.

[004] Um formato dos dados compactados pode estar em conformidade com uma especificação de compactação de vídeo padrão. A compactação pode ser com perdas, pois o vídeo compactado carece de algumas informações presentes no vídeo original. Uma consequência disso pode incluir que o vídeo descompactado pode ter qualidade inferior em relação ao vídeo descompactado original porque não há informações suficientes para reconstruir com precisão o vídeo original.

[005] Pode haver relações complexas entre a qualidade do vídeo, a quantidade de dados usados para representar o vídeo (por exemplo, determinado pela taxa de bits), a complexidade dos algoritmos de codificação e decodificação,

sensibilidade a perdas e erros de dados, facilidade de edição, acesso aleatório, atraso de ponta a ponta (por exemplo, latência) e similares.

[006] Durante a codificação, uma imagem (por exemplo, quadro de vídeo) é segmentada (por exemplo, particionada) em blocos relativamente grandes, como 128x128 e tal estrutura é fixa. Mas, ao segmentar uma imagem em grandes blocos para compactação e sem levar em consideração as informações de vídeo subjacentes (por exemplo, o conteúdo de vídeo), os grandes blocos podem não particionar a imagem de uma maneira que permita uma codificação eficiente, resultando em uma taxa de bits de baixa qualidade.

SUMÁRIO DA REVELAÇÃO

[007] Em um aspecto, um codificador que inclui conjunto de circuitos configurado para receber um quadro de vídeo, particionar o quadro de vídeo em uma pluralidade de blocos, determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos e, com uso de uma matriz de transformação, codificar o quadro de vídeo usando a medida de atividade espacial.

[008] Em outro aspecto, um método inclui receber, por um codificador, um quadro de vídeo, particionar o quadro de vídeo em uma pluralidade de blocos, determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos e usar uma matriz de transformação e codificar o quadro de vídeo usando a medida de atividade espacial.

[009] Os detalhes de uma ou mais variações da matéria aqui descrita são apresentados nos desenhos anexos e na descrição abaixo. Outros recursos e vantagens da matéria descrita no presente documento serão evidentes a partir da descrição e dos desenhos e das reivindicações.

DESCRIÇÃO DE DESENHOS

[010] Com o propósito de ilustrar a invenção, os desenhos mostram aspectos de uma ou mais modalidades da invenção. No entanto, deve ser entendido que a presente invenção não está limitada às disposições e instrumentalidades precisas mostradas nos desenhos, em que:

[011] A Figura 1 é um diagrama de fluxo de processo que ilustra um processo exemplificativo para a codificação de um vídeo que pode utilizar matrizes de transformação na determinação de uma medida de atividade espacial, o que pode permitir uma operação de codificador melhorada;

[012] A Figura 2 é um diagrama de fluxo de processo que ilustra um processo exemplificativo para realizar fusão de bloco com base em frequência;

[013] A Figura 4 é um diagrama de blocos do sistema que ilustra um codificador de vídeo exemplificativo capaz de codificar com o uso de uma medida de atividade espacial que pode incluir componentes de frequência de computação utilizando matrizes de transformação; e

[014] A Figura 4 é um diagrama de blocos de um sistema de computação que pode ser usado para implementar qualquer uma ou mais das metodologias reveladas no presente documento e qualquer uma ou mais porções das mesmas.

[015] Os desenhos não estão necessariamente em escala e podem ser ilustrados por linhas pontilhadas, representações diagramáticas e vistas fragmentadas. Em certos casos, detalhes que não são necessários para uma compreensão das modalidades ou que tornam outros detalhes difíceis de perceber podem ter sido omitidos. Símbolos de referência semelhantes nos vários desenhos indicam elementos semelhantes.

DESCRIÇÃO DETALHADA

[016] Algumas implementações da matéria atual se referem a uma abordagem para codificar um vídeo que inclui o uso de uma medida de atividade espacial que pode incluir componentes de frequência de computação utilizando matrizes de transformação. A utilização de matrizes de transformação produz medidas de frequência em mais frequências do que um codificador que utiliza um filtro passa- alta e as informações adicionais podem melhorar codificação. Por exemplo, ao determinar os componentes de frequência usando matrizes de transformação, informações mais precisas sobre os componentes de frequência de um quadro de vídeo podem ser produzidas. E ao utilizar informações mais precisas sobre os componentes de frequência, a fusão de blocos pode ser melhorada, o que, por sua vez, pode melhorar a previsão, reduzindo assim a taxa de bits residual e resultante do fluxo de bits.

[017] Em algumas implementações, a segmentação de imagem é realizada usando blocos de amostra como uma unidade básica. Os blocos de amostra podem ter um tamanho de bloco de amostra uniforme, que pode ter um comprimento lateral, em pixels de um quadrado de pixels; por exemplo e sem limitação, as modalidades reveladas no presente documento podem usar blocos 4 x 4 de amostra como uma unidade básica e a medida da atividade espacial que inclui componentes de frequência de computação dos blocos 4 x 4 de amostra. Ao utilizar blocos 4 x 4 como um tamanho de segmentação básico, algumas implementações da matéria atual podem permitir uma granularidade mais fina pelo codificador e tal tamanho se alinha com os tamanhos de bloco de transformação estabelecidos, permitindo a utilização de matrizes de transformação padrão e definidas, o que pode melhorar a eficiência de codificação. Além disso, tal abordagem pode ser contrastada com algumas abordagens existentes para codificação, que usam estrutura de bloco fixo de tamanho relativamente grande. Os versados na técnica, ao revisar a totalidade dessa revelação, observarão que, embora, a título de brevidade, os blocos 4 x 4 de amostra sejam descritos em muitos exemplos subsequentes, em geral qualquer tamanho ou formato de blocos de amostra, de acordo com qualquer método de medição, pode ser usado para particionamento e/ou segmentação de imagens.

[018] A Figura 1 é um diagrama de fluxo de processo que ilustra um exemplo de processo 100 para codificar um vídeo que pode utilizar matrizes de transformação na determinação de uma medida de atividade espacial, o que pode permitir uma operação melhorada do codificador. Na etapa 105, um quadro de vídeo é recebido por um codificador. Isso pode ser realizado de qualquer maneira adequada para receber um vídeo em transmissão contínua e/ou forma de arquivo de qualquer dispositivo e/ou porta de entrada. O recebimento do quadro de vídeo pode incluir a recuperação da memória do codificador e/ou um dispositivo de computação em comunicação, incorporando e/ou incorporado no codificador. O recebimento pode incluir o recebimento de um dispositivo remoto em uma rede. O recebimento de quadro de vídeo pode incluir o recebimento de uma pluralidade de quadros de vídeo que se combinam para formar um ou mais vídeos.

[019] Na etapa 110, e ainda se referindo à Figura 1, o codificador pode segmentar e/ou particionar o quadro de vídeo em blocos. Os blocos podem ter qualquer formato ou tamanho adequado, conforme descrito acima, incluindo um tamanho de 4 pixels por 4 pixels (4 x 4). Um tamanho 4 x 4 pode ser compatível com muitas resoluções de vídeo padrão, que podem ser divididas em um número inteiro de 4 x 4 blocos.

[020] Na etapa 115, e com referência contínua à Figura 1, o codificador pode determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos. Conforme usado na presente revelação, uma "medida de atividade espacial" é uma quantidade que indica com que frequência e com que amplitude a textura muda dentro de um bloco. Em outras palavras, áreas planas, como o céu, terão uma medida de baixa atividade espacial, enquanto áreas complexas, como grama, receberão uma medida de alta atividade espacial. A determinação de uma respectiva medida de atividade espacial pode incluir a determinação usando uma matriz de transformação, tal como, sem limitação, uma matriz de transformação de cosseno distinta. A determinação da respectiva medida de atividade espacial para cada bloco pode incluir a determinação usando uma matriz de transformação de cosseno distinta generalizada. Por exemplo, quando os blocos descritos acima forem blocos 4 x 4 de pixels, a matriz de transformação distinta generalizada de cosseno pode incluir uma matriz II de transformação de cosseno distinta generalizada assumindo a forma de: 𝑎 𝑎 𝑎 𝑎 𝑏 𝑐 −𝑐 −𝑏 T=( ) 𝑎 −𝑎 −𝑎 𝑎 𝑐 −𝑏 𝑏 −𝑐

1 𝜋 1 3𝜋 em que a é ½, b é √2 cos 8 e c é √2 cos . 8

[021] Em algumas implementações, uma estimativa de número inteiro de uma matriz de transformação pode ser utilizada, a qual pode ser usada para implementações de hardware e software eficientes. Por exemplo, quando os blocos descritos acima forem blocos 4x4 de pixels, uma matriz de transformação distinta de cosseno generalizada pode incluir uma matriz II de transformação de cosseno distinta generalizada assumindo a forma de: 1 1 1 1 2 1 −1 −2 TINT = ( ). 1 −1 −1 1 1 −2 2 −1

[022] Para cada bloco Bi, um conteúdo de frequência do bloco pode ser calculado usando: FBi = T x Bi x T’.

[023] em que T 'é uma transversal de uma matriz de transferência de cosseno T, Bi é um bloco representado como uma matriz de valores numéricos correspondentes a pixels no bloco, como uma matriz 4 x 4 representando um bloco 4 x 4, conforme descrito acima, e a operação x denota a multiplicação da matriz.

[024] Em algumas implementações, a fusão de blocos pode ser realizada usando as medidas de atividade espacial. Na fusão de blocos, cada bloco pode ser atribuído a uma área. Por exemplo, uma primeira área dentro do quadro de vídeo incluindo um primeiro agrupamento de um subconjunto dos blocos pode ser determinado. O primeiro agrupamento pode ser baseado na respectiva medida de atividade espacial. Os blocos podem ser agrupados em áreas de conteúdo de frequência semelhante, representando assim áreas com atividade espacial semelhante.

[025] Por exemplo, determinar a primeira área pode incluir iterar sobre cada um da pluralidade de blocos e, para cada bloco atual, comparar a medida de atividade espacial do bloco atual com uma medida de atividade espacial de um bloco anterior e determinar se uma diferença está abaixo de um limite predefinido e atribuindo o bloco atual à primeira área. O bloco atual pode ser atribuído a uma segunda área em resposta ou com base na determinação de que a diferença está acima do limite predefinido. Os versados na técnica, ao revisar a totalidade dessa revelação, estarão cientes das várias maneiras em que a comparação limite pode ser realizada, incluindo que a atribuição a um primeiro bloco pode, alternativa ou adicionalmente, ser realizada pela determinação de que um grau de similaridade excede um limite e/ou essa atribuição a um grupo diferente pode ser realizada determinando que um grau de diferença excede um limite. Um limite pode ser armazenado na memória e/ou gerado usando valores prévia ou simultaneamente recebidos e/ou calculados, que podem incluir quaisquer valores numéricos e/ou medições descritas na presente revelação.

[026] A Figura 2 é um diagrama de fluxo de processo que ilustra um processo 200 exemplificativo para realizar fusão de bloco com base em frequência. Em 205, cada bloco Bi é iterado (por exemplo, em 205, i pode ser incrementado em 1). Na etapa 205, um conteúdo de frequência do bloco FbiBi pode ser calculado. Na etapa 215, pode ser determinado se uma diferença entre a medida de atividade espacial do bloco atual FBi e uma medida de atividade espacial de um bloco anterior FBi-1 está abaixo de um limite predefinido TF. Se assim for, na etapa 220, então o bloco atual Bi é adicionado à área atual. Caso contrário, na etapa 225 o bloco atual Bi é adicionado a uma área nova ou diferente.

[027] Em algumas implementações, uma medida média de informação pode ser usada para fusão de bloco e pode ser determinada, como um exemplo não limitativo, de acordo com uma soma de medidas de informação para blocos individuais dentro da primeira área, que pode ser ponderada e/ou multiplicada por um coeficiente de significância, por exemplo, mostrado na seguinte soma: 𝑛 𝐴𝑁 = 𝑆𝑁 ∗ ∑ 𝐵𝑘 𝑘=1

[028] em que N é um número sequencial da primeira área, SN é um coeficiente de significância, k é um índice correspondente a um bloco de uma pluralidade de blocos que constituem a primeira área, n é um número de blocos que constituem a primeira área, Bk é uma medida de informação de um bloco dos blocos, e AN é a primeira medida média de informação. Bk pode incluir, por exemplo, a medida da atividade espacial calculada usando uma transformação de cosseno distinta do bloco.

[029] O coeficiente de significância SN pode ser fornecido por um especialista externo e/ou calculado com base nas características da primeira área (por exemplo, blocos fundidos). Uma "característica" de uma área, conforme usado no presente documento, é um atributo mensurável da área que é determinado com base em seu conteúdo; uma característica pode ser representada numericamente usando uma saída de um ou mais cálculos realizados na primeira área. Um ou mais cálculos podem incluir qualquer análise de qualquer sinal representado pela primeira área. Um exemplo não limitativo pode incluir atribuir SN superior para uma área com um fundo suave e um S N inferior para uma área com um fundo menos suave em aplicativos de modelagem de qualidade; como um exemplo não limitativo, a suavidade pode ser determinada usando a detecção de borda Canny para determinar um número de bordas, em que um número inferior indica um maior grau de suavidade. Um outro exemplo de detecção automática de suavidade pode incluir o uso de transformadas rápidas de Fourier (FFT) sobre um sinal em variáveis espaciais sobre uma área, em que o sinal pode ser analisado sobre qualquer sistema de coordenadas bidimensional e sobre canais que representam valores de cor vermelho-verde- azul ou semelhantes; maior predominância relativa em um domínio de frequência, conforme calculado usando um FFT, de componentes de frequência mais baixa pode indicar um maior grau de suavidade, enquanto maior predominância relativa de frequências mais altas pode indicar transições mais frequentes e rápidas em valores de cor e/ou tonalidade ao longo da área anterior, o que pode resultar em uma pontuação de suavidade mais baixa; objetos semanticamente importantes podem ser identificados pela entrada de usuário. A importância semântica pode, alternativa ou adicionalmente, ser detectada de acordo com a configuração da borda e/ou padrão de textura. Um fundo pode ser identificado, sem limitação, recebendo e/ou detectando uma porção de uma área que representa um objeto significativo ou "primeiro plano", como um rosto ou outro item, incluindo, sem limitação, um objeto semanticamente importante. Outro exemplo pode incluir a atribuição de SN mais alto para as áreas que contêm objetos semanticamente importantes, como rosto humano; objetos semanticamente importantes podem ser identificados pela entrada de usuário.

[030] Em algumas implementações, a fusão de blocos com base em frequência pode ser omitida em implementações em que outros algoritmos de processamento de informações estão usando diretamente os valores FBi calculados. Uma dessas implementações pode incluir a quantização adaptativa, em que os parâmetros de quantização são determinados com base nos valores de FBi para cada bloco 4x4 ou grupos de blocos 4x4 vizinhos combinados em blocos 8x8, 16x16, 32x32 ou 64x64 ou qualquer outra combinação adequada.

[031] Na etapa 120, o quadro de vídeo pode ser codificado. A codificação pode incluir o controle de um parâmetro de quantização com base nas medidas de atividade espacial, por exemplo, uma medida de atividade espacial média de uma primeira área resultante de um processo de fusão de blocos dos blocos 4 x

4. Os parâmetros de quantização podem incluir, podem ser iguais, ou podem ser proporcionais e/ou podem ser linearmente relacionados a uma medida de tamanho de quantização. Conforme usado no presente documento, um "nível de quantização" e/ou "tamanho de quantização" é uma quantidade numérica indicativa de uma quantidade de informação a ser descartada na compressão de um quadro de vídeo; o nível de quantização pode incluir, sem limitação, um número tal como um número inteiro pelo qual um ou mais coeficientes, incluindo, sem limitação, coeficientes de transformação, são divididos e/ou reduzidos para reduzir o conteúdo de informação do quadro codificado e decodificado subsequente. O controle pode incluir determinar um primeiro tamanho de quantização com base na primeira medida de informação; nível de quantização pode representar uma medida direta ou indireta de armazenamento de memória necessária para capturar informações que descrevem dados de luma e/ou croma de pixels em um bloco, em que um maior número de bits pode ser necessário para armazenar informações com um maior grau de variação, conforme determinado por primeira medida de informação. O tamanho de quantização pode ser baseado na primeira medida de informação conforme descrito acima, em que o tamanho de quantização pode ser maior para uma primeira medida maior de informação e menor para uma primeira medida menor de informação; o tamanho da quantização pode ser proporcional e/ou linearmente relacionado à primeira medida de informação. Em geral, um maior conteúdo de informação pode resultar em um tamanho de quantização maior. Ao controlar o tamanho de quantização, as informações sobre áreas de bloco fundido podem ser usadas para otimização de distorção de taxa para codificação. O controle pode ser ainda baseado na segunda medida média de informação da segunda área.

[032] A Figura 3 é um diagrama de blocos do sistema que ilustra um codificador de vídeo exemplificativo 200 capaz de codificar usando uma medida de atividade espacial que pode incluir componentes de frequência de computação utilizando matrizes de transformação. O codificador de vídeo exemplificativo 300 recebe um vídeo de entrada 304, que pode ser inicialmente segmentado ou particionado em 4 x 4 blocos para processamento posterior.

[033] O codificador de vídeo exemplificativo 300 inclui um processador de intraprevisão 308, um processador de estimativa/compensação de movimento 312 (também denominado de processador de interprevisão), um processador de transformação/quantização 316, um processador de quantização inversa/transformação inversa 320, um filtro em circuito 324, um armazenamento temporário de imagem decodificado 328 e um processador de codificação por entropia 332. Parâmetros de fluxo de bits podem ser inseridos no processador de codificação por entropia 332 para inclusão no fluxo de bits de saída 336.

[034] O processador de transformação/quantização 313 pode ser capaz de realizar fusão de blocos e calcular a medida de atividade espacial que pode incluir componentes de frequência de computação utilizando matrizes de transformação para cada bloco.

[035] Em operação, para cada bloco de um quadro do vídeo de entrada 304, pode-se determinar se o bloco deve ser processado por meio de previsão intraimagem ou usando estimativa/compensação de movimento. O bloco pode ser fornecido ao processador de intraprevisão 308 ou ao processador de estimativa/compensação de movimento 312. Se o bloco deve ser processado por meio de intraprevisão, o processador de intraprevisão 308 pode realizar o processamento para enviar o previsor. Se o bloco deve ser processado por meio de estimativa/compensação de movimento, o processador de estimativa/compensação de movimento 312 pode realizar o processamento.

[036] Um resíduo pode ser formado subtraindo o previsor da entrada de vídeo. O resíduo pode ser recebido pelo processador de transformação/quantização 316, que pode realizar o processamento de transformação (por exemplo, transformada distinta de cosseno (DCT)) para produzir coeficientes, que podem ser quantizados. Os coeficientes quantizados e qualquer informação de sinalização associada podem ser fornecidos ao processador de codificação por entropia 332 para codificação por entropia e inclusão no fluxo de bits de saída

336. Além disso, os coeficientes quantizados podem ser fornecidos ao processador de quantização/transformação inversa 320, que pode reproduzir pixels, que podem ser combinados com o previsor e processados pelo filtro em circuito 324, cuja saída é armazenada no armazenamento temporário de imagem decodificada 328 para uso pelo processador de estimativa/compensação de movimento 312.

[037] Deve-se notar que qualquer um ou mais dos aspectos e modalidades descritos no presente documento podem ser convenientemente implementados usando conjunto de circuitos eletrônicos digitais, conjunto de circuitos integrados, conjunto de circuitos integrados específicos de aplicação especialmente concebidos (ASICs), matrizes de portas programáveis de campo (FPGAs), hardware de computador, firmware, software e/ou combinações dos mesmos, conforme realizado e/ou implementado em uma ou mais máquinas (por exemplo, um ou mais dispositivos de computação que são utilizados como um dispositivo de computação de usuário para um documento eletrônico, um ou mais dispositivos de servidor, como um servidor de documentos, etc.) programado de acordo com os ensinamentos da presente especificação, como será evidente para aqueles versados na técnica da computação. Esses vários aspectos ou recursos podem incluir a implementação em um ou mais programas de computador e/ou software que são executáveis e/ou interpretáveis em um sistema programável, incluindo pelo menos um processador programável, que pode ser especial ou de propósito geral, acoplado para receber dados e instruções de e para transmitir dados e instruções para um sistema de armazenamento, pelo menos um dispositivo de entrada e pelo menos um dispositivo de saída. O software de codificação apropriado pode ser prontamente preparado por programadores qualificados com base nos ensinamentos da presente revelação, como será evidente para aqueles versados na técnica do software. Aspectos e implementações discutidos acima empregando software e/ou módulos de software também podem incluir hardware apropriado para auxiliar na implementação das instruções executáveis por máquina do software e/ou módulo de software.

[038] Esse software pode ser um produto de programa de computador que emprega um meio de armazenamento legível por máquina. Um meio de armazenamento legível por máquina pode ser qualquer meio que seja capaz de armazenar e/ou codificar uma sequência de instruções para execução por uma máquina (por exemplo, um dispositivo de computação) e que faz com que a máquina execute qualquer uma das metodologias e/ou modalidades descritas no presente documento. Exemplos de um meio de armazenamento legível por máquina incluem, mas sem limitação, um disco magnético, um disco óptico (por exemplo, CD, CD-R, DVD, DVD-R, etc.), um disco magneto-óptico, uma memória de apenas leitura "ROM", um dispositivo "RAM" de memória de acesso aleatório, um cartão magnético, um cartão óptico, um dispositivo de memória de estado sólido, uma EPROM, uma EEPROM, Dispositivos Lógicos Programáveis (PLDs)

e/ou quaisquer combinações dos mesmos. Um meio legível por máquina, conforme usado no presente documento, destina-se a incluir um único meio, bem como uma coleção de mídia fisicamente separada, como, por exemplo, uma coleção de discos compactos ou uma ou mais unidades de disco rígido em combinação com uma memória de computador. Conforme usado no presente documento, um meio de armazenamento legível por máquina não inclui formas transitórias de transmissão de sinal.

[039] Tal software também pode incluir informações (por exemplo, dados) transportadas como um sinal de dados em uma portadora de dados, como uma onda portadora. Por exemplo, as informações executáveis por máquina podem ser incluídas como um sinal de transporte de dados incorporado em uma portadora de dados em que o sinal codifica uma sequência de instrução, ou parte dela, para execução por uma máquina (por exemplo, um dispositivo de computação) e quaisquer informações (por exemplo, estruturas de dados e dados) que fazem com que a máquina execute qualquer uma das metodologias e/ou modalidades descritas no presente documento.

[040] Exemplos de um dispositivo de computação incluem, mas sem limitação, um dispositivo de leitura de livro eletrônico, uma estação de trabalho de computador, um computador terminal, um computador servidor, um dispositivo portátil (por exemplo, um computador do tipo tablet, um telefone inteligente, etc.), um aplicativo de web, um roteador de rede, um comutador de rede, uma ponte de rede, qualquer máquina capaz de executar uma sequência de instruções que especificam uma ação a ser realizada por essa máquina e quaisquer combinações das mesmas. Em um exemplo, um dispositivo de computação pode incluir e/ou ser incluído em um quiosque.

[041] A Figura 4 mostra uma representação diagramática de uma modalidade de um dispositivo de computação na forma exemplificativa de um sistema de computador 400 dentro do qual um conjunto de instruções para fazer com que um sistema de controle execute qualquer um ou mais dos aspectos e/ou metodologias da presente revelação pode ser executado. Também é contemplado que vários dispositivos de computação podem ser utilizados para implementar um conjunto especialmente configurado de instruções para fazer com que um ou mais dos dispositivos executem qualquer um ou mais dos aspectos e/ou metodologias da presente revelação. O sistema de computador 400 inclui um processador 404 e uma memória 408 que se comunica entre si e com outros componentes por meio de um barramento 412. O barramento 412 pode incluir qualquer um dos vários tipos de estruturas de barramento, incluindo, mas sem limitação, um barramento de memória, um controlador de memória, um barramento periférico, um barramento local e quaisquer combinações dos mesmos, usando qualquer uma de uma variedade de arquiteturas de barramento.

[042] A memória 408 pode incluir vários componentes (por exemplo, mídia legível por máquina) incluindo, mas sem limitação, um componente de memória de acesso aleatório, um componente somente leitura e quaisquer combinações dos mesmos. Em um exemplo, um sistema básico de entrada/saída 416 (BIOS), incluindo rotinas básicas que ajudam a transferir informações entre elementos dentro do sistema de computador 400, como durante a inicialização, pode ser armazenado na memória 408. A memória 408 também pode incluir (por exemplo, armazenada em uma ou mais mídias legíveis por máquina) instruções (por exemplo, software) 420 incorporando qualquer um ou mais dos aspectos e/ou metodologias da presente revelação. Em outro exemplo, a memória 408 pode incluir ainda qualquer número de módulos de programa, incluindo, mas sem limitação, um sistema operacional, um ou mais programas de aplicativos, outros módulos de programa, dados de programa e quaisquer combinações dos mesmos.

[043] O sistema de computador 400 também pode incluir um dispositivo de armazenamento 424. Exemplos de um dispositivo de armazenamento (por exemplo, dispositivo de armazenamento 424) incluem, mas sem limitação, uma unidade de disco rígido, uma unidade de disco magnético, uma unidade de disco óptico em combinação com um meio óptico, um dispositivo de memória de estado sólido e quaisquer combinações dos mesmos. O dispositivo de armazenamento 424 pode ser conectado ao barramento 412 por uma interface apropriada (não mostrada). Interfaces exemplificativas incluem, mas sem limitação, SCSI, conexão de tecnologia avançada (ATA), ATA serial, barramento serial universal (USB), IEEE 1394 (FIREWIRE) e quaisquer combinações dos mesmos. Em um exemplo, o dispositivo de armazenamento 424 (ou um ou mais componentes do mesmo) pode ter interface removível com o sistema de computador 400 (por exemplo, através de um conector de porta externa (não mostrado)). Particularmente, o dispositivo de armazenamento 424 e um meio legível por máquina associado 428 podem fornecer armazenamento não volátil e/ou volátil de instruções legíveis por máquina, estruturas de dados, módulos de programa e/ou outros dados para o sistema de computador 400. Em um exemplo, o software 420 pode residir, completa ou parcialmente, dentro do meio legível por máquina 428. Em outro exemplo, o software 420 pode residir, completa ou parcialmente, dentro do processador 404.

[044] O sistema de computador 400 também pode incluir um dispositivo de entrada 432. Em um exemplo, um usuário do sistema de computador 400 pode inserir comandos e/ou outras informações no sistema de computador 400 por meio do dispositivo de entrada 432. Exemplos de um dispositivo de entrada 432 incluem, mas sem limitação, um dispositivo de entrada alfanumérico (por exemplo, um teclado), um dispositivo apontador, um joystick, um gamepad, um dispositivo de entrada de áudio (por exemplo, um microfone, uma resposta de voz sistema, etc.), um dispositivo de controle de cursor (por exemplo, um mouse), um bloco de toque, um digitalizador óptico, um dispositivo de captura de vídeo (por exemplo, uma câmera fotográfica, uma câmera de vídeo), uma tela sensível ao toque e quaisquer combinações dos mesmos. O dispositivo de entrada 432 pode ter interface com o barramento 412 por meio de uma variedade de interfaces (não mostradas), incluindo, mas sem limitação, uma interface serial, uma interface paralela, uma porta de jogo, uma interface USB, uma interface FIREWIRE, uma interface direta para o barramento 412 e quaisquer combinações dos mesmos. O dispositivo de entrada 432 pode incluir uma interface de tela de toque que pode ser uma parte ou separada da tela 436, discutida mais abaixo. O dispositivo de entrada 432 pode ser utilizado como um dispositivo de seleção de usuário para selecionar uma ou mais representações gráficas em uma interface gráfica, conforme descrito acima.

[045] Um usuário também pode inserir comandos e/ou outras informações para o sistema de computador 400 através do dispositivo de armazenamento 424 (por exemplo, uma unidade de disco removível, uma unidade rápida, etc.) e/ou dispositivo de interface de rede 440. Um dispositivo de interface de rede, como o dispositivo de interface de rede 440, pode ser utilizado para conectar o sistema de computador 400 a uma ou mais de uma variedade de redes, como a rede 444 e um ou mais dispositivos remotos 448 conectados à mesma. Exemplos de um dispositivo de interface de rede incluem, mas sem limitação, uma placa de interface de rede (por exemplo, uma placa de interface de rede móvel, uma placa LAN), um modem e qualquer combinação dos mesmos. Exemplos de uma rede incluem, mas sem limitação, uma rede de área ampla (por exemplo, a Internet, uma rede corporativa), uma rede de área local (por exemplo, uma rede associada a um escritório, um prédio, um campus ou outro espaço geográfico relativamente pequeno), uma rede telefônica, uma rede de dados associada a um provedor de telefone/voz (por exemplo, um provedor de comunicações móveis de dados e/ou rede de voz), uma conexão direta entre dois dispositivos de computação e quaisquer combinações dos mesmos. Uma rede, como a rede 444, pode empregar um modo de comunicação com fio e/ou sem fio. Em geral, qualquer topologia de rede pode ser usada. Informações (por exemplo, dados, software 420, etc.) podem ser comunicadas para e/ou do sistema de computador 400 através do dispositivo de interface de rede 440.

[046] O sistema de computador 400 pode ainda incluir um adaptador de exibição de vídeo 452 para comunicar uma imagem exibível a um dispositivo de exibição, como o dispositivo de exibição 436. Exemplos de um dispositivo de exibição incluem, mas sem limitação, uma tela de cristal líquido (LCD), um tubo de raios catódicos (CRT), uma tela de plasma, uma tela de diodo emissor de luz (LED) e quaisquer combinações dos mesmos. O adaptador de exibição 452 e o dispositivo de exibição 436 podem ser utilizados em combinação com o processador 404 para fornecer representações gráficas de aspectos da presente revelação. Além de um dispositivo de exibição, o sistema de computador 400 pode incluir um ou mais outros dispositivos de saída periféricos incluindo, mas sem limitação, um alto-falante de áudio, uma impressora e quaisquer combinações dos mesmos. Tais dispositivos de saída periféricos podem ser conectados ao barramento 412 por meio de uma interface periférica 456. Exemplos de uma interface periférica incluem, mas sem limitação, uma porta serial, uma conexão USB, uma conexão FIREWIRE, uma conexão paralela e quaisquer combinações das mesmas.

[047] O anterior foi uma descrição detalhada de modalidades ilustrativas da invenção. Várias modificações e adições podem ser feitas sem se afastar do espírito e do escopo dessa invenção. Características de cada uma das várias modalidades descritas acima podem ser combinadas com características de outras modalidades descritas, conforme apropriado, a fim de fornecer uma multiplicidade de combinações de recursos em novas modalidades associadas. Além disso, embora o anterior descreva uma série de modalidades separadas, o que foi descrito no presente documento é meramente ilustrativo da aplicação dos princípios da presente invenção. Além disso, embora métodos particulares no presente documento possam ser ilustrados e/ou descritos como sendo realizados em uma ordem específica, a ordenação é altamente variável dentro de uma habilidade comum para alcançar modalidades como reveladas no presente documento. Consequentemente, essa descrição destina-se a ser tomada apenas a título de exemplo e não para limitar de outra forma o âmbito dessa invenção.

[048] Nas descrições acima e nas reivindicações, frases como "pelo menos um de" ou "um ou mais de" podem ocorrer seguidas por uma lista conjuntiva de elementos ou características. O termo "e/ou" também pode ocorrer em uma lista de dois ou mais elementos ou recursos. A menos que de outra forma implícita ou explicitamente contradita pelo contexto em que é usada, tal frase se destina a significar qualquer um dos elementos ou características listados individualmente ou qualquer um dos elementos ou características citadas em combinação com qualquer um dos outros elementos ou características recitadas. Por exemplo, as frases "pelo menos um de A e B;" “um ou mais de A e B;” e "A e/ou B" significam, cada um, "A sozinho, B sozinho ou A e B juntos." Uma interpretação semelhante também se destina a listas que incluem três ou mais itens. Por exemplo, as frases "pelo menos um de A, B e C;" “Um ou mais de A, B e C;” e "A, B e/ou C" significam, cada um, "A sozinho, B sozinho, C sozinho, A e B juntos, A e C juntos, B e C juntos, ou A e B e C juntos." Além disso, o uso do termo "com base em", acima e nas reivindicações, pretende significar "com base pelo menos em parte em", de modo que um recurso ou elemento não recitado também seja permitido.

[049] A matéria descrita no presente documento pode ser incorporada em sistemas, aparelhos, métodos e/ou artigos, dependendo da configuração desejada. As implementações estabelecidas na descrição anterior não representam todas as implementações consistentes com a matéria descrita no presente documento. Em vez disso, são apenas alguns exemplos consistentes com aspectos relacionados à matéria descrita. Embora algumas variações tenham sido descritas em detalhes acima, outras modificações ou acréscimos são possíveis. Em particular, outros recursos e/ou variações podem ser fornecidos além daqueles estabelecidos no presente documento. Por exemplo, as implementações descritas acima podem ser direcionadas a várias combinações e subcombinações dos recursos revelados e/ou combinações e subcombinações de vários recursos adicionais revelados acima. Além disso, os fluxos lógicos representados nas figuras anexas e/ou descritos no presente documento não exigem necessariamente a ordem particular mostrada, ou ordem sequencial, para alcançar os resultados desejáveis. Outras implementações podem fazer parte do escopo das seguintes reivindicações.

Claims

REIVINDICAÇÕES

1. CODIFICADOR sendo que o codificador é caracterizado pelo fato de que compreende conjunto de circuitos configurado para: receber um quadro de vídeo; particionar o quadro de vídeo em uma pluralidade de blocos; determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos; e com o uso de uma matriz de transformação, codificar o quadro de vídeo de acordo com as medidas de atividade espacial para pelo menos um dentre a pluralidade de blocos.

2. CODIFICADOR, de acordo com a reivindicação 1, caracterizado pelo fato de que determinar a respectiva medida de atividade espacial para cada bloco inclui usar uma matriz de transformação de cosseno distinta generalizada.

3. CODIFICADOR, de acordo com a reivindicação 2, caracterizado pelo fato de que a matriz de transformação de cosseno distinta generalizada inclui uma matriz II de transformação de cosseno distinta generalizada.

4. CODIFICADOR, de acordo com a reivindicação 2, caracterizado pelo fato de que inclui uma estimativa de número inteiro de uma matriz de transformação de cosseno distinta.

5. CODIFICADOR, de acordo com a reivindicação 1, caracterizado pelo fato de que é configurado adicionalmente para determinar parâmetros de quantização com base em cada medida de atividade espacial respectiva, em que a codificação usa os parâmetros de quantização determinados.

6. CODIFICADOR, de acordo com a reivindicação 1, caracterizado pelo fato de que é configurado adicionalmente para determinar uma primeira área dentro do quadro de vídeo que inclui um primeiro agrupamento de um subconjunto dos blocos, sendo que o primeiro agrupamento é com base na respectiva medida de atividade espacial.

7. CODIFICADOR, de acordo com a reivindicação 6, caracterizado pelo fato de que determinar a primeira área inclui iterar sobre cada um da pluralidade de blocos e, para cada bloco atual, comparar a medida de atividade espacial do bloco atual com uma medida de atividade espacial de um bloco anterior e determinar se uma diferença está abaixo de um limite predefinido e atribuir o bloco atual à primeira área.

8. CODIFICADOR, de acordo com a reivindicação 7, caracterizado pelo fato de que determinar a primeira área inclui adicionalmente atribuir o bloco atual a uma segunda área em resposta ou com base na determinação de que a diferença está acima do limite predefinido.

9. CODIFICADOR, de acordo com a reivindicação 1, caracterizado pelo fato de que um tamanho de bloco dos blocos é 4 x 4.

10. CODIFICADOR, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente: um processador de transformação e quantização; um processador de quantização inversa e transformação inversa; um filtro em circuito; um armazenamento temporário de imagem do decodificador; um processador de estimativa e compensação de movimento; e um processador de intraprevisão.

11. MÉTODO caracterizado pelo fato de que compreende: receber, por um codificador, um quadro de vídeo; particionar o quadro de vídeo em uma pluralidade de blocos; determinar uma respectiva medida de atividade espacial para cada bloco na pluralidade de blocos e como uma função de uma matriz de transformação; e codificar o quadro de vídeo de acordo com as medidas de atividade espacial para pelo menos um da pluralidade de blocos.

12. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fato de que determinar a respectiva medida de atividade espacial para cada bloco inclui usar uma matriz de transformação de cosseno distinta generalizada.

13. MÉTODO, de acordo com a reivindicação 12, caracterizado pelo fato de que a matriz de transformação de cosseno distinta generalizada inclui uma matriz II de transformação de cosseno distinta generalizada.

14. MÉTODO, de acordo com a reivindicação 12, caracterizado pelo fato de que a matriz de transformação de cosseno distinta generalizada inclui uma estimativa de número inteiro de uma matriz de transformação de cosseno distinta.

15. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fato de que compreende adicionalmente determinar parâmetros de quantização com base em cada respectiva medida de atividade espacial, em que a codificação usa os parâmetros de quantização determinados.

16. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fato de que compreende adicionalmente determinar uma primeira área dentro do quadro de vídeo que inclui um primeiro agrupamento de um subconjunto dos blocos, sendo que o primeiro agrupamento é com base nas respectivas medidas de atividade espaciais.

17. MÉTODO, de acordo com a reivindicação 16, caracterizado pelo fato de que determinar a primeira área inclui iterar sobre cada um da pluralidade de blocos e, para cada bloco atual, comparar a medida de atividade espacial do bloco atual com uma medida de atividade espacial de um bloco anterior e determinar se uma diferença está abaixo de um limite predefinido e atribuir o bloco atual à primeira área.

18. MÉTODO, de acordo com a reivindicação 17, caracterizado pelo fato de que determinar a primeira área inclui adicionalmente atribuir o bloco atual a uma segunda área em resposta ou com base na determinação de que a diferença está acima do limite predefinido.

19. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fato de que um tamanho de bloco da pluralidade de blocos é 4 x 4.

20. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fato de que o codificador que compreende o conjunto de circuitos compreende: um processador de transformação e quantização; um processador de quantização inversa e transformação inversa; um filtro em circuito;

um armazenamento temporário de imagem do decodificador; um processador de estimativa e compensação de movimento; e um processador de intraprevisão.