BRPI0616823A2 - transcodificação de vìdeo digital integrada eficiente - Google Patents

transcodificação de vìdeo digital integrada eficiente Download PDF

Info

Publication number
BRPI0616823A2
BRPI0616823A2 BRPI0616823-0A BRPI0616823A BRPI0616823A2 BR PI0616823 A2 BRPI0616823 A2 BR PI0616823A2 BR PI0616823 A BRPI0616823 A BR PI0616823A BR PI0616823 A2 BRPI0616823 A2 BR PI0616823A2
Authority
BR
Brazil
Prior art keywords
computer
scaling
transcoding
bit stream
operations
Prior art date
Application number
BRPI0616823-0A
Other languages
English (en)
Inventor
Guobin Shen
Shipeng Li
Wanyong Cao
Yuwen He
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of BRPI0616823A2 publication Critical patent/BRPI0616823A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/23608Remultiplexing multiplex streams, e.g. involving modifying time stamps or remapping the packet identifiers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4344Remultiplexing of multiplex streams, e.g. by modifying time stamps or remapping the packet identifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

TRANSCODIFICAçãO DE VIDEO DIGITAL INTEGRADA EFICIENTE. A transcodificação de vídeo digital integrada eficiente é descrita. Em um aspecto, um transcodificador integrado recebe um fluxo de bits codificado. O transcodificador integrado transcodifica o fluxo de bits codificado decodificando parcialmente o fluxo de bits codificado com base em uma primeira transformação associada com um primeiro formato de dados de mídia. As operações de decodificação geram um fluxo de dados intermediário, O transcodificador integrado então codifica o fluxo de dados intermediário usando uma segunda transformação associada com um segundo formato de dados de mídia. A primeira e a segunda transformações não são as mesmas.

Description

"TRANSCODIFICAÇÃO DE VÍDEO DIGITAL INTEGRADA EFICIENTE"
ANTECEDENTES
O conteúdo de vídeo digital é tipicamente geradopara atingir um formato de dados específico. Um formato dedados de vídeo geralmente se conforma com um padrão de codi-ficação de vídeo específico ou um algoritmo de codificaçãoproprietário, com uma taxa de transferência específica, re-solução espacial, velocidade de projeção, etc. Tais padrõesde codificação incluem MPEG-2 e vídeo de mídia do WINDOWS(WMV). A maior parte dos conteúdos de vídeo digital existen-tes é codificada de acordo com o formato de dados do MPEG-2.WMV é amplamente aceito como um codec qualificado no campode transferência de dados contínua, sendo amplamente organi-zado por toda a Internet, adotado pelo consórcio HD-DVD eatualmente sendo considerado como um padrão SMPTE. Padrõesde codificação de vídeo diferentes provêem capacidades vari-adas de compactação e qualidade visual.
A transcodificação se refere ao processo geral deconversão de um fluxo de bits compactado em um outro compac-tado. Para corresponder com as capacidades do dispositivo eredes de distribuição, é freqüentemente desejável converterum fluxo de bits em um formato de codificação para um outroformato de codificação tal como de MPEG-2 para WMV, paraH.264 ou até mesmo para um formato escalável. A transcodifi-cação pode também ser utilizada para atingir alguma funcio-nalidade específica tal como funcionalidade semelhante aoVCR, inserção de logotipo ou capacidade de resiliência deerro enriquecida do fluxo de bits para transmissão atravésde canais sem fio.
A figura 1 mostra um sistema de transcodificadordo domínio de pixel em cascata convencional (CPDT), que co-loca em cascata um decodificador de primeiro plano para de-codificar um fluxo de bits de entrada com um codificador quegera um novo fluxo de bits com um conjunto de parâmetros decodificação diferente ou no novo formato. Um inconvenientedessa arquitetura de transcodificação convencional é que suacomplexidade tipicamente apresenta um obstáculo para a orga-nização prática. Como um resultado, a arquitetura de trans-codificação do CPDT da figura 1 é tipicamente usada como umteste de desempenho para esquemas aperfeiçoados.
A figura 2 mostra uma arquitetura de transcodifi-cador de domínio DCT em cascata convencional (CDDT), simpli-ficando a arquitetura de CPDT da figura 1. 0 sistema da fi-gura 2 limita a funcionalidade ao escalonamento descendenteda resolução espacial/temporal e mudanças do parâmetro decodificação. CDDT elimina os processos de DCT/IDCT executa-dos pelo transcodif icador de CPDT da figura 1. Porém, CDDTexecuta MC no domínio DCT, que é tipicamente uma operaçãolonga e cara do ponto de vista computacional. Isso é porqueos blocos DCT são freqüentemente sobrepostos com blocos MC.
Como um resultado, a arquitetura de CDDT tipicamente precisaaplicar operações de matriz de ponto flutuante complexas ecaras do ponto de vista computacional a fim de executar MCno domínio DCT. Adicionalmente, refinamento do vetor de mo-vimento (MV) é tipicamente impossível utilizando a arquite-tura de CDDT.
SUMÁRIO
Esse sumário é provido para apresentar uma seleçãode conceitos em uma forma simplificada que são também des-critos abaixo na descrição detalhada. Esse sumário não éplanejado para identificar aspectos chaves ou aspectos es-senciais da matéria exposta reivindicada, nem ele é planeja-do para ser usado como um auxilio na determinação do escopoda matéria exposta reivindicada.
Em vista do acima, a transcodificação de vídeo di-gital integrada eficiente é descrita. Em um aspecto, umtranscodificador integrado recebe um fluxo de bits codifica-do. 0 transcodificador integrado transcodifica o fluxo debits codificado decodificando parcialmente o fluxo de bitscodificado com base em um primeiro conjunto de técnicas decompactação associadas com um primeiro formato de dados demídia. As operações de decodificação geram um fluxo de dadosintermediário. O transcodificador integrado então codifica ofluxo de dados intermediário usando um segundo conjunto detécnicas de compactação associadas com um segundo formato dedados de mídia. O primeiro e o segundo conjuntos de técnicasde compactação não são os mesmos.
BREVE DESCRIÇÃO DOS DESENHOS
Nas figuras, o dígito mais a esquerda de um númerode referência do componente identifica a figura particularna qual o componente aparece primeiro.
A figura 1 mostra um sistema de transcodificadorde domínio de pixel em cascata convencional (CPDT), que co-loca em cascata um decodificador de primeiro plano para de-codificar um fluxo de bits de entrada com um codificador pa-ra gerar um novo fluxo de bits com um conjunto de parâmetrode codificação diferente ou no novo formato.
A figura 2 mostra uma arquitetura de transcodifi-cador de domínio de DCT em cascata convencional (CDDT), sim-plificando a arquitetura de CPDT da figura 1.
A figura 3 mostra uma arquitetura dividida detranscodificação de domínio de pixel não integrada exemplarpara transcodificar MPEG-2 para WMV, de acordo com uma moda-lidade. Mais particularmente, essa arquitetura dividida pro-vê uma base conceituai para transcodificação de vídeo digi-tal integrada eficiente.
A figura 4 mostra um sistema exemplar para trans-codificação de vídeo digital integrada eficiente, de acordocom uma modalidade.
A figura 5 mostra um transcodificador de domíniode pixel em cascata de laço fechado simplificado exemplar,de acordo com uma modalidade.
A figura 6 mostra um transcodificador de domíniode DCT de laço fechado simplificado exemplar, de acordo comuma modalidade.
A figura 7 mostra uma operação de intercalação e-xemplar de quatro blocos de DCT 4x4 em um bloco de DCT de8x8, de acordo com uma modalidade. Essa operação de interca-lação é executada durante a transcodificação de conteúdo devídeo eficiente.
A figura 8 mostra uma arquitetura exemplar para umtranscodificador de escalonamento descendente de resoluçãonumerai de 2:1 de domínio de DCT simplificado, de acordo comuma modalidade.
A figura 9 mostra uma operação de intercalação e-xemplar de quatro blocos de DCT 4x4 em um bloco de DCT 8x8para mídia de entrelaçamento para operações de transcodifi-cação de escalonamento descendente de resolução espacial2:1, de acordo com uma modalidade.
A figura 10 mostra uma arquitetura de transcodifi-cador de escalonamento descendente 2:1 simplificada exemplarcom compensação de flutuação total, de acordo com uma moda-lidade.
A figura 11 mostra um modelo de armazenamento tem-porário do verificador de armazenamento temporário virtualpadrão (VBV) exemplar para um decodificador.
A figura 12 mostra um transcodificador com escalo-namento descendente de resolução arbitrariamente espacial deacordo com uma modalidade.
A figura 13 mostra um procedimento exemplar paraoperações de transcodificação de vídeo digital integrada e-ficiente, de acordo com uma modalidade.
A figura 14 mostra um ambiente exemplar no qual atranscodificação de vídeo digital integrada eficiente podeser parcial ou totalmente realizada, de acordo com uma moda-lidade.
Para finalidades de discussão e ilustração, cor éusada nas figuras para apresentar as convenções seguintes.Uma seta sólida azul representa um sinal do domínio do pixelcom relação aos dados de imagem reais ou residuais. Uma setasólida vermelha representa o sinal no domínio da DCT. Umaseta tracejada laranja representa informação de movimento.
DESCRIÇÃO DETALHADA
Visão geral
Sistemas e métodos para a transcodificação de ví-deo digital eficiente são descritos abaixo com referência àsfiguras 4 a 14. Esses sistemas e métodos utilizam informaçãono fluxo de bits de entrada para permitir que uma aplicaçãodinamicamente controle a propagação do erro, e por meio dis-so, seletivamente controle a velocidade e a qualidade datranscodificação do fluxo de bits do vídeo. Esse controleseletivo permite que uma aplicação escale sem junção datranscodificação de laço fechado (perfil de transcodificaçãode alta velocidade) para esquemas de transcodificação de la-ço aberto (perfil de transcodificação de alta qualidade). Emcontraste com as arquiteturas de transcodificação convencio-nais (por exemplo, o CPDT da figura Ieo CDDT da figura 2),as arquiteturas para transcodificação de vídeo digital efi-ciente são integradas e elas combinaram tipos diferentes detransformações de co-seno discreto (DCTs) ou transformaçõessemelhantes a DCT em um módulo de transcodif icação. Os sis-temas e métodos para a transcodificação de vídeo eficienterealizam re-quantização com uma tabela de pesquisa rápida eprovêem mecanismos de controle de flutuação fina usando umalgoritmo de limiar triplo.
Em uma realização, onde a transcodif icação de ví-deo digital eficiente transcodifica um formato de dados dofluxo de bits (por exemplo, MPEG-2, etc.) para WMV, as ope-rações de transcodificação de perfil de alta qualidade su-portam aspectos de codificação avançados do WMV. Em uma rea-lização, as operações de transcodificação de perfil de alta velocidade realizam o escalonamento descendente em dois es-tágios de resolução arbitrária (por exemplo, quando transco-dificando de alta definição (HD) para definição padrão(SD)). Em tais operações de escalonamento descendente dedois estágios, parte da razão do escalonamento descendente é eficientemente realizada no domínio da DCT, enquanto as ope-rações da razão de escalonamento descendente são realizadasno domínio espacial em uma resolução substancialmente redu-zida .
Base Conceituai Exemplar
A figura 3 mostra a arquitetura dividida de trans-codificação de domínio de pixel em cascata não integrada e-xemplar 300 para converter MPEG-2 para WMV. Essa arquiteturadividida não é integrada porque módulos separados respecti-vamente executam as operações de decodificação e de codifi-cação. A arquitetura dividida da figura 3 provê uma baseconceituai para a descrição subseqüente dos sistemas e méto-dos integrados para transcodificação de vídeo digital efici-ente. A tabela I mostra símbolos e seus significados respec-tivos para a discussão da figura 3.
Tabela 1<table>table see original document page 9</column></row><table>
Para finalidades de descrição e ilustração exem-plar, o sistema 300 é descrito com relação à transcodifica-ção de MPEG-2 para WMV com redução da taxa de transferência,redução da resolução espacial e sua combinação. Muitos con-teúdos de video digital existentes são codificados de acordocom o formato de dados do MPEG-2. WMV é amplamente aceitocomo um codec qualificado no campo da transferência continuade dados, sendo amplamente organizado por toda a Internet,adotado pelo consórcio HD-DVD e atualmente sendo consideradocomo um padrão SMPTE.
MPEG-2 e WMV provêem capacidades variadas de com-pactação e qualidade visual. Por exemplo, as técnicas decompactação respectivamente usadas por MPEG-2 e WMV são mui-to diferentes. Por exemplo, as técnicas de filtragem da com-pensação de movimento (MC) e precisão do vetor de movimento(MV) são diferentes. No MPEG-2, a precisão do movimento ésomente até a precisão de meio pixel e o método de interpo-lação é a filtragem bilinear. Em contraste, no WMV, a preci-são do movimento pode subir até a precisão do quarto de pi-xel, e dois métodos de interpolação, isto é filtragem bili-near e filtragem bicúbica, são suportados. Além do mais, e-xiste um parâmetro de controle de arredondamento envolvidono processo de filtragem. 0 uso de WMV pode resultar em umaredução de até 50% na taxa de transferência do video comperda de qualidade visual insignificante, quando comparadocom a taxa de transferência do MPEG-2.
Em um outro exemplo, transformações usadas peloMPEG-2 e WMV são diferentes. Por exemplo, o MPEG-2 usaDCT/IDCT padrão e o tamanho da transformação é fixado para8x8. Em contraste, WMV usa transformações de número inteiro(VCl-T) onde os elementos da matriz do núcleo de transforma-ção são todos pequenos números inteiros. Adicionalmente, otamanho da transformação pode ser alterado usando WMV deblocos para blocos usando 8x8, 8x4, 4x8 e 4x4. MPEG-2 nãosuporta otimização ao nível do quadro. Enquanto que, WMV su-porta várias sintaxes de nível de quadro para otimização dodesempenho. WMV suporta muitos outros aspectos de codifica-ção avançados, tais como compensação de intensidade, reduçãoda faixa e mudança de resolução dinâmica, etc.
Em vista do acima, para prover redução da taxa detransferência sem mudança de resolução, o processo de fil-tragem ligando o decodificador de MPEG-2 e o codificador doWMV mostrado na figura 3 é um filtro de passagem total (istoé, não em vigor). Portanto, a entrada para o codificador pa-ra o quadro (i+1) é expressa como:
<formula>formula see original document page 11</formula>
Nessa realização, a eficiência de codificação doWMV da figura 3 obtém resultado de precisão de movimentomais fino. Em WMV, a precisão do movimento do quarto do pi-xel é permitida comparada com a precisão de meio pixel comumcomo no MPEG-2. Além do mais, WMV permite interpolação me-lhor, porém mais complexa, conhecida como interpolação bicú-bica para filtragem de MC. A interpolação bilinear é usadapara MPEG-2 no módulo do MC (MCrap2) para MC de meio pixel. Ométodo de interpolação bilinear é similar a esse usado noWMV com a exceção que a interpolação bilinear do MPEG-2 nãotem controle de arredondamento. Para obter alta velocidade,a precisão de movimento de meio pixel pode ser realizada naporção do codificador. Uma razão para isso é a carência doquadro original absoluto (isto é, os dados de entrada dofluxo de bits (BS__IN) já estão compactados). Assim, nesseexemplo, é difícil obter um vetor de movimento mais preciso,porém significativo. Por outro lado, a informação de movi-mento obtida do decodif icador do MPEG-2 (isto é, MVvci =MVrap2) pode ser reutilizada diretamente. Desde que não existemudança de resolução, não existe perda de precisão do MV comessa suposição. Se o codificador é também restrito para usara interpolação bilinear e forçar o parâmetro de controle dearredondamento para estar sempre desativado, então sob a su-posição razoável que a compensação do movimento é uma opera-ção linear e ignorando o erro de arredondamento (isto é,MCvci = MCmp2), a equação 1 é simplificada como segue:eM = Pm + MCmp2( B1-B1, MVmp2)
De acordo com a equação 2, o transcodificador deCPDT de referência na figura 3 pode ser simplificado. Umatal arquitetura simplificada é descrita abaixo com referên-cia à figura 5. Antes de descrever a arquitetura simplifica-da, um sistema exemplar para transcodificação de vídeo digi-tal eficiente é descrito primeiro.
Um Sistema Exemplar
Embora não requerido, a transcodificação de vídeodigital eficiente é descrita no contexto geral de instruçõesde programa de computador sendo executadas por um dispositi-vo de computação tal como um computador pessoal. Módulos deprograma geralmente incluem rotinas, programas, objetos,componentes, estruturas de dados, etc., que executam tarefasparticulares ou realizam tipos de dados abstratos particula-res. Embora os sistemas e métodos sejam descritos no contex-to precedente, as ações e as operações descritas a seguirpodem também ser realizadas em hardware.
A figura 4 mostra um sistema exemplar 400 paratranscodificação de video digital eficiente. Nessa realiza-ção, as operações do sistema 400 são descritas com relação aesquemas de codificação de video de compensação de movimento(MC) com base em bloco e DCT híbrida, sobre os quais muitospadrões de codificação de vídeo e formatos proprietários sãobaseados. Mais particularmente, o sistema 400 é descrito comarquiteturas, componentes e operações usados para transcodi-ficar MPEG-2 para WMV. Entretanto, pode ser verificado queas arquiteturas, os componentes e as operações descritos pa-ra complexidade escalável e transcodificação de eficiênciapersonificados pelo sistema 400 para transcodificar MPEG-2para WMV podem também ser aplicados em outras conversões deformato de dados de fluxo de bits além de MPEG-2 e WMV. Porexemplo, em uma realização, o sistema 400 é utilizado paratranscodificar o fluxo de bits do MPEG-2 para fluxo de bitsdo MPEG-4 e dados de fluxo de bits do MPEG-4 para dados defluxo de bits do WMV, etc. Em tais modalidades alternadas,as arquiteturas de transcodificação descritas seguintes dosistema 400 (incluindo componentes e operações associadoscom elas), consideram o tipo de dados de fluxo de bits sendodecodificados, codificados e formatos de dados respectivos.
Nessa realização, o sistema 400 inclui um disposi-tivo de computação de uso geral 402. O dispositivo de compu-tação 402 representa qualquer tipo de dispositivo de compu-tação tais como um computador pessoal, um laptop, um servi-dor, um dispositivo de computação de mão ou móvel, etc. 0dispositivo de computação 402 inclui módulos do programa 404e dados do programa 406 para transcodificar um fluxo de bitscodificado em um primeiro formato de dados (por exemplo,MPEG-2) para um fluxo de bits codificado em um formato dedados diferente (por exemplo, WMV). Módulos do programa 404incluem, por exemplo, módulo de transcodificação de vídeodigital eficiente 408 ("módulo de transcodificação 408") eoutros módulos de programa 410. 0 módulo de transcodificação408 transcodifica a mídia codificada 412 (por exemplo, mídiade MPEG-2) em mídia transcodifiçada 414 (por exemplo, mídiade WMV). Outros módulos do programa 410 incluem, por exem-pio, um sistema operacional e uma aplicação utilizando ascapacidades de transcodificação de fluxo de bits de vídeo domódulo de transcodificação 408, etc. Em uma realização, aaplicação é parte do sistema operacional. Em uma realização,o módulo de transcodificação 408 expõe suas capacidades detranscodificação para a aplicação via uma interface de pro-gramação da aplicação (API) 416.
Transcodificação com Perfil de Alta VelocidadeA figura 5 mostra um transcodificador de domíniode pixel em cascata de laço fechado integrado simplificadoexemplar sem propagação de erro. Para finalidades de discus-são e ilustração, os componentes da figura 5 são descritoscom referência aos componentes da figura 4. Por exemplo, aarquitetura da figura 5 é representativa de uma realizaçãode arquitetura exemplar do módulo de transcodificação 408 dafigura 4. Com referência à arquitetura 500 da figura 5,quando comparada com a arquitetura na figura 3, por favor,observe que essa é uma arquitetura integrada sem componentesseparados de codificador e decodificador. Adicionalmente,por favor, observe que o módulo de estimativa de movimentode refinamento do MV é removido do MC no decodif icador deMPEG-2. Adicionalmente, o MC no codificador de WMV é inter-calado para um MC que opera em erros de re-quantização acu-mulados. Dessa maneira, a arquitetura de transcodificação dafigura 5 reduz significativamente a complexidade da computa-ção para transcodificação de alta velocidade dos formatos dedados de video progressivos e entrelaçados.
Por favor, observe que a transformação do WMV édiferente da usada no MPEG-2. No MPEG-2, o ponto flutuantepadrão de DCT/IDCT é usado enquanto que a transformação denúmero inteiro, cuja propriedade de acondicionamento da e-nergia é semelhante à DCT, é adotada no WMV. Como um resul-tado, a IDCT no decodificador do MPEG-2 e o VCl-T no codifi-cador do WMV não se cancelam. A transformação de número in-teiro no WMV é diferente da realização do número inteiro daDCT/IDCT. A transformação de número inteiro no WMV é cuida-dosamente projetada com todos os coeficientes de transforma-ção para ser pequenos números inteiros. Transcodificadoresconvencionais não são integrados para transcodificar um flu-xo de bits codificado com relação a uma primeira transforma-ção para uma segunda transformação que não é a mesma que aprimeira transformação.A equação 3 provê uma matriz de transformação e-xemplar para VCl-T 8x8.
<table>table see original document page 16</column></row><table>
A equação 3 em combinação com as equações 4 e 5,que são descritas abaixo, indicam como duas transformaçõesdiferentes são realizadas em um componente de escalonamentodo módulo de transcodificação 408 (figura 4). Em uma reali-zação, a precisão do VCl-T é a precisão de 16 bits, que émuito adequada para a realização MMX. Como um resultado, acomplexidade do codec pode ser significativamente reduzida.
A figura 6 mostra um transcodificador de domínioda DCT de laço fechado simplificado exemplar. A arquiteturada figura 6 é representativa de uma realização de arquitetu-ra exemplar do módulo de transcodificação 408 (figura 4). Aarquitetura 600 da figura 6 é uma arquitetura simplificadaquando comparada com a arquitetura 500 da figura 5. Com re-ferência à figura 6, deixemos C8 ser a matriz de transforma-ção da DCT padrão, Β, o bloco de DCT do MPEG-2 quantizadoinverso, e b, a IDCT do B, então a IDCT do MPEG-2 é calcula-da como segue:
<formula>formula see original document page 16</formula>Deixemos (SÍMBOLO) ser o VCl-T de b, então (SÍMBO-LO) é calculado como:
<formula>formula see original document page 17</formula>
onde (SÍMBOLO) representa multiplicação no sentidodo elemento de duas matrizes e N88 é a matriz de normaliza-ção para a transformação VCl-T que é calculada como segue:
N88 = C8 . c' 8
com
C8 = [8/288 8/289 8/292 8/298 8/288 8/289 8/292 8/298],
(SÍMBOLO) é diretamente calculado de B, usando aseguinte fórmula:
<formula>formula see original document page 17</formula>
Para verificar que T8C8' e C8T8' estão muito próxi-mos das matrizes diagonais, se nós aplicamos a aproximação,então a equação 4 se torna um escalonamento no sentido doelemento da matriz B. Isto é,
<formula>formula see original document page 17</formula>
onde
<formula>formula see original document page 17</formula>A equação 5 mostra que o VCl-T no codificador doWMV e a IDCT no decodificador do MPEG-2 podem ser intercala-dos. Conseqüentemente, a arquitetura na figura 5 pode sertambém simplificada para a mostrada na figura 6. A compara-ção detalhada revela que os dois módulos da DCT/IDCT sãosubstituídos por dois módulos do VCl-T e VCl-T inverso. Emuma realização, um módulo de escalonamento simples é tambémadicionado. Duas chaves são embutidas junto com uma máscarade atividade nessa arquitetura. Esses componentes embutidos,como descrito abaixo, são usados para controle dinâmico dacomplexidade das operações de cobertura de transcodificaçãodo transcodificador 408 (figura 4). Nesse ponto, esses com-ponentes são conectados. A propriedade aritmética de 16 bitsda transformação do WMV presta-se ao processamento paralelopara PC e DSP. Em vista disso, as complexidades de computa-ção são significativamente reduzidas. Além do mais, desdeque todos os elementos da matriz de escalonamento , S88, es-tão substancialmente em proximidade com relação um ao outro,essa computação, e uma realização, é substituída por umamultiplicação escalar.
As figuras 5 e β mostram arquiteturas de transco-difi cação de laço fechado respectivas exemplares, onde umlaço de realimentação está envolvido. Nessa realização, olaço de realimentação, que inclui a desquantização do VC-1,a transformação inversa do VC-1, a acumulação de erro resi-dual e o MC no erro acumulado, compensa o erro causado peloprocesso de re-quantização do VC-1. O erro de re-quantizaçãoé uma causa principal do erro de flutuação para transcodifi-cadores com redução de taxa de transferência, tal como essemostrado na figura 1. Embora as arquiteturas de transcodifi-cação das figuras 5 e 6 não sejam completamente livres deflutuação, mesmo com compensação de erro, o erro de flutua-ção é muito pequeno. Isso é porque a causa restante do errode flutuação é o erro de arredondamento durante a filtragempor compensação de movimento. Um mérito da compensação deerro residual é que as arquiteturas das figuras 5 e 6 provê-em a ativação ou desativação dinâmica do processo de compen-sação, como descrito abaixo com relação à tabela 2. A arqui-tetura de transcodificação da figura 6 executa a transcodi-ficação com redução de taxa de transferência do MPEG-2 paraWMV tal como a conversão de SD para SD ou HD para HD em umamaneira substancialmente ótima.
Mais particularmente, arquiteturas convencionaisde transcodificador em cascata (por exemplo, as arquiteturasdas figuras 1 e 2) carecem de flexibilidade da complexidade.Com relação a economias de computação, o máximo que tal ar-quitetura .convencional pode atingir é através da reutiliza-ção do MV e mapeamento do modo. Por outro lado, arquiteturasde compensação de erro residual acumuladas, por exemplo, aarquitetura da figura 6 (e as arquiteturas das figuras 8 e10 como descrito abaixo) tem capacidade escalável incorpora-da em termos de complexidade. A tabela 2 mostra significadosexemplares das chaves na figura 6.
TABELA 2
Chaves Exemplares para Controle Dinâmico da Velo-cidade e Qualidade Da Transcodificação<table>table see original document page 20</column></row><table>
Depois que o módulo de transcodificação 408 da fi-gura 4 realizou a simplificação livre de flutuação, uma a-plicação pode dinamicamente trocar entre a complexidade e aqualidade para acelerar a velocidade da transcodificação.
Nessa realização, a qualidade pode ser trocada por velocida-de e vice-versa. Em outras palavras, algum erro de flutuaçãopode ser permitido no transcodificador simplificado adicio-nal. Com essa estratégia, o erro de flutuação introduzido nométodo mais rápido é limitado e totalmente controlável. Combase nessa consideração, três chaves (S0, S1 e S2) são provi-das nas arquiteturas das figuras 6, 8 e 10. As chaves sãousadas somente para as arquiteturas com base em compensaçãodo erro residual. As chaves seletivamente saltam algumas o-perações longas para reduzir a complexidade substancialmen-te, enquanto introduzindo somente uma pequena quantidade deerro. Os significados das várias chaves são resumidos na ta-bela 2. Decisões computacionais associadas com essas chavessão eficientemente obtidas de acordo com critérios descritosabaixo com relação a cada chave.
A chave S0 controla quando um erro de re-quantização de um bloco deve ser acumulado no armazenamentotemporário do erro residual. Quando comparado com um seletorde reconstrução padrão, a função da chave S0 é melhorada a-dotando uma tabela de pesquisa rápida com base no processode re-quantização e provendo um mecanismo de controle deflutuação mais apurado via um algoritmo de limiar triplo.
Como um resultado, todas as observações feitas com relação àchave S0 são consideradas. Por exemplo, em uma realização, adiferença de energia do domínio da DCT pode ser utilizadacomo o indicador.
A chave Si controla quando o modelo mais consumi-dor de tempo, MC do erro residual acumulado. Em uma realiza-ção, a chave Si está acionada. Uma máscara de atividade bi-nária é criada para o quadro de referência. Cada elemento damáscara de atividade corresponde com a atividade de um bloco8x8, como determinado por
<formula>formula see original document page 21</formula>
onde Energia(blocoi) é a energia do bloco no arma-zenamento temporário do erro residual acumulado. Em uma rea-lização, Energia(blocoi) é o domínio espacial calculado oudomínio da DCT. Energia (blocoi) pode ser aproximada pela so-ma dos valores absolutos. Se o MV aponta para os blocos per-tencentes à área de baixa atividade, então o MC do erro re-sidual acumulado para esse bloco específico é saltado.
A chave S2 executa a detecção precoce para deter-minar se o erro do bloco deve ser codificado. Isso é especi-almente útil na translação de aplicações onde o codificadoraplica um tamanho de etapa de quantização mais comum. Nessarealização, se o sinal de entrada (a soma do MC do erro re-sidual acumulado e do resíduo reconstruído do decodificadordo MPEG-2) é mais fraco do que um limiar, então a chave S2 édesativada de modo que nenhum erro será codificado.
Em uma realização, limiares para as chaves S0, S1 eS2 são ajustados tal que quadros de referência mais precocessão processados com maior qualidade e em velocidade maislenta. Isso é porque a finalidade das chaves é atingir umamelhor permuta entre qualidade e velocidade, e por causa danatureza de codificação profética.
Transcodificador de Perfil de Alta Qualidade
Se a mudança da taxa de transferência não é signi-ficativa ou a qualidade da fonte de entrada não é muito al-ta, a arquitetura da figura 6 substancialmente otimiza a re-dução da taxa de transferência quando convertendo fluxos debits de MPEG-2 para os fluxos de bits de WMV. Por outro la-do, a fonte de entrada pode ser de alta qualidade e saída dealta qualidade pode ser desejada, também a velocidade datranscodificação pode ser uma exigência moderada (por exem-plo, em tempo real). Um transcodif icador de perfil de altaqualidade, tal como o transcodificador de domínio de pixelem cascata (CPDT) da figura 3 com o refinamento de MV, sa-tisfaz esses critérios. Com essa arquitetura, nós podemosativar todos os aspectos de codificação avançados do codifi-cador de WMV para garantir que uma eficiência de codificaçãomais elevada possa ser atingida.
Mudança de Resolução
Em sistemas de transcodificação de mídia conven-cionais, existem geralmente três fontes de erros para atranscodificação com escalonamento descendente'de resoluçãoespacial. Esses erros são como segue:
•Escalonamento descendente: erros gerados quando5 obtendo um video escalonado descendentemente. Essa é tipica-mente uma escolha embutida em hardware quando projetando o-perações do filtro de escalonamento descendente para fazeruma troca entre qualidade visual e complexidade, especial-mente quando escalonando descendentemente no domínio espacial.
•Erro de re-quantização: como com o processo detranscodificação com redução de taxa de transferência pura,esse é o erro devido à re-quantização com um tamanho de eta-pa de re-quantização mais comum.
Erro de MV: o MV incorreto levará a previsão er-rada com movimento compensado. Como um resultado, não impor-ta como o erro de re-quantização é compensado e não importaquão alta a taxa de transferência chega, um resultado per-feito é difícil de obter se não recalcular a compensação domovimento com base nos novos MVs e modos. Esse é um problemapara sistemas convencionais que transcodificam quadros B,porque o WMV suporta somente um modo de MV para os quadrosB. Esse poderia também ser um problema se alguém deseja exe-cutar a otimização, que levaria à mudança do modo de codifi-cação, por exemplo, do modo de quatro MVs para um MV. Alémdo mais, o problema geralmente existe para componentes decrominância desde que eles são tipicamente compensados comum único MV. (Esse não é um problema para as arquiteturas detranscodificação de vídeo digital eficientes descritas quan-do aplicadas em quadros P. Uma razão para isso é porque oWMV suporta o modo de codificação de quatro MVs para quadrosP.)
As operações do módulo de transcodificação 408
(figura 4) tratam das duas últimas fontes de erros, como a-gora descrito.
Compensação do Erro de Re-quantização
Deixemos D representar a filtragem de amostrageminferior. Com referência à arquitetura da figura 3, a entra-da para o codificador VC-I para o quadro (i + 1) é derivadacomo segue:
<formula>formula see original document page 24</formula>
Assuma que <formula>formula see original document page 24</formula> Com a
aproximação que
<formula>formula see original document page 24</formula>
A equação 6 é simplificada para o seguinte:
<formula>formula see original document page 24</formula>
O primeiro termo na equação 8, (SÍMBOLO), se refe-re ao processo de escalonamento descendente do sinal residu-al do MPEG-2 decodificado. Esse primeiro termo pode ser de-terminado usando filtragem de banda baixa do domínio espaci-al e dizimação. Entretanto, o uso do escalonamento descen-dente do domínio da DCT para obter esse termo resulta em umaredução da complexidade e melhor PSNR e qualidade visual. Osresultados do escalonamento descendente de domínio da DCTsão substancialmente melhores do que os resultados obtidosatravés da filtragem bilinear do domínio espacial ou filtra-gem de 7 derivações do domínio espacial com coeficientes (-1, 0, 9, 16, 9, 0, -l)/32. Nessa realização, o escalonamentodescendente do domínio da DCT retém somente os coeficientesde DCT de baixa freqüência 4x4 da esquerda superior. Isto é,a aplicação de uma IDCT 4x4 padrão nos coeficientes da DCTretidos resultará em uma imagem espacialmente escalonadadescendentemente de 2:1 (isto é, mídia transcodifiçada 414da figura 4).
O segundo termo na equação 8, (COPIAR), implica nacompensação do erro de re-quantização em uma resolução esca-lonada descendentemente. Nessa realização, o MC no decodifi-cador do MPEG-2 e o MC no decodificador do WMV são interca-lados em um único processo de MC que opera em erros de re-quantização acumulados na resolução reduzida.
A figura 7 mostra uma operação de intercalação e-xemplar de quatro (4) blocos de DCT 4x4 em um bloco de DCT8x8. Uma preocupação prática permanece. No escalonamentodescendente do domínio da DCT, quatro DCT 8x8 (blocos Bi aB4 em um macrobloco (MB) de MPEG-2 na resolução original)são mapeados para os quatro sub-blocos 4x4 de um bloco 8x8do novo MB na resolução reduzida e ainda no domínio da DCT(por exemplo, por favor, ver figura 7). No WMV, para quadrosP e quadros Β, o tipo de transformação de 4x4 é permitido.Como um resultado, nada precisa ser feito a mais exceto oescalonamento acima mencionado. Entretanto, para quadros I,somente o tipo de transformação 8x8 é permitido. Assim,quando lidando com quadros I, o módulo de transcodificação408 (figura 4) converte os quatro sub-blocos de DCT de baixafreqüência 4x4 em um bloco de DCT 8x8: (SÍMBOLO). Em uma re-alização, isso é realizado pela transformação inversa dosquatro sub-blocos de DCT 4x4 de volta para o domínio do pi-xel e a seguir aplicando um VCl-T 8x8 novo. Em uma realiza-ção, e para reduzir a complexidade da computação, isso éfeito no domínio da DCT.
Por exemplo, deixemos (SÍMBOLO) representar osquatro sub-blocos de baixa freqüência 4x4 de Bi, B2, B3 e B4,respectivamente, C4 ser a matriz de transformação de IDCTpadrão 4x4, T8 ser a matriz de transformação do WMV de núme-ro inteiro e adicionalmente deixemos T8 = [TL, TR] onde Tl eTr são matrizes de 8x4. Nesse cenário, (SÍMBOLO) é direta-mente calculado a partir de (SÍMBOLO), usando a seguinte equação:
<formula>formula see original document page 26</formula>
Depois de alguma manipulação, (SÍMBOLO) é mais e-ficientemente calculado como segue:
<formula>formula see original document page 26</formula>onde
C = {TLC\ + TRCA)/2D = {TlC\-TrC\)I 2Y = C(B2 + ê4)±D(B2-ê4)
Em uma realização, ambos C e D da equação acimasão pré-calculados. Os resultados finais são normalizadoscom N88.
A figura 8 mostra uma arquitetura exemplar 800 pa-ra um transcodificador de escalonamento descendente de reso-lução 2:1 numerai do domínio da DCT simplificado. Em uma re-alização, o módulo de transcodificação 408 da figura 4 rea-liza a arquitetura exemplar 800. As chaves nessa arquiteturatêm a mesma funcionalidade que essas na figura 6, como des-crito acima com referência à tabela 2. Côm referência à fi-gura 8, e uma realização, os primeiros dois módulos (VLD doMPEG-2 e quantização inversa) são simplificados quando com-parado com o que é mostrado na figura 6. Isso é porque o mó-dulo de transcodificação 408 recupera somente a porção 4x4da esquerda superior do bloco 8x8.
Comparado com um transcodificador de baixa flutua-ção convencional com compensação de erro de flutuação na re-solução reduzida, os transcodificadores das figuras 6 e 8não incluem um módulo de processamento de bloco misturado.
Isso é porque WMV suporta um modo de intra-codificação parablocos de 8x8 em um macrobloco inter-codifiçado. Em outraspalavras, um intra MB na resolução original é mapeado em umintra bloco de 8x8 de um inter MB na resolução reduzida. Emvista disso, a regra de mapeamento do modo de MB se tornamuito simples, como mostrado imediatamente abaixo:
<formula>formula see original document page 28</formula>
Operações de processamento de bloco misturado e-xistentes tipicamente exigem um laço de decodificação parareconstruir uma imagem de resolução completa. Portanto, aremoção do processamento de bloco misturado provê economiasde computação substanciais quando comparado com os sistemasconvencionais.
A arquitetura de transcodificação de escalonamentodescendente de resolução 2:1 do domínio da DCT simplificada800 é substancialmente isenta de flutuação para quadros P.Isso é um resultado do modo de codificação de quatro MVs. Aúnica causa do erro de flutuação, quando comparado com umaarquitetura de CPDT com filtragem de escalonamento descen-dente, é o arredondamento dos MVs do quarto de resolução pa-ra metade da resolução (que garante que mvmp2 = mvvcl) e apropriedade não comutativa do MC e escalonamento descenden-te. Quaisquer tais erros restantes são insignificantes devi-do à filtragem de escalonamento descendente de banda baixa(por exemplo, realizada no domínio da DCT ou no domínio dopixel).
A figura 9 mostra uma operação de intercalação e-xemplar de quatro blocos de DCT 4x4 em um bloco de DCT 8x8para a mídia de entrelaçamento para operações de transcodi-ficação de escalonamento descendente de resolução espacial2:1, de acordo com uma modalidade. 0 escalonamento descen-dente 2:1 muda a resolução de um quadro original por dois emambas as direções horizontal e vertical. Em uma realização,esse processo de entrelaçamento é realizado pelo módulo detranscodificação 408 da figura 4. Mais particularmente, paraconteúdo codificado do entrelaçamento, o sub-bloco de 8x4esquerdo superior em cada MB é reconstruído pelo decodifica-dor de MPEG-2 de atalho, ambos os campos são aplainados pelofiltro de banda baixa na direção vertical, a seguir um campoé suspenso antes do processo de codificação do WMV.
Compensação de Erro do MV
Embora o WMV suporte quatro modos de codificaçãodo MV, ele é tipicamente somente planejado para codificaçãode quadros P. Como um resultado, o sistema 400 (figura 4)realiza a arquitetura da figura 6 quando não existem quadrosB no fluxo do MPEG-2 de entrada ou os quadros B devem serdescartados durante o transcodificador para uma resoluçãotemporal inferior. Uma razão para isso é que o WMV permitesomente um MV por MB para quadros B. Em um tal cenário, omódulo de transcodificação 408 (figura 4) compõe um novo ve-tor de movimento dos quatro MVs associados com os MBs na re-solução original. Cada um dos métodos de composição do MVpreviamente mencionado é compatível. Em uma realização, omódulo de transcodificação 408 realiza a filtragem mediana.Como descrito, o MV incorreto levará a predição errada commovimento compensado. Para tornar as coisas piores, não im-porta como o erro de re-quantização é compensado e não im-porta quão alta a taxa de transferência atinja, resultadosperfeitos são difíceis para obter se não refizer a compensa-ção do movimento com base nos novos MVs. Portanto, nós pro-vemos uma arquitetura que permite que tais erros de movimen-to sejam compensados.
Novamente, com referência à arquitetura da figura3, a entrada para o codificador do VC-I para o quadro (i+1),que é assumido como sendo um quadro B, é derivada como segue:
<formula>formula see original document page 30</formula>
com a aproximação que
<formula>formula see original document page 30</formula>
A equação 9 é simplificada para
<formula>formula see original document page 30</formula>
Em vista da equação 11, o seguinte é obtido:
<formula>formula see original document page 30</formula>Os dois termos nos colchetes quadrados na equação12 compensam os erros de movimento causados pelos MVs incon-sistentes (isto é, mvmp2 é diferente de mvvci) ou causados pe-los métodos de filtragem de MC diferentes entre o MPEG-2 e oWMV. Os módulos correspondentes para essa finalidade são e-videnciados e agrupados em um bloco amarelo claro na figura 10.
A figura 10 mostra uma arquitetura de transcodifi-cador de escalonamento descendente simplificada 2:1 exemplarcom compensação de flutuação completa, de acordo com uma mo-dalidade. Em uma realização, o módulo de transcodificação408 da figura 4 realiza a arquitetura exemplar da figura 10.Com referência à equação 12, por favor, observe que (COPIAR)é executado para todos os blocos 8x8 que correspondem com osinter MBs originais, e mvmp2 = MVmp2/2 com a precisão do quar-to de pixel. O MV usado no codificador do VC-I é um únicoMV:mvvci = mediano (MVmp2)/2. Observe que com relação ao módulode compensação de erro de movimento, a precisão de mvvci podeavançar para o nivel do quarto de pixel. 0 último termo naequação 12 compensa o erro de re-quantização dos quadros dereferência. Desde que os quadros B não são uma referênciapara outros quadros, eles são mais tolerantes ao erro. Comoum resultado, uma aplicação pode desativar, com segurança, acompensação do erro para obter maior velocidade. Novamente,tal aproximação é planejada para quadros B somente. Por fa-vor, observe que o MC para a compensação de erro do movimen-to opera em armazenamentos temporários de pixel reconstruídoenquanto o MC para a compensação do erro de re-quantizaçãoopera em armazenamento temporário de erro residual acumulado.
Quanto ao MC, a conversão de intra para inter ouinter para intra pode ser aplicada. Isso é porque o decodi-ficador do MPEG-2 reconstruiu o quadro B e os quadros de re-ferência. Nessa realização, essa conversão é feita no módulode processamento de bloco misturado na figura 10. Dois méto-dos de composição de modo são possíveis. E uma realização, omodo dominante é selecionado como o modo composto. Por exem-plo, se os modos dos quatro MBs na resolução original sãodois modos de predição bidirecional, um modo de predição in-verso e um modo de predição direto, então o modo de prediçãobidirecional é selecionado como o modo para o MB na resolu-ção reduzida. Em uma outra realização, o modo que levará aomaior erro é selecionado. Em vista desse exemplo, suponhaque usar o modo inverso causará o maior erro. Nesse cenário,o modo inverso é escolhido tal que o erro pode ser compensa-do. Os resultados mostram que a última técnica oferece qua-lidade ligeiramente melhor quando comparada com a técnica deseleção de modo anterior.
Uma arquitetura exemplar de acordo com a equação12 é mostrada na figura 10. Existem quatro chaves do nívelde quadro especificamente para essa arquitetura, como mos-trado na tabela 3.
TABELA 3
Chaves de nível de quadro exemplares
<image>image see original document page 32</image><table>table see original document page 33</column></row><table>
As quatro chaves de nivel de quadro garantem tra-jetórias de codificação diferentes para tipos diferentes dequadro. Especificamente, a arquitetura não executa: a acumu-lação de erro residual para quadros B (Sip) , não executacompensação de erro do MV para os quadros IeP (Sb) e nãoreconstrói quadros de referência se não existem quadros Bpara serem gerados (SIP/B) · Por favor, observe que a chave donivel de quadro Sb pode ser transformada em chave do nivelde bloco desde que o erro do MV precisa ser compensado so-mente quando os quatro MVs originais correspondentes sãosignificativamente inconsistentes .
Mais particularmente, a chave Sip é fechada somentepara quadros I ou quadros P, a chave Sp é fechada somentepara os quadros Pea chave Sb é fechada somente para osquadros Β. A arquitetura resultante não é tão complexa quan-to o transcodificador de domínio do pixel em cascata de re-ferência da figura 3. Uma razão para isso é que o processode escalonamento descendente do domínio de pixel explícito éevitado. No lugar disso, o escalonamento descendente do do-mínio do pixel é implicitamente realizado no domínio da DCTsimplesmente descartando os altos coeficientes da DCT. Essaarquitetura tem excelente capacidade escalável da complexi-dade realizada pela utilização de várias chaves, como des-crito acima com relação à tabela 2.
Para aplicações que exigem velocidade de transco-dificação ultra-rápida, a arquitetura da figura 10 pode serconfigurada em um laço aberto ou pela desativação de todasas chaves. Essa arquitetura de laço aberto, pode ser tambémotimizada pela intercalação do processo de desquantização doMPEG-2 e o processo de re-quantização do WMV. O módulo devarredura em zigue-zague inverso (dentro do VLD) do MPEG-2pode também ser combinado com o no codificador do WMV.
Componentes de Crominância
Com relação aos componentes de crominância noMPEG-2, e no WMV, o MV e o modo de codificação dos componen-tes de crominância (UV) são derivados desses do componentede luminância (Y). Se todos os quatros MBs na resolução ori-ginal que correspondem com o MB na resolução reduzida têmmodo de codificação consistente (isto é, todos inter-codificados ou todos intra-codifiçados) , não existe proble-ma. Entretanto, se esse não é o caso, problemas resultam de-vido às regras de derivação diferentes do MPEG-2 e WMV. NoMPEG-2, os blocos de UV são inter codificados quando o MB écodificado com o inter modo. Entretanto, no WMV, os blocosde UV são inter codificados somente quando o MB é codificadocom o inter modo e existe menos do que três blocos 8x8 in-tra-codif içados. Essa preocupação existe para ambos os qua-dros P e quadros Β. 0 módulo de transcodificação 408 da fi-gura 4 trata desses problemas como segue:
Conversão inter para intra: quando o MB inter-codificado tem três blocos Y 8x8 intra-codifiçados (é impos-sível para um MB inter-codifiçado ter todos os quatro blocosY 8x8 intra codificados), os blocos de UV são intra codifi-cados. Nesse caso, um MB na resolução original é inter-codificado junto com blocos de UV correspondentes. Essesblocos de UV serão convertidos do inter modo para o intramodo. Desde que o sistema visual humano (HVS) é menos sensí-vel aos sinais de crominância, o módulo de transcodificação408 utiliza uma técnica de encobrimento espacial para con-verter os blocos de UV 8x8 do modo inter para o intra. Emuma realização, a distância DC é utilizada como um indicadorpara determinar a direção do encobrimento. 0 encobrimento éatingido via uma cópia simples ou qualquer outro método deinterpolação.
Conversão de intra para inter: quando um MB inter-codificado tem um ou dois blocos Y 8x8 intra-codifiçados, omódulo de transcodificação 408 inter-codifica os blocos deUV. Nesse cenário, existe um ou dois MBs intra-codifiçadosentre os quatro MBs correspondentes na resolução original.Esses blocos de UV são convertidos do modo intra para o modointer. Nessa realização, o módulo de transcodificação 408utiliza uma técnica de encobrimento temporal chamada o méto-do de zerar para lidar com esses blocos, e dessa maneira,evitar o laço de decodificação.
Usando as operações de encobrimento de erro paralidar com a conversão de modo para o componente de crominân-cia, o erro introduzido em um quadro atual é insignificantee pode ser ignorado, embora ele possa causar flutuação decor em quadros subseqüentes. A flutuação para o componentede crominância é tipicamente causada pelo movimento incorre-to. Para tratar isso e melhorar a qualidade, em uma realiza-ção, o módulo de transcodificação 408 usa a compensação combase na reconstrução para o componente de crominância (istoé, sempre aplicando o módulo amarelo claro para o componentede crominância).
Controle de Taxa
A figura 11 mostra um modelo de armazenamento tem-porário do verificador de armazenamento temporário virtualexemplar (VBV) para um decodificador. Um decodificador combase no modelo VBV da figura 11 tipicamente verificará umfluxo de bits de MPEG-2 existente. Nessa realização, se ataxa de video é diminuída proporcional à taxa de entrada,então o fluxo de bits de WMV transcodifiçado automaticamentesatisfará as exigências de VBV. Em vista disso, a arquitetu-ra de transcodificação de vídeo digital eficiente desse re-latório descritivo torna o tamanho do quadro codificado pro-porcional ao tamanho do quadro de entrada para todos os qua-dros. Essas novas arquiteturas continuamente compensam asdiferenças acumuladas entre o tamanho do quadro alvo e o ta-manho do quadro resultante real, e obtém, via treinamento, uma regra de mapeamento da etapa de quantização (QP) linearpara faixas de taxa de transferência diferentes.
Para alta taxa de transferência, existe uma fórmu-la aproximada entre os bits de codificação (B) e a etapa dequantização (QP) que é também usada no método de controle detaxa TM-5 do MPEG-2.
<formula>formula see original document page 37</formula>
onde S é a complexidade do quadro, X é parâmetrosde modelo. Assumindo que a complexidade de um quadro perma-nece a mesma para codecs diferentes:
<formula>formula see original document page 37</formula>
onde QPvel é o valor de QP usado na re-quantizaçãodo WMV, QPmp2 é o valor de QP da quantização do MPEG-2 e k éo parâmetro do modelo relacionado com a taxa de transferên-cia alvo. Em uma realização, o seguinte modelo linear é utilizado:
<formula>formula see original document page 37</formula>
Os valores dos parâmetros k e t para casos de bai-xa, média e alta taxa de transferência são listados na tabe-la 4 usando o método de regressão linear.
TABELA 4
VALORES DE PARÂMETRO EXEMPLARES PARA A METODOLOGIADE REGRESSÃO LINEAR<table>table see original document page 38</column></row><table>
Um algoritmo de controle de taxa detalhado exemplar com basena equação 14 é mostrado na tabela 5, onde os significadosdos vários símbolos do algoritmo apresentado na tabela 5 sãodefinidos na tabela 6 seguinte.
TABELA 5
<table>table see original document page 38</column></row><table>
TABELA 6
DEFINIÇÕES DE SÍMBOLOS USADOS NO ALGORITMO DATABELA 5<table>table see original document page 39</column></row><table>
Mudança de Resolução Arbitrariamente
A conversão dos conteúdos de resolução de HD pararesolução de SD, por exemplo, para suportar recepto-res/reprodutores de SD legados é útil. Resoluções típicas doformato HD são 1920xl080i e 1280x720p enquanto essas para SDsão 720x480i, 720x480p para NTSC. As razões de escalonamentodescendente horizontal e vertical de 1920xl080i para720x480i são 8/3 e 9/4, respectivamente. Para manter a rela-ção entre os eixos, a razão do escalonamento descendente fi-nal é escolhida para ser 8/3 e o tamanho da imagem resultan-te é 720x404. Similarmente, para 1280x720p a 720x480p, a ra-zão do escalonamento descendente é escolhida para ser 16/9 eo tamanho da imagem resultante é 720x404. Títulos pretos sãoinseridos para fazer uma imagem de 720x480 completa pelo de-codificador/reprodutor (ao invés de ser preenchido no fluxode bits).
De acordo com a teoria de processamento do sinaldigital, uma metodologia de escalonamento descendente subs-tancialmente ótima para uma razão de escalonamento descen-dente m/n, seria primeiro amostrar superiormente o sinal porη vezes (isto é, inserir n-1 zeros entre cada amostra origi-nal), aplicar um filtro de banda baixa (por exemplo, umafunção de sincronismo com muitas derivações) e a seguir de-cimar o sinal resultante por m vezes. Executando tais opera-ções, qualquer serrilhado do espectro introduzido pelo esca-lonamento descendente seria maximamente suprimido. Entretan-to, esse processo também seria muito caro do ponto de vistacomputacional e dificil para executar em tempo real porque osinal de entrada é de alta definição. Para reduzir essa com-plexidade computacional, uma nova estratégia de escalonamen-to descendente de dois estágios é realizada.
A figura 12 mostra um transcodificador com escalo-namento descendente de resolução arbitrariamente espacial,de acordo com uma modalidade. Em uma realização, o módulo detranscodificação 408 da figura 4 realiza a arquitetura dafigura 12. Em uma realização, o transcodificador de escalo-namento descendente arbitrário é um transcodificador não in-tegrado, tal como na figura 12. Em uma outra realização, asoperações de transcodificação de escalonamento descendentearbitrárias seguintes, que são descritas abaixo com relaçãoà figura 12, são realizadas em um transcodificador integradotal como esse mostrado nas figuras 5, 6, 8 e/ou 10.
Com referência à figura 12, o sistema 1200 executaas operações de escalonamento descendente de dois estágiospara atingir qualquer alvo de escalonamento descendente ar-bitrário. Os resultados do escalonamento descendente do pri-meiro estágio são embutidos no laço de decodificação. Issoreduz a complexidade das operações de decodificação. Por e-xemplo, para obter uma razão de escalonamento descendente de8/3, as operações de escalonamento descendente são executa-das primeiro para escalonar descendentemente por 2/1. Os re-sultados desse escalonamento descendente do primeiro estágiosão inseridos no laço de decodificação, onde o escalonamentodescendente do segundo estágio é executado no domínio espa-ciai. Nesse exemplo, as operações de escalonamento descen-dente do segundo estágio escalonam descendentemente por 4/3para obter uma razão de escalonamento descendente.de 8/3. Emum outro exemplo, uma razão de escalonamento descendente de16/9 é obtida pelo sistema 1200 aplicando o escalonamentodescendente de 4/3 duas vezes (em dois estágios). Essa meto-dologia de escalonamento descendente de dois estágios utili-za a estratégia de escalonamento descendente do domínio daDCT previamente discutida e a seguir embute totalmente osresultados do escalonamento descendente do primeiro estágiono laço de decodificação. Desde que a resolução é significa-tivamente reduzida depois do escalonamento descendente doprimeiro estágio, nós podemos continuar a aplicar o métodode escalonamento descendente ótimo no domínio do pixel.
são associados com um novo MB (os módulos de esca-lonamento e filtragem de MV).
Procedimento Exemplar
Com referência à figura 12, por favor, observe quemúltiplos MVsA figura 13 ilustra um procedimento 1300 paratranscodificação de video digital eficiente de acordo comuma modalidade. Em uma realização, o módulo de transcodifi-cação 408 da figura 4 executa as operações do procedimento1300. Com referência à figura 13, no bloco 1302, o procedi-mento recebe um fluxo de bits codificado (por exemplo, midiacodificada 412 da figura 4) . No bloco 1304, o procedimentoparcialmente decodifica o fluxo de bits codificado de acordocom um primeiro conjunto de técnicas de compactação associa-das com um primeiro formato de dados de midia (por exemplo,MPEG-2, MPEG-4, etc.). As operações de decodificação parci-ais geram um fluxo de dados intermediário. 0 transcodifica-dor integrado não executa a decodificação completa. Por e-xemplo, nos casos onde o MC do decodificador de MPEG-2 "con-ceitual" é intercalado com esse do codificador do WMV, é di-fícil descrever as operações de decodificação quando execu-tando a decodificação do MPEG-2. No bloco 1306, se o escalo-namento descendente do fluxo de dados intermediário é dese-jado, o procedimento escalona descendentemente os dados as-sociados com o fluxo de bits codificado em um primeiro está-gio do escalonamento descendente. 0 primeiro estágio do es-calonamento descendente é implementado no domínio da DCT deum laço de decodificação. No bloco 1308, se o escalonamentodescendente de dois estágios é desejado, o procedimento tam-bém escalona descendentemente no domínio espacial os dadosque foram escalonados descendentemente no domínio da DCT(ver bloco 1306).
No bloco 1310, os dados decodificados de acordocom o primeiro conjunto de técnicas de compactação são codi-ficados com um segundo conjunto de técnicas de compactação.
Em uma realização, o procedimento 1300 é executado dentro deuma arquitetura de transcodificação não integrada, tal comoessa mostrada e descrita com relação às figuras 12 e 14.
Nessa realização, o segundo conjunto de técnicas de compac-tação é o mesmo que o primeiro conjunto de técnicas de com-pactação. Em uma outra realização, o procedimento 1300 é e-xecutado dentro de uma arquitetura de transcodificação inte-grada, tal como essa mostrada e descrita com relação às fi-guras 5-11 e 14. Nessa outra realização, o segundo conjuntode técnicas de compactação não é o mesmo que o primeiro con-junto de técnicas de compactação. Por exemplo, em uma reali-zação, o primeiro conjunto de técnicas de compactação estáassociado com o MPEG-2 e o segundo conjunto de técnicas decompactação está associado com o WMV.
Um Ambiente de Operação Exemplar
A figura 14 ilustra um exemplo de um ambiente decomputação adequado no qual a transcodificação de video di-gital efic iente pode ser total ou parcialmente executada. Oambiente de computação exemplar 1400 é somente um exemplo deum ambiente de computação adequado para o sistema exemplar400 da figura 4, e não é planejado para sugerir qualquer li-mitação quanto ao escopo de uso ou funcionalidade dos siste-mas e métodos descritos aqui. Nem deve o ambiente de compu-tação 1400 ser interpretado como tendo qualquer dependênciaou exigência relacionada com qualquer um ou combinação decomponentes ilustrados no ambiente de computação 1400.Os métodos e sistemas descritos aqui são operacio-nais com numerosos outros sistemas de computação, ambientesou configurações de uso especial ou uso geral. Exemplos desistemas de computação, ambientes e/ou configurações bem co-nhecidos que podem ser adequados para uso incluem, mas nãosão limitados a computadores pessoais, computadores servido-res, sistemas de multiprocessador, sistemas com base em mi-croprocessador, PCs de rede, minicomputadores, computadoresde grande porte, ambientes de computação distribuídos queincluem qualquer um dos sistemas ou dispositivos acima e as-sim por diante. Versões compactas ou de subconjunto da es-trutura podem também ser realizadas em clientes de recursoslimitados, tal como computadores de mão ou outros dispositi-vos de computação. A invenção é praticada em um ambiente decomputação de rede onde as tarefas são executadas por dispo-sitivos de processamento remoto que são ligados através deuma rede de comunicações.
Com referência à figura 14, um sistema exemplarprovendo arquitetura de transcodificação de vídeo digitaleficiente inclui um dispositivo de computação de uso geralna forma de um computador 1410 executando, por exemplo, ope-rações iniciadoras associadas com o dispositivo de computa-ção 102 da figura 1. Componentes do computador 1410 podemincluir, mas não são limitados a, unidade(s) de processamen-to 1418, uma memória do sistema 1430 e um barramento do sis-tema 1421 que une vários componentes do sistema incluindo amemória do sistema na unidade de processamento 1418. O bar-ramento do sistema 1421 pode ser qualquer um de vários tiposde estruturas de barramento incluindo um barramento de memó-ria ou controlador de memória, um barramento periférico e umbarramento local usando qualquer uma de uma variedade de ar-quiteturas de barramento. Por meio de exemplo, e não limita-ção, tais arquiteturas incluem barramento da arquitetura pa-drão industrial (ISA), barramento da arquitetura de microcanal (MCA), barramento ISA aperfeiçoado (EISA), barramentolocal da associação dos padrões eletrônicos de video (VESA)e barramento de interligação de componente periférico (PCI)também conhecido como barramento Mezanino.
um computador 1410 tipicamente inclui uma varieda-de de meios legíveis pelo computador. Meios legíveis pelocomputador podem ser quaisquer meios disponíveis que possamser acessados pelo computador 1410, incluindo ambos os meiosvoláteis e não voláteis, meios removíveis e não removíveis.Por meio de exemplo, e não limitação, meios legíveis porcomputador podem compreender meios de armazenamento no com-putador e meios de comunicação. Meios de armazenamento nocomputador incluem ambos meios voláteis e não voláteis, re-movíveis e não removíveis implementados em qualquer métodoou tecnologia para armazenamento de informação tais comoinstruções legíveis pelo computador, estruturas de dados,módulos do programa ou outros dados. Meios de armazenamentono computador incluem, mas não são limitados a, RAM, ROM,EEPR0M, memória flash ou outra tecnologia de memória, CD-ROM, discos versáteis digitais (DVD) ou outro armazenamentode disco ótico, cassetes magnéticos, fita magnética, armaze-namento de disco magnético ou outros dispositivos de armaze-namento magnético ou qualquer outro meio que possa ser usadopara armazenar a informação desejada e que possa ser acessa-do pelo computador 1410.
Meios de comunicação tipicamente personificam ins-truções legíveis pelo computador, estruturas de dados, módu-los do programa ou outros dados em um sinal de dados modula-do tal como uma onda portadora ou outro mecanismo de trans-porte e incluem quaisquer meios de entrega de informação. Otermo "sinal de dados modulado" significa um sinal que temuma ou mais de suas características ajustadas ou mudadas emuma tal maneira de modo a codificar a informação no sinal.Por meio de exemplo, e não limitação, meios de comunicaçãoincluem meios ligados por fio tal como uma rede ligada porfio ou conexão ligada por fio direta e meios sem fio tais como meios sem fio acústicos, de RF, de infravermelho e ou-tros. Combinações de qualquer um dos acima devem também serincluídas dentro do escopo de meios legíveis por computador.
A memória do sistema 1430 inclui meios de armaze-namento no computador na forma de memória volátil e/ou nãovolátil tais como memória somente de leitura (ROM) 1431 ememória de acesso aleatório (RAM) 1432. Um sistema básico deentrada/saída 1433 (BIOS), contendo as rotinas básicas queajudam a transferir a informação entre elementos dentro docomputador 1410, tal como durante a partida, é tipicamente armazenado na ROM 1431. A RAM 1432 tipicamente contém dadose/ou módulos de programa que são imediatamente acessíveispara e/ou atualmente sendo operados pela unidade de proces-samento 1418. Por meio de exemplo, e não limitação, a Figura14 ilustra o sistema operacional 1434, programas aplicativos1435, outros módulos de programa 1436 e dados do programa1437.
O computador 1410 pode também incluir outros meiosde armazenamento no computador removiveis/não removíveis,voláteis/não voláteis. Por meio de exemplo somente, a Figura14 ilustra uma unidade de disco rígido 1441 que lê de ou es-creve nos meios magnéticos não removíveis, não voláteis, umaunidade de disco magnético 1451 que lê de ou escreve em umdisco magnético removível não volátil 1452 e uma unidade dedisco ótico 1455 que lê de ou escreve em um disco ótico re-movível, não volátil 1456 tal como um CD-ROM ou outros meiosóticos. Outros meios de armazenamento no computador removí-veis/não removíveis, voláteis/não voláteis que podem ser u-sados no ambiente operacional exemplar incluem, mas não sãolimitados a, cassetes de fita magnética, placas de memóriaflash, discos versáteis digitais, fita de vídeo digital, RAMde estado sólido, ROM de estado sólido e assim por diante. Aunidade de disco rígido 1441 é tipicamente conectada no bar-ramento do sistema 1421 através de uma interface de memórianão removível tal como a interface 1440 e a unidade de discomagnético 1451 e a unidade de disco ótico 1455 são tipica-mente conectadas no barramento do sistema 1421 por uma in-terface de memória removível, tal como a interface 1450.
As unidades e seus meios de armazenamento no com-putador associados, discutidos acima e ilustrados na Figura14, provêem armazenamento das instruções legíveis por compu-tador, estruturas de dados, módulos do programa e outros da-dos para o computador 1410. Na Figura 14, por exemplo, a u-nidade de disco rígido 1441 é ilustrada como armazenando osistema operacional 1444, programas aplicativos 1445, outrosmódulos de programa 1446 e dados do programa 1447. Observeque esses componentes podem ser os mesmos que ou diferentesdo sistema operacional 1434, programas aplicativos 1435, ou-tros módulos do programa 1436 e dados do programa 1437. Osistema operacional 1444, programas aplicativos 1445, outrosmódulos do programa 1446 e dados do programa 1447 são forne-cidos com números diferentes aqui para ilustrar que eles sãopelo menos cópias diferentes.
Um usuário pode inserir comandos e informação nocomputador 1410 através de dispositivos de entrada tais comoum teclado 1462 e um dispositivo de indicação 1461, geral-mente citado como um mouse, trackball ou base sensível aotoque. Outros dispositivos de entrada (não mostrados) podemincluir um microfone, barra de direção, caneta gráfica e ba-se, disco de satélite, scanner, etc. Esses e outros disposi-tivos de entrada são freqüentemente conectados na unidade deprocessamento 1418 através de uma interface de entrada dousuário 1460 que é acoplada no barramento do sistema 1421,mas pode ser conectada por outra interface e estruturas debarramento, tais como uma porta paralela, porta de jogos ouum barramento serial universal (USB). Nessa realização, ummonitor 1491 ou outro tipo de dispositivo de interface dousuário é também conectado no barramento do sistema 1421 a-través de uma interface, por exemplo, tal como uma interfacede vídeo 1490.O computador 1410 opera em um ambiente de rede u-sando conexões lógicas para um ou mais computadores remotos,tal como um computador remoto 1480. Em uma realização, ocomputador remoto 1480 representa o dispositivo de computa-ção 106 de um responder, como mostrado na figura 1. 0 compu-tador remoto 1480 pode ser um computador pessoal, um servi-dor, um roteador, um PC de rede, um dispositivo par ou outronó de rede comum, e como uma função de sua realização parti-cular, pode incluir muitos ou todos os elementos descritosacima em relação ao computador 1410, embora somente um dis-positivo de armazenamento de memória 1481 tenha sido ilus-trado na Figura 14. As conexões lógicas representadas na Fi-gura 14 incluem uma rede local (LAN) 1481 e uma rede remota(WAN) 1473, mas pode também incluir outras redes. Tais ambi-entes de rede são comuns em escritórios, redes de computadorempresariais, intranets e na Internet.
Quando usado em um ambiente de rede LAN, o compu-tador 1410 é conectado na LAN 1471 através de uma interfacede rede ou adaptador 1470. Quando usado em um ambiente derede WAN, o computador 1410 tipicamente inclui um modem 1472ou outro dispositivo para estabelecer as comunicações atra-vés da WAN 1473, tal como a Internet. O modem 1472, que podeser interno ou externo, pode ser conectado no barramento dosistema 1421 através da interface de entrada do usuário 1460ou outro mecanismo apropriado. Em um ambiente de rede, módu-los do programa representados em relação ao computador 1410,ou porções do mesmo, podem ser armazenados no dispositivo dearmazenamento de memória remoto. Por meio de exemplo, e nãolimitação, a Figura 14 ilustra programas aplicativos remotos1485 como residindo no dispositivo de memória 1481. As cone-xões de rede mostradas são exemplares e outros modos de es-tabelecimento de uma ligação de comunicações entre os compu-tadores podem ser usados.
Conclusão
Embora as seções acima descrevam arquiteturas detranscodificação de video digital eficientes na linguagemespecifica para aspectos estruturais e/ou operações metodo- lógicas ou ações, as realizações definidas nas reivindica-ções anexas não são necessariamente limitadas aos aspectosou ações específicos descritos. De preferência, os aspectose operações específicos da arquitetura de transcodificaçãode vídeo digital integrada eficiente descrita são reveladoscomo formas exemplares de executar a matéria exposta reivin-dicada .
Por exemplo, em uma realização, os sistemas e me-todologias de transcodificação rápidos e de alta qualidadedescritos, incluindo transcodificação, escalonamento descen- dente dimensionado arbitrário e redução de taxa são usadospara transcodificação de MPEG-2 para MPEG-4 e transcodifica-ção de MPEG-4 para WMV. Por exemplo, o transcodificador dedomínio de DCT de laço fechado simplificado na figura 6 podeser usado para transcodificar MPEG-4 para WMV. Uma diferença entre MPEG-2 (IS-13818 parte 2) é que o MPEG-2 somente uti-liza precisão de MV de elemento de meio pixel (pel) e a in-terpolação bilinear no MC; existe um tal mesmo modo (meiopel bilinear) no WMV. Entretanto, MPEG-4 suporta ambos aprecisão do MV de meio pel e um quarto de pel, bem como ainterpolação para posições de um quarto de pel (diferentedessa no WMV). Para cuidar dessa diferença, quando MV de 1/2pel é usado pelo video MPEG-4, então o processo de transco-dificação é o mesmo que o MPEG-2 para transcodificação doWMV, como descrito acima. Adicionalmente, quando MV de 1/4pel está contido no video do MPEG-4, então o erro é introdu-zido devido aos diferentes métodos de interpolação no MC co-mo descrito acima com relação à figura 6. Adicionalmente, otranscodificador de escalonamento descendente 2:1 simplifi-cado com compensação de flutuação completa descrito acimacom relação à figura 10 é aplicável para a transcodificaçãoreduzida de 2:1 do MPEG-4 para WMV independente da mudança.
Além do mais, transcodificação de alta qualidade, incluindoa redução de taxa acima descrita e operações de transcodifi-cação arbitrariamente de escalonamento descendente da figura12 são efetivas para transcodificação de MPEG-4 para WMV.

Claims (20)

1. Método executado em computador, CARACTERIZADOpelo fato de que compreende:receber, por um transcodificador integrado, umfluxo de bits codificado etranscodificar, pelo transcodificador integrado, ofluxo de bits codificado como segue:parcialmente decodificar, pelo transcodificadorintegrado, o fluxo de bits codificado para gerar um fluxo dedados intermediário, o fluxo de bits codificado sendo codi-ficado com um primeiro conjunto de técnicas de compactaçãoassociadas com o primeiro formato de midia edecodificar, pelo transcodificador integrado, ofluxo de dados intermediário usando um segundo conjunto detécnicas de compactação para gerar um fluxo de bits transco-dificado, o segundo conjunto de técnicas de compactação cor-respondendo com o segundo formato de midia.
2. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o primeiroformato de midia é MPEG-2 e onde o segundo formato de midiaé WMV.
3. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o primeiroformato de midia é MPEG-2 e onde o segundo formato de midiaé MPEG-4.
4. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o transcodi-ficador integrado é um transcodificador de laço fechado queimpede a propagação do erro via compensação de erro apropri-ada .
5. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o transcodi-ficador integrado é um transcodificador de laço aberto quenão impede a propagação do erro.
6. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que o transcodi-ficador integrado intercala a primeira e a segunda transfor-mações respectivamente associadas com o primeiro e o segundoformatos de midia em um componente de escalonamento .
7. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que a transcodi-ficação também compreende dinamicamente ativar ou desativaruma ou mais operações associadas com a compensação de erroresidual para respectivamente aumentar a qualidade ou a ve-locidade da transcodificação.
8. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que a transcodi-ficação executa compensação de erro residual e onde a trans-codif icação também compreende:responsiva à determinação que quadros de referên-cia anteriores estão sendo processados, dinamicamente ajus-tar uma ou mais operações para transcodificar os quadros dereferência anteriores com alta qualidade e baixa velocidadeeonde as operações compreendem a acumulação de errode re-quantização de bloco, compensação de movimento do erroacumulado e detecção precoce para determinar se um blocoparticular é para ser um codificado.
9. Método executado em computador, de acordo com areivindicação 1, CARACTERIZADO pelo fato de que a transcodi-ficação executa compensação do erro residual, e onde atranscodificação também compreende um ou mais de:responsiva a um mecanismo de controle de flutuaçãocom base no limiar, dinamicamente ativar ou desativar a acu-mulação do erro de re-quantização do bloco em um armazena-mento temporário de erro residual,responsiva a uma avaliação da atividade do bloco,dinamicamente ativar ou desativar a compensação do movimentodo erro acumulado no armazenamento temporário do erro resi-dual eresponsiva a uma determinação com base em uma somado erro residual acumulado pela compensação de movimento eresíduo reconstruído da decodificação parcial, dinamicamenteativar ou desativar a detecção precoce para determinar se obloco é para ser codificado.
10. Método executado em computador, de acordo coma reivindicação 1, CARACTERIZADO pelo fato de que parcial-mente decodificar também compreende:executar o controle de taxa com um tamanho de qua-dro codificado proporcional a um tamanho de quadro de entra-da para todos os quadros eonde o controle de taxa provê compensação continu-ada para diferenças acumuladas entre um tamanho de quadroalvo e um tamanho de quadro resultante real.
11. Método executado em computador, de acordo coma reivindicação 1, CARACTERIZADO pelo fato de que tambémcompreende:descartar altos coeficientes de transformação doco-seno discreto (DCT) para escalonar descendentemente ofluxo de dados intermediário em um domínio da DCT eonde o escalonamento descendente do domínio do pi-xel explícito não é executado.
12. Método executado em computador, de acordo coma reivindicação 1, CARACTERIZADO pelo fato de que transcodi-ficar também compreende escalonar descendentemente um blocodo fluxo de bits codificado pela reconstrução de uma imagemde resolução completa do fluxo de bits codificado indepen-dente do processamento de bloco misturado e um laço de deco-dificação correspondente.
13. Método executado em computador, de acordo coma reivindicação 1, CARACTERIZADO pelo fato de que transcodi-ficar também compreende executar operações de escalonamentodescendente de dois estágios para obter uma razão alvo deescalonamento descendente arbitrária.
14. Método executado em computador, de acordo coma reivindicação 13, CARACTERIZADO pelo fato de que as opera-ções de escalonamento descendente de dois estágios tambémcompreendem:efetuar operações de escalonamento descendente deprimeiro estágio em um laço de decodificação de domínio daDCT eexecutar operações de escalonamento descendente desegundo estágio fora do laço de decodificação em um domíniodo pixel.
15. Método executado em computador, de acordo coma reivindicação 13, CARACTERIZADO pelo fato de que as opera-ções de escalonamento descendente de dois estágios tambémcompreendem:executar operações de escalonamento descendente deprimeiro estágio para obter um primeiro resultado que é in-termediário à razão alvo do escalonamento descendente arbi-trária,inserir o primeiro resultado em um laço de decodi-ficação eefetuar operações de escalonamento descendente desegundo estágio em um domínio espacial para obter a razãoalvo de escalonamento descendente arbitrária.
16. Método executado em computador, CARACTERIZADOpelo fato de que compreende:transcodificar, por um transcodificador integrado,um fluxo de bits codificado como segue:parcialmente decodificar, pelo transcodificadorintegrado, o fluxo de bits codificado para gerar um fluxo dedados intermediário, o fluxo de bits codificado sendo codi-ficado com um primeiro conjunto de técnicas de compactaçãoassociadas com o primeiro formato de mídia,codificar, pelo transcodificador integrado, o flu-xo de dados intermediário usando um segundo conjunto de téc-nicas de compactação para gerar um fluxo de bits transcodi-ficado, a segunda transformação correspondendo com o segundoformato de mídia eonde o transcodificador integrado intercala a pri-meira e a segunda transformações respectivamente associadascom o primeiro e o segundo formatos de mídia em um componen-te de escalonamento .
17. Método executado em computador, de acordo coma reivindicação 16, CARACTERIZADO pelo fato de que o primei-ro formato de mídia é MPEG-2 e onde o segundo formato de mí-dia é WMV.
18. Método executado em computador, de acordo coma reivindicação 16, CARACTERIZADO pelo fato de que a trans-codif icação também compreende:dinamicamente ativar ou desativar uma ou mais ope-rações associadas com a compensação de erro residual pararespectivamente aumentar a qualidade ou a velocidade datranscodificação eonde a uma ou mais operações são alternadamenteativadas ou desativadas com base em um ou mais do seguinte:um mecanismo de controle de flutuação com base no limiar,avaliação dos níveis de atividade do bloco euma soma de erro residual acumulado pela compensa-ção do movimento e resíduo reconstruído das operações de de-codificação.
19. Método executado em computador, de acordo coma reivindicação 16, CARACTERIZADO pelo fato de que tambémcompreende:escalonar descendentemente os dados associados como fluxo de bits codificado em um domínio da DCT de um laçode decodificação ouescalonar descendentemente os dados em um processode escalonamento descendente de dois estágios, o processo deescalonamento descendente de dois estágios compreendendo:escalonar descendentemente, em um primeiro está-gio, os dados no domínio da DCT ereduzir a resolução dos resultados escalonadosdescendentemente do primeiro estágio no domínio espacial.
20. Método executado em computador, CARACTERIZADOpelo fato de que compreende:parcialmente decodificar, por um transcodificadorintegrado, um fluxo de bits codificado para gerar um fluxode dados intermediário, o fluxo de bits codificado sendo co-dificado com um primeiro conjunto de técnicas de compactaçãoassociadas com o primeiro formato de mídia, a decodificaçãoparcial compreendendo:escalonar descendentemente os dados do fluxo debits em um domínio da DCT de um laço de decodificação,determinar se reduzir mais os dados do fluxo debits fora do laço de decodificação em um domínio espacial, adeterminação compreendendo:reduzir a resolução dos dados do fluxo de bits es-calonados descendentemente do domínio da DCT no domínio es-pacial oupermitir que os dados do fluxo de bits escalonadosdescendentemente do domínio da DCT passem sem redução de re-solução adicional,codificar, pelo transcodificador integrado, o flu-xo de dados intermediário usando um segundo conjunto de téc-nicas de compactação para gerar um fluxo de bits transcodi-ficado, o segundo conjunto de técnicas de compactação cor-respondendo com o segundo formato de midia.
BRPI0616823-0A 2005-09-14 2006-09-13 transcodificação de vìdeo digital integrada eficiente BRPI0616823A2 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/226,590 US8447121B2 (en) 2005-09-14 2005-09-14 Efficient integrated digital video transcoding
PCT/US2006/035640 WO2007033242A1 (en) 2005-09-14 2006-09-13 Efficient integrated digital video transcoding

Publications (1)

Publication Number Publication Date
BRPI0616823A2 true BRPI0616823A2 (pt) 2011-07-05

Family

ID=37855070

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0616823-0A BRPI0616823A2 (pt) 2005-09-14 2006-09-13 transcodificação de vìdeo digital integrada eficiente

Country Status (9)

Country Link
US (1) US8447121B2 (pt)
EP (1) EP1925163B1 (pt)
JP (1) JP4955686B2 (pt)
KR (1) KR101279755B1 (pt)
CN (1) CN101263718B (pt)
AU (1) AU2006291017A1 (pt)
BR (1) BRPI0616823A2 (pt)
CA (1) CA2621423C (pt)
WO (1) WO2007033242A1 (pt)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7136417B2 (en) 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US7676590B2 (en) * 2004-05-03 2010-03-09 Microsoft Corporation Background transcoding
US7669121B2 (en) * 2005-01-19 2010-02-23 Microsoft Corporation Transcode matrix
US7738766B2 (en) * 2005-04-18 2010-06-15 Microsoft Corporation Sanctioned transcoding of digital-media content
US7558463B2 (en) * 2005-04-18 2009-07-07 Microsoft Corporation Retention of information about digital-media rights in transformed digital media content
US9436804B2 (en) 2005-04-22 2016-09-06 Microsoft Technology Licensing, Llc Establishing a unique session key using a hardware functionality scan
US9363481B2 (en) 2005-04-22 2016-06-07 Microsoft Technology Licensing, Llc Protected media pipeline
US7924913B2 (en) * 2005-09-15 2011-04-12 Microsoft Corporation Non-realtime data transcoding of multimedia content
US7830800B1 (en) 2006-01-12 2010-11-09 Zenverge, Inc. Architecture for combining media processing with networking
US8102916B1 (en) 2006-01-12 2012-01-24 Zenverge, Inc. Dynamically changing media compression format in compressed domain
JP2009526436A (ja) * 2006-02-06 2009-07-16 トムソン ライセンシング ビデオ符号化向けの動き予測の予測子として利用可能な動き情報を再使用する方法及び装置
MX2008010961A (es) * 2006-03-07 2008-09-08 Nec Corp Sistema dinamico de distribucion de imagenes y dispositivo de conversion.
US8311114B1 (en) 2006-12-06 2012-11-13 Zenverge, Inc. Streamlined transcoder architecture
TW200836130A (en) * 2007-02-16 2008-09-01 Thomson Licensing Bitrate reduction method by requantization
US20130101023A9 (en) * 2007-03-12 2013-04-25 Vixs Systems, Inc. Video encoder with video decoder reuse and method for use therewith
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8265168B1 (en) 2008-02-01 2012-09-11 Zenverge, Inc. Providing trick mode for video stream transmitted over network
WO2009097284A1 (en) * 2008-02-01 2009-08-06 Zenverge, Inc. Intermediate compression of reference frames for transcoding
JP2009260818A (ja) * 2008-04-18 2009-11-05 Nec Corp サーバ装置とコンテンツ配信方法とプログラム
US8831101B2 (en) * 2008-08-02 2014-09-09 Ecole De Technologie Superieure Method and system for determining a metric for comparing image blocks in motion compensated video coding
US8279925B2 (en) 2008-09-22 2012-10-02 Smith Micro Software, Inc. Video streaming apparatus with quantization and method thereof
BRPI0917087A2 (pt) * 2008-09-22 2016-06-14 Avot Media Inc dispositivo de transmissão de vídeo com quantização e método de quantização
US8345746B2 (en) 2008-09-22 2013-01-01 Smith Micro Software, Inc. Video quantizer unit and method thereof
US8295345B2 (en) 2008-09-22 2012-10-23 Smith Micro Software, Inc. Transcoder unit and method
US8645822B2 (en) * 2008-09-25 2014-02-04 Microsoft Corporation Multi-platform presentation system
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8687685B2 (en) 2009-04-14 2014-04-01 Qualcomm Incorporated Efficient transcoding of B-frames to P-frames
ES2739475T3 (es) * 2009-05-11 2020-01-31 Ntt Docomo Inc Dispositivo, método y programa de codificación de imágenes en movimiento, y dispositivo, método y programa de decodificación de imágenes en movimiento
US8411756B2 (en) * 2009-05-21 2013-04-02 Ecole De Technologie Superieure Method and system for generating block mode conversion table for efficient video transcoding
US9100656B2 (en) 2009-05-21 2015-08-04 Ecole De Technologie Superieure Method and system for efficient video transcoding using coding modes, motion vectors and residual information
US20120023148A1 (en) * 2009-06-05 2012-01-26 James Louis Long Applying Transcodings In A Determined Order To Produce Output Files From A Source File
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
TWI401972B (zh) * 2009-06-23 2013-07-11 Acer Inc 時間性錯誤隱藏方法
US8340191B2 (en) * 2009-09-25 2012-12-25 General Instrument Corporation Transcoder from first MPEG stream to second MPEG stream
KR101675118B1 (ko) 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8553763B2 (en) 2010-06-10 2013-10-08 Sony Corporation Iterative computation of adaptive interpolation filter
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US8755438B2 (en) 2010-11-29 2014-06-17 Ecole De Technologie Superieure Method and system for selectively performing multiple video transcoding operations
US8571099B2 (en) * 2011-06-01 2013-10-29 Sharp Laboratories Of America, Inc. Decoder with dynamic range compensation
US20120307889A1 (en) * 2011-06-01 2012-12-06 Sharp Laboratories Of America, Inc. Video decoder with dynamic range adjustments
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9432704B2 (en) * 2011-11-06 2016-08-30 Akamai Technologies Inc. Segmented parallel encoding with frame-aware, variable-size chunking
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US8812740B2 (en) * 2012-03-30 2014-08-19 Broadcom Corporation Communication over bandwidth-constrained network
US9998750B2 (en) * 2013-03-15 2018-06-12 Cisco Technology, Inc. Systems and methods for guided conversion of video from a first to a second compression format
WO2015056296A1 (ja) 2013-10-15 2015-04-23 株式会社 東芝 電子機器および通信制御方法
US9485456B2 (en) 2013-12-30 2016-11-01 Akamai Technologies, Inc. Frame-rate conversion in a distributed computing system
FR3016764B1 (fr) * 2014-01-17 2016-02-26 Sagemcom Broadband Sas Procede et dispositif de transcodage de donnees video de h.264 vers h.265
US9438910B1 (en) 2014-03-11 2016-09-06 Google Inc. Affine motion prediction in video coding
US10136147B2 (en) 2014-06-11 2018-11-20 Dolby Laboratories Licensing Corporation Efficient transcoding for backward-compatible wide dynamic range codec
US20160041993A1 (en) * 2014-08-05 2016-02-11 Time Warner Cable Enterprises Llc Apparatus and methods for lightweight transcoding
US10958948B2 (en) 2017-08-29 2021-03-23 Charter Communications Operating, Llc Apparatus and methods for latency reduction in digital content switching operations
US11368692B2 (en) * 2018-10-31 2022-06-21 Ati Technologies Ulc Content adaptive quantization strength and bitrate modeling
WO2021134046A1 (en) * 2019-12-26 2021-07-01 Bytedance Inc. Decoding parameter sets in video coding
US11509897B2 (en) 2020-08-07 2022-11-22 Samsung Display Co., Ltd. Compression with positive reconstruction error
US11503322B2 (en) 2020-08-07 2022-11-15 Samsung Display Co., Ltd. DPCM codec with higher reconstruction quality on important gray levels

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE9703849L (sv) 1997-03-14 1998-09-15 Ericsson Telefon Ab L M Nedskalning av bilder
JPH1173410A (ja) 1997-06-16 1999-03-16 Sony Corp ディジタル信号変換方法及び装置並びに変換行列作成方法
JPH11275592A (ja) * 1998-01-22 1999-10-08 Victor Co Of Japan Ltd 動画像符号列変換装置及びその方法
US6104441A (en) * 1998-04-29 2000-08-15 Hewlett Packard Company System for editing compressed image sequences
JP3821415B2 (ja) 1998-09-30 2006-09-13 日本ビクター株式会社 動画像フォーマット変換装置及びその方法
KR100312421B1 (ko) 1998-11-25 2001-12-12 오길록 영상시스템에서의압축동영상변환장치및그방법
US6618442B1 (en) 1998-12-29 2003-09-09 Intel Corporation Method and apparatus for transcoding digital video signals
JP2001145113A (ja) 1999-11-17 2001-05-25 Sony Corp 画像情報変換装置及び方法
WO2001052550A1 (en) 2000-01-12 2001-07-19 Koninklijke Philips Electronics N.V. Image data compression
US6647061B1 (en) * 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
US7266148B2 (en) 2001-01-05 2007-09-04 Lg Electronics Inc. Video transcoding apparatus
GB2369952B (en) * 2001-03-10 2002-12-04 Ericsson Telefon Ab L M Transcoding of video signals
US6671322B2 (en) 2001-05-11 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Video transcoder with spatial resolution reduction
US20030043908A1 (en) 2001-09-05 2003-03-06 Gao Cheng Wei Bandwidth scalable video transcoder
JP4082025B2 (ja) 2001-12-18 2008-04-30 日本電気株式会社 圧縮動画像の再符号化方法及び装置
JP4275358B2 (ja) 2002-06-11 2009-06-10 株式会社日立製作所 画像情報変換装置およびビットストリーム変換機ならびに画像情報変換送信方法
CN1774930A (zh) 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 视频转码
US20050132264A1 (en) * 2003-12-15 2005-06-16 Joshi Ajit P. System and method for intelligent transcoding
US7391809B2 (en) * 2003-12-30 2008-06-24 Microsoft Corporation Scalable video transcoding
TWI230547B (en) 2004-02-04 2005-04-01 Ind Tech Res Inst Low-complexity spatial downscaling video transcoder and method thereof
US20050175099A1 (en) * 2004-02-06 2005-08-11 Nokia Corporation Transcoder and associated system, method and computer program product for low-complexity reduced resolution transcoding
US20050232497A1 (en) 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US20060140274A1 (en) * 2004-12-29 2006-06-29 Mediatek Incorporation Transcoder and method used therein

Also Published As

Publication number Publication date
JP4955686B2 (ja) 2012-06-20
CA2621423A1 (en) 2007-03-22
WO2007033242A1 (en) 2007-03-22
EP1925163A1 (en) 2008-05-28
KR20080055820A (ko) 2008-06-19
EP1925163A4 (en) 2010-02-03
JP2009508445A (ja) 2009-02-26
CN101263718B (zh) 2010-12-08
KR101279755B1 (ko) 2013-07-04
CA2621423C (en) 2014-12-09
EP1925163B1 (en) 2017-11-29
US20070058718A1 (en) 2007-03-15
CN101263718A (zh) 2008-09-10
AU2006291017A1 (en) 2007-03-22
US8447121B2 (en) 2013-05-21

Similar Documents

Publication Publication Date Title
BRPI0616823A2 (pt) transcodificação de vìdeo digital integrada eficiente
BRPI0616034A2 (pt) decodificador de subamostragem de mudança de resolução arbitrária
ES2665908T3 (es) Predicción inter-componente
CN103004191B (zh) 视频编码装置、视频解码装置、视频编码方法、视频解码方法以及程序
RU2411689C2 (ru) Способ и устройство для адаптивного к макроблоку межслойного предсказания внутренней текстуры
JP2021513303A (ja) ビデオ復号化のための方法、装置およびコンピュータプログラム
CN111492661A (zh) 视频解码的方法和装置、及存储介质
JP2022507314A (ja) 単一レベルの変換分割および適応サブブロック変換を行うための方法、装置、およびプログラム
BRPI0800010B1 (pt) dispositivo de codificação de imagem em movimento, dispositivo de decodificação de imagem em movimento, método de codificação de imagem em movimento e método de decodificação de imagem em movimento
BRPI0610667A2 (pt) método e aparelho para codificação de vetor de movimento adaptativo por fatia para codificação e decodificação de vìdeo redimensionável espacial
TW201334534A (zh) 頻域取樣自適應偏移(sao)
JP2022511883A (ja) ビデオ符号化用の方法及び装置
CN113412622A (zh) 视频编解码的方法和装置
CN113424532A (zh) 视频编解码方法和装置
TW202015410A (zh) 視頻轉碼方法及設備、電腦儲存介質及電子設備
WO2021135856A1 (zh) 视频编解码方法、装置、设备及存储介质
JP6854816B2 (ja) 符号化及び復号方法並びに対応するデバイス
BRPI0210276B1 (pt) Aparelho, método de realização de operações e sistema de dados de vídeo escalonável com elevada granularidade, método para receber dados de macrobloco de vídeo codificados e dispositivo de armazenamento de programa que pode ser lido por máquina
CN111147858B (zh) 视频解码方法、装置、设备及存储介质
JP2015154198A (ja) 動画像復号装置及びプログラム
EP3322187B1 (en) Method and transcoder for video transcoding
Vetro et al. Complexity-quality analysis of MPEG-2 to MPEG-4 transcoding architectures

Legal Events

Date Code Title Description
B11A Dismissal acc. art.33 of ipl - examination not requested within 36 months of filing
B11Y Definitive dismissal - extension of time limit for request of examination expired [chapter 11.1.1 patent gazette]
B15K Others concerning applications: alteration of classification

Ipc: H04N 21/236 (2011.01), H04N 19/105 (2014.01), H04N