BRPI0718738B1 - Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo - Google Patents

Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo Download PDF

Info

Publication number
BRPI0718738B1
BRPI0718738B1 BRPI0718738-6A BRPI0718738A BRPI0718738B1 BR PI0718738 B1 BRPI0718738 B1 BR PI0718738B1 BR PI0718738 A BRPI0718738 A BR PI0718738A BR PI0718738 B1 BRPI0718738 B1 BR PI0718738B1
Authority
BR
Brazil
Prior art keywords
domain
data
time
time domain
encoded
Prior art date
Application number
BRPI0718738-6A
Other languages
English (en)
Inventor
Geiger Ralf
Neuendorf Max
Yokotani Yoshikazu
Rettelbach Nikolaus
Herre Juergen
Geyersberger Stefan
Original Assignee
Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. filed Critical Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Priority to BR122019024992-0A priority Critical patent/BR122019024992B1/pt
Publication of BRPI0718738A2 publication Critical patent/BRPI0718738A2/pt
Publication of BRPI0718738A8 publication Critical patent/BRPI0718738A8/pt
Publication of BRPI0718738B1 publication Critical patent/BRPI0718738B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

CODIFICADOR, DECODIFICADOR E MÉTODOS PARA CODIFICAÇÃO E DECODIFICAÇÃO DE SEGMENTOS DE DADOS REPRESENTANDO UMA CORRENTE DE DADOS DE DOMÍNIO DE TEMPO Aparelho para decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo, um segmento de dados sendo codificado no domínio de tempo ou no domínio de frequência, um segmento de dados codificado no domínio de frequência tendo blocos sucessivos de dados representando blocos sucessivos e sobrepostos de amostras de dados de domínio de tempo. O aparelho compreende um decodificador de domínio de tempo para decodificar um segmento de dados sendo codificado no domínio de tempo e um processador para processamento do segmento de dados sendo codificado no domínio de frequência e dados de saída do decodificador de domínio de tempo para obter blocos de dados de domínio de tempo de sobreposição. O aparelho compreende ainda um combinador de sobreposição/adição para combinar os blocos de dados de domínio de tempo de sobreposição para obter um segmento de dados decodificado da corrente de dados de domínio de tempo.

Description

DESCRIÇÃO
A presente invenção refere-se ao campo de codificação, um campo em que diferentes caracteristicas de dados a serem codificados são utilizadas para taxas de codificação, como, por exemplo, em codificação de video e áudio.
As estratégias de codificação de ultima geração podem fazer uso de caracteristicas de uma corrente de dados a ser codificadas. Por exemplo, em codificação de áudio, modelos de percepção são usados de modo a comprimir dados de origem quase sem diminuição perceptível da qualidade e sem degradação quando reproduzidos. Esquemas modernos de codificação de áudio perceptual, tais como por exemplo, MPEG-2/4 AAC (MPEG = Moving Pictures Expert Group [Grupo Especializado de Movimento de Imagens], AAC = Advanced Audio Coding [Codificação de Áudio Avançada], cf. "Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding", Norma Internacional 13818-7, Grupo
Especializado de Movimento de Imagens ISO/IEC JTC1/SC29/WG11, 1997 , podem usar bancos de filtro, tais como por exemplo, a Transformada de Cosseno Discreta Modificada (MDCT), para representar o sinal de áudio no dominio de frequência.
Na quantização de dominio de frequência, coeficientes de frequência podem ser executados, de acordo com um modelo percentual. Estes codificadores podem prover excelente qualidade de áudio perceptual para tipos gerais de sinais de áudio como, por exemplo, música. Por outro lado, codificadores modernos de voz, tais como por exemplo, ACELP (ACELP = Algebraic Code Excited Linear Prediction), usam uma abordagem previsiva, e desta maneira podem representar o sinal de áudio/voz no dominio de tempo. Estes codificadores de voz podem modelar as características 5 do processo de produção da voz humana, isto é, o trato vocal humano e, consequentemente, atingir excelente desempenho para sinais de voz em baixas taxas de bits. Inversamente, codificadores de áudio perceptuais não atingem o nivel de desempenho oferecido pelos codificadores de voz para sinais de voz codificados em taxas 10 de bits baixas, e usar codificadores de voz para representar sinais de áudio gerais/música resulta em prejuizos significativos à qualidade.
Conceitos convencionais proveem uma combinação em camadas, na qual todos os codificadores parciais estão sempre 15 ativos, isto é, codificadores de dominio de tempo e de dominio de frequência, e o sinal de saida final é calculado pela combinação das contribuições dos codificadores parciais para uma dada moldura de tempo processada. Um exemplo popular de codificação em camadas é a codificação de voz/áudio escalonável MPEG-4 com um codificador 20 de voz como uma camada base e uma camada de melhoria baseada em banco de filtro, cf. Bernhard Grill, Karlheinz Brandenburg, "A Two-or Three-Stage Bit-Rate Scalable Audio Coding System", Pré- impressão número 4132, 99- Convenção da AES (Setembro de 1995) .
Codificadores de dominio de frequência 25 convencionais podem usar bancos de filtro MDCT. O MDCT se tornou um banco de filtro dominante para codificadores de áudio perceptual convencionais devido as suas propriedades vantajosas.
Por exemplo, ele pode prover uma atenuação cruzada suave em blocos de processamento. Mesmo se um sinal em cada bloco de processamento for alterado diferentemente, por exemplo, devido à quantização de coeficientes espectrais, nenhum artefato de bloqueio devido a transições abruptas de bloco para bloco ocorre devido às operações de sobreposiçâo/adição com janelas. O MDCT usa o conceito de cancelamento da parte sobreposta de dominio de tempo (TDAC).
O MDCT é uma transformada relacionada a Fourier baseada na transformada de cosseno discreta do tipo IV, com uma propriedade adicional de ser sobreposta. Ela á designada para ser 10 executada em blocos consecutivos de um conjunto de dados maior, em que blocos subsequentes são sobrepostos de modo que a última metade de um bloco coincide com a primeira metade do próximo bloco. Esta sobreposição, em adição à qualidade de compactação de energia do DCT, torna o MDCT especialmente interessante para aplicações de compressão de sinal, visto que ajuda a evitar os referidos artefatos originários dos limites dos blocos. Como uma transformada sobreposta, o MDCT é um bit incomum se comparado com outras transformadas relacionadas a Fourier por ter metade tanto das saidas quanto das entradas, em vez do mesmo número. Em especial, números reais 2N são transformados em números reais N, em que N é um número inteiro positivo.
O MDCT inverso é também conhecido como IMDCT. Devido ao fato de existirem números diferentes de entradas e saidas, à primeira vista pode parecer que o MDCT não deveria ser invertivel. Entretanto, a invertibilidade é atingida pela adição dos IDMCTs de sobreposição de blocos de sobreposição subsequentes, fazendo que os erros sejam cancelados e os dados originais sejam recuperados, isto é, atingindo TDAC.
Sendo assim, o número de valores espectrais na saida de um banco de filtro é igual ao número de valores de entrada de dominio de tempo em sua entrada, que é também referida como amostragem critica.
Um banco de filtro MDCT provê uma seletividade de alta frequência e permite um ganho elevado de codificação. As propriedades de sobreposição de blocos e amostragem critica podem ser atingidas utilizando a técnica de cancelamento de distorção de domínio de tempo, cf. J. Princen, A. Bradley, "Analysis/Synthesis
Filter Bank Design Based on Time Domain Aliasing Cancellation", IEEE Trans. ASSP, ASSP-34(5):1153-1161, 1986. A Figura 4 ilustra estes efeitos de um MDCT. A Figura 4 mostra um sinal de entrada MDCT, em termos de um impulso ao longo de um eixo de tempo 400 na parte superior. O sinal de entrada 400 é, então, transformado por dois blocos de janela e MDCT consecutivos, em que as janelas 410 são ilustradas subjacentes ao sinal de entrada 400 na Figura 4. Os sinais de janela individuais transformados de volta são mostrados na Figura 4 pelas linhas de tempo 420 e 425.
Após o MDCT inverso, o primeiro bloco produz um componente de distorção com sinal positivo 420, o segundo bloco produz um componente de distorção com a mesma magnitude e um sinal negativo 425. Os componentes de distorção cancelam um ao outro após adição dos dois sinais de saída 420 e 425 conforme mostrado na saída final 430 na parte inferior da Figura 4. No "Extended Adaptive Multi-Rate - Wideband (AMR- WB+) codec", 3GPP TS 26.290V6.3.0, 2005-06, Technical Specification, o codec AMR-WB+ (AMR-WB = Banda Larga Adaptativa de Múltiplas Taxas) é especificado. De acordo com a seção 5.2, o algoritmo de codificação no núcleo do codec AMR-WB+ e baseado em um modelo hibrido ACELP/TCX (TCX = Excitação de Transformada codificada). Para cada bloco de um sinal de entrada, o codificador decide, tanto em um modo de alça aberta quanto de alça fechada, qual modelo de codificação, isto é, ACELP ou TCX, é melhor. O modelo ACELP é um codificador previsivo, de dominio de tempo, mais adequado para sinais de voz e transientes. O codificador AMR-WB é usado em modos ACELP. Alternativamente, o modelo TCX é um codificador baseado em transformada, e é mais apropriado para típicas amostras de música.
Especificamente, o AMR-WB+ usa uma transformada de Fourier discreta (DFT) para o modo de codificação de transformada TCX. De modo a permitir transição suave entre blocos adjacentes, uma janela e sobreposição são usadas. Esta janela e sobreposição é necessária tanto para transições entre diferentes modos de codificação (TCX/ACELP) quanto para molduras TCX consecutivas. Dessa maneira, a DFT juntamente com a janela e sobreposição representam um banco de filtro que não é extremamente amostrado. O banco de filtro produz mais valores de frequência que o número de novas amostras de entrada, cf. Fig. 4 no 3GPP TS 26.290V6.3.0 (3GPP = Third Generation Partnership Project, TS = Technical Specification). Cada moldura TCX utiliza uma sobreposição de 1/8 do comprimento da moldura que é igual ao número de novas amostras de entrada. Consequentemente, o comprimento correspondente da DFT é 9/8 do comprimento da moldura.
Considerando bancos de filtro DFT não extremamente amostrados no TCX, isto é, o número de valores espectrais na saída do banco de filtro é maior que o número de valores de entrada de domínio de tempo em sua entrada, este modo de codificação de domínio de frequência é diferente dos codecs de áudio tal como AAC (AAC = Advanced Audio Coding (Codificação de Áudio Avançada)) que utiliza um MDCT, uma transformada de parte sobreposta extremamente amostrada. O codec Dolby E é descrito por Fielder, Louis D.;
Todd, Craig C., "The Design of a Video Friendly Audio Coding System for Distributing Applications", Número do Documento 17-008, "The AES 17th International Conference: High-Quality Audio Coding" (Agosto de 1999) e Fielder, Louis D.; Davidson, Grant A., "Audio Coding Tools for Digital Television Distribution", Pré-impressão número 5104, 108th Convention of the AES" (Janeiro de 2000) . 0 codec Dolby E utiliza o banco de filtro MDCT. No projeto desta codificação, foi dada ênfase na possibilidade de executar edição no domínio de codificação. Para obtê-lo, janelas livres de distorção especiais são usadas. Nos limites destas janelas, uma atenuação cruzada suave ou corte de diferentes porções do sinal é possível. Nos documentos em referência acima é, por exemplo, descrito, cf. seção 3 do "The Design of a Video Friendly Audio Coding System for Distribution Applications", que isto não seria possível simplesmente com o uso das janelas MDCT usuais, que introduzem distorção de domínio de tempo. Entretanto, é também descrito que a remoção de distorção resulta em um número aumentado de coeficientes de transformada, indicando que o banco de filtro resultante não tem mais a propriedade de amostragem crítica.
É objetivo da presente invenção prover um conceito mais eficiente para codificação e decodificação de segmentos de dados.
O objetivo é alcançado por um aparelho para decodificação de acordo com a reivindicação 1, um método para decodificação de acordo com a reivindicação 22, um aparelho para gerar uma corrente de dados codificados de acordo com a reivindicação 24 e um método para gerar uma corrente de dados codificada de acordo com a reivindicação 35.
A presente invenção é baseada na descoberta de que um conceito de codificação e decodificação mais eficiente pode ser utilizado por meio do uso combinado de codificadores de dominio de tempo e dominio de frequência, respectivamente decodificadores. O problema de distorção de tempo pode ser eficientemente combatido pela transformação dos dados de dominio de tempo em dominio de frequência no decodificador e pela combinação dos dados de dominio de frequência transformados resultantes com os dados de dominio de frequência decodificados recebidos. Excessos podem ser reduzidos pela adaptação de regiões de sobreposição de janelas de sobreposição aplicadas a segmentos de dados para codificação de alterações de dominio. Usar janelas com regiões de sobreposição menores pode ser benéfico no uso de codificação de dominio de tempo, respectivamente quando alterando de ou para codificação de dominio de tempo.
Configurações podem prover um conceito de codificação e decodificação de áudio universal que atinja desempenho melhorado para ambos os tipos de sinais de entrada, tais como sinais de voz e sinais de música. Configurações podem obter vantagens da combinação de múltiplas abordagens de codificação, por exemplo, conceitos de codificação de dominio de tempo e de dominio de frequência. As configurações podem combinar eficientemente conceitos de codificação baseados em banco de filtro e baseados em dominio de tempo em um esquema único. Configurações podem resultar em um codec combinado que pode, por exemplo, ser capaz de mudar entre um codec de áudio para conteúdo de áudio do tipo música e um codec de voz para conteúdo do tipo voz. Configurações podem utilizar esta mudança frequentemente, especialmente para conteúdo misto.
Configurações da presente invenção podem prover a vantagem de que nenhum artefato de mudança ocorra. Nas configurações, a quantidade de dados de transmissão adicionais, ou amostras codificadas adicionalmente, para um processo de mudança pode ser minimizada de modo a evitar uma eficiência reduzida durante esta fase da operação. Portanto, o conceito de combinação mudada de codificadores parciais é diferente daquela da combinação em camadas na qual sempre todos os codificadores parciais estão ativos.
Nas configurações a seguir, a presente invenção, será descrita em detalhe usando as Figuras em anexo, nas quais: A Figura la mostra uma configuração de um aparelho para decodificação; A Figura 1b mostra uma outra configuração de um aparelho para decodificação; A Figura lc mostra uma outra configuração de um aparelho para decodificação; A Figura ld mostra uma outra configuração de um aparelho para decodificação; A Figura le mostra uma outra configuração de um aparelho para decodificação; A Figura If mostra uma outra configuração de um aparelho para decodificação; A Figura 2a mostra uma configuração de um aparelho para codificação; A Figura 2b mostra uma outra configuração de um aparelho para codificação; A Figura 2c mostra uma outra configuração de um aparelho para codificação; A Figura 3a ilustra regiões de sobreposição quando mudando entre codificação de dominio de frequência e dominio de tempo com a duração de uma janela; A Figura 3b ilustra regiões de sobreposição quando mudando entre codificação de dominio de frequência e codificação de dominio de tempo com a duração de duas janelas; A Figura 3c ilustra múltiplas janelas com diferentes regiões de sobreposição; A Figura 3d ilustra a utilização de janelas com diferentes regiões de sobreposição em uma configuração; e A Figura 4 ilustra cancelamento de distorção de dominio de tempo quando usando MDCT. A Figura la mostra um aparelho 100 para decodificar segmentos de dados representando uma corrente de dados de dominio de tempo, um segmento de dados sendo codificado em um dominio de tempo ou em um dominio de frequência, um segmento de dados sendo codificado no dominio de frequência tendo blocos sucessivos de dados representando blocos sucessivos e sobrepostos de amostras de dados de dominio de tempo. Esta corrente de dados poderia, por exemplo, corresponder a uma corrente de áudio, em que alguns dos blocos de dados são codificados no dominio de tempo e outros são codificados no dominio de frequência. Blocos de dados ou segmentos de dados que foram codificados no domínio de frequência, podem representar amostras de dados de dominio de tempo de blocos de dados de sobreposição.
O aparelho 100 compreende um decodificador de domínio de tempo 110 para decodif icação de um segmento de dados codificado no domínio de tempo. Além disso, o aparelho 100 compreende um processador 120 para processamento do segmento de dados sendo codificado no domínio de frequência e dados de saída do decodificador de domínio de tempo 110 para obter blocos de dados de domínio de tempo de sobreposição. Além disso, o aparelho 100 compreende um combinador de sobreposição/adição 130 para combinar os blocos de dados de domínio de tempo de sobreposição para obter os segmentos de dados decodificados da corrente de dados de domínio de tempo.
A Figura 1b mostra uma outra configuração do aparelho 100. Nas configurações, o processador 120 pode compreender um decodificador de domínio de frequência 122 para decodificar segmentos de dados sendo codificados no domínio de frequência para obter segmentos de dados de domínio de frequência. Além disso, nas configurações, o processador 120 pode compreender um conversor de domínio de tempo para domínio de frequência 124 para converter os dados de saída do decodificador de domínio de tempo 110 para obter segmentos de dados de domínio de frequência convertidos.
Adicionalmente, nas configurações, o processador 120 pode compreender um combinador de domínio de frequência 126 para combinação dos segmentos de dominio de frequencia e dos segmentos de dados de dominio de frequência convertidos para obter uma corrente de dados de dominio de frequência. O processador 120 pode ainda compreender um conversor de dominio de frequência para dominio de tempo 128 para conversão da corrente de dados de dominio de frequência em blocos de dados de dominio de tempo de sobreposição que podem, então, ser combinados pelo combinador de sobreposição/adição 130.
As configurações podem utilizar um banco de filtro MDCT, como por exemplo, usado em MPEG-4 AAC, sem qualquer modificação, especialmente sem abandonar a propriedade de amostragem critica. As configurações podem prover eficiência ideal de codificação. As configurações podem atingir uma transição suave para um codec de dominio de tempo compativel com as janelas MDCT estabelecidas, enquanto não introduz artefatos de mudança adicionais e apenas um excesso minimo.
As configurações podem manter a distorção de dominio de tempo no banco de filtro e intencionalmente introduzir uma distorção de dominio de tempo correspondente nas porções de sinal codificadas pelo codec de dominio de tempo. Dessa maneira, componentes resultantes da distorção de dominio de tempo podem cancelar uns aos outros da mesma maneira que eles fazem para duas molduras consecutivas dos espectros MDCT.
A Figura 1c ilustra uma outra configuração de um aparelho 100. De acordo com a Figura 1c, o decodi f icador de dominio de frequência 122 pode compreender um estágio de re- quantização 122a. Além do disso, o conversor de dominio de tempo para dominio de frequência 124 pode compreender um banco de filtro modulado de cosseno, uma transformada de parte sobreposta estendida, um banco de filtro de baixo atraso ou um banco de filtro polifásico. A configuração mostrada na Figura 1c ilustra que o conversor de dominio de tempo para dominio de frequência 124 pode compreender um MDCT 124a.
Adicionalmente, a Figura 1c ilustra que o combinador de dominio de frequência 126 pode compreender um adicionador 126a. Conforme mostrado na Figura 1c, o conversor de dominio de frequência para dominio de tempo 128 pode compreender um banco de filtro modulado de cosseno, respectivamente um MDCT inverso 128a. A corrente de dados compreendendo segmentos de dados de dominio de tempo codificado e de dominio de frequência codificado pode ser gerada por um codificador que será melhor detalhado abaixo. A mudança entre codificação de dominio de frequência e codificação de dominio de tempo pode ser atingida pela codificação de algumas porções do sinal de entrada com um codificador de dominio de frequência e algumas porções de sinal de entrada com um codificador de dominio de tempo. A configuração do aparelho 100 ilustrado na Figura 1c mostra o principio estrutural de um aparelho correspondente 100 para decodificação. Em outras configurações, a re-quantização 122a e a transformada de cosseno discreta modificada inversa 128a pode representar um decodificador de dominio de frequência.
Conforme indicado na Figura lc para porções de sinal em que o decodif icador de dominio de tempo 110 assume, a saida de dominio de tempo do decodificador de dominio de tempo 110 pode ser transformada pelo MDCT à frente 124a. O decodificador de dominio de tempo pode utilizar um filtro de previsão para decodificar os dados codificados de dominio de tempo. Alguma sobreposição na entrada do MDCT 124a e, assim, algum excesso pode ser introduzido aqui. Nas configurações a seguir será descrito o que reduz ou minimiza este excesso.
Em principio, a configuração mostrada na Figura lc também compreende um modo de operação em que ambos os codecs podem operar paralelamente. Nas configurações, o processador 120 pode ser adaptado para processamento de um segmento de dados que é codificado em paralelo no dominio de tempo e no dominio de frequência. Desta maneira o sinal pode parcialmente ser codificado no dominio de frequência e parcialmente no dominio de tempo, similarmente a uma abordagem de codificação em camadas. Os sinais resultantes são, então, adicionados no dominio de frequência, comparar o combinador de dominio de frequência 126a. No entanto, configurações podem executar um modo de operação que é para mudar exclusivamente entre os dois codecs e apenas ter, preferivelmente, um número minimo de amostras em que ambos os codecs estão ativos, de modo a obter a melhor eficiência possível.
Na Figura lc, a saida do decodificador de dominio de tempo 110 é transformada pelo MDCT 124a, seguido pelo IMDCT 128a. Em uma outra configuração, estas duas etapas podem ser vantajosamente combinadas em uma etapa única, de modo a reduzir a complexidade. A Figura ld ilustra uma configuração de um aparelho 100 ilustrando esta abordagem. O aparelho 100 mostrado na Figura ld ilustra que o processador 120 pode compreender um calculador 129 para calcular blocos de dados de dominio de tempo de sobreposição baseados nos dados de saida do decodificador de dominio de tempo 110. O processador 120 ou o calculador 129 podem ser adaptados para reproduzir uma propriedade, respectivamente uma propriedade de sobreposição do conversor de dominio de frequência para dominio de tempo 128 baseado nos dados de saida do decodi f icador de dominio de tempo 110, isto é, o processador 120 ou calculador 129 pode reproduzir uma característica de sobreposição dos blocos de dados de dominio de tempo similar a uma característica de sobreposição produzida pelo conversor de dominio de frequência para dominio de tempo 128. Além disso, o processador 120 ou calculador 129 pode ser adaptado para reproduzir distorção de dominio de tempo similar à distorção de dominio de tempo introduzida pelo conversor de dominio de frequência para dominio de tempo 128 baseado nos dados de saida do decodif icador de dominio de tempo 110.
O conversor de dominio de frequência para dominio de tempo 128 pode, então, ser adaptado para converter os segmentos de dados de dominio de frequência providos pelo decodificador de dominio de frequência 122 para blocos de dados de dominio de tempo de sobreposição. O combinador de sobreposição/adição 130 pode ser adaptado para combinar blocos de dados providos pelo conversor de dominio de frequência para dominio de tempo 128 e o calculador 129 para obter os segmentos de dados decodificados da corrente de dados de dominio de tempo.
O calculador 129 pode compreender um estágio de distorção de dominio de tempo 129a como é ilustrado na configuração mostrada na Figura le. O estágio de distorção de dominio de tempo 129a pode ser adaptado para dados de saida de distorção de tempo do decodificador de dominio de tempo para obter os blocos de dados de dominio de tempo de sobreposição.
Para os dados codificados de dominio de tempo uma combinação do MDCT e do IMDCT pode tornar o processo nas configurações muito mais simples tanto em relação à complexidade estrutural quanto computacional, visto que apenas o processo de distorção de dominio de tempo (TDA) permanece nas configurações. Este processo eficiente pode ser baseado em uma série de observações. O MDCT de janela dos segmentos de entrada de 2N amostras pode ser decomposto em três etapas.
Primeiramente, o sinal de entrada é multiplicado por uma janela de análise.
Em segundo lugar, o resultado é, então, reduzido de 2N amostras para N amostras. Para o MDCT, este processo implica no fato de que o primeiro quarto das amostras é combinado, isto é, subtraido, na ordem de tempo reverso com o segundo quarto das amostras, e que o quarto quarto das amostras é combinado, isto é, adicionado ao terceiro quarto das amostras na ordem de tempo reverso. O resultado é o sinal distorcido de tempo com amostras diminuídas no segundo e terceiro quarto modificado do sinal, compreendendo N amostras.
Em terceiro lugar, o sinal de amostras reduzidas é, então, transformado usando uma transformada do tipo DCT ortogonal mapeando amostras de N entradas para N saldas para formar a salda de MDCT final.
A reconstrução de IMDCT de janela de uma sequência de entrada de N amostras espectrais pode, similarmente, ser decomposta de três etapas.
Primeiramente, a sequência de entrada de N amostras espectrais é transformada usando uma transformada tipo
DCT inversa ortogonal mapeando amostras de N entradas para N saídas.
Em segundo lugar, os resultados desdobrados de N para 2N amostras pela gravação de valores transformados de DCT inversos no segundo e terceiro quartos de um armazenamento de saída de 2N amostras, enchendo o primeiro quarto com a versão de tempo inverso e invertida do segundo quarto, e o quarto quarto com uma versão de tempo inverso do terceiro quarto, respectivamente.
Em terceiro lugar, as 2N amostras resultantes são multiplicadas com a janela de síntese para formar a saída IMDCT de j anela.
Dessa maneira, uma concatenação do MDCT de janela e do IMDCT de janela pode ser eficientemente executada nas configurações pela sequência das primeira e segunda etapas do MDCT de janela e pela segunda e terceira etapas do IMDCT de janela. A terceira etapa do MDCT e a primeira etapa do IMDCT podem ser omitidas inteiramente nas configurações devido ao fato de serem operações inversas entre si e, dessa maneira, canceladas. As etapas remanescentes podem ser executadas apenas no dominio de tempo, e assim configurações usando esta abordagem podem ser substancialmente baixas em complexidade computacional.
Para um bloco do MDCT e consecutivo IMDCT, a segunda e terceira etapas do MDCT e a segunda e terceira etapas do IMDCT podem ser gravadas como uma multiplicação com a seguinte matriz esparsa 2Nx2N.
Figure img0001
Em outras palavras, o calculador 129 pode ser adaptado para segmentar a saída do decodificador de dominio de tempo 110 nos segmentos do calculador compreendendo 2N amostras sequenciais, aplicando pesos às 2N amostras de acordo com uma função de janela de análise, subtraindo as primeiras N/2 amostras em ordem reversa das segundas N/2 amostras, e as últimas N/2 amostras na ordem reversa para as terceiras N/2 amostras, invertendo as segundas e terceiras N/2 amostras, substituindo as primeiras N/2 amostras com a versão de tempo reverso e invertido das segundas N/2 amostras, substituindo as quartas N/2 amostras com a versão de tempo reverso das terceiras N/2 amostras, e aplicando pesos as 2N amostras de acordo com uma função de janela de síntese.
Em outras configurações, o combinador de sobreposição/adição 130 pode ser adaptado para aplicar pesos de acordo com uma função de janela de síntese a blocos de dados de domínio de tempo de sobreposição providos pelo conversor de domínio de frequência para domínio de tempo 128 . Além disso, o combinador de sobreposição/adição 130 pode ser adaptado para aplicação de pesos de acordo com uma função de janela de síntese adaptada ao tamanho de uma região de sobreposição de blocos de dados de domínio de tempo de sobreposição.
O calculador 129 pode ser adaptado para aplicação de pesos a 2N amostras de acordo com uma função de janela de análise adaptada ao tamanho de uma região de sobreposição de blocos de dados de dominio de tempo de sobreposição consecutivos e 5 o calculador pode ser adicionalmente adaptado para aplicação de pesos a 2N amostras de acordo com uma função de janela de síntese adaptada ao tamanho da região de sobreposição.
Nas configurações, o tamanho de uma região de sobreposição de dois blocos de dados de domínio de tempo 10 consecutivos que são codificados no domínio de frequência pode ser maior que o tamanho de uma sobreposição de dois blocos de dados de domínio de tempo consecutivos dos quais um é codificado no domínio de frequência e o outro é codificado no domínio de tempo.
Nas configurações, o tamanho dos segmentos de dados pode ser adaptado ao tamanho das regiões de sobreposição. As configurações podem ter uma implementação eficiente de um processamento MDCT/IMDCT combinado, isto é, um bloco TDA compreendendo as operações de janela de análise, dobra e desdobramento, e janela de síntese. Além disso, nas configurações algumas destas etapas podem ser parcialmente ou totalmente combinadas em uma implementação real.
Uma outra configuração de um aparelho 100 conforme mostrado na Figura lf ilustra que um aparelho 100 pode ainda compreender um desvio 140 para o processador 120 e o 25 combinador de sobreposição/adição 130 pode ser adaptado para desvio do processador 120 e do combinador de sobreposição/adição 130 quando ocorrem blocos de dados de domínio de tempo consecutivos sem sobreposição nos segmentos de dados, que são codificados no dominio de tempo, isto é, nenhuma conversão para o dominio de frequência será necessária para decodificação de segmentos de dados consecutivos, eles podem ser transmitidos sem qualquer sobreposição. Para estes casos, as configurações conforme mostrado na Figura lf podem desviar do processador 120 e do combinador de sobreposição/adição 130. Nas configurações, a sobreposição de blocos pode ser determinada de acordo com as especificações AAC.
A Figura 2a mostra uma configuração de um aparelho 200 para gerar uma corrente de dados codificadas com base em uma corrente de dados de dominio de tempo, a corrente de dados de dominio de tempo tendo amostras de um sinal. A corrente de dados de dominio de tempo poderia, por exemplo, corresponder a um sinal de áudio, compreendendo seções de voz e seções de música, ou simultaneamente ambas. O aparelho 200 compreende um processador de segmento 210 para prover segmentos de dados da corrente de dados, dois segmentos de dados consecutivos tendo uma primeira ou uma segunda região de sobreposição, a segunda região de sobreposição sendo menor que a primeira região de sobreposição. O aparelho 200 compreende ainda um codificador de dominio de tempo 220 para codificar um segmento de dados no dominio de tempo e um codificador de dominio de frequência 230 para aplicação de pesos a amostras da corrente de dados de dominio de tempo de acordo com uma primeira ou uma segunda função de janela, para obter um segmento de dados de janela, a primeira função e a segunda função de janela sendo adaptadas à primeira e segunda regiões de sobreposição e para codificação do segmento de dados de janela no
Adicionalmente, o aparelho 200 compreende um analisador de dados de dominio de tempo 240 para determinar uma indicação de transmissão associada com um segmento de dados e um controlador 250 para controlar o aparelho, de modo que para segmentos de dados tendo uma primeira indicação de transição, dados de saida do codificador dominio de tempo 220 são incluídos na corrente de dados codificados e para segmentos de dados tendo uma segunda indicação de transição, dados de saída do codificador de domínio de frequência 230 são incluídos na corrente de dados codificados.
Nas configurações, o analisador de dados de domínio de tempo 240 pode ser adaptado para determinar a indicação de transição da corrente de dados de domínio de tempo ou de segmentos de dados providos pelo processador de segmento 210. Estas configurações são indicadas nas Figuras 2b. Na Figura 2b é ilustrado que o analisador de dados de domínio de tempo 240 pode ser acoplado à entrada do processador de segmento 210, de modo a determinar a indicação de transição da corrente de dados de domínio de tempo. Em uma outra configuração, o analisador de dados de domínio de tempo 240 pode ser acoplado à saída do processador de segmento 210, de modo a determinar a indicação de transição dos segmentos de dados. Nas configurações, o analisador de dados de domínio de tempo 240 pode ser acoplado diretamente ao processador de segmento 210, de modo a determinar a indicação de transição de dados providos diretamente pelo processador de segmento. Estas configurações são indicadas pelas linhas pontilhadas na Figura 2b.
Nas configurações, o analisador de dados de domínio de tempo 240 pode ser adaptado para determinar uma medição de transição, a medição de transição sendo baseada em um nivel de transitoriedade na corrente de dados de dominio de tempo ou nos segmentos de dados em que o indicador de transição pode indicar se o nivel de trans itoriedade excede um limite predeterminado.
A Figura 2c mostra uma outra configuração do aparelho 200. Nas configurações mostradas na Figura 2c, o processador de segmento 210 pode ser adaptado para prover segmentos de dados com a primeira e a segunda regiões de sobreposição, o codificador de dominio c de tempo 220 pode ser adaptado para codificação de todos os segmentos de dados, o codificador de dominio de frequência 230 pode ser adaptado para codificação de todos os segmentos de dados de janela e o controlador 250 pode ser adaptado para controlar o codificador de dominio de tempo 220 e o codificador de dominio de frequência 220 e o codificador de dominio de frequência 2 30, de modo que para segmentos de dados tendo uma primeira i ndicação de transição, dados de saida do codificador de dominio de tempo 220 são incluidos na corrente de dados codificada, e para segmentos de dados tendo uma segunda indicação de transição, dados de saida do codificador de dominio de frequência 230 são incluidos na corrente de dados codificada. Em outras configurações, ambos os dados de saida do codificador de dominio de tempo 220 e do codificador de dominio de frequência 230 podem ser incluidos na corrente de dados codificada. O indicador de transição pode estar indicando se um segmento de dados é associado ou correlacionado com um sinal de voz ou com um sinal de música. Nas configurações, o codificador de dominio de frequência 230 pode ser usado para mais segmentos de dados tipo música e o codificador de dominio de tempo 220 pode ser usado para mais segmentos de dados do tipo voz. Nas configurações, codificações paralelas podem ser utilizadas, por exemplo, para sinal de áudio tipo voz tendo música de fundo.
Na configuração ilustrada na Figura 2c, múltiplas possibilidades são concebíveis para o controlador 250, para controlar os componentes múltiplos dentro do aparelho 200. As diferentes possibilidades são indicadas por linhas pontilhadas na Figura 2c. Por exemplo, o controlador 250 poderia ser acoplado ao codificador de dominio de tempo 220 e ao codificador de dominio de frequência 230, de modo a escolher qual codificador deveria produzir uma saida codificada com base na indicação de transição. Em uma outra configuração, o controlador 250 pode controlar uma troca nas saidas do codificador de dominio de tempo 220 e no codificador de dominio de frequência 230.
Nesta configuração, ambos, o codificador de dominio de tempo 220 e o codificador de dominio de frequência 230, podem codificar todos os segmentos de dados e o controlador 250 pode ser adaptado para escolher por meio da referida troca qual é acoplado às saidas dos codificadores, qual segmento de dados codificado deveria ser incluido na corrente de dados codificada, com base na eficiência de codificação, respectivamente a indicação de transição. Em outras configurações, o controlador 250 pode ser adaptado para controlar o processador de segmento 210 para prover os segmentos de dados tanto para o codificador de dominio de tempo 220 quanto para o codificador de dominio de frequência 230. O controlador 250 pode, também, controlar o processador de segmento 210 de modo a definir regiões de sobreposição para um segmento de adaptado para controlar uma troca entre o processador de segmento 210 e o codificador de dominio de tempo 220, respectivamente o codificador de dominio de frequência 230. O controlador 250 poderia, então, influenciar a troca, de modo a direcionar segmentos de dados para qualquer um dos codificadores, respectivamente a ambos. O controlador 250 pode ser adicionalmente adaptado para definir as funções de janela para o codificador de dominio de frequência 230 juntamente com as regiões de sobreposição e estratégias de codificação.
Adicionalmente, nas configurações o codificador de dominio de frequência 230 pode ser adaptado para aplicar pesos de funções de janela de acordo com especificações da AAC. O codificador de domínio de frequência 230 pode ser adaptado para converter um segmento de dados de janela para o domínio de frequência, de modo a obter um segmento de dados de domínio de frequência. Além disso, o codificador de domínio de frequência 230 pode ser adaptado para quantificar os segmentos de dados de domínio de frequência e, adicionalmente, o codificador de domínio de frequência 230 pode ser adaptado para avaliar os segmentos de dados de domínio de frequência de acordo com um modelo perceptual.
O codificador de domínio de frequência 230 pode ser adaptado para utilizar um banco de filtro modulado de cosseno, uma transformada de parte sobreposta estendida, um banco de filtro de baixo atraso ou um banco de filtro polifásico, para obter os segmentos de dados de domínio de frequência.
O codificador de domínio de frequência 230 pode ser adaptado para utilizar um MDCT para obter os segmentos de dados de frequência. O codificador de domínio de tempo 220 pode ser adaptado para usar um modelo de previsão para codificação dos segmentos de dados.
Nas configurações em que uma MDCT no codificador de dominio de frequência 230 opera em um modo denominado de bloco longo, isto é, o modo regular de operação que é usado para codificação de sinais de entrada não transientes, comparar com especificações AAC, o excesso introduzido pelo processo de troca pode ser elevado. Isto pode ser verdadeiro para os casos em que apenas uma moldura, isto é, uma taxa de comprimento/moldura de N amostras, deveria ser codificada usando o codificador de dominio de tempo 220 ao invés do codificador de dominio de frequência 230.
Então, todos os valores de entrada para o MDCT podem necessitar de codificação com o codificador de dominio de tempo 220, isto é, 2N amostras estão disponíveis na saida do decodificador de dominio de tempo 110. Dessa maneira, uma excesso de N amostras adicionais poderia ser introduzido. As Figuras 3a a 3d ilustram algumas regiões de sobreposição concebiveis de segmentos, respectivamente funções de janela aplicáveis. 2N amostras podem ter que ser codificadas com o codificador de dominio de tempo 220, de modo a substituir um bloco de dados codificados por dominio de frequência. A Figura 3a ilustra um exemplo, em que os blocos de dados codificados por dominio de frequência usam uma linha sólida, e dados codificados por dominio de tempo usam uma linha pontilhada. Subjacentes às funções de janela, segmentos de dados de são ilustrados, os quais podem ser codificados no dominio de frequência (caixas sólidas) ou no dominio de tempo (caixas pontilhadas). Esta representação será, também, referida nas Figuras 3b a 3d.
A Figura 3a ilustra o caso em que dados são codificados no dominio de frequência, interrompido por um segmento de dados que é codificado no domínio de tempo, e o segmento de dados a seguir é codificado no domínio de frequência novamente. De modo a prover os dados de domínio de tempo que são necessários para cancelar a distorção de domínio de tempo evocada pelo codificador de domínio de frequência 230, ao mudar do domínio de frequência para o domínio de tempo, metade do tamanho de um segmento de sobreposição é requerido, o mesmo não muda de volta do domínio de tempo para o domínio de frequência. Presumindo que o segmento de dados codificado de domínio de tempo na Figura 3a tem um tamanho de 2N, então em seu início e em seu final ele sobrepõe- se aos dados codificados de domínio de frequência em N/2 amostras.
No caso em que mais de uma moldura subsequente pode ser codificada usando o codificador de domínio de tempo 220, o excesso para a seção codificada de domínio de tempo permanece em N amostras. Conforme é ilustrado na Figura 3b, duas molduras consecutivas são codificadas no domínio de tempo e as regiões de sobreposição no início e no final das seções codificadas de domínio de tempo têm a mesma sobreposição, conforme foi explicado com relação à Figura 3a. A Figura 3b mostra a estrutura de sobreposição no caso das duas molduras codificadas com o codificador de domínio de tempo 220. 3N amostras têm que ser codificadas com o codificador de domínio de tempo 220 neste caso.
Este excesso pode ser reduzido nas configurações pela utilização de troca de janela, por exemplo, de acordo com a estrutura que é usada na AAC. A Figura 3c ilustra uma sequência típica de janelas, Longa, Início, Curta e Final, conforme elas são usadas na AAC. Da Figura 3c pode ser visto que os tamanhos das janelas, os tamanhos dos segmentos de dados e, consequentemente, o tamanho das regiões de sobreposição mudam com as diferentes janelas. A sequência ilustrada na Figura 3c é um exemplo para a 5 sequência mencionada acima.
As configurações não deveriam ser limitadas a janelas do tamanho de janelas AAC, no entanto, as configurações se beneficiam de janelas com diferentes regiões de sobreposição e, também, de janelas de diferentes durações. Nas configurações, 10 transições para e a partir de janelas curtas podem utilizar uma sobreposição reduzida como, por exemplo, apresentado por Bernd Edler, "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Frequenz, Vol. 43, N- 9, pág. 252-256, Setembro de 1989 e "Generic Coding of 15 Moving Pictures and Associated Audio: Advanced Audio Coding", Norma Internacional 13818-7, Grupo Especialista de Movimento de Imagens ISO/IEC JTC1/SC29/WG11, 1997, podem ser usados nas configurações para reduzir o excesso para as transições para e a partir das regiões codificadas por dominio de tempo, como é 20 ilustrado na Figura 3d. A Figura 3d ilustra quatro segmentos de dados dos quais os dois primeiros e o último são codificados no dominio de frequência e o terceiro é codificado no dominio de tempo. Quando trocando do dominio de frequência para o dominio de tempo, janelas diferentes com o tamanho de sobreposição reduzido 25 são usadas, portanto reduzindo o excesso.
Nas configurações, a transição pode ser baseada nas janelas de Inicio e Final idênticas àquelas usadas na AAC. As janelas correspondentes para as transições para e a partir das regiões codificadas de dominio de tempo são janelas apenas com regiões pequenas de sobreposição. Como uma consequência, o excesso, isto é, o número de valores adicionais a serem transmitidos devido ao processo de troca diminui substancialmente. De forma geral, o excesso pode ser Novl/2 para cada transição com a sobreposição de janela de Novi amostras. Dessa maneira, uma transição com a janela totalmente sobreposta regular como uma AAC com Novi = 1024 incorre em um excesso de 1024/2 = 512 amostras para a esquerda, isto é, a janela de aumento gradual, e 1024/2 = 512 amostras para a direita, isto é, janela de diminuição gradual, transição resultando em um excesso total de 1024 (= N) amostras. A escolha de uma janela de sobreposição reduzida como as janelas de bloco Curto AAC com Novl = 128 resulta apenas em um excesso geral de 128 amostras.
As configurações podem utilizar um banco de filtro no codificador de dominio de frequência 230 como, por exemplo, um banco de filtro MDCT amplamente usado, entretanto, outras configurações podem também ser usadas com codecs de dominio de frequência baseados em outros bancos de filtro modulados de cosseno. Isto pode compreender os derivados do MDCT, tal como transformadas de parte sobreposta estendida ou bancos de filtro de baixo atraso, assim como bancos de filtro polifásicos, tais como, por exemplo, aquele usado em codecs de áudio MPEG-1-Camada-1/2/3. Nas configurações, implementação eficiente de uma operação de banco de filtro para frente/para trás pode considerar um tipo especifico de janela e dobra/desdobramento usado no banco de filtro. Para cada tipo de banco de filtro modulado, o estágio de análise pode ser implementado eficientemente por uma etapa de pré- processamento e uma transformada de bloco, isto é, tipo DCT ou DFT, para a modulação. Nas configurações, o estágio de sintese correspondente pode ser implementado usando a transformada inversa correspondente e uma etapa de pós-processamento. Configurações 5 podem usar apenas as etapas de pré- e pós-processamento para porções do sinal codificado de dominio de tempo.
As configurações da presente invenção proveem a vantagem de que uma eficiência de código melhor pode ser atingida, visto que a troca entre um codificador de dominio de tempo 220 e o 10 codificador de dominio de frequência 230 pode ser feita com a introdução de muito pouco excesso. Nas seções de sinal de codificação de dominio de tempo subsequentes apenas, sobreposição pode ser omitida completamente nas configurações . Configurações do aparelho 100 permitem a decodificação adequada da corrente de 15 dados codificada.
As configurações aqui proveem a vantagem de que uma taxa de codificação mais baixa pode ser atingida para a mesma qualidade de, por exemplo, um sinal de áudio, respectivamente uma qualidade mais elevada pode ser atingida com a mesma taxa de 20 codificação, visto que os codificadores respectivos podem ser adaptados à transitoriedade no sinal de áudio.
Dependendo de certos requisitos de implementação dos métodos inventivos, os métodos inventivos podem ser implementados em hardware ou software. A implementação pode ser 25 executada usando um meio de armazenagem digital, em especial um disco, DVD ou CD, tendo sinais de controle eletronicamente armazenados nos mesmos, que cooperam com o sistema de computador programável de modo que os métodos inventivos sejam executados. De forma geral, a presente invenção é, portanto, um programa de computador tendo um código de programa armazenado em um meio legivel pela máquina, o código de programa sendo operacional para executar os métodos inventivos quando o programa de computador 5 opera em um computador. Em outras palavras, os métodos inventivos são, portanto, um programa de computador tendo um código de programa para executar pelo menos um dos métodos inventivos quando o programa de computador é executado em um computador. "LISTA DE REFERÊNCIA" 10 100 aparelho para decodificação 110 decodificador de dominio de tempo 120 processador 122 decodificador de dominio de frequência 122a re-quantização 15 124 conversor de dominio de tempo para dominio de frequência 124a transformada de cosseno discreta modificada 126 combinador de dominio de frequência 20 126a 128 adicionador conversor de dominio de frequência para dominio de tempo 128a transformada de cosseno discreta modificada inversa 129 calculador 25 129a estágio de distorção de dominio de tempo 130 combinador de sobreposição/adição 200 aparelho para codificação 210 processador de segmento 220 codificador de dominio de tempo 230 codificador de dominio de frequência 240 analisador de dados de dominio de tempo 250 controlador 5 400 entrada de transformada de cosseno discreta modificada 410 janelas 420 primeira janela de saida de transformada de cosseno discreta modificada inversa 10 425 segunda janela de saida de transformada de cosseno discreta modificada inversa 430 saida final

Claims (37)

1. Um aparelho para decodificar segmentos de dados que representam um fluxo de dados no domínio do tempo, em que um ou mais segmentos de dados são codificados no domínio do tempo e em que um ou mais segmentos de dados são codificados no domínio da frequência, em que os segmentos de dados que são codificados no domínio da frequência representam amostras de dados no domínio do tempo de blocos de dados sobrepostos, o aparelho caracterizado por compreender: um decodificador no domínio do tempo adaptado para decodificar um segmento de dados que é codificado no domínio do tempo, para adquirir dados de saída do decodificador no domínio do tempo; um processador adaptado para processar os segmentos de dados que são codificados no domínio da frequência e os dados de saída do decodificador no domínio do tempo para obter blocos de dados no domínio do tempo, de modo que blocos de dados no domínio do tempo obtidos com base em segmentos de dados consecutivos cujos segmentos de dados consecutivos são codificados no domínio da frequência são blocos de dados no domínio do tempo sobrepostos, e de modo que blocos de dados consecutivos no domínio do tempo, dos quais um é codificado no domínio da frequência e dos quais um é codificado no domínio do tempo, se sobreponham; e um combinador de sobreposição / adição adaptado para combinar os blocos de dados de domínio de tempo sobrepostos para obter os segmentos de dados decodificados do fluxo de dados de domínio de tempo; em que o combinador de sobreposição / adição está adaptado para aplicar pesos de acordo com funções de janela de síntese para blocos de dados de domínio de tempo sobrepostos, em que a função de janela de síntese é adaptada a um tamanho de uma região de sobreposição de blocos de dados de domínio de tempo sobrepostos consecutivos, em que uma janela com um tamanho de sobreposição reduzido é aplicada a um bloco de dados no domínio do tempo codificado no domínio da frequência ao mudar do domínio da frequência para o domínio do tempo ou do domínio do tempo para o domínio da frequência; em que um tamanho de uma região sobreposta de dois blocos de dados no domínio do tempo consecutivos que são codificados no domínio da frequência é maior do que um tamanho de uma região sobreposta de dois blocos de dados no domínio do tempo consecutivos, dos quais um é codificado no domínio da frequência e um é codificado no domínio do tempo.
2. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o processador compreende um decodificador de domínio de frequência para decodificar segmentos de dados que são codificados no domínio de frequência para obter segmentos de dados de domínio de frequência.
3. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o processador está adaptado para processar um segmento de dados que é codificado no domínio do tempo e no domínio da frequência em paralelo.
4. O aparelho de acordo com a reivindicação 2, caracterizado pelo fato de que o processador compreende um conversor de domínio de tempo para domínio de frequência para converter os dados de saída do decodificador de domínio de tempo para obter segmentos de dados de domínio de frequência convertidos.
5. O aparelho de acordo com a reivindicação 4, caracterizado pelo fato de que o processador compreende um combinador de domínio de frequência para combinar os segmentos de dados de domínio de frequência e os segmentos de dados de domínio de frequência convertidos para obter um fluxo de dados de domínio de frequência.
6. O aparelho de acordo com a reivindicação 5, caracterizado pelo fato de que o processador compreende um conversor de domínio de frequência para domínio de tempo para converter o fluxo de dados de domínio de frequência em blocos de dados de domínio de tempo sobrepostos.
7. O aparelho de acordo com a reivindicação 2 caracterizado pelo fato de que o decodificador de domínio de frequência compreende ainda um estágio de re-quantização.
8. O aparelho de acordo com a reivindicação 4, caracterizado pelo fato de que o conversor de domínio de tempo para domínio de frequência compreende um banco de filtros modulado por cosseno, uma transformada lapped estendida, um banco de filtros de baixo atraso, um banco de filtros polifásico ou uma transformada discreta de cosseno modificada.
9. O aparelho de acordo com a reivindicação 5, caracterizado pelo fato de que o combinador de domínio de frequência compreende um adicionador.
10. O aparelho de acordo com a reivindicação 6, caracterizado pelo fato de que o conversor de domínio de frequência para domínio de tempo compreende um banco de filtros modulado por cosseno ou uma transformada discreta de cosseno modificada inversamente.
11. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o decodificador no domínio do tempo é adaptado para usar um filtro de predição para decodificar um segmento de dados codificado no domínio do tempo.
12. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que o processador compreende uma calculadora para calcular blocos de dados de domínio de tempo sobrepostos com base nos dados de saída do decodificador de domínio de tempo.
13. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que a calculadora está adaptada para reproduzir uma propriedade de sobreposição do conversor de domínio de frequência para domínio de tempo com base nos dados de saída do decodificador de domínio de tempo.
14. O aparelho de acordo com a reivindicação 13, caracterizado pelo fato de que a calculadora é adaptada para reproduzir uma característica de aliasing de domínio de tempo do conversor de domínio de frequência para domínio de tempo com base nos dados de saída do decodificador de domínio de tempo.
15. O aparelho de acordo com a reivindicação 6, caracterizado pelo fato de que o conversor de domínio de frequência para domínio de tempo é adaptado para converter os segmentos de dados de domínio de frequência fornecidos pelo decodificador de domínio de frequência em blocos de dados de domínio de tempo sobrepostos.
16. O aparelho de acordo com a reivindicação 15, caracterizado pelo fato de que o combinador de sobreposição / adição é adaptado para combinar os blocos de dados de domínio de tempo sobrepostos fornecidos pelo conversor de domínio de frequência para domínio de tempo e a calculadora para obter segmentos de dados decodificados do fluxo de dados de domínio de tempo.
17. O aparelho de acordo com a reivindicação 8, caracterizado pelo fato de que a calculadora compreende um estágio de aliasing de domínio de tempo para dados de saída de aliasing de tempo do decodificador de domínio de tempo para obter os blocos de dados de domínio de tempo sobrepostos.
18. O aparelho de acordo com a reivindicação 12, caracterizado pelo fato de que a calculadora é adaptada para segmentar a saída do decodificador no domínio do tempo em segmentos de calculadora compreendendo 2N amostras sequenciais, aplicar pesos às amostras 2N de acordo com uma função de janela de análise, subtraindo as primeiras N / 2 amostras em ordem reversa das segundas N / 2 amostras, adicionar as últimas N / 2 amostras em ordem inversa às terceiras N / 2 amostras, inverter a segunda e a terceira N / 2 amostras, substituir as primeiras amostras N / 2 pela versão invertida e invertida no tempo das segundas amostras N / 2, substituir as quartas amostras N / 2 com a versão invertida no tempo das terceiras amostras N / 2, e aplicar pesos às amostras 2N de acordo com uma função de janela de síntese.
19. O aparelho de acordo com a reivindicação 6, caracterizado pelo fato de que o combinador de sobreposição / adição é adaptado para aplicar pesos de acordo com uma função de janela de síntese para blocos de dados de domínio de tempo sobrepostos fornecidos pelo conversor de domínio de frequência para domínio de tempo.
20. O aparelho de acordo com a reivindicação 19, caracterizado pelo fato de que o aparelho compreende uma calculadora que está adaptada para aplicar pesos às amostras 2N de acordo com uma função de janela de análise sendo adaptada a um tamanho de uma região de sobreposição de blocos de dados de domínio de tempo sobrepostos consecutivos e em que a calculadora está adaptada para aplicar pesos a as amostras 2N de acordo com uma função de janela de síntese sendo adaptada ao tamanho da região de sobreposição.
21. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que a sobreposição de blocos de dados está sendo determinada de acordo com as especificações AAC.
22. O aparelho de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda um desvio para o processador e o combinador de sobreposição / adição, o desvio sendo adaptado para ignorar o processador e o combinador de sobreposição / adição quando blocos de dados de domínio de tempo consecutivos não sobrepostos incorrem em segmentos de dados que são codificados no domínio do tempo.
23. Um método para decodificar segmentos de dados que representam um fluxo de dados no domínio do tempo, em que um ou mais segmentos de dados são codificados no domínio do tempo e um ou mais segmentos de dados são codificados no domínio da frequência, em que os segmentos de dados que são codificados em o domínio da frequência representa amostras de dados no domínio do tempo de blocos de dados sobrepostos, caracterizado por: decodificar um segmento de dados que é codificado no domínio do tempo, para obter dados de saída de uma decodificação no domínio do tempo; processar um dos um ou mais segmentos de dados que são codificados no domínio da frequência e os dados de saída da decodificação no domínio do tempo para obter blocos de dados no domínio do tempo sobrepostos, de modo que blocos de dados no domínio do tempo obtidos com base em segmentos de dados consecutivos segmentos de dados são codificados na sobreposição de domínio de frequência, e de modo que blocos de dados consecutivos no domínio do tempo, dos quais um é codificado no domínio da frequência e dos quais um é codificado no domínio do tempo, se sobreponham; e combinar os blocos de dados no domínio do tempo sobrepostos para obter segmentos de dados decodificados do fluxo de dados no domínio do tempo; em que os pesos de acordo com as funções da janela de síntese são aplicados aos blocos de dados no domínio do tempo sobrepostos; em que a função de síntese em janelas está adaptada a um tamanho de uma região de sobreposição de blocos de dados de domínio de tempo sobrepostos consecutivos; em que uma janela com um tamanho de sobreposição reduzido é aplicada a um bloco de dados no domínio do tempo codificado no domínio da frequência ao mudar do domínio da frequência para o domínio do tempo ou do domínio do tempo para o domínio da frequência; em que um tamanho de uma região sobreposta de dois blocos de dados no domínio do tempo consecutivos que são codificados no domínio da frequência é maior do que um tamanho de uma região sobreposta de dois blocos de dados no domínio do tempo consecutivos, dos quais um é codificado no domínio da frequência e um é codificado no domínio do tempo; em que o método é realizado usando um aparelho de hardware, ou usando um computador, ou usando uma combinação de um aparelho de hardware e um computador.
24. Um aparelho para gerar um fluxo de dados codificados com base em um fluxo de dados no domínio do tempo, o fluxo de dados no domínio do tempo tendo amostras de um sinal, o aparelho caracterizado pelo fato de compreender: um processador de segmento adaptado para fornecer segmentos de dados do fluxo de dados; um codificador de domínio do tempo adaptado para codificar pelo menos um segmento de dados em janela no domínio do tempo; um codificador de domínio de frequência adaptado para aplicar pesos a amostras do fluxo de dados de domínio de tempo de acordo com uma primeira ou segunda função de janela para obter um segmento de dados em janela, em que a primeira e a segunda funções de janela são adaptadas a regiões sobrepostas de comprimentos diferentes, em que o codificador de domínio de frequência é adaptado para codificar um segmento de dados em janela no domínio de frequência; um analisador de dados no domínio do tempo adaptado para determinar uma indicação de transição associada a um segmento de dados; e um controlador adaptado para controlar o aparelho de modo que, para segmentos de dados tendo uma primeira indicação de transição, dados de saída do codificador de domínio de tempo sejam incluídos no fluxo de dados codificados e para segmentos de dados tendo uma segunda indicação de transição, dados de saída do codificador de domínio de frequência está incluído no fluxo de dados codificados; em que o controlador está adaptado para definir as funções de janelamento para o codificador de domínio de frequência, de modo que uma janela com um tamanho de sobreposição reduzido seja usada ao alternar do domínio da frequência para o domínio do tempo ou do domínio do tempo para o domínio da frequência.
25. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o controlador está adaptado para definir as funções de janela para o codificador de domínio de frequência de modo que um tamanho de uma região de sobreposição de dois segmentos de dados em janela consecutivos que são codificados no domínio de frequência seja maior do que um tamanho de uma região de sobreposição de dois segmentos de dados em janela consecutivos, dos quais um é codificado no domínio da frequência e um é codificado no domínio do tempo.
26. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o analisador de dados no domínio do tempo é adaptado para determinar a indicação de transição do fluxo de dados no domínio do tempo, os segmentos de dados ou de dados fornecidos diretamente pelo processador de segmento.
27. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o analisador de dados no domínio do tempo é adaptado para determinar uma medida de transição, a medida de transição sendo baseada no nível de transitoriedade no fluxo de dados no domínio do tempo ou no segmento de dados e em que o indicador de transição indica se um nível de transitoriedade excede um limite predeterminado.
28. O aparelho de acordo com a reivindicação 24 caracterizado pelo fato de que o processador de segmento está adaptado para fornecer segmentos de dados com regiões sobrepostas de comprimentos diferentes, o codificador de domínio de tempo é adaptado para codificar os segmentos de dados, o codificador de domínio de frequência é adaptado para codificar segmentos de dados em janela, e o controlador é adaptado para controlar o codificador de domínio de tempo e o codificador de domínio de frequência de modo que para segmentos de dados tendo uma primeira indicação de transição, dados de saída do codificador de domínio de tempo sejam incluídos no fluxo de dados codificados e para segmentos de dados em janela tendo um segundo dados de saída de indicação de transição do codificador de domínio de frequência são incluídos no fluxo de dados codificados.
29. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o controlador é adaptado para controlar o processador de segmento para fornecer os segmentos de dados para o codificador de domínio do tempo ou para o codificador de domínio de frequência.
30. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para aplicar pesos de funções de janela de acordo com as especificações AAC.
31. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para converter um segmento de dados em janela para o domínio de frequência para obter um segmento de dados de domínio de frequência.
32. O aparelho de acordo com a reivindicação 30, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para quantizar o segmento de dados de domínio de frequência.
33. O aparelho de acordo com a reivindicação 31, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para avaliar o segmento de dados de domínio de frequência de acordo com um modelo perceptual.
34. O aparelho de acordo com a reivindicação 32, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para utilizar um banco de filtros modulado por cosseno, uma transformada lapped estendida, um banco de filtros de baixo atraso ou um banco de filtros polifásico para obter os segmentos de dados de domínio de frequência.
35. O aparato de acordo com a reivindicação 30, caracterizado pelo fato de que o codificador de domínio de frequência é adaptado para utilizar uma transformada de cosseno discreta modificada para obter os segmentos de dados de domínio de frequência.
36. O aparelho de acordo com a reivindicação 24, caracterizado pelo fato de que o codificador de domínio de tempo é adaptado para usar um filtro de predição para codificar os segmentos de dados.
37. Método para gerar um fluxo de dados codificado com base em um fluxo de dados no domínio do tempo, o fluxo de dados no domínio do tempo tendo amostras de um sinal, caracterizado pelo fato de que compreende: fornecer segmentos de dados do fluxo de dados; determinar uma indicação de transição associada aos segmentos de dados; codificar um segmento de dados no domínio do tempo; aplicar pesos a amostras do fluxo de dados no domínio do tempo de acordo com uma primeira ou segunda função de janela para obter um segmento de dados em janela, em que a primeira e a segunda funções de janela são adaptadas para regiões sobrepostas de comprimentos diferentes e codificando o segmento de dados em janela no domínio da frequência; e controlar de modo que, para segmentos de dados tendo uma primeira indicação de transição, dados de saída que são codificados no domínio do tempo sejam incluídos no fluxo de dados codificados e para segmentos de dados tendo uma segunda indicação de transição, dados de saída que são codificados no domínio de frequência sejam incluídos no fluxo de dados codificado; em que as funções de janelamento são definidas de modo que uma janela com um tamanho de sobreposição reduzido seja usada ao mudar do domínio da frequência para o domínio do tempo ou do domínio do tempo para o domínio da frequência.
BRPI0718738-6A 2006-12-12 2007-12-07 Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo BRPI0718738B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR122019024992-0A BR122019024992B1 (pt) 2006-12-12 2007-12-07 Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86967006P 2006-12-12 2006-12-12
US60/869,670 2006-12-12
PCT/EP2007/010665 WO2008071353A2 (en) 2006-12-12 2007-12-07 Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Publications (3)

Publication Number Publication Date
BRPI0718738A2 BRPI0718738A2 (pt) 2015-03-24
BRPI0718738A8 BRPI0718738A8 (pt) 2018-10-16
BRPI0718738B1 true BRPI0718738B1 (pt) 2023-05-16

Family

ID=39410130

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0718738-6A BRPI0718738B1 (pt) 2006-12-12 2007-12-07 Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
BR122019024992-0A BR122019024992B1 (pt) 2006-12-12 2007-12-07 Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR122019024992-0A BR122019024992B1 (pt) 2006-12-12 2007-12-07 Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo

Country Status (20)

Country Link
US (8) US8818796B2 (pt)
EP (1) EP2052548B1 (pt)
JP (1) JP5171842B2 (pt)
KR (1) KR101016224B1 (pt)
CN (2) CN102395033B (pt)
AT (1) ATE547898T1 (pt)
AU (1) AU2007331763B2 (pt)
BR (2) BRPI0718738B1 (pt)
CA (1) CA2672165C (pt)
ES (1) ES2383217T3 (pt)
HK (2) HK1126602A1 (pt)
IL (1) IL198725A (pt)
MX (1) MX2009006201A (pt)
MY (1) MY148913A (pt)
NO (1) NO342080B1 (pt)
PL (1) PL2052548T3 (pt)
RU (1) RU2444071C2 (pt)
TW (1) TWI363563B (pt)
WO (1) WO2008071353A2 (pt)
ZA (1) ZA200903159B (pt)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
EP3002751A1 (en) 2008-07-11 2016-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
MX2011000369A (es) * 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
AU2009267518B2 (en) 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
RU2515704C2 (ru) 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
WO2010003521A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
CN102216982A (zh) * 2008-09-18 2011-10-12 韩国电子通信研究院 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备
JP5555707B2 (ja) * 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2011013980A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2011034374A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
BR112012009032B1 (pt) * 2009-10-20 2021-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento
RU2591011C2 (ru) * 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
CN105355209B (zh) 2010-07-02 2020-02-14 杜比国际公司 音高增强后置滤波器
PL3451333T3 (pl) 2010-07-08 2023-01-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder wykorzystujący kasowanie aliasingu w przód
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
EP3023985B1 (en) 2010-12-29 2017-07-05 Samsung Electronics Co., Ltd Methods for audio signal encoding and decoding
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
SG185519A1 (en) * 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
MX2013009304A (es) * 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
MY159444A (en) * 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
SG192745A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Noise generation in audio codecs
CA2827335C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
TWI488177B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
SG192721A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US10075471B2 (en) 2012-06-07 2018-09-11 Amazon Technologies, Inc. Data loss prevention techniques
US9590959B2 (en) 2013-02-12 2017-03-07 Amazon Technologies, Inc. Data security service
US10084818B1 (en) 2012-06-07 2018-09-25 Amazon Technologies, Inc. Flexibly configurable data modification services
US9286491B2 (en) 2012-06-07 2016-03-15 Amazon Technologies, Inc. Virtual service provider zones
US10210341B2 (en) * 2013-02-12 2019-02-19 Amazon Technologies, Inc. Delayed data access
US9547771B2 (en) 2013-02-12 2017-01-17 Amazon Technologies, Inc. Policy enforcement with associated data
US9608813B1 (en) 2013-06-13 2017-03-28 Amazon Technologies, Inc. Key rotation techniques
US9300464B1 (en) 2013-02-12 2016-03-29 Amazon Technologies, Inc. Probabilistic key rotation
US9367697B1 (en) 2013-02-12 2016-06-14 Amazon Technologies, Inc. Data security with a security module
US10467422B1 (en) 2013-02-12 2019-11-05 Amazon Technologies, Inc. Automatic key rotation
US9705674B2 (en) 2013-02-12 2017-07-11 Amazon Technologies, Inc. Federated key management
US10211977B1 (en) 2013-02-12 2019-02-19 Amazon Technologies, Inc. Secure management of information using a security module
ES2634621T3 (es) 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
CN105556601B (zh) * 2013-08-23 2019-10-11 弗劳恩霍夫应用研究促进协会 用于使用交叠范围中的组合来处理音频信号的装置及方法
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9397835B1 (en) 2014-05-21 2016-07-19 Amazon Technologies, Inc. Web of trust management in a distributed system
US9438421B1 (en) 2014-06-27 2016-09-06 Amazon Technologies, Inc. Supporting a fixed transaction rate with a variably-backed logical cryptographic key
US10116418B2 (en) 2014-08-08 2018-10-30 University Of Florida Research Foundation, Incorporated Joint fountain coding and network coding for loss-tolerant information spreading
US9866392B1 (en) 2014-09-15 2018-01-09 Amazon Technologies, Inc. Distributed system web of trust provisioning
KR101626280B1 (ko) * 2014-11-05 2016-06-01 주식회사 디오텍 합성음의 고조파 성분 제거 방법 및 장치
US10469477B2 (en) 2015-03-31 2019-11-05 Amazon Technologies, Inc. Key export techniques
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
WO2017053490A1 (en) * 2015-09-25 2017-03-30 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method
US10230388B2 (en) * 2015-12-30 2019-03-12 Northwestern University System and method for energy efficient time domain signal processing
WO2017161124A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for video streaming using delay-aware fountain codes
WO2017161122A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for live video streaming using delay-aware fountain codes
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
CN110574024A (zh) * 2017-04-28 2019-12-13 索尼公司 信息处理设备和信息处理方法
WO2020132142A1 (en) * 2018-12-18 2020-06-25 Northwestern University System and method for pipelined time-domain computing using time-domain flip-flops and its application in time-series analysis

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2085680T5 (es) * 1989-01-27 2002-10-16 Dolby Lab Licensing Corp Asignacion adaptativa de bits para un codificador y un descodificador de audio.
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5327518A (en) * 1991-08-22 1994-07-05 Georgia Tech Research Corporation Audio analysis/synthesis system
SG45281A1 (en) * 1992-06-26 1998-01-16 Discovision Ass Method and arrangement for transformation of signals from a frequency to a time domain
US5570455A (en) 1993-01-19 1996-10-29 Philosophers' Stone Llc Method and apparatus for encoding sequences of data
EP0707763B1 (en) 1993-07-07 2001-08-29 Picturetel Corporation Reduction of background noise for speech enhancement
US5651090A (en) 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5615299A (en) 1994-06-20 1997-03-25 International Business Machines Corporation Speech recognition using dynamic features
TW271524B (pt) 1994-08-05 1996-03-01 Qualcomm Inc
ES2143673T3 (es) 1994-12-20 2000-05-16 Dolby Lab Licensing Corp Metodo y aparato para aplicar una prediccion de formas de onda a subbandas de un sistema codificador perceptual.
JP3158932B2 (ja) 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
US5669484A (en) * 1996-01-24 1997-09-23 Paulson; Tom J. Protective cover for the mini-slide knob of dimmers with mini-slide knobs
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6249766B1 (en) 1998-03-10 2001-06-19 Siemens Corporate Research, Inc. Real-time down-sampling system for digital audio waveform data
US6085163A (en) * 1998-03-13 2000-07-04 Todd; Craig Campbell Using time-aligned blocks of encoded audio in video/audio applications to facilitate audio switching
US6119080A (en) * 1998-06-17 2000-09-12 Formosoft International Inc. Unified recursive decomposition architecture for cosine modulated filter banks
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6188987B1 (en) 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CA2809775C (en) * 1999-10-27 2017-03-21 The Nielsen Company (Us), Llc Audio signature extraction and correlation
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
JP3630609B2 (ja) 2000-03-29 2005-03-16 パイオニア株式会社 音声情報再生方法ならびに装置
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US7010480B2 (en) 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6738739B2 (en) 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3750583B2 (ja) 2001-10-22 2006-03-01 ソニー株式会社 信号処理方法及び装置、並びに信号処理プログラム
WO2003077425A1 (fr) 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US7366659B2 (en) 2002-06-07 2008-04-29 Lucent Technologies Inc. Methods and devices for selectively generating time-scaled sound signals
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7295970B1 (en) 2002-08-29 2007-11-13 At&T Corp Unsupervised speaker segmentation of multi-speaker speech data
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
JP3870880B2 (ja) 2002-09-04 2007-01-24 住友電装株式会社 導線と圧接端子との接続構造
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
EP1554716A1 (en) * 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
US20070112573A1 (en) 2002-12-19 2007-05-17 Koninklijke Philips Electronics N.V. Sinusoid selection in audio encoding
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
JP2004302259A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
US8311809B2 (en) 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
WO2005055201A1 (en) 2003-12-01 2005-06-16 Aic A highly optimized method for modelling a windowed signal
FR2865310A1 (fr) 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US8326606B2 (en) 2004-10-26 2012-12-04 Panasonic Corporation Sound encoding device and sound encoding method
GB2420846B (en) * 2004-12-04 2009-07-08 Ford Global Technologies Llc A cooling system for a motor vehicle engine
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US7571104B2 (en) 2005-05-26 2009-08-04 Qnx Software Systems (Wavemakers), Inc. Dynamic real-time cross-fading of voice prompts
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100643310B1 (ko) 2005-08-24 2006-11-10 삼성전자주식회사 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치
US7953605B2 (en) 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
CN1963917A (zh) 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP1855436A1 (en) 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for encrypting encoded audio signal
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR101334366B1 (ko) 2006-12-28 2013-11-29 삼성전자주식회사 오디오 배속 재생 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
KR101403340B1 (ko) 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8050934B2 (en) 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
KR101441896B1 (ko) 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs

Also Published As

Publication number Publication date
HK1126602A1 (en) 2009-09-04
JP2010512550A (ja) 2010-04-22
US10714110B2 (en) 2020-07-14
ES2383217T3 (es) 2012-06-19
MY148913A (en) 2013-06-14
ZA200903159B (en) 2010-07-28
US20170249952A1 (en) 2017-08-31
EP2052548A2 (en) 2009-04-29
US9653089B2 (en) 2017-05-16
US20150179183A1 (en) 2015-06-25
NO20092506L (no) 2009-09-10
MX2009006201A (es) 2009-06-22
US20140222442A1 (en) 2014-08-07
CN102395033B (zh) 2014-08-27
IL198725A (en) 2016-03-31
US20200335117A1 (en) 2020-10-22
US11581001B2 (en) 2023-02-14
CA2672165A1 (en) 2008-06-19
KR101016224B1 (ko) 2011-02-25
TW200841743A (en) 2008-10-16
US20230154475A1 (en) 2023-05-18
US20100138218A1 (en) 2010-06-03
AU2007331763B2 (en) 2011-06-30
US9355647B2 (en) 2016-05-31
US8812305B2 (en) 2014-08-19
BRPI0718738A2 (pt) 2015-03-24
US8818796B2 (en) 2014-08-26
IL198725A0 (en) 2010-02-17
JP5171842B2 (ja) 2013-03-27
NO342080B1 (no) 2018-03-19
US11961530B2 (en) 2024-04-16
CN101589623A (zh) 2009-11-25
ATE547898T1 (de) 2012-03-15
CA2672165C (en) 2014-07-29
US9043202B2 (en) 2015-05-26
TWI363563B (en) 2012-05-01
RU2009117569A (ru) 2011-01-20
WO2008071353A2 (en) 2008-06-19
BR122019024992B1 (pt) 2021-04-06
KR20090085655A (ko) 2009-08-07
BRPI0718738A8 (pt) 2018-10-16
US20130282389A1 (en) 2013-10-24
WO2008071353A3 (en) 2008-08-21
CN102395033A (zh) 2012-03-28
EP2052548B1 (en) 2012-02-29
HK1168706A1 (en) 2013-01-04
CN101589623B (zh) 2013-03-13
US20160225383A1 (en) 2016-08-04
RU2444071C2 (ru) 2012-02-27
PL2052548T3 (pl) 2012-08-31
AU2007331763A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
BRPI0718738B1 (pt) Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
AU2016231283C1 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US8751246B2 (en) Audio encoder and decoder for encoding frames of sampled audio signals
MX2011000373A (es) Aparato y metodo para la codificacion/decodificacion de una señal de audio utilizando un esquema de conmutacion de generacion de señal ajena.
JPWO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
JP2019194711A (ja) スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/18 (2013.01), G10L 19/00 (2013.01), G10L 1

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/18 , G10L 19/00 , G10L 19/02 , G10L 19/022 , G10L 19/032 , G10L 19/26 , H04N 19/00 , H04N 21/2368 , H04N 21/2383 , H04N 21/2662 , H04N 21/434 , H04N 21/438

Ipc: G10L 19/18 (2013.01), G10L 19/022 (2013.01), G10L

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09B Patent application refused [chapter 9.2 patent gazette]
B12B Appeal against refusal [chapter 12.2 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 07/12/2007, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.