BRPI0304542B1 - “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado” - Google Patents

“Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado” Download PDF

Info

Publication number
BRPI0304542B1
BRPI0304542B1 BRPI0304542A BRPI0304542A BRPI0304542B1 BR PI0304542 B1 BRPI0304542 B1 BR PI0304542B1 BR PI0304542 A BRPI0304542 A BR PI0304542A BR PI0304542 A BRPI0304542 A BR PI0304542A BR PI0304542 B1 BRPI0304542 B1 BR PI0304542B1
Authority
BR
Brazil
Prior art keywords
audio signal
information
encoded
multichannel audio
frequency region
Prior art date
Application number
BRPI0304542A
Other languages
English (en)
Inventor
Werner Johannes Oomen Arnoldus
Jeroen Breebaart Dirk
Gosuinus Petrus Schuijers Erick
Leonardus Josephus Dimphina Elisabeth Van De Par Steven
Original Assignee
Koninklijke Philips Nv
Koninl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Nv, Koninl Philips Electronics Nv filed Critical Koninklijke Philips Nv
Publication of BRPI0304542B1 publication Critical patent/BRPI0304542B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

"método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio". sinais de áudio de multicanal são codificados em um sinal de áudio monoaural e informação permitindo recuperar o sinal de áudio de multicanal do sinal de áudio monoaural e a informação. a informação e gerada pela determinação de uma primeira porção da informação para uma primeira região de freqüências do sinal de áudio de multicanal e pela determinação de uma segunda porção da informação para uma segunda região de freqüências do sinal de áudio de multicanal. a segunda região de freqüências é uma porção da primeira região de freqüências e, desse modo, é uma subfaixa da primeira região de freqüências. a informação é em multicamadas, permitindo a definição de uma escala da qualidade de decodificação versus taxa de bits.

Description

(54) Título: MÉTODO E CODIFICADOR PARA CODIFICAR UM SINAL DE ÁUDIO DE MULTICANAL, SINAL DE ÁUDIO MULTICANAL CODIFICADO, E, MÉTODO E DECODIFICADOR PARA DECODIFICAR UM SINAL DE ÁUDIO DE MULTICANAL CODIFICADO (51) Int.CI.: G10L 19/008; G10L 19/02; G10L 19/24; H04S 3/00 (52) CPC: G10L 19/008,G10L 19/0204,G10L 19/24,H04S 3/008,H04S 2420/03 (30) Prioridade Unionista: 16/07/2002 EP 02077869.2, 22/04/2002 EP 02076588.9 (73) Titular(es): KONINKLIJKE PHILIPS Ν. V.
(72) Inventor(es): ARNOLDUS WERNER JOHANNES OOMEN; ERICK GOSUINUS PETRUS SCHUIJERS; DIRK JEROEN BREEBAART; STEVEN LEONARDUS JOSEPHUS DIMPHINA ELISABETH VAN DE PAR “MÉTODO E CODIFICADOR PARA CODIFICAR UM SINAL DE ÁUDIO DE MULTICANAL, SINAL DE ÁUDIO MULTICANAL CODIFICADO, E, MÉTODO E DECODIFICADOR PARA DECODIFICAR UM SINAL DE ÁUDIO DE MULTICANAL CODIFICADO”
A invenção se refere a um método para codificar um sinal de áudio de multicanal, um mostrar codificador para codificar um sinal de áudio de multicanal, um aparelho para fornecer um sinal de áudio, um sinal de áudio codificado, um meio de armazenamento em que o sinal de áudio codificado é armazenado, um método de decodificação de um sinal de áudio codificado, um decodificador para decodificar um sinal de áudio codificado e um aparelho para fornecer um sinal de áudio decodificado.
O EP-A-1107232 divulga um esquema de codificação paramétrico para gerar uma representação de um sinal de áudio estéreo que é composto de um sinal de canal esquerdo e um sinal de canal direito. Para utilizar, eficientemente, a largura de banda de transmissão, essa representação contém a informação referente apenas a um sinal monoaural, que é o sinal de canal esquerdo ou sinal de canal direito e informação paramétrica. O outro sinal estéreo pode ser recuperado com base no sinal monoaural junto com a informação paramétrica. A informação paramétrica compreende circuitos indicadores de localização do sinal de áudio estéreo, incluindo intensidade e características de fase do canal esquerdo e do direito.
É um objetivo da invenção proporcionar um sistema paramétrico de áudio de multicanal que é capaz de definir escalas da qualidade do sinal de áudio codificado com a taxa de bits disponível ou definir em escalas a qualidade do sinal de áudio codificado com a complexidade do decodificador ou a largura de banda de transmissão disponível.
Um primeiro aspecto da invenção proporciona um método
Petição 870170051547, de 21/07/2017, pág. 6/16 • · · · · · • · · • ·· ···· para codificar um sinal de áudio de multicanal conforme reivindicado na reivindicação 1. Um segundo aspecto da invenção proporciona um método para codificar um sinal de áudio de multicanal conforme reivindicado na reivindicação 2. Um terceiro aspecto da invenção proporciona um codificador para codificar um sinal de áudio de multicanal conforme reivindicado na reivindicação 14. Um quarto aspecto da invenção proporciona um codificador para codificar um sinal de áudio de multicanal conforme reivindicado na reivindicação 15. Um quinto aspecto da invenção proporciona um aparelho para fornecer um sinal de áudio conforme reivindicado na reivindicação 16.
Um sexto aspecto da invenção proporciona um sinal de áudio codificado conforme reivindicado na reivindicação 17. Um sétimo aspecto da invenção proporciona a um meio de armazenamento em que o sinal codificado é armazenado conforme reivindicado na reivindicação 18. Um oitavo aspecto da invenção proporciona um método de decodificação conforme reivindicado na reivindicação 19. Um nono aspecto da invenção proporciona um decodificador para decodificar um sinal de áudio codificado conforme reivindicado na reivindicação 20. Um décimo aspecto da invenção proporciona um aparelho para fornecer um sinal de áudio decodificado conforme reivindicado na reivindicação 21. Concretizações vantajosas são definidas nas reivindicações dependentes.
No método para codificar um sinal de áudio de multicanal de acordo com o primeiro aspecto da invenção, um sinal de áudio de canal único é gerado. Ainda, informação é gerada do sinal de áudio de multicanal permitindo a recuperação, com o nível de qualidade requerido, do sinal de áudio de multicanal do sinal de áudio de canal único e da informação. De preferência, a informação compreende conjuntos de parâmetros, por exemplo, conforme conhecido do EP-A-1107232.
De acordo com o primeiro aspecto da invenção, a informação é gerada através da determinação de uma primeira porção da informação para • · ···· · · · · • · · · ········ · _ - · · ·· ····· ····· · • · ·· ·· * · · · · · β · ··· ·· ·· ·· · ·· · ···· uma primeira região de freqüências do sinal de áudio de multicanal e pela determinação de uma segunda porção da informação para uma segunda região de freqüências do sinal de áudio de multicanal. A segunda região de freqüências é uma porção da primeira região de freqüências e, desse modo, é uma sub-faixa da primeira região de freqüências. Agora dois níveis de qualidade de decodificação são possíveis. Para um baixo nível de qualidade do sinal de áudio de multicanal decodificado, o decodifícador usa o sinal de áudio de canal único codificado e a primeira porção da informação. Para um nível de qualidade superior, o decodifícador usa o sinal de áudio de canal único codificado e a primeira e a segunda porção da informação. Naturalmente, é possível selecionar a qualidade de decodificação fora de uma pluralidade de níveis, se uma pluralidade de porções de informação, cada uma estando associada com uma região de freqüências diferente, estiverem presentes. Por exemplo, a primeira porção pode compreender um conjunto único de parâmetros determinado dentro de uma região de freqüências que cobre toda a largura de banda do sinal de áudio de multicanal. E a segunda porção pode compreender diversos conjuntos de parâmetros, cada conjunto de parâmetros sendo determinado para uma sub-faixa ou porção da largura de banda completa. Juntas, as porções, de preferência, cobrem toda a largura de banda. Mas muitas outras possibilidades existem. Por exemplo, a primeira porção pode compreender dois conjuntos de parâmetros, o primeiro conjunto sendo determinado para uma região de freqüências que cobre uma parte inferior da largura de banda total e o segundo conjunto sendo determinado para uma região de freqüências que cobre a outra parte da largura de banda total. A segunda porção pode compreender dois conjuntos de parâmetros determinados para as duas regiões de ffeqüência dentro da parte inferior da largura de banda total. Não é requerido que o número de conjuntos de parâmetros para a parte inferior e a parte superior da largura de banda total sejam iguais.
Figure BRPI0304542B1_D0001
Essa representação do sinal de áudio codificado permite que uma qualidade do sinal de áudio codificado dependa da complexidade do decodificador. Por exemplo, em um decodificador portátil simples um decodificador de baixa complexidade pode ser usado, o qual tem um baixo consumo de energia e que é, portanto, capaz de usar apenas parte da informação. Em uma aplicação de alta finalidade, um decodificador complexo é usado, o qual usa toda a informação disponível no sinal codificado.
A qualidade do áudio decodificado também pode depender da largura de banda de transmissão disponível. Se a largura de banda de transmissão for alta, o decodificador pode decodificar todas as camadas disponíveis, uma vez que elas são todas transmitidas. Se a largura de banda de transmissão for baixa, o transmissor pode decidir transmitir apenas um número limitado de camadas.
Em um segundo aspecto da invenção, o codificador recebe uma taxa de bits máxima permissível do sinal de áudio de multicanal codificado. Essa taxa de bits máxima permissível pode ser definida pela taxa de bits disponível de um canal de transmissão, tal como a Internet, ou de um meio de armazenamento. Em aplicações em que a largura de banda de transmissão é variável e desse modo, a taxa de bits máxima permissível muda com o tempo, é importante ser capaz de se adaptar a essas flutuações da largura de banda de transmissão, a fim de impedir uma qualidade muito baixa do sinal de áudio decodificado. Normalmente, o codificador codifica todas as camadas disponíveis. É decidido no final da transmissão que camadas transmitir, dependendo da capacidade do canal disponível. E possível fazer isso com o codificador no laço, mas isso é mais complicado do que apenas extrair algumas camadas antes da transmissão.
O codificador apenas adiciona a segunda porção da informação para a segunda região de ffeqüência do sinal de áudio de multicanal ao sinal de áudio codificado se uma taxa de bits do sinal de áudio • ··· · ·· ·· • · ····· ····· • · · · · · · de multicanal codificado, que compreende o sinal de áudio de canal único e a primeira e a segunda porção da informação, não for maior do que a taxa de bits máxima permissível. Assim, a segunda porção não está presente no sinal de áudio codificado, se a largura de banda de transmissão não for grande o bastante para suportar a transmissão da segunda porção.
Em uma concretização conforme definido na reivindicação 4, a informação compreende conjuntos de parâmetros, cada uma das porções da informação é representada por um ou mais conjuntos de parâmetros. O número de conjuntos de parâmetros é dependente do número de regiões de freqüências presentes nas porções da informação.
Em uma concretização conforme definido na reivindicação 6, os conjuntos de parâmetros compreendem pelo menos um dos indicadores de localização.
Em uma concretização conforme definido na reivindicação 7, a primeira região de freqüências cobre substancialmente toda a largura de banda do sinal de áudio de multicanal. Dessa maneira, um conjunto de parâmetros basta para proporcionar a informação básica requerida para decodificar o sinal de áudio de canal único no sinal de áudio de multicanal. Dessa maneira, um nível básico de qualidade do sinal de áudio decodificado é garantido. A segunda faixa de freqüências cobre parte da largura de banda total. Dessa maneira, a segunda porção quando presente no sinal de áudio codificado aperfeiçoa a qualidade do sinal de áudio decodificado nessa faixa de freqüências.
Em uma concretização conforme definido na reivindicação 8, a segunda porção da informação compreende pelo menos duas faixas de freqüências que juntas cobrem substancialmente toda a largura de banda do sinal de áudio de multicanal. Dessa maneira, o aperfeiçoamento da qualidade proporcionado pela segunda porção está presente através largura de banda completa.
*··· ·· · ····· ·· ···· · · ·· ·· ········ · ·· ····· ····· · ► · · · ··· · · • · ·· · ·· ····· lâ
Em uma concretização conforme definido na reivindicação 9, a camada base, que compreende o sinal de áudio de canal único e a primeira porção da informação, está sempre presente no sinal de áudio codificado. A camada de intensificação que compreende a segunda porção da informação é codificada apenas se a taxa de bits do sinal de áudio codificado não exceder a taxa de bits máxima permissível. Dessa maneira, a qualidade do sinal de áudio decodificado dependerá da taxa de bits máxima permissível. Se a taxa de bits máxima permissível for baixa demais para acomodar a camada de intensificação, o sinal de áudio decodificado será obtido da camada base, o que produzirá uma qualidade melhor do áudio decodificado do que será o caso se partes imprevisíveis do áudio codificado não alcançarem o decodificador.
Nas concretizações conforme definido em qualquer uma das reivindicações de 10 a 12, as porções da informação (usualmente contendo conjuntos de parâmetros, um conjunto para cada banda de freqüência representada) em um quadro seguinte são codificadas com base nos parâmetros do quadro anterior. Usualmente, isso reduz a taxa de bits das porções codificadas da informação porque, devido à correlação, a informação em dois quadros sucessivos não diferirá substancialmente.
Nas concretizações conforme definido na reivindicação 13, a diferença dos parâmetros de dois quadros sucessivos é codificada em lugar dos parâmetros em si.
Soluções anteriores nos codificadores de áudio que foram sugeridas para reduzir a taxa de bits de material de programa estéreo incluem estéreo de intensidade e estéreo de M/S.
No algoritmo de estéreo de intensidade, altas frequências (tipicamente, acima de 5 kHz) representadas por um sinal de áudio único (isto é, mono) combinado com fatores de escala que variam com o tempo ou fatores de intensidade que permitem recuperar o sinal de áudio decodificado, • · |3 ►· · · · ····· • · · · · · * · · · · ··· ·· ··· · ···« • · · · ·· · ·· · que parece o sinal estéreo original, para essas regiões de frequências. No algoritmo de M/S, o sinal é decomposto em um sinal de soma (ou médio, ou comum) é um sinal de diferença (ou lateral, ou incomum). Essa decomposição algumas vezes é combinada com a análise dos componentes de princípio ou fatores de escala que variam com o tempo. Esses sinais são, então, codificados independentemente, por um codificador de transformação ou um codificador de sub- banda [que são ambos codificadores de forma de onda]. A quantidade de redução de informação obtida por esse algoritmo depende fortemente das propriedades espaciais do sinal fonte. Por exemplo, se o sinal fonte for monoaural, o sinal de diferença é zero e pode ser descartado. Contudo, se a correlação de sinais de áudio esquerdo e direito for baixa (o que freqüentemente é o caso para as regiões de frequências mais altas), esse esquema oferece apenas pouca redução da taxa de bits. Para as regiões de frequências mais baixas, a codificação de M/S, em geral, proporciona mérito significativo.
As descrições paramétrica de sinais de áudio tem ganhado interesse durante os últimos anos, especialmente no campo da codificação de áudio. Tem sido mostrado que a transmissão de parâmetros (quantificados) que descrevem sinais de áudio requer apenas pouca capacidade de transmissão para re-sintetizar um sinal perceptivamente igual na extremidade de recebimento. Contudo, os codificadores de áudio paramétricos correntes focalizam-se na codificação de sinais monoaurais e sinais estéreos são processados como mono-sinais duplos.
Esses e outros aspectos da invenção são evidentes e serão elucidados com referência às concretizações aqui descritas depois.
Nos desenhos:
A figura 1 mostra um diagrama em blocos de um codificador de multicanal para áudio estéreo;
A figura 2 mostra um diagrama em blocos de um decodificador de multicanal para áudio estéreo;
A figura 3 mostra uma representação da corrente de dados codificados;
A figura 4 mostra uma concretização das faixas de ffeqüências de acordo com a invenção;
A figura 5 mostra outra concretização das faixas de ffeqüências de acordo com a invenção;
A figura 6 mostra a determinação dos conjuntos de parâmetros com base em parâmetros em um quadro anterior de acordo com uma concretização da invenção;
A figura 7 mostra um conjunto de parâmetros;
A figura 8 mostra a determinação diferencial dos parâmetros da camada base; e
A figura 9 mostra a determinação diferencial dos parâmetros que correspondem a uma região de ffeqüências de uma camada de intensificação.
A figura 1 mostra um diagrama em blocos de um codificador de multicanal. O codificador recebe um sinal de áudio de multicanal que é mostrado como um sinal estéreo RI, LI e o codificador fornece o sinal de áudio de multicanal codificado EBS.
O misturador para baixo 1 combina o sinal estéreo ou os canais estéreos RI, LI em um sinal de áudio de canal único (também referido como um sinal monoaural) SC. Por exemplo, o misturador para baixo 1 pode determinar a média dos sinais de áudio de entrada é RI, LI.
O codificador 3 codifica o sinal monoaural SC para obter um sinal monoaural codificado ESC. O codificador 3 pode ser de uma espécie conhecida, por exemplo, um codificador de MPEG - LII, MPEG - LII (mp3) ou MPEG2-AAC).
O circuito de determinação de parâmetros dois determinam os conjuntos de parâmetros Sl, S2,... caracterizando a informação INF com base nos sinais de áudio de entrada RI, LI. Opcionalmente, o circuito de determinação de parâmetros 2 recebe a taxa de bits máxima permissível MBR para determinar apenas os conjuntos de parâmetros Sl, S2,... que, quando codificados pelo codificador de parâmetros 4, junto com o sinal monoaural codificado ESC, não excedem a taxa de bits máxima permissível MBR. Os parâmetros codificados são denotados por EIN.
O formatador 5 combina o sinal monoaural codificado SC e os parâmetros codificados EIN em um fluxo de dados em um formato desejado para obter o sinal de áudio de multicanal codificado EBS.
A operação do codificador é elucidada em mais detalhes agora a seguir, à guisa de exemplo, com relação a uma concretização. O sinal de áudio de multicanal LI, RI é codificado em um sinal monoaural único SC (mais uma vez também referido como um sinal de áudio de canal único). A parametrização de atributos espaciais dos sinais de áudio de multicanal LI, RI é realizada pelo circuito de determinação de parâmetros 2. Os parâmetros contêm informação sobre como restaurar o sinal de áudio de multicanal LI, RI do sinal monoaural SC. Os parâmetros, comumente, são codificados pelo codificador de parâmetros 4, antes da combinação dos mesmos com o sinal monoaural único codificado ESC. Desse modo, para aplicações gerais de codificação de áudio, esses parâmetros combinados apenas com um sinal de áudio monoaural são transmitidos ou armazenados. O sinal codificado combinado é o sinal de áudio de multicanal codificado EBS. A capacidade de transmissão ou de armazenamento necessária para transmitir ou armazenar o sinal de áudio de multicanal codificado EBS é reduzida fortemente, comparado com os codificadores de áudio que processam os multicanais independentemente. Não obstante, a impressão espacial original é mantida pela informação INF que contém os (conjuntos de) parâmetros.
Em particular, a descrição paramétrica de áudio de multicanal • · · ···· ·· ·
RI, LI está relacionada com um modelo de processamento binaural que objetiva a descrição do processamento de sinal efetivo do sistema de auditoria binaural.
O modelo divide o áudio que entra LI, RI em diversos sinais de banda limitada, que, de preferência, são espaçados linearmente em uma escala de taxa de ERB. A largura de banda desses sinais depende da freqüência central, seguindo a taxa de ERB. Subsequentemente, de preferência, para cada banda de freqüência, as propriedades seguintes dos sinais que entram são analisadas:
- A diferença de nível interaural, ou ILD, definida pelos níveis relativos do sinal de banda limitada derivando dos ouvidos esquerdo e direito;
- A diferença de tempo interaural (ou fase) ITD (ou IPD), definida pelo retardo interaural (ou desvio de fase) correspondente ao pico na função de correlação cruzada interaural; e
- A (dis)similaridade das formas de onda que não podem ser levadas em conta por ITDs ou ILDs, que podem ser parametrizadas pela correlação cruzada interaural máxima IC (por exemplo, o valor da correlação cruzada na posição do pico máximo).
Os conjuntos Sl, S2,... dos três parâmetros, um conjunto para cada banda de freqüência FR1, FR2,..., variam com o tempo. Contudo, uma vez que o sistema de auditoria binaural é muito moroso em seu processamento, a taxa de atualização dessas propriedades é muito baixa (tipicamente dezenas de milissegundos).
Pode ser suposto que os parâmetros que variam com o tempo (lentamente) são as únicas propriedades de sinais espaciais que o sistema de auditoria binaural tem disponível e que a partir desses parâmetros dependentes do tempo e da freqüência o mundo da auditoria percebido é reconstruído pelos níveis mais altos do sistema de auditoria.
A figura 2 mostra um diagrama em blocos de um decodificador de multicanal. O decodificador recebe o sinal de áudio de multicanal codificado EBS e fornece o sinal de áudio de multicanal decodificado recuperado, que é mostrado como sinal estéreo RO, LO.
O desformatador 6 recupera o sinal monoaural codificado 5 ESC' e os parâmetros codificados EIN' do fluxo de dados EBS. O decodificador 7 decodifica o sinal monoaural codificado ESC' no sinal monoaural de saída SCO. O decodificador 7 pode ser de qualquer espécie conhecida (naturalmente que corresponda ao codificador que foi usado), por exemplo, o decodificador 7 é um decodificador de MPEG. O decodificador 8 decodifica os parâmetros codificados EIN' nos parâmetros de saída INO.
O demultiplexador 9 recupera os sinais de áudio de estéreo de saída LO e RO através da aplicação dos conjuntos de parâmetros Sl, S2,... dos parâmetros de saída INO no sinal monoaural de saída SCO.
A figura 3 mostra uma representação do fluxo de dados 15 codificados. Por exemplo, em cada quadro Fl, F2,..., o pacote de dados começa com um cabeçalho H seguido pelo sinal monoaural codificado ECS agora indicado por A, uma primeira porção PI da informação codificada EIN, uma segunda porção P2 da informação codificado EIN e uma terceira porção
P3 da informação codificada EIN.
Se o quadro Fl, F2,... compreende apenas o cabeçalho H e o sinal monoaural codificado ECS, apenas o sinal monoaural SC transmitido.
Conforme divulgado em EP-A-1107232, a banda de ffeqüência total em que o sinal de áudio de entrada ocorre é dividida em uma pluralidade de bandas de subffequências, que juntas cobrem toda a banda de ffeqüências. Na terminologia de acordo com a invenção, a informação de multicanal INF é codificada em uma pluralidade de conjuntos de parâmetros Sl, S2,..., um conjunto para cada banda de sub-fireqüências FR1, FR2,... Essa pluralidade de conjuntos de parâmetros Sl, S2... é codificada na primeira porção PI da informação de codificação EIN. Desse modo, para transmitir um • ·· ···· ·· ·
Figure BRPI0304542B1_D0002
sinal de áudio de multicanal de qualidade de nível básico, o fluxo de bits compreende o cabeçalho H, a porção A, que é o sinal monoaural codificado ECS e a primeira porção PI.
No fluxo de bits de acordo com uma concretização da invenção, a primeira porção PI consiste de parâmetros de conjunto único Sl, somente. O conjunto único sendo determinado para a largura de banda completa FR1. Esse fluxo de bits, que compreende o cabeçalho H e as porções A e PI proporciona uma camada básica de qualidade, indicada por BL na figura 3.
Para suportar uma qualidade intensificada, porções adicionais P2, P3 da informação codificada EIN estão presentes no fluxo de bits. Essas porções adicionais formam uma camada de intensificação EL. O fluxo de bits pode compreender uma porção única adicional P2 ou mais de uma porção adicional. A porção adicional P2, de preferência, compreende uma prioridade de conjuntos Sl, S2,..., as bandas de sub-freqüências FR2, FR3,..., de preferência, cobrindo toda a banda de freqüências FR1. A qualidade intensificada pode também estar presente de uma maneira escalonada, o primeiro nível de intensificação é proporcionado pela camada de intensificação ELI, que compreende a primeira porção. E uma segunda camada de intensificação EL compreende a primeira camada de intensificação ELI e a segunda camada de intensificação EL2 que compreende a porção P3.
A porção adicional P2 também pode compreender um conjunto único S2 de parâmetros que corresponde a uma única banda de freqüências FR2, que é uma sub-banda da banda total de freqüências FR1. A porção adicional P2 também pode compreender um número de conjuntos de parâmetros S2, S3,... que correspondem às bandas de freqüências FR2, FR3,..., que juntas não cobrem a banda de freqüências total completa FR1.
A porção adicional P3, de preferência, contém conjuntos de parâmetros para bandas de ffeqüências que subdividem pelo menos uma das ’ sub-bandas da porção adicional P2.
Esse formato do fluxo de bits de acordo com a invenção 5 permite, no canal de transmissão, ou no decodificador, definir em escalas a qualidade do sinal de áudio decodificado com a taxa de bits do canal de transmissão, ou a complexidade de decodificação do decodificador. Por exemplo, se o decodificador de áudio tiver um baixo consumo de energia, como é importante em aplicações portáteis, o decodificador pode ter uma * 10 baixa complexidade e usa apenas as porções Η, A e Pl. Seria mesmo possível que o decodificador fosse capaz de realizar operações mais complexas em um consumo de energia maior, se o usuário indicar que ele deseja uma qualidade superior do áudio decodificado.
Também é possível que o codificador tenha conhecimento da 15 taxa de bits máxima permissível MBR, que pode ser transmitida através do canal de transmissão o que pode ser armazenada em um meio de armazenamento. Agora, o codificador é capaz de decidir quantas, se houver, porções adicionais Pl, P2,..., se encaixam dentro da taxa de bits máxima permissível MBR. O codificador codifica apenas essas porções permissíveis • 20 Pl, P2,..., no fluxo de bits.
A figura 4 mostra uma concretização das faixas de ffeqüências de acordo com a invenção. Nesta concretização, a banda de ffeqüências FR1 é igual à largura de banda total FBW do sinal de áudio de multicanal LI, RI e a banda de ffeqüências FR2 é uma banda de sub-ffeqüências da largura de banda total FBW.
Se essas são as únicas faixas de ffeqüências para as quais os conjuntos de parâmetros Sl, S2,..., são determinados, um conjunto de parâmetros único Sl é determinado para a banda de ffeqüências FR1 e está presente na porção Pl e um conjunto de parâmetros único S2 é determinado • ···· ·· · ···· · • · · • · ··· · •···· · • · · · • · · · · · · para a banda de freqüências FR2 está presente na porção P2. A definição de escala de qualidade é possível usando ou não usando a porção P2.
A figura 5 mostra outra concretização das faixas de freqüências de acordo com a invenção. Nesta concretização, a banda de freqüências FR1 é mais uma vez igual a largura de banda total FBW e as bandas de sub-ffeqüências FR2 e FR3 juntas cobrem toda a largura de banda FBW. Ou dito em outras palavras, a banda de freqüências FR1 é subdividida em bandas de sub-ffeqüências FR2 e FR3.
Se essas são as únicas faixas de freqüências para as quais os conjuntos de parâmetros Sl, S2,... são determinados, porção PI compreende um conjunto de parâmetros único S1 determinado para a banda de freqüências FR1 e a porção P2 compreende dois conjuntos de parâmetros S2 e S3 determinados para a banda de freqüências FR2 e FR3, respectivamente. A definição de escala de qualidade é possível pelo uso ou não uso da porção P2.
A figura 6 mostra a determinação dos conjuntos de parâmetros com base nos parâmetros em um quadro anterior de acordo com uma concretização da invenção.
A figura 6 mostra um fluxo de dados que compreende em cada 20 quadro Fl, F2,... a informação codificada EIN, que compreende a porção PI que é parte da camada base BL e a porção P2 que forma a camada de intensificação EL.
No quadro Fl, a porção PI compreende um conjunto único de parâmetros Sl, que são determinados para toda a largura de banda
FR1. A porção P2, à guisa de exemplo, compreende quatro conjuntos de parâmetros S2, S3, S4, S5, que são determinados para as bandas de subfreqüências FR2, FR3, FR4, FR5, respectivamente. As quatro bandas de sub-freqüências FR2, FR3, FR4, FR5 subdividem a banda de freqüências FR1.
Figure BRPI0304542B1_D0003
·«·· · · · • ····
No quadro F2, que sucede o quadro Fl, porção PI compreende um conjunto único de parâmetros SI', que são determinados para a largura de banda total FR1 e são parte da camada base BL'. A porção P2 compreende quatro conjuntos de parâmetros S2', S3', S4', S5, que são mais uma vez determinados para as bandas de sub-freqüências FR2, FR3, FR4, FR5, respectivamente, e que formam a camada de intensificação EL'.
É possível codificar cada um dos conjuntos de parâmetros Sl, S2,... para cada um dos quadros Fl, F2,.. separadamente. Também é possível codificar os conjuntos de parâmetros da porção P2 com relação aos parâmetros da porção Pl. Isso é indicado pelas setas que começam em Sl e terminam em S2 a S5 no quadro Fl. Naturalmente isso também é possível nos outros quadros F2,... (não mostrados). Da mesma maneira, é possível codificar o conjunto de parâmetros Sl' com relação a Sl. E, finalmente, os conjuntos de parâmetros S2', S3', S4', S5' podem ser codificados correlação os conjuntos de parâmetros S2, S3, S4, S5.
Dessa maneira, a taxa de bits da informação codificada EIN pode ser reduzida quando a redundância ou a correlação entre conjunto de parâmetros Si é usada.
De preferência, os novos parâmetros dos novos conjuntos de parâmetros Sl', S2', S3', S4', S5' são codificados coma a diferença de seu valor e o valor dos parâmetros dos conjuntos anteriores de parâmetros S1, S2, S3, S4, S5.
Em intervalos de tempo regulares, pelo menos o conjunto de parâmetros Sl tem que ser codificado absolutamente e não diferencial para impedir que erros se propaguem demais.
A figura 7 mostra um conjunto de parâmetros. Cada conjunto de parâmetros Si pode compreender um ou mais parâmetros. Usualmente os parâmetros são indicadores de localização que proporcionam informação a cerca da localização de objetos sonoros na informação de áudio. Usualmente, ···· · os indicadores de localização são a diferença de nível interaural ILD, a diferença de tempo ou de fase interaural ITD ou IPD e a correlação cruzada interaural IC. Informação mais detalhada sobre esses parâmetros da proporcionada no Documento 5574 da Audio Engineering Society Convention Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression apresentado na 112a Convenção - 10 - 13 de maio de 2002, Munique, Alemanha, por Christo Faller e outros.
A figura 8 mostra a determinação diferencial de um parâmetro da camada base. O eixo horizontal indica quadros sucessivos F1 a F5. O eixo vertical mostra o valor PVG de um parâmetro do conjunto de parâmetros SI da camada base BL. Esse parâmetro tem os valores Al a A5 para os quadros F1 a F5, respectivamente. A contribuição desse parâmetro para a taxa de bits da informação codificada EIN diminuirá, se, não os valores reais A2 a A5 do parâmetro forem codificados, mas as diferenças menores Dl, D2.
A figura 9 mostra a determinação diferencial dos parâmetros que correspondem à região de frequências de uma camada de intensificação. O eixo horizontal indica dois quadros sucessivos F1 e F2. O eixo vertical indica os valores de um parâmetro particular da camada base BL e da camada de intensificação EL. Neste exemplo, a camada base BL compreende a porção PI da informação INF com um único conjunto de parâmetros determinado para toda a faixa de freqüências FBW, o parâmetro particular da porção PI tem o valor Al para o quadro F1 e A2 para o quadro F2. A camada de intensificação EL compreende a porção P2 da informação INF com três conjuntos de parâmetros determinados para três faixas de freqüências respectivas FR2, FR3, FR4, que juntas enchem a faixa de freqüências total FBW. Os três parâmetros particulares (por exemplo, o parâmetro que representa ILD) têm um valor B11,B12, B13no quadro F1 e um valor B21, B23 no quadro F2.
as ·· · ···«
A contribuição desses parâmetros para a taxa de bits da informação codificada EIN diminuirá, se, não os valores reais Bll a B23 do parâmetro particular forem codificados, mas as diferenças Dll, D12,..., por que essas diferenças podem ser codificadas mais eficientemente do que os valores reais.
Para resumir, em uma concretização preferida de acordo com a invenção, é proposto organizar a informação de parâmetro estéreo INF de modo que uma camada base BL contenha um conjunto de parâmetros ( de preferência, a diferença tempo/ nível e a correlação) Sl, que determinado para a largura de banda total FBW do sinal de áudio de multicanal LI, RI. A camada de intensificação EL contém múltiplos conjuntos de parâmetros S2, S3,.. que correspondem aos intervalos de freqüências subseqüentes FR2, FR3,... dentro da largura de banda total FBW. Para eficiência da taxa de bits, os conjuntos de parâmetros S2, S3,..., na camada de intensificação EL podem ser codificados diferencialmente com relação ao conjunto de parâmetros Sl na camada base BL.
A informação INF é codificada em uma maneira de múltiplas camadas para ativar uma definição de escala da qualidade de decodificação versus taxa de bits.
Para concluir no que segue agora, uma concretização preferida de acordo com a invenção é elucidada com relação ao código de programa e sua elucidação.
Primeiro, para todos os sub-quadros (as porções Pl, P2) nos quadros Fl, F2,... os dados ESC para representação monoaural SC, os dados
EIN para o conjunto de parâmetros estéreos Sl para a largura de banda total FBW e os parâmetros estéreos S2, S3,..., para os bins (ou regiões) de freqüências FR2, FR3,.., são determinados.
O código de programa é mostrado no lado esquerdo e uma elucidação do código de programa é proporcionada sob a descrição no lado • ···· · ·· Cs/M • · · · · · v ········ · direito.
Código Descrição
{ { para (f=0; f<nrof trames; f++) 1 para todos os quadros fazer:
example_mono_frame(f) obter dados para a representação de sinal monoaural (a porção A na figura 3)
example_stereo_extension_layer_l(f) obter dados de largura de banda total de parâmetros estéreos (a porção Pl)
} example_stereo_extension_lyer_2(f) } obter bins de freqüências de parâmetros estéreos (a porção P2)
Em segundo lugar, dependendo do valor do bit refresh_stereo, os parâmetros estéreos para toda a largura de banda são codificadas absolutamente (valor real a codificado) ou a diferença com valores prévios é codificada. O código a seguir é válido para diferença de nível interaural ILD.
Código
Example_stereo_extension_layer_l(f) {
Refreshstereo
If (refresh_stereo=: = 1) { ildglobal [f] }
else {
ild_global_diff[f] }
}
Descrição um bit denotando se o dado deve ser ou não codificado absolutamente se o dado tiver que ser codificado absolutamente codificar a diferença de intensidade interaural real (ild) para toda a área de freqüências (global) se não for um restaurar codificar ild com relação ao quadro anterior
Em terceiro lugar dependendo do valor do bit refresh_stereo, os parâmetros estéreos para todos os bins de ffeqüência são codificadas absolutamente (o valor real é codificado) ou a diferença com os parâmetros correspondentes para toda a largura de banda é codificada. O código seguinte é válido para diferença de nível interaural ILD.
• · · • · • · • · · 19 ··· ·· ···· ·· · ····· · ··· ···· · · · • · · · · ········ • · · ·· ····· · ···· • · ·· ·· · ·· · · · ··· ·· ·· ·· · ·· · ··
Código Example_stereo_extension_layer_2(f) Descrição
if (refresh stereo= =2) { for (b=0<nrof;bins;b++) { ild_bin [f,b] } else { for (b=0; b<nrof bins; b++ { ild_bin_diff[f,b] se restaurar
para todos os bins de freqüências codificar a ild naquele bin em relação ao valor global
se não restaurar
Para todos os bins
} codificar a ild dentro de um bin particular em relação ao valor naquele bin no quadro anterior.
}
Em que:
O termo refresh_stereo é um sinalizador denotando se os parâmetros estéreos serão restaurados (0 = FALSO; 1 = VERDADEIRO) o termo Ild_global[sf] representa o nível de representação absoluto codificado de Huffman da ILD para a área total de freqüências para o quadro f.
O termo ild_global_diff[f] representa o nível de representação absoluto codificado de Huffman da ILD para a área total de freqüências para o quadro f.
O termo ild_bin[f,b] representa o nível de representação absoluto codificado de Huffman da ILD para o quadro f e o bin b.
O termo ild_bin_diff[f,b] representa o nível de representação absoluto codificado de Huffman da ILD para o quadro f e o bin b.
Deve ser notado que as concretizações mencionadas acima ilustram antes do que limitam a invenção e aqueles habilitados na técnica serão capazes de projetar muitas concretizações alternativas, sem afastamento do escopo das reivindicações anexas.
• · · • · · > · · · · · • · • · · · ·
Embora a invenção seja elucidada nas figuras com relação a um sinal estéreo, a extensão a um sinal de áudio de mais de dois canais pode facilmente ser realizada pela pessoa habilitada.
Nas reivindicações, quaisquer sinais de referência colocados 5 entre parênteses não serão construídos como limitando a invenção. A palavra compreendendo não excluirá a presença de elementos ou etapas que não aquelas relacionadas em uma reivindicação. A invenção pode ser implementada por meio de hardware compreendendo diversos elementos distintos e por meio de um computador adequadamente programado. Na reivindicação de dispositivo enumerando diversos meios, diversos desses meios podem ser concretizados por um e o mesmo item de hardware. O simples fato de que certas medidas são citadas em reivindicações diferentes mutuamente dependentes não indica que uma combinação dessas medidas não pode ser usada com vantagem.
Em resumo, sinais de áudio de multicanal são codificados em um sinal de áudio monoaural e a informação que permite recuperar o sinal de áudio de multicanal do sinal de áudio monoaural e a informação. A informação é gerada pela determinação de uma primeira porção da informação para uma primeira região de ffeqüências do sinal de áudio de multicanal e pela determinação de uma segunda porção da informação para uma segunda região de ffeqüências do sinal de áudio de multicanal. A segunda região de ffeqüências é uma porção da primeira região de ffeqüências e, desse modo, é uma subfaixa da primeira região de ffeqüências. A informação é em múltiplas camadas, permitindo uma definição de escala da qualidade de decodificação versus taxa de bits.

Claims (15)

  1. REIVINDICAÇÕES
    1. Método para codificar um sinal de áudio de multicanal compreendendo pelo menos dois canais de áudio (RI, LI), caracterizado pelo fato de compreender:
    5 geração (1) de um sinal de áudio de canal único (SC) compreendendo uma combinação particular dos pelo menos dois canais de áudio (RI, LI), e codificação do sinal de áudio de canal único (SC) em um fluxo de bits (EBS) como um sinal de áudio de canal único codificado (ESC);
    geração (2) de informação (INF) a partir de pelo menos dois canais
    10 de áudio (RI, LI) permitindo recuperar com um nível de qualidade requerido o sinal de áudio de multicanal do sinal de áudio de canal único (SC) e da informação (INF), a geração (2) da informação compreendendo:
    determinação (2) de uma primeira porção da informação (Pl) consistindo de um conjunto único de parâmetros (Sl) determinado para uma
    15 primeira região de frequências (FR1) do sinal de áudio de multicanal e codificação da primeira porção da informação (Pl) no fluxo de bits (EBS) como uma primeira porção codificada da informação (EIN); e determinação (2) de uma segunda porção da informação (P2) para uma segunda região de frequências (FR2) do sinal de áudio multicanal, a
    20 segunda região de frequência (FR2) sendo uma porção da primeira região de frequências (FR1) e codificando a segunda porção da informação (P2) no fluxo de bits (EBS) como uma segunda porção codificada da informação (EIN).
  2. 2. Método para codificar um sinal de áudio de multicanal, de acordo com a reivindicação 1, caracterizado pelo fato de compreender:
    25 geração de um sinal de áudio de canal único;
    geração de informação de pelo menos dois canais de áudio permitindo recuperar com o nível de qualidade requerido o sinal de áudio de multicanal do sinal de áudio de canal único e a informação, a geração da informação compreendendo:
    Petição 870170097116, de 12/12/2017, pág. 5/13 recebimento de uma taxa de bits máxima permissível do sinal de áudio de multicanal codificado; e determinação (2) da segunda porção da informação (P2) para a segunda região de frequências (FR2) do sinal de áudio de multicanal, apenas
    5 se, uma taxa de bits do sinal de áudio de multicanal codificado compreendendo o sinal de áudio de canal único (SC), a primeira porção da informação (Pl), e a segunda porção da informação (P2) não for superior a uma taxa de bits máxima permissível (MBR).
  3. 3. Método de codificação de acordo com a reivindicação 1, 10 caracterizado pelo fato de a informação (INF) compreender conjuntos de parâmetros (Sl, S2, ...), a primeira porção (Pl) compreender pelo menos um primeiro (Sl) dos conjuntos de parâmetros (Sl, S2,...), a segunda porção (P2) compreender pelo menos um segundo (S2) dos conjuntos de parâmetros (Sl, S2,...), em que cada conjunto de parâmetros está associado com uma região
    15 de frequências (FR1, FR2,...) correspondente.
  4. 4. Método de codificação de acordo com a reivindicação 4, caracterizado pelo fato de os conjuntos de parâmetros compreenderem pelo menos um indicador de localização (ILD, ITD, IPD, IC).
  5. 5. Método de codificação de acordo com a reivindicação 4, 20 caracterizado pelo fato de pelo menos um indicador de localização (ILD, ITD,
    IPD, IC) ser selecionado de: uma diferença de nível interaural (ILD), uma diferença interaural de tempo ou de fase (ITD, IPD), ou uma correlação cruzada interaural (IC).
  6. 6. Método de codificação de acordo com a reivindicação 1 ou
    25 2, caracterizado pelo fato de a primeira região de frequências (FR1) cobrir uma largura de banda total (FBW) do sinal de áudio de multicanal.
  7. 7. Método de codificação de acordo com a reivindicação 1, caracterizado pelo fato de a primeira região de frequências (FR1) cobrir substancialmente uma largura de banda total (FBW) do sinal de áudio de
    Petição 870170097116, de 12/12/2017, pág. 6/13 multicanal, a segunda região de frequência (FR2) cobrir uma porção da largura de banda total (FB W) e de a determinação (2) da segunda porção da informação (P2) ser adaptada para determinar conjuntos de parâmetros (S2, S3,...) para a segunda região de frequências (FR2) e um conjunto de regiões de frequências
    5 adicionais (FR3, FR4, FR5)„ a segunda região de frequências (FR2) e o conjunto de região de frequências adicionais (FR3, FR4, FR5) cobrindo substancialmente toda a largura de banda (FBW), onde o conjunto de regiões de frequências adicionais (FR3, FR4, FR5) compreende pelo menos uma região de frequências adicional (FR3).
  8. 10 8. Método de codificação de acordo com a reivindicação 7, caracterizado pelo fato de o sinal de áudio de canal único (SC) e a primeira porção (Pl) da informação (INF) formarem uma camada base (BL) de informação que está sempre presente no sinal de áudio de multicanal codificado (EBS) e pelo fato de o método compreender o recebimento (2) de uma taxa de
    15 bits máxima permissível (MBR) do sinal de áudio de multicanal codificado (EBS), a segunda porção da informação (P2) formando uma camada de intensificação de informação (EL) que é codificada apenas se a taxa de bits da camada base codificada (DL) e da camada de intensificação (EL) não for maior do que a taxa de bits máxima permissível (MBR).
    20 9. Método de codificação de acordo com a reivindicação 3, caracterizado pelo fato de a determinação (2) da primeira porção de informação (Pl) em um quadro particular (F2) de informação codificada (EIN) compreender a determinação (2) do primeiro dos conjuntos de parâmetros (Sl’) no quadro particular (F2) e a codificação do primeiro dos
    25 conjuntos de parâmetros (SI’) com base no primeiro dos conjuntos de parâmetros (Sl) de um quadro (Fl) que precede o quadro particular (F2).
    10. Método de codificação de acordo com a reivindicação 7, caracterizado pelo fato de a determinação (2) da segunda porção de informação (P2) em um quadro particular (F2) da informação codificada
    Petição 870170097116, de 12/12/2017, pág. 7/13 (EIN) compreender a determinação (2) dos conjuntos de parâmetros (S2', S3', ...) da segunda porção (P2) no quadro particular (F2) e a codificação dos conjuntos de parâmetros (S2', S3', ...) da segunda porção (P2) no quadro particular (F2) com base nos conjuntos de parâmetros (S2', S3', ...) de um
    5 quadro (Fl) que precede o quadro particular (F2).
  9. 11. Método de codificação de acordo com a reivindicação 7, caracterizado pelo fato de a determinação (2) da segunda porção de informação (P2) em um quadro particular (F2) da informação codificada (EIN) compreender a determinação (2) dos conjuntos de parâmetros (S2', S3', ...) da
    10 segunda porção (P2) no quadro particular (F2) e a codificação dos conjuntos de parâmetros (S2', S3',...) da segunda porção (P2) no quadro particular (F2) com base no primeiro dos conjuntos de parâmetros (Sl) de um quadro (Fl) que precede o quadro particular (F2).
  10. 12. Método de codificação de acordo com qualquer uma das
    15 reivindicações de 9 a 11, caracterizado pelo fato de a determinação (2) compreender o cálculo de uma diferença entre os parâmetros correspondentes no quadro particular (F2) e o quadro (Fl) que precede o quadro particular (F2).
  11. 13. Codificador para codificar um sinal de áudio de multicanal compreendendo pelo menos dois canais de áudio (RI, LI), caracterizado pelo
    20 fato de compreender:
    meios para gerar (1) um sinal de áudio de canal único (SC) compreendendo uma combinação particular dos pelo menos dois canais de áudio (RI, LI);
    meios para gerar (2) informação (INF) de pelo menos dois 25 canais de áudio (RI, LI) permitindo recuperar com um nível de qualidade requerido o sinal de áudio de multicanal do sinal de áudio de canal único (SC) e da informação (INF), os meios para gerar (2) a informação compreendendo, meios para determinar (2) uma primeira porção da informação
    Petição 870170097116, de 12/12/2017, pág. 8/13 (Pl) consistindo de um conjunto único de parâmetros (Sl) determinado para uma primeira região de frequências (FR1) do sinal de áudio de multicanal; e meios para determinar (2) uma segunda porção da informação (P2) para uma segunda região de frequências (FR2) do sinal de áudio de
    5 multicanal, a segunda região de frequências (FR2) sendo uma porção da primeira região de frequências (FR1).
  12. 14. Codificador para codificar um sinal de áudio de multicanal, de acordo com a reivindicação 13, caracterizado pelo fato de compreender:
    meios para determinar (2) a segunda porção da informação (P2) 10 para a segunda região de frequências (FR2) do sinal de áudio de multicanal, apenas se, uma taxa de bits do sinal de áudio de multicanal codificado, compreendendo o sinal de áudio de canal único (SC) e a primeira porção da informação (Pl), e a segunda porção da informação (P2) não for maior do que a taxa de bits máxima permissível (MBR).
  13. 15 15. Sinal de áudio multicanal codificado, caracterizado pelo fato de compreender:
    um sinal de áudio de canal único (SC) compreendendo uma combinação particular dos pelo menos dois canais de áudio (RI, LI);
    informação (INF) de pelo menos dois canais de áudio (RI, LI) 20 permitindo recuperar com um nível de qualidade requerido o sinal de áudio de multicanal do sinal de áudio de canal único (SC) e da informação (INF), a informação compreendendo:
    uma primeira porção da informação (Pl) consistindo de um conjunto único de parâmetros (Sl) determinado para uma primeira região de
    25 frequências (FR1) do sinal de áudio de multicanal; e uma segunda porção da informação (P2) para uma segunda região de frequências (FR2) do sinal de áudio de multicanal, a segunda região de frequências (FR2) sendo uma porção de primeira região de frequências (FR1).
    Petição 870170097116, de 12/12/2017, pág. 9/13
  14. 16. Método para decodificar um sinal de áudio de multicanal codificado, sendo codificado como definido na reivindicação 15, caracterizado pelo fato de compreender:
    obtenção (6, 7) de um sinal de áudio de canal único decodificado 5 (SCO) compreendendo uma combinação particular dos pelo menos dois canais de áudio (RI, LI);
    obtenção (6, 8) de informação decodificada (INO) da informação (INF) permitindo recuperar o sinal de áudio de multicanal do sinal de áudio de canal único decodificado (SCO) e da informação decodificada
    10 (INO), a informação decodificada (INO) compreendendo a primeira porção da informação (Pl) e a segunda porção da informação (P2); e aplicação (9) da primeira porção da informação (Pl) ou da primeira porção (Pl) e da segunda porção da informação (P2) no sinal de áudio de canal único (SCO) para gerar um sinal de áudio de multicanal decodificado
    15 (LO, RO).
  15. 17. Decodificador para decodificar um sinal de áudio de multicanal codificado, sendo codificado conforme definido na reivindicação 15, caracterizado pelo fato de compreender:
    meios para obter (6, 7) um sinal de áudio de canal único 20 decodificado (SCO) compreendendo uma combinação particular dos pelo menos dois canais de áudio (RI, LI);
    meios para obter (6, 7) informação decodificada (INO) da informação (INF) permitindo recuperar o sinal de áudio de multicanal do sinal de áudio de canal único decodificado (SCO) e da informação decodificada
    25 (INO), a informação decodificada (INO) compreendendo a primeira porção da informação (Pl) e a segunda porção da informação (P2); e meios para aplicar (9) a primeira porção da informação (Pl) e a segunda porção da informação (P2) no sinal de áudio de canal único (SCO) para gerar um sinal de áudio de multicanal decodificado (LO, RO).
    Petição 870170097116, de 12/12/2017, pág. 10/13
    1/3 ·· · ···· · • · · · · • ········ • ····· ····· ·· · ·· ·
    RI
    LI
BRPI0304542A 2002-04-22 2003-04-22 “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado” BRPI0304542B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02076588 2002-04-22
EP02077869 2002-07-16
PCT/IB2003/001591 WO2003090207A1 (en) 2002-04-22 2003-04-22 Parametric multi-channel audio representation

Publications (1)

Publication Number Publication Date
BRPI0304542B1 true BRPI0304542B1 (pt) 2018-05-08

Family

ID=29252214

Family Applications (2)

Application Number Title Priority Date Filing Date
BR0304542-0A Pending BR0304542A (pt) 2002-04-22 2003-04-22 Método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio
BRPI0304542A BRPI0304542B1 (pt) 2002-04-22 2003-04-22 “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR0304542-0A Pending BR0304542A (pt) 2002-04-22 2003-04-22 Método e codificador para codificar um sinal de áudio de multicanal, aparelho para fornecer um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio

Country Status (11)

Country Link
US (1) US8498422B2 (pt)
EP (1) EP1500083B1 (pt)
JP (1) JP4714415B2 (pt)
KR (1) KR101021079B1 (pt)
CN (1) CN1647156B (pt)
AT (1) ATE332003T1 (pt)
AU (1) AU2003216686A1 (pt)
BR (2) BR0304542A (pt)
DE (1) DE60306512T2 (pt)
ES (1) ES2268340T3 (pt)
WO (1) WO2003090207A1 (pt)

Families Citing this family (115)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
DE60310449T2 (de) 2002-11-28 2007-10-31 Koninklijke Philips Electronics N.V. Audiosignalkodierung
US20040264713A1 (en) * 2003-06-27 2004-12-30 Robert Grzesek Adaptive audio communication code
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US20070168183A1 (en) * 2004-02-17 2007-07-19 Koninklijke Philips Electronics, N.V. Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI497485B (zh) 2004-08-25 2015-08-21 Dolby Lab Licensing Corp 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法
ATE442644T1 (de) * 2004-08-26 2009-09-15 Panasonic Corp Mehrkanalige signal-dekodierung
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
DE102004042819A1 (de) 2004-09-03 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Multikanalsignals und Vorrichtung und Verfahren zum Decodieren eines codierten Multikanalsignals
EP1792520A1 (en) * 2004-09-06 2007-06-06 Koninklijke Philips Electronics N.V. Audio signal enhancement
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
US7860721B2 (en) * 2004-09-17 2010-12-28 Panasonic Corporation Audio encoding device, decoding device, and method capable of flexibly adjusting the optimal trade-off between a code rate and sound quality
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
KR101268218B1 (ko) * 2004-11-29 2013-10-17 내셔널 유니버시티 오브 싱가포르 휴대형 장치용 지각인지 저전력 오디오 디코더
KR101215868B1 (ko) * 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
JP5017121B2 (ja) * 2004-11-30 2012-09-05 アギア システムズ インコーポレーテッド 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method
WO2006070757A1 (ja) * 2004-12-28 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20080162148A1 (en) * 2004-12-28 2008-07-03 Matsushita Electric Industrial Co., Ltd. Scalable Encoding Apparatus And Scalable Encoding Method
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075269A1 (en) * 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
WO2006082790A1 (ja) 2005-02-01 2006-08-10 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
US9626973B2 (en) 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
DE102005010057A1 (de) 2005-03-04 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines codierten Stereo-Signals eines Audiostücks oder Audiodatenstroms
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US8270439B2 (en) * 2005-07-08 2012-09-18 Activevideo Networks, Inc. Video game system using pre-encoded digital audio mixing
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
JP5113051B2 (ja) 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法
RU2414741C2 (ru) * 2005-07-29 2011-03-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ создания многоканального сигнала
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR101277041B1 (ko) * 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
KR100878828B1 (ko) * 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
KR20070038439A (ko) 2005-10-05 2007-04-10 엘지전자 주식회사 신호 처리 방법 및 장치
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US8036900B2 (en) * 2005-11-04 2011-10-11 National University Of Singapore Device and a method of playing audio clips
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
US20090018824A1 (en) * 2006-01-31 2009-01-15 Matsushita Electric Industrial Co., Ltd. Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method
ATE456261T1 (de) 2006-02-21 2010-02-15 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
TWI447707B (zh) 2006-02-23 2014-08-01 Lg Electronics Inc 音頻訊號之處理方法及其裝置
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US20080004883A1 (en) * 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
KR20090013178A (ko) 2006-09-29 2009-02-04 엘지전자 주식회사 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
US20080269929A1 (en) 2006-11-15 2008-10-30 Lg Electronics Inc. Method and an Apparatus for Decoding an Audio Signal
WO2008069596A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2102855A4 (en) 2006-12-07 2010-07-28 Lg Electronics Inc METHOD AND APPARATUS FOR DECODING AUDIO SIGNAL
EP2632164A3 (en) 2007-01-12 2014-02-26 ActiveVideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
US9826197B2 (en) 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
KR101453732B1 (ko) 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
EP2128856A4 (en) * 2007-10-16 2011-11-02 Panasonic Corp DEVICE FOR PRODUCING A STREAM AND DECODING DEVICE AND CORRESPONDING METHOD
JP5668923B2 (ja) * 2008-03-14 2015-02-12 日本電気株式会社 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
JP5773124B2 (ja) * 2008-04-21 2015-09-02 日本電気株式会社 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
PL2301017T3 (pl) * 2008-05-09 2017-05-31 Nokia Technologies Oy Urządzenie akustyczne
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
KR101108061B1 (ko) 2008-09-25 2012-01-25 엘지전자 주식회사 신호 처리 방법 및 이의 장치
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
US8258849B2 (en) * 2008-09-25 2012-09-04 Lg Electronics Inc. Method and an apparatus for processing a signal
US8346380B2 (en) 2008-09-25 2013-01-01 Lg Electronics Inc. Method and an apparatus for processing a signal
JP5309944B2 (ja) * 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
EP2214162A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Upmixer, method and computer program for upmixing a downmix audio signal
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
US7975063B2 (en) * 2009-05-10 2011-07-05 Vantrix Corporation Informative data streaming server
CN101556799B (zh) 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US8194862B2 (en) * 2009-07-31 2012-06-05 Activevideo Networks, Inc. Video game system with mixing of independent pre-encoded digital audio bitstreams
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
EP2628306B1 (en) 2010-10-14 2017-11-22 ActiveVideo Networks, Inc. Streaming digital video between video devices using a cable television system
EP2477418B1 (en) * 2011-01-12 2014-06-04 Nxp B.V. Signal processing method
US9204203B2 (en) 2011-04-07 2015-12-01 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
KR101930907B1 (ko) * 2011-05-30 2019-03-12 삼성전자주식회사 오디오 신호 처리 방법, 그에 따른 오디오 장치, 및 그에 따른 전자기기
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
CN103534753B (zh) * 2012-04-05 2015-05-27 华为技术有限公司 用于信道间差估计的方法和空间音频编码装置
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
WO2014013294A1 (en) 2012-07-19 2014-01-23 Nokia Corporation Stereo audio signal encoder
US9460729B2 (en) * 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
US10199044B2 (en) * 2013-03-20 2019-02-05 Nokia Technologies Oy Audio signal encoder comprising a multi-channel parameter selector
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
CN106104684A (zh) 2014-01-13 2016-11-09 诺基亚技术有限公司 多通道音频信号分类器
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks
WO2016162283A1 (en) * 2015-04-07 2016-10-13 Dolby International Ab Audio coding with range extension
CN107358960B (zh) * 2016-05-10 2021-10-26 华为技术有限公司 多声道信号的编码方法和编码器
CN107358961B (zh) * 2016-05-10 2021-09-17 华为技术有限公司 多声道信号的编码方法和编码器
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US10063612B2 (en) * 2016-09-30 2018-08-28 Amazon Technologies, Inc. Request-based encoding for streaming content portions

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH09274500A (ja) * 1996-04-09 1997-10-21 Matsushita Electric Ind Co Ltd ディジタルオーディオ信号の符号化方法
DE69712230T2 (de) * 1997-05-08 2002-10-31 St Microelectronics Asia Verfahren und gerät zur frequenzdomäneabwärtsumsetzung mit zwangblockschaltung für audiodekoderfunktionen
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE338999T1 (de) * 2001-10-19 2006-09-15 Koninkl Philips Electronics Nv Differentielle kodierung im frequenz bereich von sinusmodell parametern
DE60208426T2 (de) * 2001-11-02 2006-08-24 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur signalkodierung, signaldekodierung und system zum verteilen von audiodaten
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung

Also Published As

Publication number Publication date
EP1500083A1 (en) 2005-01-26
KR20040102163A (ko) 2004-12-03
US8498422B2 (en) 2013-07-30
KR101021079B1 (ko) 2011-03-14
AU2003216686A1 (en) 2003-11-03
WO2003090207A1 (en) 2003-10-30
US20050226426A1 (en) 2005-10-13
ATE332003T1 (de) 2006-07-15
EP1500083B1 (en) 2006-06-28
ES2268340T3 (es) 2007-03-16
JP2005523479A (ja) 2005-08-04
CN1647156A (zh) 2005-07-27
DE60306512T2 (de) 2007-06-21
CN1647156B (zh) 2010-05-26
JP4714415B2 (ja) 2011-06-29
DE60306512D1 (de) 2006-08-10
BR0304542A (pt) 2004-07-20

Similar Documents

Publication Publication Date Title
BRPI0304542B1 (pt) “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
TWI759240B (zh) 用以使用量化及熵寫碼來編碼或解碼方向性音訊寫碼參數之設備及方法
US11647333B2 (en) Audio decoder for audio channel reconstruction
EP2461321B1 (en) Coding device and decoding device
AU2005281937B2 (en) Generation of a multichannel encoded signal and decoding of a multichannel encoded signal
CN105580073B (zh) 音频解码器、音频编码器、方法和计算机可读存储介质
RU2618383C2 (ru) Кодирование и декодирование аудиообъектов
JP7379602B2 (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP2024038139A (ja) 信号をインタリーブするためのオーディオ復号器
US7644001B2 (en) Differentially coding an audio signal
WO2012058805A1 (en) Parametric encoder for encoding a multi-channel audio signal
JP2022084671A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
ES2836682T3 (es) Método y dispositivo para extraer parámetro de diferencia de fase entre canales
ES2867477T3 (es) Decodificación de secuencias de bits de audio con metadatos de replicación de banda espectral mejorada en al menos un elemento de relleno