BR122022015729B1 - Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada - Google Patents

Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada Download PDF

Info

Publication number
BR122022015729B1
BR122022015729B1 BR122022015729-7A BR122022015729A BR122022015729B1 BR 122022015729 B1 BR122022015729 B1 BR 122022015729B1 BR 122022015729 A BR122022015729 A BR 122022015729A BR 122022015729 B1 BR122022015729 B1 BR 122022015729B1
Authority
BR
Brazil
Prior art keywords
signal
channel audio
residual
decorrelated
audio decoder
Prior art date
Application number
BR122022015729-7A
Other languages
English (en)
Other versions
BR122022015729A8 (pt
BR122022015729A2 (pt
Inventor
Sascha DICK
Christian Helmrich
Johannes Hilpert
Andreas Holzer
Original Assignee
Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. filed Critical Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V.
Publication of BR122022015729A2 publication Critical patent/BR122022015729A2/pt
Publication of BR122022015729A8 publication Critical patent/BR122022015729A8/pt
Publication of BR122022015729B1 publication Critical patent/BR122022015729B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Trata-se de um decodificador de áudio de múltiplos canais, para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada, que é configurado para realizar uma combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual para obter um dos sinais de áudio de saída. O decodificador de áudio de múltiplos canais é configurado para determinar um peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada que depende do sinal residual. Um codificador de áudio de múltiplos canais para fornecer uma representação codificada de um sinal de áudio de múltiplos canais é configurado para obter um sinal de downmix com base no sinal de áudio de múltiplos canais, para fornecer parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais e para fornecer um sinal residual. O codificador de áudio de múltiplos canais é configurado para variar uma quantidade de sinal residual incluído na representação codificada que depende do sinal de áudio de múltiplos canais.

Description

CAMPO DA TÉCNICA
[001] Uma modalidade de acordo com a invenção se refere a um decodificador de áudio de múltiplos canais para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada.
[002] Outra modalidade de acordo com a invenção se refere a um codificador de áudio de múltiplos canais para fornecer uma representação codificada de um sinal de áudio de múltiplos canais.
[003] Outra modalidade de acordo com a invenção se refere a um método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada.
[004] Outra modalidade de acordo com a invenção se refere a um método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais.
[005] Outra modalidade de acordo com a presente invenção se refere a um programa de computador para realizar um dos métodos.
[006] Geralmente, algumas modalidades de acordo com a invenção se referem a uma criptografia paramétrica e residual combinada.
ANTECEDENTES DA INVENÇÃO
[007] Atualmente, a demanda de armazenamento e transmissão de conteúdo de áudio tem aumentado progressivamente. Ademais, as exigências de qualidade para o armazenamento e transmissão de conteúdo de áudio também tem aumentado progressivamente. Em conformidade, os conceitos para a codificação e decodificação de conteúdo de áudio foram aprimorados. Por exemplo, a chamada “criptografia de áudio avançada” (AAC) foi desenvolvida, a qual é descrita, por exemplo, na norma internacional ISO/IEC 13818-7: 2003.
[008] Ademais, algumas extensões espaciais foram produzidas, como, por exemplo, o chamado conceito “MPEG surround”, que é descrito, por exemplo, na norma internacional ISO/IEC 23003-1:2007. Ademais os aprimoramentos adicionais para a codificação e decodificação de informações espaciais de sinais de áudio são descritos na norma internacional ISO/IEC 23003-2:2010, que se refere à chamada criptografia de objeto de áudio espacial. Ademais, um conceito de codificação/decodificação de áudio flexível (comutável), que fornece a possibilidade de codificar tanto sinais de áudio gerais quanto sinais de voz com boa eficiência de criptografia e de lidar com sinais de áudio de múltiplos canais, é definido na norma internacional ISO/IEC 23003-3:2012, que descreve o chamado conceito de “criptografia de áudio e voz unificada”.
[009] No entanto, há um desejo de fornecer um conceito ainda mais avançado de uma codificação e decodificação eficiente de sinais de áudio de múltiplos canais.
SUMÁRIO DA INVENÇÃO
[010] Uma modalidade de acordo com a invenção proporciona um decodificador de áudio de múltiplos canais para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O decodificador de áudio de múltiplos canais é configurado para realizar uma combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual para obter um dos sinais de áudio de saída. O decodificador de áudio de múltiplos canais é configurado para determinar um peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada que depende do sinal residual.
[011] Essa modalidade de acordo com a invenção se baseia na constatação de que os sinais de áudio de saída podem ser obtidos com base em uma representação codificada de uma maneira muito eficiente se um peso que descreve uma contribuição do sinal descorrelacionado à combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual forem ajustados dependendo do sinal residual. Em conformidade, ajustando-se o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada que depende do sinal residual, é possível mesclar (ou desvanecimento) entre uma criptografia paramétrica (ou uma criptografia principalmente paramétrica) e uma criptografia residual (ou criptografia principalmente residual) sem transmitir informações de controle adicionais. Ademais, constatou-se que o sinal residual, que é incluído na representação codificada, é uma boa indicação para o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada, visto que é tipicamente preferencial dispor um peso (comparativamente) maior no sinal descorrelacionado se o sinal residual for (comparativamente) fraco (ou insuficiente para uma reconstrução da energia desejada) e dispor um peso (comparativamente) menor no sinal descorrelacionado se o sinal residual for (comparativamente) forte (ou suficiente para reconstruir a energia desejada). Em conformidade, o conceito mencionado acima permite uma transição gradual entre uma criptografia paramétrica (em que, por exemplo, características de energia desejadas e/ou características de correlação são sinalizadas por parâmetros e reconstruídas adicionando-se um sinal descorrelacionado) e uma criptografia residual (em que o sinal residual é usado para reconstruir sinais de áudio de saída - em alguns casos, até mesmo forma de onda dos sinais de áudio de saída - com base em um sinal de downmix). Em conformidade, é possível adaptar a técnica para a reconstrução, e também a qualidade da reconstrução, para os sinais decodificados sem ter sobrecarga de sinalização adicional.
[012] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada que (também) depende do sinal descorrelacionado. Determinando-se o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada tanto dependente do sinal residual quanto dependente do sinal descorrelacionado, o peso pode ser bem ajustado às características de sinal, de modo que uma boa qualidade de reconstrução dos pelo menos dois sinais de áudio de saída com base na representação codificada (em particular, com base no sinal de downmix, no sinal descorrelacionado e no sinal residual) possa ser alcançada.
[013] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para obter parâmetros de upmix com base na representação codificada e para determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada que depende dos parâmetros de upmix. Considerando-se os parâmetros de upmix, é possível reconstruir características desejadas dos sinais de áudio de saída (como, por exemplo, uma correlação desejada entre os sinais de áudio de saída, e/ou características de energia desejadas dos sinais de áudio de saída) para obter um valor desejado.
[014] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada, de modo que o peso do sinal descorrelacionado diminua com o aumento da energia dos um ou mais sinais residuais. Esse mecanismo permite ajustar a precisão da reconstrução dos pelo menos dois sinais de áudio de saída que dependem da energia do sinal residual. Se a energia dos sinais residuais é comparativamente alta, o peso da contribuição do sinal descorrelacionado é comparativamente pequeno, de modo que o sinal descorrelacionado não mais afete de modo prejudicial uma alta qualidade da reprodução que é causada usando-se o sinal residual. Em contrapartida, se a energia do sinal residual é comparativamente baixa, ou até mesmo zero, um peso grande é dado ao sinal descorrelacionado, de modo que o sinal descorrelacionado possa levar as características dos sinais de áudio de saída a valores desejados de modo eficiente.
[015] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada, de modo que um peso máximo, que é determinado por um parâmetro de upmix de sinal descorrelacionado, seja associado ao sinal descorrelacionado se uma energia do sinal residual for zero, e de modo que um peso zero seja associado ao sinal descorrelacionado se uma energia do sinal residual ponderada com o uso de um coeficiente de ponderação de sinal residual for maior ou igual a uma energia do sinal descorrelacionado, ponderada com o parâmetro de upmix de sinal descorrelacionado. Essa modalidade se baseia na constatação de que a energia desejada, que deve ser adicionada ao sinal de downmix, é determinada pela energia do sinal descorrelacionado, ponderada com o parâmetro de upmix de sinal descorrelacionado. Em conformidade, conclui-se que não é mais necessário adicionar o sinal descorrelacionado se a energia do sinal residual, ponderada com o coeficiente de ponderação de sinal residual, for maior ou igual à dita energia do sinal descorrelacionado, ponderada com o parâmetro de upmix de sinal descorrelacionado. Em outras palavras, o sinal descorrelacionado não é mais usado para fornecer os pelo menos dois sinais de áudio de saída caso se julgue que o sinal residual porta energia suficiente (por exemplo, suficiente a fim de alcançar uma energia total suficiente).
[016] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para computar um valor de energia ponderado do sinal descorrelacionado, ponderada dependendo de um ou mais parâmetros de upmix de sinal descorrelacionado, e para computar um valor de energia ponderado do sinal residual, ponderado com o uso de um ou mais parâmetros de upmix de sinal residual (que pode ser igual ao coeficiente de ponderação de sinais residuais mencionado acima), para determinar um fator que depende do valor de energia ponderado do sinal descorrelacionado e do valor de energia ponderado do sinal residual, e para obter um peso que descreve a contribuição do sinal descorrelacionado a (pelo menos) um dos sinais de saída de áudio com base no fator. Constatou-se, que esse procedimento é bem adequado para uma computação eficiente do peso que descreve a contribuição do sinal descorrelacionado a um ou mais dos sinais de áudio de saída.
[017] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para multiplicar o fator por um parâmetro de upmix de sinal descorrelacionado, para obter o peso que descreve a contribuição do sinal descorrelacionado a (pelo menos) um dos sinais de áudio de saída. Usando-se tal procedimento, é possível considerar tanto um ou mais parâmetros que descrevem características de sinal desejadas dos pelo menos dois sinais de áudio de saída (que são descritas pelo parâmetro de upmix de sinal descorrelacionado) e a relação entre a energia de sinal descorrelacionado e a energia do sinal residual, a fim de determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada. Desse modo, há tanto a possibilidade de mesclar (ou desvanecimento) entre uma criptografia paramétrica (ou criptografia predominantemente paramétrica) quanto uma criptografia residual (ou a criptografia predominantemente residual) enquanto ainda se consideram as características desejadas dos sinais de áudio de saída (que são refletidas pelo parâmetro de upmix de sinal descorrelacionado).
[018] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para computar a energia do sinal descorrelacionado, ponderado com o uso dos parâmetros de upmix de sinal descorrelacionado, em uma pluralidade de canais de upmix e intervalos de tempo, para obter o valor de energia ponderado do sinal descorrelacionado. Em conformidade, é possível evitar fortes variações do valor de energia ponderado do sinal descorrelacionado. Desse modo, um ajuste estável do decodificador de áudio de múltiplos canais é alcançado.
[019] De modo semelhante, o decodificador de áudio de múltiplos canais é configurado para computar a energia do sinal residual, ponderado com o uso de parâmetros de upmix de sinal residual, em uma pluralidade de canais de upmix e intervalos de tempo, para obter o valor de energia ponderado do sinal residual. Em conformidade, um ajuste estável do decodificador de áudio de múltiplos canais é alcançado, visto que fortes variações do valor de energia ponderado do sinal residual são evitadas.
[020] No entanto, o período de referência pode ser selecionado suficientemente curto para permitir um ajuste dinâmico da ponderação.
[021] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para computar o fator que depende de uma diferença entre o valor de energia ponderado do sinal descorrelacionado e o valor de energia ponderado do sinal residual. Uma computação, que “compara” o valor de energia ponderado do sinal descorrelacionado e o valor de energia ponderado do sinal residual permite suplementar o sinal residual (ou a versão ponderada do sinal residual) com o uso (da versão ponderada) do sinal descorrelacionado, em que o peso que descreve a contribuição do sinal descorrelacionado é ajustado às necessidades para o fornecimento dos pelo menos dois sinais de canal de áudio.
[022] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para computar o fator que depende de uma razão entre uma diferença entre o valor de energia ponderado do sinal descorrelacionado e o valor de energia ponderado do sinal residual, e o valor de energia ponderado do sinal descorrelacionado. Constatou-se, que a computação do fator que depende dessa razão suscita bons resultados particulares. Ademais, deve-se observar que a razão descreve qual porção da energia total do sinal descorrelacionado (ponderada com o uso do parâmetro de upmix de sinal descorrelacionado) é necessária na presença do sinal residual a fim de alcançar uma boa impressão de audição (ou de modo equivalente, para ter substancialmente a mesma energia de sinal nos sinais de áudio de saída quando em comparação com o caso em que não há sinal residual).
[023] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para determinar pesos que descrevem contribuições do sinal descorrelacionado a dois ou mais sinais de áudio de saída. Nesse caso, o decodificador de áudio de múltiplos canais é configurado para determinar uma contribuição do sinal descorrelacionado a um primeiro sinal de áudio de saída com base no valor de energia ponderado do sinal descorrelacionado e um parâmetro de upmix de sinal descorrelacionado de primeiro canal. Ademais, o decodificador de áudio de múltiplos canais é configurado para determinar uma contribuição do sinal descorrelacionado a um segundo canal de áudio de saída com base no valor de energia ponderado do sinal descorrelacionado e um parâmetro de upmix de sinal descorrelacionado de segundo canal. Em conformidade, dois sinais de áudio de saída podem ser dotados de esforço moderado e boa qualidade de áudio, em que as diferenças entre os dois sinais de áudio de saída são consideradas com o uso de um parâmetro de upmix de sinal descorrelacionado de primeiro canal e um parâmetro de upmix de sinal descorrelacionado de segundo canal.
[024] Em uma modalidade preferencial, o decodificador de áudio de múltiplos canais é configurado para desabilitar uma contribuição do sinal descorrelacionado à combinação ponderada se uma energia residual exceder uma energia de descorrelacionador (isto é, uma energia do sinal descorrelacionado, ou de uma versão ponderada desse). Em conformidade, é possível comutar para uma criptografia residual pura, sem o uso do sinal descorrelacionado, se o sinal residual portar energia suficiente, se a energia residual exceder a energia do descorrelacionador.
[025] Em uma modalidade preferencial, o decodificador de áudio é configurado para determinar, no sentido da banda, o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada que depende de uma determinação em termos de banda de um valor de energia ponderado do sinal residual. Em conformidade, pode-se decidir de modo flexível, sem uma sobrecarga de sinalização adicional, em que bandas de frequência um refinamento dos pelo menos dois sinais de áudio de saída deve ser baseado (ou deve ser predominantemente baseado) em uma criptografia paramétrica, e em que bandas de frequência o refinamento dos pelo menos dois sinais de áudio de saída deve baseado (ou deve ser predominantemente baseado) em uma criptografia residual. Desse modo, pode-se decidir de modo flexível em que bandas de frequência uma reconstrução de forma de onda (ou pelo menos uma reconstrução de forma de onda parcial) deve ser realizada usando-se (pelo menos predominantemente) a criptografia residual ao mesmo tempo em que se mantém o peso do sinal descorrelacionado comparativamente baixo. Desse modo, é possível obter uma boa qualidade de áudio aplicando-se seletivamente a criptografia paramétrica (que é principalmente baseada no fornecimento de um sinal descorrelacionado) e a criptografia residual (que é principalmente baseada no fornecimento de um sinal residual).
[026] Em uma modalidade preferencial, o decodificador de áudio é configurado para determinar o peso que descreve a contribuição do sinal descorrelacionado em uma combinação ponderada para cada quadro dos sinais de áudio de saída. Em conformidade, uma boa resolução de temporização pode ser obtida, que permite comutar de modo flexível entre uma criptografia paramétrica (ou criptografia predominantemente paramétrica) e a criptografia residual (ou criptografia predominantemente residual) entre quadros subsequentes. Em conformidade, a decodificação de áudio pode ser ajustada às características do sinal de áudio com uma boa resolução de tempo.
[027] Outra modalidade de acordo com a invenção proporciona um decodificador de áudio de múltiplos canais para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O decodificador de áudio de múltiplos canais é configurado para obter (pelo menos) um dos sinais de áudio de saída com base em uma representação codificada de um sinal de downmix, uma pluralidade de parâmetros espaciais codificados e uma representação codificada de um sinal residual. O decodificador de áudio de múltiplos canais é configurado para mesclar entre uma criptografia paramétrica e a criptografia residual que depende do sinal residual. Em conformidade, um conceito de decodificação de áudio muito flexível é alcançado, em que o melhor modo de decodificação (decodificação e criptografia paramétrica versus decodificação e criptografia residual) pode ser selecionado sem sobrecarga de sinalização adicional. Ademais, a consideração explicada acima também é aplicada.
[028] Uma modalidade de acordo com a invenção proporciona um codificador de áudio de múltiplos canais para fornecer uma representação codificada de um sinal de áudio de múltiplos canais. O codificador de áudio de múltiplos canais é configurado para obter um sinal de downmix com base no sinal de áudio de múltiplos canais. Ademais, o codificador de áudio de múltiplos canais é configurado para fornecer parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais e para fornecer um sinal residual. Ademais, o codificador de áudio de múltiplos canais é configurado para variar uma quantidade de um sinal residual incluído na representação codificada que depende do sinal de áudio de múltiplos canais. Variando-se uma quantidade de sinal residual incluído para a representação codificada, é possível ajustar de modo flexível o processo de codificação às características do sinal. Por exemplo, é possível incluir uma quantidade comparativamente grande de sinal residual na representação codificada para porções (por exemplo, para porções temporais e/ou para porções de frequência) em que é desejável preservar, pelo menos parcialmente, a forma de onda do sinal de áudio decodificado. Desse modo, uma reconstrução baseada em sinal residual mais precisa do sinal de áudio de múltiplos canais é possibilitada pela possibilidade de variar a quantidade de sinal residual incluído na representação codificada. Ademais, deve-se observar que, em conjunto com o decodificador de áudio de múltiplos canais discutido acima, um conceito muito eficiente é produzido, visto que o decodificador de áudio de múltiplos canais descrito acima nem mesmo necessita de sinalização adicional para mesclar entre uma criptografia (predominantemente) paramétrica e uma criptografia (predominantemente) residual. Em conformidade, o codificador de múltiplos canais discutido no presente documento permite explorar os benefícios que são possíveis usando-se o codificador de áudio de múltiplos canais discutido acima.
[029] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para variar uma largura de banda do sinal residual que depende do sinal de áudio de múltiplos canais. Em conformidade, é possível ajustar o sinal residual, de modo que o sinal residual auxilie na reconstrução de faixas de frequência ou bandas de frequência mais importantes de modo psicoacústico.
[030] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para selecionar bandas de frequência para as quais o sinal residual é incluído na representação codificada que depende do sinal de áudio de múltiplos canais. Em conformidade, o codificador de áudio de múltiplos canais pode decidir para quais bandas de frequência é necessário, ou mais benéfico, incluir um sinal residual (em que o sinal residual tipicamente resulta em reconstrução de forma de onda pelo menos parcial). Por exemplo, as bandas de frequência significativas de modo psicoacústico podem ser consideradas. Além disso, a presença de eventos transientes também pode ser considerada, visto que um sinal residual tipicamente auxilia no aprimoramento da renderização de transientes em um decodificador de áudio. Ademais, a taxa de bits disponível também pode ser levada em consideração para decidir que quantidade de sinal residual é incluída na representação codificada.
[031] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para incluir seletivamente o sinal residual na representação codificada para bandas de frequência para as quais o sinal de áudio de múltiplos canais é tonal, ao mesmo tempo em que se omite a inclusão do sinal residual na representação codificada para bandas de frequência em que o sinal de áudio de múltiplos canais é não tonal. Essa modalidade se baseia na consideração de que uma qualidade de áudio obtenível no lado de um decodificador de áudio pode ser aprimorada se bandas de frequência tonais forem reproduzidas com qualidade particularmente alta e preferencialmente com o uso de reconstrução de forma de onda pelo menos parcial. Em conformidade, é vantajoso incluir seletivamente o sinal residual na representação codificada para bandas de frequência para as quais o sinal de áudio de múltiplos canais é tonal, visto que isso resulta em um bom comprometimento entre taxa de bits e qualidade de áudio.
[032] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para incluir seletivamente o sinal residual na representação codificada para porções de tempo e/ou banda de frequência, em que a formação do sinal de downmix resulta em um cancelamento de componentes de sinal do sinal de áudio de múltiplos canais. Constatou-se, que é difícil ou até mesmo impossível reconstruir de modo adequado múltiplos sinais de áudio com base em um sinal de downmix se houver um cancelamento de componentes do sinal de áudio de múltiplos canais, devido ao fato de que até mesmo uma descorrelação ou uma previsão não pode recuperar componentes de sinal que foram cancelados durante a formação do sinal de downmix. Em tal caso, o uso de um sinal residual é uma maneira eficiente de evitar uma degradação significativa do sinal de áudio de múltiplos canais reconstruído. Desse modo, esse conceito auxilia no aprimoramento da qualidade do áudio ao mesmo tempo em que se evita um esforço de sinalização (por exemplo, quando considerado em conjunto com o decodificador de áudio descrito acima).
[033] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para detectar um cancelamento de componentes de sinal do sinal de áudio de múltiplos canais no sinal de downmix, e o decodificador de áudio de múltiplos canais também é configurado para ativar o fornecimento do sinal residual em resposta a um resultado da detecção. Em conformidade, há uma maneira eficiente de evitar uma má qualidade de áudio.
[034] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para computar o sinal residual com o uso de uma combinação linear de pelo menos dois sinais de canal do sinal de áudio de múltiplos canais e uma dependência de coeficientes de upmix a serem usados no lado de um decodificador de múltiplos canais. Consequentemente, o sinal residual é computado em de uma maneira eficiente e bem adaptada para uma reconstrução do sinal de áudio de múltiplos canais no lado de um decodificador de áudio de múltiplos canais.
[035] Em uma modalidade, o codificador de áudio de múltiplos canais é configurado para codificar os coeficientes de upmix com o uso dos parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais, ou para derivar os coeficientes de upmix a partir dos parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais. Em conformidade, o fornecimento do sinal residual pode ser realizado de modo eficiente com base em parâmetros, que também são usados para uma criptografia paramétrica.
[036] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para determinar, de modo variante no tempo, a quantidade de sinal residual incluído na representação codificada com o uso de um modelo psicoacústico. Em conformidade, uma quantidade comparativamente alta de sinal residual pode ser incluída para porções (porções temporais, ou porções de frequência, ou porções de frequência de tempo) do sinal de áudio de múltiplos canais que compreendem uma relevância psicoacústica comparativamente alta, enquanto uma quantidade (comparativamente) menor de sinal residual pode ser incluída para porções temporais ou porções de frequência ou porções de frequência de tempo do sinal de áudio de múltiplos canais com uma relevância psicoacústica comparativamente baixa. Em conformidade, uma boa troca de entre taxa de bits e qualidade de áudio pode ser alcançada.
[037] Em uma modalidade preferencial, o codificador de áudio de múltiplos canais é configurado para determinar, de modo variante no tempo, a quantidade de sinal residual incluído na representação codificada que depende de uma taxa de bits atualmente disponível. Em conformidade, a qualidade do áudio pode ser adaptada à taxa de bits disponível, que permite alcançar a melhor qualidade de áudio possível para a taxa de bits atualmente disponível.
[038] Uma modalidade de acordo com a invenção proporciona um método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O método compreende realizar uma combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual para obter um dos sinais de áudio de saída. Um peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada é determinado dependendo do sinal residual. Esse método se baseia nas mesmas considerações que o decodificador de áudio descrito acima.
[039] Outra modalidade de acordo com a invenção proporciona um método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O método compreende obter (pelo menos) um dos sinais de áudio de saída com base em uma representação codificada de um sinal de downmix, uma pluralidade de parâmetros espaciais codificados e uma representação codificada de um sinal residual. Uma mescla (ou desvanecimento) é realizada entre uma criptografia paramétrica e uma criptografia residual que depende do sinal residual. Esse método também é baseado nas mesmas considerações que o decodificador de áudio descrito acima.
[040] Outra modalidade de acordo com a invenção proporciona um método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais. O método compreende obter um sinal de downmix com base no sinal de áudio de múltiplos canais, fornecer parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais e fornecer um sinal residual. Uma quantidade de sinal residual incluído na representação codificada é variada dependendo do sinal de áudio de múltiplos canais. Esse método se baseia nas mesmas considerações que o codificador de áudio descrito acima.
[041] Modalidades adicionais, de acordo com a invenção proporcionam programas de computador para realizar os métodos descritos no presente documento.
BREVE DESCRIÇÃO DAS FIGURAS
[042] Modalidades de acordo com a invenção serão subsequentemente descritas com referência às figuras anexas, em que
[043] Figura 1 mostra um diagrama de blocos esquemático de um codificador de áudio de múltiplos canais, de acordo com uma modalidade de a invenção;
[044] Figura 2 mostra um diagrama de blocos esquemático de um decodificador de áudio de múltiplos canais, de acordo com uma modalidade de a invenção;
[045] Figura 3 mostra um diagrama de blocos esquemático de um decodificador de áudio de múltiplos canais, de acordo com a outra modalidade da presente invenção;
[046] Figura 4 mostra um fluxograma de um método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais, de acordo com uma modalidade de a invenção;
[047] Figura 5 mostra um fluxograma de um método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada, de acordo com uma modalidade de a invenção;
[048] Figura 6 mostra um fluxograma de um método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada, de acordo com outra modalidade de a invenção; e
[049] Figura 7 mostra um diagrama de fluxo de um decodificador, de acordo com uma modalidade da presente invenção; e
[050] Figura 8 mostra uma representação esquemática de um Decodificador Residual Híbrido.
DESCRIÇÃO DETALHADA DAS MODALIDADES
[051] Codificador de áudio de múltiplos canais de acordo com a Figura 1
[052] A Figura 1 mostra um diagrama de blocos esquemático de um codificador de áudio de múltiplos canais 100 para fornecer uma representação codificada de um sinal de múltiplos canais.
[053] O codificador de áudio de múltiplos canais 100 é configurado para receber um sinal de áudio de múltiplos canais 110 e para fornecer, com base nesse, uma representação codificada 112 do sinal de áudio de múltiplos canais 110. O codificador de áudio de múltiplos canais 100 compreende um processador (ou dispositivo de processamento) 120, que é configurado para receber o sinal de áudio de múltiplos canais e para obter um sinal de downmix 122 com base no sinal de áudio de múltiplos canais 110. O processador 120 é adicionalmente configurado para fornecer parâmetros 124 que descrevem dependências entre os canais do sinal de áudio de múltiplos canais 110. Ademais, o processador 120 é configurado para fornecer um sinal residual 126. Ademais, o codificador de áudio de múltiplos canais compreende um processamento de sinal residual 130, que é configurado para variar uma quantidade de sinal residual incluído na representação codificada 112 que depende do sinal de áudio de múltiplos canais 110.
[054] No entanto, deve-se observar que não é necessário que o decodificador de áudio de múltiplos canais compreenda um processador 120 separado e um processamento de sinal residual 130 separado. Em vez disso, é suficiente se o codificador de áudio de múltiplos canais for, de algum modo, configurado para realizar a funcionalidade do processador 120 e do processamento de sinal residual 130.
[055] Considerando-se a funcionalidade do codificador de áudio de múltiplos canais 100, pode-se observar que os sinais de canal do sinal de áudio de múltiplos canais 110 são tipicamente codificados com o uso de uma codificação de múltiplos canais, em que a representação codificada 112 tipicamente compreende (em uma forma codificada) o sinal de downmix 122, os parâmetros 124 que descrevem dependências entre canais (ou sinais de canal) do sinal de áudio de múltiplos canais 110 e o sinal residual 126. O sinal de downmix 122 pode, por exemplo, ser baseado uma combinação (por exemplo, combinação linear) dos sinais de canal do sinal de áudio de múltiplos canais. No entanto, um sinal de downmix 122 pode ser fornecido com base em uma pluralidade de sinais de canal do sinal de áudio de múltiplos canais. No entanto, alternativamente, dois ou mais sinais de downmix podem ser associados a um número maior (tipicamente maior do que o número de sinais de downmix) de sinais de canal do sinal de áudio de múltiplos canais 110. Os parâmetros 124 podem descrever dependências (por exemplo, uma correlação, uma covariância, uma relação de nível ou similares) entre canais (ou sinais de canal) do sinal de áudio de múltiplos canais 110. Em conformidade, os parâmetros 124 servem para o propósito de derivar uma versão reconstruída dos sinais de canal do sinal de áudio de múltiplos canais 110 com base no sinal de downmix 122 no lado de um decodificador de áudio. Para essa finalidade, os parâmetros 124 descrevem características desejadas (por exemplo, características individuais ou características relativas) dos sinais de canal do sinal de áudio de múltiplos canais, de modo que um codificador de áudio, que usa uma decodificação paramétrica, pode reconstruir sinais de canal com base nos um ou mais sinais de downmix 122.
[056] Além disso, o decodificador de áudio de múltiplos canais 100 fornece o sinal residual 126, que tipicamente representa componentes de sinal que, de acordo com o que se espera ou se estima do codificador de áudio de múltiplos canais, não podem ser reconstruídos por um decodificador de áudio (por exemplo, por um decodificador de áudio que segue uma determinada regra de processamento) com base no sinal de downmix 122 e nos parâmetros 124. Em conformidade, o sinal residual 126 pode tipicamente ser considerado como um sinal de refinamento, que permite uma reconstrução de forma de onda, ou pelo menos uma reconstrução de forma de onda parcial, no lado de um decodificador de áudio.
[057] No entanto, o codificador de áudio de múltiplos canais 100 é configurado para variar uma quantidade de sinal residual incluído na representação codificada 112 que depende do sinal de áudio de múltiplos canais 110. Em outras palavras, o codificador de áudio de múltiplos canais pode, por exemplo, decidir quanto à intensidade (ou a energia) do sinal residual 126 que é incluída na representação codificada 112. Adicional ou alternativamente, o codificador de áudio de múltiplos canais 100 pode decidir em relação a quais bandas de frequência e/ou a quantas bandas de frequência o sinal residual é incluído na representação codificada 112. Variando-se a “quantidade” de sinal residual 126 incluída na representação codificada 112 que depende do sinal de áudio de múltiplos canais (e/ou que depende de uma taxa de bits disponível), o codificador de áudio de múltiplos canais 100 pode determinar de modo flexível com que precisão os sinais de canal do sinal de áudio de múltiplos canais 110 podem ser reconstruídos no lado de um decodificador de áudio com base na representação codificada 112. Desse modo, a precisão com que os sinais de canal do sinal de áudio de múltiplos canais 110 pode ser reconstruída pode ser adaptada a uma relevância psicoacústica de diferentes porções de sinal dos sinais de canal do sinal de áudio de múltiplos canais 110 (como, por exemplo, porções temporais, porções de frequência e/ou porções de frequência/tempo). Desse modo, porções de sinal de alta relevância psicoacústica (como, por exemplo, porções de sinal tonal ou porções de sinal que compreendem eventos transientes podem ser codificadas com resolução particularmente alta incluindo- se uma “grande quantidade” do sinal residual 126 na representação codificada. Por exemplo, pode-se conseguir que um sinal residual com uma energia comparativamente alta seja incluída na representação codificada 112 para porções de sinal de alta relevância psicoacústica. Ademais, pode-se conseguir que um sinal residual de alta energia seja incluído na representação codificada 112 se o sinal de downmix 122 compreender uma “qualidade insuficiente”, por exemplo, se houver um cancelamento substancial de componentes de sinal ao se combinarem os sinais de canal do sinal de áudio de múltiplos canais 112 no sinal de downmix 122. Em outras palavras, o decodificador de áudio de múltiplos canais 100 pode seletivamente inserir uma “maior quantidade” de sinal residual (por exemplo, um sinal residual que tem uma energia comparativamente alta) na representação codificada 112 para porções de sinal do sinal de áudio de múltiplos canais 110 para que o fornecimento de uma quantidade comparativamente grande do sinal residual forneça um aprimoramento significativo dos sinais de canal reconstruídos (reconstruídos no lado de um decodificador de áudio).
[058] Em conformidade, a variação da quantidade de sinal residual incluído na representação codificada que depende do sinal de áudio de múltiplos canais 110 permite adaptar a representação codificada 112 (por exemplo, o sinal residual 126, que é incluído na representação codificada em uma forma codificada) do sinal de áudio de múltiplos canais 110, de modo que uma boa troca entre a eficiência taxa de bits e a qualidade de áudio do sinal de áudio de múltiplos canais reconstruído (reconstruído no lado de um decodificador de áudio) possa ser alcançada.
[059] Deve-se observar que o codificador de áudio de múltiplos canais 100 pode ser opcionalmente aprimorado de muitas maneiras diferentes. Por exemplo, o codificador de áudio de múltiplos canais pode ser configurado para variar uma largura de banda do sinal residual 126 (que é incluída na representação codificada) que depende do sinal de áudio de múltiplos canais 110. Em conformidade, a quantidade de sinal residual incluído na representação codificada 112 pode ser adaptada às bandas de frequência perceptualmente mais importantes.
[060] Opcionalmente, o decodificador de áudio de múltiplos canais pode ser configurado para selecionar bandas de frequência para as quais o sinal residual 126 é incluído na representação codificada 112 que depende do sinal de áudio de múltiplos canais 110. Em conformidade, a representação codificada 120 (mais precisamente, a quantidade de sinal residual incluído na representação codificada 112) pode ser adaptada ao sinal de áudio de múltiplos canais, por exemplo, às bandas de frequência perceptualmente mais importantes do sinal de áudio de múltiplos canais 110.
[061] Opcionalmente, o codificador de áudio de múltiplos canais pode ser configurado para incluir o sinal residual 126 na representação codificada para bandas de frequência para as quais o sinal de áudio de múltiplos canais é tonal. Além disso, o codificador de áudio de múltiplos canais pode ser configurado para não incluir o sinal residual 126 na representação codificada 112 para bandas de frequência em que o sinal de áudio de múltiplos canais é non-tonal (a menos que qualquer outra condição específica seja preenchida que cause uma inclusão do sinal residual na representação codificada para uma banda de frequência específica). Desse modo, o sinal residual pode ser seletivamente incluído na representação codificada para bandas de frequência tonais perceptualmente importantes.
[062] Opcionalmente, o codificador de áudio de múltiplos canais 100 pode ser configurado para incluir seletivamente o sinal residual na representação codificada para porções de tempo e/ou para bandas de frequência em que a formação do sinal de downmix resulta em um cancelamento de componentes de sinal do sinal de áudio de múltiplos canais. Por exemplo, o codificador de áudio de múltiplos canais pode ser configurado para detectar um cancelamento de componentes de sinal do sinal de áudio de múltiplos canais 110 no sinal de downmix 122, e para ativar o fornecimento do sinal residual 126 (por exemplo, a inclusão do sinal residual 126 na representação codificada 112) em resposta ao resultado da detecção. Em conformidade, se o downmix (ou qualquer outra combinação tipicamente linear) de sinais de canal do sinal de áudio de múltiplos canais 110 no sinal de downmix 122 resultar em um cancelamento de componentes de sinal do sinal de áudio de múltiplos canais 112 (que pode ser causado, por exemplo, por componentes de sinal de diferentes sinais de canal que são variados em fase em 180 graus), o sinal residual 126, que auxilia na superação do efeito prejudicial desse cancelamento durante a reconstrução do sinal de áudio de múltiplos canais 110 em um decodificador de áudio, será incluído na representação codificada 112. Por exemplo, o sinal residual 126 pode ser seletivamente incluído na representação codificada 112 para bandas de frequência para as quais há tal cancelamento.
[063] Opcionalmente, o codificador de áudio de múltiplos canais pode ser configurado para computar o sinal residual com o uso de uma combinação linear de pelo menos dois sinais de canal do sinal de áudio de múltiplos canais e que depende de coeficientes de upmix a serem usados no lado de um decodificador de áudio de múltiplos canais. Tal computação de um sinal residual é eficiente e permite uma simples reconstrução dos sinais de canal no lado de um decodificador de áudio.
[064] Opcionalmente, o codificador de áudio de múltiplos canais pode ser configurado para codificar os coeficientes de upmix com o uso do parâmetro 124 que descreve dependências entre os canais do sinal de áudio de múltiplos canais, ou para derivar os coeficientes de upmix a partir dos parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais. Em conformidade, os parâmetros 124 (que pode, por exemplo, ser parâmetros de diferença de nível intracanal, parâmetros de correlação intracanal ou similares) podem ser usados tanto para a criptografia paramétrica (codificação ou decodificação) quanto para a criptografia assistida por sinal residual (codificação ou decodificação). Desse modo, o uso do sinal residual 126 não resulta em uma sobrecarga de sinalização adicional. Em vez disso, os parâmetros 124, que são usados para a criptografia paramétrica (codificação/decodificação) de qualquer modo, são reusados também para a criptografia residual (codificação/decodificação). Desse modo alta eficiência de criptografia pode ser alcançada.
[065] Opcionalmente, o decodificador de áudio de múltiplos canais pode ser configurado para determinar, de modo variante no tempo, a quantidade de sinal residual incluído na representação codificada com o uso de um modelo psicoacústico. Em conformidade, a precisão de codificação pode ser adaptada a características psicoacústicas do sinal, que tipicamente resultam em uma boa eficiência de taxa de bits.
[066] No entanto, deve-se observar que o codificador de áudio de múltiplos canais pode opcionalmente ser suplementado por qualquer um dos recursos ou funcionalidades descritas no presente documento (tanto na descrição e quanto nas reivindicações). Ademais, o codificador de áudio de múltiplos canais também pode ser adaptado paralelamente ao decodificador de áudio descrito no presente documento para cooperar com o decodificador de áudio.
[067] 2. Decodificador de áudio de múltiplos canais, de acordo com a Figura 2
[068] A Figura 2 mostra um diagrama de blocos esquemático de um decodificador de áudio de múltiplos canais 200 de acordo com uma modalidade da presente invenção.
[069] O decodificador de áudio de múltiplos canais 200 é configurado para receber uma representação codificada 210 e para fornecer, com base nesse, pelo menos dois sinais de áudio de saída 212, 214. O decodificador de áudio de múltiplos canais 200 pode, por exemplo, compreender um combinador de ponderação 220, que é configurado para realizar uma combinação ponderada de um sinal de downmix 222, um sinal descorrelacionado 224 e um sinal residual 226, para obter (pelo menos) um dos sinais de saída, por exemplo, o primeiro sinal de áudio de saída 212. Deve-se observar, no presente documento, que o sinal de downmix 212, o sinal descorrelacionado 224 e o sinal residual 226 podem, por exemplo, ser derivados da representação codificada 210, em que a representação codificada 210 pode portar uma representação codificada do sinal de downmix 220 e uma representação codificada do sinal residual 226. Ademais, o sinal descorrelacionado 224 pode, por exemplo, ser derivado do sinal de downmix 222 ou pode ser derivado com o uso de informações adicionais incluídas na representação codificada 210. No entanto, o sinal descorrelacionado também pode ser fornecido sem quaisquer informações específicas da representação codificada 210.
[070] O decodificador de áudio de múltiplos canais 200 também é configurado para determinar um peso que descreve uma contribuição do sinal descorrelacionado 224 na combinação ponderada que depende do sinal residual 226. Por exemplo, o decodificador de áudio de múltiplos canais 200 pode compreender um determinador de peso 230, que é configurado para determinar um peso 232 que descreve a contribuição do sinal descorrelacionado 224 na combinação ponderada (por exemplo, a contribuição do sinal descorrelacionado 224 ao primeiro sinal de áudio de saída 212) com base no sinal residual 226.
[071] Considerando-se a funcionalidade do decodificador de áudio de múltiplos canais 200, deve-se observar que a contribuição do sinal descorrelacionado 224 à combinação ponderada e, consequentemente ao primeiro sinal de áudio de saída 212, é ajustada de uma maneira flexível (por exemplo, com variação temporal e dependente de frequência) dependendo do sinal residual 226, sem sobrecarga de sinalização adicional. Em conformidade, a quantidade de sinal descorrelacionado 224, que é incluída no primeiro sinal de áudio de saída 212, é adaptada dependendo da quantidade de sinal residual 226 que é incluída no primeiro sinal de áudio de saída 212, de modo que uma boa qualidade do primeiro sinal de áudio de saída 212 seja alcançada. Em conformidade, é possível obter uma ponderação apropriada do sinal descorrelacionado 224 em quaisquer circunstâncias e sem uma sobrecarga de sinalização adicional. Desse modo, com o uso do decodificador de áudio de múltiplos canais 200, uma boa qualidade do sinal de áudio de saída decodificado 212 pode ser alcançada com taxa de bits moderada. Uma precisão da reconstrução pode ser ajustada de modo flexível por um codificador de áudio, em que o codificador de áudio pode determinar uma quantidade de sinal residual 226 que é incluída na representação codificada 212 (por exemplo, a quantidade da energia do sinal residual 226 incluída na representação codificada 210, ou a quantas bandas de frequência o sinal residual 226 incluído na representação codificada 210 se refere), e o decodificador de áudio de múltiplos canais 200 pode reagir em conformidade e ajustar a ponderação do sinal descorrelacionado 224 para corresponder à quantidade de sinal residual 226 incluída na representação codificada 210. Consequentemente, se há uma grande quantidade de sinal residual 226 incluída na representação codificada 210 (por exemplo, para uma banda de frequência específica, ou para uma porção temporal específica), a combinação ponderada 220 pode predominantemente (ou exclusivamente) considerar o sinal residual 226 ao mesmo tempo em que fornece pouco peso (ou nenhum peso) ao sinal descorrelacionado 224. Em contrapartida, se há apenas uma quantidade menor de um sinal residual 226 incluída na representação codificada 210, a combinação ponderada 220 pode predominantemente (ou exclusivamente) considerar o sinal descorrelacionado 224, mas apenas a um grau comparativamente pequeno (ou nenhum) o sinal residual 226 além do sinal de downmix 222. Desse modo, o decodificador de áudio de múltiplos canais 200 pode cooperar de modo flexível com um codificador de áudio de múltiplos canais apropriado e ajustar a combinação ponderada 220 para alcançar a melhor qualidade de áudio possível em quaisquer circunstâncias (independentemente de se uma quantidade menor ou uma quantidade maior de sinal residual 226 é incluída na representação codificada 210).
[072] Deve-se observar que o segundo sinal de áudio de saída 214 pode ser gerado de uma maneira semelhante. No entanto, não é necessário aplicar os mesmos mecanismos ao segundo sinal de áudio de saída 214, por exemplo, se houver diferentes exigências de qualidade em relação ao segundo sinal de áudio de saída.
[073] Em um aprimoramento opcional, o decodificador de áudio de múltiplos canais pode ser configurado para determinar o peso 232 que descreve a contribuição do sinal descorrelacionado 224 na combinação ponderada que depende do sinal descorrelacionado 224. Em outras palavras, o peso 232 pode depender tanto do sinal residual 226 quanto do sinal descorrelacionado 224. Em conformidade, o peso 232 pode ser ainda mais bem adaptado a um sinal de áudio atualmente decodificado sem sobrecarga de sinalização adicional.
[074] Como outro aprimoramento opcional, o decodificador de áudio de múltiplos canais pode ser configurado para obter parâmetros de upmix com base na representação codificada 212 e para determinar o peso 232 que descreve a contribuição do sinal descorrelacionado na combinação ponderada que depende dos parâmetros de upmix. Em conformidade, o peso 232 pode adicionalmente depender dos parâmetros de upmix, de modo que uma adaptação ainda melhor do peso 232 possa ser alcançada.
[075] Como outro aprimoramento opcional, o decodificador de áudio de múltiplos canais pode ser configurado para determinar o peso que descreve a contribuição do sinal descorrelacionado na combinação ponderada de modo que o peso do sinal descorrelacionado diminua com o aumento da energia do sinal residual. Em conformidade, uma mescla ou desvanecimento pode ser realizada entre uma decodificação que é predominantemente baseada no sinal descorrelacionado 224 (além de um sinal de downmix 222) e uma decodificação que é predominantemente baseada no sinal residual 226 (além de um sinal de downmix 222).
[076] Como outro aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 pode ser configurado para determinar o peso 232 de modo que um peso máximo, que é determinado por um parâmetro de upmix de sinal descorrelacionado (que pode ser incluído ou derivado da representação codificada 210) seja associado ao sinal descorrelacionado 224 se uma energia do sinal residual 226 for zero, e que de modo que um peso zero seja associado ao sinal descorrelacionado 224 se uma energia do sinal residual 226, ponderada com o coeficiente de ponderação de sinal residual (ou um parâmetro de upmix de sinal residual), for maior ou igual a uma energia do sinal descorrelacionado 224, ponderada com o parâmetro de upmix de sinal descorrelacionado. Em conformidade, é possível mesclar (ou desvanecimento) completamente entre uma decodificação baseada no sinal descorrelacionado 224 e uma decodificação baseada no sinal residual 226. Se o sinal residual 226 for julgado como sendo forte o suficiente (por exemplo, quando a energia do sinal residual ponderado for igual ou maior do que a energia do sinal descorrelacionado ponderado 224), a combinação ponderada pode se basear totalmente no sinal residual 226 para refinar o sinal de downmix 222 ao mesmo tempo em que se deixa o sinal descorrelacionado 224 fora de consideração. Nesse caso, uma reconstrução de forma de onda (pelo menos parcial) no lado do decodificador de áudio de múltiplos canais 200 pode ser realizada, visto que a consideração do sinal descorrelacionado 224 tipicamente evita uma reconstrução de forma de onda particularmente boa, enquanto o uso do sinal residual 226 tipicamente permite uma boa reconstrução de forma de onda.
[077] Em outro aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 pode ser configurado para computar um valor de energia ponderado de um sinal descorrelacionado, ponderada dependendo de um ou mais parâmetros de upmix de sinal descorrelacionado, e para computar um valor de energia ponderado do sinal residual, ponderado com o uso de um ou mais parâmetros de upmix de sinal residual. Nesse caso, o decodificador de áudio de múltiplos canais pode ser configurado para determinar um fator que depende do valor de energia ponderado do sinal descorrelacionado e do valor de energia ponderado do sinal residual e para obter um peso que descreve a contribuição do sinal descorrelacionado 224 a um dos sinais de áudio de saída (por exemplo, o primeiro sinal de áudio de saída 212) com base no fator. Desse modo, a determinação de peso 230 pode fornecer valores de ponderação particularmente bem adaptados 232.
[078] Em um aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 (ou o determinador de peso 230 desse) pode ser configurado para multiplicar o fator pelo parâmetro de upmix de sinal descorrelacionado (que pode ser incluído na representação codificada 210, ou derivado da representação codificada 210), para obter o peso (ou valor de ponderação) 232 que descreve a contribuição do sinal descorrelacionado 224 a um dos sinais de áudio de saída (por exemplo, o primeiro sinal de áudio de saída 212).
[079] Em um aprimoramento opcional, o decodificador de áudio de múltiplos canais (ou o determinador de peso 230 desse) pode ser configurado para computar a energia do sinal descorrelacionado 224, ponderado com o uso de parâmetros de upmix de sinal descorrelacionado (que pode ser incluído na representação codificada 210, ou que pode ser derivado da representação codificada 210), em uma pluralidade de canais de upmix e intervalos de tempo, para obter o valor de energia ponderado do sinal descorrelacionado.
[080] Como um aprimoramento opcional adicional, o decodificador de áudio de múltiplos canais 200 pode ser configurado para computar a energia do sinal residual 224, ponderado com o uso de parâmetros de upmix de sinal residual (que pode ser incluído na representação codificada 210 ou que pode ser derivado da representação codificada 210) em relação a uma pluralidade de canais de upmix e intervalos de tempo, para obter o valor de energia ponderado do sinal residual.
[081] Como outro aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 (ou o determinador de peso 232 desse) pode ser configurado para computar o fator mencionado acima que depende de uma diferença entre o valor de energia ponderado do sinal descorrelacionado e o valor de energia ponderado do sinal residual. Constatou-se, que tal computação é uma solução eficiente para determinar os valores de ponderação 232.
[082] Como um aprimoramento opcional, o decodificador de áudio de múltiplos canais pode ser configurado para computar o fator que depende de uma razão entre uma diferença entre o valor de energia ponderado do sinal descorrelacionado 224 e o valor de energia ponderado do sinal residual 226, e o valor de energia ponderado do sinal descorrelacionado 224. Constatou-se, que tal computação para o fator proporciona bons resultados para mesclar entre um refinamento baseado em sinal predominantemente de descorrelação do sinal de downmix 222 e refinamento baseado em sinal predominantemente residual do sinal de downmix 222.
[083] Como um aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 pode ser configurado para determinar pesos que descrevem contribuições dos sinais descorrelacionados a dois ou mais sinais de áudio de saída, como, por exemplo, o primeiro sinal de áudio de saída 212 e o segundo sinal de áudio de saída 214. Nesse caso, o decodificador de áudio de múltiplos canais pode ser configurado para determinar uma contribuição do sinal descorrelacionado 224 ao primeiro sinal de áudio de saída 212 com base no valor de energia ponderado do sinal descorrelacionado 224 e um parâmetro de upmix de sinal descorrelacionado de primeiro canal. Ademais, o decodificador de áudio de múltiplos canais pode ser configurado para determinar uma contribuição do sinal descorrelacionado 224 ao segundo sinal de áudio de saída 214 com base no valor de energia ponderado do sinal descorrelacionado 224 e um parâmetro de upmix de sinal descorrelacionado de segundo canal. Em outras palavras, diferentes parâmetros de upmix de sinal descorrelacionado podem ser usados para fornecer o primeiro sinal de áudio de saída 212 e o segundo sinal de áudio de saída 214. No entanto, o mesmo valor de energia ponderado do sinal descorrelacionado pode ser usado para determinar a contribuição do sinal descorrelacionado ao primeiro sinal de áudio de saída 212 e a contribuição do sinal descorrelacionado ao segundo sinal de áudio de saída 214. Desse modo, um ajuste eficiente é possível, em que, entretanto, diferentes características dos dois sinais de áudio de saída 212, 214 podem ser consideradas por diferentes parâmetros de upmix de sinal descorrelacionado.
[084] Como um aprimoramento opcional, o decodificador de áudio de múltiplos canais 200 pode ser configurado para desabilitar uma contribuição do sinal descorrelacionado 224 à combinação ponderada se uma energia residual (por exemplo, uma energia do sinal residual 226 ou da versão ponderada do sinal residual 226) exceder uma energia descorrelacionada (por exemplo, uma energia do sinal descorrelacionado 224 ou da versão ponderada do sinal descorrelacionado 224).
[085] Como um aprimoramento opcional adicional, o decodificador de áudio pode ser configurado para determinar, no sentido da banda, o peso 232 que descreve uma contribuição do sinal descorrelacionado 224 na combinação ponderada que depende de uma determinação, no sentido da banda, de um valor de energia ponderado do sinal residual. Em conformidade, um ajuste fino do decodificador de áudio de múltiplos canais 200 aos sinais a serem decodificados pode ser realizado.
[086] Em outro aprimoramento opcional, o decodificador de áudio pode ser configurado para determinar o peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada para cada quadro do sinal de áudio de saída 212, 214. Em conformidade, uma boa resolução temporal pode ser alcançada.
[087] Em um aprimoramento adicionalmente opcional, a determinação do valor de ponderação 232 pode ser realizada de acordo com algumas das equações fornecidas abaixo.
[088] Ademais, deve-se observar que o decodificador de áudio de múltiplos canais 200 pode ser suplementado por qualquer um dos recursos ou funcionalidades descritas no presente documento, também em relação a outras modalidades.
[089] 3. Decodificador de áudio de múltiplos canais, de acordo com a Figura 3
[090] A Figura 3 mostra um diagrama de blocos esquemático de um decodificador de áudio de múltiplos canais 300 de acordo com uma modalidade de a invenção. O decodificador de áudio de múltiplos canais 300 é configurado para receber uma representação codificada 310 e para fornecer, com base nesse, dois ou mais sinais de áudio de saída 312, 314. A representação codificada 310 pode, por exemplo, compreender uma representação codificada de um sinal de downmix, uma representação codificada de um ou mais parâmetros espaciais e uma representação codificada de um sinal residual. O decodificador de áudio de múltiplos canais 300 é configurado para obter (pelo menos) um dos sinais de áudio de saída, por exemplo, um primeiro sinal de áudio de saída 312 e/ou um segundo sinal de áudio de saída 314, com base na representação codificada do sinal de downmix, uma pluralidade de parâmetros espaciais codificados e uma representação codificada do sinal residual.
[091] Em particular, o decodificador de áudio de múltiplos canais 300 é configurado para mesclar entre uma criptografia paramétrica e uma criptografia residual que depende do sinal residual (que é incluído, em uma forma codificada, na representação codificada 310). Em outras palavras, o decodificador de áudio de múltiplos canais 300 pode mesclar entre um modo de decodificação em que o fornecimento dos sinais de áudio de saída 312, 314 é realizado com base no sinal de downmix e com o uso de parâmetros espaciais que descrevem uma relação desejada entre os sinais de áudio de saída 312, 314 (por exemplo, uma diferença de nível intercanal desejada ou uma correlação intercanal desejada dos sinais de áudio de saída 312, 314), e um modo de decodificação em que os sinais de áudio de saída 312, 314 são reconstruídos com base no sinal de downmix com o uso do sinal residual. Desse modo, a intensidade (por exemplo, energia) do sinal residual, que é incluída na representação codificada 310, pode determinar se a decodificação é principalmente (ou exclusivamente) baseada em os parâmetros espaciais (além do sinal de downmix) ou se a decodificação é principalmente (ou exclusivamente) baseada no sinal residual (além do sinal de downmix), ou se um estado intermediário é considerado em que tanto os parâmetros espaciais quanto o sinal residual afetam o refinamento do sinal de downmix, para derivar os sinais de áudio de saída 312, 314 do sinal de downmix.
[092] Ademais, o decodificador de áudio de múltiplos canais 300 permite uma decodificação que é bem adaptada ao conteúdo de áudio atual sem alta sobrecarga de sinalização mesclando-se entre a criptografia paramétrica, (em que, tipicamente, um peso comparativamente alto é fornecido a um sinal descorrelacionado quando se fornecem os sinais de áudio de saída 312, 314) e uma criptografia residual (em que, tipicamente, um peso comparativamente baixo é fornecido a um sinal descorrelacionado) que depende do sinal residual.
[093] Ademais, deve-se observar que o decodificador de áudio de múltiplos canais 300 se baseia em considerações semelhantes ao decodificador de áudio de múltiplos canais 200 e que aprimoramentos opcionais descritos acima em relação ao decodificador de áudio de múltiplos canais 200 também podem ser aplicados ao decodificador de áudio de múltiplos canais 300.
[094] 4. Método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais de acordo com a Figura 4
[095] A Figura 4 mostra um fluxograma de um método 400 para fornecer uma representação codificada de um sinal de áudio de múltiplos canais.
[096] O método 400 compreende uma etapa 410 de obter um sinal de downmix com base em um sinal de áudio de múltiplos canais. O método 400 também compreende uma etapa 420 de fornecer parâmetros que descrevem dependências entre os canais do sinal de áudio de múltiplos canais. Por exemplo, parâmetros de diferença de nível intercanal e/ou parâmetros de correlação intercanal (ou parâmetros de covariância) podem ser fornecidos, os quais descrevem dependências entre canais do sinal de áudio de múltiplos canais. O método 400 também compreende uma etapa 430 de fornecer um sinal residual. Ademais, o método compreende uma etapa 440 de variar uma quantidade de sinal residual incluído na representação codificada que depende do sinal de áudio de múltiplos canais.
[097] Deve-se observar que o método 400 se baseia nas mesmas considerações que o codificador de áudio 100 de acordo com a Figura 1. Ademais, o método 400 pode ser suplementado por qualquer um dos recursos e funcionalidades descritos no presente documento em relação aos aparelhos da invenção.
[098] 5. Método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada de acordo com a Figura 5.
[099] A Figura 5 mostra um fluxograma de um método 500 para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O método 500 compreende determinar 510 um peso que descreve uma contribuição de um sinal descorrelacionado em uma combinação ponderada que depende de um sinal residual. O método 500 também compreende realizar 520 uma combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual para obter um dos sinais de áudio de saída.
[100] Deve-se observar que o método 500 pode ser suplementado por qualquer um dos recursos e funcionalidades descritos no presente documento em relação aos aparelhos da invenção.
[101] 6. Método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada de acordo com a Figura 6.
[102] A Figura 6 mostra um fluxograma de um método 600 para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada. O método 600 compreende obter 610 um dos sinais de áudio de saída com base em uma representação codificada de um sinal de downmix, uma pluralidade de parâmetros espaciais codificados e uma representação codificada de um sinal residual. Obter 610 um dos sinais de áudio de saída compreende realizar 620 uma mescla entre uma criptografia paramétrica e uma criptografia residual que depende do sinal residual.
[103] Deve-se observar que o método 600 pode ser suplementado por qualquer um dos recursos e funcionalidades descritos no presente documento em relação aos aparelhos da invenção.
[104] 7. Modalidades adicionais
[105] A seguir, algumas considerações gerais e algumas modalidades adicionais serão descritas.
[106] 7.1 Considerações gerais
[107] Modalidades de acordo com a invenção são baseadas na ideia de que, em vez de usar uma largura de banda residual fixa, um decodificador (por exemplo, um decodificador de áudio de múltiplos canais) detecta a quantidade de sinal residual transmitido medindo-se its energia por banda para cada quadro (ou, geralmente, pelo menos para uma pluralidade de faixas de frequência e/ou para uma pluralidade de porções temporais). Dependendo dos parâmetros espaciais transmitidos, uma saída descorrelacionada é adicionada quando a energia residual “está ausente”, para alcançar uma quantidade necessária (ou desejada) de descorrelação e energia de saída. Isso permite uma largura de banda residual variável bem como sinais residuais do estilo passa-banda. Por exemplo, é possível apenas usar criptografia residual para bandas tonais. Para se ter a capacidade de usar o downmix simplificado para criptografia paramétrica bem como para criptografia de preservação de forma de onda (que também é designada como criptografia residual), um sinal residual para o downmix simplificado é definido no presente documento.
[108] 7.2 Cálculo do sinal residual para o downmix simplificado
[109] A seguir, algumas considerações em relação ao cálculo do sinal residual e em relação à construção de sinais de canal de um sinal de áudio de múltiplos canais serão descritas.
[110] Em criptografia de áudio e voz unificada (USAC), não há sinal residual definido quando um chamado “downmix simplificado” é usado. Desse modo, nenhuma criptografia de preservação de forma de onda de modo parcial é possível. No entanto, a seguir, um método para calcular um sinal residual para o chamado “downmix simplificado” será descrito.
[111] Ponderações de “downmix simplificado” d1, d2 são calculadas por banda de fator de escala, enquanto que coeficientes de upmix paramétricos ud1, ud2 são calculados por banda de parâmetro. Desse modo, coeficientes wr1, wr2, para calcular o sinal residual não podem ser diretamente computados a partir dos parâmetros espaciais (como é o caso para um MPEG surround clássico), mas podem precisar ser determinados por de fator de escala por banda a partir dos coeficientes de downmix e upmix.
[112] Com L, R sendo os canais de entrada e D sendo o canal de downmix, um sinal residual res deve preencher as propriedades a seguir:
Figure img0001
[113] Isso é alcançado calculando-se o residual como
Figure img0002
[114] com o uso dos pesos de downmix
Figure img0003
[115] Os coeficientes de upmix residuais ur,1, ur,2 usados pelo decodificador são preferencialmente escolhidos de maneira a garantir decodificação robusta. Visto que o downmix simplificado tem propriedades assimétricas (em oposição a MPEG Surround com pesos fixos) um upmix que depende dos parâmetros espaciais é aplicado, por exemplo, com o uso dos seguintes coeficientes de upmix:
Figure img0004
[116] Outra opção é definir os coeficientes de upmix residuais para serem ortogonais aso coeficientes de upmix de sinal de downmix, de modo que:
Figure img0005
[117] Em outras palavras, um decodificador de áudio pode obter o sinal de downmix D com o uso de uma combinação linear de um sinal de canal esquerdo L (primeiro sinal de canal) e a sinal de canal direito R (segundo sinal de canal). De modo semelhante, o sinal residual res é obtido com o uso de uma combinação linear do canal esquerdo L e do sinal de canal direito R (ou, geralmente, de um primeiro sinal de canal e um segundo sinal de canal do sinal de áudio de múltiplos canais).
[118] Pode-se verificar, por exemplo, nas Equações (5) e (6), os pesos de downmix wr,1 e wr,2 para obter o sinal residual res podem ser obtidos quando os pesos de downmix simplificado d1, d2, os coeficientes de upmix paramétricos ud,1 e ud,2 e os coeficientes de upmix residuais ur,1 e ur,2 são determinados. Ademais, pode-se verificar que ur,1 e ur,2 podem ser derivados de ud,1 e ud,2 com o uso das equações (7) e (8) ou da equação (9). Os pesos de downmix simplificado d1 e d2, bem como os coeficientes de upmix paramétricos ud,1 e ud,2 podem ser obtidos da maneira usual.
[119] 7.3 Processo de codificação
[120] A seguir, alguns detalhes em relação ao processo de codificação serão descritos. A codificação pode, por exemplo, ser realizada pelo codificador de áudio de múltiplos canais 100 ou por quaisquer outros programas de computador ou meios apropriados.
[121] Preferencialmente, a quantidade de um residual que é transmitido é determinada por um modelo psicoacústico do codificador (por exemplo, codificador de áudio de múltiplos canais), dependendo do sinal de áudio (por exemplo, dependendo dos sinais de canal do sinal de áudio de múltiplos canais 110) e uma taxa de bits disponível. O sinal residual transmitido pode, por exemplo, ser usado para preservação de forma de onda parcial ou para evitar cancelamento de sinal causado pelo método de downmix usado (por exemplo, o método de downmix descrito pela equação (1) acima).
[122] 7.3.1 Preservação de forma de onda parcial
[123] A seguir, descreve-se como a preservação de forma de onda parcial pode ser alcançada. Por exemplo, o residual calculado (por exemplo, o residual res de acordo com a equação (4)) é transmitido em modo de banda total ou banda limitada para fornecer preservação de forma de onda parcial dentro da largura de banda residual. Partes residuais, que são detectadas como perceptualmente irrelevantes pelo modelo psicoacústico podem, por exemplo, ser quantizadas para zero (por exemplo, ao fornecer a representação codificada 112 com base no sinal residual 126). Isso inclui, mas não se limita à redução da largura de banda residual transmitida no tempo de execução (que pode ser considerado como variando uma quantidade de sinal residual que é incluída na representação codificada). Esse sistema também pode permitir que a exclusão do estilo passa-banda de partes de sinal residual, como energia de sinal ausente, seja reconstruída pelo decodificador (por exemplo, pelo decodificador de áudio de múltiplos canais 200 ou o decodificador de áudio de múltiplos canais 300). Desse modo, por exemplo, a criptografia residual pode ser apenas aplicada a componentes tonais do sinal, preservando suas relações de fase, enquanto que o ruído de fundo pode ser parametricamente criptografado para reduzir a taxa de bits residual. Em outras palavras, o sinal residual 126 pode apenas ser incluído na representação codificada 112 (por exemplo, pelo processamento de sinal residual 130) para bandas de frequência e/ou porções temporais para as quais o sinal de áudio de múltiplos canais 110 (ou pelo menos um dos sinais de canal do sinal de áudio de múltiplos canais 110) é constatado como sendo tonal. Em contrapartida, o sinal residual 126 pode não ser incluído na representação codificada 112 para bandas de frequência e/ou porções temporais para as quais o sinal de áudio de múltiplos canais 110 (ou pelo menos um ou mais sinais de canal do sinal de áudio de múltiplos canais 110) é identificado como sendo similar a ruído. Desse modo, uma quantidade de sinal residual incluído na representação codificada é variada dependendo do sinal de áudio de múltiplos canais.
[124] 7.3.2 Prevenção de cancelamento de sinal em downmix
[125] A seguir, será descrito como um cancelamento de sinal no downmix pode ser prevenido (ou compensado).
[126] Para aplicações de baixa taxa de bits, a criptografia paramétrica (que se baseia predominante ou exclusivamente nos parâmetros 124 que descrevem dependências entre canais do sinal de áudio de múltiplos canais) em vez de criptografia de preservação de forma de onda (que, por exemplo, se baseia predominantemente no sinal residual 126, além do sinal de downmix 122) é aplicada. No presente documento, o sinal residual 126 é apenas usado para compensar cancelamentos de sinal no downmix 122, para minimizar o uso de bits do residual. Desde que nenhum cancelamento de sinal no downmix 122 seja detectado, o sistema é executado em modo paramétrico com o uso de descorrelacionadores (no lado do decodificador de áudio). Quando os cancelamentos de sinal ocorrem, por exemplo, para faseamento de sinais tonais, um sinal residual 126 é transmitido para as partes de sinal desemparelhadas (por exemplo, bandas de frequência e/ou porções temporais). Desse modo, o sinal energia pode ser restaurados pelo decodificador.
[127] 74 Processo de decodificação
[128] 7JJ. Visão geral
[129] No decodificador (por exemplo, no decodificador de áudio de múltiplos canais 200 ou no decodificador de áudio de múltiplos canais 300), os e sinais de downmix e residuais transmitidos (por exemplo, sinal de downmix 222 ou sinal residual 226) são decodificados por um decodificador de núcleo e alimentados a um decodificador de MPEG surround juntamente com a carga de MPEG surround decodificada. Os coeficientes de upmix residuais para o downmix de MPS clássico são imutáveis, e o coeficiente de upmix residual para o downmix simplificado são definidos nas equações (7) e (8) e/ou (9). Adicionalmente, as saídas de descorrelacionador e seus coeficientes de ponderação são calculados, como para decodificação paramétrica. O sinal residual e as saídas de descorrelacionador são ponderados e ambos misturados ao sinal de saída. Portanto, fatores de ponderação são determinados medindo-se as energias dos sinais de descorrelacionador e residuais.
[130] Em outras palavras, fatores de upmix residuais (ou coeficientes) podem ser determinados medindo-se as energias dos sinais descorrelacionados e residuais.
[131] Por exemplo, o sinal de downmix 222 é fornecido com base na representação codificada 210, e o sinal descorrelacionado 224 é derivado do sinal de downmix 222 ou gerado com base em parâmetros incluídos na representação codificada 210 (ou de outro modo). Os coeficientes de upmix residuais podem, por exemplo, ser derivados dos coeficientes de upmix paramétricos ud,1 e ud,2 de acordo com as equações (7) e (8) pelo decodificador, em que os coeficientes de upmix paramétricos ud,1 ud,2 podem ser obtidos com base na representação codificada 210, por exemplo, diretamente ou derivando- os de dados espaciais incluídos na representação codificada 210 (por exemplo, a partir de coeficientes de correlação intercanal e coeficientes de diferença de nível intercanal, ou de coeficientes de correlação interobjeto e diferenças de nível interobjeto).
[132] Os coeficientes de upmix para a saída de descorrelacionador (ou saídas) podem ser obtidos como para decodificação de MPEG surround convencional. No entanto, os fatores de ponderação para ponderar a saída de descorrelacionador (ou saídas de descorrelacionador) podem ser determinados com base nas energias do sinal residual (e possivelmente também com base nas energias do sinal ou sinais de descorrelacionador) de modo que um peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada seja determinado dependendo do sinal residual.
[133] 7.4.2 Implementação exemplificativa
[134] A seguir, uma implementação exemplificativa será descrita em referência à Figura 7. No entanto, deve-se observar que o conceito descrito no presente documento também pode ser aplicado nos decodificadores de áudio de múltiplos canais 200 ou 300 de acordo com as Figuras 2 e 3.
[135] A Figura 7 mostra um diagrama de blocos esquemático (ou diagrama de fluxo) de um decodificador (por exemplo, de um decodificador de áudio de múltiplos canais). O decodificador de acordo com a Figura 7 é designado com 700 em sua totalidade. O decodificador 700 é configurado para receber um fluxo de bits 710 e para fornecer, com base nesse, um primeiro sinal de canal de saída 712 e um segundo sinal de canal de saída 714. O decodificador 700 compreende um decodificador de núcleo 720, que é configurado para receber o fluxo de bits 710 e para fornecer, com base nesse, um sinal de downmix 722, um sinal residual 724 e dados espaciais 726. Por exemplo, o decodificador ne núcleo 720 pode fornecer, como o sinal de downmix, uma representação de domínio de tempo ou representação de domínio de transformada (por exemplo, representação de domínio de frequência, representação de domínio de MDCT, representação de domínio de QMF) do sinal de downmix representado pelo fluxo de bits 710. De modo semelhante, o decodificador ne núcleo 720 pode fornecer uma representação de domínio de tempo ou representação de domínio de transformada do sinal residual 724, que é representado pelo fluxo de bits 710. Ademais, o decodificador ne núcleo 720 pode fornecer um ou mais parâmetros espaciais 726, como, por exemplo, um ou mais parâmetro de correlação intercanal, parâmetros de diferença de nível intercanal ou similares.
[136] O decodificador 700 também compreende um descorrelacionador 730, que é configurado para fornecer um sinal descorrelacionado 732 com base no sinal de downmix 722. Qualquer um dos conceitos de descorrelacionamento conhecidos podem ser usados pelo descorrelacionador 730. Ademais, o decodificador 700 também compreende um calculador de coeficiente de upmix 740, que é configurado para receber dados espaciais 726 e para fornecer parâmetros de upmix (por exemplo, parâmetros de upmix udmx,1, udmx,2, udec,1 e udec,2). Ademais, o decodificador 700 compreende um upmixer 750, que é configurado para aplicar os parâmetros de upmix 742 (também designados como coeficientes de upmix) que são fornecidos pelo calculador de coeficiente de upmix 740 com base nos dados espaciais 726. Por exemplo, o upmixer 750 pode escalonar o sinal de downmix 722 com o uso de dois coeficientes de upmix de sinal de downmix (por exemplo, udmx,1, udmx,2), para obter duas versões submetidas a upmix 752, 754 do sinal de downmix 722. Ademais, o upmixer 750 também é configurado para aplicar um ou mais parâmetros de upmix (por exemplo, dois parâmetros de upmix) ao sinal descorrelacionado 732 fornecido pelo descorrelacionador 730, para obter uma primeira versão submetida a upmix (escalonada) 756 e uma segunda versão submetida a upmix (escalonada) 758 do sinal descorrelacionado 732. Ademais, o upmixer 750 é configurado para aplicar um ou mais coeficientes de upmix (por exemplo, dois coeficientes de upmix) ao sinal residual 724, para obter uma primeira versão submetida a upmix (escalonada) 760 e uma segunda versão submetida a upmix (escalonada) 762 do sinal residual 724.
[137] O decodificador 700 também compreende um calculador de peso 770, que é configurado para medir as energias das versões submetidas a upmix (escalonadas) 756, 758 do sinal descorrelacionado 752 e da versão submetida a upmix (escalonada) 760, 762 do sinal residual 724. Ademais, o calculador de peso 770 é configurado para fornecer um ou mais valores de ponderação 772 a um ponderador 780. O ponderador 780 é configurado para obter uma primeira versão submetida a upmix (escalonada) e ponderada 782 do sinal descorrelacionado 732, uma segunda versão submetida a upmix (escalonada) e ponderada 784 do sinal descorrelacionado 732, uma primeira versão submetida a upmix (escalonada) e ponderada 786 do sinal residual 724 e uma segunda versão submetida a upmix (escalonada) e ponderada 788 do sinal residual 724 com o uso de um ou mais valores de ponderação 772 fornecidos pelo calculador de peso 770. O decodificador também compreende um primeiro adicionador 790, que é configurado para adicionar a primeira versão submetida a upmix (escalonada) 752 do sinal de downmix 720, a primeira versão submetida a upmix (escalonada) e ponderada 782 do sinal descorrelacionado 732 e a primeira versão submetida a upmix (escalonada) e ponderada 786 do sinal residual 724, para obter o primeiro sinal de canal de saída 712. Ademais, o decodificador compreende um segundo adicionador 792, que é configurado para adicionar a segunda versão submetida a upmix 754 do sinal de downmix 720, a segunda versão submetida a upmix (escalonada) e ponderada 784 do sinal descorrelacionado 732 e a segunda versão submetida a upmix (escalonada) e ponderada 788 do sinal residual 724, para obter o segundo sinal de canal de saída 714.
[138] No entanto, deve-se observar que não é necessário que o ponderador 780 pese todos os sinais 756, 758, 760, 762. Por exemplo, em algumas modalidades, pode ser suficiente ponderar apenas os sinais 756, 758, ao mesmo tempo em que se deixam os sinais 760, 762 não afetados (de modo que, efetivamente, os sinais 760, 762 sejam diretamente aplicados aos adicionadores 790, 792). Alternativamente, no entanto, a ponderação dos sinais residuais 760, 762 pode ser variada com o tempo. Por exemplo, os sinais residuais podem ser desvanecidos no início ou desvanecidos no final. Por exemplo, a ponderação (ou os fatores de ponderação) dos sinais descorrelacionados pode ser suavizada com o tempo, e os sinais residuais podem ser desvanecidos no início ou desvanecidos no final de modo correspondente.
[139] Ademais, deve-se observar que a ponderação, que é realizada pelo ponderador 780, e o upmix, que é aplicado pelo upmixer 750, também podem ser realizados como uma operação combinada, em que o cálculo do peso pode ser realizado diretamente com o uso do sinal descorrelacionado 732 e o sinal residual 724.
[140] A seguir, alguns detalhes adicionais em relação à funcionalidade do decodificador 700 serão descritas.
[141] Um modo de criptografia paramétrica e residual combinadas pode, por exemplo, ser sinalizado de um modo compatível semirreverso, por exemplo, sinalizando-se a largura de banda residual de uma banda de parâmetro no fluxo de bits. Desse modo, um decodificador preexistente ainda passará e decodificará o fluxo de bits ao comutar para decodificação paramétrica acima da primeira banda de parâmetro. Fluxos de bits preexistentes com o uso de uma largura de banda residual de um não conteria energia residual acima da primeira banda de parâmetro, o que leva a uma decodificação paramétrica no novo decodificador proposto.
[142] No entanto, dentro de um sistema de codec de áudio 3D, a criptografia paramétrica e residual combinada pode ser usada em conjunto com outras ferramentas de decodificador de núcleo como um elemento de canal quádruplo, que possibilita que o decodificador explicitamente detecte fluxos de bits preexistentes e os decodifique em modo de criptografia residual limitada por banda regular. Uma largura de banda residual real é preferencialmente não explicitamente sinalizada, conforme é determinado pelo decodificador no tempo de execução. O cálculo dos coeficientes de upmix é estabelecido para o modo paramétrico em vez de um modo de criptografia residual. As energias da saída de descorrelacionador ponderada Edec e sinal residual ponderado Eres são calculadas pela banda híbrida hb em todos os intervalos de tempo ts e canais de upmix ch para cada quadro:
Figure img0006
[143] No presente documento, udec designa um parâmetro de upmix de sinal descorrelacionado para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch, ∑ ch designa uma soma de canais de upmix, e designa uma soma de intervalos de tempo. xdec designa um valor (por exemplo, um valor de domínio de transformada complexa) do sinal descorrelacionado para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch.
[144] O sinal residual (por exemplo, o sinal residual submetido a upmix 760 ou o sinal residual submetido a upmix 762) é adicionado aos canais de saída (por exemplo, aos canais de saída 712, 714) com um peso de um. O sinal de descorrelacionador (por exemplo, o sinal de descorrelacionador submetido a upmix 756 ou o sinal de descorrelacionador submetido a upmix 758) pode ser ponderado com um fator r (por exemplo, pelo ponderador 780) que é calculado como
Figure img0007
[145] em que Edec(hb) representa um valor de energia ponderado do sinal descorrelacionado xdec para uma banda de frequência hb, e em que Eres(hb) representa um valor de energia ponderado do sinal residual xres para uma banda de frequência hb.
[146] Se nenhum residual (por exemplo, nenhum sinal residual 724) tiver sido transmitido, por exemplo, se Eres = 0, r (o fator que pode ser aplicado pelo ponderador 780, e que pode ser considerado como um valor de ponderação 772) se torna 1, que é equivalente a uma decodificação puramente paramétrica. Se a energia residual (por exemplo, a energia do sinal residual submetido a upmix 760 e/ou do sinal residual submetido a upmix 762) exceder a energia do descorrelacionador (por exemplo, a energia do sinal descorrelacionado submetido a upmix 756 ou do sinal descorrelacionado submetido a upmix 758), por exemplo, se Eres > Edec, o fator r pode ser estabelecido como zero, desabilitando, desse modo, o descorrelacionador e habilitando parcialmente a decodificação de preservação de forma de onda (que pode ser considerada como criptografia residual). No processo de upmix, a saída de descorrelacionador ponderada (por exemplo, sinais 782 e 784) e o sinal residual (por exemplo, sinais 786, 788 ou sinais 760, 762) são ambos adicionados aos canais de saída (por exemplo, sinais 712, 714).
[147] Em conclusão, isso leva a uma regra de upmix em forma de matriz
Figure img0008
[148] em que ch1 representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um primeiro sinal de áudio de saída, em que ch2 representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um segundo sinal de áudio de saída, em que xdmx representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal de downmix, em que xdec representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal descorrelacionado, em que xres representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal residual, em que udmx,1 representa um parâmetro de upmix de sinal de downmix para o primeiro sinal de áudio de saída, em que udmx,2 representa um parâmetro de upmix de sinal de downmix para o segundo sinal de áudio de saída, em que udec,1 representa um parâmetro de upmix de sinal descorrelacionado para o primeiro sinal de áudio de saída, em que udec,2 representa um parâmetro de upmix de sinal descorrelacionado para o segundo sinal de áudio de saída, em que max representa um operador máximo, e em que r representa um fator que descreve uma ponderação do sinal descorrelacionado que depende do sinal residual.
[149] Os coeficientes de upmix Udmx,1, Udmx,2, Udec,1, Udec,2 são calculados como para o modo paramétrico MPS dois-um-dois (2-1-2). Para detalhes, faz-se referência à norma mencionada acima do conceito de MPEG surround.
[150] Em resumo, uma modalidade de acordo com a invenção proporciona um conceito para fornecer sinais de canal de saída com base em um sinal de downmix, um sinal residual e dados espaciais, em que uma ponderação do sinal descorrelacionado é ajustada de modo flexível sem qualquer sobrecarga de sinalização significativa.
[151] 7.5 Alternativas de implementação
[152] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é claro que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa do método ou um recurso de uma etapa do método. De modo análogo, aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou recurso correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou com o uso de) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, alguma ou mais das etapas do método mais importantes podem ser executadas por tal aparelho.
[153] O sinal de áudio codificado da invenção pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão tal como um meio de transmissão sem fio ou um meio de transmissão com fio tal como a Internet.
[154] Dependendo de determinadas exigências de implementação, modalidades da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada com o uso de um meio de armazenamento digital, por exemplo, um disco flexível, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, que tem sinais de controle eletronicamente legíveis armazenados nesse, que cooperam (ou tenham capacidade de cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legível por computador.
[155] Algumas modalidades de acordo com a invenção compreendem uma portadora de dados que tem sinais de controle eletronicamente legíveis, com capacidade de cooperar com um sistema de computador programável, de modo que um dos métodos descritos no presente documento seja realizado.
[156] Geralmente, modalidades da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, sendo que o código de programa é operável para realizar um dos métodos quando o produto de programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível por máquina.
[157] Outras modalidades compreendem o programa de computador para realizar um dos métodos descritos no presente documento, armazenados em uma portadora legível por máquina.
[158] Em outras palavras, uma modalidade do método da invenção é, portanto, um programa de computador que tem um código de programa para realizar um dos métodos descritos no presente documento, quando o programa de computador é executado em um computador.
[159] Uma modalidade adicional dos métodos da invenção é, portanto, uma portadora de dados (ou um meio de armazenamento digital, ou um meio legível por computador) que compreende, gravado nesse, o programa de computador para realizar um dos métodos descritos no presente documento. A portadora de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.
[160] Uma modalidade adicional do método da invenção é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descritos no presente documento. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.
[161] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador, ou um dispositivo de lógica programável, configurado ou adaptado para realizar um dos métodos descritos no presente documento.
[162] Uma modalidade adicional compreende a computador que tem instalado nesse o programa de computador para realizar um dos métodos descritos no presente documento.
[163] Uma modalidade adicional de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos descritos no presente documento para um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou similares. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivos para transferir o programa de computador para o receptor.
[164] Em algumas modalidades, um dispositivo de lógica programável (por exemplo, um arranjo de portas programável em campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, um arranjo de portas programável em campo pode cooperar com um microprocessador a fim de realizar um dos métodos descritos no presente documento. Geralmente, os métodos são preferencialmente realizados por qualquer aparelho de hardware.
[165] As modalidades acima descritas são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e dos detalhes descritos no presente documento estarão claras para outros versados na técnica. Pretende-se, portanto, que sejam limitadas apenas pelo escopo das reivindicações da patente anexas e não pelos detalhes específicos apresentados a título de descrição e explicação das modalidades no presente documento.
[166] 7.6 Modalidade adicional
[167] A seguir, outra modalidade de acordo com a invenção será descrita em referência à Figura 8, que mostra um diagrama de blocos esquemático de um chamado Decodificador Residual Híbrido.
[168] O Decodificador Residual Híbrido 800 de acordo com a Figura 8 é muito semelhante ao decodificador 700 de acordo com a Figura 7, de modo que se faça referência às explicações acima. No entanto, no Decodificador Residual Híbrido 800, uma ponderação adicional (além da aplicação dos parâmetros de upmix) é apenas aplicada aos sinais descorrelacionados submetidos a upmix (que correspondem aos sinais 756,758 no decodificador 700), mas não aos sinais residuais submetidos a upmix (que correspondem aos sinais 760, 762 no decodificador 700). Desse modo, o ponderador no Decodificador Residual Híbrido 800 é, de algum modo, mais simples do que o ponderador no decodificador 700, mas está em concordância, por exemplo, com a ponderação de acordo com a equação (14).
[169] A seguir, a Decodificação Residual e Paramétrica combinada (Criptografia Residual Híbrida) de acordo com a Figura 8 será explicada em mais alguns detalhes.
[170] No entanto, primeiramente, uma visão geral será fornecida.
[171] Além do uso da criptografia residual ou de upmix mono para estéreo com base em descorrelacionador conforme descrito em ISO/IEC 23003-3, subitem 7.11.1, a Criptografia Residual Híbrida permite uma combinação dependente de sinal de ambos os modos. O sinal residual e saída de descorrelacionador são mesclados entre si, com o uso de fatores de ponderação dependentes de tempo e frequência dependendo das energias de sinal e dos parâmetros espaciais, conforme ilustrado na Figura 8.
[172] A seguir, o processo de decodificação será descrito.
[173] O modo de Criptografia Residual Híbrida é indicado pelos elementos de sintaxe bsResidualCoding == 1 e bsResidualBands == 1 em Mps212Config(). Em outras palavras, o uso da criptografia Residual Híbrida pode ser sinalizado com o uso de um elemento do fluxo de bits da representação codificada. O cálculo da matriz de mistura M2 é realizado como se bsResidualCoding == 0, l,m seguindo o cálculo em ISO/IEC 23003-3, subitem 7.11.2.3. A matriz R para a parte com base em descorrelacionador é definida como
[174]
Figure img0009
[175] O processo de upmix é dividido em Downmix, saída de descorrelacionador e residual. O Downmix submetido a upmix udmx é calculado com o uso de:
[176]
Figure img0010
[177] A saída de descorrelacionador submetida a upmix udec é calculada com o uso de:
[178]
Figure img0011
[179] O sinal residual submetido a upmix ur» é calculado com o uso de:
[180]
Figure img0012
[181] As energias do sinal residual submetido a upmix Eres e da saída de descorrelacionador submetida a upmix Edec são calculadas por banda híbrida como soma de canais de saída ch e todos os intervalos de tempo ts quanto de um quadro as:
[182]
Figure img0013
[183]
Figure img0014
[184] A saída de descorrelacionador submetida a upmix é ponderada com o uso de um fator de ponderação rdec calculado para cada banda híbrida por quadro como:
Figure img0015
[185] sendo que ε é um número pequeno para evitar a divisão por zero (por exemplo, ε = 1e-9, ou 0<ε<=1e-5). No entanto, em algumas modalidades, ε pode ser estabelecido como zero (substituindo "E- < ε" por "Em = 0").
[186] Todos os três sinais de upmix são adicionados para formar o sinal de saída decodificado.
[187] 8. Conclusões
[188] Em conclusão, modalidades de acordo com a invenção produzem uma criptografia paramétrica e residual combinada.
[189] A presente invenção proporciona um método para uma combinação dependente de sinal de criptografia residual e paramétrica para a criptografia de estéreo conjunto, que se baseia na ferramenta para estéreo unificado de USAC. Em vez de usar uma largura de banda residual fixa, a quantidade de residual transmitida é determinada como dependente de sinal por um codificador, com variação de tempo e frequência. No lado do decodificador, a quantidade necessária de descorrelação entre os canais de saída é gerada misturando-se o sinal residual e saída de descorrelacionador. Desse modo, um sistema de criptografia/decodificação correspondente tem capacidade para mesclar entre criptografia residual de preservação de forma de onda e criptografia paramétrica total, dependendo do sinal codificado.
[190] Modalidades de acordo com a invenção superam as soluções convencionais. Por exemplo, em USAC, um sistema de MPEG surround dois- um-dois (2-1-2) é usado para criptografia estéreo paramétrica, ou estéreo unificado, que transmite a sinal residual de largura de banda total ou limitado por banda para a preservação de forma de onda parcial. Se um residual limitado por banda é transmitido, o upmix paramétrico com o uso de descorrelacionadores é aplicado acima da largura de banda residual. A desvantagem desse método é que a largura de banda residual é estabelecida como um valor fixo na inicialização do codificador.
[191] Em contrapartida, modalidades de acordo com a invenção permitem uma adaptação dependente de sinal da largura de banda residual ou a comutação para criptografia paramétrica. Ademais, se o processo de downmix em modo de criptografia paramétrica produz cancelamentos de sinal para relações de fase condicionadas equivocadamente, modalidades de acordo com a invenção permitem reconstruir as partes de sinal ausentes (por exemplo, fornecendo um sinal residual apropriado). Deve-se observar que o método de downmix simplificado produz menos cancelamentos de sinal do que o downmix MPS clássico para criptografia paramétrica. No entanto, embora o downmix simplificado convencional não possa ser usado para a preservação de forma de onda parcial, visto que nenhum sinal residual é definido em USAC, modalidades de acordo com a invenção permitem uma reconstrução de forma de onda (por exemplo, uma reconstrução de forma de onda parcial seletiva para porções de sinal em que a reconstrução de forma de onda parcial parece ser importante).
[192] Ainda em conclusão, modalidades de acordo com a invenção produzem um aparelho, um método ou um programa de computador para codificação ou decodificação de áudio conforme descrito no presente documento.

Claims (17)

1. Decodificador de áudio de múltiplos canais (200; 300; 700; 800) para fornecer pelo menos dois sinais de áudio de saída (212, 214; 312, 314; 712, 714) com base em uma representação codificada (210; 310; 710), em que o decodificador de áudio de múltiplos canais é configurado para realizar uma combinação ponderada (220; 780, 790, 792) de um sinal de downmix (222; 752, 754), um sinal descorrelacionado (224; 756,758) e um sinal residual (226; 760, 762; res) para obter um dos sinais de áudio de saída (212, 214; 712, 714), caracterizado por: o decodificador de áudio de múltiplos canais ser configurado para determinar um peso (232; r; rdec) que descreve uma contribuição do sinal descorrelacionado na combinação ponderada que depende de ambos o sinal residual e do sinal descorrelacionado; o decodificador de áudio ser configurado para determinar o peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada para cada quadro dos sinais de áudio de saída.
2. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 1, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para obter parâmetros de upmix (udmx,i, udmx,2, udec,1, udec,2, ur,1, ur,2) com base na representação codificada, e para determinar o peso (232; r; rdec) que descreve a contribuição do sinal descorrelacionado na combinação ponderada que depende dos parâmetros de upmix.
3. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação i ou 2, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para determinar o peso (232; r; rdec) que descreve a contribuição do sinal descorrelacionado na combinação ponderada, de modo que o peso do sinal descorrelacionado diminua com o aumento da energia do sinal residual.
4. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 1 a 3, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para determinar o peso (232; r; rdec) que descreve a contribuição do sinal descorrelacionado na combinação ponderada, de modo que um peso máximo, que é determinado por um parâmetro de upmix de sinal descorrelacionado (udec,1, udec,2; udec(hb,ts,ch); udec(ch,ts)), seja associado ao sinal descorrelacionado se uma energia do sinal residual for zero, e de modo que um peso zero seja associado ao sinal descorrelacionado se uma energia do sinal residual ponderada com um coeficiente de ponderação de sinal residual (ur,1, ur,2; ures(hb,ts.ch); ures(ch,ts)) for maior ou igual a uma energia do sinal descorrelacionado, ponderada com o parâmetro de upmix de sinal descorrelacionado.
5. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 1 a 4, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar um valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado, ponderado dependendo de um ou mais parâmetros de upmix de sinal descorrelacionado, e para computar um valor de energia ponderado (Eres(hb); Eres) do sinal residual, ponderado com o uso de um ou mais parâmetros de upmix de sinal residual, para determinar um fator (r, rdec) que depende do valor de energia ponderado do sinal descorrelacionado e do valor de energia ponderado do sinal residual, e para obter o peso que descreve a contribuição do sinal descorrelacionado a um dos sinais de áudio de saída com base no fator ou para usar o fator como o peso que descreve a contribuição do sinal descorrelacionado a um dos sinais de áudio de saída.
6. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 5, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para multiplicar o fator (r) por um parâmetro de upmix de sinal descorrelacionado (udec,1, udec,2; udec(hb,ts,ch); udec(ch,ts)) para obter o peso que descreve a contribuição do sinal descorrelacionado a um dos sinais de áudio de saída.
7. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 5 ou 6, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar a energia do sinal descorrelacionado, ponderado com o uso de parâmetros de upmix de sinal descorrelacionado, em uma pluralidade de canais de upmix (ch) e intervalos de tempo (ts), para obter o valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado.
8. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 5 a 7, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar a energia do sinal residual, ponderado com o uso de parâmetros de upmix de sinal residual, em uma pluralidade de canais de upmix (ch) e intervalos de tempo (ts), para obter o valor de energia ponderado (Eres(hb); Eres) do sinal residual.
9. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 5 a 8, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar o fator (r; rdec que depende de uma diferença entre o valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado e o valor de energia ponderado (Eres(hb); Eres) do sinal residual.
10. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 9, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar o fator (r; rdec) que depende de uma razão entre • uma diferença entre o valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado e o valor de energia ponderado do sinal residual (Eres(hb); Eres), e • o valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado.
11. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 5 a 10, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para determinar pesos que descrevem contribuições do sinal descorrelacionado a dois ou mais sinais de áudio de saída, em que o decodificador de áudio de múltiplos canais é configurado para determinar uma contribuição do sinal descorrelacionado a um primeiro sinal de áudio de saída com base no valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado e um parâmetro de upmix de sinal descorrelacionado de primeiro canal (udec,1), e em que o decodificador de áudio de múltiplos canais é configurado para determinar uma contribuição do sinal descorrelacionado a um segundo canal de áudio de saída com base no valor de energia ponderado (Edec(hb); Edec) do sinal descorrelacionado e a parâmetro de upmix de sinal descorrelacionado de segundo canal (udec,2).
12. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 1 a 11, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para desabilitar uma contribuição do sinal descorrelacionado à combinação ponderada se uma energia residual (Eres(hb); Eres) exceder uma energia de descorrelacionador (Edec(hb); Edec).
13. Decodificador de áudio de múltiplos canais, de acordo com qualquer uma das reivindicações 1 a 12, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar dois sinais de áudio de saída ch1, ch2 de acordo com
Figure img0016
em que ch1 representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um primeiro sinal de áudio de saída, em que ch2 representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um segundo sinal de áudio de saída, em que xdmx representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal de downmix; em que xdec representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal descorrelacionado; em que xres representa uma ou mais amostras de domínio de tempo ou amostras de domínio de transformada de um sinal residual; em que udmx,1 representa um parâmetro de upmix de sinal de downmix para o primeiro sinal de áudio de saída; em que udmx,2 representa um parâmetro de upmix de sinal de downmix para o segundo sinal de áudio de saída; em que udec,1 representa um parâmetro de upmix de sinal descorrelacionado para o primeiro sinal de áudio de saída; em que udec,2 representa um parâmetro de upmix de sinal descorrelacionado para o segundo sinal de áudio de saída; em que max representa um operador máximo; e em que r representa um fator que descreve uma ponderação do sinal descorrelacionado que depende do sinal residual.
14. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 13, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar o fator r de acordo com
Figure img0017
ou de acordo com
Figure img0018
em que Edec(hb) ou Edec representa um valor de energia ponderado do sinal descorrelacionado xdec para uma banda de frequência hb, e em que Eres(hb) ou Eres representa um valor de energia ponderado do sinal residual xres para uma banda de frequência hb.
15. Decodificador de áudio de múltiplos canais, de acordo com a reivindicação 14, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para computar o valor de energia ponderado do sinal descorrelacionado de acordo com
Figure img0019
em que udec designa um parâmetro de upmix de sinal descorrelacionado para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch, em que xdec representa uma amostra de domínio de tempo ou amostra de domínio de transformada de um sinal descorrelacionado para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch, em que ∑ designa uma soma de canais de upmix ch, e em que ∑ designa uma soma de intervalos de tempo ts, em que ||. || designa um operador normal, em que o decodificador de áudio de múltiplos canais é configurado para computar o valor de energia ponderado do sinal residual de acordo com
Figure img0020
em que ures designa um sinal residual parâmetro de upmix para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch, em que xres representa uma amostra de domínio de tempo ou amostra de domínio de transformada de um sinal descorrelacionado para uma banda de frequência hb, para um intervalo de tempo ts e para um canal de upmix ch.
16. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 15, sendo que o decodificador de áudio de múltiplos canais é caracterizado por ser configurado para ajustar de modo variado um peso que descreve uma contribuição do sinal residual na combinação ponderada.
17. Método (500) para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada, que compreende: realizar (520) uma combinação ponderada de um sinal de downmix, um sinal descorrelacionado e um sinal residual para obter um dos sinais de áudio de saída, caracterizado por um peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada ser determinado (510) dependendo de ambos o sinal residual e do sinal descorrelacionado; o peso que descreve uma contribuição do sinal descorrelacionado na combinação ponderada ser determinado para cada quadro dos sinais de áudio de saída.
BR122022015729-7A 2013-07-22 2014-07-17 Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada BR122022015729B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP13177375.6 2013-07-22
EP13177375 2013-07-22
EP13189309.1 2013-10-18
EP13189309.1A EP2830053A1 (en) 2013-07-22 2013-10-18 Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
PCT/EP2014/065416 WO2015011020A1 (en) 2013-07-22 2014-07-17 Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Publications (3)

Publication Number Publication Date
BR122022015729A2 BR122022015729A2 (pt) 2017-07-25
BR122022015729A8 BR122022015729A8 (pt) 2022-11-29
BR122022015729B1 true BR122022015729B1 (pt) 2023-03-14

Family

ID=48808223

Family Applications (3)

Application Number Title Priority Date Filing Date
BR122022015747-5A BR122022015747B1 (pt) 2013-07-22 2014-07-17 Decodificador e codificador de áudio de múltiplos canais, método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada e método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais
BR122022015729-7A BR122022015729B1 (pt) 2013-07-22 2014-07-17 Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada
BR112016001248-8A BR112016001248B1 (pt) 2013-07-22 2014-07-17 Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR122022015747-5A BR122022015747B1 (pt) 2013-07-22 2014-07-17 Decodificador e codificador de áudio de múltiplos canais, método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada e método para fornecer uma representação codificada de um sinal de áudio de múltiplos canais

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR112016001248-8A BR112016001248B1 (pt) 2013-07-22 2014-07-17 Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada

Country Status (19)

Country Link
US (4) US10839812B2 (pt)
EP (4) EP2830053A1 (pt)
JP (5) JP6253776B2 (pt)
KR (2) KR101803212B1 (pt)
CN (2) CN105556596B (pt)
AR (1) AR097013A1 (pt)
AU (3) AU2014295212B2 (pt)
BR (3) BR122022015747B1 (pt)
CA (2) CA2974271C (pt)
ES (2) ES2701812T3 (pt)
MX (3) MX361809B (pt)
MY (2) MY198121A (pt)
PL (2) PL3025331T3 (pt)
PT (2) PT3425633T (pt)
RU (1) RU2676233C2 (pt)
SG (3) SG10201708211SA (pt)
TW (1) TWI566234B (pt)
WO (1) WO2015011020A1 (pt)
ZA (1) ZA201601081B (pt)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
RU2642386C2 (ru) * 2013-10-03 2018-01-24 Долби Лабораторис Лайсэнзин Корпорейшн Адаптивное генерирование рассеянного сигнала в повышающем микшере
JP6479786B2 (ja) * 2013-10-21 2019-03-06 ドルビー・インターナショナル・アーベー オーディオ信号のパラメトリック再構成
KR20160101692A (ko) 2015-02-17 2016-08-25 한국전자통신연구원 다채널 신호 처리 방법 및 상기 방법을 수행하는 다채널 신호 처리 장치
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
CN117854515A (zh) * 2017-07-28 2024-04-09 弗劳恩霍夫应用研究促进协会 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置
CN109389986B (zh) * 2017-08-10 2023-08-22 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
CN110060696B (zh) * 2018-01-19 2021-06-15 腾讯科技(深圳)有限公司 混音方法及装置、终端及可读存储介质
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
CN114708874A (zh) 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
SG11202012936VA (en) * 2018-07-04 2021-01-28 Fraunhofer Ges Forschung Multisignal audio coding using signal whitening as preprocessing
KR20200073878A (ko) 2018-12-15 2020-06-24 한수영 자동 플라스틱 컵 분리기
MX2021007109A (es) 2018-12-20 2021-08-11 Ericsson Telefon Ab L M Metodo y aparato para controlar el ocultamiento de perdida de tramas de audio multicanal.
BR112021025265A2 (pt) 2019-06-14 2022-03-15 Fraunhofer Ges Forschung Sintetizador de áudio, codificador de áudio, sistema, método e unidade de armazenamento não transitória
CN110739000B (zh) * 2019-10-14 2022-02-01 武汉大学 一种适应于个性化交互***的音频对象编码方法
CN111081264B (zh) * 2019-12-06 2022-03-29 北京明略软件***有限公司 一种语音信号处理方法、装置、设备及存储介质
GB2595475A (en) * 2020-05-27 2021-12-01 Nokia Technologies Oy Spatial audio representation and rendering
KR20230084244A (ko) * 2020-10-09 2023-06-12 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 대역폭 확장을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램

Family Cites Families (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3330178B2 (ja) 1993-02-26 2002-09-30 松下電器産業株式会社 音声符号化装置および音声復号化装置
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
US5970152A (en) 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
EP1604352A4 (en) * 2003-03-15 2007-12-19 Mindspeed Tech Inc SINGLE NOISE DELETION MODEL
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US7646875B2 (en) 2004-04-05 2010-01-12 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatus thereof
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402649D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods of creating orthogonal signals
US7835918B2 (en) * 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4543973B2 (ja) * 2005-03-08 2010-09-15 富士電機機器制御株式会社 AS−i用スレーブの過負荷・短絡保護回路
BRPI0608945C8 (pt) * 2005-03-30 2020-12-22 Coding Tech Ab codificador de áudio de multi-canal, decodificador de áudio de multi-canal, método de codificar n sinais de áudio em m sinais de áudio e dados paramétricos associados, método de decodificar k sinais de áudio e dados paramétricos associados, método de transmitir e receber um sinal de áudio de multi-canal codificado, mídia de armazenamento legível por computador, e, sistema de transmissão
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US20070055510A1 (en) 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
KR100636249B1 (ko) * 2005-09-28 2006-10-19 삼성전자주식회사 인핸스드 오디오 매트릭스 디코딩 방법 및 장치
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
JP2007207328A (ja) 2006-01-31 2007-08-16 Toshiba Corp 情報記憶媒体、プログラム、情報再生方法、情報再生装置、データ転送方法、及びデータ処理方法
US20080004883A1 (en) 2006-06-30 2008-01-03 Nokia Corporation Scalable audio coding
EP2328364B1 (en) 2006-10-13 2020-07-01 Auro Technologies NV A method and encoder for combining digital data sets, a decoding method and decoder for such combined digital data sets and a record carrier for storing such combined digital data set
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2009049896A1 (en) 2007-10-17 2009-04-23 Fraunhofer-Fesellschaft Zur Förderung Der Angewandten Forschung E.V. Audio coding using upmix
WO2009054665A1 (en) 2007-10-22 2009-04-30 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
US8386271B2 (en) * 2008-03-25 2013-02-26 Microsoft Corporation Lossless and near lossless scalable audio codec
US8811621B2 (en) 2008-05-23 2014-08-19 Koninklijke Philips N.V. Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
EP2144229A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
CA2820199C (en) 2008-07-31 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Signal generation for binaural signals
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
WO2010064877A2 (en) 2008-12-05 2010-06-10 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CA2754671C (en) * 2009-03-17 2017-01-10 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
SG177277A1 (en) 2009-06-24 2012-02-28 Fraunhofer Ges Forschung Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
CN102171754B (zh) 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
KR101613975B1 (ko) 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
TWI433137B (zh) 2009-09-10 2014-04-01 Dolby Int Ab 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法
TWI478149B (zh) * 2009-10-16 2015-03-21 Fraunhofer Ges Forschung 用以利用平均值而基於下混信號表示型態和與下混信號表示型態相關聯之參數側邊資訊來提供用於提供上混信號表示型態之一或多個經調整參數的裝置、方法與電腦程式
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
UA101291C2 (ru) 2009-12-16 2013-03-11 Долби Интернешнл Аб Сводка параметров последовательности бит sbr
EP2360681A1 (en) 2010-01-15 2011-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
KR101437896B1 (ko) * 2010-04-09 2014-09-16 돌비 인터네셔널 에이비 Mdct-기반의 복소수 예측 스테레오 코딩
AU2011240239B2 (en) 2010-04-13 2014-06-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction
EP3144932B1 (en) * 2010-08-25 2018-11-07 Fraunhofer Gesellschaft zur Förderung der Angewand An apparatus for encoding an audio signal having a plurality of channels
KR101697550B1 (ko) 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
JP5533502B2 (ja) 2010-09-28 2014-06-25 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
GB2485979A (en) 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
CN102074242B (zh) * 2010-12-27 2012-03-28 武汉大学 语音音频混合分级编码中核心层残差提取***及方法
JP5582027B2 (ja) * 2010-12-28 2014-09-03 富士通株式会社 符号器、符号化方法および符号化プログラム
EP2477188A1 (en) 2011-01-18 2012-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of slot positions of events in an audio signal frame
TWI480860B (zh) 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術
JP5737077B2 (ja) 2011-08-30 2015-06-17 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JP5998467B2 (ja) * 2011-12-14 2016-09-28 富士通株式会社 復号装置、復号方法、及び復号プログラム
US9288371B2 (en) 2012-12-10 2016-03-15 Qualcomm Incorporated Image capture device in a networked environment
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830053A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal

Also Published As

Publication number Publication date
JP2018010312A (ja) 2018-01-18
EP3660844A1 (en) 2020-06-03
ES2701812T3 (es) 2019-02-26
JP2016531483A (ja) 2016-10-06
AU2014295212B2 (en) 2017-08-31
SG11201600403VA (en) 2016-02-26
CN105556596B (zh) 2019-12-13
MX2023001960A (es) 2023-02-23
ZA201601081B (en) 2017-11-29
US20180040328A1 (en) 2018-02-08
BR122022015729A8 (pt) 2022-11-29
TW201519215A (zh) 2015-05-16
SG10201708209WA (en) 2017-11-29
CN110895944A (zh) 2020-03-20
AU2017216523B2 (en) 2019-05-16
CA2918864A1 (en) 2015-01-29
AR097013A1 (es) 2016-02-10
CA2918864C (en) 2018-07-10
US10839812B2 (en) 2020-11-17
MX2018009140A (es) 2020-09-17
KR101893016B1 (ko) 2018-08-29
JP2021140170A (ja) 2021-09-16
BR122022015747B1 (pt) 2023-03-14
EP3025331B1 (en) 2018-08-15
CN105556596A (zh) 2016-05-04
AU2017216523A1 (en) 2017-08-31
JP2019135547A (ja) 2019-08-15
BR122022015747A2 (pt) 2017-07-25
JP7269279B2 (ja) 2023-05-08
EP3025331A1 (en) 2016-06-01
EP2830053A1 (en) 2015-01-28
KR20170084355A (ko) 2017-07-19
JP7156986B2 (ja) 2022-10-19
CA2974271A1 (en) 2015-01-29
CA2974271C (en) 2020-06-02
PL3025331T3 (pl) 2019-01-31
US20160142845A1 (en) 2016-05-19
JP2023103271A (ja) 2023-07-26
RU2016105647A (ru) 2017-08-25
US20160275958A1 (en) 2016-09-22
BR122022015729A2 (pt) 2017-07-25
MX361809B (es) 2018-12-14
MY192214A (en) 2022-08-09
AU2019202950A1 (en) 2019-05-16
EP3425633B1 (en) 2020-05-13
TWI566234B (zh) 2017-01-11
JP6585128B2 (ja) 2019-10-02
PT3425633T (pt) 2020-08-20
ES2798137T3 (es) 2020-12-09
US10755720B2 (en) 2020-08-25
US20200388293A1 (en) 2020-12-10
WO2015011020A1 (en) 2015-01-29
PL3425633T3 (pl) 2020-10-19
MX2016000513A (es) 2016-04-07
BR112016001248A2 (pt) 2017-07-25
MY198121A (en) 2023-08-04
AU2014295212A1 (en) 2016-03-10
BR112016001248B1 (pt) 2022-11-16
BR122022015747A8 (pt) 2022-11-29
AU2019202950B2 (en) 2020-11-26
RU2676233C2 (ru) 2018-12-26
EP3425633A1 (en) 2019-01-09
KR101803212B1 (ko) 2017-12-28
KR20160033163A (ko) 2016-03-25
PT3025331T (pt) 2018-11-23
JP6253776B2 (ja) 2017-12-27
SG10201708211SA (en) 2017-11-29
US10354661B2 (en) 2019-07-16

Similar Documents

Publication Publication Date Title
BR122022015729B1 (pt) Decodificador de áudio de múltiplos canais e método para fornecer pelo menos dois sinais de áudio de saída com base em uma representação codificada
JP6735053B2 (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
BR112016001137B1 (pt) Decodificador de áudio, codificador de áudio, método para fornecer pelo menos quatro sinais de canal de áudio na base de uma representação codificada, e método para fornecer uma representação codificada na base de pelo menos quatro sinais de canal de áudio que usa uma extensão de largura de banda
BR112016001143B1 (pt) Codificador de áudio para codificar dados de entrada de áudio para obter dados de saída de áudio, decodificador de áudio para decodificar dados de áudio codificados e método de codificação de dados de entrada de áudio para obter dados de saída de áudio
MX2012005781A (es) Aparato para proporcionar una representacion de señal de mezcla ascendente con base en la representacion de señal de mezcla descendente, aparato para proporcionar un flujo de bits que representa una señal de audio multicanal, metodos, programas informaticos y flujo de bits que representan una señal de audio multicanal usando un parametro de combinacion lineal.
KR102380370B1 (ko) 오디오 인코더 및 디코더
BR112016001141B1 (pt) Codificador de áudio, decodificador de áudio e métodos que usam sinais residuais codificados em conjunto

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/008 , G10L 19/20

Ipc: G10L 19/008 (2006.01), G10L 19/20 (2006.01), G10L

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 17/07/2014, OBSERVADAS AS CONDICOES LEGAIS