BR112016021382B1 - dispositivo codificador de áudio e um dispositivo decodificador de áudio com codificação de ganho eficiente no controle de gama dinâmica - Google Patents

dispositivo codificador de áudio e um dispositivo decodificador de áudio com codificação de ganho eficiente no controle de gama dinâmica Download PDF

Info

Publication number
BR112016021382B1
BR112016021382B1 BR112016021382-3A BR112016021382A BR112016021382B1 BR 112016021382 B1 BR112016021382 B1 BR 112016021382B1 BR 112016021382 A BR112016021382 A BR 112016021382A BR 112016021382 B1 BR112016021382 B1 BR 112016021382B1
Authority
BR
Brazil
Prior art keywords
dynamic range
range control
dfr
nodes
dfs
Prior art date
Application number
BR112016021382-3A
Other languages
English (en)
Inventor
Fabian KÜCH
Christian Uhle
Michael KRATSCHMER
Bernhard NEUGEBAUER
Michael Meier
Stephan Schreiner
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V
Publication of BR112016021382B1 publication Critical patent/BR112016021382B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

DISPOSITIVO CODIFICADOR DE ÁUDIO E UM DISPOSITIVO DECODIFICADOR DE ÁUDIO COM CODIFICAÇÃO DE GANHO EFICIENTE NO CONTROLE DE GAMA DINÂMICA. A invenção providencia um dispositivo codificador de áudio, que compreende: um codificador de áudio configurado para produzir u m fluxo de bits de áudio codificado a partir de um sinal de áudio que compreende quadros de áudio consecutivos; um codificador de controle da gama dinâmica configurado para produzir um fluxo de bits de controle da gama dinâmica codificado a partir de uma sequência de controle da gama dinâmica correspondente ao sinal de áudio e que compreende quadros de controle da gama dinâmica consecutivos, em que cada quadro de controle da gama dinâmica dos quadros de controle da gama dinâmica inclui um ou mais nós, em que cada nó do ou dos vários nós inclui informação de ganho para o sinal de áudio e informação de tempo indicativa do momento a que a informação de ganho corresponde; em que o codificador de controle da gama dinâmica está configurado de modo a que o fluxo de bits de controle da gama dinâmica codificado compreenda para cada quadro de controle da gama dinâmica dos quadros de controle da gama dinâmica uma correspondente parte (...).

Description

[001] Controle de gama dinâmica (DRC) no contexto deste documento refere-se a uma técnica de processamento de sinal digital para reduzir a gama dinâmica de sinais de áudio de um modo controlado [1]. A redução desejada da gama dinâmica é conseguida pela redução do nível de componentes de sons altos e/ou a amplificação de partes suaves dos sinais de áudio.
[002] Uma típica aplicação para DRC é adaptar as propriedades dinâmicas de um sinal de áudio a um ambiente de escuta. Por exemplo, quando escuta música em um ambiente ruidoso, a gama dinâmica deve ser reduzida para permitir uma amplificação de sinal geral sem causar um corte no resultante sinal amplificado. Neste caso, os picos de sinal altos devem ser atenuados, p. ex. através de um limitador. Adicionalmente, os componentes de sinal suave devem ser amplificados relativamente às partes ruidosas para melhorar a sua inteligibilidade em um ambiente de escuta ruidoso.
[003] Um objetivo da presente invenção é providenciar um conceito melhorado para o controle da gama dinâmica no contexto da transmissão de áudio.
[004] Este objetivo é conseguido por um dispositivo codificador de áudio que compreende:
[005] um codificador de áudio configurado para produzir um fluxo de bits de áudio codificado a partir de um sinal de áudio que compreende quadros de áudio consecutivos;
[006] um codificador de controle da gama dinâmica configurado para produzir um fluxo de bits de controle da gama dinâmica codificado a partir de uma sequência de controle da gama dinâmica correspondente ao sinal de áudio e que compreende quadros de controle da gama dinâmica consecutivos, em que cada quadro de controle da gama dinâmica dos quadros de controle da gama dinâmica inclui um ou mais nós, em que cada nó do ou dos vários nós inclui informação de ganho para o sinal de áudio e informação de tempo indicativa do momento a que a informação de ganho corresponde;
[007] em que o codificador de controle da gama dinâmica está configurado de modo a que o fluxo de bits de controle da gama dinâmica codificado compreenda para cada quadro de controle da gama dinâmica dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits;
[008] em que o codificador de controle da gama dinâmica está configurado para executar um procedimento de deslocação, no qual são selecionados como nós deslocados um ou mais nós dos nós do quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica, em que uma representação de bits de cada um dos um ou mais nós deslocados do quadro de controle da gama dinâmica de referência está integrada na parte de fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, em que uma representação de bits de cada nó remanescente dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica está integrada na parte de fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica de referência.
[009] A invenção dirige-se à situação de uma transmissão de áudio que usa a codificação do sinal de áudio, em que a informação de ganho não é diretamente aplicada ao sinal de áudio, mas também codificada e transmitida em conjunto com o sinal de áudio codificado. No decodificador, tanto o sinal de áudio como a informação de ganho podem ser decodificados e a informação de ganho pode ser aplicada ao correspondente sinal de áudio. Conforme explicado em mais detalhe abaixo, a invenção consegue uma codificação eficiente da informação de ganho. Mais precisamente, evita picos de taxas de bits no fluxo de bits de controle da gama dinâmica codificado.
[010] O processo de aplicar controle de gama dinâmica a um sinal de áudio pode ser expresso por uma simples multiplicação do sinal de áudio x(k) através de um valor de ganho de tempo variável g(k):y(k) = ^(k)x(k) (1)
[011] em que k representa um índice de tempo de amostra. O valor do ganho g(k) pode ser calculado, p. ex. com base em uma estimativa a curto prazo da raiz quadrada média do sinal de áudio x(k). Mais detalhes sobre estratégias para determinar valores de ganho adequados são discutidos em [1]. A seguir abordamos os ganhos de tempo variável g(k) como uma sequência de ganhos.
[012] Explica-se a seguir a codificação das sequências de ganhos do controle da gama dinâmica. Em primeiro lugar, a sequência de ganhos do controle da gama dinâmica está dividida em chamados quadros de controle da gama dinâmica de amostras de ganhos, que contêm um número fixo de amostras de ganhos. Normalmente, escolhe-se um tamanho de quadro temporal para os quadros de controle da gama dinâmica que seja igual ao tamanho temporal de um quadro de áudio do correspondente codificador de áudio. Dentro de cada quadro de controle da gama dinâmica, são selecionados uns chamados nós, preferencialmente em uma grelha de tempo uniforme.
[013] O espaçamento desta grelha define a resolução mais alta do tempo disponível, isto é, a distância mínima em amostras entre dois nós é igual às amostras que têm a resolução mais alta de tempo disponível. Cada nó é representado pela posição da amostra dentro do quadro de controle da gama dinâmica, a informação de ganho, que pode ser expressa como um valor de ganho, para essa posição e opcionalmente informação sobre a inclinação dos valores do ganho nas posições do nó. Para a discussão que se segue será útil definir o número máximo de nós que pode ser selecionado dentro de um quadro.
[014] O codificador de controle da gama dinâmica codifica a informação de ganho dos nós, p. ex., usando valores diferenciais quantizados de pares de nós de ganho consecutivos. No decodificador, a sequência de ganho original é reconstruída como sendo o mais possível boa utilizando a interpolação spline ou interpolação linear baseada na informação transmitida dos nós (valor do ganho, posição da amostra dentro do quadro de controle da gama dinâmica e informação sobre a inclinação, se for aplicável).
[015] Uma abordagem eficiente para codificar a sequência de ganhos de controle da gama dinâmica é usar um valor quantizado da diferença do ganho (normalmente em dB) de pares de nós consecutivos, assim como, a diferença de tempo das posições de amostra destes nos dentro do quadro de controle da gama dinâmica considerado. A informação sobre inclinação normalmente não está representada como uma diferença entre dois nós. Uma vez que não existe um nó anterior para o primeiro nó dentro do quadro, o seu valor de ganho não é codificado de um modo diferencial, mas os valores são explicitamente codificados. A diferença de tempo do primeiro nó é normalmente determinada como sendo o desvio do início do quadro de controle da gama dinâmica.
[016] O codificador pode depois atribuir uma palavra de código fixa p. ex. de uma tabela Huffman predefinida (livro de código) a cada ganho e diferenças de tempo dos pares de nós.
[017] No decodificador de controle da gama dinâmica, o fluxo de bits de controle da gama dinâmica é decodificado e é reconstruída a informação relevante (valor do ganho, posição de amostra dentro do quadro de controle da gama dinâmica e informação sobre inclinação, se for aplicável) nas posições dos nós transmitidos. Os valores de ganhos para as amostras de ganho remanescentes dentro de um quadro são obtidos por interpolação entre os pares dos nós transmitidos e decodificados. A interpolação pode basear-se em splines se a informação sobre inclinação dos nós de ganho foi transmitida ou, em alternativa, usando a interpolação linear se apenas estiverem disponíveis as diferenças de ganhos entre os pares de nós e a informação de inclinação tiver sido descartada.
[018] Em princípio, as cadeias de codificador/ decodificador de controle da gama dinâmica podem ser operadas de dois modos. O chamado modo de quadro total refere-se ao caso em que depois da decodificação de um fluxo de bits de controle da gama dinâmica recebido, correspondendo a um quadro de controle da gama dinâmica de referência, os ganhos em cada posição de amostra do quadro de controle da gama dinâmica de referência, pode ser imediatamente determinado após interpolação com base nos nós decodificados. Isto implica que um nó tem de ser transmitido em cada limite de quadro, isto é, na posição de amostra correspondente à última amostra do quadro de controle da gama dinâmica de referência. Se o comprimento do quadro de controle da gama dinâmica for N isto quer dizer que o último nó transmitido tem de estar localizado na posição de amostra N dentro do quadro de controle da gama dinâmica de referência.
[019] A invenção evita esta desvantagem pelo fato de se basear no segundo modo, que é designado por “modo de atraso”. Neste caso, não existe a necessidade de transmitir um nó para a última posição de amostra dentro do quadro de controle da gama dinâmica de referência. Por isso, o decodificador de controle da gama dinâmica tem de esperar pela decodificação do quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência para realizar a interpolação exigida de todos os valores de ganho a seguir ao último nó dentro do quadro de controle da gama dinâmica de referência. Isto porque a informação do primeiro nó do quadro de controle da gama dinâmica subsequente tem de ser conhecida para realizar a interpolação entre o último nó do quadro de controle da gama dinâmica de referência e o primeiro nó do quadro de controle da gama dinâmica subsequente para determinar o valor de ganho no meio através da interpolação.
[020] Na prática, o atraso causado pelo uso do modo de atraso para codificar a informação de controle da gama dinâmica não é um problema. Isto porque os códigos de áudio que normalmente acompanham o esquema de codificação de controle da gama dinâmica também introduzem um atraso inerente de um quadro de áudio quando aplicam subsequentemente os passos de codificação e decodificação. Exemplos importantes desses códigos de áudio são ISO/IEC 13818-7, Codificação de Áudio Avançada (MPEG-2 AAC), ISO/IEC 14496-3, subparte 4 (MPEG-4 AAC) ou ISO/IEC 23003-3, parte 3, Discurso Unificado e Codificação de Áudio (USAC). Esse tipo de esquemas de codificação de áudio requer o quadro de áudio de referência e o quadro de áudio subsequente ao quadro de áudio de referência para calcular (usando uma estrutura de adição e sobreposição) as amostras de áudio corretas correspondentes ao quadro de áudio de controle da gama dinâmica de referência.
[021] É importante notar que o número de nós exigidos para suficientemente aproximar a sequência do ganho de controle da gama dinâmica original varia significativamente de quadro de controle da gama dinâmica para quadro de controle da gama dinâmica. Isso resulta do fato de serem exigidos mais nós para representar ganhos muito variáveis no tempo comparativamente ao caso em que apenas têm de ser codificados valores de ganho de mudança lenta. Esta observação implica que a taxa de bits exigida para transmitir sequências de ganhos pode variar significativamente de quadro para quadro. Alguns quadros podem exigir um número maior de nós por codificar, resultando em picos de taxas de bits altos. Isto não é desejável, especialmente, quando o sinal de áudio e a sequência de ganho de controle da gama dinâmica são transmitidos em um fluxo de bits conjunto que compreende o fluxo de bits de controle da gama dinâmica codificado e o fluxo de bits de áudio codificado, que devem ter uma taxa de bits quase constante. Depois, um pico na taxa de bits relacionado com o controle da gama dinâmica reduz a taxa de bits disponível para o codificador de áudio, que resulta frequentemente em uma degradação da qualidade de áudio depois da decodificação. No entanto, com os métodos do estado tecnológico atual para a codificação de sequências de ganho de controle da gama dinâmica, só se consegue uma redução da taxa de bits relacionada com o controle da gama dinâmica em um certo quadro se for reduzido o número de nós que são selecionados para representar a sequência de ganho dentro do quadro. Isto, por sua vez, causa mais erros entre a sequência de ganho original e aquela que é reconstruída depois do processo de decodificação do controle da gama dinâmica. A invenção supera estas desvantagens ao reduzir as taxas de bits de pico do fluxo de dados de controle da gama dinâmica codificado sem aumentar o erro entre a sequência original e a sequência de controle da gama dinâmica reconstruída.
[022] Nesta seção apresenta-se a codificação das sequências de ganhos do controle da gama dinâmica de acordo com a invenção. A invenção permite controlar a taxa de bits de pico exigida para um quadro de controle da gama dinâmica de referência sem mudar a resultante sequência da taxa de bits comparativamente com o caso em que o método proposto não é usado. A abordagem proposta explora o atraso inerente de um quadro introduzido pelos codificadores de áudio do estado atual da técnica para reduzir picos no número de nós dentro de um quadro através da distribuição da transmissão de alguns dos nós para o próximo quadro de controle da gama dinâmica subsequente. Os detalhes do método proposto são apresentados a seguir.
[023] Tal como foi explicado em cima, quando combinado com um esquema de codificação de áudio que introduz um atraso de quadro relativamente aos ganhos de controle da gama dinâmica, os ganhos de controle da gama dinâmica decodificados são atrasados por um quadro antes de serem aplicados ao sinal de áudio. Isto quer dizer que os nós do quadro de controle da gama dinâmica de referência são aplicados à saída do decodificador de áudio válida em um quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência. Isto implica que no modo de atraso predefinido basta transmitir os nós do quadro de controle da gama dinâmica de referência juntamente com os nós do quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência e aplicar os correspondentes ganhos de controle da gama dinâmica sem um atraso diretamente ao correspondente sinal de saída de áudio no decodificador.
[024] O fato é explorado na invenção para reduzir o número máximo de nós transmitidos dentro de um quadro de controle da gama dinâmica. De acordo com a invenção, alguns nós do quadro de controle da gama dinâmica de referência são deslocados para o quadro de controle da gama dinâmica subsequente, o que pode ser feito antes da decodificação. Tal como será discutido a seguir, os nós deslocados podem “preceder” o primeiro nó no quadro de controle da gama dinâmica subsequente apenas para a codificação das diferenças de ganho e a informação sobre inclinação. Para codificar a informação da diferença de tempo, pode ser aplicado um método diferente.
[025] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de um número de nós do quadro de controle da gama dinâmica de referência ser superior a um valor limite predefinido.
[026] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de uma soma de um número de nós do quadro de controle da gama dinâmica de referência e um número de nós deslocados do quadro de controle da gama dinâmica anterior ao quadro de controle da gama dinâmica de referência por integrar na parte de fluxo de bits correspondente ao quadro de controle da gama dinâmica de referência ser maior do que um valor limite predefinido.
[027] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de uma soma de um número de nós do quadro de controle da gama dinâmica de referência e um número de nós deslocados do quadro de controle da gama dinâmica anterior ao quadro de controle da gama dinâmica de referência por integrar na parte de fluxo de bits correspondente ao quadro de controle da gama dinâmica de referência ser maior do que um número de nós do quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência.
[028] Independentemente das condições definidas, sob as quais o procedimento de deslocação é iniciado, o primeiro nó do quadro de controle da gama dinâmica de referência não deve ser deslocado para o quadro de controle da gama dinâmica subsequente, uma vez que o seu valor é necessário para interpolação dos valores de controle do ganho no início do quadro de controle da gama dinâmica de referência. Além disso, um nó deve ser deslocado apenas uma vez para evitar um atraso quando está a decodificar o fluxo de bits.
[029] De acordo com um modelo privilegiado da invenção, a informação do tempo do um ou mais nós, é representada de modo a que o um ou mais nós deslocados possa ser identificado usando a informação do tempo.
[030] De acordo com um modelo privilegiado da invenção, a informação de tempo do um ou mais nós deslocados que está representada por uma soma da diferença de tempo a partir de um início do quadro de controle da gama dinâmica ao qual pertence o respectivo nó até à posição temporal do respectivo nó dentro do quadro do controle da gama dinâmica ao qual pertence o respectivo nó e sendo um valor de desvio superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica subsequente ao respectivo quadro de controle da gama dinâmica.
[031] De acordo com um modelo privilegiado da invenção, a informação de ganho da representação de bits do nó deslocado, que está em uma primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, é representada por um valor de ganho absoluto, e a informação de ganho de cada representação de bits dos nós deslocados uma posição depois da representação de bits do nó, que está na primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, é representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho da representação de bits do respectivo nó deslocado e o valor de ganho da representação de bits do nó, que precede a representação de bits do respectivo nó.
[032] De acordo com um modelo privilegiado da invenção, no caso de as representações de bits do um ou mais nós deslocados do quadro de controle da gama dinâmica de referência estarem integradas na parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, a informação de ganho da representação de bits do nó do subsequente quadro de controle da gama dinâmica em uma primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência depois de uma ou mais posições das representações de bits do um ou mais nós deslocados ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho da representação de bits do respectivo nó e um valor de ganho da representação de bits do deslocado nó, que precede a representação de bits do respectivo nó.
[033] De acordo com um modelo privilegiado da invenção, um tamanho temporal dos quadros de áudio é igual a um tamanho temporal dos quadros de controle da gama dinâmica.
[034] De acordo com um modelo privilegiado da invenção, o um ou mais nós do (um) quadro de controle da gama dinâmica são selecionados a partir de uma grelha de tempo uniforme.
[035] De acordo com um modelo privilegiado da invenção, cada nó do um ou mais nós, compreende informação de inclinação.
[036] De acordo com um modelo privilegiado da invenção, o codificador de controle da gama dinâmica está configurado para codificar os nós usando uma técnica de codificação entrópica, tal como a codificação Huffman ou aritmética.
[037] O codificador pode atribuir uma palavra de código fixa p. ex. de uma tabela Huffman predefinida (livro de código) a cada ganho e diferenças de tempo dos pares de nós. Exemplos de tabelas de Huffman adequadas para codificar as diferenças de tempo de pares de nós consecutivos são dados na Tabela 1 e Tabela 2, respectivamente.Tabela 1: Exemplo de uma tabela de Huffman para a codificação de diferenças de tempo dos nós de ganho DRC.
Figure img0001
Figure img0002
Tabela 2: Exemplo de uma tabela de Huffman para a codificação de diferenças de tempo dos nós de ganho DRC, em que Z=ceil(log2(2*nNodesMax))
Figure img0003
[038] Em outro aspecto da invenção o objetivo é conseguido por um dispositivo decodificador de áudio, que compreende:
[039] um decodificador de áudio configurado para decodificar um fluxo de bits de áudio codificado para reproduzir um sinal de áudio que compreende quadros de áudio consecutivos;
[040] um decodificador de controle da gama dinâmica configurado para decodificar um fluxo de bits de controle da gama dinâmica codificado para reproduzir uma sequência do controle da gama dinâmica correspondente ao sinal de áudio AS e que compreende quadros de controle da gama dinâmica consecutivos;
[041] em que o fluxo de bits de controle da gama dinâmica codificado compreende para cada quadro de controle da gama dinâmica, dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits;
[042] em que o fluxo de bits de controle da gama dinâmica codificado compreende representações de bits de nós, em que cada representação de bits de um nó dos nós compreende informação de ganho para o sinal de áudio e informação de tempo indicando a que momento no tempo a informação de ganho corresponde;
[043] em que o fluxo de bits de controle da gama dinâmica codificado compreende representações de bits de nós deslocados selecionados a partir dos nós de um quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, em que a representação de bits de cada nó remanescente dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica está integrada na parte do fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica de referência; e
[044] em que o decodificador de controle da gama dinâmica está configurado para decodificar a representação de bits de cada nó remanescente dos nós remanescentes do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica para reproduzir cada nó remanescente do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica, para decodificar a representação de bits de cada nó deslocado dos nós deslocados selecionados a partir dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica para reproduzir cada nó deslocado dos nós deslocados selecionados a partir dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica e para combinar os nós remanescentes reproduzidos e os nós deslocados reproduzidos para reconstruir o quadro de controle da gama dinâmica de referência.
[045] O decodificador de controle da gama dinâmica recebe o fluxo de bits de controle da gama dinâmica. O fluxo de bits de controle da gama dinâmica, que corresponde à informação de nós (posição da amostra, valor de ganho e informação de inclinação, se for aplicável), pode ser decodificado do seguinte modo:
[046] Um valor para a diferença de tempo entre dois nós (p. ex. como um múltiplo inteiro da distância mínima entre dois nós) é determinado a partir da palavra de código recebida baseada p. ex. nas regras apresentadas em um livro de códigos de Huffman. A correspondente posição de amostra do nó atualmente decodificado é obtida pela adição do valor da diferença de tempo ao valor da posição da amostra calculado para o nó anterior.
[047] Depois de decodificar os nós do quadro de controle da gama dinâmica de referência, os nós do quadro de controle da gama dinâmica subsequente são decodificados.
[048] Se a posição de amostra determinada dentro do quadro de controle da gama dinâmica subsequente corresponder a um valor superior ao comprimento de um quadro de controle da gama dinâmica subsequente, o decodificador de controle da gama dinâmica reconhece que a informação do nó temporal atual se refere a um nó originalmente localizado no quadro de controle da gama dinâmica de referência.
[049] Para obter a posição da amostra correta dentro do quadro de controle da gama dinâmica de referência, é subtraído um desvio da posição de amostra calculada. Um exemplo prático é subtrair o valor que corresponde ao comprimento de um quadro de controle da gama dinâmica (que implica que o codificador adicionou o mesmo valor à posição de amostra original). Um exemplo típico para o valor de desvio é o tamanho temporal de um quadro de controle da gama dinâmica.
[050] Depois de decodificar e, se for aplicável, corrigir a informação de tempo de todos os nós em todo o quadro de controle da gama dinâmica subsequente, o decodificador sabe quantos nós, foram deslocados de volta para o quadro de controle da gama dinâmica de referência (sem explicitamente fornecer esta informação no codificador) e em que posição de amostra se encontram dentro do quadro de controle da gama dinâmica de referência.
[051] O decodificador de controle da gama dinâmica determina ainda a informação do valor de ganho de todos os nós de um quadro recebido através da decodificação da informação de ganho diferencial no fluxo de bits.
[052] A partir do passo de decodificação da informação de tempo, o desconhecedor sabe quantos dos valores de ganho decodificados têm de ser atribuídos aos nós do quadro de controle da gama dinâmica de referência (e a qual posição de amostra) e quais os valores de ganho que estão atribuídos aos nós no quadro de controle da gama dinâmica de referência.
[053] A decodificação da informação sobre inclinação e a atribuição aos nós corretos são efetuadas de forma idêntica ao processo de decodificação de valores de ganho.
[054] Depois de decodificar todos os nós do quadro de controle da gama dinâmica subsequente, pode assegurar-se que todos os nós exigidos para calcular os valores de ganho para cada amostra do quadro de controle da gama dinâmica de referência via interpolação estão disponíveis. Após o passo de interpolação, os valores de ganho do controle da gama dinâmica para cada amostra podem ser aplicados às correspondentes amostras de áudio corretas.
[055] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica está configurado para identificar o um ou mais nós deslocados usando a informação do tempo.
[056] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica está configurado para decodificar a informação de tempo do um ou mais nós deslocados, que está representada por uma soma de um tempo a partir de um início do quadro de controle da gama dinâmica ao qual pertence o respectivo nó até à posição temporal do respectivo nó dentro do quadro do controle da gama dinâmica ao qual pertence o respectivo nó e sendo um valor de desvio superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica subsequente ao respectivo quadro de controle da gama dinâmica.
[057] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica está configurado para decodificar a informação de ganho da representação de bits do nó deslocado, que está em uma primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, é representada por um valor de ganho absoluto, e a informação de ganho de cada representação de bits dos nós deslocados uma posição depois da representação de bits do nó, que está na primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, é representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho da representação de bits do respectivo nó deslocado e o valor de ganho da representação de bits do nó, que precede a representação de bits do respectivo nó.
[058] De acordo com um modelo privilegiado da invenção, o decodificador do controle da gama dinâmica está configurado para decodificar a informação de ganho da representação de bits do nó do subsequente quadro de controle da gama dinâmica em uma primeira posição da parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência depois de uma ou mais posições das representações de bits do um ou mais nós deslocados ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho da representação de bits do respectivo nó um valor de ganho da representação de bits do deslocado nó, que precede a representação de bits do respectivo nó.
[059] De acordo com um modelo privilegiado da invenção, um tamanho temporal dos quadros de áudio é igual a um tamanho temporal dos quadros de controle da gama dinâmica.
[060] De acordo com um modelo privilegiado da invenção, o um ou mais nós do (um) dos quadros de controle da gama dinâmica, são selecionados a partir de uma grelha de tempo uniforme.
[061] De acordo com um modelo privilegiado da invenção, cada nó do um ou mais nós, compreende informação de inclinação.
[062] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica está configurado para decodificar as representações de bits dos nós usando uma técnica de decodificação entrópica.
[063] O objetivo é ainda obtido por um sistema que compreende um dispositivo codificador de áudio de acordo com a invenção e um dispositivo decodificador de áudio de acordo com a invenção.
[064] A invenção fornece ainda um método para operar um codificador de áudio, em que o método compreende os passos de:
[065] produzir um fluxo de bits de áudio codificado a partir de um sinal de áudio que compreende quadros de áudio consecutivos;
[066] produzir um fluxo de bits de controle da gama dinâmica codificado a partir de uma sequência de controle da gama dinâmica correspondente ao sinal de áudio e que compreende quadros de controle da gama dinâmica consecutivos, em que cada quadro de controle da gama dinâmica dos quadros de controle da gama dinâmica inclui um ou mais nós, em que cada nó do ou dos vários nós inclui informação de ganho para o sinal de áudio e informação de tempo indicativa do momento a que a informação de ganho corresponde;
[067] em que o fluxo de bits de controle da gama dinâmica codificado compreende para cada quadro de controle da gama dinâmica, dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits;
[068] executar um procedimento de deslocação, no qual são selecionados como nós deslocados um ou mais nós dos nós do quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica, em que uma representação de bits de cada um dos um ou mais nós deslocados do quadro de controle da gama dinâmica de referência está integrada na parte de fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, em que uma representação de bits de cada nó remanescente dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica está integrada na parte de fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica de referência.
[069] A invenção fornece ainda um método para operar um decodificador de áudio, em que o método compreende os passos de:
[070] decodificar um fluxo de bits de áudio codificado para reproduzir um sinal de áudio que compreende quadros de áudio consecutivos;
[071] decodificar um fluxo de bits de controle da gama dinâmica codificado para reproduzir uma sequência do controle da gama dinâmica correspondente ao sinal de áudio e que compreende quadros de controle da gama dinâmica consecutivos;
[072] em que o fluxo de bits de controle da gama dinâmica codificado compreende para cada quadro de controle da gama dinâmica, dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits;
[073] em que o fluxo de bits de controle da gama dinâmica codificado compreende representações de bits de nós, em que cada representação de bits de um nó dos nós compreende informação de ganho para o sinal de áudio e informação de tempo indicando a que momento no tempo a informação de ganho corresponde;
[074] em que o fluxo de bits de controle da gama dinâmica codificado compreende representações de bits de nós deslocados selecionados a partir dos nós de um quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência, em que a representação de bits de cada nó remanescente dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica está integrada na parte do fluxo de bits correspondente ao (um) quadro de controle da gama dinâmica de referência; e
[075] em que a representação de bits de cada nó remanescente dos nós remanescentes do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica é decodificada para reproduzir cada nó remanescente do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica;
[076] em que a representação de bits de cada nó remanescente dos nós remanescentes selecionados a partir dos nós do (um) quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica é decodificada para reproduzir cada nó deslocado dos nós deslocados selecionados a partir dos nós do quadro de controle da gama dinâmica de referência dos quadros de controle da gama dinâmica; e
[077] em que os nós remanescentes reproduzidos e os nós deslocados reproduzidos são combinados para reconstruir o quadro de controle da gama dinâmica de referência.
[078] Em outro aspecto, a invenção fornece um programa para realizar, quando é executado em um processador, o método de acordo com a invenção.
[079] Passamos a discutir a seguir os modelos privilegiados da invenção, com referência aos desenhos anexos, em que:
[080] A Fig. 1 ilustra um modelo de um dispositivo codificador de áudio de acordo com a invenção em uma vista esquemática;
[081] A Fig. 2 ilustra o princípio de controle da gama dinâmica aplicado no contexto de codificação de áudio em uma vista esquemática,
[082] A Fig. 3 ilustra os diferentes modos para a codificação de sequências de ganhos de controle da gama dinâmica em uma vista esquemática;
[083] A Fig. 4 ilustra a aplicação do controle da gama dinâmica no contexto de codificação de áudio em uma vista esquemática;
[084] A Fig. 5 ilustra um procedimento de deslocação para nós de acordo com a invenção em uma vista esquemática;
[085] A Fig. 6 ilustra a codificação da informação de tempo de acordo com a invenção em uma vista esquemática;
[086] A Fig. 7 ilustra a codificação da informação de ganho de acordo com a invenção em uma vista esquemática;
[087] A Fig. 8 ilustra a codificação da informação sobre inclinação de acordo com a invenção em uma vista esquemática; e
[088] A Fig. 9 ilustra um modelo de um decodificador de áudio de acordo com a invenção em uma vista esquemática.
[089] A Fig. 1 ilustra um modelo de um dispositivo codificador de áudio 1 de acordo com a invenção em uma vista esquemática. O dispositivo codificador de áudio 1 compreende:
[090] um codificador de áudio 2 configurado para produzir um fluxo de bits de áudio codificado ABS a partir de um sinal de áudio AS que compreende quadros de áudio consecutivos AFP, AFR, AFS;
[091] um codificador de controle da gama dinâmica 3 configurado para produzir um fluxo de bits de controle da gama dinâmica codificado DBS a partir de uma sequência de controle da gama dinâmica DS correspondente ao sinal de áudio AS e compreender quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS, em que cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica DFP, DFR, DFS compreende um ou mais nós Ao ... A5; Bo... B2; Co, em que cada nó do ou mais nós Ao ... A5; Bo ... B2; Co compreende informação de ganho GAo ... GA5; GBo ... GB2; GCo para o sinal de áudio AS e informação de tempo TAo . TA5; TBo . TB2; TCo indicando a que momento no tempo corresponde a informação de ganho GAo . GA5; GBo. GB2; GCo;
[092] em que o codificador de controle da gama dinâmica 3 está configurado de modo a que o fluxo de bits de controle da gama dinâmica codificado DBS compreenda para cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica DFP, DFR, DFS uma correspondente parte do fluxo de bits DFP’, DFR’. DFS’;
[093] em que o codificador de controle da gama dinâmica 2 está configurado para executar um procedimento de deslocação, no qual são selecionados como nós deslocados B1, B2 um ou mais nós B1, B2 dos nós Bo . B2 do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS, em que uma representação de bits B’1, B’2 de cada um dos um ou mais nós deslocados B1, B2 do quadro de controle da gama dinâmica de referência DFR está integrada na parte de fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, em que uma representação de bits B’o de cada nó remanescente Bo dos nós Bo ... B2 do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS está integrada na parte de fluxo de bits DFR’ correspondente ao (um) quadro de controle da gama dinâmica de referência DFR.
[094] A invenção permite controlar a taxa de bits de pico exigida para um quadro de controle da gama dinâmica de referência DFR sem mudar a resultante sequência da taxa de bits DBS comparativamente com o caso em que o método proposto não é usado. A abordagem proposta explora o atraso inerente de um quadro introduzido pelos codificadores de áudio do estado atual da técnica para reduzir picos no número de nós dentro de um quadro através da distribuição da transmissão de alguns dos nós para o próximo quadro de controle da gama dinâmica subsequente. Os detalhes do método proposto são apresentados a seguir.
[095] Tal como foi explicado em cima, quando combinado com um esquema de codificação de áudio que introduz um atraso de quadro relativamente aos ganhos de controle da gama dinâmica, os ganhos de controle da gama dinâmica decodificados são atrasados por um quadro antes de serem aplicados ao sinal de áudio. Isto quer dizer que os nós do quadro de controle da gama dinâmica de referência são aplicados à saída do decodificador de áudio válida em um quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência. Isto implica que no modo de atraso predefinido basta transmitir os nós do quadro de controle da gama dinâmica de referência juntamente com os nós do quadro de controle da gama dinâmica subsequente ao quadro de controle da gama dinâmica de referência e aplicar os correspondentes ganhos de controle da gama dinâmica sem um atraso diretamente ao correspondente sinal de saída de áudio no decodificador.
[096] O fato é explorado na invenção para reduzir o número máximo de nós transmitidos dentro de um quadro de controle da gama dinâmica. De acordo com a invenção, alguns nós do quadro de controle da gama dinâmica de referência são deslocados para o quadro de controle da gama dinâmica subsequente, o que pode ser feito antes da decodificação. Tal como será discutido a seguir, os nós deslocados podem “preceder” o primeiro nó no quadro de controle da gama dinâmica subsequente apenas para a codificação das diferenças de ganho e a informação sobre inclinação. Para codificar a informação da diferença de tempo, pode ser aplicado um método diferente.
[097] No exemplo apresentado na Fig. 1, o quadro de controle da gama dinâmica anterior DFP contém seis nós Ao ... A5, dos quais os nós A4, A5 são deslocados para a parte do fluxo de bits DFR’. Além disso, o quadro de controle da gama dinâmica de referência DFR contém três nós, B0 . B2. A soma do número dos nós deslocados A4, A5 e os nós B0 . B2 do quadro de controle da gama dinâmica de referência DFR é igual a cinco, o que é superior ao número dos nós Co do quadro de controle da gama dinâmica subsequente DFS, de modo a iniciar um procedimento de deslocação para que os nós B1, B2 sejam deslocados para a parte do fluxo de bits DFS’. Apesar de o número máximo de nós dentro dos quadros de controle da gama dinâmica DFS, DFR, DFP ser igual a seis, o número máximo de nós dentro das partes de fluxos de bits DFS’, DFR’, DFP’ é igual a quatro para evitar o pico dos fluxos de bits.
[098] De acordo com um modelo privilegiado da invenção, um tamanho temporal dos quadros de áudio AFP, AFR, AFS é igual a um tamanho temporal dos quadros de controle da gama dinâmica DFP, DFR, DFS.
[099] De acordo com um modelo privilegiado da invenção, o um ou mais nós A0 . A5; B0 . B2; C0 do (um) quadro de controle da gama dinâmica DFP, DFR, DFS são selecionados a partir de uma grelha de tempo uniforme.
[100] De acordo com um modelo privilegiado da invenção, o codificador de controle da gama dinâmica 3 está configurado para codificar os nós A0 . A5; B0 ... B2; CO usando uma técnica de codificação entrópica.
[101] Em outro aspecto, a invenção fornece um método para operar um codificador de áudio 1, em que o método compreende os passos de:
[102] produzir um fluxo de bits de áudio codificado ABS a partir de um sinal de áudio AS que compreende quadros de áudio consecutivos AFP, AFR, AFS;
[103] produzir um fluxo de bits de controle da gama dinâmica codificado DBS a partir de uma sequência de controle da gama dinâmica DS correspondente ao sinal de áudio AS e compreender quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS, em que cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica DFP, DFR, DFS compreende um ou mais nós A0 . A5; B0. B2; C0, em que cada nó do ou mais nós A0 . A5; B0. B2; C0 compreende informação de ganho GA0 . GA5; GB0 . GB2; GC0 para o sinal de áudio AS e informação de tempo TA0 . TA5; TB0 . TB2; TC0 indicando a que momento no tempo corresponde a informação de ganho;
[104] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende para cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits DFP’, DFR’. DFS’;
[105] executar um procedimento de deslocação, no qual são selecionados como nós deslocados B1, B2 um ou mais nós B1, B2 dos nós B0 . B2 do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS, em que uma representação de bits B’1, B’2 de cada um dos um ou mais nós deslocados B1, B2 do quadro de controle da gama dinâmica de referência DFR está integrada na parte de fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, em que uma representação de bits B’0 de cada nó remanescente B0 dos nós B0 . B2 do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS está integrada na parte de fluxo de bits DFR’ correspondente ao (um) quadro de controle da gama dinâmica de referência DFR.
[106] A Fig. 2 ilustra o princípio de controle da gama dinâmica aplicado no contexto de codificação de áudio em uma vista esquemática.
[107] O processo de aplicar DRC a um sinal pode ser expresso por uma simples multiplicação do sinal de áudio x(k) através de um valor de ganho de tempo variável g(k): y(k) = ^(k)x(k) (1)
[108] em que k representa um índice de tempo de amostra. O valor do ganho g(k) é calculado, p. ex. com base em uma estimativa a curto prazo da raiz quadrada média do sinal de entrada x(k). Mais detalhes sobre estratégias para determinar valores de ganho adequados são discutidos em [1]. A seguir abordamos os ganhos de tempo variável g(k) como uma sequência de ganhos.
[109] A invenção refere-se a um cenário de aplicação, onde tanto o sinal de áudio AS como a sequência de controle da gama dinâmica DS são codificados e transmitidos. Neste caso, os ganhos de controle da gama dinâmica são diretamente aplicados ao sinal de áudio AS, mas codificados e transmitidos em conjunto com o sinal de áudio codificado ABS. No decodificador 4, tanto o sinal de áudio AS como a sequência de controle da gama dinâmica DS podem ser decodificados e a informação de controle da gama dinâmica é aplicada ao correspondente sinal de áudio AS.
[110] Um aspecto da invenção fornece um sistema que compreende um dispositivo codificador de áudio 1 de acordo com a invenção e um dispositivo decodificador de áudio 4 de acordo com a invenção.
[111] A Fig. 3 ilustra os diferentes modos para a codificação de sequências de ganhos de controle da gama dinâmica em uma vista esquemática, nomeadamente o modo de quadro total (A) e modo de atraso (B). Os nós de ganho recebidos no quadro n são apresentados como círculos e os nós de ganho recebidos no quadro n+1 são apresentados em quadrados. A linha sólida ilustra o ganho DRC interpolado até ao quadro DRC n+1.
[112] Em princípio, a cadeia de codificador/decodificador de controle da gama dinâmica, podem ser operadas de dois modos. O chamado modo de quadro total refere-se ao caso em que depois da decodificação de um fluxo de bits de controle da gama dinâmica recebido, correspondendo a um quadro de controle da gama dinâmica específico, os ganhos em cada posição de amostra do quadro de controle da gama dinâmica, pode ser imediatamente determinado após interpolação com base nos nós decodificados. Isto implica que um nó tem de ser transmitido em cada limite de quadro, isto é, na posição de amostra correspondente à última amostra do quadro de controle da gama dinâmica. Se o comprimento do quadro de controle da gama dinâmica for N isto quer dizer que o último nó transmitido tem de estar localizado na posição de amostra N dentro do quadro. Isto é ilustrado em cima na Fig. 3 referenciado por “A”. Tal como se pode ver, os ganhos de controle da gama dinâmica do quadro nth podem ser imediatamente aplicados ao correspondente quadro e áudio.
[113] O segundo modo é designado por “modo de atraso” e está ilustrado na parte inferior “B” da Fig. 3. Neste caso, não existe nenhum nó transmitido para a última posição de amostra dentro do quadro n. Por isso, o decodificador DRC tem de esperar para decodificar o quadro DRC n+1 para realizar a interpolação exigida de todos os valores de ganho que se seguem ao último nó dentro do quadro n. Isto porque a informação do primeiro nó do quadro n+1 tem de ser conhecida para realizar a interpolação entre o último nó do quadro n e o primeiro nó no quadro n+1 para determinar o valor de ganho no meio através da interpolação.
[114] A Fig. 4 ilustra a aplicação do controle da gama dinâmica no contexto da codificação de áudio em uma vista esquemática onde o codificador de áudio introduz um atraso de quadro relativamente ao esquema de codificação da gama dinâmica.
[115] A Fig. 5 ilustra um procedimento de deslocação para nós de acordo com a invenção em uma vista esquemática. O lado esquerdo mostra a situação quando se usa uma abordagem do estado atual da técnica, enquanto o lado direito mostra o método proposto, onde cada quadrado corresponde a um nó A0 ... A5; BO... B2; CO.
[116] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de um número de nós Bo . B2 do quadro de controle da gama dinâmica de referência DFR ser superior a um valor limite predefinido.
[117] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de uma soma de um número de nós Bo . B2 do quadro de controle da gama dinâmica de referência DFR e um número de nós deslocados A4, A5do quadro de controle da gama dinâmica DFP anterior ao quadro de controle da gama dinâmica de referência DFR por integrar na parte de fluxo de bits DFR’ correspondente ao quadro de controle da gama dinâmica de referência DFR ser maior do que um valor limite predefinido.
[118] De acordo com um modelo privilegiado da invenção, o procedimento de deslocação é iniciado no caso de uma soma de um número de nós Bo . B2 do quadro de controle da gama dinâmica de referência DFR e um número de nós deslocados A4, A5 do quadro de controle da gama dinâmica anterior DFP ao quadro de controle da gama dinâmica de referência DFR por integrar na parte de fluxo de bits DFR’ correspondente ao quadro de controle da gama dinâmica de referência DFR ser maior do que um número de nós Co do quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR.
[119] Tal como foi explicado em cima, quando combinado com um esquema de codificação de áudio que introduz um atraso de quadro relativamente aos quadros de controle da gama dinâmica, os ganhos de controle da gama dinâmica decodificados são atrasados por um quadro antes de serem aplicados ao sinal de áudio. Tendo em conta o lado esquerdo na Fig. 5, isto quer dizer que os nós Ai do quadro nth são aplicados ao decodificador de áudio válido produzido no quadro n+1. Isto implica que o modo de atraso predefinido seria suficiente para transmitir os nós Ai juntamente com o nó Bo no quadro n+1 e aplicar os correspondentes ganhos DRC sem um atraso diretamente ao correspondente sinal de saída de áudio no decodificador.
[120] O fato é explorado no método proposto para reduzir o número máximo de nós transmitidos dentro de um quadro. Isto é ilustrado no lado direito da Figura 4. Os nós A4 e A5 são deslocados para o quadro n+1 antes da codificação, isto é, o número máximo de nós no quadro n é reduzido de 6 para 4 no exemplo fornecido. Tal como será discutido a seguir, os nós A4 e A5 “precedem” o primeiro nó n+1, isto é, B0 apenas para a codificação das diferenças de ganho e a informação sobre inclinação. Para codificar a informação da diferença de tempo, tem de ser aplicado um método diferente.
[121] A Fig. 6 ilustra a codificação da informação de tempo de acordo com a invenção em uma vista esquemática.
[122] De acordo com um modelo privilegiado da invenção, a informação de tempo TAo ... TA5; TBo ... TB2; TCo do um ou mais nós Ao ... A5; Bo ... B2; Co é representada de modo a que o um ou vários nós deslocados A4, A5; B1, B2 possam ser identificados usando a informação de tempo TA4, TA5; TB1, TB2.
[123] De acordo com um modelo privilegiado da invenção, a informação de tempo TA4, TA5; TB1, TB2 do um ou mais nós deslocados A4, A5; B1, B2 é representada por uma soma da diferença de tempo t_A4, t_A5; t_B1, t_B2 a partir de um início do quadro de controle da gama dinâmica DFP; DFR ao qual pertence o respectivo nó A4, A5; B1, B2 até à posição temporal do respectivo nó A4, A5; B1, B2 dentro do quadro do controle da gama dinâmica DFP; DFR ao qual pertence o respectivo nó A4, A5; B1, B2 e sendo um valor de desvio drcFrameSize superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica DFR; DFS subsequente ao respectivo quadro de controle da gama dinâmica DFP; DFR.
[124] Primeiramente consideramos a codificação das diferenças de tempo entre pares de nós. Na Fig. 6 é apresentada a situação para determinar as diferenças de tempo para pares de nós para o exemplo de acordo com a Figura 4, em que t_Ai apresenta a posição de amostra do nó Ai na grelha de possíveis posições do nó dentro de um quadro. Conforme discutido anteriormente, os nós podem ser selecionados em uma grelha de tempo uniforme, onde o espaçamento desta grelha define a resolução mais alta de tempo disponível deltaTmin. Por conseguinte, a informação de tempo t_Ai é fornecida em exemplos, onde as diferenças de tempo entre dois nós são sempre múltiplos inteiros de deltaTmin.
[125] A informação da posição temporal de um nó é codificada de um modo diferencial, isto é, relativamente à posição do nó anterior. Se um nó for o primeiro nó dentro de um quadro, a diferença de tempo é determinada relativamente ao início de um quadro. O lado esquerdo da Fig. 6 apresenta a situação se não for aplicada nenhuma deslocação de nós. Neste caso, a informação do tempo diferencial do nó A4 tDrcDelta_A4 é processada como tDrcDelta_A4 = t_A4 - t_A3. Este valor de tempo diferencial é depois codificado usando a correspondente entrada em uma tabela de Huffman apropriada, p. ex. de acordo com a Tabela 1 ou 2. Temos outro exemplo se olhamos para a diferença de tempo codificada do nó B0. Uma vez que é o primeiro nó do quadro n+1, é determinada a correspondente diferença de tempo relativamente ao início do quadro, isto é, tDrcDelta_B0 = t_B0.
[126] Vamos agora considerar a codificação da posição do nó para a técnica de reservatório de nós proposta usando a deslocação de nós. Para o exemplo apresentado no lado direito da Fig. 6, os nós A4 e A5 foram deslocados para o próximo quadro para codificação. A representação dos nós A0 até A3 não mudou e as diferenças de tempo codificadas não estão, por isso, alteradas. O mesmo é verdade para a informação da posição codificada do nó B0. Porém, a informação de tempo do nó A4 e do nó A5 é agora processada de modo diferente. Tal como se pode ver na Fig. 6, o valor original t_A4 que indica a posição da amostra do nó A4 é modificado no codificador, adicionando um desvio de drcFrameSize. Uma vez que a informação da posição resultante excede o valor máximo que seria possível no caso de uma codificação regular, o desvio indica ao decodificador que o nó correspondente tem de ser mais processado dentro do contexto do quadro anterior. Além disso, o decodificador sabe que a posição de amostra original t_A4 é obtida pela subtração do desvio drcFrameSize do valor decodificado.
[127] Em seguida, consideramos o cálculo da informação da diferença de tempo que é atualmente codificada para a situação apresentada no lado direito da Fig. 6. Por razões de eficiência de codificação, a informação da posição diferencial para o nó A4 é processada relativamente ao nó B0. Ao contrário da situação anteriormente discutida para o lado esquerdo da Fig. 6, a informação do tempo diferencial é agora processada de acordo com tDrcDelta_A4 = t_A4 + drcFrameSize - t_B0, isto é, incluindo o desvio. De forma análoga, para o nó A5 nós obtemos tDrcDelta_A5 = t_A5 + drcFrameSize - t_A4 - drcFrameSize, que obviamente é o mesmo que tDrcDelta_A5 = t_A5 - t_A4. Estes valores de tempo diferenciais são depois codificados usando a correspondente introdução da palavra de código da tabela de Huffman correta, p. ex. de acordo com a Tabela 1 ou 2.
[128] O método para decodificar a informação da posição temporal pode ser resumido do seguinte modo. O decodificador extrai a informação da diferença de tempo de um nó com base na correspondente palavra de código do fluxo de bits. A informação de tempo é obtida adicionando a informação da diferença de tempo à informação de tempo do nó anterior. Se a posição de amostra resultante for maior que drcFrameSize, o decodificador sabe que o nó presente tem de ser processado como se fosse o último nó no quadro anterior, isto é, tem de ser anexado aos nós decodificados no quadro anterior. A posição correta da amostra é determinada pela subtração do valor de desvio drcFrameSize do valor de tempo decodificado. São aplicados os mesmos passos de processamento de forma idêntica se ocorrerem mais nós deslocados em um quadro decodificado.
[129] Depois de decodificar e corrigir a informação de tempo de um quadro inteiro, o decodificador sabe quantos nós, foram deslocados de volta para o quadro anterior (sem explicitamente fornecer esta informação no codificador) e em que posição de amostra se encontram dentro do quadro anterior. A informação sobre o número de nós deslocados será explorada no contexto do ganho de decodificação e informação de inclinação descrito abaixo.
[130] A Fig. 7 ilustra a codificação da informação de ganho de acordo com a invenção em uma vista esquemática.
[131] De acordo com um modelo privilegiado da invenção, a informação de ganho GB1 da representação de bits B'1 do nó deslocado B1, que está em uma primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, é representada por um valor de ganho absoluto g_B1 e a informação de ganho GB2 de cada representação de bits B’2 dos nós deslocados B2 em uma posição depois da representação de bits B'1 do nó B1, que está na primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, é representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho g_B2 da representação de bits B’2 do respectivo nó deslocado B2 e o valor de ganho g_B1 da representação de bits B’1 do nó B1, que precede a representação de bits B’2 do respectivo nó B2
[132] De acordo com um modelo privilegiado da invenção, no caso de as representações de bits B’1, B’2 do um ou mais nós deslocados B1, B2 do quadro de controle da gama dinâmica de referência DFR estarem integradas na parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, a informação de ganho GC0 da representação de bits C’0 do nó C0 do subsequente quadro de controle da gama dinâmica (DFS) em uma primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR depois de uma ou mais posições das representações de bits B’1, B’2 do um ou mais nós deslocados B1, B2 é representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho g_C0 da representação de bits C’0 do respectivo nó C0 e um valor de ganho g_B2 da representação de bits B’2 do deslocado nó B2, que precede a representação de bits C’0 do respectivo nó C0.
[133] Na Fig. 7 é apresentada a situação para determinar as diferenças de ganho para pares de nós para o exemplo de acordo com a Figura 5, em que g_Ai apresenta o valor de ganho do no A1.
[134] Em primeiro lugar, são tidos em conta os valores de ganho diferenciais para o nó A4. Para a abordagem sem reservatório de nós, apresentado no lado esquerda da Fig. 7, o valor de ganho diferencial Delta_A4 é calculado a partir da diferença do valor de ganho (in dB) do nó anterior A3 e do nó A4, isto é, gainDelta_A4 = g_A4 - g_A3. Este valor de ganho diferencial é depois codificado usando a correspondente entrada em uma tabela de Huffman apropriada. Além disso, nós consideramos o primeiro nó do quadro n+1 do lado esquerdo da Fig. 7 Uma vez que B0 é o primeiro nó desse quadro, o seu valor de ganho não está codificado de um modo diferencial, mas de acordo com uma codificação específica de valores de ganho inicial gainInitial, isto é, o valor de ganho é codificado como o seu valor atual: gainDelta_B0 = g_B0.
[135] Para a situação apresentada no lado direito, onde o nó A4 foi deslocado para o próximo quadro n+1, os valores da informação de ganho codificada, é diferente. Tal como se pode ver, depois de se deslocado, o nó A4 torna-se no primeiro nó no quadro n+1 relativamente à codificação das diferenças de ganho. Assim sendo, o seu valor de ganho não está codificado de modo diferencial, mas a codificação específica dos valores de ganho iniciais é aplicada conforme descrito acima. O valor de ganho diferencial de A5 permanece o mesmo para ambas as situações apresentadas no lado esquerdo e no lado direito. Uma vez que o nó B0 segue o nó A5 se o reservatório de nós for usado, a sua informação de ganho será determinada a partir da diferença dos ganhos do nó B0 e A5, isto é, gainDelta_B0 = g_B0 - g_A5. Note que apenas muda o modo como as diferenças de ganho são determinadas quando se aplica a técnica de reservatório de nós, enquanto os valores reconstruídos dos ganhos permanecem os mesmos para cada nó. Obviamente, depois de decodificar toda a informação relacionada com o ganho dos quadros n e n+1, os valores de ganho obtidos para os nós A0 até B0 são idênticos aos obtidos no lado esquerdo, e os nós podem ser calculados “a tempo” para a aplicação dos ganhos DRC ao correspondente quadro de áudio.
[136] Conforme discutido no parágrafo anterior, o número de nós deslocados e a sua posição de amostra dentro do quadro anterior são conhecidos depois de decodificar a informação da diferença de tempo. Tal como é ilustrado no lado direito da Figura 6, os valores de ganho de nós deslocados do quadro n começam imediatamente no início da informação de ganho recebida do quadro n+1. Por isso, a informação sobre o número de nós deslocados é suficiente para o decodificador atribuir cada valor de ganho à correta posição de amostra dentro do quadro correto. Tendo em conta o exemplo apresentado no lado direito da Figura 6, o decodificador sabe que os dois primeiros valores de ganho decodificados do quadro n+1 têm de ser anexados aos últimos valores de ganho do quadro anterior, enquanto o terceiro valor de ganho corresponde ao correto valor de ganho do primeiro nó no quadro atual.
[137] A Fig. 8 ilustra a codificação da informação sobre inclinação de acordo com a invenção em uma vista esquemática.
[138] De acordo com o modelo privilegiado da invenção, cada nó Ao ... A5; Bo ... B2; Co do um ou dos vários nós Ao ... A5; Bo ... B2; Co compreende informação sobre inclinação SA0 . SA5; SB0. SB2; SC0.
[139] De seguida, é considerada a codificação da informação sobre inclinação, que é ilustrada na Fig. 8. A informação sobre inclinação dos nós não é codificada de um modo diferencial entre pares de nós, mas para cada nó independentemente. Por isso, a informação sobre inclinação permanece inalterada em ambos os casos com e sem recurso ao uso do reservatório de nós. Tal como no caso da codificação de valores de ganho, as tabelas Huffman para criar as palavras de código para a informação sobre inclinação permanecem as mesmas em ambos os casos, com e sem usar a deslocação de nós proposta. A atribuição da informação sobre inclinação à posição correta de amostra dentro do quadro correto é efetuada de forma idêntica ao caso de decodificação de valores de ganho.
[140] Depois de toda a informação de nós recebida para o quadro n+1 ter sido decodificada e, se for aplicável, ter sido deslocada de volta ao quadro anterior n, a interpolação de ganho para o quadro n que usa splines ou interpolação linear pode ser realizada de forma habitual e os valores de ganho são aplicados ao correspondente quadro de áudio.
[141] A Fig. 9 ilustra um modelo de um decodificador de áudio de acordo com a invenção em uma vista esquemática. O dispositivo decodificador de áudio 4 compreende:
[142] um decodificador de áudio 5 configurado para decodificar um fluxo de bits de áudio codificado ABS para reproduzir um sinal de áudio AS que compreende quadros de áudio consecutivos AFP, AFR, AFS;
[143] um decodificador de controle da gama dinâmica 6 configurado para decodificar um fluxo de bits de controle da gama dinâmica codificado DBS para reproduzir uma sequência do controle da gama dinâmica DS correspondente ao sinal de áudio AS e que compreende quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS;
[144] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende para cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits DFP’, DFR’. DFS’;
[145] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende representações de bits A’o ... A’5; B’o... B’2; C’o de nós Ao ... A5; Bo ... B2; Co, em que cada representação de bits de um nó dos nós compreende informação de ganho GAo . GA5; GBo . GB2; GCo para o sinal de áudio AS e informação de tempo TAo . TA5; TBo . TB2; TCo indicando a que momento no tempo a informação de ganho GAo . GA5; GBo. GB2; GCo corresponde;
[146] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende representações de bits B’1, B’2 de nós deslocados B1, B2 selecionados a partir dos nós Bo ... B2 de um quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS, que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, em que a representação de bits B’o de cada nó remanescente Bo dos nós Bo. B2 do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS está integrada na parte do fluxo de bits DFR’ correspondente ao (um) quadro de controle da gama dinâmica de referência DFR; e
[147] em que o decodificador de controle da gama dinâmica 6 está configurado para decodificar a representação de bits B’o de cada nó remanescente Bo dos nós remanescentes B’o do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS para reproduzir cada nó remanescente Bo do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS, para decodificar a representação de bits B’1, B’2 de cada nó deslocado B1, B2 dos nós deslocados B1, B2 selecionados a partir dos nós Bo . B2 do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS para reproduzir cada nó deslocado B1, B2 dos nós deslocados B1, B2 selecionados a partir dos nós do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS e para combinar os nós remanescentes reproduzidos Bo e os nós deslocados reproduzidos B1, B2 para reconstruir o quadro de controle da gama dinâmica de referência DFR.
[148] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica 6 está configurado para identificar o um ou mais nós deslocados A4, A5; B1, B2 usando a informação do tempo TA4, TA5; TB1, TB2.
[149] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica 6 está configurado para decodificar a informação de tempo TA4, TA5; TB1, TB2 do um ou mais nós deslocados A4, A5; B1, B2, que está representada por uma soma da diferença de tempo t_A4, t_A5; t_B1, t_B2 a partir de um início do quadro de controle da gama dinâmica DFP; DFR ao qual pertence o respectivo nó A4, A5; B1, B2 até à posição temporal do respectivo nó A4, A5; B1, B2 dentro do quadro do controle da gama dinâmica DFP; DFR ao qual pertence o respectivo nó A4, A5; B1, B2 e sendo um valor de desvio drcFrameSize superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica DFR; DFS subsequente ao respectivo quadro de controle da gama dinâmica DFP; DFR.
[150] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica 6 está configurado para decodificar a informação de ganho GB1 da representação de bits B'1 do nó deslocado B1, que está em uma primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, é representado por um valor de ganho absoluto g_B1 e em que a informação de ganho GB2 de cada representação de bits B’2 dos nós deslocados B2 em uma posição depois da representação de bits B'1 do nó B1, que está na primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, é representado por um valor de ganho relativo que é igual a uma diferença de um valor de ganho g_B2 da representação de bits B’2 do respectivo nó deslocado B2 e o valor de ganho g_B1 da representação de bits B’1 do nó B1, que precede a representação de bits B’2 do respectivo nó B2
[151] De acordo com um modelo privilegiado da invenção, o decodificador do controle da gama dinâmica 6 está configurado para decodificar a informação de ganho GC0 da representação de bits C’0 do nó C0 do subsequente quadro de controle da gama dinâmica DFS em uma primeira posição da parte do fluxo de bits DFS’ correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR depois de uma ou mais posições das representações de bits B’1, B’2 do um ou mais nós deslocados B1, B2 ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho g_C0 da representação de bits C’0 do respectivo nó C0 e um valor de ganho g_B2 da representação de bits B’2 do deslocado nó B2, que precede a representação de bits C’0 do respectivo nó C0.
[152] De acordo com um modelo privilegiado da invenção, um tamanho temporal dos quadros de áudio AFP, AFR, AFS é igual a um tamanho temporal dos quadros de controle da gama dinâmica AFP, AFR, AFS.
[153] De acordo com um modelo privilegiado da invenção, o um ou mais nós Ao ... A5; Bo ... B2; Co do (um) quadro de controle da gama dinâmica DFP, DFR, DFS são selecionados a partir de uma grelha de tempo uniforme.
[154] De acordo com o modelo privilegiado da invenção, cada nó Ao . A5; Bo . B2; Co do um ou dos vários nós Ao . A5; Bo . B2; Co compreende informação sobre inclinação SAo . SA5; SBo. SB2; SCo.
[155] De acordo com um modelo privilegiado da invenção, o decodificador de controle da gama dinâmica 6 está configurado para decodificar as representações de bits dos nós A’o . A’5; B’o. B’2; C’o usando uma técnica de decodificação entrópica.
[156] Em outro aspecto, a invenção fornece um método para operar um decodificador de áudio, em que o método compreende os passos de:
[157] decodificar um fluxo de bits de áudio codificado ABS para reproduzir um sinal de áudio AS que compreende quadros de áudio consecutivos AFP, AFR, AFS;
[158] decodificar um fluxo de bits de controle da gama dinâmica codificado DBS para reproduzir uma sequência do controle da gama dinâmica DS correspondente ao sinal de áudio AS e que compreende quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS;
[159] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende para cada quadro de controle da gama dinâmica DFP, DFR, DFS dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits DFP’, DFR’. DFS’;
[160] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende representações de bits A’o ... A’5; B’o... B’2; C’o de nós Ao ... A5; Bo ... B2; Co, em que cada representação de bits de um nó dos nós compreende informação de ganho GAo . GA5; GBo . GB2; GCo para o sinal de áudio AS e informação de tempo TAo . TA5; TBo . TB2; TCo indicando a que momento no tempo a informação de ganho GAo . GA5; GBo. GB2; GCo corresponde;
[161] em que o fluxo de bits de controle da gama dinâmica codificado DBS compreende representações de bits B’1, B’2 de nós deslocados B1, B2 selecionados a partir dos nós Bo . B2 de um quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS, que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica DFS subsequente ao quadro de controle da gama dinâmica de referência DFR, em que a representação de bits B’o de cada nó remanescente Bo dos nós Bo. B2 do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS está integrada na parte do fluxo de bits DFR’ correspondente ao (um) quadro de controle da gama dinâmica de referência DFR; e
[162] em que a representação de bits B’o de cada nó remanescente Bo dos nós remanescentes B’o do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS é decodificada para reproduzir cada nó remanescente Bo do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS;
[163] em que a representação de bits B’1, B’2 de cada nó remanescente B1, B2 dos nós remanescentes B1, B2 selecionados a partir dos nós Bo. B2 quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS é decodificada para reproduzir cada nó deslocado B1, B2 dos nós deslocados B1, B2 selecionados a partir dos nós do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS; e
[164] em que os nós remanescentes B0 reproduzidos e os nós deslocados B1, B2 reproduzidos são combinados para reconstruir o quadro de controle da gama dinâmica de referência DFR.
[165] Relativamente ao decodificador, o codificador e os métodos dos modelos descritos, deve ser mencionado o seguinte.
[166] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, está claro que esses aspectos representam também uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma fase do método ou a uma característica de uma fase do método. De forma análoga, os aspectos descritos no contexto de uma fase do método representam também uma descrição de um bloco ou item correspondente ou característica de um aparelho correspondente.
[167] Dependendo de determinados requisitos de implementação, as versões da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada usando um meio de armazenamento digital, por exemplo um disquete, um DVD, um CD, um ROM, um PROM, um EPROM, um EEPROM ou uma memória FLASH, com sinais de controle de leitura eletrónica guardados lá, que cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo a que seja executado o respectivo método.
[168] Algumas versões de acordo com a invenção incluem um transportador de dados com sinais de controle eletronicamente legíveis, que conseguem cooperar com um sistema de computador programável de modo a que seja efetuado um dos métodos aqui descritos.
[169] No geral, as versões da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, sendo o código do programa operativo para efetuar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser guardado em um suporte de leitura em máquina.
[170] Outras versões incluem o programa de computador para efetuar um dos métodos aqui descritos, que é guardado em um suporte legível pela máquina ou em um suporte de armazenamento não transitório.
[171] Por outras palavras, uma versão do método da invenção é, desse modo, um programa de computador com um código do programa para efetuar um dos métodos aqui descritos, quando o programa de computador é executado em um computador.
[172] Uma outra versão dos métodos inventivos é, desse modo, um transportador de dados (ou um meio de armazenamento digital ou um meio legível no computador) que inclui, conforme registado, o programa de computador para efetuar um dos métodos aqui descritos.
[173] Outro modelo do método da invenção é, por isso, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para executar um dos métodos aqui descritos. O fluxo de dados ou a sequência de sinais pode ser configurado para ser transferido através de uma ligação de comunicação de dados, por exemplo via Internet.
[174] Outro modelo compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para executar um dos métodos aqui descritos.
[175] Outro modelo compreende um computador com o programa informático instalado para executar um dos métodos aqui descritos.
[176] Em alguns modelos, pode ser utilizado um dispositivo programável lógico (por exemplo uma rede de portas lógicas programáveis) para executar algumas ou todas as funcionalidades dos métodos aqui descritos em alguns modelos, uma rede de portas lógicas programáveis pode cooperar com um microprocessador para executar um dos métodos aqui descritos. De um modo geral, os métodos são vantajosamente efetuados por qualquer aparelho de hardware.
[177] Apesar de esta invenção ter sido descrita em termos de vários modelos, existem alterações, permutações e equivalentes que se incluem no âmbito desta invenção. Note-se que existem muitos modos alternativos para implementar os métodos e composições da presente invenção. Pretende-se, por isso, que as reivindicações anexas que se seguem sejam interpretadas como inclusivas de todas as alterações, permutações e equivalentes dentro do espírito e âmbito da presente invenção.
[178] Sinais de referência: 1 dispositivo codificador de áudio 2 codificador de áudio 3 codificador de controle de gama dinâmica 4 dispositivo decodificador de áudio 5 decodificador de áudio 6 decodificador de controle de gama dinâmica ABS fluxo de bits de áudio codificado AS sinal de áudio AFP quadro de áudio anterior AFR quadro de áudio de referência AFS quadro de áudio subsequente DBS fluxo de bits de controle da gama dinâmica codificado DS sequência de controle de gama dinâmica DFP quadro de controle da gama dinâmica anterior DFR quadro de controle da gama dinâmica de referência DFS quadro de controle da gama dinâmica subsequente Ao ... A5 nós do quadro de controle da gama dinâmica anterior Bo ... B2 nós do quadro de controle da gama dinâmica de referência C0 nó do quadro de controle da gama dinâmica subsequente DFP’ parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica anterior DFR’ parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica de referência DFS’ parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica subsequente TAo ... TA5 informação de tempo dos nós do quadro de controle da gama dinâmica anterior TB0 . TB2 informação de tempo dos nós do quadro de controle da gama dinâmica de referência TC0 informação de tempo do nó do quadro de controle da gama dinâmica subsequente t_A0 . t_A5 diferença de tempo dos nós do quadro de controle da gama dinâmica anterior t_B0. t_B2 diferença de tempo dos nós do quadro de controle da gama dinâmica de referência t_C0 diferença de tempo do nó do quadro de controle da gama dinâmica subsequente GA0 . GA5 informação de ganho dos nós do quadro de controle da gama dinâmica anterior GB0 . GB2 informação de ganho dos nós do quadro de controle da gama dinâmica de referência GC0 informação de ganho do nó do quadro de controle da gama dinâmica subsequente g_A0 . g_A5 valor de ganho dos nós do quadro de controle da gama dinâmica anterior g_B0. g_B2 valor de ganho dos nós do quadro de controle da gama dinâmica de referência g_C0 valor de ganho do nó do quadro de controle da gama dinâmica subsequente SA0 . SA5 informação sobre inclinação dos nós do quadro de controle da gama dinâmica anterior SB0 . SB2 informação sobre inclinação dos nós do quadro de controle da gama dinâmica de referência SC0 informação sobre inclinação do nó do quadro de controle da gama dinâmica subsequente
[179] Referências: [1] D. Giannoulis, M. Massberg, J. D. Reiss, “Conceção de Compressor de Gama Dinâmica Digital - Um Tutorial e Análise” J. Audio Engineering Society, Vol. 60, No. 6, junho de 2012. in

Claims (24)

1. Dispositivo codificador de áudio, caracterizado por compreender: um codificador de áudio (2) configurado para produzir um fluxo de bits de áudio codificado (ABS) a partir de um sinal de áudio (AS), que compreende quadros de áudio consecutivos (AFP, AFR, AFS); um codificador de controle da gama dinâmica (3) configurado para produzir um fluxo de bits de controle da gama dinâmica codificado (DBS) a partir de uma sequência de controle da gama dinâmica (DS) correspondente ao sinal de áudio (AS) e compreender quadros de controle da gama dinâmica consecutivos (DFP, DFR, DFS), em que cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) compreende um ou mais nós (Ao ... A5; Bo ... B2; Co), em que cada nó do ou mais nós (Ao ... A5; Bo ... B2; Co) compreende informação de ganho (GAo . GA5; GBo . GB2; GCo) para o sinal de áudio (AS) e informação de tempo (TAo . TA5; TBo . TB2; TCo) indicando a que momento no tempo corresponde a informação de ganho (GAo . GA5; GBo. GB2; GCo); em que o codificador de controle da gama dinâmica (3) está configurado de modo a que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreenda para cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) uma correspondente parte do fluxo de bits (DFP’, DFR’. DFS’); em que o codificador de controle da gama dinâmica (2) está configurado para executar um procedimento de deslocação, no qual são selecionados como nós deslocados (B1, B2) um ou mais nós (B1, B2) dos nós (Bo . B2) do quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS), em que uma representação de bits (B’1, B’2) de cada um dos um ou mais nós deslocados (B1, B2) do quadro de controle da gama dinâmica de referência (DFR) está integrada na parte de fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), em que uma representação de bits (B’0) de cada nó remanescente (Bo) dos nós (Bo ... B2) do quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) está integrada na parte de fluxo de bits (DFR’) correspondente ao (um) quadro de controle da gama dinâmica de referência (DFR).
2. Dispositivo codificador de áudio de acordo com a reivindicação 1, caracterizado por o procedimento de deslocação ser iniciado no caso de um número de nós do quadro de controle da gama dinâmica de referência ser superior a um valor limite predefinido.
3. Dispositivo codificador de áudio de acordo com a reivindicação 1, caracterizado por o procedimento de deslocação ser iniciado no caso de uma soma de um número de nós do quadro de controle da gama dinâmica de referência e um número de nós deslocados do quadro de controle da gama dinâmica anterior ao quadro de controle da gama dinâmica de referência por integrar na parte de fluxo de bits correspondente ao quadro de controle da gama dinâmica de referência ser maior do que um valor limite predefinido.
4. Dispositivo codificador de áudio de acordo com a reivindicação 1, caracterizado por o procedimento de deslocação ser iniciado no caso de uma soma de um número de nós (B0. B2) do quadro de controle da gama dinâmica de referência (DFR) e um número de nós deslocados (A4, A5) do quadro de controle da gama dinâmica anterior (DFP) ao quadro de controle da gama dinâmica de referência (DFR) por integrar na parte de fluxo de bits (DFR’) correspondente ao quadro de controle da gama dinâmica de referência (DFR) ser maior do que um número de nós (C0) do quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR).
5. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por a informação de tempo (TAo ... TA5; TB0 . TB2; TC0) do um ou mais nós (A0 . A5; B0 . B2; C0) ser representada de modo a que o um ou vários nós deslocados (A4, A5; B1, B2) possam ser identificados usando a informação de tempo (TA4, TA5; TB1, TB2).
6. Dispositivo codificador de áudio de acordo a reivindicação 5, caracterizado por a informação de tempo (TA4, TA5; TBi, TB2) do um ou mais nós deslocados (A4, A5; B1, B2), ser representada por uma soma da diferença de tempo (t_A4, t_A5; t_B1, t_B2) a partir de um início do quadro de controle da gama dinâmica (DFP; DFR) ao qual pertence o respectivo nó (A4, A5; B1, B2) até à posição temporal do respectivo nó (A4, A5; B1, B2) dentro do quadro do controle da gama dinâmica (DFP; DFR) ao qual pertence o respectivo nó (A4, A5; B1, B2) e sendo um valor de desvio (drcFrameSize) superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica (DFR; DFS) subsequente ao respectivo quadro de controle da gama dinâmica (DFP; DFR).
7. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 6, caracterizado por a informação de ganho (GBi) da representação de bits (B’1) do nó deslocado (B1), que está em uma primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), ser representada por um valor de ganho absoluto (g_B1), e por a informação de ganho (GB2) de cada representação de bits (B’2) dos nós deslocados (B2) em uma posição depois da representação de bits (B'1) do nó (B1), que está na primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho (g_B2) da representação de bits (B’2) do respectivo nó deslocado (B2) e o valor de ganho (g_B1) da representação de bits (B’1) do nó (B1), que precede a representação de bits (B’2) do respectivo nó (B2).
8. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por, no caso de a representação de bits (B’1, B’2) do um ou mais nós deslocados (B1, B2) do quadro de controle da gama dinâmica de referência (DFR) estar integrada na parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), a informação de ganho (GC0) da representação de bits (C’0) do nó (C0) do subsequente quadro de controle da gama dinâmica (DFS) em uma primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR) depois de uma ou mais posições das representações de bits (B’1, B’2) do um ou mais nós deslocados (B1, B2) ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho (g_C0) da representação de bits (C’0) do respectivo nó (C0) e um valor de ganho (g_B2) da representação de bits (B’2) do deslocado nó (B2), que precede a representação de bits (C’0) do respectivo nó (C0).
9. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 8, caracterizado por um tamanho temporal dos quadros de áudio (AFP, AFR, AFS) ser igual a um tamanho temporal dos quadros de controle da gama dinâmica (DFP, DFR, DFS).
10. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 9, caracterizado por o um ou mais nós (Ao ... A5; Bo ... B2; C0) de um dos quadros de controle da gama dinâmica (DFP, DFR, DFS) ser selecionado a partir de uma grelha de tempo uniforme.
11. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 10, caracterizado por cada nó (Ao ... A5; Bo ... B2; Co) do um ou dos vários nós (Ao . A5; Bo. B2; Co) compreender informação sobre inclinação (SAo . SA5; SBo . SB2; SCo).
12. Dispositivo codificador de áudio de acordo com qualquer uma das reivindicações 1 a 11, caracterizado por o codificador de controle da gama dinâmica (3) estar configurado para codificar os nós (A’o . A’5; B’o . B’2; C’o) usando uma técnica de decodificação entrópica.
13. Dispositivo decodificador de áudio, caracterizado por compreender: um decodificador de áudio (5) configurado para decodificar um fluxo de bits de áudio codificado (ABS) para reproduzir um sinal de áudio (AS) que compreende quadros de áudio consecutivos (AFP, AFR, AFS); um decodificador de controle da gama dinâmica 6 configurado para decodificar um fluxo de bits de controle da gama dinâmica codificado DBS para reproduzir uma sequência do controle da gama dinâmica DS correspondente ao sinal de áudio AS e que compreende quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS; em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende para cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits (DFP’, DFR’. DFS’); em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende representações de bits (A’o ... A’5; B’o ... B’2; C’o) de nós (Ao ... A5; Bo ... B2; Co), em que cada representação de bits de um nó dos nós compreende informação de ganho (GAo . GA5; GBo . GB2; GCo) para o sinal de áudio (AS) e informação de tempo (TAo . TA5; TBo. TB2; TCo) indicando a que momento no tempo a informação de ganho (GAo . GA5; GBo. GB2; GCo) corresponde; em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende representações de bits (B’1, B’2) de nós deslocados (B1, B2) selecionados a partir dos nós (Bo . B2) de um quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS), que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), em que a representação de bits (B’o) de cada nó remanescente (Bo) dos nós (Bo . B2) do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) está integrada na parte do fluxo de bits (DFR’) correspondente ao (um) quadro de controle da gama dinâmica de referência (DFR); e em que o decodificador de controle da gama dinâmica (6) está configurado para decodificar a representação de bits (B’0) de cada nó remanescente (B0) dos nós remanescentes (B’0) do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) para reproduzir cada nó remanescente (B0) do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS), para decodificar a representação de bits (B’1, B’2) de cada nó deslocado (B1, B2) dos nós deslocados B1, B2 selecionados a partir dos nós (Bo ... B2) do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) para reproduzir cada nó deslocado (B1, B2) dos nós deslocados (B1, B2) selecionados a partir dos nós do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) e para combinar os nós remanescentes reproduzidos (B0) e os nós deslocados reproduzidos (B1, B2) para reconstruir o quadro de controle da gama dinâmica de referência (DFR).
14. Dispositivo decodificador de áudio de acordo com a reivindicação 13, caracterizado por o decodificador de controle da gama dinâmica (6) estar configurado para identificar o um ou mais nós deslocados (A4, A5; B1, B2) usando a informação do tempo (TA4, TA5; TB1, TB2).
15. Dispositivo decodificador de áudio de acordo com a reivindicação 13 ou 14, caracterizado por o decodificador de controle da gama dinâmica (6) estar configurado para decodificar a informação de tempo (TA4, TA5; TB1, TB2) do um ou mais nós deslocados (A4, A5; B1, B2,) que é representada por uma soma da diferença de tempo (t_A4, t_A5; t_B1, t_B2) a partir de um início do quadro de controle da gama dinâmica (DFP; DFR) ao qual pertence o respectivo nó (A4, A5; B1, B2) até à posição temporal do respectivo nó (A4, A5; B1, B2) dentro do quadro do controle da gama dinâmica (DFP; DFR) ao qual pertence o respectivo nó (A4, A5; B1, B2) e sendo um valor de desvio (drcFrameSize) superior ou igual a um tamanho temporal do quadro de controle da gama dinâmica (DFR; DFS) subsequente ao respectivo quadro de controle da gama dinâmica (DFP; DFR).
16. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 15, caracterizado por o decodificador de controle da gama dinâmica (6) estar configurado para decodificar a informação de ganho (GB1) da representação de bits (B'1) do nó deslocado (B1), que está em uma primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), estar representado por um valor de ganho absoluto (g_B1) e em que a informação de ganho (GB2) de cada representação de bits (B’2) dos nós deslocados (B2) em uma posição depois da representação de bits (B'1) do nó (B1), que está na primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), estar representado por um valor de ganho relativo que é igual a uma diferença de um valor de ganho (g_B2) da representação de bits (B’2) do respectivo nó deslocado (B2) e um valor de ganho (g_B1) da representação de bits (B’1) do nó (B1), que precede a representação de bits (B’2) do respectivo nó (B2).
17. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 16, caracterizado por o decodificador do controle da gama dinâmica (6) estar configurado para decodificar a informação de ganho (GC0) da representação de bits (C’0) do nó (C0) do subsequente quadro de controle da gama dinâmica (DFS) em uma primeira posição da parte do fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR) depois de uma ou mais posições das representações de bits (B’1, B’2) do um ou mais nós deslocados (B1, B2) ser representada por um valor de ganho relativo que é igual a uma diferença de um valor de ganho (g_C0) da representação de bits (C’0) do respectivo nó (C0) e um valor de ganho (g_B2) da representação de bits (B’2) do deslocado nó (B2), que precede a representação de bits (C’0) do respectivo nó (C0).
18. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 17, caracterizado por um tamanho temporal dos quadros de áudio (AFP, AFR, AFS) ser igual a um tamanho temporal dos quadros de controle da gama dinâmica (AFP, AFR, AFS).
19. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 18, caracterizado por o um ou mais nós (Ao ... A5; Bo ... B2; Co) de um dos quadros de controle da gama dinâmica (DFP, DFR, DFS) ser selecionado a partir de uma grelha de tempo uniforme.
20. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 19, caracterizado por cada nó (Ao ... A5; Bo ... B2; Co) do um ou dos vários nós (Ao . A5; Bo. B2; Co) compreender informação sobre inclinação (SAo . SA5; SBo . SB2; SCo).
21. Dispositivo decodificador de áudio de acordo com qualquer uma das reivindicações 13 a 2Q, caracterizado por o decodificador de controle da gama dinâmica (6) estar configurado para decodificar as representações de bits dos nós (A’o . A’5; B’o . B’2; C’o) usando uma técnica de decodificação entrópica.
22. Sistema caracterizado por compreender um dispositivo codificador de áudio (1) de acordo com qualquer uma das reivindicações 1 a 12 e um dispositivo decodificador de áudio (4) de acordo com qualquer uma das reivindicações 13 a 21.
23. Método para operar um codificador de áudio, caracterizado por compreender os passos de: produzir um fluxo de bits de áudio codificado (ABS) a partir de um sinal de áudio (AS) que compreende quadros de áudio consecutivos (AFP, AFR, AFS); produzir um fluxo de bits de controle da gama dinâmica codificado (DBS) a partir de uma sequência de controle da gama dinâmica (DS) correspondente ao sinal de áudio (AS) e compreender quadros de controle da gama dinâmica consecutivos (DFP, DFR, DFS), em que cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) compreende um ou mais nós (Ao ... A5; Bo ... B2; Co), em que cada nó do ou mais nós (Ao ... A5; Bo ... B2; Co) compreende informação de ganho (GAo . GA5; GBo . GB2; GCo) para o sinal de áudio (AS) e informação de tempo (TAo . TA5; TBo . TB2; TCo) indicando a que momento no tempo corresponde a informação de ganho em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende para cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits (DFP’, DFR’. DFS’); executar um procedimento de deslocação, no qual são selecionados como nós deslocados (B1, B2) um ou mais nós (B1, B2) dos nós (Bo . B2) do quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS), em que uma representação de bits (B’1, B’2) de cada um dos um ou mais nós deslocados (B1, B2) do quadro de controle da gama dinâmica de referência (DFR) está integrada na parte de fluxo de bits (DFS’) correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), em que uma representação de bits (B’o) de cada nó remanescente (Bo) dos nós (Bo . B2) do quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) está integrada na parte de fluxo de bits (DFR’) correspondente ao (um) quadro de controle da gama dinâmica de referência (DFR).
24. Método para operar um decodificador de áudio, caracterizado por compreender os passos de: decodificar um fluxo de bits de áudio codificado (ABS) para reproduzir um sinal de áudio AS que compreende quadros de áudio consecutivos (AFP, AFR, AFS); decodificar um fluxo de bits de controle da gama dinâmica codificado DBS para reproduzir uma sequência do controle da gama dinâmica DS correspondente ao sinal de áudio AS e que compreende quadros de controle da gama dinâmica consecutivos DFP, DFR, DFS; em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende para cada quadro de controle da gama dinâmica (DFP, DFR, DFS) dos quadros de controle da gama dinâmica uma correspondente parte do fluxo de bits (DFP’, DFR’. DFS’); em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende representações de bits (A’o ... A’5; B’o ... B’2; C’o) de nós (Ao ... A5; Bo ... B2; Co), em que cada representação de bits de um nó dos nós compreende informação de ganho (GAo . GA5; GBo . GB2; GCo) para o sinal de áudio (AS) e informação de tempo (TAo . TA5; TBo. TB2; TCo) indicando a que momento no tempo a informação de ganho (GAo . GA5; GBo. GB2; GCo) corresponde; em que o fluxo de bits de controle da gama dinâmica codificado (DBS) compreende representações de bits (B’1, B’2) de nós deslocados (B1, B2) selecionados a partir dos nós (Bo . B2) de um quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS), que estão integrados em uma parte do fluxo de bits correspondente ao quadro de controle da gama dinâmica (DFS) subsequente ao quadro de controle da gama dinâmica de referência (DFR), em que a representação de bits (B’o) de cada nó remanescente (Bo) dos nós (Bo . B2) do (um) quadro de controle da gama dinâmica de referência (DFR) dos quadros de controle da gama dinâmica (DFP, DFR, DFS) está integrada na parte do fluxo de bits (DFR’) correspondente ao (um) quadro de controle da gama dinâmica de referência (DFR); e em que a representação de bits B’o de cada nó remanescente Bo dos nós remanescentes B’o do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS é decodificada para reproduzir cada nó remanescente B0 do (um) quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS; em que a representação de bits B’1, B’2 de cada nó remanescente B1, B2 dos nós remanescentes Bi, B2 selecionados a partir dos nós Bo ... B2 quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS é decodificada para reproduzir cada nó deslocado Bi, B2 dos nós deslocados Bi, B2 selecionados a partir dos nós do quadro de controle da gama dinâmica de referência DFR dos quadros de controle da gama dinâmica DFP, DFR, DFS; e em que os nós remanescentes B0 reproduzidos e os nós deslocados Bi, B2 reproduzidos são combinados para reconstruir o quadro de controle da gama dinâmica de referência DFR.
BR112016021382-3A 2014-03-25 2015-03-20 dispositivo codificador de áudio e um dispositivo decodificador de áudio com codificação de ganho eficiente no controle de gama dinâmica BR112016021382B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14161605 2014-03-25
EP14161605.2 2014-03-25
PCT/EP2015/055945 WO2015144587A1 (en) 2014-03-25 2015-03-20 Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Publications (1)

Publication Number Publication Date
BR112016021382B1 true BR112016021382B1 (pt) 2021-02-09

Family

ID=52727126

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016021382-3A BR112016021382B1 (pt) 2014-03-25 2015-03-20 dispositivo codificador de áudio e um dispositivo decodificador de áudio com codificação de ganho eficiente no controle de gama dinâmica

Country Status (20)

Country Link
US (3) US10074377B2 (pt)
EP (1) EP3123469B1 (pt)
JP (1) JP6259930B2 (pt)
KR (1) KR101890216B1 (pt)
CN (2) CN111326165B (pt)
AR (1) AR099836A1 (pt)
AU (1) AU2015238519B2 (pt)
BR (1) BR112016021382B1 (pt)
CA (1) CA2942743C (pt)
ES (1) ES2678068T3 (pt)
MX (1) MX355089B (pt)
MY (1) MY186155A (pt)
PL (1) PL3123469T3 (pt)
PT (1) PT3123469T (pt)
RU (1) RU2678487C2 (pt)
SG (1) SG11201607940WA (pt)
TR (1) TR201809427T4 (pt)
TW (1) TWI585751B (pt)
WO (1) WO2015144587A1 (pt)
ZA (1) ZA201607193B (pt)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2262108B1 (en) 2004-10-26 2017-03-01 Dolby Laboratories Licensing Corporation Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103325380B (zh) 2012-03-23 2017-09-12 杜比实验室特许公司 用于信号增强的增益后处理
EP2850612B1 (en) 2012-05-18 2019-04-10 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
RU2665873C1 (ru) 2013-01-21 2018-09-04 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
BR122020020608B1 (pt) 2013-01-21 2022-05-10 Dolby Laboratories Licensing Corporation Unidade de processamento de áudio
EP2959479B1 (en) 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
CN107093991B (zh) 2013-03-26 2020-10-09 杜比实验室特许公司 基于目标响度的响度归一化方法和设备
US9635417B2 (en) 2013-04-05 2017-04-25 Dolby Laboratories Licensing Corporation Acquisition, recovery, and matching of unique information from file-based media for automated file detection
TWM487509U (zh) 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
WO2015038522A1 (en) 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content
JP6476192B2 (ja) 2013-09-12 2019-02-27 ドルビー ラボラトリーズ ライセンシング コーポレイション 多様な再生環境のためのダイナミックレンジ制御
AU2014371411A1 (en) * 2013-12-27 2016-06-23 Sony Corporation Decoding device, method, and program
CA2942743C (en) 2014-03-25 2018-11-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
CN110808723A (zh) 2014-05-26 2020-02-18 杜比实验室特许公司 音频信号响度控制
CN112164406B (zh) 2014-10-10 2024-06-25 杜比实验室特许公司 基于发送无关的表示的节目响度

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701390A (en) * 1995-02-22 1997-12-23 Digital Voice Systems, Inc. Synthesis of MBE-based coded speech using regenerated phase information
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
US6785655B1 (en) * 2000-05-15 2004-08-31 Lsi Logic Corporation Method for independent dynamic range control
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP4575609B2 (ja) * 2001-03-13 2010-11-04 旭化成エレクトロニクス株式会社 データ変換装置
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
CN1993700B (zh) * 2004-07-02 2012-03-14 尼尔逊媒介研究股份有限公司 用于进行压缩数字位流的混合的方法及装置
CN101055719B (zh) * 2004-09-17 2011-02-02 广州广晟数码技术有限公司 编码和发送多声道数字音频信号的方法
US7991610B2 (en) * 2005-04-13 2011-08-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Adaptive grouping of parameters for enhanced coding efficiency
US8521314B2 (en) * 2006-11-01 2013-08-27 Dolby Laboratories Licensing Corporation Hierarchical control path with constraints for audio dynamics processing
CN101587711B (zh) * 2008-05-23 2012-07-04 华为技术有限公司 基音后处理方法、滤波器以及基音后处理***
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
RU2468451C1 (ru) * 2008-10-29 2012-11-27 Долби Интернэшнл Аб Защита от ограничения сигнала с использованием заранее существующих метаданных коэффициента усиления аудиосигнала
KR101336891B1 (ko) * 2008-12-19 2013-12-04 한국전자통신연구원 G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치
US8861879B2 (en) * 2009-09-17 2014-10-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image based on skip mode
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN103003877B (zh) * 2010-08-23 2014-12-31 松下电器产业株式会社 声音信号处理装置及声音信号处理方法
CN103827965B (zh) * 2011-07-29 2016-05-25 Dts有限责任公司 自适应语音可理解性处理器
US20140369527A1 (en) * 2011-09-22 2014-12-18 Earsoft Limited Dynamic range control
EP2850612B1 (en) * 2012-05-18 2019-04-10 Dolby Laboratories Licensing Corporation System for maintaining reversible dynamic range control information associated with parametric audio coders
US9332373B2 (en) * 2012-05-31 2016-05-03 Dts, Inc. Audio depth dynamic range enhancement
EP2898506B1 (en) * 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CA2942743C (en) 2014-03-25 2018-11-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control

Also Published As

Publication number Publication date
TWI585751B (zh) 2017-06-01
MY186155A (en) 2021-06-28
USRE49107E1 (en) 2022-06-14
AU2015238519A1 (en) 2016-11-10
CN106165014A (zh) 2016-11-23
KR20160136390A (ko) 2016-11-29
RU2678487C2 (ru) 2019-01-29
RU2016141556A (ru) 2018-04-25
US20170011749A1 (en) 2017-01-12
WO2015144587A1 (en) 2015-10-01
US10074377B2 (en) 2018-09-11
PT3123469T (pt) 2018-07-06
CN111326165A (zh) 2020-06-23
CA2942743A1 (en) 2015-10-01
ZA201607193B (en) 2018-08-30
KR101890216B1 (ko) 2018-08-22
JP6259930B2 (ja) 2018-01-10
US20220277756A1 (en) 2022-09-01
TW201543470A (zh) 2015-11-16
MX2016012421A (es) 2016-12-16
SG11201607940WA (en) 2016-10-28
EP3123469B1 (en) 2018-04-18
JP2017517020A (ja) 2017-06-22
EP3123469A1 (en) 2017-02-01
RU2016141556A3 (pt) 2018-04-25
TR201809427T4 (tr) 2018-07-23
AU2015238519B2 (en) 2017-11-23
CN106165014B (zh) 2020-01-24
PL3123469T3 (pl) 2018-09-28
CA2942743C (en) 2018-11-13
AR099836A1 (es) 2016-08-24
CN111326165B (zh) 2023-12-12
MX355089B (es) 2018-04-04
ES2678068T3 (es) 2018-08-08

Similar Documents

Publication Publication Date Title
BR112016021382B1 (pt) dispositivo codificador de áudio e um dispositivo decodificador de áudio com codificação de ganho eficiente no controle de gama dinâmica
US20230245665A1 (en) Decoding apparatus and method, and program
BR112015017293B1 (pt) Decodificador e codificador do sinal de áudio, método para decodificar uma representação do sinal de áudio codificado e para prover uma representação correspondente do sinal áudio decodificado e método de codificação de sinal de áudio para prover uma representação de sinal de áudio codificado com base na representação do domínio-tempo de um sinal de entrada de áudio
JP5270006B2 (ja) 周波数領域におけるオーディオ信号ラウドネス決定と修正
BR122017012321A2 (pt) codificador e decodificador de áudio com informações de programa ou metadados de estrutura de substream
BRPI0906300B1 (pt) Decodificador de sinal de áudio, provedor de dados de contorno de distorção de tempo e método
JP6286554B2 (ja) 低演算資源を用いて符号化済みオーディオ信号を復号化する装置及び方法
BR112017010911B1 (pt) Método e sistema de decodificação para ocultar erros em pacotes de dados que devem ser decodificados em um decodificador de áudio baseado em transformação de cosseno discreto modificado
JP6538820B2 (ja) スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム
BR112016027898B1 (pt) Método, entidade de recepção, e, meio de armazenamento não transitório legível por computador para ocultação de perda de quadro
BR112018012007B1 (pt) Aparelho e método para processamento de um sinal de áudio codificado
JP2022014459A (ja) 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム
JP4332973B2 (ja) 復号化装置および復号化方法
BR122020021674B1 (pt) Decodificação em escala reduzida
BR112017007833B1 (pt) Método e sistema de processamento de áudio para representação de um sinal de áudio sob a forma de um fluxo de bits de áudio, método e sistema de processamento de áudio para reconstrução de um sinal de áudio representado por um fluxo de bits segmentado em quadros de fluxo de bits, e midia legível por computador
BR112017001631B1 (pt) Aparelho e método para processamento de um sinal de áudio utilizando um pós-filtro harmônico

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 20/03/2015, OBSERVADAS AS CONDICOES LEGAIS.