BRPI0506627B1 - método e dispositivo para quantizar um sinal de informações - Google Patents

método e dispositivo para quantizar um sinal de informações Download PDF

Info

Publication number
BRPI0506627B1
BRPI0506627B1 BRPI0506627A BRPI0506627A BRPI0506627B1 BR PI0506627 B1 BRPI0506627 B1 BR PI0506627B1 BR PI0506627 A BRPI0506627 A BR PI0506627A BR PI0506627 A BRPI0506627 A BR PI0506627A BR PI0506627 B1 BRPI0506627 B1 BR PI0506627B1
Authority
BR
Brazil
Prior art keywords
audio
values
limit
value
information
Prior art date
Application number
BRPI0506627A
Other languages
English (en)
Inventor
Schuller Gerald
Hirschfeld Jens
Wabnik Stefan
Fiesel Wolfgang
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of BRPI0506627A publication Critical patent/BRPI0506627A/pt
Publication of BRPI0506627B1 publication Critical patent/BRPI0506627B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Abstract

método e dispositivo para quantizar um sinal de informações a quantização de um sinal de informações de uma seqüência de valores de informações inclui uma filtragem seletiva de freqüência da seqüência de valores de informações para obter uma seqüência de valores de informações filtradas e quantizar os valores de informações filtradas para obter uma seqüência de valores de informaçoes quantizadas por meio de uma função da etapa quantizadora, que mapeia os valores de informações filtradas para os valores das informações quantizadas, cujo curso é mais inclinado abaixo de um valor das informações limite do que acima do valor das informções limite.

Description

(54) Título: MÉTODO E DISPOSITIVO PARA QUANTIZAR UM SINAL DE INFORMAÇÕES (73) Titular: FRAUNHOFER-GESELLSCHAFT ZUR FÕRDERUNG DER ANGEWANDTEN FORSCHUNG E.V.. Endereço: Hansastrasse 27c, 80686 München, ALEMANHA(DE) (72) Inventor: GERALD SCHULLER; STEFAN WABNIK; JENS HIRSCHFELD; WOLFGANG FIESEL
Prazo de Validade: 10 (dez) anos contados a partir de 09/10/2018, observadas as condições legais
Expedida em: 09/10/2018
Assinado digitalmente por:
Liane Elizabeth Caldeira Lage
Diretora de Patentes, Programas de Computador e Topografias de Circuitos Integrados
1/44
MÉTODO E DISPOSITIVO PARA. QUANTIZAR UM SINAL DE
INFORMAÇÕES
Descrição [001] A presente invenção se relaciona em geral a quantizadores ou sinais de informações de quantização e em configurações para sinais de áudio de quantização, como, por exemplo, os usados para a compressão de dados de sinais de áudio ou para codificação de áudio. Em uma configuração especial, a presente invenção se refere à codificação de áudio com um curto tempo de retardo.
[002] O método de compressão de áudio mais conhecido no presente é o MPEG-1 Layer III. Com esse método de compressão, a amostra ou valores de áudio de um sinal de áudio são codificados em um sinal codificado com perdas. Colocado de forma diferente, a irrelevância e a redundância do sinal de áudio original são reduzidas ou removidas idealmente quando da compressão. De maneira a atingir esse fim, os mascaramentos simultâneos e temporais são reconhecidos por um modelo psico-acústico, isto é, variando temporalmente é calculado ou determinado o limite de mascaramento dependendo do sinal de áudio, indicando a partir de qual volume os tons de uma determinada frequência são percebidos pelo ouvido humano. Por sua vez, essas informações são usadas para a codificação do sinal pela quantificação dos valores espectrais do sinal de áudio, de maneira mais precisa ou menos precisa ou de maneira alguma, dependendo do limite de mascaramento, e integrando-o no sinal codificado.
[003] Os métodos de compressão de áudio como, por exemplo, o formato MP3, têm um limite em suas aplicabilidades
Petição 870180058805, de 06/07/2018, pág. 7/56
2/44 quando dados de áudio são transferidos por meio de um canal de transmissão com taxa de bits limitado por uma, de um lado, maneira comprimida, mas por outro lado, com o menor tempo de retardo possível. Em algumas aplicações, o tempo de retardo não desempenha um papel, como por exemplo, ao arquivar informações de áudio.
Entretanto, são necessários codificadores de áudio de pequeno retardo, que são por vezes denominados ultra low delay coders”, quando devem ser transmitidos sinais de áudio de tempo crítico, como por exemplo, em teleconferências, nos alto-falantes ou microfones sem fio. Para esses campos de aplicação, o artigo de
Schuller G. et al. Perceptual Audio Codlng using Adaptlve Preand Post-filters and Lossless Compression, IEEE Transactions on
Speech and Audio Processing, vol. 10, no. 6, September 2002, pp.
379 a 390, sugere a codificação de áudio quando a redução da irrelevância e a redução da redundância não são feitas com base em uma única transformada, mas em duas transformadas em separado.
[004] O princípio será discutido subsequentemente com referência às Figs. 12 e 13. A codificação inicia com um sinal de áudio 902 que já tenha sido amostrado, e que assim já esteja presente como uma sequência de áudio 904 de valores de áudio ou amostra 906, caracterizado pelo fato de que a ordem temporal dos valores de áudio 906 é indicada por uma flecha 908. É calculado um limite de audição por meio de um modelo psico-acústico para sucessivos blocos de valores de áudio 906 caracterizados por uma numeração ascendente por bloco#. A Fig. 13, por exemplo, mostra um diagrama onde, com relação à frequência f, o gráfico a plota o espectro de um bloco de sinais de 128 valores de áudio 906 e b plota o limite de mascaramento, conforme calculados por um modelo
Petição 870180058805, de 06/07/2018, pág. 8/56
3/44 psico-acústico, em unidades logarítmicas. 0 limite de mascaramento indica, como já mencionado, até quais frequências de intensidade permanecem inaudíveis ao ouvido humano, a saber, todos os tons abaixo do limite de mascaramento b. Com base nos limites de audição calculados para cada bloco, é alcançada uma redução de irrelevância controlando um filtro parametrizável, seguido por um quantizador. Para o filtro parametrizável, é calculada uma parametrização de maneira que sua resposta de frequência corresponda ao inverso da magnitude do limite de mascaramento.
Essa parametrização está indicada na Fig. 12 por x#(i).
[005] Após a filtragem dos valores de áudio 906, ocorre a quantização com dimensão de etapas constante, como por exemplo, uma operação de arredondamento até o número inteiro mais próximo.
Esse ruído de quantização é o ruído branco. No lado do decodificador, o sinal filtrado é retransformado novamente por um filtro parametrizável, cuja função de transferência é ajustada para a magnitude do próprio limite de mascaramento. Não somente o sinal filtrado é novamente decodificado assim, mas o ruído de quantização no lado do decodificador é também ajustado para a forma ou o formato do limite de mascaramento. Para que o ruído de quantização corresponda ao limite de mascaramento da maneira mais precisa possível, é calculado um valor de amplificação a# aplicado ao sinal filtrado antes da quantização do lado do codificador para cada parâmetro ajustado ou para cada parametrização. Para que a retransformada seja feita no lado do decodificador, o valor de amplificação a e a parametrização x são transferidos para o codificador como informações colaterais 910, separadamente dos dados principais reais, isto é, os valores de áudio filtrados e
Petição 870180058805, de 06/07/2018, pág. 9/56
4/44 quantizados 912. Para a redução da redundância 914, esses dados, isto é, as informações colaterais 910 e os dados principais 912, são submetidos a uma compressão sem perdas, a saber, codificação entrópica, que é como o sinal codificado é obtido.
[006] O artigo supramencionado sugere uma dimensão de
128 valores da amostra 906 como uma dimensão de bloco. Isto permite um retardo relativamente curto de 8 ms com a taxa de amostragem de 32 kHz. Com referência à implementação detalhada, o artigo também declara que, para aumentar a eficiência da codificação das informações colaterais, as informações colaterais, a saber, os coeficientes x# e a#, somente serão transferidos se houver alterações suficientes comparadas com um ajuste de parâmetros transferido anteriormente, isto é, se as alterações excederem um determinado valor limite. Além disso, é descrito que a implementação é feita preferivelmente de maneira que um parâmetro corrente estabelecido não seja diretamente aplicado a todos os valores das amostras que pertencem ao respectivo bloco, mas que seja usada uma interpolação linear dos coeficientes de filtro x# para evitar problemas audíveis. Para realizar a interpolação linear dos coeficientes de filtro, é sugerida para o filtro uma estrutura treliçada para que o filtro evite a ocorrência de instabilidades. Para o caso de ser desejado um sinal codificado com taxa de bits controlado, o artigo também sugere a multiplicação ou a atenuação seletiva do sinal filtrado graduado com o fator de amplificação dependente do tempo a por um fator diferente de 1, de maneira que ocorram interferências audíveis, mas a taxa de bits possa ser reduzida nos locais em que os sinais de áudio têm codificação complicada.
Petição 870180058805, de 06/07/2018, pág. 10/56
5/44 [007] Apesar do esquema de codificação de áudio descrito no artigo supramencionado já reduzir o tempo de retardo de muitas aplicações a um grau adequado, o problema do esquema acima é que, devido ao requisito de ter que transferir o limite de mascaramento ou a função de transferência do filtro do lado codificador, denominado subsequentemente de pré-filtro, o canal de transferência é carregado a um grau relativamente alto, mesmo apesar de que os coeficientes de filtro só sejam transferidos quando for ultrapassado um limite predeterminado.
[008] Outra desvantagem do esquema de codificação acima é que, devido ao fato de que o limite de mascaramento ou seu inverso deva estar disponível no lado do decodificador pelo conjunto de parâmetro x# a ser transferido, deve ser feito um compromisso entre a menor taxa de bits possível ou uma alta razão de compressão, de um lado, e a aproximação mais exata possível ou parametrização do limite de mascaramento, ou seu inverso, por outro lado. Assim, é inevitável que o ruído de quantização ajustado para o limite de mascaramento pelo esquema de codificação de áudio acima ultrapasse o limite de mascaramento em algumas faixas de frequências e assim resultar em audíveis interferências de áudio para o ouvinte. A Fig. 13, por exemplo, mostra a resposta de frequência parametrizada do filtro parametrizável do lado do decodificador pelo gráfico c. Como pode ser visto, existem regiões em que a função de transferência do filtro do lado do decodificador, subsequentemente denominado de pós-filtro, ultrapassa o limite de mascaramento b. O problema é agravado pelo fato de que a parametrização é somente transferida de maneira intermitente com uma alteração suficiente entre parametrizações e
Petição 870180058805, de 06/07/2018, pág. 11/56
6/44 aí interpolada. Uma interpolação dos coeficientes de filtro x#, como sugerida no artigo, resulta individualmente em interferências audíveis quando o valor da amplificação a# é mantido constante a partir de nodo a nodo ou de nova parametrização para nova parametrização. Mesmo que a interpolação sugerida no artigo seja também aplicada como valor das informações colaterais a#, isto é, o valor da amplificação transferida, podem permanecer problemas audíveis de áudio no sinal de áudio que chega no lado do decodificador.
[009] Outro problema com o esquema de codificação de áudio de acordo com as Figs. 12 e 13, é que o sinal filtrado pode, devido à filtragem com seleção de frequência, tomar uma forma não prevista onde, particularmente devido a uma superposição randômica de muitas ondas harmônicas individuais, um ou vários valores individuais de áudio de sinal codificado se somam a valores muito altos que, por sua vez, resultam em uma menor taxa de compressão na redução da redundância subseqüente devido às suas raras ocorrências.
[0010] É o objetivo da presente invenção prover um método e um dispositivo para a quantização de um sinal de informações, de maneira que possa ser feita uma maior compressão de dados do sinal de informações, induzindo somente uma pequena deterioração na qualidade do sinal original de informações.
[0011] Esse objetivo é alcançado por um método de acordo com a reivindicação 12 e um dispositivo de acordo com a reivindicação 1.
[0012] A quantização inventiva de um sinal de informações de uma sequência de valores de informações inclui a
Petição 870180058805, de 06/07/2018, pág. 12/56
7/44 filtragem com seleção de frequência da sequência dos valores das informações para obter uma sequência de valores de informações filtradas e quantizar os valores de informações filtradas para obter uma sequência de valores de informações quantizadas por meio de uma função da etapa quantizadora, que mapeia os valores de informações filtradas nos valores de informações quantizadas, e cujo curso é mais inclinado abaixo de um valor das informações limite do que acima do valor das informações limite.
[0013] Foi observado que os problemas gerados artificialmente no sinal de informações filtrado resultante é proveniente da filtragem com seleção de frequência de um sinal de áudio onde os valores das informações individuais, devido a uma interferência construtiva randômica de todos ou de muitos dos harmônicos, toma valores que são significativamente maiores do que os valores máximos do sinal original, como por exemplo, mais do que o dobro. É a idéia central da presente invenção que, cortando o sinal das informações filtradas acima de um limite adequado, que é, por exemplo, duas vezes maior do que o maior valor possível do sinal original das informações a ser filtrado, de maneira que os problemas gerados artificialmente pela filtragem seletiva de frequência sejam removidos ou atenuados no sinal das informações filtradas após a pós-filtragem, raramente resulta em qualquer deterioração na qualidade do sinal de informações pós-filtrado depois da quantização, considerando que o corte ou o aumento do tamanho da etapa de quantização acima de um limite adequado oferece grande economia na representação de bits no sinal das informações filtradas.
[0014] De acordo com uma configuração preferida, o sinal
Petição 870180058805, de 06/07/2018, pág. 13/56
8/44 de informações é um sinal de áudio em que a quantização seletiva acima ou abaixo de um determinado limite raramente resulta em uma redução audível da qualidade de áudio, com uma enorme redução simultânea na representação de bits.
[0015] A função da etapa quantizadora pode ser provida de maneira alternativa para quantizar todos os valores de áudio em uma etapa quantizadora mais elevada acima de um valor limite, ou uma função da etapa quantizadora tendo um curso mais nivelado acima do valor limite ou tendo um maior tamanho da etapa quantizadora acima do valor limite é usada de maneira que os problemas gerados artificialmente sejam quantizados de forma mais grosseira.
[0016] Serão detalhadas subsequentemente as configurações preferidas da presente invenção com referência aos desenhos anexos, onde:
[0017] Fig. 1 mostra um diagrama de circuito de blocos de um codificador de áudio de acordo com uma configuração da presente invenção;
[0018] Fig. 2 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 na entrada de dados;
[0019] Fig. 3 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 com referência à avaliação do sinal de áudio de entrada por um modelo psicoacústico;
[0020] Fig. 4 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 com referência à aplicação dos parâmetros obtidos pelo modelo psico-acústico no
Petição 870180058805, de 06/07/2018, pág. 14/56
9/44 sinal de áudio de entrada;
[0021] Fig. 5a mostra um diagrama esquemático da ilustração do sinal de áudio de entrada, a sequência dos valores de áudio de que consiste, e as etapas operacionais da Fig. 4 com relação aos valores de áudio;
[0022] Fig. 5b mostra um diagrama esquemático da ilustração do estabelecimento do sinal codificado;
[0023] Fig. 6 mostra um fluxograma da ilustração do modo de funcionamento do codificador de áudio da Fig. 1 com relação ao
processamento final até o sinal codificado;
[0024] Fig. 7a mostra um diagrama em que consta uma
configuração da função da etapa de quantização;
[0025] Fig. 7b mostra um diagrama em que consta uma
outra configuração da função da etapa de quantização;
[0026] Fig. 8 mostra um diagrama de circuito de blocos de um codificador de áudio capaz de decodificar um sinal de áudio codificado pelo codificador de áudio da Fig. 1 de acordo com uma configuração da presente invenção;
[0027] Fig. 9 mostra um fluxograma da ilustração do modo de funcionamento do decodificador da Fig. 8 na entrada de dados;
[0028] Fig. 10 mostra um fluxograma da ilustração do modo de funcionamento do decodif icador da Fig. 8 com relação ao armazenamento no buffer dos dados de áudio pré-decodifiçados quantizados e filtrados e o processamento dos blocos de áudio sem as correspondentes informações colaterais;
[0029] Fig. 11 mostra um fluxograma da ilustração do modo de funcionamento do decodif icador da Fig. 8 com relação à real filtragem reversa;
Petição 870180058805, de 06/07/2018, pág. 15/56
10/44 [0030] Fig. 12 mostra um diagrama esquemático da ilustração de um esquema convencional de codificação de áudio com curto retardo de tempo; e [0031] Fig. 13 mostra um diagrama onde, exemplarmente, estão mostrados um espectro de um sinal de áudio, seu limite de audição e a função de transferência do pós-filtro no decodificador.
[0032] A Fig. 1 mostra um codificador de áudio de acordo com uma configuração da presente invenção. O codificador de áudio, que é geralmente indicado por 10, inclui uma entrada de sinal 12 onde recebe o sinal de áudio a ser codificado, que, como será explicado em maiores detalhes posteriormente com referência à Fig.
5a, consiste de uma sequência de valores de áudio ou valores de amostra, e uma saida de dados, de onde sai o sinal codificado, cujo teor de informações será discutido em maiores detalhes com referência à Fig. 5b.
[0033] O codificador de áudio 10 da Fig. 1 é dividido em uma parte de redução de irrelevância 16 e uma parte de redução de redundância 18. A parte de redução de irrelevância 16 inclui o meio 20 para a determinação de um limite de audição, meio 22 para o cálculo de um valor de amplificação, meio 24 para o cálculo da parametrização, meio de comparação de nodo 26, um quantizador 28 e um pré-filtro parametrizável 30 e um buffer FIFO de entrada(first in first out) 32, buffer ou memória 38 e um multiplicador ou meio de multiplicação 40. A parte de redução de redundância 18 inclui um compressor 34 e um controlador de taxa de bits 36.
[0034] A parte de redução de irrelevância 16 e a parte de redução de redundância 18 são ligadas em série nessa ordem
Petição 870180058805, de 06/07/2018, pág. 16/56
11/44 entre a entrada de dados 12 e a saída de dados 14. Em particular, a entrada de dados 12 está ligada a uma entrada de dados do meio para a determinação de um limite de audição e a uma entrada de dados do buffer de entrada 32. Uma saída de dados do meio 20 para a determinação do limite de audição está ligada a uma entrada do meio 24 para o cálculo de uma parametrização e à uma entrada de dados do meio 22 para o cálculo de um valor de amplificação para indicar um limite de audição determinado para este. Os meios 22 e calculam uma parametrização ou valor de amplificação baseado no limite de audição e estão ligados ao meio de comparação de nodos para indicar a ele esses resultados. Dependendo do resultado da comparação, o meio de comparação de nodos 26, como será discutido posteriormente, indica os resultados calculados pelos meios 22 e como parâmetro de entrada ou de parametrização para o préfiltro parametrizável 30. O pré-filtro parametrizável 30 está ligado entre uma saída de dados do buffer de entrada 32 e uma entrada de dados do buffer 38. O multiplicador 40 está conectado entre uma saída de dados do buffer 38 e o quantizador 28. O quantizador 28 indica os valores de áudio filtrados que podem ser multiplicados ou graduados, mas sempre quantizados, para a parte de redução de redundância 18, mais precisamente a uma entrada de dados do compressor 34. O meio de comparação de nodos 26 indica as informações a partir das quais os parâmetros de entrada indicados para o pré-filtro parametrizável 30 podem ser derivados para a parte de redução de redundância 18, mais precisamente para outra entrada de dados do compressor 34. O controlador de taxa de bits está conectado com uma entrada de controle do multiplicador 40 por meio de uma conexão de controle para prover valores de áudio
Petição 870180058805, de 06/07/2018, pág. 17/56
12/44 quantizados e filtrados, como recebidos do pré-filtro 30, para serem multiplicados pelo multiplicador 40 por um multiplicando adequado, como será discutido em maiores detalhes abaixo. O controlador de taxa de bits 36 está ligado entre a saida de dados do compressor 34 e a saida de dados 14 do codificador de áudio 10 para determinar o multiplicando para o multiplicador 40 de maneira adequada. Quando cada valor de áudio passa pelo quantizador 40 pela primeira vez, o multiplicando é primeiramente ajustado em um fator de graduação adequado como, por exemplo, 1. O buffer 38, entretanto, continua armazenando todos os valores de áudio filtrados para dar ao controlador de taxa de bits 36, como será descrito subsequentemente, uma possibilidade de alteração do multiplicando para uma outra passagem de um bloco de valores de áudio. Se tal alteração não for indicada pelo controlador de taxa de bits 36, o buffer 38 pode liberar a memória retida por este bloco.
[0035] Após o ajuste do codificador de áudio da Fig. 1 ter sido acima descrito, seu modo de funcionamento será subsequentemente descrito com referência às Figs. 2 a 7b.
[0036] Como pode ser visto na Fig. 2, o sinal de áudio, ao ter atingido a entrada de áudio 12, já foi obtido pela amostragem de sinal de áudio 50 a partir de um sinal análogo de áudio. A amostragem de sinal de áudio é feita com uma frequência da amostragem predeterminada, que está normalmente entre 32 e 48 kHz. Como consequência, na entrada de dados 12 existe um sinal de áudio que consiste de uma sequência de valores da amostra ou de áudio. Apesar da codificação do sinal de áudio não ocorrer de forma bloqueada, como se tornará óbvio a partir da descrição a
Petição 870180058805, de 06/07/2018, pág. 18/56
13/44 seguir, os valores de áudio na entrada de dados 12 são primeiramente combinados para formar blocos de áudio na etapa 52.
A combinação para formar blocos de áudio ocorre somente com o propósito de determinar o limite de audição, como se tornará óbvio a partir da descrição a seguir, e ocorre em um estágio de entrada do meio 20 para a determinação do limite de audição. Na presente configuração, é suposto como exemplo que 128 sucessivos valores de áudio são combinados para formar blocos de áudio e que a combinação ocorre de maneira que, por um lado, sucessivos blocos de áudio não se sobrepõem e, por outro lado, são vizinhos diretos entre si. Isto será brevemente discutido como exemplo referindo-se à Fig. 5a.
[0037] A Fig. 5a em 54 indica a sequência de valores da amostra, cada valor da amostra sendo ilustrado por um retângulo
56. Os valores da amostra são numerados com objetivos de ilustração, caracterizados pelo fato de que, por razões de clareza, somente alguns valores da amostra da sequência 54 são mostrados. Como indicado pelas junções acima da sequência 54, 128 sucessivos valores da amostra são combinados para formar um bloco de acordo com a presente configuração, caracterizado pelo fato de que os 128 valores da amostra diretamente sucessivos formam o próximo bloco. Somente como medida de precaução, deve ser indicado que a combinação para formar blocos também poderia ser feita de maneira diferente, como exemplo, superpondo blocos ou blocos espaçados entre si e blocos tendo outra dimensão de bloco, apesar da dimensão de bloco de 128 ser preferida, já que provê uma boa vantagem entre alta qualidade de áudio por um lado e o menor retardo possível de tempo pelo outro lado.
Petição 870180058805, de 06/07/2018, pág. 19/56
14/44 [0038] Considerando que os blocos de áudio combinados no meio 20 na etapa 52 são processados no meio 20 para determinar um limite de audição bloco a bloco, os valores de áudio de entrada serão armazenados em buffer 54 no buffer de entrada 32 até que o pré-filtro parametrizável 30 tenha obtido parâmetros de entrada a partir do meio de comparação de nodos 26 para realizar a préfiltragem, como será descrito subsequentemente.
[0039] Como pode ser visto na Fig. 3, o meio 20 para a determinação de um limite de audição inicia seu processamento diretamente depois que tiverem sido recebidos suficientes valores de áudio na entrada de dados 12 para formar um bloco de áudio ou para formar o próximo bloco de áudio, que o meio 20 monitora por uma inspeção na etapa 60. Se não houver um bloco de áudio processado completo, o meio 20 aguardará. Se houver um bloco de áudio completo a ser processado, o meio 20 para a determinação do limite de audição calculará um limite de audição na etapa 62, com base em um modelo psico-acústico adequado na etapa 62. Para a ilustração do limite de audição, é feita novamente referência à
Fig. 12 e, em particular, ao gráfico b que foi obtido com base em um modelo psico-acústico, exemplarmente com relação a um bloco de áudio corrente com um espectro a. O limite de mascaramento determinado na etapa 62 é uma função dependente da frequência, que pode variar para sucessivos blocos de áudio e que também pode variar consideravelmente de sinal de áudio para sinal de áudio, como, por exemplo, trechos de uma música de rock para trechos de uma música clássica. O limite de audição indica, para cada frequência, um valor limite baixo do qual o ouvido humano não percebe interferências.
Petição 870180058805, de 06/07/2018, pág. 20/56
15/44 [0040] Em uma etapa subseqüente 64, o meio 24 e o meio calculam a partir do limite de audição M(f) calculado (f indicando a frequência) um valor de amplificação a ou conjunto de parâmetros de N parâmetros x(i) (i = 1, ..., N) . A parametrização x(i) que o meio 24 calcula na etapa 64 é provida para o pré-filtro parametrizável 30 que é, por exemplo, configurado em uma estrutura de filtro adaptável, como usada na codificação LPC (LPC = linear predictive coding) . Por exemplo, s (η) , n = 0, ..., 127, sendo os 128 valores de áudio do bloco de áudio corrente e s'(n) sendo os 128 valores de áudio resultantes filtrados, então o filtro é configurado exemplarmente de maneira a se aplicar a seguinte equação:
κ [0041] s'(n) = s(n) - Y a^s(n - k), k=l [0042] K sendo a ordem do filtro e a£, k = 1, ..., K, sendo os coeficientes de filtro, e o índice t sendo para ilustrar que os coeficientes de filtro se alteram nos sucessivos blocos de áudio. O meio 24 então calcula a parametrização a£, de maneira que a função de transferência H(f) do pré-filtro parametrizável 30 é aproximadamente igual ao inverso da magnitude do limite de mascaramento M(f), isto é, de maneira a se aplicar a seguinte equação:
[0043] H(f, t) « —--|M(f, t)| [0044] Onde a dependência de t, por sua vez, é para ilustrar que o limite de mascaramento M(f) se altera para os diferentes blocos de áudio. Ao implementar o pré-filtro 30 como o filtro adaptável acima mencionado, os coeficientes de filtro a£
Petição 870180058805, de 06/07/2018, pág. 21/56
16/44 serão obtidos como segue: a transformada discreta inversa de Fourier de |M(f, t)|2 na frequência para o bloco no instante t resulta em uma função alvo de autocorrelação ^(i). Então, a£ é obtido solucionando o sistema de equação linear:
K-l [0045] Σ r^k - i|)a£ = r^(i + l), 0 < i < K k=0 [0046] Para não surgirem instabilidades entre as parametrizações na interpolação linear descrita abaixo em maiores detalhes, é preferivelmente usada uma estrutura em treliça para o filtro 30, caracterizado pelo fato de que os coeficientes de filtro para a estrutura em treliça são re-parametrizáveis para formar coeficientes de reflexão. Com relação a maiores detalhes do projeto do pré-filtro, o cálculo dos coeficientes e a reparametrização, é feita referência ao artigo de Schuller etc.
mencionado na introdução para descrição e, em particular, na página 381, divisão III, incorporada ao presente como referência.
[0047] Considerando que, como consequência o meio 24 calcula a parametrização para o pré-filtro parametrizável 30, de maneira que sua função de transferência é igual ao inverso do limite de mascaramento, o meio 22 calcula um limite de potência de ruído com base no limite de audição, a saber, um limite que indica quanta potência de ruído o quantizador 28 pode introduzir no sinal de áudio filtrado pelo pré-filtro 30 para que o ruído de quantização no lado do decodificador fique abaixo do limite de audição M(f) ou o iguale exatamente após a pós-f iltragem ou a filtragem reversa. O meio 22 calcula esse limite de potência de ruído como a área abaixo do quadrado da magnitude do limite de
Petição 870180058805, de 06/07/2018, pág. 22/56
17/44 audição M, isto é, como Σ|M(f)|2 . 0 meio 22 calcula o valor de amplificação a do limite de potência de ruido calculando a raiz da fração da potência de ruido da quantização dividida pelo limite de potência de ruido. 0 ruido de quantização é o ruido causado pelo quantizador 28. 0 ruido causado pelo quantizador 28 é, como será descrito abaixo, o ruido branco e, portanto, independente da frequência. A potência de ruido de quantização é a potência do ruido de quantização.
[0048] Como fica evidente a partir da descrição acima, o meio 22 também calcula o limite de potência de ruido separado do valor de amplificação a. Apesar de ser possível para o meio de comparação de nodos 26 calcular novamente o limite de potência de ruído a partir do valor de amplificação a obtido do meio 22, é também possível para o meio 22 transmitir o limite de potência de ruído determinado para o meio de comparação de nodos 26, independente do valor de amplificação a.
[0049] Após calcular o valor de amplificação e a parametrização, o meio de comparação de nodos 26 verifica na etapa se a parametrização recém-calculada difere além do limite predeterminado da última parametrização corrente indicada para o pré-filtro parametrizável. Se a verificação na etapa 66 indicar que a parametrização recém-calculada difere da corrente além do limite predeterminado, os coeficientes de filtro recém-calculados e o valor da amplificação recém-calculada e o limite de potência de ruído são armazenados em buffer no meio de comparação de nodos para que seja discutida uma interpolação e o meio de comparação de nodos 26 entrega para o pré-filtro 30 os coeficientes de filtro recém-calculados na etapa 68 e o valor da amplificação recémPetição 870180058805, de 06/07/2018, pág. 23/56
18/44 calculada na etapa 70. Se, entretanto, não for esse o caso e a parametrização recém-calculada não diferir da corrente além do limite predeterminado, o meio de comparação de nodos (26) entregará ao pré-filtro 30 na etapa 72, ao invés da parametrização recém-calculada, somente a corrente parametrização de nodo, isto é, a parametrização que resultou por último em um resultado positivo na etapa 66, isto é, diferiu de uma parametrização anterior de nodo além do limite predeterminado. Após as etapas 70 e 72, o processo da Fig. 3 retorna ao processamento do próximo bloco de áudio, isto é, à pergunta 60.
[0050] No caso em que a parametrização recém-calculada não difere da corrente parametrização de nodo e conseqüentemente o pré-filtro 30 na etapa 72 obtém novamente a parametrização de nodo já obtida pelo menos no último bloco de áudio, o pré-filtro 30 aplicará essa parametrização de nodo a todos os valores da amostra desse bloco de áudio no FIFO 32, como será descrito abaixo em maiores detalhes, que é como esse bloco corrente é coletado no
FIFO 32 e o quantizador 28 recebe um bloco de áudio resultante dos valores de áudio pré-filtrados.
[0051] A Fig. 4 ilustra o modo de funcionamento do préfiltro parametrizável 30 no caso em que recebe a parametrização recém-calculada e o valor da amplificação recém-calculado, porque
diferem suficientemente da corrente parametrização de nodo em
maiores detalhes. Como descrito com referência à Fig. 3, não
existe processamento de acordo com a Fig. 4 para cada um dos
sucessivos blocos de áudio, mas somente para os blocos de áudio onde a parametrização respectiva diferiu suficientemente da corrente parametrização de nodo. Os demais blocos de áudio são,
Petição 870180058805, de 06/07/2018, pág. 24/56
19/44 como foi há pouco descrito, pré-filtrados aplicando a respectiva parametrização de nodo corrente e o valor de amplificação respectivo corrente a todos os valores da amostra desses blocos de áudio.
[0052] Na etapa 80, o pré-filtro parametrizável 30 verifica se ocorreu o handover dos coeficientes de filtro recémcalculados do meio de comparação de nodos 26, ou de parametrizações de nodo anteriores. O pré-filtro 30 faz a verificação 80 até ocorrer o handover.
[0053] Logo que ocorre esse handover, o pré-filtro
parametrizável 30 inicia o processamento do bloco de áudio
corrente dos valores de áudio no buffer 32, isto é, aquele para o
qual a parametrização foi calculada. A Fig. 5a mostra, por
exemplo, que todos os valores de áudio 56 na frente do valor de áudio com o número 0 já foram processados e assim já passaram pela memória 32. Foi disparado o processamento do bloco de valores de áudio na frente do valor de áudio com número 0 porque a parametrização calculada para o bloco de áudio na frente do bloco
0, a saber, x0(i), diferiu da parametrização de nodo indicada antes ao pré-filtro 30 além do limite predeterminado. A parametrização x0(i) é, portanto, uma parametrização de nodo, como descrita na presente invenção. O processamento dos valores de áudio no bloco de áudio na frente do valor de áudio 0 foi feito com base no conjunto de parâmetros a0, x0(i).
[0054] É suposto na Fig. 5a que a parametrização foi calculada para o bloco 0 com os valores de áudio 0 a 127 diferindo por menos que o limite predeterminado da parametrização x0(i) que se referiu ao bloco em frente. Esse bloco 0 foi assim também
Petição 870180058805, de 06/07/2018, pág. 25/56
20/44 retirado do FIFO 32 pelo pré-filtro 30, igualmente processado com relação a todos os seus valores da amostra 0 a 127 por meio da parametrização x0(i) fornecida na etapa 72, como indicada pela flecha 81 descrita por aplicação direta, e depois passada para o quantizador 28.
[0055] Entretanto, a parametrização calculada para o bloco 1 ainda localizada no FIFO 32, em contraste diferiu, de acordo com o exemplo ilustrativo da Fig. 5a, em mais do que o limite predeterminado da parametrização x0(i) e foi assim passado na etapa 68 para o pré-filtro 30 como uma parametrização Xi(i), juntamente com o valor de amplificação aT (etapa 70) e, se aplicável, limite de potência de ruído adequado, caracterizado pelo fato de que os índices de a e x na Fig. 5 devem ser um índice para os nodos, como usados na interpolação a ser discutida abaixo, que foi feita em relação aos valores da amostra 128 a 255 no bloco 1, simbolizado por uma flecha 82 e realizados pelas etapas seguintes à etapa 80 na Fig. 4. O processamento na etapa 80 iniciaria assim, com a ocorrência do bloco de áudio com o número
1.
[0056] No momento em que o conjunto de parâmetros aT, Xi é passado, somente os valores de áudio 128 a 255, isto é, o bloco de áudio corrente após o último bloco de áudio 0 processado pelo pré-filtro 30, está na memória 32. Depois de determinar o handover dos parâmetros de nodo Xi(i) na etapa 80, o pré-filtro 30 determina o limite de potência de ruído qT que corresponde ao valor de amplificação aT na etapa 84. Isto pode ocorrer pelo meio de comparação de nodos 26 passando esse valor para o pré-filtro 30 ou pelo pré-filtro 30 novamente calculando esse valor, como acima
Petição 870180058805, de 06/07/2018, pág. 26/56
21/44 descrito com referência à etapa 64.
[0057] Depois, é inicializado um índice j para um valor da amostra na etapa 86, de maneira a indicar o mais antigo valor da amostra que permanece na memória FIFO 32 ou o primeiro valor da amostra do bloco de áudio corrente bloco 1, isto é, no presente exemplo da Fig. 5, o valor da amostra 128. Na etapa 88, o préfiltro parametrizável faz uma interpolação entre os coeficientes de filtro x0 e xlf caracterizado pelo fato de que aqui a parametrização x0 atua como um nodo no nodo que tem o número de valor de áudio 127 do bloco anterior 0 e a parametrização Xi atua como um nodo no nodo que tem o número de valor de áudio 255 do bloco corrente 1. Essas posições de valor de áudio 127 e 255 serão subsequentemente indicadas como nodo 0 e nodo 1, onde as parametrizações de nodo referentes aos nodos da Fig. 5a são indicadas pelas flechas 90 e 92.
[0058] Na etapa 88, o pré-filtro parametrizável 30 faz a interpolação dos coeficientes de filtro x0, Xi entre os dois nodos, sob a forma de interpolação linear para obter os coeficientes de filtro interpolados na posição da amostra j, isto é, x(tj) (i) , i =
... N.
[0059] Depois disso, a saber, na etapa 90, o pré-filtro parametrizável 30 faz uma interpolação entre o limite de potência de ruído qT e q0 para obter um limite de potência de ruído interpolado na mesma posição da amostra j, isto é, q(tj).
[0060] Na etapa 92, o pré-filtro parametrizável 30 subsequentemente calcula o valor de amplificação da posição da amostra j com base no limite de potência de ruído interpolado e a potência de ruído de quantização, e preferivelmente também os
Petição 870180058805, de 06/07/2018, pág. 27/56
22/44 coeficientes de filtro interpolados, a saber, por exemplo, potência de ruído de quantização dependendo da raiz de -, onde são feitas explicações para essa referência na etapa 64 da Fig. 3.
[0061] Na etapa 94, o pré-filtro parametrizável 30 então aplica o valor de amplificação calculado e os coeficientes de filtro interpolados ao valor da amostra na posição da amostra j para obter um valor da amostra filtrado para essa posição da amostra, a saber, s'(tj)· [0062] Na etapa 96, o pré-filtro parametrizável 30 então verifica se a posição da amostra j atingiu o nodo corrente, isto é, o nodo 1, no caso da Fig. 5a a posição da amostra 255, isto é, o valor da amostra para o qual a parametrização transferida para o pré-filtro parametrizável 30 mais o valor de amplificação deve ser diretamente válida, isto é, sem interpolação. Se este não for o caso, o pré-filtro parametrizável 30 aumentará ou incrementará o índice j de 1, onde as etapas 88 a 96 serão repetidas. Entretanto, se a verificação na etapa 96 for positiva, o pré-filtro parametrizável aplica, na etapa 100, o último valor de amplificação transmitido do meio de comparação de nodos 26 e os últimos coeficientes de filtro transmitidos do meio de comparação de nodos 26 diretamente sem interpolação ao valor da amostra no novo nodo, onde o bloco corrente, isto é, no caso corrente o bloco
1, foi processado, sendo o processo novamente feito na etapa 80 relativo ao bloco subseqüente a ser processado que, dependendo se a parametrização do próximo bloco de áudio, o bloco 2, difere o suficiente da parametrização Xi(i), pode ser esse próximo bloco de áudio, bloco 2, ou um bloco de áudio posterior.
Petição 870180058805, de 06/07/2018, pág. 28/56
23/44 [0063] Antes de qualquer outro procedimento para o processamento dos valores da amostra filtrados s' serem descritos com relação à Fig. 5, serão descritos abaixo o propósito e o histórico do procedimento das Figs. 3 e 4. O propósito da filtragem, é filtrar o sinal de áudio na entrada 12 com um filtro adaptável, cuja função de transferência é continuamente ajustada para o inverso do limite de audição até o melhor grau possível, que também se altera no tempo. A razão para isto é, que, no lado do decodificador, a filtragem reversa, cuja função é ajustada contínua e correspondentemente para o limite de audição, conforma o ruído branco de quantização introduzido pela quantização do sinal de áudio filtrado, isto é, o ruído de quantização de frequência constante, por um filtro adaptável que o ajusta à forma do limite de audição.
[0064] A aplicação do valor de amplificação nas etapas e 100 no pré-filtro 30 é uma multiplicação do sinal de áudio ou do sinal de áudio filtrado, isto é, os valores da amostra s ou os valores da amostra filtrados s', pelo fator de amplificação. O objetivo é assim estabelecer o ruído de quantização introduzido no sinal de áudio filtrado pela quantização descrita abaixo em maiores detalhes, e que é ajustado pela filtragem reversa no lado do decodificador à forma do limite de audição, o mais alto possível sem ultrapassar o limite de audição. Isto pode ser exemplificado pela fórmula de Parsevals, de acordo com a qual o quadrado da magnitude de uma função é igual ao quadrado da magnitude da transformada de Fourier. Quando no lado do decodificador, a multiplicação do sinal de áudio no pré-filtro pelo valor de amplificação é novamente revertida pela divisão do
Petição 870180058805, de 06/07/2018, pág. 29/56
24/44 sinal de áudio filtrado pelo valor de amplificação, a potência de ruído de quantização é também reduzida, a saber, pelo fator a-2, a sendo o valor de amplificação. Como consequência, a potência de ruído de quantização pode ser estabelecida em um grau idealmente alto aplicando o valor de amplificação no pré-filtro
30, que é sinônimo da dimensão da etapa quantizadora sendo aumentada e assim ser reduzido o número de etapas quantizadoras a serem codificadas que, por sua vez, aumenta a compressão na subseqüente parte de redução de redundância.
[0065] Colocado de forma diferente, o efeito do préfiltro pode ser considerado como uma normalização do sinal em seu limite de mascaramento, de maneira que o nível de interferências de quantização ou do ruído de quantização pode ser mantido constante, tanto no tempo como na frequência. Como o sinal de áudio está no domínio do tempo, a quantização pode, assim, ser feita passo a passo, com uma quantização uniforme constante, como será descrito subsequentemente. Assim, teoricamente, qualquer irrelevância possível é removida do sinal de áudio, podendo ser usado um esquema de compressão sem perdas para também remover a redundância remanescente no sinal de áudio pré-filtrado e quantizado, como será descrito abaixo.
[0066] Com referência à Fig. 5a, deve ser novamente e explicitamente indicado que, evidentemente, os coeficientes de filtro e os valores de amplificação a0, aT, x0, Xi usados devem estar disponíveis no lado do decodificador como informações colaterais, que a complexidade de transferência disto, entretanto, é reduzida não somente usando novos coeficientes de filtro e novos valores de amplificação para cada bloco. Ao invés disso, ocorre
Petição 870180058805, de 06/07/2018, pág. 30/56
25/44 uma verificação do valor limite 66 para somente transferir as parametrizações como informações colaterais com uma suficiente mudança de parametrização e para de outra forma não transferir as informações colaterais ou parametrizações. Ocorre uma interpolação da antiga para a nova parametrização nos blocos de áudio para onde as parametrizações foram transferidas. A interpolação dos coeficientes de filtro ocorre da maneira acima descrita com referência à etapa 88. A interpolação com referência à amplificação ocorre por um atalho, a saber, por meio de uma interpolação linear 90 do limite de potência de ruido q0, qi.
Comparada com uma interpolação direta por meio do valor de amplificação, a interpolação linear resulta em uma melhor audição ou em menos problemas audíveis com relação ao limite de potência de ruído.
[0067] Subsequentemente, a continuação do processamento do sinal pré-filtrado será descrita com referência à Fig. 6, que basicamente inclui redução de quantização e redundância. Primeiro, a saída dos valores da amostra filtrados pelo pré-filtro parametrizável 30 são armazenados no buffer 38 e ao mesmo tempo deixados passar do buffer 38 para o multiplicador 40 onde são, já que se trata da primeira passagem, primeiramente passados inalterados, a saber, com um fator de graduação de um, pelo multiplicador 40 para o quantizador 28. Aí, são cortados os valores de áudio filtrados acima de um limite superior na etapa
110 e depois quantizados na etapa 112. As duas etapas 110 e 112 são realizadas pelo quantizador 28. Em particular, as duas etapas
110 e 112 são preferivelmente realizadas pelo quantizador 28 em uma etapa, pela quantização dos valores de áudio filtrados s' por
Petição 870180058805, de 06/07/2018, pág. 31/56
26/44 uma função da etapa quantizadora que mapeia os valores da amostra filtrados s' exemplarmente presentes em uma ilustração de ponto flutuante em uma pluralidade de valores ou índices de etapa quantizadora de números inteiros e que tem um curso nivelado para os valores da amostra filtrados a partir de um determinado valor limite, de maneira que os valores da amostra filtrados que forem maiores do que o valor limite, são quantizados para a mesma etapa de quantização. Um exemplo dessa função de etapa de quantização está ilustrado na Fig. 7a.
[0068] Os valores da amostra filtrados e quantizados são denominados por σ' na Fig. 7a. A função da etapa quantizadora é preferivelmente uma função da etapa quantizadora com uma dimensão de etapa que é constante abaixo do valor limite, isto é, o pulo para a próxima etapa de quantização sempre ocorrerá após um intervalo constante juntamente com os valores de entrada S'. Na implementação, a dimensão da etapa para o valor limite é ajustada de maneira que o número de etapas de quantização corresponde, preferivelmente, a uma potência de 2. Comparado com a ilustração de ponto flutuante dos valores da amostra filtrados de entrada s', o valor limite é menor, de maneira que o valor máximo da região mostrada na ilustração de ponto flutuante ultrapassa o valor limite.
[0069] A razão para este valor limite é que foi observado que a saída do sinal de áudio filtrado pelo pré-filtro compreende ocasionalmente valores de áudio que se somam a valores muito grandes devido a um acúmulo desfavorável de ondas harmônicas. Além disso, foi observado que o corte desses valores, como realizado pela função da etapa quantizadora mostrada na Fig.
Petição 870180058805, de 06/07/2018, pág. 32/56
27/44
7a, resulta em uma grande redução de dados, mas somente com pequeno prejuízo na qualidade de áudio. Assim, esses locais ocasionais no sinal de áudio filtrado são formados artificialmente por uma filtragem seletiva de frequência no filtro parametrizável
30, de maneira que cortá-los prejudica a qualidade de áudio somente em pequeno grau.
[0070] Um exemplo de certa forma mais específico da função da etapa quantizadora mostrada na Fig. 7a seria a que arredonda todos os valores das amostras filtrados s' para o próximo número inteiro até o valor limite, e daí em diante quantiza todos os valores das amostras filtrados acima para a maior etapa quantizadora, tal como, por exemplo, 256. Esse caso está ilustrado na Fig. 7a.
[0071] Outro exemplo de uma possível função da etapa quantizadora seria o mostrado na Fig. 7b. Até o valor limite, a função da etapa quantizadora da Fig. 7b corresponde à da Fig. 7a.
Entretanto, ao invés de ter um curso nivelado abruptamente para valores das amostras s' acima do valor limite, a função da etapa quantizadora continua com uma inclinação menor do que a inclinação na região abaixo do valor limite. Colocado de outra forma, a dimensão da etapa quantizadora é maior acima do valor limite. Por isso, é alcançado um efeito similar como pela função de quantização da Fig. 7a, mas, por um lado, com maior complexidade devido às diferentes dimensões de etapas da função da etapa quantizadora acima e abaixo do valor limite e, por outro lado, uma melhor qualidade de áudio, já que valores de áudio com filtragem s' muito grandes não são cortados completamente, mas somente quantizados com uma maior dimensão da etapa quantizadora.
Petição 870180058805, de 06/07/2018, pág. 33/56
28/44 [0072] Como já descrito anteriormente, no lado do decodificador não somente os valores de áudio quantizados e filtrados σ' devem estar disponíveis, mas também os parâmetros de entrada para o pré-filtro 30 sendo a base da filtragem desses valores, a saber, a parametrização do nodo incluindo uma sugestão para o valor de amplificação pertinente. Na etapa 114, o compressor 34 realiza assim um primeiro experimento de compressão e assim comprime as informações colaterais que contêm o valor das amplificações a0 e aT nos nodos, como por exemplo, 127 e 255, e os coeficientes de filtro x0 e Xi nos nodos e os valores das amostras quantizados e filtrados σ' para um sinal filtrado temporalmente. O compressor 34 é assim um codificador de operação sem perdas, como por exemplo, um codificador Huffman ou aritmético, com ou sem predição e/ou adaptação.
[0073] A memória 38 pela qual os valores de áudio amostrados σ' passam, serve como um buffer para uma dimensão de bloco adequada com a qual o compressor 34 processa os valores de áudio quantizados, filtrados e também graduados σ' como descritos anteriormente, que saem do quantizador 28. A dimensão de bloco pode diferir da dimensão de bloco dos blocos de áudio como usadas pelo meio 20.
[0074] Como já mencionado, o controlador de taxa de bits controla o multiplexador 40 por um multiplicando de 1 para o primeiro experimento de compressão, de maneira que os valores de áudio filtrados ficam inalterados a partir do pré-filtro 30 para o quantizador 28 e daí como valores de áudio quantizados e filtrados para o compressor 34. O compressor 34 monitora na etapa 116 se uma determinada dimensão do bloco de compressão, isto é, um
Petição 870180058805, de 06/07/2018, pág. 34/56
29/44 determinado número de valores de áudio amostrados quantizados, foram codificados no sinal codificado temporário, ou se outros valores de áudio quantizados e filtrados σ' devem ser codificados no sinal codificado temporário corrente. Se a dimensão do bloco de compressão não foi alcançada, o compressor 34 continuará realizando a compressão corrente 114. Entretanto, se a dimensão do bloco de compressão tiver sido alcançada, o controlador de taxa de bits 36 verificará na etapa 118 se a quantidade necessária de bits para a compressão é maior do que a quantidade de bits indicada por um taxa de bits desejado. Se este não for o caso, o controlador de taxa de bits 36 verificará na etapa 120 se a quantidade necessária é menor do que a quantidade de bits indicada por um taxa de bits desejado. Se este for o caso, o controlador de taxa de bits 36 preencherá o sinal codificado na etapa 122 com filler bits até que a quantidade indicada pela taxa de bits desejada tenha sido alcançada. Subsequentemente, o sinal codificado sai na etapa 124.
Como alternativa à etapa 122, o controlador de taxa de bits 36 poderia mover o bloco de compressão dos valores de áudio filtrados σ' ainda armazenados na memória 38, nos quais a última compressão se baseou, sob uma forma multiplicada por um multiplicando maior do que 1 pelo multiplicador 40 para o quantizador 28, para novamente passar as etapas 110 a 118, até que a quantidade de bits indicada pela taxa de bits indicada tenha sido alcançada, como indicado na etapa 125 ilustrada em linhas interrompidas.
[0075] Se, entretanto, a verificação da etapa 118 resultar em que a quantidade requerida de bits seja maior do que a indicada pela taxa de bits desejada, o controlador de taxa de bits mudará o multiplicando para o multiplicador 40 para um fator
Petição 870180058805, de 06/07/2018, pág. 35/56
30/44 entre 0 e 1 exclusivo. Isto é feito na etapa 126. Após a etapa
126, o controlador de taxa de bits 36 faz a memória 38 novamente produzir o último bloco de compressão de valores de áudio filtrados σ' nos quais a compressão se baseou, caracterizado pelo fato de que são subsequentemente multiplicados pelo fator estabelecido na etapa 126 e novamente fornecido ao quantizador 28, quando as etapas 110 a 118 são novamente realizadas e até quando o sinal codificado temporariamente é descartado.
[0076] Deve ser ressaltado que, ao realizar as etapas
110 a 116 novamente na etapa 114, é evidente que o fator usado na etapa 126 (ou etapa 125) é também integrado ao sinal codificado.
[0077] O propósito do procedimento após a etapa 126 é aumentar a dimensão da etapa efetiva do quantizador 28 pelo fator.
Isto significa que o ruído de quantização resultante está uniformemente acima do limite de mascaramento, que resulta em interferências audíveis ou ruído audível, mas que resulta em um taxa de bits reduzido. Se, após passar novamente as etapas 110 a
116, for novamente determinado na etapa 118 que a quantidade necessária de bits é maior do que aquela indicada pela taxa de bits desejada, o fator será novamente reduzido na etapa 126, etc.
[0078] Se os dados forem finalmente produzidos na etapa
124 como um sinal codificado, o próximo bloco de compressão será feito a partir dos valores de áudio quantizados e filtrados subseqüentes σ'.
que outro valor préusado como fator de
Depois, a graduação , isto é, na parte [0079] Deve também ser ressaltado inicializado diferente de 1 poderia ser multiplicação, a saber, por exemplo, 1.
ocorrería primeiramente em qualquer caso
Petição 870180058805, de 06/07/2018, pág. 36/56
31/44 superior da Fig. 6.
[0080] A Fig. 5b novamente ilustra o sinal codificado resultante, que é geralmente indicado por 130. O sinal codificado inclui informações colaterais e dados principais no intermédio. As informações colaterais incluem, como já mencionado, as informações a partir das quais para blocos de áudio especiais, a saber, blocos de áudio onde uma alteração significativa dos coeficientes de filtro resultou em uma sequência de blocos de áudio, o valor da amplificação e o valor dos coeficientes de filtro podem ser derivados. Se necessário, as informações colaterais incluirão outras informações relativas ao valor de amplificação usado para o controlador de bits. Devido à dependência mútua do valor de amplificação e ao limite de potência de ruido q, as informações colaterais podem opcionalmente, independente do valor de amplificação a# para um nodo #, também incluir o limite de potência de ruido q#, ou somente o último. As informações colaterais são preferencialmente dispostas dentro do sinal codificado, de maneira que as informações colaterais para os coeficientes de filtro e o valor de amplificação referente ou o limite de potência de ruido referente são dispostas na frente dos dados principais para o bloco de áudio dos valores de áudio quantizados e filtrados σ', a partir dos quais esses coeficientes de filtro com valores de amplificação referentes ou limite de potência de ruido referente se derivaram, isto é, as informações colaterais a0, x0(i) após o bloco -1 e as informações colaterais ai, Xi(i) após o bloco 1. Colocado de forma diferente, os dados principais, isto é, os valores de áudio quantizados e filtrados σ', iniciando de, excluindo, um bloco de áudio do tipo em que uma
Petição 870180058805, de 06/07/2018, pág. 37/56
32/44 significativa alteração na sequência dos blocos de áudio tenha resultado nos coeficientes de filtro, até e inclusive, o próximo bloco de áudio desse tipo, na Fig. 5, por exemplo, os valores de áudio σ'(to) _ σ'(t255), sempre estarão dispostos entre o bloco de informações colaterais 132 até o primeiro desses dois blocos de áudio (bloco -1) e o outro bloco de informações colaterais 134 até o segundo dos dois blocos de áudio (bloco 1) . Os valores de áudio σ' (t0) - σ' (ti27) são decodificáveis ou foram, como mencionado anteriormente com referência à Fig. 5a, obtidos somente por meio das informações colaterais 132, considerando que os valores de áudio σ' (ti2s) - σ' (t255) foram obtidos por interpolação por meio das informações colaterais 132 como valores de suporte no nodo com o número do valor da amostra 127 e por meio das informações colaterais 134 como valores de suporte no nodo com o número de valor da amostra 255 sendo assim somente decodificáveis por meio de ambas as informações colaterais.
[0081] Além disso, as informações colaterais referentes ao valor de amplificação ou ao limite de potência de ruido e os coeficientes de filtro em cada bloco de informações colaterais 132 e 134 não estão sempre integradas independentes entre si. Ao invés disso, essas informações colaterais são transferidas em diferenças para o bloco anterior de informações colaterais. Na Fig. 5b por exemplo, o bloco de informações colaterais 132 contém o valor de amplificação a0 e coeficientes de filtro x0 com relação ao nodo no momento t_i. No bloco de informações colaterais 132, esses valores podem se derivar do próprio bloco. A partir do bloco de informações colaterais 134, entretanto, as informações colaterais referentes ao nodo no momento t255 não podem mais se derivar
Petição 870180058805, de 06/07/2018, pág. 38/56
33/44 exclusivamente deste bloco. Ao invés disso, o bloco de informações colaterais 134 somente inclui informações sobre diferenças do valor de amplificação ai do nodo no momento t255 e o valor de amplificação do nodo no momento t0 e as diferenças dos coeficientes de filtro Xi e os coeficientes de filtro x0. 0 bloco de informações colaterais 134 como consequência, somente contém as informações sobre aT - a0 e Xi(i) - x0(i) . Em momentos intermitentes, entretanto, os coeficientes de filtro e o valor de amplificação ou o limite de potência de ruído devem ser totalmente transferidos e não somente como uma diferença para o nodo anterior, como, por exemplo, cada segundo permitindo que um receptor ou decodificador bloqueie em um fluxo de operação de dados de codificação, como será discutido abaixo.
[0082] Esse tipo de integração das informações colaterais nos blocos das informações colaterais 132 e 134 oferece a vantagem da possibilidade de uma maior taxa de compressão. A razão para isso é que, apesar das informações colaterais somente serem, se possível, transferidas se tiver havido uma alteração suficiente dos coeficientes de filtro para os coeficientes de filtro de um nodo anterior, a complexidade para calcular a diferença no lado do codificador ou para calcular a soma no lado do decodificador compensa, já que as diferenças resultantes são pequenas, apesar da questão da etapa 66 para assim permitir vantagens na codificação de entropia.
[0083] Depois que a configuração de um codificador de áudio foi descrita anteriormente, será descrita subsequentemente uma configuração de um decodificador de áudio adequado para a decodificação do sinal codificado gerado pelo codificador de áudio
Petição 870180058805, de 06/07/2018, pág. 39/56
34/44 da Fig. 1 para um sinal de áudio decodificado reproduzível ou processável.
[0084] O estabelecimento desse decodificador está mostrado na Fig. 8. O decodificador geralmente indicado por 210 inclui um descompressor 212, uma memória FIFO 214, um multiplicador 216 e um pós-filtro parametrizável 218. O descompressor 212, a memória FIFO 214, o multiplicador 216 e o pós-filtro parametrizável 218 estão conectados nessa ordem entre uma entrada de dados 220 e uma saída de dados 222 do decodificador
210, caracterizado pelo fato de que o sinal codificado é recebido na entrada de dados 220 e o sinal de áudio decodificado somente diferindo do sinal de áudio original na entrada de dados 12 do codificador de áudio 10 pelo ruído de quantização gerado pelo quantizador 28 no codificador de áudio 10 na saída de dados 222. O
descompressor 212 está conectado a uma entrada de controle do
multiplicador 216 em outra saída de dados para passar um
multiplicando para este, e para uma entrada de parametrização do
pós-filtro parametrizável 218 por outra saída de dados.
[0085] Como mostrado na Fig. 9, o descompressor 212 primeiramente descomprime na etapa 224 o sinal comprimido na entrada de dados 220 para obter os dados de áudio quantizados e filtrados, a saber, os valores das amostras σ', e as informações colaterais referentes nos blocos das informações colaterais 132,
134, que, como se sabe, indicam os coeficientes de filtro e o valor das amplificações ou, ao invés dos valores das amplificações, o limite de potência de ruídos nos nodos.
[0086] Como mostrado na Fig. 10, o descompressor 212 verifica o sinal descomprimido na ordem do aparecimento na etapa
Petição 870180058805, de 06/07/2018, pág. 40/56
35/44
226 se as informações colaterais com coeficientes de filtro estão aí contidas, de forma autocontida sem uma referência de diferença com um bloco anterior de informações colaterais. Colocado de forma diferente, o descompressor 212 procura o primeiro bloco de informações colaterais 132. Logo que o descompressor 212 encontrar alguma coisa, os valores de áudio quantizados e filtrados σ' são armazenados em buffer na memória FIFO 214 na etapa 228. Se um bloco de áudio completo, com valores de áudio quantizados e filtrados σ' tiver sido armazenado na etapa 228 sem um bloco de informações colaterais diretamente a seguir, será primeiramente pós-filtrado na etapa 228 por meio das informações contidas nas informações colaterais recebidas na etapa 226 no valor da parametrização e da amplificação em um pós-filtro e amplificado no multiplicador 216, forma com a qual é decodificado, e assim o bloco de áudio decodificado referente é conseguido.
[0087] Na etapa 230, o descompressor 212 monitora o sinal descomprimido quanto à ocorrência de qualquer tipo de bloco de informações colaterais, a saber, com coeficientes de filtro absolutos ou diferenças de coeficientes de filtro com relação a um bloco de informações colaterais anterior. No exemplo da Fig. 5b, o descompressor 212 reconhecería, por exemplo, a ocorrência do bloco de informações colaterais 134 na etapa 230 quando do reconhecimento do bloco de informações colaterais 132 na etapa
226. Assim, o bloco de valores de áudio quantizados e filtrados σ' (t0) - σ' (ti27) feria sido decodificado na etapa 228, usando as informações colaterais 132. Enquanto o bloco de informações colaterais 134 no sinal descomprimido ainda não tiver ocorrido, o efeito de buffer e, talvez, a decodificação de blocos prossiga na
Petição 870180058805, de 06/07/2018, pág. 41/56
36/44 etapa 228 por meio das informações colaterais da etapa 226, como descrito anteriormente.
[0088] Logo que o bloco de informações colaterais 132 ocorrer, o descompressor 212 calculará os valores dos parâmetros no nodo 1, isto é, aT, Xi(i), na etapa 232 somando os valores da diferença no bloco de informações colaterais 134 e os valores dos parâmetros no bloco de informações colaterais 132. A etapa 232 é, evidentemente, omitida se o bloco de informações colaterais corrente for um bloco de informações colaterais autocontido, sem diferenças, que, como descrito anteriormente, pode ocorrer exemplarmente a cada segundo. Para que o tempo de espera do decodificador 210 não seja muito grande, os blocos de informações colaterais 132, de onde os valores do parâmetro podem ser derivados com certeza, isto é, sem relação com outro bloco de informações colaterais, são dispostos a distâncias suficientemente pequenas, para que o tempo para ligar ou o tempo para desligar ao acionar o codificador de áudio 210 no caso de, por exemplo, uma transmissão de rádio ou uma transmissão de difusão, não seja muito grande. Preferivelmente, o número de blocos de informações colaterais 132 dispostos no intermédio, com os valores de diferença é disposto em um número predeterminado fixo entre os blocos de informações colaterais 132, de maneira que o decodificador saiba quando um bloco de informações colaterais do tipo 132 deve ser novamente esperado no sinal codificado.
Alternativamente, os diferentes tipos de blocos de informações colaterais estão indicados pelos flags correspondentes.
[0089] Como mostrado na Fig. 11, após ter sido alcançado um bloco de informações colaterais para um novo nodo, em
Petição 870180058805, de 06/07/2018, pág. 42/56
37/44 particular após a etapa 226 ou 232, um índice de valor da amostra j é primeiramente inicializado em 0 na etapa 234. Esse valor corresponde à posição da amostra do primeiro valor da amostra no bloco de áudio correntemente remanescente no FIFO 214, ao qual se referem as atuais informações colaterais. A etapa 234 é realizada pelo pós-filtro parametrizável 218. 0 pós-filtro 218 então calcula o limite de potência de ruído no novo nodo na etapa 236, caracterizado pelo fato de que esta etapa corresponde à etapa 84 da Fig. 4 e pode ser omitida quando, por exemplo, o limite de potência de ruído nos nodos é transmitido, além dos valores de amplificação. Nas etapas subseqüentes 238 e 240, o pós-filtro 218 realiza interpolações com relação aos coeficientes de filtro e o limite de potência de ruído que correspondem às interpolações 88 e da Fig. 4. O cálculo subseqüente do valor de amplificação para a posição da amostra j com base no limite de potência de ruído interpolado e os coeficientes de filtro interpolados das etapas
238 e 240 na etapa 242, correspondem à etapa 92 da Fig. 4. Na etapa 244, o pós-filtro 218 aplica o valor de amplificação calculado na etapa 242 e os coeficientes de filtro interpolados ao valor da amostra na posição da amostra j. Essa etapa difere da etapa 94 da Fig. 4 pelo fato de que os coeficientes de filtro interpolados são aplicados aos valores das amostras σ' quantizados e filtrados, de maneira que a função de transferência do pósfiltro parametrizável não corresponda ao inverso do limite de audição, mas ao próprio limite de audição. Além disso, o pósfiltro não faz uma multiplicação pelo valor de amplificação, mas uma divisão pelo valor de amplificação nos valores das amostras σ' quantizados e filtrados ou o valor da amostra filtrado e
Petição 870180058805, de 06/07/2018, pág. 43/56
38/44 quantizado, já com filtragem reversa na posição j.
[0090] Se o pós-filtro 218 ainda não tiver alcançado o nodo corrente com a posição da amostra j, que a verifica na etapa
246, incrementará o índice de posição da amostra j na etapa 248 e iniciará as etapas 238 a 246 novamente. Somente quando o nodo tiver sido alcançado, aplicará o valor de amplificação e os coeficientes de filtro do novo nodo ao valor da amostra no nodo, a saber, na etapa 250. A aplicação, por sua vez, inclui, como na etapa 218, uma divisão por meio do valor de amplificação e filtragem com uma função de transferência que iguala o limite de audição e não o inverso deste último, ao invés de uma multiplicação. Após a etapa 250, o bloco de áudio corrente é decodificado por uma interpolação entre duas parametrizações de nodo.
[0091] Como já mencionado, o ruído introduzido pela quantização durante a codificação na etapa 110 ou 112 é ajustado tanto na forma como na magnitude para o limite de audição pela filtragem e a aplicação de um valor de amplificação nas etapas 218 e 224.
[0092] Também deve ser ressaltado que, no caso em que os valores de áudio quantizados e filtrados tiverem sido submetidos a uma outra multiplicação na etapa 126 devido ao controlador de taxa de bits antes de serem codificados em sinal codificado, este fator também pode ser considerado nas etapas 218 e 224.
Alternativamente, os valores de áudio obtidos pelo processo da
Fig. 11 podem, evidentemente, ser submetidos a uma outra multiplicação para amplificar novamente, de forma correspondente, os valores de áudio enfraquecidos por uma menor taxa de bits.
Petição 870180058805, de 06/07/2018, pág. 44/56
39/44 [0093] Com relação às Figs. 3, 4, 6 e 9 a 11, deve-se ressaltar que mostram fluxogramas ilustrando o modo de funcionamento do codificador da Fig. 1 ou o decodificador da Fig.
e que cada uma das etapas ilustradas no fluxograma por um bloco, como descrito, é implementada pelos meios correspondentes, como descrito anteriormente. A implementação das etapas individuais pode ser feita em hardware, como parte do circuito ASIC, ou em software, como sub-rotinas. Em particular, as explanações escritas nos blocos nessas figuras indicam aproximadamente a qual processo a etapa respectiva que corresponde ao bloco respectivo se refere, considerando que as flechas entre os blocos ilustram a ordem das etapas ao operar, respectivamente, o codificador e o decodificador.
[0094] Com referência à descrição anterior, deve-se novamente ressaltar que o esquema de codificação ilustrado acima pode variar em muitos aspectos. Como exemplo, não é necessário para uma parametrização e um valor de amplificação ou um limite de potência de ruido, como indicado para um determinado bloco de áudio, ser considerado como diretamente válido para um determinado valor de áudio, como na configuração anterior o último valor de áudio respectivo de cada bloco de áudio, isto é, o 128- valor neste bloco de áudio, de maneira que a interpolação desse valor de áudio possa ser omitida. Ao invés disso, é possível relacionar esses valores de parâmetros de nodo com um nodo que está temporariamente entre os tempos das amostras tn, n = 0, ..., 127, dos valores de áudio desse bloco de áudio, de maneira que fosse necessária uma interpolação para cada valor de áudio. Em particular, a parametrização determinada para um bloco de áudio ou
Petição 870180058805, de 06/07/2018, pág. 45/56
40/44 o valor de amplificação determinado para este bloco de áudio também pode ser aplicado indiretamente a outro valor, como, por exemplo, o valor de áudio na metade do bloco de áudio, como, por exemplo, o 6 4- valor de áudio no caso da dimensão de bloco acima de 128 valores de áudio.
[0095] Além disso, deve-se ressaltar que a configuração acima se refere a um esquema de codificação de áudio projetado para gerar um sinal codificado com taxa de bits controlado.
Entretanto, o controle da taxa de bits, não é necessário para
todos os casos da aplicação. Esta é a razão das etapas
correspondentes 116 a 122 e 126 ou 125 também poderem ser
omitidas.
[0096] Com referência ao esquema de compressão
mencionado, referindo-se à etapa 114, por razões de integralidade, é feita referência ao documento de Schuller et al. descrito na introdução à descrição e, em particular, à divisão IV, cujo teor, com relação à redução de redundância por meio de codificação sem perdas, está incorporada como referência ao presente.
[0097] O seguinte se refere à descrição supramencionada.
Apesar da presente invenção ter sido acima descrita com referência a um esquema especial de codificação de áudio que permite curtos tempos de retardo, a presente invenção pode, evidentemente, também ser aplicada a diferentes codificações de áudio. Como exemplo, seria concebível um esquema de codificação de áudio onde o sinal codificado consistisse dos próprios valores de áudio filtrados e quantizados sem uma redução de redundância a ser feita. De maneira correspondente, também seria concebível fazer a filtragem com seleção de frequência de maneira diferente da descrita
Petição 870180058805, de 06/07/2018, pág. 46/56
41/44 anteriormente, isto é, no lado do codificador com uma função de transferência igual ao inverso do limite de audição e no lado do decodificador com uma função de transferência igual ao limite de audição.
[0098] Além disso, podem ser omitidos os aspectos individuais das configurações acima. Assim, por exemplo, é possível ao reduzir a razão de compressão, transmitir as informações colaterais referentes a cada bloco de áudio, para omitir a interpolação e/ou para sempre transferir os parâmetros nas informações colaterais em blocos de informações colaterais autocontidos e não como diferenças referentes aos blocos de informações colaterais anteriores.
[0099] Além disso, a presente invenção não se limita a sinais de áudio. Também pode ser aplicada a diferentes sinais de informações, como por exemplo, sinais de vídeo que consistem de uma sequência de quadros, isto é, uma sequência de conjuntos de pixels.
[00100] Em qualquer caso, o esquema de codificação de áudio acima provê uma forma para a limitação de taxa de bits em um codificador de áudio com um tempo de retardo muito curto. Os picos de taxa de bits que resultam durante a codificação, dependendo do sinal de áudio, são evitados limitando a faixa de valores de partida do pré-filtro. Como esta corresponde consequentemente à natureza dos sinais de áudio a serem transferidos, que resultam em diferentes altas taxas de bits para a transferência, isto é, sinais de áudio mais complexos que resultam em maiores taxas de bits e os menos complexos que resultam em menores taxas de bits, pode sempre ser encontrado um limite superior para a taxa de bits
Petição 870180058805, de 06/07/2018, pág. 47/56
42/44 da transferência que, por exemplo, geralmente existe em meios de transferência sem fio. A mudança na função da etapa quantizadora acima do limite é um meio adequado para a limitação da taxa de bits no máximo admissível.
[00101] Nas configurações acima, o codificador incluiu um pré-filtro para a conformação do sinal de áudio de maneira adequada, um quantizador com um tamanho de etapa de quantização, seguido por um codificador de entropia. O quantizador gerou valores que também são denominados índices. Em geral, altos índices também significam um maior taxa de bits a eles ligado que, entretanto, tem sido evitado pela limitação (Fig. 7a) ou pelo desbaste (Fig. 7b) da faixa de índices, entretanto, induzindo a possibilidade da deterioração da qualidade de áudio.
[00102] Além disso, deve ser ressaltado o seguinte com relação à configuração anterior. Apesar de ter sido ressaltado anteriormente que o valor limite sempre permanece constante ao ser feita a quantização ou mesmo que a função da etapa de quantização sempre permanece constante, isto é, os problemas gerados no sinal de áudio filtrado são sempre quantizados ou cortados por uma quantização mais grosseira que pode comprometer a qualidade de áudio até um limite audível, é também possível usar somente essas medidas se a complexidade do sinal de áudio assim o requerer, isto é, se a taxa de bits requerida para a codificação ultrapassar a taxa de bits desejada. Nesse caso, além das funções da etapa quantizadora mostradas nas Figs. 7a e 7b, por exemplo, pode ser usada uma com um tamanho de etapa quantizadora constante em toda a faixa de valores possíveis na saída do pré-filtro e o quantizador, por exemplo, respondería a um sinal para usar seja a função da
Petição 870180058805, de 06/07/2018, pág. 48/56
43/44 etapa quantizadora com um tamanho de etapa quantizadora sempre constante ou uma das funções da etapa quantizadora de acordo com as Figs. 7a ou 7b, de maneira que o quantizador podería ser informado pelo sinal para realizar, com pequeno comprometimento da qualidade de áudio, a redução da etapa de quantização acima do valor limite ou corta-la acima do valor limite. De maneira alternativa, o valor limite também podería ser gradualmente reduzido. Nesse caso, podería ser feita a redução do valor limite ao invés da redução de fator da etapa 126. Após uma primeira tentativa de compressão sem a etapa 110, o sinal temporariamente comprimido somente podería ser submetido a uma quantização de valor limite seletivo em uma etapa modificada 126 se a taxa de bits ainda fosse muito alta (118). Em uma outra passagem, os valores de áudio filtrados seriam então quantizados com a função da etapa quantizadora tendo um curso mais nivelado acima do limite de áudio. Poderíam ser feitas outras reduções de taxa de bits na etapa modificada 126, reduzindo o valor limite e, portanto, por outra modificação da função da etapa de quantização.
[00103] Em particular, deve ser ressaltado que, dependendo das circunstâncias, o esquema de codificação de áudio da invenção pode ser implementado em software. A implementação pode ser no meio de armazenamento digital, em particular em disco ou em CD que possua sinais de controle que possam ser lidos eletronicamente, que possam interagir com um sistema de computador programável, de maneira que o método correspondente seja realizado. Em geral, a invenção também está em um produto de programa de computador, que tem um código de programa armazenado em um portador com leitura por máquina para realizar o método da
Petição 870180058805, de 06/07/2018, pág. 49/56
44/44 invenção quando o produto de programa de computador opera em um computador. Colocado de forma diferente, a invenção também pode ser realizada como um programa de computador que tem um código de programa para realizar o método quando o programa de computador opera em um computador.
[00104] Em particular, podem ser implementadas individualmente as etapas do método acima nos blocos do fluxograma ou em grupos de várias em conjunto em rotinas de sub-programas. De maneira alternativa, é evidentemente também possível uma implementação do dispositivo da invenção sob a forma de um circuito integrado quando esses blocos forem, por exemplo, implementados como peças de um circuito individual de um ASIC.
[00105] Em particular, deve ser ressaltado que, dependendo das circunstâncias, o esquema de codificação de áudio da invenção pode ser implementado em software. A implementação pode ser no meio de armazenamento digital, em particular em disco ou em CD que possua sinais de controle que possam ser lidos eletronicamente, que possam interagir com um sistema de computador programável, de maneira que o método correspondente seja realizado. Em geral, a invenção também está em um produto de programa de computador, que tem um código de programa armazenado em um portador com leitura por máquina para realizar o método da invenção quando o produto de programa opera em um computador.
Colocado de forma diferente, a invenção também pode ser realizada como um programa de computador que tem um código de programa para realizar o método quando o programa de computador opera em um computador.
Petição 870180058805, de 06/07/2018, pág. 50/56
1/5

Claims (9)

  1. REIVINDICAÇÕES
    1. Dispositivo para a quantização de um sinal de informações de uma sequência de valores de informações, o sinal de informações sendo um sinal de áudio (12) e os valores de informações sendo valores de áudio, compreendendo:
    meios para a determinação de um limite de audição (20) para um bloco de valores de áudio de uma sequência de valores de áudio;
    meios para o cálculo de uma versão de uma parametrização (24) de um filtro parametrizável, de maneira que sua função de transferência corresponda ao inverso da magnitude do primeiro limite de audição;
    meios para a filtragem seletiva de frequência da sequência de valores de áudio para obter uma sequência de valores de áudio filtrados;
    meios para a quantização (28) dos valores de áudio filtrados para obter uma sequência de valores de áudio quantizados por meio de uma função da etapa quantizadora, que mapeia os valores de áudio filtrados para os valores de áudio
    quantizados e cujo curso é mais inclinado abaixo de um valor das informações limite do que acima de um valor das informações limite; caracterizado pelo fato de que os meios para a
    filtragem seletiva de frequência compreendem:
    meios para a filtragem de um bloco predeterminado de valores de áudio da sequência de valores de áudio com o filtro parametrizável (30) usando uma parametrização predeterminada, dependendo, de uma forma predeterminada da versão da
    Petição 870180058805, de 06/07/2018, pág. 51/56
  2. 2/5 parametrização, de maneira a obter um bloco de valores de áudio filtrados.
    2. Dispositivo de acordo com a reivindicação 1, caracterizado pelo fato de que os meios para a determinação de um limite de audição (20) são formados para ainda determinarem um outro segundo limite de audição para outro segundo bloco de valores de áudio, sendo formados os meios de cálculo (24) para calcularem uma versão de outra segunda parametrização do filtro parametrizável (30), de maneira que sua função de transferência corresponda ao inverso da magnitude do segundo limite de audição, onde os meios para a filtragem seletiva de frequência compreendem:
    meios para a interpolação entre a versão da primeira parametrização e a versão da segunda parametrização, para obter uma versão de uma parametrização interpolada de um valor de áudio predeterminado do bloco predeterminado de valores de áudio;
    e meios para a aplicação da versão da parametrização interpolada no valor de áudio predeterminado do bloco predeterminado de valores de áudio.
  3. 3. Dispositivo de acordo com a reivindicação 2, ainda compreendendo meios (22) para a determinação de um primeiro limite de potência de ruído, dependendo do primeiro limite de mascaramento e um segundo limite de potência de ruído dependendo do segundo limite de mascaramento, e caracterizado pelo fato de que os meios para a filtragem compreendem meios (90) para a interpolação entre o primeiro limite de potência de ruído e o segundo limite de potência de ruído, para obter um limite de potência de ruído interpolado para um valor de áudio
    Petição 870180058805, de 06/07/2018, pág. 52/56
    3/5 predeterminado do bloco predeterminado de valores de áudio, meios (92) para determinar um valor de graduação intermediário dependendo de uma potência de ruído de quantização provocada pela quantização, de acordo com uma regra de quantização predeterminada e o limite de potência de ruído interpolado, os meios (94) para a aplicação do valor de graduação intermediário ao valor de áudio predeterminado, para obter um valor de áudio filtrado graduado.
  4. 4. Dispositivo de acordo com a reivindicação 3, caracterizado pelo fato de que os meios para a interpolação (90) entre o primeiro limite de potência de ruído e o segundo limite de potência de ruído fazem uma interpolação linear.
  5. 5. Dispositivo de acordo com as reivindicações 3 ou 4, caracterizado pelo fato de que os meios para a determinação do valor (92) de graduação intermediário compreendem meios para o cálculo da raiz do quociente do ruído de quantização dividida pelo limite de potência de ruído interpolado.
  6. 6. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que os meios para quantização (28) são formados para fazer a quantização responsiva a um sinal de controle.
  7. 7. Dispositivo de acordo com qualquer uma das reivindicações anteriores, compreendendo ainda meios de compressão (34) sem perdas para a compressão dos valores de áudio filtrados no fluxo de áudio comprimido, caracterizado pelo fato de que os meios de compressão (34) são formados para controlar um taxa de bits do fluxo de áudio comprimido e para enviar o sinal de controle para os meios de quantização (28), no caso em que a taxa de bits é maior do que um valor de controle.
    Petição 870180058805, de 06/07/2018, pág. 53/56
    4/5
  8. 8. Dispositivo de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que a função da etapa quantizadora tem um curso nivelado acima do valor das informações limite, de maneira que os valores de áudio filtrados maiores do que o valor das informações limite são quantizados em um valor máximo de etapa quantizadora.
  9. 9. Método para a quantização de um sinal de informações de uma sequência de valores de informações, o sinal de informações sendo um sinal de áudio (12) e os valores de informações sendo valores de áudio, compreendendo as etapas de:
    filtragem seletiva de frequência da sequência de valores de áudio para obter uma sequência de valores de áudio filtrados;
    quantização dos valores de áudio filtrados para obter uma sequência de valores de áudio quantizados por meio de uma função da etapa quantizadora, que mapeia os valores de áudio filtrados para os valores de áudio quantizados e cujo curso é mais inclinado abaixo do valor das informações limite do que acima de um valor das informações limite;
    determinar um limite de audição para um bloco de valores de áudio; e calcular uma versão de uma parametrização de um filtro parametrizável (30), de maneira que sua função de transferência corresponda ao inverso da magnitude do primeiro limite de audição, caracterizado pelo fato de que a etapa da filtragem seletiva de frequência compreende ainda a etapa de:
    filtrar um bloco predeterminado de valores de
    Petição 870180058805, de 06/07/2018, pág. 54/56
    5/5 áudio da sequência de valores de áudio com o filtro parametrizável (30) usando uma parametrização predeterminada que, de maneira predeterminada depende da versão da parametrização para obter um bloco de valores de áudio filtrados.
    Petição 870180058805, de 06/07/2018, pág. 55/56 ·· ·· • ·
    I' ··
    1/12
    SINAL CODIFICADO
    2/12*
    FIGURA 2 <èú
    3/12 « · *
    ó.À♦ · • ·
    4/12
    Ó3>
    • · • · · · • ·· * · * * » ’ ϊ ··· · ·
    5/12
    ΙΟ
    LL
    ΙΟ <
    Ο
    Ο
    u.
    ίβω '°S ρ
    £8 <Λ
    LU (Λ 'Ο < <>g S LU ' S Η0É < ο -1
    U-Ο ζ ο
    6/12
    ENVIANDO OS DADOS COMPRIMIDOS ·♦ *
    FIGURA 7A
    FIGURA 7B cr
    MAIS ALTA ETAPA DE QUANTIZAÇÃO
    TAMANHO*DA ETAPA;
    VALOR LIMITE
    FAIXA DE ILUSTRAÇÃO DE INDICAÇÃO DO PONTO FLUTUANTE
    8/12“ «·*
    210
    FIGURA 8
    9/12’
    SINAL COMPRIMIDO
    DESCOMPRIMINDO O SINAL COMPRIMIDO
    224
    DADOS DE ÁUDIO QUANTIZED FILTRADOS QUANTIZADOS E INFORMAÇÕES COLATERAIS
    FIGURA 9
    FIGURA 10
    Ut, ío/iS ··· ♦ • · * ·· · • τ • » *·· » * · • * · • *· * . , • * * * · • · *· ··
    902
    906 ιι/ι2'
    908
    904
    . V ' BLOCO0 JL - .....V BLOCO1 n V 20 V a, MO x,(U
    -γ
    BLOCO2
    910
    REDUÇÃO DE IRRELEVÂNCIA \ζ
    912 a#· Μ·)
    DADOS PRINCIPAIS
    INFORMAÇÕES COLATERAIS
    914
    REDUÇÃO DE REDUNDÂNCIA
    V
    SINAL
    CODIFICADO
    FIGURA 12 (TÉCNICA ANTERIOR)
    Το
    12712’ (TÉCNICA ANTERIOR)
BRPI0506627A 2004-02-13 2005-02-10 método e dispositivo para quantizar um sinal de informações BRPI0506627B1 (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004007184A DE102004007184B3 (de) 2004-02-13 2004-02-13 Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
PCT/EP2005/001343 WO2005078703A1 (de) 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals

Publications (2)

Publication Number Publication Date
BRPI0506627A BRPI0506627A (pt) 2007-05-02
BRPI0506627B1 true BRPI0506627B1 (pt) 2018-10-09

Family

ID=34853461

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0506627A BRPI0506627B1 (pt) 2004-02-13 2005-02-10 método e dispositivo para quantizar um sinal de informações

Country Status (16)

Country Link
US (1) US7464027B2 (pt)
EP (1) EP1697929B1 (pt)
JP (1) JP4444295B2 (pt)
KR (1) KR100813193B1 (pt)
CN (1) CN1918630B (pt)
AT (1) ATE377243T1 (pt)
AU (1) AU2005213767B2 (pt)
BR (1) BRPI0506627B1 (pt)
CA (1) CA2555639C (pt)
DE (2) DE102004007184B3 (pt)
ES (1) ES2294685T3 (pt)
HK (1) HK1093814A1 (pt)
IL (1) IL177164A (pt)
NO (1) NO337836B1 (pt)
RU (1) RU2337413C2 (pt)
WO (1) WO2005078703A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) * 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
JP4640020B2 (ja) * 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
EP1852848A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
EP2122615B1 (en) * 2006-10-20 2011-05-11 Dolby Sweden AB Apparatus and method for encoding an information signal
US7823092B1 (en) * 2007-11-23 2010-10-26 Altera Corporation Method and apparatus for implementing a parameterizable filter block with an electronic design automation tool
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
KR102165403B1 (ko) 2014-07-25 2020-10-14 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음향 신호 부호화 장치, 음향 신호 복호 장치, 음향 신호 부호화 방법 및 음향 신호 복호 방법
DE102014220687A1 (de) * 2014-10-13 2016-04-14 Continental Automotive Gmbh Kommunikationsvorrichtung für ein Fahrzeug und Verfahren zum Kommunizieren
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3506912A1 (de) 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
DE3820037A1 (de) 1988-06-13 1989-12-14 Ant Nachrichtentech Bildcodierverfahren und einrichtung
DE3820038A1 (de) * 1988-06-13 1989-12-14 Ant Nachrichtentech Verfahren zur aufbereitung und uebertragung einer bildsequenz
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体
US5581653A (en) * 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE19549621B4 (de) * 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
GB2307833B (en) * 1995-12-01 2000-06-07 Geco As A data compression method and apparatus for seismic data
EP0950238B1 (en) * 1996-07-05 2003-09-10 The Victoria University Of Manchester Speech coding and decoding system
US6370477B1 (en) * 1996-11-22 2002-04-09 Schlumberger Technology Corporation Compression method and apparatus for seismic data
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
KR100440896B1 (ko) * 1998-12-30 2004-09-18 주식회사 대우일렉트로닉스 양자화복호화장치
EP1175670B2 (en) * 1999-04-16 2007-09-19 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
EP1228569A1 (en) 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
WO2002080573A1 (en) * 2001-03-28 2002-10-10 Sony Corporation Quantization apparatus, quantization method, quantization program, and recording medium
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed

Also Published As

Publication number Publication date
CA2555639A1 (en) 2005-08-25
ATE377243T1 (de) 2007-11-15
RU2006132742A (ru) 2008-03-20
CA2555639C (en) 2012-07-10
EP1697929B1 (de) 2007-10-31
EP1697929A1 (de) 2006-09-06
HK1093814A1 (en) 2007-03-09
US20070043557A1 (en) 2007-02-22
DE102004007184B3 (de) 2005-09-22
CN1918630B (zh) 2010-04-14
DE502005001821D1 (de) 2007-12-13
NO337836B1 (no) 2016-06-27
BRPI0506627A (pt) 2007-05-02
IL177164A0 (en) 2006-12-10
KR100813193B1 (ko) 2008-03-13
ES2294685T3 (es) 2008-04-01
AU2005213767A1 (en) 2005-08-25
JP2007522509A (ja) 2007-08-09
AU2005213767B2 (en) 2008-04-10
NO20064091L (no) 2006-11-10
IL177164A (en) 2010-11-30
JP4444295B2 (ja) 2010-03-31
CN1918630A (zh) 2007-02-21
US7464027B2 (en) 2008-12-09
WO2005078703A1 (de) 2005-08-25
KR20060113999A (ko) 2006-11-03
RU2337413C2 (ru) 2008-10-27

Similar Documents

Publication Publication Date Title
BRPI0506627B1 (pt) método e dispositivo para quantizar um sinal de informações
JP4444296B2 (ja) オーディオ符号化
US7383180B2 (en) Constant bitrate media encoding techniques
KR102077308B1 (ko) 메타데이터 구동된 동적 범위 제어
RU2586874C1 (ru) Устройство, способ и компьютерная программа для устранения артефактов амплитудного ограничения
KR101437127B1 (ko) 가중 윈도우들을 사용한 저-지연 변환 코딩
BRPI0506628B1 (pt) codificação de áudio
KR20180134379A (ko) 상부 주파수 대역에서 검출된 피크 스펙트럼 영역을 고려하여 오디오 신호를 부호화하는 오디오 인코더, 오디오 신호를 부호화하는 방법, 및 컴퓨터 프로그램
CN111344784B (zh) 控制编码器和/或解码器中的带宽
MXPA06009144A (en) Audio encoding
MXPA06009110A (en) Method and device for quantizing a data signal
MXPA06009146A (en) Audio coding

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: G10L 19/032 (2013.01), G10L 19/26 (2013.01)

B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B15K Others concerning applications: alteration of classification

Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/032 , G10L 19/26

Ipc: G10L 19/26 (2013.01)

Ipc: G10L 19/26 (2013.01)

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 09/10/2018, OBSERVADAS AS CONDICOES LEGAIS.