BR122021019078B1 - Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata - Google Patents

Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata Download PDF

Info

Publication number
BR122021019078B1
BR122021019078B1 BR122021019078-0A BR122021019078A BR122021019078B1 BR 122021019078 B1 BR122021019078 B1 BR 122021019078B1 BR 122021019078 A BR122021019078 A BR 122021019078A BR 122021019078 B1 BR122021019078 B1 BR 122021019078B1
Authority
BR
Brazil
Prior art keywords
filter bank
signals
synthesis
audio signal
sub
Prior art date
Application number
BR122021019078-0A
Other languages
English (en)
Inventor
Lars Villemoes
Per Ekstrand
Sascha Disch
Frederik Nagel
Stephan Wilde
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V., Dolby International Ab filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority claimed from BR112012022574-0A external-priority patent/BR112012022574B1/pt
Publication of BR122021019078B1 publication Critical patent/BR122021019078B1/pt

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Um aparelho para processar um sinal de áudio de entrada (2300) depende de uma cascata de bancos de filtro, a cascata compreendendo um banco de filtro de síntese (2304) para sintetizar um sinal de áudio intermediário (2306) do sinal de áudio de entrada (2300), o sinal de áudio de entrada sendo representado por uma pluralidade de primeiros sinais de subfaixa (2303) gerados por um banco de filtro de análise (2302), em que um número de canais de banco de filtro do banco de filtro de síntese (2304) é menor do que um número de canais do banco de filtro de análise (2302). O aparelho ainda compreende outro banco de filtro de análise (2307) para gerar uma pluralidade de segundos sinais de subfaixa (2308) do sinal de áudio intermediário (2306), em que o outro banco de filtro de análise tem um número de canais sendo diferente do número de canais do banco de filtro de síntese (2304), de forma que uma taxa de amostragem de um sinal de subfaixa da pluralidade de segundos sinais de subfaixa (2308) seja diferente de uma taxa de amostragem de um primeiro sinal de subfaixa da pluralidade de primeiros sinais de subfaixa (2303).

Description

CAMPO TÉCNICO
[0001] A presente invenção se refere aos sistemas de codificação da fonte de áudio que fazem uso de um método de transposição harmônica para reconstrução de alta frequência (HFR), e para os processadores de efeito digital, por exemplo, os chamados excitadores, onde a geração de distorção harmônica soma luminosidade ao sinal processado, e aos extensores de tempo, onde a duração de um sinal é estendida enquanto mantém o conteúdo espectral do original.
HISTÓRICO DA INVENÇÃO
[0002] Em PCT WO 98/57436 o conceito de transposição foi estabelecido como um método para recriar uma faixa de alta frequência de uma faixa de frequência inferior de um sinal de áudio. Uma economia substancial na taxa de bits pode ser obtida utilizando este conceito na codificação de áudio. Em um sistema de codificação de áudio com base em HFR, um sinal de largura de banda baixa é processado por um codificador de forma de onda central e as frequências mais altas são regeneradas utilizando transposição e informações laterais adicionais da taxa de bits muito baixa que descrevem a forma espectral alvo no lado do codificador. Para taxas de bits baixas, onde a largura de banda do sinal central codificado é estreita, esta se torna cada vez mais importante para recriar uma banda alta com características perceptualmente agradáveis. A transposição harmônica definida em PCT WO 98/57436 realiza muito bem para o material musical complexo em uma situação com baixa frequência cruzada. O princípio de uma transposição harmônica é que um sinusóide com frequência m é mapeado a um sinusóide com frequência Tm onde T > 1 é um número inteiro que define a ordem da transposição. Em contraste, um método de HFR com base na modulação de única faixa lateral (SSB) mapeia um sinusóide com frequência m em um sinusóide com frequência m+Δm onde Δm é uma mudança de frequência fixa. Dado um sinal central com baixa largura de banda, um artefato de toque dissonante pode resultar da transposição SSB.
[0003] Para atingir a melhor qualidade de áudio possível, os métodos HFR harmônica de alta qualidade do estado técnico empregam os bancos de filtro modulados complexos, por exemplo, uma Transformação de Fourier de Curta Duração (STFT), com resolução de alta frequência e um alto grau de sobreamostragem para atingir a qualidade de áudio necessária. A fina resolução é necessária para evitar distorção da intermodulação indesejada que surge do processamento não linear das somas de sinusóides. Com resolução de frequência suficientemente alta, ou seja, subfaixas estreitas, os métodos de alta qualidade têm o objetivo de ter um máximo de um sinusóide em cada subfaixa. Um alto grau de sobreamostragem em tempo é necessário para evitar o tipo alternativo de distorção, e certo grau de sobreamostragem na frequência é necessário para evitar pré-ecos para sinais transitórios. A desvantagem óbvia é que a complexidade computacional pode se tornar alta.
[0004] A transposição harmônica da subfaixa com base no bloco é outro método de HFR para suprimir os produtos de intermodulação, cujo caso um banco de filtro com resolução de frequência grossa e um grau inferior de sobreamostragem é empregado, por exemplo, um banco de QMF multicanal. Neste método, um bloco de tempo das amostras de subfaixa complexa é processado por um modificador de fase comum enquanto a superposição das várias amostras modificadas forma uma amostra de subfaixa de saída. Isto tem o efeito líquido de suprimir os produtos de intermodulação que, por outro lado, ocorreriam quando o sinal de entrada de subfaixa consiste em vários sinusoides. A transposição com base no processamento de subfaixa com base no bloco tem a complexidade computacional muito inferior às transposições de alta qualidade e atinge quase a mesma qualidade para muitos sinais. Entretanto, a complexidade é ainda muito mais alta que para os métodos de HFR com base na SSB trivial, visto que uma pluralidade de bancos de filtro de análise, cada sinal de processamento de diferentes ordens de transposição T, é necessária em uma aplicação típica de HFR para sintetizar a largura de banda necessária. Adicionalmente, uma abordagem comum é adaptar a taxa de amostragem dos sinais de entrada para encaixar os bancos de filtro de análise de um tamanho constante, embora os bancos de filtro processem sinais de diferentes ordens de transposição. Também é comum aplicar os filtros passa-baixo aos sinais de entrada para obter os sinais de saída, processados de diferentes ordens de transposição, com densidades espectrais de energia sem sobreposição.
[0005] O armazenamento ou transmissão dos sinais de áudio geralmente está sujeito às restrições da estrita taxa de bits. No passado, os codificadores eram forçados a reduzir drasticamente a largura de banda de áudio transmitido apenas quando uma taxa de bits muito baixa estava disponível. Atualmente, os codecs de áudio modernos podem codificar sinais de banda ultralarga utilizando os métodos de extensão da largura de banda (BWE) [1-12]. Estes algoritmos dependem de uma representação paramétrica do conteúdo de alta frequência (HF) que é gerado da parte de baixa frequência (LF) do sinal decodificado por meios de transposição à região espectral de HF (“reparação”) e aplicação de um parâmetro acionado pós-processamento. A parte de LF é codificada com qualquer áudio ou codificador de discurso. Por exemplo, os métodos de extensão da largura de banda métodos descritos em [1-4] dependem de uma modulação de banda lateral única (SSB), geralmente também chamada de método de “cópia”, para gerar vários pedaços de HF.
[0006] Recentemente, um novo algoritmo, que emprega um banco de vocoders de fase [15-17] para a geração dos diferentes pedaços, foi apresentado [13] (ver figura 20). Este método foi desenvolvido para evitar a rugosidade auditiva que é geralmente observada em sinais sujeitos à extensão da largura de banda da SSB. Entretanto, visto que o algoritmo de BWE é executado no lado do decodificador de uma corrente de codec, a complexidade computacional é um problema sério. Os métodos da técnica anterior, especialmente HBE com base no vocoder de fase, valorizam uma complexidade computacional muito elevada comparada aos métodos com base em SSB.
[0007] Conforme descrito acima, os esquemas da extensão da largura de banda existentes aplicam apenas um método de reparação em um dado bloco do sinal por vez, seja ele reparação com base na SSB [1-4] ou reparação com base no vocoder de HBE [15- 17]. Adicionalmente, os codificadores modernos de áudio [19-20] oferecem a possibilidade de comutar o método de reparação globalmente em uma base do bloco de tempo entre os esquemas de reparação alternativa.
[0008] A reparação da cópia da SSB introduz aspereza indesejada ao sinal de áudio, mas é computacionalmente simples e preserva o tempo envolvente de transitórios. Além disso, a complexidade computacional é significativamente elevada sobre o método de cópia de SSB muito simples.
SUMÁRIO DA INVENÇÃO
[0009] Quando chega a uma redução de complexidade, as taxas de amostragem são de importância particular. Isto é devido ao fato de que uma alta taxa de amostragem significa uma alta complexidade e uma baixa taxa de amostragem geralmente significa baixa complexidade devido ao número reduzido de operações necessárias. Por outro lado, entretanto, a situação nas aplicações de extensão da largura de banda é particularmente de forma que a taxa de amostragem do sinal de saída do codificador central tipicamente será tão baixa que esta taxa de amostragem é muito baixa para um sinal da largura de banda total. Indicado de forma diferente, quando a taxa de amostragem do sinal de saída do decodificador é, por exemplo, 2 ou 2,5 vezes a frequência máxima do sinal de saída do codificador central, então uma extensão da largura de banda, por exemplo, por um fator de 2 significa que uma operação de elevação da taxa de amostragem é necessária de forma que a taxa de amostragem do sinal estendido da largura de banda seja muito alta que a amostragem possa “cobrir” os componentes de alta frequência gerados adicionalmente.
[0010] Adicionalmente, os bancos de filtro como bancos de filtro de análise e bancos de filtro de síntese são responsáveis por uma quantidade considerável de operações de processamento. Assim, o tamanho dos bancos de filtro, ou seja, se o banco de filtro for um banco de filtro com 32 canais, um banco de filtro com 64 canais ou mesmo um banco de filtro com um número de canais mais alto influenciará significativamente na complexidade do algoritmo de processamento de áudio. Geralmente, pode-se dizer que um alto número de canais de banco de filtro requer mais operações de processamento e, desta forma, complexidade mais alta que um pequeno número de canais de banco de filtro. Tendo em conta esta situação, nas aplicações de extensão da largura de banda e também em outras aplicações de processamento de áudio, onde diferentes taxas de amostragem são um problema, como em aplicações como vocoder ou quaisquer outras aplicações de efeito de áudio, há uma independência específica entre complexidade e taxa de amostragem ou largura de banda de áudio, que significa que as operações para elevação da taxa de amostragem ou filtragem de subfaixa podem melhorar drasticamente a complexidade sem especificamente influenciar a qualidade do áudio em um bom sentido quando as ferramentas erradas ou algoritmos são escolhidos para as operações específicas.
[0011] A presente invenção tem como objetivo prover um conceito melhorado de processamento de áudio, que permite uma baixa complexidade no processamento por um lado e uma boa qualidade de áudio por outro lado.
[0012] Este objetivo é obtido por um aparelho para processar um sinal de áudio de entrada, de acordo com a reivindicação 1 ou 18, um método para processar um sinal de áudio de entrada, de acordo com a reivindicação 20 ou 21, ou um programa de computador, de acordo com a reivindicação 22.
[0013] As realizações da presente invenção dependem de uma colocação específica em cascata dos bancos de filtro de análise e/o dos bancos de filtro de síntese para obter uma baixa complexidade de reamostragem sem sacrificar a qualidade do áudio. Em uma realização, um aparelho para processar um sinal de áudio de entrada compreende um banco de filtro de síntese para sintetizar um sinal de áudio intermediário a partir do sinal de áudio de entrada, onde o sinal de áudio de entrada é representado por uma pluralidade de primeiros sinais de subfaixa gerados por um banco de filtro de análise colocado na direção do processamento antes do banco de filtro de síntese, em que um número de canais de banco de filtro do banco de filtro de síntese é menor que um número de canais do banco de filtro de análise. O sinal intermediário é ainda processado por outro banco de filtro de análise para gerar uma pluralidade de segundos sinais de subfaixa do sinal de áudio intermediário, em que o outro banco de filtro de análise tem um número de canais sendo diferentes do número de canais do banco de filtro de síntese de forma que uma taxa de amostragem de um sinal de subfaixa da pluralidade de sinais de subfaixa seja diferente de uma taxa de amostragem de um primeiro sinal de subfaixa da pluralidade de primeiros sinais de subfaixa gerados pelo banco de filtro de análise.
[0014] A cascata de um banco de filtro de síntese e outro banco de filtro de análise subsequentemente conectado provê uma conversão da taxa de amostragem e adicionalmente uma modulação da parte da largura de banda do sinal de áudio de entrada original que foi inserido ao banco de filtro de síntese em uma banda base. Este sinal intermediário de tempo, que agora foi extraído do sinal de áudio de entrada original que pode, por exemplo, ser um sinal de saída de um decodificador central de um esquema da extensão da largura de banda, é agora representado preferivelmente como um sinal amostrado criticamente modulado à banda base, e foi visto que esta representação, ou seja, o sinal de saída amostrado novamente, quando processado por outro banco de filtro de análise para obter uma representação da subfaixa permite um processamento de baixa complexidade de outras operações de processamento que podem ou não ocorrer e que podem, por exemplo, ser operações de processamento relacionadas à extensão da largura de banda como operações de subfaixa não lineares seguidas pelo processamento de reconstrução de alta frequência e por uma mistura das subfaixas no banco de filtro de síntese final.
[0015] A presente aplicação provê diferentes aspectos de aparelhos, métodos ou programas de computador para processar os sinais de áudio no contexto da extensão da largura de banda e no contexto de outras aplicações de áudio, que não estão relacionadas à extensão da largura de banda. As características dos aspectos individuais subsequentemente descritos e reivindicados podem ser parcialmente ou completamente combinadas, mas podem também ser utilizadas separadamente uma da outra, visto que os aspectos individuais já provêm vantagens com relação à qualidade perceptual, complexidade computacional e recursos de processador/memória quando implementados em um sistema de computador ou microprocessador.
[0016] As realizações provêm um método para reduzir a complexidade computacional de um método de HFR harmônica com base no bloco de subfaixa por meios de filtragem eficiente e conversão da taxa de amostragem dos sinais de entrada aos estágios de análise do banco de filtro de HFR. Ainda, os filtros passa-baixo aplicados aos sinais de entrada podem ser mostrados como obsoletos em um transposição com base no bloco de subfaixa.
[0017] As presentes realizações ajudam a reduzir a complexidade computacional da transposição harmônica da subfaixa com base no bloco implementando eficientemente várias ordens da transposição com base no bloco de subfaixa na estrutura de um único par de bancos de filtro de análise e de síntese. Dependendo da qualidade perceptual versus o compromisso da complexidade computacional, apenas um subconjunto adequado de ordens ou todas as ordens de transposição podem ser realizados coletivamente dentro de um par do banco de filtro. Além disso, um esquema de transposição combinada onde apenas certas ordens de transposição são calculadas diretamente em que a largura de banda restante é preenchida pela reprodução de ordens de transposição disponíveis, ou seja, previamente calculadas, (por exemplo, 2a ordem) e/ou a largura de banda codificada central. Neste caso, a reparação pode ser realizada utilizando cada combinação concebível de faixas de fonte disponíveis para reprodução.
[0018] Adicionalmente, as realizações provêm um método para melhorar os métodos de HFR harmônica de alta qualidade bem como os métodos de HFR harmônica com base no bloco de subfaixa por meios do alinhamento espectral das ferramentas de HFR. Em particular, o desempenho elevado é obtido pelo alinhamento das bordas espectrais dos sinais gerados pela HFR às bordas espectrais da tabela de frequência do ajuste envolvente. Ainda, as bordas espectrais da ferramenta limitadora são, pelo mesmo princípio, alinhadas às bordas espectrais dos sinais gerados pela HFR.
[0019] Outras realizações são configuradas para melhorar a qualidade perceptual de transitórios e ao mesmo tempo reduzindo a complexidade computacional, por exemplo, pela aplicação de um esquema de reparação que aplica uma reparação misturada que consiste na reparação harmônica e reparação de cópia.
[0020] Em realizações específicas, os bancos de filtro individuais da estrutura do banco de filtro em cascata são bancos de filtro de espelho em quadratura (QMF), que depende de um filtro passa-baixo protótipo ou janela modulada utilizando um conjunto de frequências de modulação que definem as frequências centrais dos canais de banco de filtro. Preferivelmente, todas as funções da janela e filtros protótipos dependem uma da outra de forma que os filtros dos bancos de filtro com diferentes tamanhos (canais do banco de filtro) dependem um do outro também. Preferivelmente, o maior banco de filtro em uma estrutura em cascata de bancos de filtro compreendendo, em realizações, um primeiro banco de filtro de análise, um banco de filtro subsequentemente conectado, outro banco de filtro de análise, e em algum estado posterior de processamento um banco de filtro de síntese final, tem uma resposta da função de janela ou filtro de protótipo tendo um determinado número de coeficientes de função de janela ou filtro de protótipo. Os bancos de filtro com tamanho menor são versões subamostradas desta função de janela, que significa que as funções de janela para os outros bancos de filtro são versões subamostradas da “grande” função de janela. Por exemplo, se um banco de filtro tem a metade do tamanho do grande banco de filtro, então a função de janela tem metade do número de coeficientes, e os coeficientes dos bancos de filtro com tamanho menor são derivados pela subamostragem. Nesta situação, a subamostragem significa que, por exemplo, a cada segundo o coeficiente do filtro é considerado para o menor banco de filtro tendo metade do tamanho. Entretanto, quando há outras relações entre os tamanhos do banco de filtro que não são valores de números inteiros, um determinado tipo de interpolação dos coeficientes da janela é realizado de forma que no final da janela do menor banco de filtro seja novamente uma versão subamostrada da janela do maior.
[0021] As realizações da presente invenção são particularmente úteis em situações onde apenas uma parte do sinal de áudio de entrada é necessária para mais processamento, e esta situação particularmente ocorre no contexto da extensão da largura de banda harmônica. Neste contexto, as operações de processamento do tipo vocoder são particularmente preferidas.
[0022] É uma vantagem das realizações que as realizações provêm uma complexidade inferior para uma transposição de QMF pelas operações eficientes de domínio de tempo e frequência e uma qualidade do áudio melhorada para reprodução da banda espectral harmônica com base em QMF e DFT utilizando o alinhamento espectral.
[0023] As realizações se referem aos sistemas de codificação da fonte de áudio que empregam, por exemplo, um método de transposição harmônica da subfaixa com base no bloco para reconstrução de alta frequência (HFR), e para processadores de efeito digital, por exemplo, os chamados excitadores, onde a geração de distorção harmônica soma luminosidade ao sinal processado, e aos extensores de tempo, onde a duração de um sinal é estendida enquanto mantém o conteúdo espectral do original. As realizações provêm um método para reduzir a complexidade computacional de um método de HFR harmônica com base no bloco de subfaixa por meios da filtragem eficiente e da conversão da taxa de amostragem dos sinais de entrada antes dos estágios de análise do banco de filtro de HFR. Ainda, as realizações mostram que os filtros passa-baixo convencionais aplicados aos sinais de entrada são obsoletos em um sistema de HFR do bloco de subfaixa. Adicionalmente, as realizações provêm um método para melhorar os métodos de HFR harmônica de alta qualidade bem como os métodos de HFR harmônica com base no bloco de subfaixa por meios do alinhamento espectral das ferramentas de HFR. Em particular, as realizações ensinam como o desempenho elevado é obtido pelo alinhamento das bordas espectrais dos sinais gerados pela HFR às bordas espectrais da tabela de frequência do ajuste envolvente. Ainda, as bordas espectrais da ferramenta limitadora são pelo mesmo princípio alinhado às bordas espectrais dos sinais gerados pela HFR.
BREVE DESCRIÇÃO DOS DESENHOS
[0024] A presente invenção agora será descrita em forma de exemplos ilustrativos, não limitando o escopo ou espírito da invenção, com referência aos desenhos anexos, nos quais:
[0025] A figura 1 ilustra a operação de uma transposição com base no bloco utilizando ordens de transposição de 2, 3 e 4 em uma estrutura do decodificador melhorada de HFR;
[0026] A figura 2 ilustra a operação das unidades de extensão da subfaixa não linear na figura 1;
[0027] A figura 3 ilustra uma implementação eficiente da transposição com base no bloco da figura 1, onde os reamostradores e filtros passa-baixo precedentes do banco de filtros de análise de HFR são implementados utilizando reamostradores de domínio de tempo multitaxa e filtros passa-baixo com base em QMF;
[0028] A figura 4 ilustra um exemplo de blocos em construção para uma implementação eficiente de um reamostrador de domínio de tempo multitaxa da figura 3;
[0029] A figura 5 ilustra o efeito em um sinal processado exemplar pelos diferentes blocos da figura 4 para uma ordem de transposição de 2;
[0030] A figura 6 ilustra uma implementação eficiente da transposição com base no bloco da figura 1, onde os reamostradores e filtros passa-baixo precedentes do banco de filtros de análise de HFR são recolocados pelo pequeno banco de filtros de síntese subamostrado operando em subfaixas selecionadas de um banco de filtro de análise de 32-faixas;
[0031] A figura 7 ilustra o efeito em um sinal processado exemplar por um banco de filtro de síntese subamostrado da figura 6 para uma ordem de transposição de 2;
[0032] A figura 8 ilustra os blocos em implementação de um eficiente redutor da taxa de amostragem de domínio de tempo multitaxa de um fator 2;
[0033] A figura 9 ilustra os blocos em implementação de um eficiente redutor da taxa de amostragem de domínio de tempo multitaxa de um fator 3/2;
[0034] A figura 10 ilustra o alinhamento das bordas espectrais dos sinais de transposição de HFR às bordas das faixas de frequência de ajuste envolvente em um codificador melhorado de HFR;
[0035] A figura 11 ilustra um cenário onde os artefatos emergem devido às bordas espectrais desalinhadas dos sinais de transposição de HFR;
[0036] A figura 12 ilustra um cenário onde os artefatos da figura 11 são evitados como um resultado de bordas espectrais alinhadas dos sinais de transposição de HFR;
[0037] A figura 13 ilustra a adaptação das bordas espectrais na ferramenta limitadora às bordas espectrais dos sinais de transposição de HFR;
[0038] A figura 14 ilustra o princípio de transposição harmônica da subfaixa com base no bloco;
[0039] A figura 15 ilustra um exemplo cenário para a aplicação de transposição com base no bloco de subfaixa utilizando várias ordens de transposição em um codec de áudio melhorado de HFR;
[0040] A figura 16 ilustra um cenário exemplar da técnica anterior para a operação de uma transposição de ordem múltipla com base no bloco de subfaixa que aplica um banco de filtro de análise separado por ordem de transposição;
[0041] A figura 17 ilustra um cenário do exemplo inventivo para a eficiente operação de uma transposição de ordem múltipla com base no bloco de subfaixa aplicando um único banco de filtro de análise de QMF de 64 faixas;
[0042] A figura 18 ilustra outro exemplo para formar um amplo processamento com o sinal de subfaixa;
[0043] A figura 19 ilustra uma reparação da modulação da banda lateral única (SSB);
[0044] A figura 20 ilustra uma reparação da extensão da largura de banda harmônica (HBE);
[0045] A figura 21 ilustra uma reparação misturada, onde a primeira reparação é gerada pela propagação de frequência e a segunda recuperação é gerada por uma cópia de SSB de uma parte de baixa frequência;
[0046] A figura 22 ilustra uma reparação alternativa misturada utilizando a primeira reparação de HBE para uma operação de cópia de SSB para gerar uma segunda recuperação;
[0047] A figura 23 ilustra uma estrutura em cascata preferida dos bancos de filtro de análise e de síntese;
[0048] A figura 24a ilustra uma implementação preferida do pequeno banco de filtro de síntese da figura 23;
[0049] A figura 24b ilustra uma implementação preferida do outro banco de filtro de análise da figura 23;
[0050] A figura 25a ilustra visões gerais de certos bancos de filtro de análise e de síntese de ISO/IEC 14496-3: 2005(E), e particularmente uma implementação de um banco de filtro de análise que pode ser utilizado para o banco de filtro de análise da figura 23 e uma implementação de um banco de filtro de síntese que pode ser utilizado para o banco de filtro de síntese final da figura 23;
[0051] A figura 25b ilustra uma implementação como um fluxograma do banco de filtro de análise da figura 25a;
[0052] A figura 25c ilustra uma implementação preferida do banco de filtro de síntese da figura 25a;
[0053] A figura 26 ilustra uma visão geral da estrutura no contexto do processamento de extensão da largura de banda; e
[0054] A figura 27 ilustra uma implementação preferida de um processamento da saída dos sinais de subfaixa pelo outro banco de filtro de análise da figura 23.
BREVE DESCRIÇÃO DOS DESENHOS
[0055] As realizações descritas abaixo são meramente ilustrativas e podem prover uma complexidade inferior de uma transposição de QMF por operações eficientes de domínio de tempo e frequência, e qualidade de áudio melhorada de SBR harmônica com base em QMF e DFT pelo alinhamento espectral. É entendido que as modificações e variações das disposições e os detalhes descritos aqui serão aparentes aos técnicos no assunto. É intenção, desta forma, estar limitado apenas pelo escopo das próximas reivindicações da patente e não pelos detalhes específicos apresentados em forma de descrição e explicação das realizações aqui.
[0056] A figura 23 ilustra a implementação preferida do aparelho para processar um sinal de áudio de entrada, onde o sinal de áudio de entrada pode ser um sinal de entrada de domínio de tempo em linha 2300 emitido por, por exemplo, um decodificador de áudio central 2301. O sinal de áudio de entrada é inserido em um primeiro banco de filtro de análise 2302 que é, por exemplo, um banco de filtro de análise tendo M canais. Particularmente, o banco de filtro de análise 2302 desta forma emite M sinais de subfaixa 2303, que têm uma taxa de amostragem fS = fS/M. Isto significa que o banco de filtro de análise é um banco de filtro de análise criticamente amostrado. Isto significa que o banco de filtro de análise 2302 provê, para cada bloco de M amostras de entrada em linha 2300 uma única amostra para cada canal de subfaixa. Preferivelmente, o banco de filtro de análise 2302 é um banco de filtro modulado complexo que significa que cada amostra de subfaixa tem uma magnitude e uma fase ou equivalentemente uma parte real e uma parte imaginária. Assim, o sinal de áudio de entrada em linha 2300 é representado por uma pluralidade de primeiros sinais de subfaixa 2303 que são gerados pelo banco de filtro de análise 2302.
[0057] Um subconjunto de todos os primeiros sinais de subfaixa é inserido em um banco de filtro de síntese 2304. O banco de filtro de síntese 2304 tem canais Ms, onde Ms é menor que M. Assim, nem todos os sinais de subfaixa gerados pelo banco de filtro 2302 são inseridos ao banco de filtro de síntese 2304, mas apenas um subconjunto, ou seja, uma determinada quantidade menor de canais conforme indicado por 2305. Na figura 23 da realização, o subconjunto 2305 protege uma determinada largura de banda intermediária, mas de modo alternativo, o subconjunto também pode proteger uma largura de banda começando com o canal do banco de filtro 1 do banco de filtro 2302 até um canal tendo um número de canal menor que M, ou de modo alternativo, o subconjunto 2305 também pode proteger um grupo de sinais de subfaixa alinhados com o canal M mais alto e estendido a um canal inferior tendo um número de canal mais alto que o número de canal 1. De modo alternativo, a indexação do canal pode ser iniciada com zero dependendo da notificação utilizada atualmente. Preferivelmente, entretanto, para as operações de extensão da largura de banda uma determinada largura de banda intermediária representada pelo grupo de sinais de subfaixa indicados em 2305 é inserida ao banco de filtro de síntese 2304.
[0058] Os outros canais que não pertencem ao grupo 2305 não são inseridos ao banco de filtro de síntese 2304. O banco de filtro de síntese 2304 gera um sinal de áudio intermediário 2306, que tem uma taxa de amostragem igual a fS • MS/M. Visto que MS é menor que M, a taxa de amostragem do sinal intermediário 2306 será menor que a taxa de amostragem do sinal de áudio de entrada em linha 2300. Desta forma, o sinal intermediário 2306 representa um sinal subamostrado e demodulado correspondente ao sinal da largura de banda representado pelas subfaixas 2305, onde o sinal é demodulado à banda base, visto que o canal mais baixo do grupo 2305 é inserido ao canal 1 do banco de filtro de síntese Ms e o canal mais alto do bloco 2305 é inserido à entrada mais alta do bloco 2304, longe de algumas operações de preenchimento zero para o canal mais baixo ou o mais alto para evitar problemas de aliasing nas bordas do subconjunto 2305. O aparelho para processar um sinal de áudio de entrada ainda compreende outro banco de filtro de análise 2307 para analisar o sinal intermediário 2306, e o outro banco de filtro de análise tem canais MA, onde MA é diferente de MS e preferivelmente é maior que MS. Quando MA é maior que Ms, então a taxa de amostragem dos sinais de subfaixa emitidos pelo outro banco de filtro de análise 2307 e indicados em 2308 será mais baixa que a taxa de amostragem de um sinal de subfaixa 2303. Entretanto, quando MA for menor que MS, então a taxa de amostragem de um sinal de subfaixa 2308 será mais alta que uma taxa de amostragem de um sinal de subfaixa da pluralidade de primeiros sinais de subfaixa 2303.
[0059] Desta forma, a cascata dos bancos de filtro 2304 e 2307 (e preferivelmente 2302) proveem a elevação da taxa de amostragem muito eficiente e operações de redução ou elevação da taxa de amostragem de alta qualidade ou geralmente uma ferramenta de processamento de reamostragem muito eficiente. A pluralidade de segundos sinais de subfaixa 2308 é preferivelmente ainda processada em um processador 2309 que realiza o processamento com os dados reamostrados pela cascata de bancos de filtro 2304, 2307 (e preferivelmente 2302). Adicionalmente, é preferido que o bloco 2309 também realize uma operação de elevação da taxa de amostragem para as operações de processamento da extensão da largura de banda de forma que no final as subfaixas emitidas pelo bloco 2309 estejam na mesma taxa de amostragem que as subfaixas emitidas pelo bloco 2302. Então, em uma aplicação do processamento de extensão da largura de banda, estas subfaixas são inseridas juntas com as subfaixas adicionais indicadas em 2310, que são preferivelmente as subfaixas da faixa baixa como, por exemplo, geradas pelo banco de filtro de análise 2302 em um banco de filtro de síntese 2311, que finalmente provê um sinal de domínio de tempo processado, por exemplo, um sinal estendido da largura de banda tendo uma taxa de amostragem 2fS. Esta taxa de amostragem emitida pelo bloco 2311 é nesta realização 2 vezes a taxa de amostragem do sinal em linha 2300, e esta taxa de amostragem emitida pelo bloco 2311 é grande o suficiente de forma que a largura de banda adicional gerada pelo processamento no bloco 2309 possa ser representada no sinal de domínio de tempo processado com alta qualidade do áudio.
[0060] Dependendo da determinada aplicação da presente invenção dos bancos de filtro em cascata, o banco de filtro 2302 pode estar em um dispositivo separado e um aparelho para processar um sinal de áudio de entrada pode apenas compreender o banco de filtro de síntese 2304 e o outro banco de filtro de análise 2307. Indicado de forma diferente, o banco de filtro de análise 2302 pode ser distribuído separadamente de um “pós”-processador compreendendo blocos 2304, 2307 e, dependendo da implementação, os blocos 2309 e 2311, também.
[0061] Em outras realizações, a aplicação da presente invenção que implementa ao bancos de filtro em cascata pode ser diferente em que um determinado dispositivo compreende o banco de filtro de análise 2302 e o menor banco de filtro de síntese 2304, e o sinal intermediário é provido a um diferente processador distribuído por um diferente distribuidor ou através de um diferente canal de distribuição. Então, a combinação do banco de filtro de análise 2302 e o menor banco de filtro de síntese 2304 representa uma forma muito eficiente de redução da taxa de amostragem e ao mesmo tempo a demodulação do sinal da largura de banda representada pelo subconjunto 2305 à banda base. Esta redução da taxa de amostragem e a demodulação à banda base foi realizada sem qualquer perda na qualidade do áudio, e particularmente sem qualquer perda na informação do áudio e desta forma é um processamento de alta qualidade.
[0062] A tabela na figura 23 ilustra determinados números exemplares para diferentes dispositivos. Preferivelmente, o banco de filtro de análise 2302 tem 32 canais, o banco de filtro de síntese tem 12 canais, o outro banco de filtro de análise tem 2 vezes os canais do banco de filtro de síntese, como 24 canais, e o banco de filtro de síntese final 2311 tem 64 canais. Geralmente indicado, o número de canais no banco de filtro de análise 2302 é grande, o número de canais no banco de filtro de síntese 2304 é pequeno, o número de canais no outro banco de filtro de análise 2307 é médio e o número de canais no banco de filtro de síntese 2311 é muito grande. As taxas de amostragem dos sinais de subfaixa emitidos pelo banco de filtro de análise 2302 é fS/M. O sinal intermediário tem uma taxa de amostragem fS • MS/M. Os canais de subfaixa do outro banco de filtro de análise indicados em 2308 têm uma taxa de amostragem de fS • MS/(M • MA) , e o banco de filtro de síntese 2311 provê um sinal de saída tendo uma taxa de amostragem de 2fS, quando o processamento no bloco 2309 dobra a taxa de amostragem. Entretanto, quando o processamento no bloco 2309 não dobra a taxa de amostragem, então a saída taxa de amostragem emitida pelo banco de filtro de síntese será correspondentemente menor. Subsequentemente, outras realizações preferidas relacionadas a presente invenção são discutidas.
[0063] A figura 14 ilustra o princípio da transposição com base no bloco de subfaixa. O sinal do domínio de tempo de entrada é inserido a um banco de filtro de análise 1401 que provê uma grande variedade de sinais de subfaixa com valor complexo. Estes são inseridos à unidade de processamento da subfaixa 1402. A grande variedade de subfaixas de saída com valor complexo é inserido ao banco de filtro de síntese 1403, que por sua vez emite o sinal de domínio de tempo modificado. A unidade de processamento da subfaixa 1402 realiza operações de processamento não linear da subfaixa com base no bloco de forma que o sinal de domínio de tempo modificado seja uma versão transposta do sinal de entrada correspondente a uma ordem de transposição T > 1 . O conceito de um processamento da subfaixa com base no bloco é definido compreendendo operações não lineares nos blocos de mais que uma amostra de subfaixa por vez, onde os blocos subsequentes estão em janelas e sobrepostos adicionados para gerar os sinais de saída de subfaixa.
[0064] Os bancos de filtro 1401 e 1403 podem ser de qualquer tipo modulado exponencial complexo como QMF ou DFT em janela. Eles podem ser igual ou diferentemente empilhados na modulação e podem ser definidos de uma ampla faixa de filtros de protótipos ou janelas. É importante conhecer o quociente Δfs / ΔfA dos dois parâmetros do banco de filtro, medido em unidades físicas.
[0065] ΔfA : o espaçamento da frequência da subfaixa do banco de filtro de análise 1401;
[0066] Δfs : o espaçamento da frequência da subfaixa do banco de filtro de síntese 1403.
[0067] Para a configuração do processamento da subfaixa 1402 é necessário localizar a correspondência entre os índices da subfaixa fonte e alvo. É observado que uma sinusoide de entrada da frequência física Q resultará em uma contribuição principal ocorrendo nas subfaixas de entrada com índice n ~Q/ΔfA . Uma sinusoide de saída da frequência física desejada transposta T-Q resultará da inserção da subfaixa da síntese com índice m =T-Q/Δfs . Assim, os valores do índice de subfaixa fonte apropriados do processamento da subfaixa para um determinado índice de subfaixa alvo m devem obedecer
Figure img0001
[0068] A figura 15 ilustra um cenário exemplar para a aplicação de transposição com base no bloco de subfaixa utilizando várias ordens da transposição em um codec de áudio melhorado de HFR. Um fluxo de dados transmitido é recebido no decodificador central 1501, que provê um sinal central decodificado da baixa largura de banda em uma frequência de amostragem fs. A baixa frequência é reamostrada à frequência de amostragem de saída 2fs por meios de um banco de análise de QMF de 32 faixas complexo modulado 1502 seguido por um banco de síntese de QMF de 64 faixas (QMF inverso) 1505. Os dois bancos de filtro 1502 e 1505 têm os mesmos parâmetros de resolução física ΔfS = ΔfA e a unidade de processamento de HFR 1504 simplesmente deixa através das subfaixas inferiores não modificadas correspondentes ao baixo sinal da largura de banda central. O conteúdo de alta frequência do sinal de saída é obtido pela inserção das subfaixas mais altas do banco de síntese de QMF de 64 faixas 1505 com as faixas de saída da múltipla unidade de transposição 1503, sujeito à forma espectral e modificação realizada pela unidade de processamento de HFR 1504. A múltipla transposição 1503 considera como entrada o sinal central decodificado e emite uma grande variedade de sinais de subfaixa que representa a análise de 64 faixas de QMF de uma superposição ou combinação de vários componentes transpostos. O objetivo é que se o processamento de HFR é desviado, cada componente corresponde a uma transposição física do número inteiro do sinal central, ( T = 2,3,K).
[0069] A figura 16 ilustra um cenário exemplar da técnica anterior para a operação de uma transposição de ordem múltipla com base no bloco de subfaixa 1603 aplicando um banco de filtro de análise separado por ordem de transposição. Aqui três ordens de transposição T = 2,3,4 serão produzidas e administradas no domínio de uma QMF de 64 faixas operando na taxa de amostragem de saída 2fs. A unidade de união 1604 simplesmente seleciona e combina as subfaixas relevantes de cada ramificação do fator de transposição em uma única grande variedade de subfaixas de QMF a ser inseridas na unidade de processamento de HFR.
[0070] Considere primeiro o caso T = 2 . O objetivo é especificamente que a corrente de processamento de uma análise de QMF de 64 faixas 1602-2, uma unidade de processamento da subfaixa 1603-2, e uma síntese de QMF de 64 faixas 1505 resulta em uma transposição física de T =2 . A identificação destes três blocos com 1401, 1402 e 1403 da figura 14, um considera que e ΔfS IΔfA = 2 de forma que (1) resulta na especificação para 1603-2 que a correspondência entre as subfaixas fonte n e alvo m é determinada por n=m .
[0071] Para o caso T = 3 , o sistema exemplar inclui um conversor da taxa de amostragem 1601-3 que converte a taxa de amostragem baixa de entrada por um fator 3/2 de fs a 2fs/3. O objetivo é especificamente que a corrente do processamento da análise de QMF de 64 faixas 1602-3, a unidade de processamento da subfaixa 1603-3, e a síntese de QMF de 64 faixas 1505 resulta em uma transposição física de T = 3 . A identificação destes três blocos com 1401, 1402 e 1403 da figura 14, um considera devido à reamostragem que ΔfS IΔfA = 3 de forma que (1) provê a especificação para 1603-3 que a correspondência entre as subfaixas fonte n e subfaixas alvo m é novamente determinada por n = m .
[0072] Para o caso T = 4 , o sistema exemplar inclui um conversor da taxa de amostragem 1601-4 que converte a taxa de amostragem baixa de entrada por um fator dois de fs a fs/2. O objetivo é especificamente que a corrente do processamento da análise de QMF de 64 faixas 1602-4, a unidade de processamento da subfaixa 1603-4, e a síntese de QMF de 64 faixas 1505 resulta em uma transposição física de T = 4 . A identificação destes três blocos com 1401, 1402 e 1403 da figura 14, um considera devido à reamostragem que ΔfS IΔfA = 4 de forma que (1) provê a especificação para 1603-4 que a correspondência entre as subfaixas fonte n e subfaixas alvo m também é dada por n = m .
[0073] A figura 17 ilustra um cenário do exemplo inventivo para a eficiente operação de uma transposição de ordem múltipla com base no bloco de subfaixa aplicando um único banco de filtro de análise QMF de 64 faixas. De fato, o uso de três bancos de análise de QMF separados e dois conversores da taxa de amostragem na figura 16 resulta em uma complexidade computacional relativamente elevada, bem como algumas desvantagens de implementação para o processamento com base na estrutura devido à conversão da taxa de amostragem 1601-3. As realizações atuais ensinam substituir as duas ramificações 1601-3 ^ 1602-3 ^ 1603-3 e 1601-4 ^ 1602-4 ^ 1603-4 pelo processamento da subfaixa 1703-3 e 1703-4, respectivamente, em que a ramificação 1602-2 ^ 1603-2 é mantida inalterada comparada à figura 16. Todas as três ordens de transposição agora terão que ser realizadas em um domínio do banco de filtro com referência à figura 14, onde ΔfS IΔfA = 2 . Para o caso T =3 , a especificação para 1703-3 dada por (1) é que a correspondência entre as subfaixas fonte n e as subfaixas alvo m é dada por n ~ 2 m I3 . Para o caso T = 4, a especificação para 1703-4 dada por (1) é que a correspondência entre as subfaixas fonte n e as subfaixas alvo m é dada por n ~ 2m . Para reduzir mais a complexidade, algumas ordens de transposição podem ser geradas pela cópia das ordens de transposição já calculadas ou a saída decodificador central.
[0074] A figura 1 ilustra a operação de uma transposição com base no bloco de subfaixa utilizando ordens de transposição de 2, 3 e 4 em uma estrutura do decodificador melhorada de HFR, como SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects - Parte 3: Audio]”. O fluxo de dados é decodificado ao domínio de tempo pelo decodificador central 101 e passado ao módulo de HFR 103, que gera um sinal de alta frequência do sinal central da banda base. Após a geração, o sinal gerado por HFR é dinamicamente ajustado para corresponder ao sinal original o mais próximo possível por meios das informações transmitidas adicionais. Este ajuste é realizado pelo processador de HFR 105 nos sinais de subfaixa, obtidos a partir de um ou vários bancos de análise de QMF. Um cenário típico é onde o decodificador central opera em um sinal de domínio de tempo amostrado em metade da frequência dos sinais de entrada e saída, ou seja, o módulo do decodificador de HFR reamostrará efetivamente o sinal central a duas vezes a frequência de amostragem. Esta conversão da taxa de amostra é geralmente obtida pela primeira etapa de filtragem do sinal do codificador central por meios de um banco de análise de QMF de 32 faixas 102. As subfaixas abaixo chamadas de frequência cruzada, ou seja, o subconjunto mais baixo das 32 subfaixas que contém toda a energia do sinal do codificador central é combinado com o conjunto de subfaixas que carregam o sinal gerado por HFR. Geralmente, o número das subfaixas combinadas é 64, que, após filtrar através do banco de síntese de QMF 106, resulta em um sinal convertido da taxa de amostra do codificador central combinado com a saída do módulo de HFR.
[0075] Na transposição com base no bloco de subfaixa do módulo de HFR 103, três ordens de transposição T = 2, 3 e 4, devem ser produzidas e administradas no domínio de uma QMF de 64 faixas operando na taxa de amostragem de saída 2fs. O sinal do domínio de tempo de entrada é filtrado com o filtro passa-baixo nos blocos 103-12, 103-13 e 103-14. Isto é feito para que os sinais de saída, processados pelas diferentes ordens de transposição, para tenham os conteúdos espectrais não sobrepostos. Os sinais ainda têm sua taxa de amostragem reduzida (103-23, 103-24) para adaptar a taxa de amostragem dos sinais de entrada ao banco de filtros de análise de um tamanho constante (neste caso 64). Pode ser observado que o aumento da taxa de amostragem, de fs para 2fs, pode ser explicado pelo fato de que os conversores da taxa de amostragem utilizam fatores de redução da taxa de amostragem de T/2 em vez de T, nos quais o último resultaria nos sinais de subfaixa transpostos tendo taxa de amostragem igual ao sinal de entrada. Os sinais com a taxa de amostragem reduzida são inseridos aos bancos de filtros de análise de HFR separados (103-32, 103-33 e 103-34), um para cada ordem de transposição, que provêm uma grande variedade de sinais de subfaixa com valor complexo. Estes são inseridos às unidades de extensão da subfaixa não linear (103-42, 103-43 e 103-44). A grande variedade de subfaixas de saída com valor complexo é inserida ao Módulo Unir/Combinar 104 com a saída do banco de análise subamostrado 102. A unidade Unir/Combinar simplesmente une as subfaixas do banco de filtro de análise central 102 e cada fator de extensão se subdivide em uma única grande variedade de subfaixas de QMF a ser inserida à unidade de processamento de HFR 105.
[0076] Quando o sinal espectral de diferentes ordens de transposição é definido para não sobrepor, ou seja, o espectro da Ta ordem do sinal de transposição deveria iniciar onde o espectro dos finais do sinal de ordem T-1, os sinais transpostos precisam ser de caráter passa-baixo. Assim, os filtros passa-baixo tradicionais 103-12-103-14 na figura 1. Entretanto, através de uma simples seleção exclusiva entre as subfaixas disponíveis pela unidade Unir/Combinar 104, os filtros passa-baixo separados são redundantes e podem ser evitados. Ainda, o a característica passa- baixo inerente fornecida pelo banco de QMF é explicada pela inserção de diferentes contribuições das ramificações de transposição independentemente dos diferentes canais de subfaixa em 104. É também suficiente para aplicar a extensão de tempo apenas às faixas que são combinadas em 104.
[0077] A figura 2 ilustra a operação de uma unidade de extensão da subfaixa não linear. O extrator de bloco 201 testa uma estrutura finita de amostras do sinal de entrada com valor complexo. A estrutura é definida por uma posição indicadora da entrada. Esta estrutura passa pelo processamento não linear em 202 e é subsequentemente colocado em janela por uma finita janela de comprimento em 203. As amostras resultantes são adicionadas às amostras previamente emitidas na unidade de sobreposição e adição 204 onde a posição da estrutura de saída é definida por uma posição indicadora da saída. O indicador de entrada é aumentado por uma quantidade fixa e o indicador de saída é aumentado pelo fator de extensão da subfaixa vezes a mesma quantidade. Uma iteração desta corrente de operações produzirá um sinal de saída com duração sendo o fator de extensão da subfaixa vezes a duração do sinal de subfaixa de entrada, até o comprimento da janela de síntese.
[0078] Enquanto a transposição de SSB empregada por SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audiovisual objects - Parte 3: Audio]” tipicamente explica toda a banda base, excluindo a primeira subfaixa, para gerar o sinal de banda alta, uma transposição harmônica geralmente utiliza uma parte menor do espectro do codificador central. A quantidade utilizada, a chamada faixa fonte, depende da ordem de transposição, o fator de extensão da largura de banda, e as regras aplicadas para o resultado combinado, por exemplo, se os sinais gerados de diferentes ordens de transposição são permitidos sobrepor de forma espectral ou não. Como uma consequência, apenas uma parte limitada do espectro de saída da transposição harmônica para uma determinada ordem de transposição será atualmente utilizada pelo processamento de módulo de HFR 105.
[0079] A figura 18 ilustra outra realização de uma implementação do processamento exemplar para processar um único sinal de subfaixa. O único sinal de subfaixa esteve sujeito a qualquer tipo de dizimação antes ou depois de ser filtrado por um banco de filtro de análise não mostrado na figura 18. Desta forma, a duração do tempo do único sinal de subfaixa é mais curta que a duração do tempo antes de formar a dizimação. O único sinal de subfaixa é inserido a um extrator de bloco 1800, que pode ser idêntico ao extrator de bloco 201, mas que também pode ser implementado de forma diferente. O extrator de bloco 1800 na figura 18 opera utilizando uma amostra/valor de avanço do bloco de forma exemplar chamado e. A amostra/valor de avanço do bloco pode ser variável o pode ser fixadamente definida e é ilustrada na figura 18 como uma seta na caixa do extrator de bloco 1800. Na saída do extrator de bloco 1800, existe uma pluralidade de blocos extraídos. Estes blocos são altamente sobrepostos, visto que a amostra/valor de avanço do bloco e é significativamente menor que o comprimento do bloco do extrator de bloco. Um exemplo é que o extrator de bloco extrai blocos de 12 amostras. O primeiro bloco compreende amostras 0 a 11, o segundo bloco compreende amostras 1 a 12, o terceiro bloco compreende amostras 2 a 13, e assim por diante. Nesta realização, a amostra/valor de avanço do bloco e é igual a 1, e há uma sobreposição de 11 dobras.
[0080] Os blocos individuais são inseridos a um windower 1802 para janelamento dos blocos utilizando uma função de janela para cada bloco. Adicionalmente, uma calculadora de fase 1804 é provida, e calcula uma fase para cada bloco. A calculadora de fase 1804 pode utilizar tanto o bloco individual antes do janelamento ou após o janelamento. Então, um valor de ajuste de fase p x k é calculado e inserido a um regulador de fase 1806. O regulador de fase aplica o valor de ajuste em cada amostra no bloco. Além disso, o fator k é igual ao fator de extensão da largura de banda. Quando, por exemplo, a extensão da largura de banda por um fator 2 for obtido, então a fase p calculada para um bloco extraído pelo extrator de bloco 1800 é multiplicado pelo fator 2 e o valor de ajuste aplicado em cada amostra do bloco no regulador de fase 1806 é p multiplicado por 2. Isto é um valor/regra exemplar. De modo alternativo, a fase corrigida para a síntese é k * p, p + (k-1)*p. Então, neste exemplo o fator de correção é 2, se multiplicado ou 1*p se somado. Outros valores/regras podem ser aplicados para calcular o valor de correção de fase.
[0081] Em uma realização, o único sinal de subfaixa é um sinal de subfaixa complexo, e a fase de um bloco pode ser calculada por uma pluralidade de diferentes formas. Uma forma é considerar a amostra no meio ou ao redor do meio do bloco e calcular a fase desta amostra complexa. Também é possível calcular a fase para cada amostra.
[0082] Embora seja ilustrado na figura 18 na forma em que um regulador de fase opera após o windower estes dois blocos também podem ser trocados, de forma que o ajuste da fase seja realizado aos blocos extraídos pelo extrator de bloco e uma operação de janelamento subsequente é realizada. Visto que ambas as operações, ou seja, o janelamento e o ajuste da fase são multiplicações com valor real ou valor complexo, estas duas operações podem ser resumidas em uma única operação utilizando um fator de multiplicação complexo, que, é o próprio produto de um fator de multiplicação do ajuste de fase e um fator de janelamento.
[0083] Os blocos ajustados por fase são inseridos a uma sobreposição/soma e bloco de correção de amplitude 1808, onde os blocos ajustados por fase ou em janela são sobrepostos-somados. De forma importante, entretanto, a amostra/valor de avanço do bloco no bloco 1808 é diferente do valor utilizado no extrator de bloco 1800. Particularmente, a amostra/valor de avanço do bloco no bloco 1808 é maior que o valor e utilizado no bloco 1800, de forma que um extensão de tempo do sinal emitido pelo bloco 1808 seja obtido. Assim, o sinal de subfaixa processado emitido pelo bloco 1808 tem uma extensão que é mais longa que o sinal de subfaixa inserido ao bloco 1800. Quando a extensão da largura de banda de dois for obtida, então a amostra/valor de avanço do bloco é utilizada, que é duas vezes o valor no bloco correspondente 1800. Isto resulta em uma extensão de tempo por um fator de dois. Quando, entretanto, outros fatores de extensão de tempo são necessário, então outra amostra/valor de avanço dos blocos pode ser utilizada de forma que a saída do bloco 1808 tenha uma duração do tempo necessária.
[0084] Para direcionar a questão da sobreposição, uma correção de amplitude é preferivelmente realizada para direcionar a questão de diferentes sobreposições no bloco 1800 e 1808. Esta correção de amplitude poderia, entretanto, ser também introduzida ao fato de multiplicação do windower/regulador de fase, mas a correção de amplitude também pode ser realizada após a sobreposição/processamento.
[0085] No exemplo acima com um comprimento do bloco de 12 e uma amostra/valor de avanço do bloco no extrator de bloco de um, a amostra/valor de avanço do bloco para o bloco de sobreposição/soma 1808 seria igual a dois, quando uma extensão da largura de banda por um fator de dois for realizada. Isto ainda resultaria em uma sobreposição de cinco blocos. Quando uma extensão da largura de banda por um fator de três deve ser realizada, então a amostra/valor de avanço do bloco utilizada pelo bloco 1808 seria igual a três, e a sobreposição cairia em uma sobreposição de três. Quando uma extensão da largura de banda de quatro dobras tiver que ser realizada, então o bloco de sobreposição/soma 1808 teria que utilizar uma amostra/valor de avanço do bloco de quatro, que ainda resultaria em uma sobreposição de mais que dois blocos.
[0086] Grandes economias computacionais podem ser obtidas restringindo os sinais de entrada às ramificações de transposição para conter apenas a faixa fonte, e isto em uma taxa de amostragem adaptada para cada ordem de transposição. O esquema de blocos básico de tal sistema para um gerador de HFR com base no bloco de subfaixa é ilustrado na figura 3. O sinal de entrada do codificador central é processado pelos redutores da taxa de amostragem dedicados antes do banco de filtros de análise de HFR.
[0087] O efeito essencial de cada redutor da taxa de amostragem é filtrar o sinal da faixa fonte e levá-la ao banco de filtro de análise na taxa de amostragem mais baixa possível. Aqui, o mais baixo possível se refere à taxa de amostragem mais baixa que é ainda adequada para o processamento a jusante, não necessariamente a taxa de amostragem mais baixa que evita o aliasing após a dizimação. A conversão da taxa de amostragem pode ser obtida de várias formas. Sem limitar o escopo da invenção, dois exemplos serão dados: o primeiro mostra a reamostragem realizada pelo processamento de domínio de tempo multitaxa, e o segundo ilustra a reamostragem atingida por meios do processamento da subfaixa de QMF.
[0088] A figura 4 mostra um exemplo dos blocos em um redutor da taxa de amostragem de domínio de tempo multitaxa para uma ordem de transposição de 2. O sinal de entrada, tendo uma largura de banda B Hz, e uma frequência de amostragem fs, é modulado por um exponencial complexo (401) para alternação de frequência para iniciar a faixa fonte para a frequência DC como
Figure img0002
[0089] Exemplos de um sinal de entrada e o espectro após a modulação é descrito nas figuras 5(a) e (b). O sinal modulado é interpolado (402) e filtrado por um filtro passa-baixo com valor complexo com limites de banda passante 0 e B/2 Hz (403). Os espectros após as respectivas etapas são mostrados nas figuras 5(c) e (d). O sinal filtrado é subsequentemente decimado (404) e a parte real do sinal é calculada (405). Os resultados após estas etapas são mostrados nas figuras 5(e) e (f). Neste exemplo particular, quando T=2, B=0,6 (em uma escala normalizada, ou seja, fs=2), P2 é escolhido como 24, para seguramente abranger a faixa fonte. O fator de redução da taxa de amostragem obtém
Figure img0003
[0090] onde a fração foi reduzida pelo fator comum 8. Assim, o fator de interpolação é 3 (como visto da figura 5(c)) e o fator de dizimação é 8. Pela utilização de Identidades Nobres [“Multirate Systems And Filter Banks,” P.P. Vaidyanathan, 1993, Prentice Hall, Englewood Cliffs], o decimador pode ser movido por todo o caminho para a esquerda, e o interpolador todo o caminho para a direita na figura 4. Desta forma, a modulação e a filtragem são feitas sobre a taxa de amostragem mais baixa possível e a complexidade computacional é ainda reduzida.
[0091] Outra abordagem é utilizar as saídas da subfaixa do banco de análise de QMF de 32 faixas subamostrado 102 já presente no método de HRF SBR. As subfaixas que abrangem as faixas fontes para as diferentes ramificações de transposição são sintetizadas ao domínio de tempo pelos pequenos bancos de QMF subamostrados antes do banco de filtros de análise de HFR. Este tipo de sistema de HFR é ilustrado na figura 6. Os pequenos bancos de QMF são obtidos pela subamostragem do banco de QMF de 64 faixas original, onde os coeficientes do filtro de protótipo são encontrados pela interpolação linear do filtro de protótipo original. Seguindo a notação na figura 6, o banco de síntese de QMF antes da ramificação da transposição de 2a ordem tem Q2=12 faixas (as subfaixas com índices com base em zero de 8 a 19 na QMF de 32 faixas). Para impedir o aliasing no processo de síntese, a primeira (índice 8) e a última (índice 19) faixas são definidas a zero. A saída espectral resultante é mostrada na figura 7. Observe que a transposição com base no banco de filtro de análise do bloco tem 2Q2=24 faixas, ou seja, o mesmo número de faixas que no exemplo com base no redutor da taxa de amostragem de domínio de tempo multitaxa (figura 3).
[0092] Quando a figura 6 e a figura 23 são comparadas, é claro que o elemento 601 da figura 6 corresponde ao banco de filtro de análise 2302 da figura 23. Além disso, o banco de filtro de síntese 2304 da figura 23 corresponde ao elemento 602-2, e o outro banco de filtro de análise 2307 da figura 23 corresponde ao elemento 603-2. O bloco 604-2 corresponde ao bloco 2309 e o combinador 605 pode corresponde ao banco de filtro de síntese 2311, mas em outras realizações, o combinador pode ser configurado para emitir sinais de subfaixa e, então, o outro banco de filtro de síntese conectado ao combinador pode ser utilizado. Entretanto, dependendo da implementação, uma determinada reconstrução de alta frequência conforme discutido no contexto da figura 26 posteriormente pode ser realizada antes da filtragem de síntese pelo banco de filtro de síntese 2311 ou combinador 205, ou pode ser realizada após a filtragem de síntese no banco de filtro de síntese 2311 da figura 23 ou após o combinador no bloco 605 da figura 6.
[0093] As outras ramificações que se estendem de 602-3 a 604-3 ou que se estendem de 602-T a 604-T não são ilustradas na figura 23, mas podem ser implementadas de forma semelhante, mas com diferentes tamanhos dos bancos de filtro onde T na figura 6 corresponde a um fator de transposição. Entretanto, conforme discutido no contexto da figura 27, a transposição por um fator de transposição de 3 e a transposição por um fator de transposição de 4 podem ser introduzidas à ramificação de processamento que consiste no elemento 602-2 a 604-2 de forma que o bloco 604-2 não proveja apenas uma transposição por um fator de 2, mas também uma transposição por um fator de 3 e um fator de 4, com um determinado banco de filtro de síntese é utilizada conforme discutido no contexto das figuras 26 e 27.
[0094] Na figura 6 da realização, Q2 corresponde a MS e MS é igual a, por exemplo, 12. Além disso, o tamanho do outro banco de filtro de análise 603-2 correspondente ao elemento 2307 é igual a 2MS como 24 na realização.
[0095] Além disso, conforme descrito antes, o canal mais baixo de subfaixa e o canal mais alto de subfaixa do banco de filtro de síntese 2304 pode ser inserido com zeros para evitar problemas de aliasing.
[0096] O sistema descrito na figura 1 pode ser visualizado como um caso especial simplificado da reamostragem descrito nas figuras 3 e 4. Para simplificar a disposição, os moduladores são omitidos. Ainda, toda a filtragem de análise de HFR é obtida utilizando banco de filtros de análise de 64 faixas. Assim, P2 = P3 = P4 = 64 da figura 3, e os fatores de redução da taxa de amostragem são 1, 1,5 e 2 para as ramificações de 2a, 3a e 4a ordem de transposição respectivamente.
[0097] É uma vantagem da presente invenção que no contexto do processamento de amostragem crítica inventiva, os sinais de subfaixa do banco de análise de QMF de 32 faixas correspondente ao bloco 2302 da figura 23 ou 601 da figura 6 conforme definido em MPEG4 (ISO/IEC 14496-3) possam ser utilizados. A definição deste banco de filtro de análise no Padrão MPEG-4 seja ilustrada na parte superior da figura 25a e seja ilustrada como um fluxograma na figura 25b, que também é considerado do Padrão MPEG-4. A SBR (reprodução da largura de banda espectral) deste padrão é incorporada aqui por referência. Particularmente, o banco de filtro de análise 2302 da figura 23 ou a QMF de 32 faixas 601 da figura 6 pode ser implementada conforme ilustrado na figura 25a, a parte superior e o fluxograma na figura 25b.
[0098] Além disso, o banco de filtro de síntese ilustrado no bloco 2311 da figura 23 também pode ser implementado conforme indicado na parte inferior da figura 25a e conforme ilustrado no fluxograma da figura 25c. Entretanto, quaisquer outras definições do banco de filtro podem ser aplicadas, mas pelo menos para o banco de filtro de análise 2302, a implementação ilustrada nas figuras 25a e 25b é preferida devido à robustez, estabilidade e alta qualidade provida por este banco de filtro de análise tendo 32 canais do MPEG-4 pelo menos no contexto de aplicações de extensão da largura de banda como reprodução da largura de banda espectral, ou indicada geralmente, as aplicações do processamento de reconstrução de alta frequência.
[0099] O banco de filtro de síntese 2304 é configurado para sintetizar um subconjunto das subfaixas que abrangem a faixa fonte para uma transposição. Esta síntese é feita para sintetizar o sinal intermediário 2306 no domínio de tempo. Preferivelmente, o banco de filtro de síntese 2304 é um pequeno banco de QMF com valor real subamostrado.
[0100] A saída do domínio de tempo 2306 deste banco de filtro é então inserida a um banco de QMF de análise com valor complexo de duas vezes o tamanho do banco de filtro. Este banco de QMF é ilustrado pelo bloco 2307 da figura 23. Este procedimento permite uma economia substancial na complexidade computacional, pois apenas a faixa fonte relevante é transformada no domínio da subfaixa de QMF tendo a resolução da frequência dobrada. Os pequenos bancos de QMF são obtidos pela subamostragem do banco de QMF de 64 faixas original, onde os coeficientes do filtro de protótipo são obtidos pela interpolação linear do filtro de protótipo original. Preferivelmente, o filtro de protótipo associado com o banco de filtro de síntese de MPEG-4 tendo 640 amostras é utilizado, onde o banco de filtro de análise MPEG-4 tem uma janela de 320 amostras de janela.
[0101] O processamento dos bancos de filtro subamostrados é descrito nas figuras 24a e 24b, que ilustram os fluxogramas. As variáveis a seguir são determinadas primeiramente:
Figure img0004
[0102] onde MS é o tamanho do banco de filtro de síntese subamostrado e kL representa o índice da subfaixa do primeiro canal do banco de QMF de 32 faixas para inserir o banco de filtro de síntese subamostrado. A matriz startSubband2kL é listada na tabela 1. A função floor{x} circula o argumento x ao número inteiro mais próximo em direção a infinidade negativa. Tabela 1 - y = startSubband2kL(x)
Figure img0005
[0104] Assim, o valor MS define o tamanho do banco de filtro de síntese 2304 da figura 23 e KL é o primeiro canal do subconjunto 2305 indicado na figura 23. Especificamente, o valor na equação ftableLow é definido no ISO/IEC 14496-3, seção 4.6.18.3.2 que é também incorporado aqui por referência. Deve ser observado que o valor MS passa por aumentos de 4, que significa que o tamanho do banco de filtro de síntese 2304 pode ser 4, 8, 12, 16, 20, 24, 28 ou 32.
[0105] Preferivelmente, o banco de filtro de síntese 2304 é um banco de filtro de síntese com valor real. Para esta finalidade, um conjunto de amostras de subfaixa com valor real MS é calculado das amostras de subfaixa com novo valor complexo MS de acordo com a primeira etapa da figura 24a. Para esta finalidade, a equação a seguir é utilizada
Figure img0006
[0106] Na equação, exp() denota a função complexa exponencial, i é a unidade imaginária e kL foi definido antes.
[0107] Alternar as amostras na matriz v pelas posições 2MS. As amostras mais antigas 2MS são descartadas.
[0108] As amostras de subfaixa com valor em real MS multiplicado pela matriz N, ou seja, o produto matriz-vetor N’V é calculado, onde
Figure img0007
[0109] A saída desta operação é armazenada nas posições 0 a 2MS-1 da matriz v.
[0110] Extrair as amostras de v, de acordo com o fluxograma na figura 24a, para criar a matriz g do elemento 10MS.
[0111] Multiplicar as amostras da matriz g por janela ci para produzir a matriz w. Os coeficientes da janela ci são obtidos pela interpolação linear dos coeficientes c, ou seja, através da equação
Figure img0008
[0112] onde µ( ) n e ρ( ) n são definidos como o número inteiro e as partes fracionais de 64 / ⋅n M S , respectivamente. Os coeficientes da janela de c podem ser encontrados na tabela 4.A.87 do ISO/IEC 14496-3:2009.
[0113] Assim, o banco de filtro de síntese tem uma calculadora funcional da janela de protótipo para calcular uma função da janela de protótipo pela subamostragem ou interpolação utilizando uma função da janela armazenada para um banco de filtro tendo um tamanho diferente.
[0114] Calcular as novas amostras de saída MS pela soma de amostras da matriz w de acordo com a última etapa no fluxograma da figura 24a.
[0115] Subsequentemente, a implementação preferida do outro banco de filtro de análise 2307 na figura 23 é ilustrada com o fluxograma na figura 24b.
[0116] Alternar as amostras na matriz x pelas posições 2MS de acordo com a primeira etapa da figura 24b. As amostras mais antigas 2MS são descartadas e as novas 2MS amostras são armazenadas nas posições 0 a 2MS-1.
[0117] Multiplicar as amostras da matriz x pelos coeficientes da janela c2i. Os coeficientes da janela c2i são obtidos pela interpolação linear dos coeficientes c, ou seja, através da equação
Figure img0009
[0118] onde µ( ) n e ρ( ) n são definidos como o número inteiro e partes fracionais de 32 / ⋅n M S, respectivamente. Os coeficientes da janela de c podem ser encontrados na tabela 4.A.87 da ISO/IEC 14496-3:2009.
[0119] Assim, o outro banco de filtro de análise 2307 tem uma calculadora funcional da janela de protótipo para calcular uma função da janela de protótipo pela subamostragem ou interpolação utilizando uma função da janela armazenada para um banco de filtro tendo um tamanho diferente.
[0120] Somar as amostras de acordo com a fórmula no fluxograma na figura 24b para criar a matriz u do elemento 4MS.
[0121] Calcular as novas amostras de subfaixa com novo
Figure img0010
[0122] Na equação, exp() denota a função complexa exponencial, e i é a unidade imaginária.
[0123] Um diagrama em blocos de um redutor da taxa de amostragem com fator 2 é mostrado na figura 8(a). O filtro passabaixo com valor real pode ser escrito H z B z A z ( ) ( ) / ( ) = , onde B z ( ) é a parte não recursiva (FIR) e A z ( ) é a parte recursiva (IIR). Entretanto, para uma implementação eficiente, utilizando as Identidades Nobres para reduzir a complexidade computacional, é útil desenhar um filtro onde todos os polos têm multiplicidade 2 (polos duplos) como A (z2). Assim, o filtro pode ser fatorado conforme mostrado na figura 8(b). Utilizando a Identidade Nobre 1, a parte recursiva pode ser movida depois do decimador como na figura 8(c). O filtro não recursivo B z ( ) pode ser implementado utilizando decomposição de polifase de 2 componentes padrão como
Figure img0011
[0124] Assim, o redutor da taxa de amostragem pode ser estruturado como na figura 8(d). Após utilizar a Identidade Nobre 1, a parte FIR é calculada na taxa de amostragem mais baixa possível conforme mostrado na figura 8(e). A partir da figura 8(e) é fácil ver que a operação FIR (atraso, decimadores e componentes polifase) pode ser vista como uma operação de soma pela janela utilizando um avanço de entrada de duas amostras. Para duas amostras de entrada, uma nova amostra de saída será produzida, efetivamente resultante em uma redução da taxa de amostragem de um fator 2.
[0125] Um diagrama em blocos do redutor da taxa de amostragem com o fator 1,5=3/2 é mostrado na figura 9(a). O filtro passa-baixo com valor real pode novamente ser escrito H(z) = B(z) / A(z) , onde B(z) é a parte não recursiva (FIR) e A(z) é a parte recursiva (IIR). Como antes, para uma implementação eficiente, utilizando a Identidade Nobre para reduzir a complexidade computacional, é útil desenhar um filtro onde todos os polos têm multiplicidade 2 (polos duplos) ou multiplicidade 3 (polos triplos) como A(z ) ou A(z ) respectivamente. Aqui, os polos duplos são escolhidos como o algoritmo do desenho para o filtro passa-baixo é mais eficiente, embora a parte recursiva atualmente seja 1,5 vezes mais complexa para implementar comparado à abordagem do polo triplo. Assim, o filtro pode ser fatorado conforme mostrado na figura 9(b). Utilizando a Identidade Nobre 2, a parte recursiva pode ser movida na frente do interpolador como utilizando a decomposição polifase do componente padrão 2'3 6 como
Figure img0012
[0126] Assim, o redutor da taxa de amostragem pode ser estruturado como na figura 9(d). Após utilizar a Identidade Nobre 1 e 2, a parte FIR é calculada na taxa de amostragem mais baixa possível conforme mostrado na figura 9(e). A partir da figura 9(e) é fácil ver que as amostras de saída com índice par são calculadas utilizando o grupo inferior de três filtros polifase (
Figure img0013
enquanto as amostras com índice ímpar são calculadas do grupo mais alto
Figure img0014
. A operação de cada grupo (corrente de atraso, decimadores e componentes polifase) pode ser vista como a operação de soma pela janela utilizando um avanço de entrada de três amostras. Os coeficientes da janela utilizados no grupo superior são coeficientes com índice ímpar, enquanto o grupo inferior utiliza os coeficientes com índice par Assim, para um grupo de três amostras de entrada, duas novas amostras de saída serão produzidas, efetivamente resultando em uma redução da taxa de amostragem de um fator 1,5.
[0127] O sinal de domínio de tempo do decodificador central (101 na figura 1) também pode ser subamostrado utilizando uma transformação de síntese subamostrada menor no decodificador central. O uso de uma menor transformação de síntese oferece ainda complexidade computacional reduzida. Dependendo da frequência cruzada, ou seja, a largura de banda do sinal do codificador central, o índice do tamanho da transformação de síntese e o tamanho nominal Q (Q < 1), resulta em um sinal de saída do codificador central tendo uma taxa de amostragem Qfs. Para processar o sinal do codificador central subamostrado nos exemplos descritos na aplicação atual, todos os bancos de filtro de análise da figura1 (102, 103-32, 103-33 e 103-34) precisam ser escalados pelo fator Q, bem como os redutores da taxa de amostragem (301-2, 301-3 e 301-T) da figura 3, o decimador 404 da figura 4 e o banco de filtro de análise 601 da figura 6. Aparentemente, Q tem que ser escolhido de forma que todos os tamanhos dos bancos de filtro sejam números inteiros.
[0128] A figura 10 ilustra o alinhamento das bordas espectrais dos sinais de transposição de HFR às bordas espectrais da tabela de frequência do ajuste envolvente em um codificador melhorado de HFR, como SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audio-visual objects - Parte 3: Audio]”. A figura 10(a) mostra um gráfico estilístico das baixas frequências compreendendo a tabela de ajuste envolvente, as chamadas faixas do fator em escala, que abrangem a faixa de frequência da frequência cruzada kx à frequência parada ks. As faixas do fator em escala constituem a grade de frequência utilizada em um codificador melhorado de HFR ao ajustar o nível de energia da frequência de alta faixa regenerada, ou seja, o envelope da frequência. Para ajustar o envelope, a energia do sinal é calculada em média um bloco de tempo/frequência restrito pelas bordas da faixa do fator em escala e das bordas do tempo selecionado. Se os sinais gerados pelas diferentes ordens de transposição estiverem desalinhados às faixas do fator em escala, conforme ilustrado na figura 10(b), artefatos podem surgir se a energia espectral mudar drasticamente na proximidade de uma borda da faixa de transposição, visto que o processo de ajuste envolvente manterá a estrutura espectral dentro de uma faixa do fator em escala. Assim, a solução proposta é adaptar as bordas de frequência dos sinais transpostos às bordas das faixas do fator em escala conforme mostrado na figura 10(c). Na figura, a borda superior dos sinais gerados pelas ordens de transposição de 2 e 3 (T=2, 3) é reduzida a uma pequena quantidade, comparada à figura 10(b), para alinhar as bordas de frequência das faixas de transposição às bordas da faixa do fator em escala existente.
[0129] Um cenário realístico que mostra os artefatos potenciais ao utilizar as bordas desalinhadas é descrito na figura 11. A figura 11(a) mostra novamente as bordas da faixa do fator em escala. A figura 11(b) mostra os sinais gerados não ajustados pela HFR das ordens de transposição T=2, 3 e 4 com o sinal da banda base decodificado central. A figura 11(c) mostra o sinal ajustado por envelope quando um plano alvo do envelope é assumido. Os blocos com áreas quadriculadas representam as faixas do fator em escala com variações de alta energia de intrafaixa, que podem causar anomalias no sinal de saída.
[0130] A figura 12 ilustra o cenário da figura 11, mas desta vez utilizando as bordas alinhadas. A figura 12(a) mostra as bordas da faixa do fator em escala, a figura 12(b) descreve os sinais gerados não ajustados pela HFR de ordens de transposição T=2, 3 e 4 com o sinal da banda base decodificados centrais e, em linha com a figura 11(c), a figura 12(c) mostra o sinal ajustado por envelope quando um plano alvo do envelope é assumido. Como é visto da figura, não há faixas do fator em escala com variações de alta energia de intrafaixa devido ao desalinhamento das faixas do sinal transposto e as faixas do fator em escala, e assim os artefatos potenciais são reduzidos.
[0131] A figura 13 ilustra a adaptação das bordas da faixa limitadora de HFR, conforme descrito em, por exemplo, SBR [ISO/IEC 14496-3:2009, “Information technology - Coding of audiovisual objects - Parte 3: Audio]” aos reparos harmônicos em um codificador melhorado de HFR. O limitador opera nas faixas de frequência tendo uma resolução mais grossa que as faixas do fator em escala, mas o princípio da operação é o mesmo. No limitador, um valor de ganho médio para cada uma das faixas limitadoras é calculado. Os valores de ganho individuais, ou seja, os valores de ganho envolvente calculados para cada uma das faixas do fator em escala, não são permitidos exceder o valor do ganho médio limitador por mais que um determinado fator multiplicativo. O objetivo do limitador é para suprir grandes variações dos ganhos da faixa do fator em escala dentro de cada uma das faixas limitadoras. Enquanto a adaptação das faixas geradas por transposição às faixas do fator em escala garante pequenas variações da energia intrafaixa dentro de uma faixa do fator em escala, a adaptação das bordas da faixa limitadora às bordas da faixa de transposição, de acordo com a presente invenção, lida com as maiores diferenças da energia em escala entre as faixas processadas por transposição. A figura 13(a) mostra os limites de frequência dos sinais gerados pela HFR das ordens de transposição T=2, 3 e 4. Os níveis de energia dos diferentes sinais transpostos podem ser substancialmente diferentes. A figura 13(b) mostra as faixas de frequência do limitador que tipicamente são de largura constante em uma escala de frequência logarítmica. As bordas da faixa de frequência de transposição são somadas como bordas limitadoras constantes e as bordas limitadoras restantes são recalculadas para manter as relações logarítmicas o mais próximo possível, como, por exemplo, ilustrado na figura 13(c). Embora alguns aspectos foram descritos no contexto de um aparelho, é claro que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou uma característica de uma etapa do método. Analogicamente, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente.
[0132] Outras realizações empregam um esquema de reparação misturada que é mostrado na figura 21, onde o método de reparação misturada dentro de um bloco de tempo é realizado. Para total cobertura das diferentes regiões do espectro de HF, BWE compreende várias reparações. Em HBE, as reparações mais altas exigem altos fatores de transposição dentro dos vocoders de fase, que particularmente deterioram a qualidade perceptual de transitórios.
[0133] Assim, as realizações geram as reparações de ordem mais alta que ocupam as regiões espectrais superiores preferivelmente pelo cálculo da eficiente reparação da cópia de SSB e as reparações de ordem inferior que abrangem as regiões espectrais médias, para as quais a preservação da estrutura harmônica é desejada, preferivelmente pela reparação de HBE. A mistura individual dos métodos de reparação pode ser estática ao longo do tempo ou, preferivelmente, ser sinalizada no fluxo de dados.
[0134] Para a operação de cópia, a informação de baixa frequência pode ser utilizada conforme mostrado na figura 21. De modo alternativo, os dados das reparações que foram gerados utilizando os métodos de HBE podem ser utilizados conforme ilustrado na figura 21. O último leva a uma estrutura tonal menos densa para as reparações mais elevadas. Além destes dois exemplos, cada combinação da cópia e HBE é concebível.
[0135] As vantagens dos conceitos propostos são
[0136] Qualidade perceptual melhorada de transitórios
[0137] Complexidade computacional reduzida
[0138] A figura 26 ilustra uma corrente do processamento preferida para a finalidade de extensão da largura de banda, onde diferentes operações de processamento podem se realizadas dentro do processamento não linear da subfaixa indicada em blocos 1020a, 1020b. A cascata de bancos de filtro 2302, 2304, 2307 é representada na figura 26 pelo bloco 1010. Além disso, o bloco 2309 pode corresponder aos elementos 1020a, 1020b e o regulador envolvente 1030 podem ser colocados entre o bloco 2309 e o bloco 2311 da figura 23 ou pode ser colocado após o processamento no bloco 2311. Nesta implementação, o processamento seletivo por faixa do sinal de domínio de tempo processado como o sinal estendido da largura de banda é realizado no domínio de tempo em vez de no domínio da subfaixa, que existe antes do banco de filtro de síntese 2311.
[0139] A figura 26 ilustra um aparelho para gerar um sinal estendido da largura de banda de áudio de um sinal de entrada de banda baixa 1000 de acordo com outra realização. O aparelho compreende um banco de filtro de análise 1010, um processador de subfaixa não linear ampla da subfaixa 1020a, 1020b, um regulador envolvente subsequentemente conectado 1030 ou, geralmente indicado, um processador de reconstrução de alta frequência operando na reconstrução dos parâmetros de alta frequência como, por exemplo, entrada na linha do parâmetro 1040. O regulador envolvente, ou como geralmente indicado, o processador de reconstrução de alta frequência processa sinais de subfaixa individuais para cada canal de subfaixa e insere os sinais de subfaixa processados para cada canal de subfaixa em um banco de filtro de síntese 1050. O banco de filtro de síntese 1050 recebe, em seus sinais de entrada do canal inferior, uma representação da subfaixa do sinal central do decodificador de banda baixa. Dependendo da implementação, a banda baixa também pode ser derivada das saídas do banco de filtro de análise 1010 na figura 26. Os sinais de subfaixa transpostos são inseridos aos canais de banco de filtro mais altos do banco de filtro de síntese para realizar a reconstrução de alta frequência.
[0140] O banco de filtro 1050 finalmente emite um sinal de saída da transposição que compreende as extensões da largura de banda pelos fatores de transposição 2, 3 e 4, e o sinal emitido pelo bloco 1050 não é a largura de banda-limitada à frequência cruzada, ou seja, à frequência mais alta do sinal do codificador central correspondente à frequência mais baixa de SBR ou do sinal gerado por componentes de HFR.
[0141] Na realização da figura 26, o banco de filtro de análise realiza duas vezes a sobreamostragem e tem um determinado espaçamento da subfaixa de análise 1060. O banco de filtro de síntese 1050 tem um espaçamento da subfaixa de síntese 1070 que é, nesta realização, o dobro do tamanho do espaçamento da subfaixa de análise que resulta em uma contribuição de transposição conforme será discutido posteriormente no contexto da figura 27.
[0142] A figura 27 ilustra uma implementação detalhada de uma realização preferida de um processador não linear de subfaixa 1020a na figura 26. O circuito ilustrado na figura 27 recebe como uma entrada um único sinal de subfaixa 108, que é processado em três “ramificações”: A ramificação superior 110a é para uma transposição por um fator de transposição de 2. A ramificação no meio da figura 27 indicada em 110b é para uma transposição por um fator de transposição de 3, e a ramificação inferior na figura 27 é para uma transposição por um fator de transposição de 4 e é indicada pelo numeral de referência 110c. Entretanto, a transposição atual obtida por cada elemento de processamento na figura 27 é apenas 1 (ou seja, nenhuma transposição) para ramificação 110a. A transposição atual obtida pelo elemento de processamento ilustrado na figura 27 para a ramificação média 110b é igual a 1,5 e a transposição atual para a ramificação inferior 110c é igual a 2. Isto é indicado pelos números em parênteses à esquerda da figura 27, onde os fatores de transposição T são indicados. As transposições de 1,5 e 2 representam uma contribuição da primeira transposição obtida tendo uma operação de dizimação nas ramificações 110b, 110c e uma extensão de tempo pelo processador sobreposição-adição. A segunda contribuição, ou seja, o dobro da transposição é obtido pelo banco de filtro de síntese 105, que tem um espaçamento da subfaixa de síntese 107 que é duas vezes o banco de filtro de espaçamento da subfaixa de análise. Desta forma, visto que o banco de filtro de síntese tem duas vezes o espaçamento da subfaixa de análise, qualquer funcionalidade de dizimação não ocorre em ramificação 110a.
[0143] A ramificação 110b, entretanto, tem uma funcionalidade de dizimação para obter uma transposição por 1,5. Devido ao fato de que o banco de filtro de síntese tem duas vezes o espaçamento de subfaixa físico do banco de filtro de análise, um fator de transposição de 3 é obtido conforme indicado na figura 27 à esquerda do extrator de bloco para a segunda ramificação 110b.
[0144] Analogicamente, a terceira ramificação tem uma funcionalidade de dizimação correspondente a um fator de transposição de 2, e a contribuição final do diferente espaçamento da subfaixa no banco de filtro de análise e o banco de filtro de síntese finalmente corresponde a um fator de transposição de 4 da terceira ramificação 110c.
[0145] Particularmente, cada ramificação tem um extrator de bloco 120a, 120b, 120c e cada um destes extratores de bloco podem ser semelhantes ao extrator de bloco 1800 da figura 18. Além disso, cada ramificação tem uma calculadora de fase 122a, 122b e 122c, e a calculadora de fase pode ser semelhante à calculadora de fase 1804 da figura 18. Além disso, cada ramificação tem um regulador de fase 124a, 124b, 124c e o regulador de fase pode ser semelhante ao regulador de fase 1806 da figura 18. Além disso, cada ramificação tem um windower 126a, 126b, 126c, onde cada um destes windowers pode ser semelhante ao windower 1802 da figura 18. Todavia, os windowers 126a, 126b, 126c também podem ser configurados para aplicar uma janela retangular com certo “preenchimento zero”. Os sinais de transposição ou de reparo de cada ramificação 110a, 110b, 110c, na realização da figura 27, são inseridos ao adicionador 128, que soma a contribuição de cada ramificação ao sinal de subfaixa da corrente para finalmente obter os chamados blocos de transposição na saída do adicionador 128. Então, um procedimento de sobreposição-adição no adicionador de sobreposição 130 é realizado, e o adicionador de sobreposição 130 pode ser semelhante ao bloco de sobreposição/soma 1808 da figura 18. O adicionador de sobreposição aplica um valor de avanço de sobreposição-adição de 2*e, onde e é o valor de avanço por sobreposição ou “valor de avanço” dos extratores de bloco 120a, 120b, 120c, e o adicionador de sobreposição 130 emite o sinal transposto que é, na realização da figura 27, uma única saída da subfaixa para o canal k, ou seja, para o canal de subfaixa atualmente observado. O processamento ilustrado na figura 27 é realizado para cada subfaixa de análise ou para um determinado grupo de subfaixas de análise e, conforme ilustrado na figura 26, sinais de subfaixa transpostos são inseridos ao banco de filtro de síntese 1050 após ser processado pelo bloco 1030 para finalmente obter o sinal de saída da transposição ilustrado na figura 26 na saída do bloco 1050.
[0146] Em uma realização, o extrator de bloco 120a da ramificação da primeira transposição 110a extrai 10 amostras de subfaixa e subsequentemente uma conversão destas 10 amostras de QMF às coordenadas polares é realizada. Esta saída, gerada pelo regulador de fase 124a, é então direcionado ao windower 126a, que estende a saída pelos zeros para o primeiro e o último valor do bloco, onde esta operação é equivalente a um janelamento (de síntese) com uma janela retangular de extensão 10. O extrator de bloco 120a na ramificação 110a não realiza uma dizimação. Desta forma, as amostras extraídas pelo extrator de bloco são mapeadas em um bloco extraído no mesmo espaçamento de amostra conforme eles foram extraídos.
[0147] Entretanto, isto é diferente para as ramificações 110b e 110c. O extrator de bloco 120b preferivelmente extrai um bloco de 8 amostras de subfaixa e distribui estas 8 amostras de subfaixa no bloco extraído em um diferente espaçamento da amostra de subfaixa. As entradas da amostra de subfaixa sem número inteiro para o bloco extraído são obtidas por uma interpolação, e as amostras QMF obtidas com as amostras interpoladas são convertidas às coordenadas polares e são processados pelo regulador de fase. Então, novamente, o janelamento no windower 126b é realizado para estender o bloco emitido pelo regulador de fase 124b por zeros para as primeiras duas amostras e as últimas duas amostras, cuja operação é equivalente a um janelamento (de síntese) com a janela retangular de extensão 8.
[0148] O extrator de bloco 120c é configurado para extrair um bloco com uma extensão de tempo de 6 amostras de subfaixa e realiza uma dizimação de um fator de dizimação 2, realiza uma conversão das amostras de QMF em coordenadas polares e novamente realiza uma operação no regulador de fase 124b, e a saída é novamente estendida por zeros, entretanto agora para as primeiras três amostras de subfaixa e para as últimas três amostras de subfaixa. Esta operação é equivalente a um janelamento (de síntese) com uma janela retangular de extensão 6.
[0149] As saídas de transposição de cada ramificação são então somadas para formar a saída de QMF combinada pelo adicionador 128, e as saídas de QMF combinadas são finalmente superimpostas utilizando sobreposição-adição no bloco 130, onde o valor de avanço de sobreposição-adição ou valor de avanço é duas vezes o valor de avanço dos extratores de bloco 120a, 120b, 120c conforme discutido antes.
[0150] Uma realização compreende um método para decodificar um sinal de áudio utilizando a transposição harmônica da subfaixa com base no bloco, compreendendo a filtragem de um sinal decodificado central através de um banco de filtro de análise de faixa M para obter um conjunto de sinais de subfaixa; sintetizando um subconjunto dos ditos sinais de subfaixa por meios de bancos de filtro de síntese subamostrados tendo um número de subfaixas reduzido, para obter os sinais da faixa fonte subamostrados.
[0151] Uma realização se refere a um método para alinhar as bordas espectrais da faixa dos sinais gerados pela HFR às bordas espectrais utilizadas em um processo paramétrico.
[0152] Uma realização se refere a um método para alinhar as bordas espectrais dos sinais gerados pela HFR às bordas espectrais da tabela de frequência do ajuste envolvente compreendendo: a pesquisa para a borda mais alta na tabela de frequência do ajuste envolvente que não excede os limites fundamentais da largura de banda do sinal gerado por HFR do fator de transposição T; e utilizando a borda mais alta encontrada como o limite de frequência do sinal gerado por HFR do fator de transposição T.
[0153] Uma realização se refere a um método para alinhar as bordas espectrais da ferramenta limitadora às bordas espectrais dos sinais gerados pela HFR compreendendo: adicionar as bordas de frequência dos sinais gerados pela HFR à tabela de bordas utilizada ao criar as bordas da faixa de frequência utilizadas pela ferramenta limitadora; e forçar o limitador para utilizar as bordas de frequência adicionadas como bordas constantes e ajustar as bordas restantes corretamente.
[0154] Uma realização se refere á transposição combinada de um sinal de áudio compreendendo várias ordens de transposição de número inteiro em um domínio do banco de filtro de baixa resolução onde a operação de transposição é realizada nos blocos de tempo dos sinais de subfaixa.
[0155] Outra realização se refere à transposição combinada, onde as ordens de transposição maiores que 2 são embutidas em um ambiente de transposição de ordem 2.
[0156] Outra realização se refere á transposição combinada, onde ordens de transposição maiores que 3 são embutidas em um ambiente de transposição de ordem 3, em que as ordens de transposição menores de 4 são realizadas separadamente.
[0157] Outra realização se refere à transposição combinada, onde ordens de transposição (por exemplo, ordens de transposição maiores que 2) são criadas pela reprodução de ordens de transposição previamente calculadas (ou seja, ordens especialmente menores) incluindo a largura de banda codificada central. Cada combinação concebível das ordens de transposição disponíveis e a largura de banda são possíveis sem restrições.
[0158] Uma realização se refere à redução de complexidade computacional devido ao número reduzido de bancos de filtro de análise que são necessários para a transposição.
[0159] Uma realização se refere a um aparelho para gerar um sinal estendido da largura de banda a partir de um sinal de áudio de entrada, compreendendo: um reparador para reparação de um sinal de áudio de entrada para obter um primeiro sinal reparado e um segundo sinal recuperado, o segundo sinal recuperado tendo uma diferente frequência de reparo comparada ao primeiro sinal reparado, em que o primeiro sinal reparado é gerado utilizando um algoritmo da primeira reparação, e o segundo sinal recuperado é gerado utilizando um algoritmo da segunda reparação; e um combinador para combinar o primeiro sinal reparado e o segundo sinal recuperado para obter o sinal estendido da largura de banda.
[0160] Outra realização se refere a este aparelho certamente, no qual o algoritmo da primeira reparação é um algoritmo de reparação harmônica, e o algoritmo de segunda reparação é um algoritmo de reparação não harmônica.
[0161] Outra realização se refere a um aparelho anterior, no qual a frequência da primeira reparação é inferior à frequência da segunda reparação ou vice versa.
[0162] Outra realização se refere a um aparelho anterior, no qual o sinal de entrada compreende uma informação de reparação; e no qual o reparador é configurado para ser controlado pela informação de reparação extraída do sinal de entrada para variar o algoritmo da primeira reparação ou o algoritmo da segunda reparação de acordo com a informação de reparação.
[0163] Outra realização se refere a um aparelho anterior, no qual o reparador é operativo para reparar blocos subsequentes das amostras do sinal de áudio, e no qual o reparador é configurado para aplicar o algoritmo da primeira reparação e o algoritmo da segunda reparação ao mesmo bloco de amostras de áudio.
[0164] Outra realização se refere a um aparelho anterior, no qual um reparador compreende, em ordens arbitrárias, um decimador controlado por um fator de extensão da largura de banda, um banco de filtro, e um extensor para um sinal de subfaixa do banco de filtro.
[0165] Outra realização se refere a um aparelho anterior, no qual o extensor compreende um extrator de bloco para extrair um número de blocos sobrepostos de acordo com um valor de avanço de extração; um regulador de fase ou windower para ajustar valores de amostra da subfaixa em cada bloco com base em uma função de janela ou uma correção de fase; e uma sobreposição/adicionador para realizar um processo de adição/sobreposição dos blocos ajustados por fase ou janela utilizando um valor de avanço de sobreposição maior que o valor de avanço de extração.
[0166] Outra realização se refere a um aparelho para largura de banda que estende um sinal de áudio compreendendo: um banco de filtro para filtrar o sinal de áudio para obter sinais com a taxa de amostragem reduzida de subfaixa; uma pluralidade de diferentes processadores de subfaixa para processar diferentes sinais de subfaixa de formas diferentes, os processadores de subfaixa que realizam diferentes operações de extensão de tempo do sinal de subfaixa utilizando diferentes fatores de extensão; e uma união para unir as subfaixas processadas emitidas pela pluralidade de diferentes processadores de subfaixa para obter um sinal estendido da largura de banda de áudio.
[0167] Outra realização se refere a um aparelho para redução da taxa de amostragem de um sinal de áudio, compreendendo: um modulador; um interpolador utilizando um fator de interpolação; um filtro passa baixo complexo; e um decimador utilizando um fator de dizimação, em que o fator de dizimação é mais alto que o fator de interpolação.
[0168] Uma realização se refere a um aparelho para redução da taxa de amostragem de um sinal de áudio, compreendendo: um primeiro banco de filtro para gerar uma pluralidade de sinais de subfaixa do sinal de áudio, em que uma taxa de amostragem do sinal de subfaixa é menor que uma taxa de amostragem do sinal de áudio; pelo menos um banco de filtro de síntese seguido por um banco de filtro de análise para realizar uma conversão da taxa de amostra, o banco de filtro de síntese tendo um número de canais diferente de um número de canais do banco de filtro de análise; um processador de extensão de tempo para processar o sinal convertido da taxa de amostra; e um combinador para combinar o sinal com tempo estendido e um sinal de banda baixa ou um diferente sinal com tempo estendido.
[0169] Outra realização se refere a um aparelho para redução da taxa de amostragem de um sinal de áudio por um fator de redução da taxa de amostragem de número não inteiro, compreendendo: um filtro digital; um interpolador tendo um fator de interpolação; um elemento polifase tendo desvios ímpares e pares; e um decimador tendo um fator de dizimação sendo maior que o fator de interpolação, o fator de dizimação e o fator de interpolação sendo selecionado de forma que um índice do fator de interpolação e do fator de dizimação não seja número inteiro.
[0170] Uma realização se refere a um aparelho para processar um sinal de áudio, compreendendo: um decodificador central tendo um tamanho da transformação de síntese sendo menor que um tamanho de transformação nominal por um fator, de forma que um sinal de saída seja gerado pelo decodificador central tendo uma taxa de amostragem menor que uma taxa de amostragem nominal correspondente ao tamanho de transformação nominal; e um pós- processador tendo um ou mais bancos de filtro, um ou mais extensores de tempo e uma união, em que um número de canais do banco de filtro de um ou mais bancos de filtro é reduzido comparado a um número conforme determinado pelo tamanho de transformação nominal.
[0171] Outra realização se refere a um aparelho para processar um sinal de banda baixa, compreendendo: um gerador de reparo para gerar várias reparações utilizando o sinal de banda baixa de áudio; um regulador envolvente para ajustar um sinal envolvente utilizando fatores de escala dados para faixas do fator em escala adjacente tendo bordas da faixa do fator em escala, em que o gerador de reparo é configurado para realizar as várias reparações, de forma que uma borda entre as reparações adjacentes coincide com uma borda entre as faixas do fator em escala adjacente na escala de frequência.
[0172] Uma realização se refere a um aparelho para processar um sinal de banda baixa de áudio, compreendendo: um gerador de reparo para gerar várias reparações utilizando o sinal de áudio de banda baixa; e um limitador de ajuste envolvente para limitar os valores de ajuste envolventes para um sinal limitando as faixas limitadoras adjacentes tendo bordas da faixa limitadora, em que o gerador de reparo é configurado para realizar as várias reparações de forma que uma borda entre reparações adjacentes coincide com uma borda entre as faixas limitadoras adjacentes em uma escala de frequência.
[0173] O processamento inventivo é útil para melhorar os codecs de áudio que dependem de um esquema da extensão da largura de banda. Especialmente, se uma qualidade perceptual ideal a uma dada taxa de bits for altamente importante e, ao mesmo tempo, a energia do processamento for um recurso limitado.
[0174] Aplicações mais proeminentes são decodificadores de áudio, que são geralmente implementados em dispositivos portáteis e assim operam em uma fonte de alimentação por bateria.
[0175] O sinal de áudio codificado inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão como um meio de transmissão sem fio ou um meio de transmissão com fio como a Internet.
[0176] Dependendo de determinadas exigências da implementação, as realizações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controle legíveis eletronicamente armazenados nele, que cooperaram (ou podem cooperar) com um sistema de computador programável de forma que o respectivo método seja realizado.
[0177] Algumas realizações de acordo com a invenção compreendem um transportador de dados tendo sinais de controle legíveis eletronicamente, que podem cooperar com um sistema de computador programável, de forma que um dos métodos descritos aqui seja realizado.
[0178] Geralmente, as realizações da presente invenção podem ser implementadas como um produto do programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador operar em um computador. O código de programa pode, por exemplo, ser armazenado em um transportador legível pela máquina.
[0179] Outras realizações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um transportador legível pela máquina.
[0180] Em outras palavras, uma realização do método inventivo é, desta forma, um programa de computador tendo um código de programa para realizar um dos métodos descritos aqui, quando o programa de computador opera em um computador.
[0181] Outra realização dos métodos inventivos é, desta forma, um transportador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, registrado nele, o programa de computador para realizar um dos métodos descritos aqui.
[0182] Outra realização do método inventivo é, desta forma, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos descritos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[0183] Outra realização compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos aqui.
[0184] Outra realização compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descritos aqui.
[0185] Em algumas realizações, um dispositivo lógico programável (por exemplo, uma matriz de portas programáveis em campo) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas realizações, uma matriz de portas programáveis em campo pode cooperar com um microprocessador para realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por um hardware.
[0186] As realizações descritas acima são meramente ilustrativas para os princípios da presente invenção. É entendido que as modificações e variações das disposições e os detalhes descritos aqui serão aparentes aos outros técnicos no assunto. É intenção, desta forma, ser limitado apenas pelo escopo das próximas reivindicações da patente e não pelos detalhes específicos apresentados em forma de descrição e explicação das realizações aqui.
[0187] LITERATURA
[0188] M. Dietz, L. Liljeryd, K. Kjorling e O. Kunz, “Spectral Band Replication, a novel approach in audio coding,” na 112a Convenção AES, Munique, maio de 2002.
[0189] S. Meltzer, R. Bohm e F. Henn, “SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale” (DRM),” na 112a Convenção AES, Munique, maio de 2002.
[0190] T. Ziegler, A. Ehret, P. Ekstrand e M. Lutzky, “Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm,” na 112a Convenção AES, Munique, maio de 2002.
[0191] Norma Internacional ISO/IEC 14496-3:2001/FPDAM 1, “Bandwidth Extension,” ISO/IEC, 2002. Speech bandwidth extension method and apparatus Vasu Iyengar et al.
[0192] E. Larsen, R. M. Aarts, e M. Danessis. Efficient high-frequency bandwidth extension of music and speech. Na 112a Convenção AES, Munique, Alemanha, maio de 2002.
[0193] R. M. Aarts, E. Larsen, e O. Ouweltjes. A unified approach to low- and high frequency bandwidth extension. Na AES 115a Convenção AES, Nova York, EUA, outubro de 2003.
[0194] K. Kãyhko. A Robust Wideband Enhancement for Narrowband Speech Signal. Relatório de Pesquisa, Helsinki Universidade de Tecnologia, Laboratório de Processamento de Acústica e Sinal de Áudio, 2001.
[0195] E. Larsen e R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004.
[0196] E. Larsen, R. M. Aarts, e M. Danessis. Efficient high-frequency bandwidth extension of music and speech. Na 112a Convenção AES, Munique, Alemanha, maio de 2002.
[0197] J. Makhoul. Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU- 21(3), junho de 1973.
[0198] Pedido de Patente Norte-Americano 08/951.029, Ohmori , et al. Audio band width extending system and method.
[0199] Pedido de Patente Norte-Americano 6895375, Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech.
[0200] Frederik Nagel, Sascha Disch, “A harmonic bandwidth extension method for audio codecs,” ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, abril de 2009.
[0201] Frederik Nagel, Sascha Disch, Nikolaus Rettelbach, “A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs,” Na 126a Convenção AES, Munique, Alemanha, maio de 2009.
[0202] M. Puckette. Phase-locked Vocoder. “IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995.”, Robel, A.: Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html.
[0203] Laroche L., Dolson M.: “Improved phase vocoder timescale modification of audio”, IEEE Trans. Speech and Audio Processing, vol. 7, no. 3, pp. 323--332,.
[0204] Pedido de Patente Norte-Americano 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting.
[0205] Herre, J.; Faller, C.; Ertel, C.; Hilpert, J.; Holzer, A.; Spenger, C, “MP3 Surround: Efficient and Compatible Coding of Multi-Channel Audio,” 116a Convenção Aud. Eng. Soc., maio de 2004.
[0206] Neuendorf, Max; Gournay, Philippe; Multrus, Markus; Lecomte, Jérémie; Bessette, Bruno; Geiger, Ralf; Bayer, Stefan; Fuchs, Guillaume; Hilpert, Johannes; Rettelbach, Nikolaus; Salami, Redwan; Schuller, Gerald; Lefebvre, Roch; Grill, Bernhard: Unified Speech and Audio Coding Scheme for High Quality at Lowbitrates, ICASSP 2009, 19-24 de abril de 2009, Taipei, Taiwan. [0207] Bayer, Stefan; Bessette, Bruno; Fuchs, Guillaume; Geiger, Ralf; Gournay, Philippe; Grill, Bernhard; Hilpert, Johannes; Lecomte, Jérémie; Lefebvre, Roch; Multrus, Markus; Nagel, Frederik; Neuendorf, Max; Rettelbach, Nikolaus; Robilliard, Julien; Salami, Redwan; Schuller, Gerald: A Novel Scheme for Low Bitrate Unified Speech and Audio Coding, 126a Convenção AES, 7 de maio de 2009, München.

Claims (17)

1. APARELHO PARA PROCESSAR UM SINAL DE ÁUDIO DE ENTRADA (2300), compreendendo: um banco de filtro de síntese (2304) para sintetizar um sinal de áudio intermediário (2306) do sinal de áudio de entrada (2300), o sinal de áudio de entrada (2300) sendo representado por uma pluralidade de primeiros sinais de subfaixa (2303) gerados por um banco de filtro de análise (2302), em que um número de canais de banco de filtro (MS) do banco de filtro de síntese (2304) é menor do que um número de canais (M) do banco de filtro de análise (2302); outro banco de filtro de análise (2307) para gerar uma pluralidade de segundos sinais de subfaixa (2308) do sinal de áudio intermediário (2306), em que o outro banco de filtro de análise (2307) tem um número de canais (MA) sendo diferentes do número de canais do banco de filtro de síntese (2304), de forma que uma taxa de amostragem de um sinal de subfaixa da pluralidade de segundos sinais de subfaixa (2308) seja diferente de uma taxa de amostragem de um primeiro sinal de subfaixa da pluralidade de primeiros sinais de subfaixa (2303);e o banco de filtro de análise (2302)é configurado para receber uma representação do domínio de tempo do sinal de áudio de entrada (2300) e para analisar a representação do domínio de tempo para obter a pluralidade de primeiros sinais de subfaixa (2303), em que um subgrupo (2305) da pluralidade de primeiros sinais de subfaixa (2303) é inserido ao banco de filtro de síntese (2304), e em que os sinais de subfaixa restantes da pluralidade de primeiros sinais de subfaixa não são inseridos ao banco de filtro de síntese (2304),ou um processador de subfaixa (2309) para processar a pluralidade de segundas subfaixas (2308), caracterizado por o processador de subfaixa (2309, 1020a, 1020b) compreende, em ordens arbitrárias, um decimador controlado por um fator de extensão da largura de banda, e um extensor para um sinal de subfaixa, em que o extensor compreende um extrator de bloco (1800, 120a, 120b, 120c) para extrair um número de blocos sobrepostos de acordo com um valor de avanço de extração; um ajustador de fase (1806, 124a, 124b, 124c) ou windower (1802, 126a, 126b, 126c) para ajustar os valores de amostra da subfaixa em cada bloco com base em uma função de janela ou uma correção de fase; e um adicionador de sobreposição (1808, 130) para realizar um processo de adicionar sobreposição dos blocos em janela e ajustados por fase utilizando um valor de avanço de sobreposição maior do que o valor de avanço de extração.
2. APARELHO, de acordo com a reivindicação 1, caracterizado por o banco de filtro de síntese (2304) ser um banco de filtro com valor real.
3. APARELHO, de acordo com a reivindicação 1, caracterizado por o número de primeiros sinais de subfaixa da pluralidade de primeiros sinais de subfaixa (2303) ser maior ou igual a 24, e no qual o número de canais de banco de filtro do banco de filtro de síntese (2304) é menor ou igual a 22.
4. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 3, no qual o banco de filtro de análise (2302) é um banco de filtro com valor complexo, no qual o banco de filtro de síntese (2304) é caracterizado por compreender uma calculadora com valor real para calcular os sinais de subfaixa com valor real dos primeiros sinais de subfaixa, em que o sinais de subfaixa com valor real calculados pela calculadora com valor real são ainda processados pelo banco de filtro de síntese (2304) para obter o sinal de áudio intermediário (2306).
5. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 4, caracterizado por o outro banco de filtro de análise (2307) é um banco de filtro com valor complexo e é configurado para gerar a pluralidade de segundos sinais de subfaixa (2308) como sinais de subfaixa complexos.
6. APARELHO, de acordo com qualquer uma das reivindicações , caracterizado por o banco de filtro de síntese (2304), o outro banco de filtro de análise (2307) ou o banco de filtro de análise (2302) são configurados para utilizar versões subtestadas da mesma janela do banco de filtro.
7. APARELHO, de acordo com qualquer uma das reivindicações anteriores, é ainda caracterizado por compreender: outro banco de filtro de síntese (2311) para filtrar uma pluralidade de subfaixas processadas, em que o outro banco de filtro de síntese (2311), o banco de filtro de síntese (2304), o banco de filtro de análise (2302) ou o outro banco de filtro de análise (2307) são configurados para utilizar versões subtestadas da mesma janela do banco de filtro, ou em que o outro banco de filtro de síntese (2311) é configurado para aplicar uma janela de síntese, e em que o outro banco de filtro de análise (2307), o banco de filtro de síntese (2304) ou o banco de filtro de análise (2302) são configurados para aplicar uma versão subtestada da janela de síntese utilizada pelo outro banco de filtro de síntese (2311).
8. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 7, caracterizado por compreender um processador de subfaixa (2309)que é configurado para realizar uma operação de processamento não linear por subfaixa para obter uma pluralidade de subfaixas processadas; em que o aparelho compreende ainda um processador de reconstrução de alta frequência (1030) para ajustar um sinal de entrada, com base nos parâmetros transmitidos (1040); e outro banco de filtro de síntese (2311, 1050) para combinar o sinal de áudio de entrada (2300) e a pluralidade de sinais de subfaixa processados, em que o processador de reconstrução de alta frequência (1030) é configurado para processar uma saída do outro banco de filtro de síntese (1050, 2311) ou para processar a pluralidade de subfaixas processadas, antes da pluralidade de subfaixas processadas ser inserida ao outro banco de filtro de síntese (2311, 1050).
9. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 8, caracterizado por o banco de filtro de síntese (2304) é configurado para definir a zero uma entrada em um canal do banco de filtro mais baixo e em um canal do banco de filtro mais alto do banco de filtro de síntese (2304).
10. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 9, sendo configurado para realizar uma transposição harmônica com base em bloco, caracterizado por o banco de filtro de síntese (2304) é um banco de filtro subtestado.
11. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 10, é caracterizado por o processador de subfaixa (2309), compreender: uma pluralidade de diferentes ramificações de processamento (110a, 110b, 110c) para diferentes fatores de transposição para obter um sinal de transposição, em que cada ramificação de processamento é configurada para extrair (120a, 120b, 120c) os blocos das amostras de subfaixa; um adicionador (128) para adicionar os sinais de transposição para obter os blocos de transposição; e um adicionador de sobreposição (130) para adicionar blocos de transposição de tempo consecutivo utilizando um valor de avanço do bloco sendo maior do que um valor de avanço do bloco utilizado para extrair (120a, 120b, 120c) os blocos na pluralidade de diferentes ramificações de processamento (110a, 110b, 110c).
12. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 11, caracterizado por compreender ainda: o banco de filtro de síntese (2304) e o outro banco de filtro de análise (2307) que são configurados para realizar uma conversão da taxa de amostra, um processador de extensão de tempo (100a, 100b, 100c) para processar o sinal convertido da taxa de amostra; e um combinador (2311, 605) para combinar os sinais de subfaixa processados gerados pelo processador de extensão de tempo para obter um sinal de domínio de tempo processado.
13. APARELHO, de acordo com qualquer uma das reivindicações de 1 a 12, caracterizado por o número de canais do outro banco de filtro de análise (2307) ser maior do que o número de canais do banco de filtro de síntese (2304).
14. APARELHO PARA PROCESSAR UM SINAL DE ÁUDIO DE ENTRADA (2300), que compreende: um banco de filtro de análise (2302) tendo um número (M) de canais do banco de filtro de análise, em que o banco de filtro de análise (2302) é configurado para filtrar o sinal de áudio de entrada (2300) para obter uma pluralidade de primeiros sinais de subfaixa (2303); e um banco de filtro de síntese (2304) para sintetizar um sinal de áudio intermediário (2306) utilizando um grupo (2305) de primeiros sinais de subfaixa (2303), onde o grupo compreende um número de sinais de subfaixa menor do que o número de canais de banco de filtro do banco de filtro de análise (2302), em que o sinal de áudio intermediário (2306) é a representação subtestada de uma parte da largura de banda do sinal de áudio de entrada (2300); caracterizado por o banco de filtros de análise (2302) e o banco de filtros de síntese (2304) serem conectados de tal forma que um subgrupo (2305) da pluralidade de primeiros sinais de subfaixa (2303) é inserido ao banco de filtro de síntese (2304), e em que os sinais de subfaixa restantes da pluralidade de primeiros sinais de subfaixa não são inseridos ao banco de filtro de síntese (2304).
15. APARELHO, de acordo com a reivindicação 14, caracterizado por o banco de filtro de análise (2302) ser criticamente o banco de filtro QMF complexo testado, e no qual o banco de filtro de síntese (2304) é um banco de filtro QMF de valor real criticamente testado.
16. MÉTODO PARA PROCESSAR UM SINAL DE ÁUDIO DE ENTRADA (2300), que compreende: filtragem de síntese utilizando um banco de filtro de síntese (2304) para sintetizar um sinal de áudio intermediário (2306) do sinal de áudio de entrada (2300), o sinal de áudio de entrada (2300) sendo representado por uma pluralidade de primeiros sinais de subfaixa (2303) gerados por um banco de filtro de análise (2302), em que um número de canais de banco de filtro (MS) do banco de filtro de síntese (2304) é menor do que um número de canais (M) do banco de filtro de análise (2302); e filtragem de análise utilizando outro banco de filtro de análise (2307) para gerar uma pluralidade de segundos sinais de subfaixa (2308) do sinal de áudio intermediário (2306), em que o outro banco de filtro de análise (2307) tem um número de canais (MA) sendo diferente do número de canais do banco de filtro de síntese (2304), de forma que uma taxa de amostragem de um sinal de subfaixa da pluralidade de segundos sinais de subfaixa (2308) seja diferente de uma taxa de amostragem de um primeiro sinal de subfaixa da pluralidade de primeiros sinais de subfaixa (2303); em que o método compreende o uso do banco de filtro de análise (2302)é configurado para receber uma representação do domínio de tempo do sinal de áudio de entrada (2300) e para analisar a representação do domínio de tempo para obter a pluralidade de primeiros sinais de subfaixa (2303), em que um subgrupo (2305) da pluralidade de primeiros sinais de subfaixa (2303) é inserido ao banco de filtro de síntese (2304), e em que os sinais de subfaixa restantes da pluralidade de primeiros sinais de subfaixa não são inseridos ao banco de filtro de síntese (2304),ou em que o método compreende usar um processador de subfaixa (2309) para processar a pluralidade de segundas subfaixas (2308), caracterizado por o processador de subfaixa (2309, 1020a, 1020b) compreende, em ordens arbitrárias, um decimador controlado por um fator de extensão da largura de banda, e um extensor para um sinal de subfaixa, em que o extensor compreende um extrator de bloco (1800, 120a, 120b, 120c) para extrair um número de blocos sobrepostos de acordo com um valor de avanço de extração; um ajustador de fase (1806, 124a, 124b, 124c) ou windower (1802, 126a, 126b, 126c) para ajustar os valores de amostra da subfaixa em cada bloco com base em uma função de janela ou uma correção de fase; e um adicionador de sobreposição (1808, 130) para realizar um processo de adicionar sobreposição dos blocos em janela e ajustados por fase utilizando um valor de avanço de sobreposição maior do que o valor de avanço de extração.
17. MÉTODO PARA PROCESSAR UM SINAL DE ÁUDIO DE ENTRADA (2300), caracterizado por compreender: filtragem de análise utilizando um banco de filtro de análise (2302) tendo um número (M) de canais do banco de filtro de análise, em que o banco de filtro de análise (2302) é configurado para filtrar o sinal de áudio de entrada (2300) para obter uma pluralidade de primeiros sinais de subfaixa (2303); e filtragem de síntese utilizando um banco de filtro de síntese (2304) para sintetizar um sinal de áudio intermediário (2306) utilizando um grupo (2305) de primeiros sinais de subfaixa (2303), onde o grupo compreende um número de sinais de subfaixa menor do que o número de canais de banco de filtro do banco de filtro de análise (2302), em que o sinal de áudio intermediário (2306) é a representação subtestada de uma parte da largura de banda do sinal de áudio de entrada (2300); um subgrupo (2305) da pluralidade de primeiros sinais de subfaixa (2303) é inserido ao banco de filtro de síntese (2304), e em que os sinais de subfaixa restantes da pluralidade de primeiros sinais de subfaixa não são inseridos ao banco de filtro de síntese (2304).
BR122021019078-0A 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata BR122021019078B1 (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US31212710P 2010-03-09 2010-03-09
US61/312,127 2010-03-09
BR112012022574-0A BR112012022574B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata
PCT/EP2011/053315 WO2011110500A1 (en) 2010-03-09 2011-03-04 Apparatus and method for processing an input audio signal using cascaded filterbanks

Publications (1)

Publication Number Publication Date
BR122021019078B1 true BR122021019078B1 (pt) 2022-05-03

Family

ID=81581648

Family Applications (1)

Application Number Title Priority Date Filing Date
BR122021019078-0A BR122021019078B1 (pt) 2010-03-09 2011-03-04 Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Country Status (1)

Country Link
BR (1) BR122021019078B1 (pt)

Similar Documents

Publication Publication Date Title
US20240135939A1 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 04/03/2011, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.

B25G Requested change of headquarter approved

Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V. (DE) ; DOLBY INTERNATIONAL AB (IE)