BRPI0304231B1 - Method for codifying a multiple channel signal, method and arrangement for decoding multiple channel signal information, provision for coding a multiple channel sign, data sign including multiple channel signal information, and a communication device multi-channel signal - Google Patents

Method for codifying a multiple channel signal, method and arrangement for decoding multiple channel signal information, provision for coding a multiple channel sign, data sign including multiple channel signal information, and a communication device multi-channel signal Download PDF

Info

Publication number
BRPI0304231B1
BRPI0304231B1 BRPI0304231B1 BR PI0304231 B1 BRPI0304231 B1 BR PI0304231B1 BR PI0304231 B1 BRPI0304231 B1 BR PI0304231B1
Authority
BR
Brazil
Prior art keywords
signal
main
transformation
channel
channel signal
Prior art date
Application number
Other languages
English (en)
Publication date

Links

Description

“MÉTODO PARA CODIHCAÇÀO DE UM SINAL DE CANAIS MÚLTIPLOS, MÉTODO E DISPOSIÇÃO PARA DECODIFICAÇÃO DE INFORMAÇÃO DE SINAL DE CANAIS MÚLTIPLOS, DISPOSIÇÃO PARA CODIFICAÇÃO DE UM SINAL DE CANAIS MÚLTIPLOS, SINAL DE DADOS INCLUINDO INFORMAÇÃO DE SINAL DE CANAIS MÚLTIPLOS, E DISPOSITIVO PARA COMUNICAÇÃO DE UM SINAL DE CANAIS MÚLTIPLOS” Esta invenção se refere à codificação de sinais de canais múltiplos incluindo pelo menos um primeiro e um segundo componente de sinal. Mais parti eu larmente, a invenção se refere à codificação de sinais de áudio multifônicos, tais como sinais estereofônicos.
Os sinais de áudio estereofônicos compreendem um componente de sinal esquerdo (L) e um direito (R), os quais podem se originar de uma fonte de sinal estéreo, por exemplo, de microfones separados. A codificação de sinais de áudio tem o objetivo de reduzir a taxa de bit de um sinal estereofônico, por exemplo, para permitir uma eficiente transmissão de sinais dc som através dc uma rede dc comunicação, tal como a Internet, através de um modem e linhas telefônicas analógicas, canais de comunicação móvel ou de outras redes sem fio, etc., e para armazenar um sinal de som estereofônico em um cartão de ehip ou em outro meio de armazenamento com limitada capacidade de armazenamento. A Patente U.S. 4.589.127 revela um transmissor para sinais estereofônicos, os quais geram sinais de soma e diferença dos sinais L e R estéreo. Os sinais de soma e diferença são subseqüentemente usados em um esquema de modulação, resultando em um sinal modulado compreendendo tanto a informação dc soma quanto dc diferença.
Todavia, o método da técnica anterior acima não aborda o problema de codificar um sinal estéreo com uma eficiente utilização de taxa de bit, isto é, com uma baixa taxa de bit para uma dada qualidade de som.
Os problemas acima e outros são solucionados por um método para codificar um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, o método compreendendo as etapas de transformar pelo menos o primeiro e o segundo componentes de sinal por meio de uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e representar o sinal de canais múltiplos pelo menos por meio do sinal principal e do parâmetro de transformação.
Consequentemente, por meio da transformação do sinal de canais múltiplos em um sinal principal, o qual inclui a maioria da energia, e em um sinal residual, o qual somente inclui pouca energia de sinal, o sinal de canais múltiplos pode ser representado pelo sinal principal, pelo parâmetro de transformação, e, opcionalmente, por um pequeno sinal residual, desta maneira aperfeiçoando a eficiência de codificação para o sinal de canais múltiplos. Efetivamente, o sinal de canais múltiplos pode ser codificado com uma taxa de bit que é somente ligeiramente mais elevada do que aquela de um canal simples, por exemplo, um mono-canal. O sinal codificado resultante pode ser armazenado e/ou comunicado em/a um receptor.
Quando o método também compreende a etapa de determinar adaptativamente o parâmetro de transformação com base pelo menos no primeiro e segundo componentes de sinal, o parâmetro de transformação ótimo pode ser continuamente rastreado, através disto assegurando que a transformação permaneça ótima, até mesmo se as características do sinal de entrada se alterarem, ou seja, no exemplo de um sinal de áudio, em virtude de uma fonte de som móvel ou de alterações nas propriedades acústicas do ambiente.
Quando a transformação predeterminada é uma rotação e o parâmetro de transformação corresponde a um ângulo de rotação, uma transformação simples é provida, com base somente em um único parâmetro, o ângulo de rotação. Por meio da adaptação do ângulo de modo que os componentes de sinal, por exemplo, os componentes de sinal L e R de um sinal estéreo, são girados para um sinal de componente principal e um sinal residual, uma eficiente codificação é provida, enquanto é mantido um sinal de elevada qualidade.
Em uma forma de realização preferida da invenção, a etapa de representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação também compreende a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação e pelo sinal residual, desta maneira melhorando ainda mais a qualidade do sinal codificado, como se informação de sinal fosse descartada. Como o sinal residual é pequeno em comparação com o sinal principal, a alocação de bit pode ser negociada entre aqueles sinais. Além disto, como a alocação de taxa de bit pode ser variada, um mecanismo para degradação elegante é provido, por exemplo por meio da elevação ou diminuição adaptativamente da taxa de bit permitida para o sinal residual.
Conseqüentemente, em uma outra forma de realização preferida, a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação e pelo sinal residual também compreende as etapas de: codificar o sinal principal com uma primeira taxa de bit; e codificar o sinal residual com uma segunda taxa de bit menor do que a primeira taxa de bit.
Em outra forma de realização preferida o método também compreende a etapa de estimar o sinal residual a partir do sinal principal usando um filtro de predição correspondendo a um conjunto de parâmetros de filtro; e a etapa de representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação compreende a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação, e pelo conjunto de parâmetros de filtro.
Esta forma de realização da invenção é baseada no reconhecimento que, para muitos sinais de canais múltiplos, por exemplo no caso de sinais de áudio para música e sinais de voz, o sinal residual pode ser estimado como uma versão filtrada do sinal principal. Conseqüentemente, quando da determinação de um conjunto de parâmetros de filtro de um filtro adaptativo, o qual modela o sinal residual, os parâmetros de filtro podem ser codificados juntamente com o sinal principal e o parâmetro de transformação. Conseqüentemente, a comunicação do sinal residual é evitada, sem perder a informação incluída neste sinal, desta maneira provendo uma codificação eficiente que preserva um alto nível de qualidade. r E uma vantagem da invenção o fato de que ela provê uma eficiente utilização de taxa de bit, isto é, um esquema de codificação, o qual usa uma baixa taxa de bit para uma dada qualidade de som. O esquema de codificação, de acordo com a invenção, pode ser usado para reduzir a taxa de bit, sem significantemente reduzir a qualidade de som, para manter a taxa de bit, enquanto melhora a qualidade de som, ou uma combinação dos acima. A invenção também se refere a um método para decodificação de informação de sinal de canais múltiplos, o método compreendendo as etapas de: receber um sinal principal e um parâmetro de transformação, o sinal principal correspondendo a um resultado de uma transformação predeterminada de pelo menos um primeiro e um segundo componentes de sinal de um sinal de fonte de canais múltiplos, a transformação predeterminada sendo parametrizada por meio de pelo menos o parâmetro de transformação; e gerar um primeiro e um segundo componentes de sinal decodificados por meio da transformação inversa do sinal principal recebido e pelo menos de um sinal residual. A presente invenção pode ser implementada em diferentes maneiras, incluindo os métodos descritos acima e nas disposições que seguem para codificação e decodificação de sinais de canais múltiplos, respectivamente, um sinal de dados, e outros meios de produto, cada um produzindo um ou mais dos benefícios e vantagens descritos em conexão com o primeiro método mencionado, e cada um tendo uma ou mais formas de realização preferidas correspondentes às formas de realização descritas em conexão com o primeiro método mencionado e revelado nas reivindicações dependentes. É notado que as características dos métodos descritos acima e a seguir podem ser implementadas em software e executadas em um sistema de processamento de dados ou em outros meios de processamento, causadas pela execução de instruções executáveis por computador. As instruções podem ser meios de código de programa, carregados em uma memória, tal como uma RAM, a partir de um meio de armazenamento ou a partir de outro computador através de uma rede de computadores. Altemativamente, as características descritas podem ser implementadas por meio de circuitos na forma de condutores físicos, em lugar de software, ou em combinação com software. A invenção também se refere a uma disposição para codificação de um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, a disposição compreendendo: primeiros meios de processamento, adaptados para transformar pelo menos o primeiro e o segundo componentes de sinal por meio de uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos em um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e segundos meios de processamento, adaptados para representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação. A invenção também se refere a uma disposição para decodificação de informação de sinal de canais múltiplos, a disposição compreendendo: meios de recepção, para receber um sinal principal e um parâmetro de transformação, o sinal principal correspondendo a um resultado de uma transformação predeterminada de um primeiro e de um segundo sinais de fonte de canais múltiplos, a transformação predeterminada sendo parametrizada por meio de pelo menos o parâmetro de transformação; e meios de processamento para gerar um primeiro e um segundo sinais de canais múltiplos por transformação inversa do sinal principal recebido e de um sinal residual.
As disposições acima podem ser parte de qualquer equipamento eletrônico incluindo computadores, tais como PCs estacionários e portáteis, equipamentos de comunicação a rádio estacionários e portáteis, e outros dispositivos portáteis e que cabem na palma da mão, tais como telefones móveis, radiolocalizadores, unidades leitoras de áudio, unidades leitoras de multimídia, comunicadores, isto é, organizadores eletrônicos, telefones inteligentes, assistentes digitais pessoais (PDAs), computadores portáteis, ou similares. 0 termo meios de processamento compreende microprocessadores programáveis de finalidade geral ou especial, Processadores de Sinal Digital (DSP), Circuitos Integrados Específicos de Aplicação (ASICS), Arranjos Lógicos Programáveis (PLA), Arranjos de Porta Programáveis por Campo (FPGA), circuitos eletrônicos de finalidade especial, etc., ou uma combinação dos mesmos. Os acima primeiro e segundo meios de processamento podem ser meios de processamento separados ou eles podem ser compreendidos em um meio de processamento. O termo meios de recepção inclui circuitos e/ou dispositivos adequados para permitir a comunicação de dados, por exemplo através de uma ligação de dados por fios ou uma sem fios. Exemplos de tais meios de recepção incluem uma interface de rede, uma placa de rede, um receptor de rádio, um receptor para outros sinais eletromagnéticos adequados, tais como luz infravermelha, por exemplo através de uma porta IrDa, comunicação baseada em rádio, por exemplo, transreceptores Bluetooth, ou similares. Outros exemplos de tais meios de recepção incluem um modem a cabo, um modem telefônico, um adaptador de Rede Digital de Serviços Integrados (ISDN), um adaptador de Linha de Subscritor Digital (DSL), um transreceptor de satélite, um adaptador de Ethernet, ou similares. O termo meios de recepção também compreende outros circuitos/dispositivos de entrada para receber sinais de dados, por exemplo sinais de dados armazenados em um meio legível por computador. Exemplos de tais meios de recepção incluem uma unidade leitora de disco flexível, uma unidade leitora de CD-ROM, uma unidade leitora de DVD, ou qualquer outra unidade leitora de disco adequada, um adaptador de cartão de memória, um adaptador de cartão inteligente, etc. A invenção também se refere a um sinal de dados incluindo informação de sinal de canais múltiplos, o sinal de dados sendo gerado por um método descrito acima e a seguir. O sinal pode ser incorporado como um sinal de dados em uma onda portadora, por exemplo como um sinal de dados transmitido por meio de meios de comunicação, como descritos acima e a seguir. A invenção também se refere a um meio legível por computador compreendendo um registro de dados indicativo da informação de sinal de canais múltiplos, gerada por um método descrito acima e a seguir. O termo meio legível por computador compreende fita magnética, disco óptico, disco de vídeo digital (DVD), disco compacto (CD ou CD-ROM), mini-disco, disco rígido, disco flexível, memória ferro-elétrica, memória de apenas leitura programável, apagável eletricamente, (EEPROM), memória-flash, EPROM, memória de apenas leitura (ROM), memória de acesso aleatório estático (SRAM), memória de acesso aleatório dinâmico (DRAM), memória de acesso aleatório dinâmico síncrono (SDRAM), memória ferromagnética, armazenamento óptico, dispositivos acoplados de carga, cartões inteligentes, cartão PCMCIA, etc. A invenção também se refere a um dispositivo para comunicação de um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, o dispositivo compreendendo uma disposição para codificar o sinal de canais múltiplos, como descrito acima e a seguir.
Estes e outros aspectos da invenção ficarão aparentes a partir das, e elucidados com referência às, formas de realização, e com referência ao desenho, no qual: a figura 1 mostra uma vista esquemática de um sistema para comunicação de sinais estéreo, de acordo com uma forma de realização da invenção; a figura 2 mostra uma vista esquemática de uma disposição para codificar um sinal estéreo, de acordo com uma primeira forma de realização da invenção; a figura 3 ilustra a determinação da transformação de sinal, de acordo com uma forma de realização da invenção; a figura 4 mostra uma vista esquemática de uma disposição para decodificar um sinal estéreo, de acordo com uma primeira forma de realização da invenção; a figura 5 mostra uma vista esquemática de uma disposição para codificar um sinal estéreo, de acordo com uma segunda forma de realização da invenção; a figura 6 mostra uma vista esquemática de uma disposição para decodificar um sinal estéreo, de acordo com uma segunda forma de realização da invenção; as figuras 7a-c mostram vistas esquemáticas de exemplos de um circuito de filtro para uso em uma forma de realização da invenção; a figura 8 mostra uma vista esquemática de uma disposição para codificar um sinal estéreo, de acordo com uma terceira forma de realização da invenção; a figura 9 mostra uma vista esquemática de uma disposição para codificar um sinal estéreo, de acordo com uma quarta forma de realização da invenção; a figura 10 mostra uma vista esquemática de uma disposição para decodificar um sinal estéreo, de acordo com uma quarta forma de realização da invenção; a figura 11 mostra uma vista esquemática de uma disposição para codificar um sinal de canais múltiplos, de acordo com uma quinta forma de realização da invenção; a figura 12 mostra uma vista esquemática de uma disposição para codificar um sinal de canais múltiplos, de acordo com uma sexta forma de realização da invenção; e a figura 13 mostra uma vista esquemática de um circuito de subtração para uso com uma forma de realização da invenção. A figura 1 mostra uma vista esquemática de um sistema para comunicação de sinais estéreo, de acordo com uma forma de realização da invenção. O sistema compreende um dispositivo de codificação 101, para gerar um sinal estereofônico codificado, e um dispositivo de decodificação 105, para decodificar um sinal codificado recebido em um componente de sinal estéreo L e um componente de sinal estéreo R. O dispositivo de codificação 101 e o dispositivo de decodificação 105, cada, podem ser qualquer equipamento eletrônico ou parte de tal equipamento. Aqui, o termo equipamento eletrônico compreende computadores, tais como PCs estacionários e portáteis, equipamentos de comunicação a rádio estacionários e portáteis, e outros dispositivos portáteis ou que cabem na palma da mão, tais como telefones móveis, radiolocalizadores, unidades leitoras de áudio, unidades leitoras de multimídia, comunicadores, isto é, organizadores eletrônicos, telefones inteligentes, assistentes digitais pessoais (PDAs), computadores portáteis, ou similares. É notado que o dispositivo de codificação 101 e o dispositivo de decodificação 105 podem ser combinados em um equipamento eletrônico, onde sinais estereofônicos são armazenados em um meio legível por computador para a posterior reprodução. O dispositivo de codificação 101 compreende um codificador 102 para codificar um sinal estereofônico, de acordo com a invenção, o sinal estereofônico incluindo um componente de sinal L e um componente de sinal R. O codificador recebe os componentes de sinal L e R e gera um sinal codificado T. Os sinais estereofônicos L e R podem se originar de um conjunto de microfones, por exemplo através de um outro equipamento eletrônico, tal como um equipamento de mixagem, etc. Os sinais podem ser também recebidos como uma saída a partir de uma outra unidade leitora estéreo, através do ar como um sinal de rádio, ou por qualquer outro meio adequado. Formas de realização preferidas de um tal codificador de acordo com a invenção serão descritas abaixo. De acordo com uma forma de realização, o codificador 102 é conectado a um transmissor 103 para transmitir o sinal codificado T , através de um canal de comunicação 109, para o dispositivo de codificação 105. O transmissor 103 pode compreender circuitos adequados para permitir a comunicação de dados, por exemplo através de uma ligação de dados por fios ou em fios 109. Exemplos de um tal transmissor incluem uma rede, interface, uma placa de rede, um transmissor a rádio, um transmissor para outros sinais eletromagnéticos adequados, tal como um LED, para transmitir luz infravermelha, por exemplo através de uma porta de IrDa, comunicação baseadas em rádio, por exemplo através de um transreceptor de Bluetooth, ou similares. Outros exemplos de transmissores adequados incluem um modem a cabo, um modem para telefone, um adaptador de Rede Digital de Serviços Integrados (ISDN), um adaptador de Linha de Subscritor Integrada (DSL), um transreceptor de satélite, um adaptador de Ethernet, ou similares. Correspondentemente, o canal de comunicação 109 pode ser qualquer ligação de dados adequado, com fios ou sem fios, por exemplo de uma rede de comunicação baseada em pacotes, tal como a Internet ou uma outra rede de TCP/IP, uma ligação de comunicação de curta amplitude, tal como uma conexão a raios infravermelhos, uma conexão de Bluetooth ou uma outra ligação baseada em rádio. Outros exemplos de do canal de comunicação incluem redes de computadores e redes de telecomunicações sem fios, tais como uma rede de Dados em Pacote Digitais Celulares (Cellular Digital Packet Data) (CDPD), uma rede de Sistema Global para Comunicações Móveis (Global System for Mobile Communications) (GSM), uma rede de Acesso Múltiplo por Divisão de Código (Code Division Multiple Access) (CDMA), uma rede de Acesso Múltiplo por Divisão no Tempo (Time Division Multiple Access NetWork) (TDMA), uma rede de serviço a Rádio por Pacote Geral (General Packet Radio service) (GPRS), uma rede de terceira geração, tal como uma rede de UMTS, ou similares. Altemativamente ou adicionalmente, o dispositivo de codificação pode compreender uma ou mais outras interfaces 104 para comunicar o sinal estéreo codificado T ao dispositivo de codificação 105. Exemplos de tais interfaces incluem uma unidade leitora de disco para armazenar dados em um meio legível por computador 110, por exemplo uma unidade leitora de disco flexível, uma unidade leitora de CD-ROM de leitura/escrita , uma unidade leitora de DVD. Outros exemplos incluem um espaço de placa de memória, um dispositivo de leitura/escrita de cartão magnético, uma interface para acessar um cartão inteligente, etc. Correspondentemente, o dispositivo de codificação 105 compreende um correspondente receptor 108 para receber o sinal transmitido pelo transmissor e/ou uma outra interface 106 para receber o sinal estéreo codificado, comunicado através da interface 104 e do meio legível por computador 110. O dispositivo de decodificação também compreende um decodificador 107, o qual recebe o sinal recebido T e o decodifica nos correspondentes componentes estéreo L’ e R\ Formas de realização preferidas de um tal decodificador de acordo com a invenção serão descritas abaixo. Os sinais decodificados L’ e R’ podem ser subseqüentemente alimentados em uma unidade reprodutora estéreo para reprodução através de um conjunto de alto-falantes, auscultadores, ou similares. A figura 2 mostra uma vista esquemática de uma disposição 102 para codificar um sinal estéreo, de acordo com uma primeira forma de realização da invenção. A disposição compreende circuitos 201 para executar uma rotação do sinal estéreo no espaço L-R por um ângulo a, resultando em componentes de sinal girados y e r, de acordo com a transformação y = L cos α + R sen α = wL L + wR R r = -Lsena + Rcosa = -WrL + wlR, (1) onde wL = cos α e wR = sen α serão referidos como fatores de ponderação.
De acordo com a invenção, o ângulo α é determinado de modo que ele corresponde a uma direção de elevada variância de sinal, isto é, o componente principal pode ser estimado por meio de uma análise de componente principal, de modo que o componente y girado corresponde ao sinal de componente principal, o qual inclui a maioria da energia de sinal, e r é um sinal residual. Correspondentemente, a disposição da figura 2 compreende circuitos 200 que determinam o ângulo α ou, altemativamente, os fatores de peso wL e wR.
Com referência à figura 3, de acordo com uma forma de realização preferida, os fatores de peso acima wL e wR são determinados de acordo com o seguinte algoritmo: Inicialmente, os sinais estéreos de chegada L e R são retificados e filtrados em passa-baixa, resultando em sinais de envoltório p(k) e q(k), respectivamente, onde p(k) e q(k) são adequadamente amostrados e o índice de amostra é denotado por k. Deste modo, o vetor x(k) = (p(k), q(k)) denota o vetor de sinal de chegada. Altemativamente, os sinais L e R podem ser usados diretamente, isto é, sem filtragem, ou podem ser usadas outras versões de L e R, por exemplo sinais L e R filtrados por passa-alta. Na figura 3, inúmeros pontos de sinal estão ilustrados como círculos. Como um exemplo, o ponto de sinal x(k) e seus correspondentes componentes p(k) e q(k) estão indicados. De acordo com a invenção, os sinais são girados na direção do componente principal dos vetores de sinal. No exemplo da figura 3, isto corresponde à direção y, onde α é um ângulo entre a direção y e a direção p. O vetor de peso w = (wL, wR) indica a direção do componente principal, e os componentes girados de x(k) são denotados por y(k) e r(k), respectivamente. O componente principal pode ser determinado por qualquer método adequado conhecido na técnica. Em uma forma de realização particularmente vantajosa, é usado um método iterativo utilizando a regra de Oja (Oja’s rule) (ver, por exemplo, S. Haykin: “Neural Networks”, Prentice Hall, N.J., 1999). De acordo com esta forma de realização, o vetor de peso w é iterativamente estimado de acordo com a seguinte equação: w(k) + w(k-l) + μ [x(k-1) - w(k-1) y(k-1)], (2) onde w(k) = ( wL(k), wR(k) ) corresponde à estimativa no instante k. A iteração acima pode, por exemplo, ser iniciada com um grupo de pequenos pesos aleatórios w(0), ou de qualquer outra maneira adequada. O vetor de peso, acima estimado, pode ser usado para calcular o sinal girado de acordo com y(k) = w (k)x(k). Altemativamente, a iteração da equação (2) pode ser realizada em uma base de bloco, por exemplo para um bloco de N amostras, onde N depende da implementação particular, por exemplo, N = 512, 1024, 2048, etc. Nesta forma de realização, o vetor de peso estimado w(N) para um bloco pode ser usado na transformação de todas amostras daquele bloco, de acordo com y(k) = wT(N)x(k). O fator μ na equação (2) corresponde a uma escala de tempo do algoritmo de rastreamento. Se μ = 0, os fatores de ponderação e, assim, o ângulo a, permanecem constantes, enquanto eles se alteram rapidamente para grande μ. Como um exemplo, para um tamanho de bloco de 2048 amostras, μ pode ser selecionado na ordem de 10'3 para uma taxa de amostragem de 44,1 kHz. É uma vantagem do algoritmo iterativo acima que ele é linear, isto é, não requer o cálculo de quaisquer funções trigonométricas, raízes quadradas ou similares. É uma outra vantagem que a iteração acima produz um vetor de peso normalizado w, pois o termo - pw(k-l)y(k-l) na equação (2) corresponde a um termo de decaimento de peso penalizando grandes pesos, enquanto o termo +μ x(k-l) aciona o vetor de peso na direção do componente principal. É também notado que, na presente forma de realização, vez que x(k) é o sinal de envoltório, wL, wR € [0,1], isto é, o vetor de peso w situa-se no primeiro quadrante na figura 3, desta maneira assegurando que μ é positivo. É uma outra vantagem desta forma de realização, que ela é suficiente para transmitir um dos wL e wR, pois o outro fator pode ser determinado de acordo com . Altemativamente, o ângulo α pode ser transmitido.
Novamente com referência à figura 2, o circuito 200 fornece o ângulo α determinado ou, altemativamente, um ou ambos os fatores de peso wL e wR. A informação de ângulo é alimentada no circuito de rotação 201, o qual gera os componentes de sinal girados y e r. É entendido que os circuitos 200 e 201 podem ser combinados em um único circuito que executa o cálculo iterativo da equação (2) e o cálculo de y e r de acordo com a equação (1). A disposição também compreende codificadores 202 que executam uma codificação adequada dos sinais y e r, respectivamente. Por exemplo, os sinais podem ser codificados de acordo com MPEG, por exemplo camada e de MPEG Instalação de energia eólica (MP3), de acordo com codificação senoidal (SSC), ou esquemas de codificação de áudio baseados em sub-banda, paramétricos, ou esquemas de transformação, ou quaisquer outros esquemas adequados ou combinações dos mesmos. É entendido que os codificadores 202 podem ser do mesmo tipo ou de tipos diferentes, por exemplo um codificador de MP3 e um codificador de SSC, etc. Os resultantes sinais codificados ye e re, respectivamente, são alimentados em um circuito de combinador 204 juntamente com a informação de ângulo α. O circuito de combinador 204 executa enquadramento, alocação de taxa de bit, e codificação sem perdas, resultando em um sinal combinado T a ser comunicado. Em uma forma de realização, o ângulo α ou, altemativamente, wL e/ou wR , podem ser comunicados como parte de um cabeçalho transmitido antes para um quadro de sinal, um bloco de sinal ou similar. De acordo com a invenção, quando o ângulo de transformação α é rastreado, de modo que o sinal de componente principal inclui a maioria da energia de sinal, as taxas de bit, alocadas aos sinais de y e r, podem ser selecionadas para ser em diferentes, desta maneira otimizando a eficiência de codificação.
Por exemplo, os sinais estéreo L e R podem ser expressos como L = M + SeR = M-S, onde M corresponde a um sinal médio ou central e S corresponde a um sinal estéreo ou lateral. No caso de uma gravação acústica de uma fonte de som estacionária, por exemplo um alto-falante gravado por dois microfones, os sinais L e R são substancialmente iguais, se o alto-falante for posicionado exatamente entre os microfones e assumindo que não existem distorções acústicas, tais como reflexões, etc. Conseqüentemente, neste caso, S é substancialmente zero ou pelo menos pequeno, e o esquema de codificação de acordo com a invenção substancialmente produz y correspondente a L+R e r correspondente a L - R sendo zero ou pequeno; isto corresponde a α = 45 graus. Se o alto-falante não for posicionado exatamente entre os microfones, isto é, existe uma assimetria, mas ainda assumindo que não existem reflexões ou outras distorções, o sinal girado y, de acordo com a invenção, também corresponde ao alto-falante e o sinal residual r é substancialmente zero. Todavia, neste caso, o ângulo α difere de 45 graus. Se a fonte de som se mover, por exemplo, da esquerda para a direita, o método de acordo com a invenção ainda produz um sinal de componente principal y correspondente à fonte, e um pequeno sinal residual r, idealmente sendo r = 0. Neste caso, α se altera de 0 (totalmente à esquerda) para 90° (totalmente à direita). O exemplo acima ilustra a vantagem de rastrear o ângulo a. Nas situações acima, pode ser suficiente transmitir o sinal de componente principal y e o ângulo a, para permitir que o decodificador reconstrua os sinais originais R e L, sem uma perda significante em qualidade. Em geral, como o sinal residual r é pequeno, em comparação como sinal principal, a alocação de bit ou eficiência de codificação é negociável entre y e r. Conseqüentemente, é uma vantagem da invenção o fato de que ela permite uma codificação eficiente de sinais estéreo. A figura 4 mostra uma vista esquemática de uma disposição 107 para decodificação de um sinal estéreo de acordo com a primeira forma de realização da invenção. A disposição recebe um sinal estéreo codificado T, por exemplo se originando de um codificador de acordo com a forma de realização descrita em conexão com a figura 2. A disposição compreende um circuito 404 para extrair os sinais codificados ye e re e a informação de ângulo oc a partir do sinal combinado T, isto é, o circuito 404 executa uma operação inversa do combinador 204 da figura 2. Os sinais extraídos ye e re são alimentados nos correspondentes decodificadores 402 executando decodificação de áudio, correspondente à codificação executada pelos codificadores 202 da figura 2, resultando no sinal de componente principal decodificado y’ e no sinal residual decodificado r\ Os sinais y’, r’ e a informação de ângulo α são alimentados em um circuito de rotação 401, o qual gira os sinais y’, r’ de volta na direção dos componentes L e R originais, resultando assim nos sinais recebidos L’ e R’. A figura 5 mostra uma vista esquemática de uma disposição para codificação de um sinal estéreo, de acordo com uma segunda forma de realização da invenção. A disposição compreende circuitos 201 executando uma rotação dos sinais estéreo L e R por um ângulo a, resultando em componentes de sinal ver girados, como descrito em conexão com a figura 2. A disposição também compreende circuitos 200 para a determinação do ângulo de rotação, como descrito em conexão com as figuras 2 e 3. De acordo com esta forma de realização da invenção, é reconhecido que o sinal residual r pode ser estimado como uma versão filtrada do sinal principal y. Como descrito em conexão com a figura 2, em uma gravação acústica de uma fonte de áudio, gravada por dois microfones na ausência de distorções acústicas, por exemplo devidas a reflexões, etc., o sinal principal y corresponde à fonte de áudio e o sinal residual é substancialmente zero. Todavia, em uma situação mais realística, distorções estão presentes, por exemplo em virtude de reflexões do sinal sobre as paredes de um recinto e na cabeça e torso do alto-falante, etc. Estes efeitos influenciam o sinal residual r. Conseqüentemente, quando da estimativa do sinal residual por meio de um filtro, o filtro, com efeito, modela as características acústicas do recinto, etc. Para uma orquestra clássica, a situação é similar, enquanto que no caso de música pop moderna, a situação pode ser ligeiramente diferente. Neste caso, um engenheiro de som, tipicamente, faz a mixagem de múltiplos canais em dois canais, freqüentemente usando reverberação artificial, caixas de efeito, etc. Neste caso, o filtro modela os efeitos acústicos introduzidos pelo processo de mixagem.
Ainda com referência à figura 5, a disposição compreende um filtro adaptativo 501 que recebe o sinal principal y como uma entrada e gera um sinal filtrado Ar. Os parâmetros de filtro Fp do filtro adaptativo são selecionados de modo que o sinal filtrado Ar se aproxima do sinal residual r, por exemplo, por meio do controle do filtro adaptativo 501 pelo sinal de erro e que indica a diferença entre r e Ar, como gerados por meio de um circuito de subtração 502. Os resultantes parâmetros de filtro Fp são alimentados em um circuito de combinador 204, preferivelmente após uma adequada codificação por meio de um codificador 503, por exemplo um codificador que provê uma codificação de Huffman ou qualquer outro esquema de codificação adequado. O filtro 501 pode ser qualquer filtro adequado conhecido na técnica. Exemplos de tais filtros incluem um filtro de resposta de, adaptativo ou fixo, com as ffeqüências e magnitudes de corte sendo fixadas ou rastreadas recursivamente, ou similar. O filtro pode ser de qualquer ordem, preferivelmente menor do que 10. O tipo do filtro pode ser Butterworth, Chebychev, ou qualquer outro tipo adequado de filtro. A disposição também compreende um codificador 202 para codificar o sinal principal, como descrito em conexão com a figura 2, resultando no sinal principal codificado ye, o qual é alimentado no circuito de combinador 204 juntamente com os parâmetros de filtro Fp e a informação de ângulo a. Como descrito em conexão com a figura 2, o circuito de combinador 204 executa enquadramento, alocação de taxa de bit, e codificação sem perdas, resultando em um sinal combinado T a ser comunicado, o qual inclui o sinal principal codificado ye, os parâmetros de filtro Fp e a informação de ângulo a. De acordo com esta forma de realização da invenção, a taxa de bit a ser alocada aos parâmetros de filtro Fp pode ser consideravelmente menor do que a taxa de bit necessária para o sinal principal y, por exemplo, em uma forma de realização, a taxa de bit para Fp pode, na média, ser menor que 10% da taxa de bit para y. Conseqüentemente, é uma vantagem da invenção o fato de que ela reduz a taxa de bit necessária para a transmissão de um sinal estéreo. A taxa de bit total, de acordo com a invenção, é somente ligeiramente mais elevada do que para um único canal mono. É notado, contudo, que esta relação pode variar durante uma gravação. Por exemplo, a relação pode se tomar menor, por exemplo em uma situação com poucas distorções e uma fonte estacionária, mas também pode se tomar maior, por exemplo, se os sinais L e R forem momentaneamente independentes. A figura 6 mostra uma vista esquemática de uma disposição 107 para decodificação de um sinal estéreo, de acordo com a segunda forma de realização da invenção. A disposição recebe um sinal estéreo codificado T, por exemplo originando-se de uma codificação de acordo com a forma de realização descrita em conexão com a figura 5. A disposição compreende um circuito 404 para extrair o sinal codificado ye, os parâmetros de filtro Fp, e a informação de ângulo a, a partir do sinal combinado T, isto é, o circuito 404 executa uma operação inversa à do combinador 404 da figura 5. O sinal extraído ye é alimentado em um decodificador 402 para executar decodificação de áudio, correspondente à codificação executada pelo codificador 202 da figura 5, resultando no sinal de componente principal decodificado y\ Preferivelmente, os parâmetros de filtro são decodificados por meio de um decodificador 602 correspondente à codificação dos parâmetros de filtro por meio do codificador 503 da figura 5. O sinal y’ é alimentado em um filtro 601, juntamente com os parâmetros de filtro recebidos Fp. O filtro 601 gera um correspondente sinal residual estimado r . O sinal de componente principal recebido y’, o sinal residual estimado r' e a informação de ângulo α recebida são alimentados em um circuito de rotação 401, o qual gira óu roda os sinais y’, r' de volta na direção dos componentes originais L e R, resultando assim nos sinais recebidos L’ e R\ Na forma de realização descrita em conexão com as figuras 5 e 6, os filtros 501 e 601 podem ser um filtro adaptativo padrão no domínio temporal ou de tempo (ver, por exemplo, “Adaptive Filter Theory”, de S. Haykin, Prentice Hall, 2001), por exemplo, um filtro adaptativo conhecido do campo de cancelamento de eco. Outros exemplos de filtros incluem um filtro fixo FIR ou IIR, com uma freqüência e magnitude de ffeqüência de corte fixa ou adaptativa. Altemativamente, em uma forma de realização, o filtro pode ser baseado em um modelo psico-acústico do sistema auditivo humano, por exemplo como é conhecido de codificação de MPEG, deste modo reduzindo o número de parâmetros de filtro. De acordo com ainda uma outra forma de realização, o filtro é ainda mais simplificado, por exemplo por meio do uso de um filtro de 10a ordem, que usa 5 filtros BiQuadráticos e uma unidade de reverberação artificial. Nesta forma de realização, no lado de codificação, o filtro é equipado e o tempo de reverberação é determinado. Estes parâmetros são lentamente variáveis, deste modo reduzindo a necessária taxa de bit para sua transmissão.
As figuras 7a-c mostram vistas esquemáticas de exemplos de um circuito de filtro para uso em uma forma de realização da invenção.
No exemplo da figura 7a, o filtro 501 compreende uma combinação de um filtro 701 e um filtro de reverberação 702. Por exemplo, o filtro 701 pode ser um filtro adaptativo padrão no domínio temporal ou de tempo, um filtro FIR ou IIR fixo com uma freqüência e magnitude de corte fixas ou adaptativa, etc., por exemplo um filtro de passa-alta. De acordo com esta forma de realização, ambos, os parâmetros de filtro do filtro 701 e os parâmetros do filtro de reverberação 702, tal como o tempo de reverberação denotado por T6o, são transmitidos para o decodificador como parâmetros de filtro Fp.
No exemplo da figura 7b, em adição aos filtros 701 e 702, dois circuitos de controle 703 - 704 são adicionados. Um circuito de controle 703 é adicionado para assegurar que a potência média do sinal residual r e a potência média da saída do reverberador 702 sejam aproximadamente a mesma, por exemplo por meio da multiplicação da saída do reverberador 702 por um parâmetro βι. Um segundo circuito de controle 704 multiplica a saída escalada do reverberador por β2. O fator β2 pode ser selecionado na faixa entre - 3dBe + 6dB, eé determinado e modo que a correlação cruzada p entre r e r é tão elevada quanto possível, isto é, que os sinais re r são tão similares quanto possível. Consequentemente, a disposição de filtro da figura 7b também compreende um circuito 705 para determinar a correlação cruzada p. A disposição de filtro também compreende um multiplicador 706 para gerar o produto β = βι · β2, o qual é potência efetiva como uma parte dos parâmetros de filtro Fp. Consequentemente, βι é um ganho que é automaticamente controlado, por exemplo por meio da comparação da média absoluta de r e r, e β2 é um outro ganho que é automaticamente controlado, por exemplo por meio do uso do coeficiente de relação cruzado p. O primeiro ganho é destinado para se ter a certeza de que a energia de r é preservada, isto é, que a energia do sinal predito r' no receptor corresponde à energia de r. O segundo ganho é para se ter certeza que r e r' são bem correlacionados.
Em uma forma de realização, o reverberador 702 e o filtro 701 podem ser fixos, isto é, não adaptados de acordo com os parâmetros de filtro Fp. Ademais, β2 pode ser fixo, desta maneira deixando o parâmetro lentamente variável βι como o único parâmetro adaptativo que precisa ser ajustado e transmitido. Consequentemente, uma disposição e filtro particularmente simples é provida. É uma vantagem desta forma de realização o fato de que ela somente requer cerca de metade da taxa de bit estéreo r original para transmitir um sinal estéreo. E notado que outras variações da forma de realização acima podem ser usadas. Por exemplo, em uma forma de realização, o filtro 701 pode ser deixado de fora.
Além disto, altemativamente ou adicionalmente à correlação p, outras medidas de correlação podem ser usadas para assegurar um alto grau de similaridade entre o sinal original e o sinal após a codificação-decodificação. Por exemplo, em uma forma de realização, dois correlacionadores podem ser usados, em lugar do correlacionador 705. Um correlacionador pode computar a correlação cruzada Plr dos sinais de entrada L e R. Além disto, um segundo correlacionador pode computar a correlação cruzada p’lr das saídas resultantes L’ e R’ do codificador-decodificador, isto é, de acordo com esta forma de realização, o codificador também compreende um circuito de decodificador para determinar os sinais L’ e R’. Esta forma de realização usa a diferença ερ = pLR - p’lr para controlar β2, de modo que ερ é mínima. Isto está ilustrado na figura 7c, onde o correlacionador da figura 7b é substituído pelo circuito 707, o qual recebe os sinais L e R bem como L’ e R’, como entradas, e gera, como uma saída, um sinal indicativo da diferença ερ. a saída ερ do circuito 707 controla o circuito 704 para incrustação o residual estimado r, de modo que ερ é minimizado. Em uma forma de realização, as entradas no circuito 707 são filtradas em passa-alta, por exemplo em 250 Hz, de modo que as baixas freqüências têm uma contribuição decrescente para ερ. Como na forma de realização da figura 7b, é uma vantagem desta forma de realização o fato de que a correlação entre a imagem estéreo resultante e a imagem estéreo original, antes da codificação-decodificação, é muito elevada. A figura 8 mostra uma vista esquemática de uma disposição para codificação de um sinal estéreo, de acordo com uma terceira forma de realização da invenção. A disposição é uma variação da forma de realização descrita em conjunção com a figura 5, e ela compreende os circuitos 201 para executar uma rotação dos sinais estéreo L e R, os circuitos 200 para determinar o ângulo de rotação, um filtro adaptativo 501, um circuito de subtração 502, um codificador 202, um codificador 503, e um circuito de combinador 204, como descrito em conexão com a figura 5. De acordo com esta forma de realização, o sinal de componente principal y não é diretamente alimentado no filtro 501. Em vez disto, a disposição também compreende um decodificador 402, como descrito em conexão com a figura 6. O decodificador 402 recebe o sinal de componente principal codificado ye, gerado pelo codificador 202, e gera o sinal principal decodificado y’, o qual é alimentado no filtro 501. É uma vantagem desta forma de realização o fato de que ela reduz o efeito de erros de codificação introduzidos pela codificação e decodificação do sinal y. Estes erros de codificação causam com que o sinal decodificado y’ seja ligeiramente diferente do sinal original y, em virtude do fato de que o decodificador 402, na prática, não é um inverso perfeito do codificador 202, isto é, E E'111. Conseqüentemente, por meio da aplicação de uma codificação e decodificação do sinal y no decodificador,, a entrada y’ para o filtro 501 corresponde à entrada y’ alimentada no filtro 601 no receptor, deste modo melhorando o resultado da predição de r' do sinal residual no receptor. Conseqüentemente, o codificador de acordo com esta forma de realização pode ser usado em conexão com um decodificador de acordo com a forma de realização da figura 6. A figura 9 mostra uma vista esquemática de uma disposição para codificação um sinal estéreo de acordo com uma quarta forma de realização da invenção. A disposição é uma variação da forma de realização descrita em conexão com a figura 5, e compreende circuitos 201 para executar uma rotação dos sinais estéreo L e R, circuitos 200 para determinar o ângulo de rotação, um filtro adaptativo 501, um circuito de subtração 502, um codificador 202, um codificador 503, e um circuito de combinador 204, como descrito em conexão com a figura 5. De acordo com esta forma de realização, o sinal de componente principal y não é diretamente alimentado ao filtro 501. Em vez disto, a disposição também compreende um circuito de multiplicação 901 que multiplica o sinal residual r recebido do circuito 201 por uma constante γ, e um circuito de adição 902 para adicionar o sinal residual escalado ao sinal de componente principal y, resultando em um sinal y + γτ, o qual é alimentado no filtro 501. Aqui, γ é um pequeno valor positivo, por Λ exemplo da ordem de 10'. Em uma forma de realização, a constante γ é rastreada adaptativamente. É uma vantagem desta forma de realização o fato de que freqüências, as quais não são substancialmente presentes no espectro do sinal y, mas presentes no espectro de r, podem ser utilizadas na modelação do sinal residual r pelo filtro 501, deste modo melhorando a qualidade do sinal codificado. De acordo com esta forma de realização, o sinal y + γ r é alimentado no codificador 202, o qual gera o sinal principal decodificado ye a ser transmitido para o receptor. Além disto, de acordo com esta forma de realização, a constante γ é alimentada no combinador 204 e transmitida para o receptor. A figura 10 mostra uma vista esquemática de uma disposição para decodificação de um sinal estéreo, de acordo com a quarta forma de realização da invenção, isto é, adequada para decodificação de um sinal recebido a partir de um codificador de acordo com a figura 9. A disposição compreende um circuito 404 para extração da informação recebida a partir do sinal combinado T, um decodificador 402, um decodificador 602, um filtro 601, e um circuito de rotação 401, como descrito em conexão com a figura 6. De acordo com esta forma de realização, o circuito 404 também extrai a constante γ a partir do sinal combinado T, e a disposição também compreende um circuito de multiplicação 1001 para multiplicação do sinal residual predito r\ gerado pelo filtro 601, pela constante recebida γ. A disposição também compreende um circuito 1002 para subtração do sinal residual predito, escalado, resultante, γ r', a partir do sinal principal decodificado y\ A figura 11 mostra uma vista esquemática de uma disposição para codificação de um sinal de canais múltiplos, de acordo com uma quinta forma de realização da invenção. A disposição recebe um sinal de canais múltiplos x = (xj,..., xn) compreendendo n canais. A disposição compreende um analisador de componente principal 1100 para executar uma análise de componente principal do sinal x, resultando em um vetor de peso w = (wi,...,wn) para transformar o sinal de entrada x em um sinal de componente principal y e n-1 sinais residuais rb r2, ..., rn_i. A disposição também compreende um circuito de transformação 1101 recebendo o sinal de entrada x e o determinado vetor de peso w, e gerando os sinais y e r1} ..., rn.i, de acordo com a transformação acima. Os sinais transformados são codificados por meio de codificadores adequados 202 e 1102, e combinados por meio de um circuito de combinador 204 juntamente com o vetor de peso w, como descrito em conexão com a figura 2. De acordo com esta forma de realização, o codificador 1102 é adaptado para codificar os sinais residuais rb..., rn„i. Por exemplo, o codificador 1102 pode compreender n-1 codificadores paralelos, cada um codificando um dos sinais residuais, como descrito em conexão com o codificador 202. A figura 12 mostra uma vista esquemática de uma disposição para codificar um sinal de canais múltiplos, de acordo com uma sexta forma de realização da invenção. Em adição à transformação de um sinal de canais múltiplos, como descrito em conexão com a figura 11, de acordo com esta forma de realização, o sinal de componente principal é alimentado em um conjunto de filtros adaptativos 501, cada um predizendo um dos sinais residuais η,..., rn.i, como descrito em conexão com a figura 5, resultando em correspondentes parâmetros de filtro Fpi,..., FP(n.]), os quais são alimentados em correspondentes codificadores 503 e, subseqüentemente, no combinador 204. Em um correspondente decodificador (não mostrado), filtros correspondentes são usados para gerar estimativas de r' j,... r'n_i dos sinais residuais, com base nos parâmetros de filtro, como descrito em conexão com a figura 6. É entendido que, de acordo com uma forma de realização, somente um subconjunto de sinais residuais, por exemplo rh ..., rk, k < n-1, pode ser transmitido para o receptor ou alimentado em filtros correspondentes, deste modo reduzindo a necessária taxa de bit, enquanto é mantida a maioria da qualidade de sinal. A figura 13 mostra uma vista esquemática de um circuito de subtração para uso com uma forma de realização da invenção. Nas formas de realização acima das figuras 5, 8, 9 e 12, os parâmetros de filtro são determinados por meio da comparação de um sinal-alvo com um sinal estimado isto é, por meio do sinal de erro e que indica a diferença entre r e r, t quando gerado por um circuito de subtração 502. E entendido que o circuito de subtração pode gerar diferentes medidas de diferença entre r e r, por exemplo uma diferença pode ser determinada no domínio de tempo ou no domínio de freqüência. Com referência à figura 13, o circuito 502 pode compreender circuitos 1301 para transformar os sinais r e r, respectivamente, no domínio de freqüência, por exemplo por meio da execução de uma transformação de Fourier rápida (FFT). Os componentes de freqüência resultantes podem ser também processados por meio de respectivos circuitos 1304. Por exemplo, diferentes freqüências podem ser diferentemente ponderadas, preferivelmente de acordo com as propriedades do sistema auditivo humano, desta maneira ponderando diferenças na faixa de freqüências audíveis, mais fortemente. Outros exemplos de ulterior processamento por meio dos circuitos 1304 incluem uma realização de média sobre predeterminados componentes de freqüência, calculando a magnitude dos componentes de freqüência complexa, agrupamento dos componentes de filtro, ou similar. Por exemplo, em uma forma de realização preferida, um agrupamento é executado antes da subtração, no domínio de freqüência. Este agrupamento pode ser realizado usando um banco de filtros, por exemplo com sub-larguras de banda lineares ou logarítmicas. Altemativamente, o agrupamento pode ser realizado usando a assim chamada largura de banda retangular equivalente (ERB) (ver, por exemplo, “An introduction to the Psychology of Hearing”, de Brian Moore, Academic Press, Londres, 1997). A técnica de largura de banda retangular equivalente agrupa bandas de freqüência que correspondem aos filtros auditivos humanos, por exemplo as assim chamadas bandas críticas. De acordo com a esta forma de realização, o correspondente valor da ERB, como uma função de freqüência central, f (em kHz), pode ser calculado de acordo com ERB = 24,7 (4,37 f + 1). Ainda com referência à figura 13, o circuito 502 também compreende um circuito de subtração 1303 para subtrair os componentes de freqüência processados. Altemativamente, os sinais transformados, gerados pelos circuitos 1301, são diretamente alimentados no circuito de subtração 1304, sem outro processamento. O sinal de diferença gerado pelo circuito de subtração 1304 é alimentado em um circuito de transformação 1302 para transformar o sinal de erro de volta para o domínio de tempo, por exemplo, pela execução de uma transformada de Fourier rápida inversa (IFFT). Altemativamente, o sinal de diferença no domínio de freqüência pode ser usado diretamente. É entendido que uma pessoa especializada na técnica pode adaptar as formas de realização acima, por exemplo por meio da adição ou remoção de características, ou por meio da combinação de características das formas de realização acima. Por exemplo, é entendido que as características introduzidas nas formas de realização das figuras 8 e 9 podem ser incorporadas também na forma de realização da figura 12. Como um outro exemplo, o sinal de erro e, que descreve a qualidade do sinal residual estimado na forma de realização da figura 5, pode ser comparado com um erro-limite, indicando um erro máximo aceitável. Se o erro não for aceitável, o sinal de erro pode, após codificação adequada, ser transmitido juntamente com o sinal T, similarmente aos métodos usados dentro do campo de Codificação Preditiva Linear (LPC). É também notado que a invenção não é limitada a sinais estereofônicos, mas pode ser também aplicada em outros sinais de entrada de canais múltiplos que têm dois ou mais canais de entrada. Exemplos de tais sinais de canais múltiplos incluem sinais recebidos de um Disco Digital Versátil (Digital Versatile Disc) (DVD) ou de um Disco Compacto de Super Áudio, etc. Neste caso mais geral, um sinal de componente principal y e um ou mais sinais residuais r podem ser também gerados de acordo com a invenção. O número de sinais residuais transmitidos depende do número de canais e da taxa de bit desejada, pois resíduos de ordem mais elevada podem ser omitidos sem degradar significativamente a qualidade de sinal.
Em geral, é uma vantagem da invenção o fato de que a alocação de taxa de bit pode ser adaptativamente variada, deste modo permitindo a elegante degradação. Por exemplo, se o canal de comunicação momentaneamente somente permite uma reduzida taxa de bit a ser transmitida, por exemplo em virtude de elevado tráfego de rede, ruído, ou similar, a taxa de bit do sinal transmitido pode ser reduzida, sem degradar significativamente a qualidade perceptível do sinal. Por exemplo, no caso de uma fonte de som estacionária, acima discutida, a taxa de bit pode ser reduzida por um fator de aproximadamente dois, sem degradar significativamente a qualidade de sinal, correspondendo à transmissão de um único canal, em lugar de dois. É notado que as disposições acima podem ser implementadas como microprocessadores programáveis, de finalidade geral ou especial, Processadores de Sinal Digital (DSP), Circuitos Integrados Específicos de Aplicação (ASIC), Arranjos Lógicos Programáveis (PLA), Arranjos de Porta Programáveis por Campo (FPGA), circuitos eletrônicos de finalidade especial, etc., ou uma combinação dos mesmos.
Deve ser notado que as formas de realização acima mencionadas ilustram mais propriamente o limite da invenção, e que aqueles especializados na técnica serão capazes de projetar muitas formas de realização alternativas, sem fugir do escopo das reivindicações anexas. Nas reivindicações, quaisquer sinais de referência colocados entre parênteses não devem ser entendidos como limitação da reivindicação. A palavra “compreendendo” não exclui a presença de outros elementos ou etapas que aqueles listados em uma reivindicação. A invenção pode ser implementada por meio de hardware compreendendo vários elementos distintos, e por meio de um computador adequadamente programado. Em uma reivindicação de dispositivo que enumera vários meios, vários destes meios podem ser incorporados por um e pelo mesmo item de hardware. O mero fato de que certas medidas são mencionadas em reivindicações dependentes, mutuamente diferentes, não indica que uma combinação destas medidas não pode ser usada com vantagem.
REIVINDICAÇÕES

Claims (16)

1. Método para codificação de um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, o primeiro componente de sinal e o segundo componente de sinal sendo componentes de sinal no domínio do tempo caracterizado pelo fato de que compreende as etapas de: transformar no domínio do tempo pelo menos o primeiro e o segundo componentes de sinal por meio dc uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos em um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato dc que compreende também a etapa dc determinar adaptativamente o parâmetro dc transformação com base no pelo menos primeiro c segundo componentes de sinal.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o sinal principal corresponde a um componente principal do primeiro e segundo componentes de sinal.
4. Método de acordo com qualquer uma das reivindicações I a 3, caracterizado pelo fato de que a transformação predeterminada é uma rotação e o parâmetro dc transformação corresponde a um ângulo dc rotação.
5. Método dc acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a etapa de representar o sinal de canais múltiplos pelo menos pelo sinal principal c o parâmetro de transformação compreende a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação e pelo sinal residual.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de que a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação e pelo sinal residual também compreende as etapas de: codificar o sinal principal com uma primeira taxa de bit; e codificar o sinal residual com uma segunda taxa de bit menor do que a primeira taxa de bit.
7. Método de acordo com qualquer uma das reivindicações 1 a 6 caracterizado pelo fato de que o sinal principal corresponde a uma primeira energia de sinal e o sinal residual corresponde a uma segunda energia de sinal menor que a primeira energia de sinal.
8. Método de acordo com qualquer uma das reivindicações 1 a 7 caracterizado pelo fato de que: o método também compreende a etapa de estimar o sinal residual a partir do sinal principal usando um filtro de predição correspondente a um conjunto de parâmetros de filtro; e a etapa de representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação compreende a etapa de representar o sinal de canais múltiplos pelo sinal principal, pelo parâmetro de transformação e pelo conjunto de parâmetros de filtro.
9. Método de acordo com qualquer uma das reivindicações 1 a 8 caracterizado pelo fato de que o sinal de canais múltiplos compreende um sinal estereofônico incluindo um componente de sinal esquerdo e um direito.
10. Método para decodificação de informação de sinal de canais múltiplos, caracterizado pelo fato de que compreende as etapas de: receber um sinal principal e um parâmetro de transformação, o sinal principal correspondendo a um resultado de uma transformação predeterminada de pelo menos um primeiro e um segundo componentes de sinal no domínio do tempo de um sinal de fonte de canais múltiplos, a transformação predeterminada sendo parametrizada por meio de pelo menos o parâmetro de transformação; e gerar um primeiro e um segundo componentes de sinal no domínio do tempo decodificados por meio da transformação inversa do sinal principal recebido e pelo menos de um sinal residual.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de que a etapa de receber um sinal principal e um parâmetro de transformação também compreende a etapa de receber o sinal residual.
12. Método de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que a etapa de receber o sinal principal e o parâmetro de transformação também compreende a etapa de receber um conjunto de parâmetros de filtro, e o método também compreende a etapa de predição do sinal residual a partir do sinal principal usando um filtro de predição correspondendo ao conjunto recebido de parâmetros de filtro.
13. Disposição para codificação de um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, o primeiro componente de sinal e o segundo componente de sinal sendo componentes de sinal no domínio do tempo, caracterizada pelo fato de que compreende: primeiros meios de processamento, adaptados para transformar no domínio do tempo pelo menos o primeiro e o segundo componentes de sinal por meio de uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos em um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e segundos meios de processamento, adaptados para representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação.
14. Disposição para decodificação de informação de sinal de canais múltiplos, caracterizada pelo fato de que a disposição compreende: meios de recepção, para receber um sinal principal e um parâmetro de transformação, o sinal principal correspondendo a um resultado de uma transformação predeterminada de um primeiro e um segundo sinais no domínio do tempo de fonte de canais múltiplos, a transformação predeterminada sendo parametrizada por meio de pelo menos o parâmetro de transformação; e meios de processamento para gerar um primeiro e um segundo sinais no domínio do tempo de canais múltiplos por transformação inversa do sinal principal recebido e de um sinal residual no domínio do tempo.
15. Sinal de dados incluindo informação de sinal de canais múltiplos, caracterizado pelo fato de ser codificado por um método para codificação um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente de sinal, em que compreende as etapas de: transformar pelo menos o primeiro e o segundo componentes de sinal por meio de uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos em um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação, resultando no dito sinal de dados.
16. Dispositivo para comunicação de um sinal de canais múltiplos incluindo pelo menos um primeiro componente de sinal e um segundo componente e sinal, o primeiro componente de sinal e o segundo componente de sinal sendo componentes de sinal no domínio do tempo, caracterizado pelo fato de compreender uma disposição para codificar o sinal de canais múltiplos, a disposição incluindo: primeiros meios de processamento, adaptados para transformar no domínio do tempo pelo menos o primeiro e o segundo componentes de sinal por meio de uma transformação predeterminada em um sinal principal incluindo a maioria da energia de sinal e pelo menos em um sinal residual incluindo menos energia que o sinal principal, a transformação predeterminada sendo parametrizada por meio de pelo menos um parâmetro de transformação; e segundos meios de processamento, adaptados para representar o sinal de canais múltiplos pelo menos pelo sinal principal e pelo parâmetro de transformação.

Family

ID=

Similar Documents

Publication Publication Date Title
BRPI0308691B1 (pt) “Métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, e arranjos para codificar e decodificar um sinal de canal múltiplo”
US7437299B2 (en) Coding of stereo signals
JP5722912B2 (ja) 音響通信方法及び音響通信方法を実行させるためのプログラムを記録した記録媒体
ES2659177T3 (es) Codificador de audio, descodificador de audio, método para proveer una información de audio codificada, método para proveer una información de audio descodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptable a la señal
BR112014028439B1 (pt) Método e aparelho para comprimir um sinalambissônico de ordem superior (aos), método e aparelhopara descomprimir um sinal ambissônico de ordemsuperior (aos) comprimido, e representação de sinal aos
Griffin et al. Single-channel and multi-channel sinusoidal audio coding using compressed sensing
BRPI0605641B1 (pt) equipamento e método para a geração de sinal de controle sintetizador multicanais e equipamento e método para sintetizar multicanais
BRPI0714825A2 (pt) Sistemas e métodos para incluir um identificador a um pacote associado a um sinal de fala
TWI775838B (zh) 用於在多源環境中之非諧波語音偵測及頻寬擴展之裝置、方法、電腦可讀媒體及設備
BRPI0923749B1 (pt) Aparelho que decodifica um sinal de áudio, métodos para a decodificação e para a codificação de um sinal de áudio
BRPI0304540B1 (pt) Methods for coding an audio signal, and to decode an coded audio sign, encoder to codify an audio signal, codified audio sign, storage media, and, decoder to decode a coded audio sign
BRPI0923850B1 (pt) Aparelho que decodifica um sinal de áudio de canal múltiplo e método para a decodificação e codificação de um sinal de áudio de canal múltiplo
EP3762923B1 (en) Audio coding
BR122020017207B1 (pt) Método, sistema de processamento de mídia, aparelho e meio de armazenamento legível por computador não transitório
WO2012010929A1 (en) A reverberation estimator
BR112021010964A2 (pt) Aparelho e método para gerar uma descrição de campo de som
BRPI0719728A2 (pt) Sistemas e métodos para normalização dinâmica para reduzir perda em precisão para sinais de baixo nível.
BR112017001520B1 (pt) Método para estimar ruído em um sinal de áudio, estimador de ruído, criptador de áudio, decodificador de áudio e sistema para transmitir sinais de áudio
JP7453997B2 (ja) DirACベースの空間オーディオ符号化のためのパケット損失隠蔽
KR102605961B1 (ko) 고해상도 오디오 코딩
BRPI0304231B1 (pt) Method for codifying a multiple channel signal, method and arrangement for decoding multiple channel signal information, provision for coding a multiple channel sign, data sign including multiple channel signal information, and a communication device multi-channel signal
CN113302688A (zh) 高分辨率音频编解码
JP7130878B2 (ja) 高分解能オーディオコーディング
KR20210111815A (ko) 고해상도 오디오 코딩
Aarts et al. Coding of stereo signals