BRPI0707135A2 - aparelho e método para codificação e decodificação de sinal - Google Patents

aparelho e método para codificação e decodificação de sinal Download PDF

Info

Publication number
BRPI0707135A2
BRPI0707135A2 BRPI0707135-3A BRPI0707135A BRPI0707135A2 BR PI0707135 A2 BRPI0707135 A2 BR PI0707135A2 BR PI0707135 A BRPI0707135 A BR PI0707135A BR PI0707135 A2 BRPI0707135 A2 BR PI0707135A2
Authority
BR
Brazil
Prior art keywords
signals
decoding
signal
coding
encoded
Prior art date
Application number
BRPI0707135-3A
Other languages
English (en)
Inventor
Won Jung Yang
O Oh Hyun
Jin Kim Hyo
Jong Choi Seung
Geum Lee Dong
Goo Kang Hong
Seong Lee Jae
Original Assignee
Lg Electronics Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Electronics Inc. filed Critical Lg Electronics Inc.
Publication of BRPI0707135A2 publication Critical patent/BRPI0707135A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

APARELHO E MéTODO PARA CODIFICAçãO E DECODIFICAçãO DE SINAL. São fornecidos aparelhos de codificação e de decodificação e métodos para codificação e decodificação. O método de decodificação inclui extrair uma pluralidade de sinais codificados de um fluxo contínuo de bits de entrada, determinar qual de uma pluralidade de métodos de decodificação deve ser usado para decodificar cada um dos sinais codificados, decodificar os sinais codificados usando os métodos de decodificação determinados e sintetizar os sinais decodificados. Dessa maneira, é possível codificar sinais com diferentes características em uma taxa de bits ideal pela classificação dos sinais em uma ou mais classes de acordo com as características dos sinais e é possível codificar cada um dos sinais usando uma unidade de codificação que pode mais bem servir à classe à qual um sinal correspondente pertence. Além do mais, é possível codificar eficientemente vários sinais que incluem sinais de áudio e de fala.

Description

"APARELHO E MÉTODO PARA CODIFICAÇÃO EDECODIFICAÇÃO DE SINAL"
CAMPO TÉCNICO
A presente invenção diz respeito a aparelhos decodificação e de decodificação e a métodos para codificaçãoe decodificação e, mais particularmente, a aparelhos de co-dificação e de decodificação e métodos para codificação edecodificação que podem codificar ou decodificar sinais emuma taxa de bits ideal de acordo com as características dossinais.
ANTECEDENTES DA INVENÇÃO
Codificadores de áudio convencionais podem forne-cer sinais de áudio de alta qualidade em uma alta taxa debits de 48 kbps ou mais, mas são ineficientes para processarsinais de fala. Por outro lado, codificadores de fala con-vencionais podem codificar efetivamente sinais de fala emuma baixa taxa de bits de 12 kbps ou menos, mas são insufi-cientes para codificar vários sinais de áudio.
DIVULGAÇÃO DA INVENÇÃO
PROBLEMA TÉCNICO
A presente invenção fornece aparelhos de codifica-ção e de decodificação e métodos para codificação e decodi-ficação que podem codificar ou decodificar sinais (por exem-plo, sinais de fala e de áudio) com diferentes característi-cas em uma taxa de bits ideal.
SOLUÇÃO TÉCNICA
De acordo com um aspecto da presente invenção, éfornecido um método para decodificação que inclui extrairuma pluralidade de sinais codificados de um fluxo continuode bits de entrada, determinar qual de uma pluralidade demétodos para decodificação deve ser usado para decodificarcada um dos sinais codificados, decodificar os sinais codi-ficados usando os métodos para decodificação determinados esintetizar os sinais decodificados.
De acordo com um outro aspecto da presente inven-ção, é fornecido um aparelho de decodificação que inclui ummódulo de desempacotamento de bits que extrai uma pluralida-de de sinais codificados de um fluxo continuo de bits de en-trada, um módulo de determinação do decodificador que deter-mina qual de uma pluralidade de unidades de decodificaçãodeve ser usada para decodificar cada um dos sinais codifica-dos, um módulo de decodificação que inclui as unidades dedecodificação e decodifica os sinais codificados usando asunidades de decodificação determinadas, e um módulo de sin-tetização que sintetiza os sinais decodificados.
De acordo com um outro aspecto da presente inven-ção, é fornecido um método para codificação que inclui divi-dir um sinal de entrada em uma pluralidade de sinais dividi-dos, determinar qual de uma pluralidade de métodos para co-dificação deve ser usado para codificar cada um dos sinaisdivididos com base nas características de cada um dos sinaisdivididos, codificar os sinais divididos usando os métodosde codificação determinados, e gerar um fluxo contínuo debits com base nos sinais divididos codificados.
De acordo com um outro aspecto da presente inven-ção, é fornecido um aparelho de codificação que inclui ummódulo de divisão de sinal que divide um sinal de entrada emuma pluralidade de sinais divididos, um módulo de determina-ção do codificador que determina qual de uma pluralidade deunidades de codificação deve ser usada para codificar cadaum dos sinais divididos com base nas características de cadaum dos sinais divididos, um módulo de codificação que incluias unidades de codificação e codifica os sinais divididosusando as unidades de codificação determinadas, e um módulode empacotamento de bits que gera um fluxo contínuo de bitscom base nos sinais divididos codificados.
EFEITOS VANTAJOSOS
Dessa maneira, é possível codificar sinais com di-ferentes características em uma taxa de bits ideal pelaclassificação dos sinais em uma ou mais classes de acordocom as características dos sinais, e codificar cada um dossinais usando uma unidade de codificação que pode mais bemservir à classe à qual um sinal correspondente pertence. A-lém do mais, é possível codificar eficientemente vários si-nais, incluindo sinais de áudio e de fala.
DESCRIÇÃO RESUMIDA DOS DESENHOS
A figura 1 é um diagrama de blocos de um aparelhode codificação de acordo com uma modalidade da presente in-venção;
a figura 2 é um diagrama de blocos de uma modali-dade de um módulo de classificação ilustrado na figura 1;
a figura 3 é um diagrama de blocos de uma modali-dade de uma unidade de pré-processamento ilustrada na figura2;a figura 4 é um diagrama de blocos de um aparelhopara calcular a entropia perceptiva de um sinal de entrada,de acordo com uma modalidade da presente invenção;
a figura 5 é um diagrama de blocos de uma outramodalidade do módulo de classificação ilustrado na figura 1;
a figura 6 é um diagrama de blocos de uma modali-dade de uma unidade de divisão de sinal ilustrada na figura 5;
as figuras 7 e 8 são diagramas para explicar méto-dos para mesclar uma pluralidade de sinais divididos, de a-cordo com modalidades da presente invenção;
a figura 9 é um diagrama de blocos de uma outramodalidade da unidade de divisão de sinal ilustrada na figura 5 ;
a figura 10 é um diagrama para explicar um métodopara dividir um sinal de entrada em uma pluralidade de si-nais divididos, de acordo com uma modalidade da presente in-venção;
a figura 11 é um diagrama de blocos de uma modali-dade de uma unidade de determinação ilustrada na figura 5;
a figura 12 é um diagrama de blocos de uma modali-dade de uma unidade de codificação ilustrada na figura 1;
a figura 13 é um diagrama de blocos de uma outramodalidade da unidade de codificação ilustrada na figura 1;
a figura 14 é um diagrama de blocos de um aparelhode codificação de acordo com uma outra modalidade da presen-te invenção;
a figura 15 é um diagrama de blocos de um aparelhode decodificação de acordo com uma modalidade da presenteinvenção; e
a figura 16 é um diagrama de blocos de uma modali-dade de uma unidade de sintetização ilustrada na figura 15.
MELHOR MODO PARA REALIZAR A INVENÇÃO
A seguir, a presente invenção será descrita maiscompletamente em relação aos desenhos anexos, nos quais mo-dalidades exemplares da invenção são mostradas.
A figura 1 é um diagrama de blocos de um aparelhode codificação de acordo com uma modalidade da presente in-venção. Em relação à figura 1, o aparelho de codificação in-clui um módulo de classificação 100, um módulo de codifica-ção 200 e um módulo de empacotamento de bits 300.
O módulo de codificação 200 inclui uma pluralidadeda primeira até m-ésima unidades de codificação 210 e 220que realiza diferentes métodos de codificação.
O módulo de classificação 100 divide um sinal deentrada em uma pluralidade de sinais divididos e casa cadaum dos sinais divididos com uma da primeira até m-ésima uni-dades de codificação 210 e 220. Algumas da primeira até m-ésima unidades de codificação 210 e 220 podem ser casadascom dois ou mais sinais divididos ou sinais não divididos.
O módulo de classificação 100 pode alocar umaquantidade de bits para codificar cada um dos sinais dividi-dos ou pode determinar a ordem na qual os sinais divididosdevem ser codificados.
O módulo de codificação 200 codifica cada um dossinais divididos usando qualquer uma da primeira até m-ésimaunidades de codificação 210 e 220 que esteja casada com umsinal dividido correspondente. O módulo de classificação 100analisa as características de cada um dos sinais divididos eescolhe uma da primeira até m-ésima unidades de codificação210 e 220 que pode codificar mais eficientemente cada um dossinais divididos de acordo com os resultados da análise.
Uma unidade de codificação que pode codificar maiseficientemente um sinal dividido pode ser considerada capazde alcançar uma maior eficiência de compressão.
Por exemplo, um sinal dividido que pode ser facil-mente modelado como um coeficiente e um resíduo pode ser e-ficientemente codificados por um codificador de fala, e umsinal dividido que não pode ser modelado facilmente como umcoeficiente e um resíduo pode ser eficientemente codificadopor um codificador de áudio.
Se a proporção da energia de um resíduo obtido pe-la modelagem de um sinal dividido em relação à energia dosinal dividido for menor do que um limite pré-definido, osinal dividido pode ser considerado um sinal que pode serfacilmente modelado.
Já que um sinal dividido que exibe uma alta redun-dância em um eixo geométrico de tempo pode ser bem modeladousando um método de prognóstico linear no qual um sinal atu-al é prognosticado com base em um sinal anterior, ele podeser codificado mais eficientemente por um codificador de fa-la que usa um método de codificação de prognóstico linear.
0 módulo de empacotamento de bits 300 gera um flu-xo contínuo de bits a ser transmitido com base em sinais di-vididos codificados fornecidos pelo módulo de codificação200 e em informação de codificação adicional que consideraos sinais divididos codificados. 0 módulo de empacotamentode bits 300 pode gerar um fluxo continuo de bits com uma ta-xa de bits variável usando um método do bit plano ou um mé-todo de codificação aritmética fatiada de bits.
Sinais ou larguras de banda divididos que não sãocodificados em função das restrições da taxa de bits podemser restaurados a partir de sinais ou de larguras de bandadecodificados fornecidos por um decodificador que usa um mé-todo de interpolação, de extrapolação ou de replicação. Tam-bém, informação de compensação que considera sinais dividi-dos que não são codificados pode ser incluída em um fluxocontínuo de bits a ser transmitido.
Em relação à figura 1, o módulo de classificação110 pode incluir uma pluralidade da primeira até n-ésima u-nidades de classificação 110 e 120. Cada uma da primeira atén-ésima unidades de classificação 110 e 120 pode dividir osinal de entrada em uma pluralidade de sinais divididos,converter um domínio dos sinal de entrada, extrair as carac-terísticas do sinal de entrada, classificar o sinal de en-trada de acordo com as características do sinal de entrada,ou casar o sinal de entrada com uma da primeira até m-ésimaunidades de codificação 210 e 220.
Uma da primeira até n-ésima unidades de classifi-cação 110 e 120 pode ser uma unidade de pré-processamentoque realiza uma operação de pré-processamento no sinal deentrada para que o sinal de entrada possa ser convertido emum sinal que pode ser eficientemente codificado. A unidadede pré-processamento pode dividir o sinal de entrada em umapluralidade de componentes, por exemplo, um componente decoeficiente e um componente de sinal, e pode realizar umaoperação de pré-processamento no sinal de entrada antes queas outras unidades de classificação realizem suas operações.
O sinal de entrada pode ser pré-processado seleti-vamente de acordo com as características do sinal de entra-da, de acordo com fatores ambientais externos e de acordocom a taxa de bits alvo, e somente parte de uma pluralidadede sinais divididos obtidos a partir do sinal de entrada po-de ser seletivamente pré-processada.
O módulo de classificação 100 pode classificar osinal de entrada de acordo com a informação de caracter!sti-ca perceptiva do sinal de entrada fornecida por um módulo demodelagem psicoacústica 400. Exemplos da informação de ca-racterística perceptiva incluem um limite de mascaramento,uma proporção de sinal por máscara (SMR) e entropia percep-tiva.
Em outras palavras, o módulo de classificação 100pode dividir o sinal de entrada em uma pluralidade de sinaisdivididos ou pode.casar cada um dos sinais divididos com umaou mais da primeira até m-ésima unidades de codificação 210até 220 de acordo com a informação de característica percep-tiva do sinal de entrada, por exemplo, um limite de mascara-mento e uma SNR do sinal de entrada.
Além do mais, o módulo de classificação 100 podereceber informação, tais como a tonalidade, taxa de cruza-mento de zero (ZCR) e coeficiente de prognóstico linear dosinal de entrada, e informação de classificação dos quadrosanteriores, e pode classificar o sinal de entrada de acordocom a informação recebida.
Em relação à figura 1, a informação de resultadocodificada transmitida pelo módulo de codificação 200 podeser realimentada no módulo de classificação 100.
Já que o sinal de entrada é dividido em uma plura-lidade de sinais divididos pelo módulo de classificação 100e determina-se por qual da primeira até m-ésima unidades decodificação 210 e 220, com qual quantidade de bits, e emqual ordem os sinais divididos devem ser codificados, os si-nais divididos são codificados de acordo com os resultadosda determinação. Uma quantidade de bits realmente usada paracodificar cada um dos sinais divididos pode não ser, neces-sariamente, a mesma quantidade de bits alocada pelo módulode classificação 100.
Informação que especifica a diferença entre aquantidade de bits realmente usada e a quantidade de bitsalocada pode ser realimentada no módulo de classificação 100para que o módulo de classificação 100 possa aumentar aquantidade de bits alocada para outros sinais divididos. Sea quantidade de bits realmente usada for maior do que aquantidade de bits alocada, o módulo de classificação 100pode reduzir a quantidade de bits alocada para outros sinaisdivididos.
Uma unidade de codificação que realmente codificaum sinal dividido pode não ser, necessariamente, a mesma u-nidade de codificação que é casada com o sinal dividido pelomódulo de classificação 100. Neste caso, a informação podeser realimentada no módulo de classificação 100, indicandoque uma unidade de codificação que realmente codifica um si-nal dividido é diferente de uma unidade de codificação casa-da com o sinal dividido pelo módulo de classificação 100.Então, o módulo de classificação 100 pode casar o sinal di-vidido com uma unidade de codificação diferente da unidadede codificação anteriormente casada com o sinal dividido.
O módulo de classificação 100 pode dividir nova-mente o sinal de entrada em uma pluralidade de sinais divi-didos de acordo com a informação de resultado codificada ne-le realimentada. Neste caso, o módulo de classificação 100pode obter uma pluralidade de sinais divididos com uma es-trutura diferente daquela dos sinais divididos previamenteobtidos.
Se uma operação de codificação escolhida pelo mó-dulo de classificação 100 diferir de uma operação de codifi-cação que é realmente realizada, informação que considera asdiferenças entre elas pode ser realimentada no módulo declassificação 100 para que o módulo de classificação 100possa determinar novamente a informação relacionada à opera-ção de codificação.
A figura 2 é um diagrama de blocos de uma modali-dade de um módulo de classificação 100 ilustrado na figura1. Em relação à figura 2, a primeira unidade de classifica-ção pode ser uma unidade de pré-processamento que realizauma operação de pré-processamento em um sinal de entrada pa-ra que o sinal de entrada possa ser efetivamente codificado.
Em relação à figura 2, a primeira unidade de clas-sificação 110 pode incluir uma pluralidade do primeiro atén-ésimo pré-processadores 111 e 112 que realiza diferentesmétodos de pré-processamento. A primeira unidade de classi-ficação 110 pode usar um do primeiro até n-ésimo pré-processadores 111 e 112 para realizar o pré-processamento emum sinal de entrada de acordo com as características do si-nal de entrada, de acordo com fatores ambientais externos ede acordo com uma taxa de bits alvo. Também, a unidade declassificação 110 pode realizar duas ou mais operações depré-processamento no sinal de entrada usando o primeiro atén-ésimo pré-processadores 111 e 112.
A figura 3 é um diagrama de blocos de uma modali-dade do primeiro até n-ésimo pré-processadores 111 e 112 i-lustrados na figura 2. Em relação à figura 3, um pré-processador inclui um extrator de coeficiente 113 e um ex-trator de resíduo 114.
0 extrator de coeficiente 113 analisa um sinal deentrada e extrai do sinal de entrada um coeficiente que re-presenta as características do sinal de entrada. 0 extratorde resíduo 114 extrai do sinal de entrada um resíduo comcomponentes redundantes removidos usando o coeficiente ex-traído .
O pré-processador pode realizar uma operação decodificação de prognóstico linear no sinal de entrada. Nestecaso, o extrator de coeficiente 113 extrai um coeficiente deprognóstico linear do sinal de entrada pela realização deanálise de prognóstico linear no sinal de entrada, e o ex-trator de resíduo 114 extrai um resíduo do sinal de entradausando o coeficiente de prognóstico linear fornecido peloextrator de coeficiente 113. 0 resíduo com redundância remo-vida pode ter o mesmo formato do ruído branco.
A seguir, um método de análise de prognóstico li-near de acordo com uma modalidade da presente invenção serádescrito com detalhes.
Um sinal prognosticado obtido pela análise deprognóstico linear pode ser composto por uma combinação li-near dos sinais de entrada anteriores, como indicado pelaEquação (1) :
Valor matemático 1
<formula>formula see original document page 13</formula>
em que ρ indica uma ordem do prognóstico linear, ιaté ρ indicam coeficientes de prognóstico linear que são ob-tidos pela minimização de um erro quadrático médio (MSE) en-tre um sinal de entrada e um sinal estimado.
Uma função de transferência P(z) para análise deprognóstico linear pode ser representada pela Equação (2):
Valor matemático 2Em relação à figura 3, o pré-processador pode ex-trair um coeficiente de prognóstico linear e um resíduo deum sinal de entrada usando um método de codificação de prog-nóstico linear distorcido (WLPC), que é um outro tipo de a-5 nálise de prognóstico linear. 0 método WLPC pode ser reali-zado pela substituição de um atraso de unidade Z-1 por umfiltro passa tudo com uma função de transferência A(z). Afunção de transferência A(z) pode ser representada pela E-quação (3):
Valor matemático 3
<formula>formula see original document page 14</formula>
em que indica o coeficiente de um filtro passa tu-do. Pela variação do coeficiente do filtro passa tudo, épossível variar a resolução de um sinal a ser analisado. Porexemplo, se um sinal a ser analisado for altamente concen-trado em uma certa banda de freqüência, por exemplo, se osinal a ser analisado for um sinal de áudio que é altamenteconcentrado em uma banda de baixa freqüência, o sinal a seranalisado pode ser codificado eficientemente pelo ajuste docoeficiente passa tudo de maneira tal que a resolução dossinais da banda de baixa freqüência possa aumentar.
No método WLPC, os sinais de baixa freqüência sãoanalisados com maior resolução do que os sinais de alta fre-qüência. Assim, o método WLPC pode alcançar alto desempenhode prognóstico para sinais de baixa freqüência e pode mode-lar melhor os sinais de baixa freqüência.
0 coeficiente passa tudo pode variar ao longo deum eixo geométrico de tempo de acordo com as característicasde um sinal de entrada, de acordo com os fatores ambientaisexternos e de acordo com uma taxa de bits alvo. Se o coefi-ciente passa tudo variar durante o tempo, um sinal de áudioobtido pela decodificação pode ser consideravelmente distor-cido. Assim, quando o coeficiente passa tudo varia, um méto-do de alisamento pode ser aplicado no coeficiente passa tudopara que o coeficiente passa tudo possa variar gradualmente,e aquela distorção de sinal pode ser minimizada. A faixa devalores que pode ser determinada como um valor de coeficien-te passa tudo atual pode ser determinada por valores de coe-ficiente passa tudo anteriores.
Um limite de mascaramento, em vez de um sinal ori-ginal, pode ser usado como uma entrada para a estimação deum coeficiente de prognóstico linear. Mais especificamente,um limite de mascaramento pode ser convertido em um sinal dedomínio temporal, e WLPC pode ser realizada usando o sinalde domínio temporal como uma entrada. O prognóstico de umcoeficiente de prognóstico linear pode ser adicionalmenterealizado usando um resíduo como uma entrada. Em outras pa-lavras, a análise de prognóstico linear pode ser realizadamais de uma vez, desse modo, obtendo um resíduo adicional-mente embranquecido.
Em relação à figura 2, a primeira unidade de clas-sificação 110 pode incluir um primeiro pré-processador 111que realiza a análise de prognóstico linear supradescrita emrelação às Equações (1) e (2) e um segundo pré-processador(não mostrado) que realiza a WLPC. A primeira unidade declassificação 100 pode escolher um do primeiro processador111 e do segundo pré-processador, ou pode decidir não reali-zar a análise de prognóstico linear em um sinal de entradade acordo com as características do sinal de entrada, de a-cordo com os fatores ambientais externos e de acordo com umataxa de bits alvo.
Se o coeficiente passa tudo tiver um valor de 0, osegundo pré-processador pode ser o mesmo primeiro pré-processador 111. Neste caso, a primeira unidade de classifi-cação 110 pode incluir somente o segundo pré-processador eescolher um do método de análise de prognóstico linear e dométodo WLPC, de acordo com o valor do coeficiente passa tu-do. Também, a primeira unidade de classificação 110 pode re-alizar a análise de prognóstico linear ou qualquer um do mé-todo de análise de prognóstico linear e do método WLPC é es-colhido em unidades de quadros.
Informação que indica se deve ser realizada análi-se de prognóstico linear e informação que indica qual do mé-todo de análise de prognóstico linear e dos métodos WLPC éescolhido podem ser incluídas em um fluxo contínuo de bits aser transmitido.
O módulo de empacotamento de bits 300 recebe daprimeira unidade de classificação 110 um coeficiente deprognóstico linear, informação que indica se deve ser reali-zada codificação de prognóstico linear e informação que i-dentifica um codificador de prognóstico linear que é real-mente usado. Então, o módulo de empacotamento de bits 300insere todas as informações recebidas em um fluxo continuode bits a ser transmitido.
Uma quantidade de bits necessária para codificarum sinal de entrada em um sinal com uma qualidade de somquase indistinguivel daquela do sinal de entrada originalpode ser determinada pelo cálculo da entropia perceptiva dosinal' de entrada.
A figura 4 é um diagrama de blocos de um aparelhopara calcular a entropia perceptiva de acordo com uma moda-lidade da presente invenção. Em relação à figura 4, o apare-lho inclui um banco de filtro 115, uma unidade de prognósti-co linear 116, uma unidade de modelagem psicoacústica 117,uma primeira unidade de cálculo de bits 118 e uma segundaunidade de cálculo de bits 119.
A entropia perceptiva PE de um sinal de entradapode ser calculada usando a Equação (4) :
Valor matemático 4:
<formula>formula see original document page 17</formula>
em que X(ejw) incida o nivel de energia do sinal deentrada original, e T(ejw) indica um limite de mascaramento. .
Em um método WLPC que envolve o uso de um filtropassa tudo, a entropia perceptiva de um sinal de entrada po-de ser calculada usando a proporção da energia de um resíduodo sinal de entrada por um limite de mascaramento do resí-duo. Mais especificamente, um aparelho de codificação queusa o método WLPC pode calcular a entropia perceptiva PE deum sinal de entrada usando a Equação (5) :
Valor matemático 5
<formula>formula see original document page 18</formula>
em que R(Qjw) indica a energia de um resíduo do si-nal de entrada e T(Qjw) indica um limite de mascaramento deum resíduo.
0 limite de mascaramento T(Qjw) pode ser represen-tado pela Equação (6):
Valor matemático 6
<formula>formula see original document page 18</formula>
em que T(Qjw) indica um limite de mascaramento deum sinal original e H(Qjw) indica uma função de transferên-cia para WLPC. A unidade de modelagem psicoacústica 320 podecalcular o limite de mascaramento T(Qjw) usando o limite demascaramento T(Qjw) em um domínio de banda de fator de esca-la e usando a função de transferência H(Qjw).
Em relação à figura 4, a primeira unidade de cál-culo de bits 118 recebe um resíduo obtido pela WLPC realiza-da pela unidade de prognóstico linear 116 e um limite demascaramento transmitido pela unidade de modelagem psicoa-cústica 117. 0 banco de filtro 116 pode realizar conversãode freqüência em um sinal original, e o resultado da conver-são de freqüência pode ser inserido na unidade de modelagempsicoacústica 117 e na segunda unidade de cálculo de bits119. O banco de filtro 115 pode realizar a transformada deFourier no sinal original.
A primeira unidade de cálculo de bits 118 podecalcular a entropia perceptiva usando a proporção de um li-mite de mascaramento do sinal original dividido por um es-pectro de uma função de transferência de um filtro de sínte-se WLPC pela energia do resíduo.
A entropia perceptiva distorcida WPE de um sinalque é dividido em 60 ou mais bandas de partição não unifor-mes com diferentes larguras de banda pode ser calculada u-sando WLPC, como indicado pela Equação (7):
Valor matemático 7
<formula>formula see original document page 19</formula>
em que b indica um índice de uma banda de partiçãoobtida usando um modelo psicoacústico, eres(b) indica a somadas energias dos resíduos na banda de partição b, w_low(b) ew_high (b) indicam, respectivamente, freqüências mais baixa emais alta na banda de partição b, Hbunear (w) indica um limitede mascaramento de uma banda de partição linearmente mapea-da, h(w)2 indica um espectro de energia de codificação deprognóstico linear (LPC) de um quadro e nbres(w) indica umlimite de mascaramento linear correspondente ao resíduo.
Por outro lado, a entropia perceptiva distorcidaWPEsub de um sinal que é dividido em 60 ou mais bandas departição uniformes com a mesma largura de banda pode sercalculada usando WLPC, como indicado pela Equação (8):Valor matemático 8
<formula>formula see original document page 20</formula>
em que s indica um índice de uma sub-banda linear-mente particionada, slow(w) e shigh (w) indicam, respectivamen-te, freqüências mais baixas e mais altas nas sub-bandas Ii-nearmente particionadas s, nbsub(s) indica um limite de mas-caramento da sub-banda linearmente particionada s, e Gsub (s)indica a energia da sub-banda s linearmente particionada,isto é, a soma das freqüências na sub-banda s linearmenteparticionada. O limite de mascaramento nbsub(s) é um mínimode uma pluralidade de limites de mascaramento na sub-banda slinearmente particionada.
A entropia perceptiva pode não ser calculada parabandas com a mesma largura de banda e com limites mais altosdo que a soma dos espectros de entrada. Assim, a entropiaperceptiva distorcida WPEsab da Equação (8) pode ser menor doque a entropia perceptiva distorcida WPE da Equação (7), quefornece alta resolução para bandas de baixa freqüência.A entropia perceptiva distorcida WPESf pode sercalculada para bandas de fator de escala com diferentes lar-guras de banda usando WLPC, como indicado pela Equação (9):
Valor matemático 9
<formula>formula see original document page 21</formula>
em que / indica um índice de uma banda de fator deescala, nbSf(f) indica um limite de mascaramento mínimo dabanda de fator de escala f, WPEsf indica a proporção de umsinal de entrada da banda de fator de escala / por um limitede mascaramento da banda de fator de escala /, e esf(s) in—dica a soma de todas as freqüências na banda de fator de es-cala /, isto é, a energia da banda de fator de escala /.
A figura 5 é um diagrama de blocos de uma outramodalidade do módulo de classificação 100 ilustrado na figu-ra 1. Em relação à figura 5, um módulo de classificação in-clui uma unidade de divisão de sinal 121 e uma unidade dedeterminação 122.
Mais especificamente, a unidade de divisão de si-nal 121 divide um sinal de entrada em uma pluralidade de si-nais divididos. Por exemplo, a unidade de divisão de sinal121 pode dividir o sinal de entrada em uma pluralidade debandas de freqüência usando um filtro de sub-banda. As ban-das de freqüência podem ter a mesma largura de banda ou di-ferentes larguras de banda. Como exposto, um sinal divididopode ser codificado separadamente dos outros sinais dividi-dos por uma unidade de codificação que pode mais bem serviràs características do sinal dividido.
A unidade de divisão de sinal 121 pode dividir osinal de entrada em uma pluralidade de sinais divididos, porexemplo, uma pluralidade de sinais de banda, para que a in-terferência entre os sinais de banda possa ser minimizada. Aunidade de divisão de sinal 121 pode ter uma estrutura debanco de filtro dual. Neste caso, a unidade de divisão desinal 121 pode dividir adicionalmente cada um dos sinais di-vididos.
Informação de divisão considerando os sinais divi-didos obtidos pela unidade de divisão de sinal 121, por e-xemplo, o número total de sinais divididos e informação debanda de cada um dos sinais divididos, pode ser incluída emum fluxo contínuo de bits a ser transmitido. Um aparelho dedecodificação pode decodificar o sinal dividido separadamen-te e sintetizar os sinais decodificados em relação à infor-mação de divisão, desse modo, restaurando o sinal de entradaoriginal.
A informação de divisão pode ser armazenada comouma tabela. Um fluxo contínuo de bits pode incluir informa-ção de identificação de uma tabela usada para dividir o si-nal de entrada original.
A importância de cada um dos sinais divididos (porexemplo, uma pluralidade de sinais de banda de freqüência)para a qualidade do som pode ser determinada, e a taxa debits pode ser ajustada para cada um dos sinais divididos deacordo com os resultados da determinação. Mais especifica-mente, a importância de um sinal dividido pode ser definidacomo um valor fixo ou como um valor não fixo que varia deacordo com as características de um sinal de entrada paracada quadro.
Se os sinais de fala e de áudio forem misturadosno sinal de entrada, a unidade de divisão de sinal 121 podedividir o sinal de entrada em um sinal de fala e em um sinalde áudio, de acordo còm as características dos sinais de fa-la e de acordo com as características dos sinais de áudio.
A unidade de determinação 122 pode determinar qualda primeira até m-ésima unidades de codificação 210 e 220 nomódulo de codificação 200 pode codificar mais eficientementecada um dos sinais divididos.
A unidade de determinação 122 classifica os sinaisdivididos em inúmeros grupos. Por exemplo, a unidade de de-terminação 122 pode classificar os sinais em N classes e po-de determinar qual da primeira até m-ésima unidades de codi-ficação 210 e 220 deve ser usada para codificar cada um dossinais divididos pelo casamento de cada uma das N classescom uma da primeira até m-ésima unidades de codificação 210e 220.
Mais especificamente, dado que o módulo de codifi-cação 200 inclui as primeira até m-ésima unidades de codifi-cação 210 e 220, a unidade de determinação 122 pode classi-ficar os sinais divididos na primeira até m-ésima classes,que podem ser codificados mais eficientemente pela primeiraaté m-ésima unidades de codificação 210 e 220, respectiva-mente .
Para isto, as características dos sinais que podemser codificados mais eficientemente por cada uma da primeiraaté m-ésima unidades de codificação 210 e 220 podem ser de-terminadas antecipadamente, e as características da primeiraaté m-ésima classes podem ser definidas de acordo com os re-sultados da determinação. Posteriormente, a unidade de de-terminação 122 pode extrair as caracterí sticas de cada umdos sinais divididos e classificar cada um dos sinais divi-didos em uma da primeira até m-ésima classes que comparti-lham as mesmas características de um sinal dividido corres-pondente, de acordo com os resultados da extração.
Exemplos da primeira até m-ésima classes incluemuma classe de fala em voz, uma classe de fala sem voz, umaclasse de ruído de fundo, uma classe de silêncio, uma classede áudio tonai, uma classe de áudio não tonai e uma classede mistura de fala em voz / áudio.
A unidade de determinação 122 pode determinar qualda primeira até m-ésima unidades de codificação 210 e 220deve ser usada para codificar cada um dos sinais divididospela referência da informação de característica perceptivaque considera os sinais divididos fornecidos pelo módulo demodelagem psicoacústica 400, por exemplo, os limites de mas-caramento, SMRs ou níveis de entropia perceptiva dos sinaisdivididos.
A unidade de determinação 122 pode determinar umaquantidade de bits para codificar cada um dos sinais dividi-dos ou para determinar a ordem na qual os sinais divididosdevem ser codificados pela referência da informação de ca-racterística perceptiva que considera os sinais divididos.
A informação obtida pela determinação realizadapela unidade de determinação 122, por exemplo, informaçãoque indica por qual da primeira até m-ésima unidades de co-dificação 210 e 220 e com qual quantidade de bits cada umdos sinais divididos deve ser codificado e informação queindica a ordem na qual os sinais divididos devem ser codifi-cados, pode ser incluída em um fluxo contínuo de bits a sertransmitido.
A figura 6 é um diagrama de blocos de uma modali-dade da unidade de divisão de sinal 122 ilustrada na figura5. Em relação à figura 6, uma unidade de divisão de sinalinclui um divisor 123 e um mesclador 124.
O divisor 123 pode dividir um sinal de entrada emuma pluralidade de sinais divididos. O mesclador 124 podemesclar sinais divididos com características similares em umúnico sinal. Para isto, o mesclador 124 pode incluir um ban-co de filtro de síntese.
Por exemplo, o divisor 123 pode dividir um sinalde entrada em 256 bandas. Das 256 bandas, aquelas com carac-terísticas similares podem ser mescladas em uma única bandapelo mesclador 124.
Em relação à figura 7, o mesclador 124 pode .mes-clar uma pluralidade de sinais divididos que são adjacentesuns aos outros em um único sinal mesclado. Neste caso, omesclador 124 pode mesclar uma pluralidade de sinais dividi-dos adjacentes em um único sinal mesclado de acordo com umaregra pré-definida sem considerar as características dos si-nais divididos adjacentes.
Alternativamente, em relação à figura 8, o mescla-dor 124 pode mesclar uma pluralidade de sinais divididos comcaracterísticas similares em um único sinal mesclado, inde-pendentemente se os sinais divididos são adjacente uns aosoutros. Neste caso, o mesclador 124 pode mesclar uma plura-lidade de sinais divididos que pode ser eficientemente codi-ficada pela mesma unidade de codificação em um único sinalmesclado.
A figura 9 é um diagrama de blocos de uma outramodalidade da unidade de divisão de sinal 121 ilustrada nafigura 5. Em relação à figura 9, uma unidade de divisão desinal inclui um primeiro divisor 125, um segundo divisor 126e um terceiro divisor 127.
Mais especificamente, a unidade de divisão de si-nal 121 pode dividir hierarquicamente um sinal de entrada.
Por exemplo, o sinal de entrada pode ser dividido em doissinais divididos pelo primeiro divisor 125, um dos dois si-nais divididos pode ser dividido em três sinais divididospelo segundo divisor 126 e um dos três sinais divididos podeser dividido em três sinais divididos pelo terceiro divisor127. Desta maneira, o sinal de entrada pode ser dividido emum total de 6 sinais divididos. A unidade de divisão de si-nal 121 pode dividir hierarquicamente o sinal de entrada emuma pluralidade de bandas com diferentes larguras de banda.
Na modalidade ilustrada na figura 9, um sinal deentrada é dividido de acordo com uma hierarquia de 3 níveis,mas a presente invenção não é restrita a ela. Em outras pa-lavras, um sinal de entrada pode ser dividido em uma plura-lidade de sinais divididos de acordo com uma hierarquia de 2níveis ou de 4 ou mais níveis.
Um do primeiro até terceiro divisores 125 até 127na unidade de divisão de sinal 121 pode dividir um sinal deentrada em uma pluralidade de sinais de domínio temporal.
A figura 10 explica uma modalidade da divisão deum sinal de entrada em uma pluralidade de sinais divididospela unidade de divisão de sinal 121.
No geral, sinais de fala ou de áudio são estacio-nários durante um curto período de comprimento de quadro.Entretanto, algumas vezes, sinais de fala ou de áudio podemter características não estacionárias, por exemplo, duranteum período de transição.
A fim de analisar efetivamente sinais não estacio-nários e de melhorar a eficiência da codificação de tais si-nais não estacionários, o aparelho de codificação de acordocom a presente modalidade pode usar um método de ondeleta oude decomposição em modo empírico (EMD). Em outras palavras,o aparelho de codificação de acordo com a presente modalida-de pode analisar as características de um sinal de entradausando uma função de transformação não fixa. Por exemplo, aunidade de divisão de sinal 121 pode dividir um sinal de en-trada em uma pluralidade de bandas com larguras de banda va-riáveis usando um método de filtragem de sub-banda de bandade freqüência não fixa.A seguir, um método para dividir um sinal de en-trada em uma pluralidade de sinais divididos por meio de EMDserá descrito com detalhes.
No método EMD, um sinal de entrada pode ser decom-posto em uma ou mais funções de modo intrínseco (IMFs) . UmaIMF deve satisfazer as seguintes condições: o número de pon-tos extremos e o número de zeros cruzados devem ser iguaisou diferir, no máximo, em um; e o valor médio de um envelopedeterminado pelo local máximo e de um envelope determinadopelo local mínimo é zero.
Uma IMF representa um único modo oscilatório simi-lar a um componente em uma única função harmônica, desse mo-do, tornando possível decompor efetivamente um sinal de en-trada usando o método EMD.
Mais especificamente, a fim de extrair uma IMF deum sinal de entrada s (t), um envelope superior pode ser pro-duzido pela conexão de todos os pontos extremos locais de-terminados pelo local máximo do sinal de entrada s (t) usandoum método de interpolação cúbica de curva matematicamentedefinida por nós de controle, e um envelope inferior podeser produzido pela conexão de todos os pontos extremos lo-cais determinados pelo local mínimo do sinal de entrada s (t)usando o método de interpolação cúbica de curva matematica-mente definida por nós de controle. Todos os valores que osinal de entrada s(t) pode ter podem estar entre o envelopesuperior e o envelope inferior.
Posteriormente, o valor médio m(t) do envelope su-perior e do envelope inferior pode ser calculado. Posterior-mente, um primeiro componente Ii1 (t) pode ser calculado pelasubtração do valor médio m(t) do sinal de entrada s (t) , comoindicado pela Equação (10):
Valor matemático 10
s(t)-m1(t)=h1(t)
Se o primeiro componente hi(t) não satisfizer assupramencionadas condições da IMF, pode-se determinar que oprimeiro componente h]_(t) é igual ao sinal de entrada s (t),e a supramencionada operação pode ser realizada novamenteaté que um primeiro Ci(t) da IMF que satisfaz as supramen-cionadas condições da IMF seja obtido.
Uma vez que o primeiro C1It) da IMF é obtido, umresíduo ri(t) é obtido pela subtração do primeiro C1 (t) daIMF, como indicado pela Equação (11):
Valor matemático 11
s(t)-c1(t)=r1(t)
Posteriormente, a supramencionada operação de ex-tração da IMF pode ser novamente realizada usando o resíduor!(t) como o novo sinal de entrada, desse modo, obtendo umsegundo C2 (t) da IMF e um resíduo r2(t).
Se um resíduo rn(t) obtido durante a supramencio-nada operação de extração IMF tiver um valor constante, oufor uma função monotonamente crescente ou uma função de pe-ríodo simples com somente um ponto extremo ou sem nenhumponto extremo, a supramencionada operação de extração da IMFpode ser terminada.
Em decorrência da supramencionada operação de ex-tração da IMF, o sinal de entrada s (t) pode ser representadopela soma de uma pluralidade de Co (t) até Cm (t) da IMF e deum resíduo final rm(t), como indicado pela Equação (12):
Valor matemático 12
<formula>formula see original document page 30</formula>
em que M indica o número total das IMFs extraídas.
0 resíduo final rm(t) pode refletir as características ge-rais do sinal de entrada s (t).
A figura 10 ilustra onze IMFs e um resíduo finalobtido pela decomposição de um sinal de entrada original u-sando o método EMD. Em relação à figura 10, a freqüência deuma IMF obtida do sinal de entrada original em um estágioinicial da extração da IMF é mais alta do que a freqüênciade uma IMF obtida do sinal de entrada original em um estágioposterior da extração da IMF.
A extração da IMF pode ser simplificada usando umdesvio padrão SD entre um resíduo anterior hl(k-D e um resí-duo atual hlk, como indicado pela Equação (13) :
Valor matemático 13
<formula>formula see original document page 30</formula>Se o desvio padrão SD for menor do que um valor dereferência, por exemplo, 0,3, o resíduo atual hlk pode serconsiderado como uma IMF.
Neste ínterim, um sinal x(t) pode ser transformadoem um sinal analítico pela transformada de Hilbert, como in-dicado pela Equação (14):
Valor matemático 14
<formula>formula see original document page 31</formula>
em que (t) indica uma amplitude instantânea, (t)indica uma fase instantânea, e H{} indica a transformada deHilbert.
Em decorrência da transformada de Hilbert, um si-nal de entrada pode ser convertido em um sinal analítico queconsiste em um componente real e um componente imaginário.
Pela aplicação da transformada de Hilbert em umsinal com uma média de 0, podem ser obtidos os componentesda freqüência que podem fornecer alta resolução tanto para odomínio temporal quanto para o domínio de freqüência.
A seguir, será descrito com detalhes como a unida-de de determinação 112 ilustrada na figura 4 determina qualde uma pluralidade de unidades de codificação deve ser usadapara codificar cada um de uma pluralidade de sinais dividi-dos obtidos pela decomposição de um sinal de entrada.
A unidade de determinação "122 pode determinar qualde um codificador de fala e de um codificador de áudio podecodificar mais eficientemente cada um dos sinais divididos.Em outras palavras, a unidade de determinação 122 pode deci-dir codificar sinais divididos que podem ser eficientementecodificados por um codificador de fala usando qualquer umada primeira até m-ésima unidades de codificação 210 e 220 emum codificador de fala e decidir codificar sinais divididosque podem ser eficientemente codificados por um codificadorde áudio usando qualquer uma da primeira até m-ésima unida-des de codificação 210 e 220 em um codificador de áudio.
A seguir, será descrito com detalhes como a unida-de de determinação 122 determina qual de um codificador defala e de um codificador de áudio pode codificar mais efici-entemente um sinal dividido.
A unidade de determinação 122 pode medir a varia-ção em um sinal dividido e pode determinar que o sinal divi-dido pode ser codificado mais eficientemente por um codifi-cador de fala do que por um codificador de áudio se o resul-tado da medição for maior do que um valor de referência pré-definido.
Alternativamente, a unidade de determinação 122pode medir um componente tonai incluído em uma certa partede um sinal dividido e pode determinar que o sinal divididopode ser codificado mais eficientemente por um codificadorde áudio do que por um codificador de fala se o resultado damedição for maior do que um valor de referência pré-definido.
A figura 11 é um diagrama de blocos de uma modali-dade da unidade de determinação 122 ilustrada na figura 5.Em relação à figura 11, uma unidade de determinação incluiuma unidade de codificação / decodificação de fala 500, umprimeiro banco de filtro 510, um segundo banco de filtro520, uma unidade de determinação 530 e uma unidade de mode-lagem psicoacústica 540.
A unidade de determinação ilustrada na figura 11pode determinar qual de um codificador de fala e de um codi-ficador de áudio pode codificar mais eficientemente cada si-nal dividido.
Em relação à figura 11, um sinal de entrada é co-dificado pela unidade de codificação / decodificação de fala500, e o sinal codificado é decodificado pela unidade de co-dificação / decodificação de fala 500, desse modo, restau-rando o sinal de entrada original. A unidade de codificação/ decodificação de fala 500 pode incluir um codificador /decodificador de fala em banda larga multitaxas (AMR-WB), eo codificador / decodif icador de fala AMR-WB pode ter umaestrutura de prognóstico linear estimulado por código(CELP).
0 sinal de entrada pode ser amostrado descendente-mente antes de ser inserido na unidade de codificação / de-codif icação de fala 500. Um sinal transmitido pela unidadede codificação / decodificação de fala 500 pode ser amostra-do ascendentemente, desse modo, restaurando o sinal de en-trada .
0 sinal de entrada pode ser sujeito à conversão defreqüência pelo primeiro banco de filtro 510.
O sinal transmitido pela unidade de codificação /decodificação de fala 500 é convertido em um sinal de domi-nio de freqüência pelo segundo banco de filtro 520. O pri-meiro banco de filtro 510 ou o segundo banco de filtro 520podem realizar transformada cosseno, por exemplo, transfor-mada discreta modificada (MDCT), em um sinal neles inserido.
Tanto um componente de freqüência do sinal de en-trada original transmitido pelo primeiro banco de filtro 510quanto um componente de freqüência do sinal de entrada res-taurado transmitido pelo segundo banco de filtro 520 são in-seridos na unidade de determinação 530. A unidade de deter-minação 530 pode determinar qual de um codificador de fala ede um codificador de áudio pode codificar o sinal de entradamais eficientemente com base nos componentes de freqüêncianela inseridos.
Mais especificamente, a unidade de determinação530 pode determinar qual de um codificador de fala e de umcodificador de áudio pode codificar mais eficientemente osinal de entrada com base nos componentes de freqüência nelainseridos pelo cálculo da entropia perceptiva PE± de cada umdos componentes de freqüência, usando a Equação (15):
Valor matemático 15
<formula>formula see original document page 34</formula>
em que
<formula>formula see original document page 34</formula>em que x(j) indica um coeficiente de um componentede freqüência, j indica um índice do componente de freqüên-cia, indica o tamanho da etapa de quantização, nint() é umafunção que retorna o número inteiro mais próximo do seu ar-gumento, e jlow<i> e jhigh(i) são um índice de freqüência inici-al e um índice de freqüência final, respectivamente, de umabanda de fator de escala.
A unidade de determinação 530 pode calcular a en-tropia perceptiva do componente de freqüência do sinal deentrada original e a entropia perceptiva do componente defreqüência do sinal de entrada restaurado usando a Equação(15), e pode determinar qual de um codificador de áudio e deum codificador de fala é mais eficiente para uso na codifi-cação do sinal de entrada com base nos resultados do cálculo.
Por exemplo, se a entropia perceptiva do componen-te de freqüência do sinal de entrada original for menor doque a entropia perceptiva do componente de freqüência do si-nal de entrada restaurado, a unidade de determinação 530 po-de determinar que o sinal de entrada pode ser mais eficien-temente codificado por um codificador de áudio do que por umcodificador de fala. Por outro lado, se a entropia percepti-va do componente de freqüência do sinal de entrada restaura-do for menor do que a entropia perceptiva do componente defreqüência do sinal de entrada original, a unidade de deter-minação 530 pode determinar que o sinal de entrada pode sercodificado mais eficientemente por um codificador de fala doque por um codificador de áudio.A figura 12 é um diagrama de blocos de uma modali-dade de uma da primeira até m-ésima unidades de codificação210 e 220 ilustradas na figura 1. A unidade de codificaçãoilustrada na figura 12 pode ser um codificador de fala.
No geral, codificadores de fala podem realizar LPCem um sinal de entrada em unidades dos quadros e extrair umcoeficiente da LPC, por exemplo, um coeficiente LPC de 16aordem, de cada quadro do sinal de entrada usando o algoritmoLevinson-Durbin. Um sinal de estimulo pode ser quantizadopor meio de uma busca de livro de código adaptativo ou deuma busca de livro de código fixa. O sinal de estimulo podeser quantizado usando um método de prognóstico linear esti-mulado por código algébrico. A quantização de vetor pode serrealizada no ganho do sinal de estimulo usando uma tabela dequantização com uma estrutura conjugada.
O codificador de fala ilustrado na figura 12 in-clui uma unidade de análise de prognóstico linear 600, umaunidade de estimativa de afastamento 610, uma unidade debusca de livro de código 620, uma unidade de par de espectrolinear (LSP) 630 e uma unidade de quantização 640.
A unidade de análise de prognóstico linear 600 re-aliza análise de prognóstico linear em um sinal de entradaque usa um coeficiente de autocorrelação que é obtido usandouma janela assimétrica. Se um período de antecipação, istoé, a janela assimétrica, tiver um comprimento de 30 ms, aunidade de análise de prognóstico linear 600 pode realizar aanálise de prognóstico linear usando um período de antecipa-ção de 5 ms.O coeficiente de autocorrelação é convertido em umcoeficiente de prognóstico linear usando um algoritmo Levin-son-Durbin. Para a quantização e a interpolação linear, aunidade LSP 630 converte o coeficiente de prognóstico linearem um LSP. A unidade de quantização 64 quantiza o LSP.
A unidade de estimativa de afastamento 610 estimao afastamento do laço aberto a fim de reduzir a complexidadede uma busca de livro de código adaptativa. Mais especifica-mente, a unidade de estimativa de afastamento 610 estima umperíodo de afastamento do laço aberto usando um domínio desinal de fala ponderado de cada quadro. Posteriormente, umfiltro de modelagem de ruído harmônico é configurado usandoo afastamento do laço aberto estimado. Posteriormente, umaresposta de impulso é calculada usando o filtro de modelagemde ruído harmônico, um filtro de síntese de prognóstico li-near e um filtro de ponderação de pico da freqüência acústi-ca perceptivo. A resposta de impulso pode ser usada para ge-rar um sinal alvo para a quantização de um sinal de estímulo.
A unidade de busca de livro de código 620 realizauma busca de livro de código adaptativa e uma busca de livrode código fixa. A busca de livro de código adaptativa podeser realizada em unidades de subquadros pelo cálculo de umvetor de livro de código adaptativo por meio de uma busca deafastamento do laço fechado e por meio da interpolação dossinais de estímulo anteriores. O sinal de estímulo pode sergerado por um filtro de síntese de prognóstico linear a fimde simplificar uma busca de laço fechado.Uma estrutura de livro de código fixo é estabele-cida com base no desenho de permutação de pulso simples en-trelaçado (ISSP). Um vetor de livro de código que compreende64 posições, em que 64 pulsos são respectivamente localiza-dos, é dividido em quatro trilhas, cada trilha compreendendo16 posições. Um número pré-determinado de pulsos pode serlocalizado em cada uma das quatro trilhas de acordo com ataxa de transmissão. Já que um índice de livro de código in-dica o local da trilha e o sinal de um pulso, não há neces-sidade de armazenar um livro de código, e um sinal de estí-mulo pode ser gerado simplesmente usando do índice de livrode código.
0 codificador de fala ilustrado na figura 12 poderealizar os supramencionados processos de codificação em umdomínio temporal. Também, se um sinal de entrada for codifi-cado usando um método de codificação de prognóstico linearpelo módulo de classificação 100 ilustrado na figura 1, aunidade de análise de prognóstico linear 600 pode ser opcional.
A presente invenção não é restrita ao codificadorde fala ilustrado na figura 12. Em outras palavras, várioscodificadores de fala diferentes do codificador de fala i-lustrado na figura 12, que podem codificar eficientementesinais de fala, podem ser usados no escopo da presente in-venção.
A figura 13 é um diagrama de blocos de uma outramodalidade de uma da primeira até m-ésima unidades de codi-ficação 210 e 220 ilustradas na figura 1. A unidade de codi-ficação ilustrada na figura 13 pode ser um codificador deáudio.
Em relação à figura 13, o codificador de áudio in-clui um primeiro banco de filtro 700, uma unidade de modela-gem psicoacústica 710 e uma unidade de quantização 720.
O banco de filtro 700 converte um sinal de entradaem um sinal de domínio de freqüência. O banco de filtro 700pode realizar transformada cosseno, por exemplo, transforma-da discreta modificada (MDCT), no sinal de entrada.
A unidade de modelagem psicoacústica 710 calculaum limite de mascaramento do sinal de entrada da SMR do si-nal de entrada. A unidade de quantização 720 quantiza os co-eficientes da MDCT transmitidos pelo banco de filtro 700 u-sando o limite de mascaramento calculado pela unidade de mo-delagem psicoacústica 710. Alternativamente, a fim de mini-mizar a distorção audível em uma dada faixa de taxa de bits,a unidade de quantização 720 pode usar a SMR do sinal de en-trada.
O codificador de áudio ilustrado na figura 13 poderealizar os supramencionados processos de codificação em umdomínio de freqüência.
A presente invenção não é restrita ao codificadorde áudio ilustrado na figura 13. Em outras palavras, várioscodificadores de áudio (por exemplo, codificadores de áudioavançados) diferentes do codificador de áudio ilustrado nafigura 13, que podem codificar eficientemente sinais de áu-dio, podem ser usados no escopo da presente invenção.
Codificadores de áudio avançados realizam modela-gem de ruído temporal (TNS), intensidade / acoplamento,prognóstico e codificação estéreo meio / lado. TNS é uma o-peração de distribuir apropriadamente o ruído da quantizaçãode domínio temporal em uma janela do banco de filtro paraque o ruído da quantização possa ficar inaudível. Intensida-de / acoplamento é uma operação que pode reduzir a quantida-de de informação espacial a ser transmitida pela codificaçãode um sinal de áudio e que pode transmitir a energia do si-nal de áudio somente com base no fato de que a percepção dadireção do som em uma banda alta depende principalmente daescala temporária da energia.
O prognóstico é uma operação de remover redundân-cia de um sinal cujas características estatísticas não vari-am pelo uso da correlação entre os componentes do espectrodos quadros. Codificação estéreo M/S é uma operação detransmitir a soma normalizada (isto é, meio) e a diferença(isto é, lado) de um sinal estéreo em vez de sinais de canalesquerdo e direito.
Um sinal que passa por TNS, intensidade / acopla-mento, prognóstico e codificação estéreo M/S é quantizadopor um quantizador que realiza Análise por Síntese (AbS) u-sando uma SMR obtida de um modelo psicoacústico.
Como exposto, já que um codificador de áudio codi-fica um sinal de entrada usando um método de modelagem, talcomo um método de codificação de prognóstico linear, a uni-dade de determinação 122 ilustrada na figura 5 pode determi-nar se o sinal de entrada pode ser facilmente modelado deacordo com um conjunto pré-determinado de regras. Posterior-mente, se for determinado que o sinal de entrada pode serfacilmente modelado, a unidade de determinação 122 pode de-cidir codificar o sinal de entrada usando um codificador defala. Por outro lado, se for determinado que o sinal de en-trada não pode ser facilmente modelado, a unidade de deter-minação 122 pode decidir codificar o sinal de entrada usandoum codificador de áudio.
A figura 14 é um diagrama de blocos de um aparelhode codificação de acordo com uma outra modalidade da presen-te invenção. Nas figuras 1 até 14, números de referência i-guais representam elementos iguais e, assim, suas descriçõesdetalhadas serão omitidas.
Em relação à figura 14, um módulo de classificação100 divide um sinal de entrada em uma pluralidade do primei-ro até n-ésimo sinais divididos e determina qual de uma plu-ralidade de unidades de codificação 230, 240, 250, 260 e 270deve ser usada para codificar cada um do primeiro até n-ésimo sinais divididos.
Em relação à figura 14, as unidades de codificação230, 240, 250, 260 e 270 podem codificar seqüencialmente oprimeiro até n-ésimo sinais divididos, respectivamente. Tam-bém, se o sinal de entrada for dividido em uma pluralidadede sinais de banda de freqüência, os sinais de banda de fre-qüência podem ser codificados na ordem de um sinal de bandade freqüência mais baixo até um sinal de banda de freqüênciamais alto.
Em um caso em que os sinais divididos são seqüen-cialmente codificados, um erro de codificação de um sinalanterior pode ser usado para codificar um sinal atual. Emdecorrência disto, é possível codificar os sinais divididosusando diferentes métodos de codificação e, assim, impedir adistorção de sinal e fornecer escalabilidade de largura debanda.
Em relação à figura 14, a unidade de codificação230 codifica o primeiro sinal dividido, decodifica o primei-ro sinal dividido codificado e transmite um erro entre o si-nal decodificado e o primeiro sinal dividido para a unidadede codificação 240. A unidade de codificação 240 codifica osegundo sinal dividido usando o erro transmitido pela unida-de de codificação 230. Desta maneira, o segundo até m-ésimosinais divididos são codificados em consideração dos errosde codificação dos seus respectivos sinais divididos anteri-ores. Portanto, é possível realizar codificação sem erro emelhorar a qualidade do som.
O aparelho de codificação ilustrado na figura 14pode restaurar um sinal de um fluxo contínuo de bits de en-trada realizando inversamente as operações realizadas peloaparelho de codificação ilustrado nas figuras 1 até 14.
A figura 15 é um diagrama de blocos de um aparelhode decodificação de acordo com uma modalidade da presenteinvenção. Em relação à figura 15, o aparelho de decodifica-ção inclui um módulo de desempacotamento de bits 800, um mó-dulo de determinação do decodificador 810, um módulo de de-codif icação 820 e um módulo de sintetização 830.
0 módulo de desempacotamento de bits 800 extrai,de um fluxo contínuo de bits de entrada, um ou mais sinaiscodificados e informação adicional que são necessários paradecodificar os sinais codificados.
O módulo de decodificação 820 inclui uma plurali-dade da primeira até m-ésima unidades de decodificação 821 e822 que realiza diferentes métodos de decodificação.
O módulo de determinação do decodificador 810 de-termina qual da primeira até m-ésima unidades de decodifica-ção 821 e 822 pode decodificar mais eficientemente cada umdos sinais codificados. O módulo de determinação do decodi-ficador 810 pode usar um método similar àquele do módulo declassificação 100 ilustrado na figura 1 para determinar qualda primeira até m-ésima unidades de decodificação 821 e 822pode decodificar mais eficientemente cada um dos sinais co-dificados. Em outras palavras, o módulo de determinação dodecodificador 810 pode determinar qual da primeira até m-ésíma unidades de decodificação 821 e 822 pode decodificarmais eficientemente cada um dos sinais codificados com basenas características de cada um dos sinais codificados. Pre-ferivelmente, o módulo de determinação do decodificador 810pode determinar qual da primeira até m-ésima unidades de de-codificação 821 e 822 pode decodificar mais eficientementecada um dos sinais codificados com base na informação adi-cional extraída do fluxo contínuo de bits de entrada.
A informação adicional pode incluir informação declasse que identifica que uma classe na qual um sinal codi-ficado é classificado pertence a um aparelho de codificação,informação da unidade de codificação que identifica uma uni-dade de codificação usada para produzir o sinal codificado,e informação da unidade de decodificação que identifica umaunidade decodificação a ser usada para decodificar o sinalcodificado.
Por exemplo, o módulo de determinação do decodifi-cador 810 pode determinar a qual classe um sinal codificadopertence com base na informação adicional e escolher, para osinal codificado, qualquer uma da primeira até m-ésima uni-dades de decodificação 821 e 822 correspondente à classe dosinal codificado. Neste caso, a unidade de decodificação es-colhida pode ter uma estrutura tal que ela possa decodificarmais eficientemente sinais que pertencem à mesma classe dosinal codificado.
Alternativamente, o módulo de determinação do de-codificador 810 pode identificar uma unidade de codificaçãousada para produzir um sinal codificado com base na informa-ção adicional e para escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 correspondente à unidade de codificação iden-tificada. Por exemplo, se o sinal codificado foi produzidopor um codificador de fala, o módulo de determinação do de-codificador 810 pode escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 em um decodificador de fala.
Alternativamente, o módulo de determinação do de-codificador 810 pode identificar uma unidade de decodifica-ção que pode decodificar um sinal codificado com base na in-formação adicional e pode escolher, para o sinal codificado,qualquer uma da primeira até m-ésima unidades de decodifica-ção 821 e 822 correspondente à unidade de decodificação i-dentifiçada.
Alternativamente, o módulo de determinação do de-codificador 810 pode obter as características de um sinalcodificado da informação adicional e pode escolher qualqueruma da primeira até m-ésima unidades de decodificação 821 e822 que pode decodificar mais eficientemente os sinais comas mesmas características do sinal codificado.
Desta maneira, determina-se que cada um dos sinaiscodificados extraídos do fluxo contínuo de bits de entradaque é codificado por qualquer uma da primeira até m-ésimaunidades de decodificação 821 e 822 pode decodificar maiseficientemente um sinal codificado correspondente. Os sinaisdecodificados são sintetizados pelo módulo de sintetização830, desse modo, restaurando um sinal original.
O módulo de desempacotamento de bits 800 extraiinformação de divisão considerando os sinais codificados,por exemplo, o número de sinais codificados e informação debanda de cada um dos sinais codificados, e o módulo de sin-tetização 830 pode sintetizar os sinais decodificados forne-cidos pelo módulo de decodificação 820 em relação à informa-ção de divisão.
O módulo de sintetização 830 pode incluir uma plu-ralidade da primeira até n-ésima unidades de sintetização831 e 832. Cada uma da primeira até n-ésima unidades de sin-tetização 831 e 832 pode sintetizar os sinais decodificadosfornecidos pelo módulo de decodificação 820 ou pode realizara conversão de domínio ou decodificação adicional no mesmosinal codificado ou em todos eles.
Uma da primeira até n-ésima unidades de sintetiza-ção 831 e 832 pode realizar uma operação pós-processamento,que é o inverso de uma operação pré-processamento realizadapor um aparelho de codificação, em um sinal sintetizado. In-formação que indica se deve ser realizada uma operação depós-processamento e informação de decodificação usada pararealizar a operação de pós-processamento podem ser extraídasdo fluxo contínuo de bits de entrada.
Em relação à figura 16, uma da primeira até n-ésima unidades de sintetização 831 e 832, particularmente,uma segunda unidade de sintetização 833, pode incluir umapluralidade do primeiro até n-ésimo pós-processadores 834 e835. A primeira unidade de sintetização 831 sintetiza umapluralidade de sinais decodificados em um único sinal, e umdo primeiro até n-ésimo pós-processadores 834 e 835 realizauma operação de pós-processamento no único sinal obtido pelasintetização.
Informação que indica qual do primeiro até n-ésimopós-processadores 834 e 835 deve realizar uma operação depós-processamento no único sinal obtido pela sintetizaçãopode ser incluída no fluxo contínuo de bits de entrada.
Um do primeiro até n-ésimo sintetizadores 831 e832 pode realizar decodificação de prognóstico linear no ú-nico sinal obtido pela unidade de sintetização usando um co-eficiente de prognóstico linear extraído do fluxo contínuode bits de entrada, desse modo, restaurando um sinal original.A presente invenção pode ser realizada como códigolegível por computador escrito em uma mídia de gravação le-gível por computador. A mídia de gravação legível por compu-tador pode ser qualquer tipo de dispositivo de gravação noqual dados são armazenados de uma maneira legível por compu-tador. Exemplos de mídia de gravação legível por computadorincluem uma ROM, uma RAM, um CD-ROM, uma fita magnética, umdisco flexível, um armazenamento ótico de dados e uma ondaportadora (por exemplo, transmissão de dados por meio da In-ternet). A mídia de gravação legível por computador pode serdistribuída em uma pluralidade de sistemas de computador co-nectados em uma rede para que o código legível por computa-dor seja nela escrito e executado a partir dela de uma ma-neira descentralizada. Programas funcionais, código e seg-mentos de código necessários para realizar a presente inven-ção podem ser facilmente entendidos pelos versados na técnica.
Embora a presente invenção tenha sido particular-mente mostrada e descrita em relação às suas modalidades e-xemplares, versados na técnica entendem que várias mudançasnà forma e nos detalhes podem ser feitas sem fugir do espí-rito e do escopo da presente invenção definidos pelas se-guintes reivindicações.
APLICABILIDADE INDUSTRIAL
Como exposto, de acordo com a presente invenção, épossível codificar sinais com diferentes características emuma taxa de bits ideal pela classificação dos sinais em umaou mais classes de acordo com as características dos sinaise é possível codificar cada um dos sinais usando uma unidadede codificação que pode mais bem servir à classe à qual umsinal correspondente pertence. Portanto, é possível codifi-car eficientemente vários sinais, incluindo sinais de áudioe de fala.

Claims (20)

1. Método de decodificação, CARACTERIZADO pelo fa-to de que compreende:extrair uma pluralidade de sinais codificados deum fluxo continuo de bits de entrada;determinar qual de uma pluralidade de métodos dedecodif icação deve ser usado para decodificar cada um dossinais codificados;decodificar os sinais codificados usando os méto-dos de decodificação determinados; esintetizar os sinais decodificados.
2. Método de decodificação de acordo com a reivin-dicação 1, CARACTERIZADO pelo fato de que compreende adicio-nalmente extrair a informação do método de decodificação queconsidera como decodificar cada um dos sinais codificados,em que a determinação compreende determinar porqual da pluralidade dos métodos de decodificação os sinaiscodificados devem ser decodificados usando a informação dométodo de decodificação.
3. Método de decodif icação, de acordo com a rei-vindicação 1, CARACTERIZADO pelo fato de que a informação dométodo de decodificação compreende pelo menos uma da infor-mação da unidade de codificação que identifica uma unidadede codificação que produziu um sinal codificado, da informa-ção de unidade de decodificação que identifica uma unidadede decodificação que deve decodificar o sinal codificado eda informação que indica uma característica do sinal codifi-cado .
4. Método de decodificação, de acordo com a rei-vindicação 1, CARACTERIZADO pelo fato de que a determinaçãocompreende escolher qualquer um dos métodos de decodificaçãoque pode decodificar mais eficientemente cada um dos sinaiscodificados.
5. Método de decodif icação, de acordo com a rei-vindicação 1, CARACTERIZADO pelo fato de que compreende adi-cionalmente extrair informação de divisão dos sinais codifi-cados do fluxo continuo de bits de entrada,em que a sintetização compreende sintetizar os si-nais decodificados em um único sinal em relação à informaçãode divisão.
6. Método de decodif icação, de acordo com a rei-vindicação 5, CARACTERIZADO pelo fato de que a informação dedivisão compreende inúmeros sinais codificados ou informaçãode banda de freqüência dos sinais codificados.
7. Método de decodif icação, de acordo com a rei-vindicação 1, CARACTERIZADO pelo fato de que compreende adi-cionalmente extrair informação de quantidade de bits dos si-nais codificados do fluxo continuo de bits de entrada,em que a decodificação compreende decodificar ossinais codificados de acordo com a informação de quantidadede bits.
8. Método de decodif icação, de acordo com a rei-vindicação 1, CARACTERIZADO pelo fato de que compreende adi-cionalmente extrair informação de ordem de decodificação dossinais codificados do fluxo continuo de bits de entrada,em que a decodificação compreende decodificar ossinais codificados de acordo com a informação de ordem dedecodificação.
9. Aparelho de decodif icação, CARACTERIZADO pelofato de que compreende:um módulo de desempacotamento de bits que extraiuma pluralidade de sinais codificados de um fluxo continuode bits de entrada;um módulo de determinação do decodificador que de-termina qual de uma pluralidade de unidades de decodificaçãodeve ser usada para decodificar cada um dos sinais codifica-- dos;um módulo de decodificação que compreende a unida-de de decodificação e que decodifica cada um dos sinais co-dificados usando as unidades de decodificação determinadas;eum módulo de sintetização que sintetiza os sinaisdecodificados.
10. Aparelho de decodificação, de acordo com areivindicação 9, CARACTERIZADO pelo fato de que o módulo dedesempacotamento de bits extrai informação da unidade de de-codificação de cada um dos sinais codificados do fluxo con-tinuo de bits de entrada,em que o módulo de determinação do decodificadordetermina por qual da pluralidade de unidades de decodifica-ção os sinais codificados devem ser decodificados usando ainformação da unidade de decodificação.
11. Aparelho de decodificação, de acordo com areivindicação 9, CARACTERIZADO pelo fato de que o módulo dedeterminação do decodificador escolhe qualquer uma das uni-dades de decodificação que pode decodificar mais eficiente-mente os sinais codificados.
12. Aparelho de decodificação, de acordo com areivindicação 9, CARACTERIZADO pelo fato de que o módulo dedesempacotamento de bits extrai informação de divisão dossinais codificados do fluxo continuo de bits de entrada,em que o módulo de sintetização sintetiza os si-nais decodificados em um único sinal em relação à informaçãode divisão.
13. Método de codificação, CARACTERIZADO pelo fatode que compreende:dividir um sinal de entrada em uma pluralidade desinais divididos;determinar qual de uma pluralidade de métodos decodificação deve ser usado para codificar cada um dos sinaisdivididos com base nas características de cada um dos sinaisdivididos;codificar os sinais divididos usando os métodos decodificação; egerar um fluxo contínuo de bits usando os sinaisdivididos codificados.
14. Método de codificação, de acordo com a reivin-dicação 13, CARACTERIZADO pelo fato de que a determinaçãocompreende escolher qualquer um dos métodos de codificaçãoque pode codificar mais eficientemente os sinais divididos.
15. Método de codificação, de acordo com a reivin-dicação 13, CARACTERIZADO pelo fato de que compreende adi-cionalmente alocar uma quantidade de bits para codificar ca-da um dos sinais divididos.
16. Método de codificação, de acordo com a reivin-dicação 13, CARACTERIZADO pelo fato de que compreende adi-cionalmente determinar uma ordem na qual os sinais divididosdevem ser codificados.
17. Método de codificação, de acordo com a reivin-dicação 13, CARACTERIZADO pelo fato de que compreende adi-cionalmente dividir novamente o sinal de entrada em uma plu-ralidade de sinais divididos, determinar novamente qual dosmétodos de codificação deve ser usado para codificar cada umdos sinais divididos, determinar novamente uma quantidade debits para codificar os sinais divididos ou uma ordem na qualos sinais divididos devem ser codificados.
18. Aparelho de codificação, CARACTERIZADO pelofato de que compreende:um módulo de divisão de sinal que divide um sinalde entrada em uma pluralidade de sinais divididos;um módulo de determinação do codificador que de-termina qual de uma pluralidade de unidades de codificaçãodeve ser usada para codificar cada um dos sinais divididos;um módulo de codificação que compreende as unida-des de codificação e que codifica os sinais divididos usandoas unidades de codificação determinadas; eum módulo de empacotamento de bits que gera umfluxo continuo de bits usando os sinais divididos codifica-dos.
19. Aparelho de codificação, de acordo com a rei-vindicação 18, CARACTERIZADO pelo fato de que o módulo dedeterminação do codificador escolhe qualquer uma das unida-des de codificação que pode codificar mais eficientemente ossinais divididos.
20. Midia de qravação legivel por computador,CARACTERIZADA pelo fato de que tem um programa para executaro método de decodificação de qualquer uma das reivindicações-1 até 8 ou o método de codificação de qualquer uma das rei-vindicações 13 até 17.
BRPI0707135-3A 2006-01-18 2007-01-18 aparelho e método para codificação e decodificação de sinal BRPI0707135A2 (pt)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US75962206P 2006-01-18 2006-01-18
US60/759,622 2006-01-18
US79778206P 2006-05-03 2006-05-03
US60/797,782 2006-05-03
US81792606P 2006-06-29 2006-06-29
US60/817,926 2006-06-29
US84451006P 2006-09-13 2006-09-13
US60/844,510 2006-09-13
US84821706P 2006-09-29 2006-09-29
US60/848,217 2006-09-29
US86082206P 2006-11-24 2006-11-24
US60/860,822 2006-11-24
PCT/KR2007/000302 WO2007083931A1 (en) 2006-01-18 2007-01-18 Apparatus and method for encoding and decoding signal

Publications (1)

Publication Number Publication Date
BRPI0707135A2 true BRPI0707135A2 (pt) 2011-04-19

Family

ID=38287837

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0707135-3A BRPI0707135A2 (pt) 2006-01-18 2007-01-18 aparelho e método para codificação e decodificação de sinal

Country Status (10)

Country Link
US (3) US20090222261A1 (pt)
EP (3) EP1989703A4 (pt)
JP (3) JP2009524101A (pt)
KR (3) KR20080097178A (pt)
AU (1) AU2007206167B8 (pt)
BR (1) BRPI0707135A2 (pt)
CA (1) CA2636493A1 (pt)
MX (1) MX2008009088A (pt)
TW (3) TWI318397B (pt)
WO (3) WO2007083931A1 (pt)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102007003187A1 (de) * 2007-01-22 2008-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals
US7908103B2 (en) * 2007-05-21 2011-03-15 Nilanjan Senroy System and methods for determining masking signals for applying empirical mode decomposition (EMD) and for demodulating intrinsic mode functions obtained from application of EMD
GB2454208A (en) * 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
BRPI0820488A2 (pt) 2007-11-21 2017-05-23 Lg Electronics Inc método e equipamento para processar um sinal
BRPI0908963A2 (pt) * 2008-03-28 2015-07-28 Thomson Licensing Aparelho e método decodificação de sinais
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101381513B1 (ko) 2008-07-14 2014-04-07 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR101261677B1 (ko) * 2008-07-14 2013-05-06 광운대학교 산학협력단 음성/음악 통합 신호의 부호화/복호화 장치
KR20100007738A (ko) 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
JP5555707B2 (ja) * 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
CN101763856B (zh) * 2008-12-23 2011-11-02 华为技术有限公司 信号分类处理方法、分类处理装置及编码***
CN101604525B (zh) * 2008-12-31 2011-04-06 华为技术有限公司 基音增益获取方法、装置及编码器、解码器
JP5358270B2 (ja) * 2009-04-28 2013-12-04 パナソニック株式会社 デジタル信号再生装置及びデジタル信号圧縮装置
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
EP3693963B1 (en) * 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
CN105355209B (zh) * 2010-07-02 2020-02-14 杜比国际公司 音高增强后置滤波器
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US8660848B1 (en) * 2010-08-20 2014-02-25 Worcester Polytechnic Institute Methods and systems for detection from and analysis of physical signals
US20120095729A1 (en) * 2010-10-14 2012-04-19 Electronics And Telecommunications Research Institute Known information compression apparatus and method for separating sound source
CA2827000C (en) 2011-02-14 2016-04-05 Jeremie Lecomte Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
SG192721A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
CA2827335C (en) 2011-02-14 2016-08-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
TWI488177B (zh) * 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
MX2013009304A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
TWI492615B (zh) * 2011-05-23 2015-07-11 Nat Univ Chung Hsing 改良向量量化編碼還原影像品質與快速編碼簿訓練方法、壓縮方法、解壓縮方法及其程式產品
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
JP5752324B2 (ja) * 2011-07-07 2015-07-22 ニュアンス コミュニケーションズ, インコーポレイテッド 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制
EP2774145B1 (en) * 2011-11-03 2020-06-17 VoiceAge EVS LLC Improving non-speech content for low rate celp decoder
KR20130093783A (ko) * 2011-12-30 2013-08-23 한국전자통신연구원 오디오 객체 전송 장치 및 방법
EP2673776B1 (en) * 2012-01-20 2015-06-17 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio encoding and decoding employing sinusoidal substitution
GB201201230D0 (en) * 2012-01-25 2012-03-07 Univ Delft Tech Adaptive multi-dimensional data decomposition
CN103295578B (zh) 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
TWI591620B (zh) * 2012-03-21 2017-07-11 三星電子股份有限公司 產生高頻雜訊的方法
CN106409299B (zh) * 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
CN103839551A (zh) * 2012-11-22 2014-06-04 鸿富锦精密工业(深圳)有限公司 音频处理***与音频处理方法
CN104112451B (zh) * 2013-04-18 2017-07-28 华为技术有限公司 一种选择编码模式的方法及装置
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US20170201356A1 (en) * 2016-01-08 2017-07-13 Rohde & Schwarz Gmbh & Co. Kg Method and apparatus for expanding a message coverage
CN107316649B (zh) * 2017-05-15 2020-11-20 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置
BR112020004883A2 (pt) * 2017-09-20 2020-09-15 Voiceage Corporation método e dispositivo para alocar um bit-budget entre subquadros em um codec celp
WO2020050665A1 (ko) * 2018-09-05 2020-03-12 엘지전자 주식회사 비디오 신호의 부호화/복호화 방법 및 이를 위한 장치
US20220232255A1 (en) * 2019-05-30 2022-07-21 Sharp Kabushiki Kaisha Image decoding apparatus
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
KR20210003507A (ko) 2019-07-02 2021-01-12 한국전자통신연구원 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치
CN110489606B (zh) * 2019-07-31 2023-06-06 云南师范大学 一种分组Hilbert编码和解码方法
CN112155523B (zh) * 2020-09-27 2022-09-16 太原理工大学 一种基于模态能量主成分比量化的脉搏信号特征提取与分类方法
TWI768674B (zh) * 2021-01-22 2022-06-21 宏碁股份有限公司 諧振峰強化的語音編碼裝置及語音編碼方法
US20230025801A1 (en) * 2021-07-08 2023-01-26 Boomcloud 360 Inc. Colorless generation of elevation perceptual cues using all-pass filter networks

Family Cites Families (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US714559A (en) * 1902-06-10 1902-11-25 John Byrne Railway-tie.
EP0428156B1 (en) * 1989-11-14 1996-08-21 Nec Corporation Adaptive transform coding by selecting optimum block lengths according to variations between successive blocks
FR2674710B1 (fr) * 1991-03-27 1994-11-04 France Telecom Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle.
JPH05158495A (ja) * 1991-05-07 1993-06-25 Fujitsu Ltd 音声符号化伝送装置
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
CN1064773C (zh) * 1993-06-30 2001-04-18 索尼公司 数字信号的编码方法和解码方法
JP3277677B2 (ja) * 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US5742734A (en) * 1994-08-10 1998-04-21 Qualcomm Incorporated Encoding rate selection in a variable rate vocoder
US5751903A (en) * 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
US6272178B1 (en) * 1996-04-18 2001-08-07 Nokia Mobile Phones Ltd. Video data encoder and decoder
US5881053A (en) * 1996-09-13 1999-03-09 Qualcomm Incorporated Method for a wireless communications channel
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
US6148282A (en) * 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
WO1999003097A2 (en) * 1997-07-11 1999-01-21 Koninklijke Philips Electronics N.V. Transmitter with an improved speech encoder and decoder
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
DE69836785T2 (de) * 1997-10-03 2007-04-26 Matsushita Electric Industrial Co., Ltd., Kadoma Audiosignalkompression, Sprachsignalkompression und Spracherkennung
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
WO1999022525A1 (en) * 1997-10-23 1999-05-06 Mitsubishi Denki Kabushiki Kaisha Image encoding method, image encoder, image decoding method, and image decoder
US6418147B1 (en) * 1998-01-21 2002-07-09 Globalstar Lp Multiple vocoder mobile satellite telephone system
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
US6029126A (en) * 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
JP4618823B2 (ja) * 1998-10-22 2011-01-26 ソニー株式会社 信号符号化装置及び方法
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6278972B1 (en) * 1999-01-04 2001-08-21 Qualcomm Incorporated System and method for segmentation and recognition of speech signals
US6278982B1 (en) * 1999-04-21 2001-08-21 Lava Trading Inc. Securities trading system for consolidation of trading on multiple ECNS and electronic exchanges
US6549147B1 (en) * 1999-05-21 2003-04-15 Nippon Telegraph And Telephone Corporation Methods, apparatuses and recorded medium for reversible encoding and decoding
JP4438127B2 (ja) * 1999-06-18 2010-03-24 ソニー株式会社 音声符号化装置及び方法、音声復号装置及び方法、並びに記録媒体
WO2001022401A1 (en) * 1999-09-20 2001-03-29 Koninklijke Philips Electronics N.V. Processing circuit for correcting audio signals, receiver, communication system, mobile apparatus and related method
US7054809B1 (en) * 1999-09-22 2006-05-30 Mindspeed Technologies, Inc. Rate selection method for selectable mode vocoder
US6697776B1 (en) * 2000-07-31 2004-02-24 Mindspeed Technologies, Inc. Dynamic signal detector system and method
US6373411B1 (en) * 2000-08-31 2002-04-16 Agere Systems Guardian Corp. Method and apparatus for performing variable-size vector entropy coding
US6760698B2 (en) * 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
JP3557164B2 (ja) * 2000-09-18 2004-08-25 日本電信電話株式会社 オーディオ信号符号化方法及びその方法を実行するプログラム記憶媒体
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US6862558B2 (en) * 2001-02-14 2005-03-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Empirical mode decomposition for analyzing acoustical signals
US6996522B2 (en) * 2001-03-13 2006-02-07 Industrial Technology Research Institute Celp-Based speech coding for fine grain scalability by altering sub-frame pitch-pulse
EP1382202B1 (en) * 2001-04-18 2006-07-26 Koninklijke Philips Electronics N.V. Audio coding with partial encryption
US6820054B2 (en) * 2001-05-07 2004-11-16 Intel Corporation Audio signal processing for speech communication
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
KR100434275B1 (ko) * 2001-07-23 2004-06-05 엘지전자 주식회사 패킷 변환 장치 및 그를 이용한 패킷 변환 방법
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
US6785645B2 (en) * 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
BR0206783A (pt) * 2001-11-30 2004-02-25 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal, corrente de bits que representa um sinal codificado, meio de armazenagem, método e decodificador para decodificar uma corrente de bits que representa um sinal codificado, transmissor, receptor, e, sistema
TW564400B (en) * 2001-12-25 2003-12-01 Univ Nat Cheng Kung Speech coding/decoding method and speech coder/decoder
US6647366B2 (en) * 2001-12-28 2003-11-11 Microsoft Corporation Rate control strategies for speech and music coding
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
CN100370517C (zh) * 2002-07-16 2008-02-20 皇家飞利浦电子股份有限公司 一种对编码信号进行解码的方法
US7970606B2 (en) * 2002-11-13 2011-06-28 Digital Voice Systems, Inc. Interoperable vocoder
KR100604032B1 (ko) * 2003-01-08 2006-07-24 엘지전자 주식회사 복수 코덱을 지원하는 장치와 방법
KR100621076B1 (ko) * 2003-05-02 2006-09-08 삼성전자주식회사 마이크로폰 어레이 방법 및 시스템 및 이를 이용한 음성인식 방법 및 장치
EP1631954B1 (en) * 2003-05-27 2007-02-14 Koninklijke Philips Electronics N.V. Audio coding
US20050159942A1 (en) * 2004-01-15 2005-07-21 Manoj Singhal Classification of speech and music using linear predictive coding coefficients
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
WO2005098821A2 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
KR20070001267A (ko) * 2004-04-09 2007-01-03 닛본 덴끼 가부시끼가이샤 음성 통신 방법 및 장치
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
US7739120B2 (en) * 2004-05-17 2010-06-15 Nokia Corporation Selection of coding models for encoding an audio signal
CN1954365B (zh) * 2004-05-17 2011-04-06 诺基亚公司 使用不同编码模型的音频编码
EP1747554B1 (en) * 2004-05-17 2010-02-10 Nokia Corporation Audio encoding with different coding frame lengths
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7873515B2 (en) * 2004-11-23 2011-01-18 Stmicroelectronics Asia Pacific Pte. Ltd. System and method for error reconstruction of streaming audio information
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US7196641B2 (en) * 2005-04-26 2007-03-27 Gen Dow Huang System and method for audio data compression and decompression using discrete wavelet transform (DWT)

Also Published As

Publication number Publication date
AU2007206167B8 (en) 2010-06-24
US20090281812A1 (en) 2009-11-12
US20090222261A1 (en) 2009-09-03
WO2007083931A1 (en) 2007-07-26
MX2008009088A (es) 2009-01-27
EP1989703A4 (en) 2012-03-14
TW200746052A (en) 2007-12-16
KR20080101873A (ko) 2008-11-21
JP2009524099A (ja) 2009-06-25
US20110057818A1 (en) 2011-03-10
AU2007206167A1 (en) 2007-07-26
KR20080097178A (ko) 2008-11-04
EP1984911A4 (en) 2012-03-14
EP1984911A1 (en) 2008-10-29
WO2007083934A1 (en) 2007-07-26
TW200737738A (en) 2007-10-01
WO2007083933A1 (en) 2007-07-26
JP2009524100A (ja) 2009-06-25
EP1989702A1 (en) 2008-11-12
KR20080101872A (ko) 2008-11-21
TWI333643B (en) 2010-11-21
AU2007206167B2 (en) 2010-06-10
EP1989703A1 (en) 2008-11-12
JP2009524101A (ja) 2009-06-25
TW200746051A (en) 2007-12-16
TWI318397B (en) 2009-12-11
EP1989702A4 (en) 2012-03-14
CA2636493A1 (en) 2007-07-26

Similar Documents

Publication Publication Date Title
BRPI0707135A2 (pt) aparelho e método para codificação e decodificação de sinal
JP6691093B2 (ja) オーディオエンコーダ、符号化方法およびコンピュータプログラム
CN100568345C (zh) 用于人工扩展语音信号的带宽的方法和装置
EP2077551B1 (en) Audio encoder and decoder
Ravelli et al. Union of MDCT bases for audio coding
MX2013009303A (es) Codec de audio utilizando sintesis de ruido durante fases inactivas.
KR102560473B1 (ko) 후처리 지연을 저감시킨 고주파 재구성 기술의 통합
Lindblom A sinusoidal voice over packet coder tailored for the frame-erasure channel
Bhatt Simulation and overall comparative evaluation of performance between different techniques for high band feature extraction based on artificial bandwidth extension of speech over proposed global system for mobile full rate narrow band coder
RU2414009C2 (ru) Устройство и способ для кодирования и декодирования сигнала
EP0950238B1 (en) Speech coding and decoding system
EP4120253A1 (en) Integral band-wise parametric coder
Motlicek et al. Wide-band audio coding based on frequency-domain linear prediction
Motlicek et al. Frequency domain linear prediction for QMF sub-bands and applications to audio coding
Cornuz et al. Object coding of harmonic sounds using sparse and structured representations
Viswanathan et al. A harmonic deviations linear prediction vocoder for improved narrowband speech transmission
Gao et al. A new approach to generating Pitch Cycle Waveform (PCW) for Waveform Interpolation codec
Yaghmaie Prototype waveform interpolation based low bit rate speech coding

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 10A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]