BRPI0317652B1 - Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável - Google Patents

Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável Download PDF

Info

Publication number
BRPI0317652B1
BRPI0317652B1 BRPI0317652-5A BRPI0317652A BRPI0317652B1 BR PI0317652 B1 BRPI0317652 B1 BR PI0317652B1 BR PI0317652 A BRPI0317652 A BR PI0317652A BR PI0317652 B1 BRPI0317652 B1 BR PI0317652B1
Authority
BR
Brazil
Prior art keywords
prediction
vector
stage
error vector
prediction error
Prior art date
Application number
BRPI0317652-5A
Other languages
English (en)
Inventor
Jelinek Milan
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of BRPI0317652B1 publication Critical patent/BRPI0317652B1/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

"método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável". a presente invenção relaciona a um método e a um dispositivo para quantizar os parâmetros de predição linear na codificação do sinal de som de taxa de bit variável, no qual o vetor de entrada do parâmetro de predição linear é recebido, o quadro do sinal de som correspondendo ao vetor de entrada do parâmetro de predição linear é classificado, o vetor de predição é calculado, o vetor de predição calculado é removido do vetor de entrada do parâmetro de predição linear para produzir o vetor de erro de predição, e o vetor de erro de predição é quantificado. o cálculo do vetor de predição compreende selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro do sinal de som, e processar o vetor de erro de predição através do esquema de predição selecionado. a presente invenção também relaciona a um método e a um dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal de som a uma taxa de bit variável, no qual ao menos um índice de quantização e a informação sobre a classificação do quadro de sinal de som correspondendo ao índice de quantização são recebidos, o vetor de erro de predição é recuperado ao aplicar o índice para ao menos uma tabela de quantização, o vetor de predição é reconstruído, e o vetor do parâmetro de predição linear é produzido em resposta ao vetor de erro de predição recuperado e ao vetor de predição reconstruído. a reconstrução do vetor de predição compreende processar o vetor de erro de predição recuperado através de um de uma pluralidade de esquemas de predição dependendo da informação de classificação do quadro.

Description

(54) Título: MÉTODO E DISPOSITIVO PARA QUANTIZAR OS PARÂMETROS DE PREDIÇÃO LINEAR NA CODIFICAÇÃO DO SINAL DO SOM A UMA TAXA DE BIT VARIÁVEL, E, MÉTODO E DISPOSITIVO PARA DÊS-QUANTIZAR OS PARÂMETROS DE PREDIÇÃO LINEAR NA DECODIFICAÇÃO DO SINAL DO SOM A UMA TAXA DE BIT VARIÁVEL (51) Int.CI.: G10L 19/038; G10L 19/20 (52) CPC: G10L 19/038,G10L 19/20 (30) Prioridade Unionista: 24/12/2002 CA 2,415,105 (73) Titular(es): NOKIA TECHNOLOGIES OY (72) Inventor(es): MILAN JELINEK / 30
MÉTODO E DISPOSITIVO PARA QUANTIZAR OS PARÂMETROS DE PREDIÇÃO LINEAR NA CODIFICAÇÃO DO SINAL DO SOM A UMA TAXA DE BIT VARIÁVEL, E, MÉTODO E DISPOSITIVO PARA DÊS-QUANTIZAR OS PARÂMETROS DE PREDIÇÃO LINEAR NA DECODIFICAÇÃO DO SINAL DO SOM A UMA TAXA DE BIT VARIÁVEL
1. Campo da Invencão [0001] A presente invenção refere-se a uma técnica melhorada para codificar digitalmente o sinal do som, em particular mas não exclusivamente a um sinal de fala, em vista da transmissão e da sintetização deste sinal do som. Mais especificamente, a presente invenção está relacionada com um método e um dispositivo para quantizar vetorialmente os parâmetros de predição linear em uma codificação baseada na predição linear de taxa de bit variável.
Descrição da Técnica Anterior
Codificação de fala e quantização dos parâmetros de predição linear (LP):
[0002] Os sistemas de comunicação de voz digital, tal como os sistemas sem fio usam os codificadores de fala para aumentar a capacidade enquanto mantêm uma qualidade alta de voz. O codificador de fala converte o sinal de fala em um fluxo de bit digital que é transmitido sobre um canal de comunicação ou armazenado em um meio de armazenagem. O sinal de fala é digitalizado, quer dizer, amostrado e quantificado com usualmente 16-bits por amostra. O codificador de fala tem a regra de representar estas amostras digitais com um menor número de bits enquanto mantêm uma qualidade boa de fala subjetiva. O decodificador de fala ou sintetizador opera no fluxo de bit transmitido ou armazenado e converte este de volta para o sinal de som.
[0003] Os métodos de codificação de fala digital baseados na análise de predição linear têm sido muito bem sucedidos na codificação de fala de taxa de bit baixa. Em particular, a codificação de predição linear de código excitado (CELP - code-excited
Petição 870170068282, de 13/09/2017, pág. 7/52
2/30 linear predictiorí) é uma das melhores técnicas conhecidas para alcançar um bom compromisso entre a qualidade subjetiva e a taxa de bit. Esta técnica de codificação é à base de vários padrões de codificação de fala, tanto nas aplicações sem fio quanto na cabeada. Na codificação CELP, o sinal de fala amostrado é processado em blocos sucessivos de Namostras usualmente denominados de quadros, onde N é um número predeterminado correspondendo tipicamente a 10-30 ms. O filtro de predição linear (LP) A(z) é calculado, codificado e transmitido em cada quadro. O cálculo do filtro (LP) A(z) tipicamente necessita de um antecessor, que consiste de um segmento de fala de 5-15ms do quadro subseqüente. O quadro de /l/-amostras é dividido em blocos menores denominados de sub-quadros. Usualmente o número de sub-quadros é três ou quatro, resultando em sub-quadros de 4-10ms. Em cada subquadro, um sinal de excitação é usualmente obtido de dois componentes, a excitação passada e a excitação de livro código inovadora. O componente formado da excitação passada é frequentemente referenciado como livro código adaptativo ou excitação de passo. Os parâmetros que caracterizam o sinal de excitação são codificados e transmitidos para o decodificador, onde o sinal de excitação reconstruído é usado como a entrada do filtro de síntese LP.
[0004] O filtro de síntese LP é dado por:
Á(z)
Figure BRPI0317652B1_D0001
OjZ onde a, são coeficientes de predição linear e M é a ordem da análise LP. O filtro de síntese LP modela o envelope espectral do sinal de fala. No decodificador, o sinal de fala é reconstruído ao filtrar a excitação decodificada através do filtro de síntese LP.
[0005] O grupo de coeficientes de predição linear a\ são calculados, tal que o erro de predição:
Petição 870170068282, de 13/09/2017, pág. 8/52
3/30 e(n) = s(ri) - s (ri) é minimizado, onde s(n) é o sinal de entrada no tempo n e (n) é o sinal predito baseado nas últimas amostras AZ dadas por:
s 00 = ais& - 0 [0006] Assim, o erro de predição é dado por:
.Iíi ’ e(n) = X») + ats(n - i)
M [0007] Este corresponde no domínio da transformada-z a:
£(Z) = S(z)A(z) [0008] onde A(z) é o filtro LP da ordem AZ dado por:
[0009] Tipicamente, os coeficientes de predição linear a, são calculados ao minimizar o erro de predição médio quadrado sobre o bloco de L amostras, L sendo um inteiro igual ou maior do que N (L usualmente corresponde de 20-30ms). O
Petição 870170068282, de 13/09/2017, pág. 9/52 / 30 cálculo dos coeficientes de predição linear é bem conhecido do técnico. Um exemplo de tal cálculo é dado na [Recomendação ITU-T G.722.2 Codificação de fala de banda larga em tomo de 16kbit/s usando banda larga de múltiplas taxas adaptativo (AMR-WB), Geneva, 2002].
[0010] Os coeficientes de predição linear ai não podem ser diretamente quantizados para transmissão para o decodificador. A razão é que erros de menor quantização nos coeficientes de predição linear podem produzir erros espectrais maiores na função de transferência do filtro LP, e pode causar instabilidades no filtro. Consequentemente, uma transformação é aplicada aos coeficientes de predição linear a, antes da quantização. A transformação produz o que é chamado de representação dos coeficientes de predição linear ai. Após receber os coeficientes de predição linear transformados e quanti ficados ai, o decodificador pode então aplicar a transformação inversa para obter os coeficientes de predição linear quantificados. Uma representação amplamente usada para os coeficientes de predição linear ai são as frequências espectrais de linha (LSF, Line Spectral Frequency) também conhecida como pares espectrais de linha (LSP, Line Spectral airs). Detalhes do cálculo das Frequências Espectrais de Linha podem ser encontrados na (Recomendação ITU-T G.729 Codificação de fala a 8kbit/s usando predição linear de código algébrico excitado de estrutura conjugada (CS-ACELP), Geneva, Março de 1996].
[0011] Uma representação similar são as Frequências Espectrais de Imitância (ISF, Immitance Spectral Frequencies), que tem sido usada no padrão de codificação AMR-WB [Recomendação ITU-T G.722.2 Codificação de fala de banda larga em tomo de 16kbit/s usando banda larga de múltiplas taxas adaptativo (AMR-WB), Geneva, 2002]. Outras representações são também possíveis e têm sido usadas. Sem perda de generalidade, um caso particular de representação ISF será considerado na descrição a seguir.
[0012] Os parâmetros LP então obtidos (LSFs, ISFs, etc.) são quantificados ou com quantização escalar (SQ - S.calar Quantization) ou quantização vetorial (VQ, Vector
Petição 870170068282, de 13/09/2017, pág. 10/52 / 30
Quantization). Na quantização escalar, os parâmetros LP são quantificados individualmente e usual mente 3 ou 4 bits por parâmetro são requeridos. Na quantização vetorial, os parâmetros LP são agrupados no vetor e quantificados como urna entidade. Um livro código, ou uma tabela, contendo o grupo de vetores quantificados é armazenado. O quantificador busca o livro código para a entrada do livro código que está mais próxima da entrada do vetor de acordo com urna certa medida da distância. O índice do vetor quanti ficado selecionado é transmitido para o decodificador. A quantização vetorial oferece uma melhor performance do que a quantização escalar, mas às custas dos requerimentos de complexidade e memória aumentados.
[0013] A quantização vetorial estruturada é usualmente usada para reduzir a complexidade e os requerimentos de armazenagem de VQ. Na divisão-VQ, o vetor do parâmetro LP é dividido em ao menos dois sub-vetores que são quantificados individualmente. No VQ de múltiplos-estágios, o vetor quantificado é a adição das entradas de vários livros códigos. Ambos, o VQ de divisão e o VQ de múltiplos estágios resultam em uma memória e complexidade reduzidas, enquanto mantêm uma performance de quantização boa. Em adição, uma aproximação interessante é combinar o VQ de divisão e o de múltiplos estágios para também reduzir os requerimentos de memória e complexidade. Na referência [Recomendação ITU-T G.729 Codificação de fala a 8kbit/s usando predição linear de código algébrico excitado de estrutura conjugada (CS-ACELP), Geneva, Março de 1996), o vetor do parâmetro LP é quantificado em dois estágios, onde o vetor do segundo estágio é dividido em dois sub-vetores.
[0014] Os parâmetros LP exibem uma forte correlação entre quadros sucessivos e é usualmente explodido pelo uso da quantização preditiva para melhorar a performance. Na quantização vetorial preditiva, o vetor do parâmetro LP predito é calculado baseado na informação dos quadros passados. Então, o vetor predito é removido da entrada do vetor e o erro de predição é o vetor quantificado. Dois tipos de predição são usualmente usados: a predição auto-regressiva (AR, AutoPetição 870170068282, de 13/09/2017, pág. 11/52 / 30
Regressive) e a predição de média móvel (MA, Moving Average). Na predição AR, o vetor predito é calculado como uma combinação dos vetores quantificados dos quadros passados. Na predição MA, o vetor predito é calculado como uma combinação dos vetores de erro de predição dos quadros passados. A predição AR produz uma melhor performance. Contudo, a predição AR não é robusta para as condições de perda de quadro, que são encontradas nos sistemas de comunicação sem fio e baseado em pacote. No caso dos quadros perdidos, o erro propaga para os quadros consecutivos uma vez que a predição é baseada nos quadros corrompidos prévios.
2.2 Codificação de taxa de bit variável (VBR - Variable Bit-Rate):
[0015] Nos vários sistemas de comunicação, por exemplo, nos sistemas sem fio usando a tecnologia de acesso múltiplo por divisão de código (CDMA), o uso da codificação de fala de taxa de bit variável controlada por fonte (VBR) melhora significativamente a capacidade do sistema. Na codificação VBR controlada por fonte, o codificador opera nas várias taxas de bit, e o modo de seleção de taxa é usado para determinar a taxa de bit usada para codificar cada quadro de fala baseado na natureza do quadro de fala, por exemplo, vozeado, não vozeado, transiente, ruído de fundo, etc. A meta é obter a melhor qualidade de fala em uma taxa de bit média determinada, também referenciada como a taxa de dados média (ADR, Average Data Rate). O codificador é também capaz de operar de acordo com diferentes modos de operação ao sintonizar o modo de seleção da taxa para obter diferentes ADRs para diferentes modos, onde a performance do codificador melhora com o aumento do ADR. Isto provê ao codificador um mecanismo de oferta entre a qual idade de fala e a capacidade do sistema. Nos sistemas CDMA, por exemplo, CDMA-one e CDMA2000, tipicamente 4 taxas de bit são usadas e referenciadas como taxamáxima (FR, Full Rate), meia-taxa (HR, Half-Rate), um quarto-taxa (QR, QuarterRate), e um oitavo-taxa (ER). Neste sistema CDMA, dois grupos de taxas são suportados e referenciados como Grupo de Taxa I e Grupo de Taxa 11. No Grupo de Taxa II, um codificador de taxa variável com um mecanismo de seleção de taxa opera nas taxas de bit de codificação de fonte de 13.3 (FR), 6.2 (HR), 2.7 (QR), e
Petição 870170068282, de 13/09/2017, pág. 12/52 / 30
1.0 (ER) kbit/s, correspondendo às taxas de bit gerais de 14.4, 7.2, 3.6, e 1.8 kbi/s (com alguns bits adicionados para detecção de erro).
[0016] O codec de banda larga conhecido como codec de fala de banda larga de múltiplas taxas adaptativo (AMR-WB) foi recentemente selecionado pelo ITU-T (International Telecommunications Union - Telecommunication Standardization Sector) para vários serviços e telefonia de fala de banda larga e pelo 3GPP (Third Generation Partnership Project) para os sistemas sem fio de terceira geração GSM e W-CDM A (Wideband Code Division Multiple Access/ Acesso Múltiplo por Divisão de Código de Banda Larga). O codec AMR-WB consiste de nove taxas de bit na faixa de 6.6 a 23.85 kbit/s. Ao projetar um codec VBR controlado por fonte baseado no AMRWB para o sistema CDMA2000 tem a vantagem de possibilitar a interoperação entre o CDMA2000 e outros sistemas usando o codec AMR-WB. A taxa de bit do AMR-WB de 12.65 kbit/s é a taxa mais próxima de que pode ajustar na taxa máxima de 13.3 kbit/s do Grupo de Taxa II CDMA2000. A taxa de 12.65 kbit/s pode ser usada como uma taxa comum entre o codec VBR de banda larga CDMA2000 e o codec AMR-WB para possibilitar a interoperabilidade sem transcodi ficar, o que degrada a qualidade de fala. A meia-taxa de 6.2 kbit/s tem de ser adicionada para possibilitar uma operação eficiente na estrutura do Grupo de Taxa II. O codec resultante pode operar em poucos modos específicos-CDMA2000, e incorpora um modo que possibilita a interoperabilidade com os sistemas usando o codec AMR-WB.
[0017] A codificação de meia-taxa é tipicamente escolhida nos quadros onde o sinal de entrada de fala é estacionário. As armazenagens de bit, comparadas à taxa máxima, são alcançadas ao atualizar os parâmetros de codificação menos frequentemente ou ao usar poucos bits para codificar alguns destes parâmetros de codificação. Mais especificamente, nos segmentos vozeados estacionários, a informação de passo é codificada apenas uma vez por quadro, e poucos bits são usados para representar os parâmetros do livro código fixo e os parâmetros de predição linear.
Petição 870170068282, de 13/09/2017, pág. 13/52 / 30 [0018] Uma vez que, o VQ preditivo com a predição MA é tipicamente aplicado para codificar os coeficientes de predição linear, um aumento desnecessário no ruído de quantização pode ser observado nestes coeficientes de predição linear. A predição MA, como oposta à predição AR, é usada para aumentar a robustez das perdas do quadro; contudo, nos quadros estacionários os coeficientes de predição linear evoluem lentamente ao usar a predição AR, neste caso particular teria um impacto menor na propagação de erro no caso dos quadros perdidos. Isto pode ser visto ao observar que, no caso dos quadros perdidos, a maioria dos decodificadores aplica um procedimento de encobrimento, o que essencialmente extrapola os coeficientes de predição linear do último quadro. Se o quadro perdido for vozeado estacionário, esta extrapolação produz valores muito similares ao atualmente transmitido, mas não os parâmetros LP recebidos. O vetor do parâmetro LP reconstruído está então próximo ao que teria sido decodificado se o quadro não tivesse sido perdido. Neste caso específico, então, ao usar a predição AR no procedimento de quantização dos coeficientes de predição linear não pode ter um efeito muito adverso na propagação do erro de quantização.
Sumário da Invenção [0019] De acordo com a presente invenção é fornecido um método para quantizar os parâmetros de predição linear na codificação do sinal de som de taxa de bi t variável, compreendendo receber um vetor de entrada do parâmetro de predição linear, classificar o quadro do sinal de som correspondente ao vetor de entrada do parâmetro de predição linear, calcular o vetor de predição, remover o vetor de predição calculado do vetor de entrada do parâmetro de predição linear para produzir um vetor de erro de predição, escalar o vetor de erro de predição, e quantizar o vetor de erro de predição escalonado. Calcular o vetor de predição compreende selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro de sinal do som, e calcular o vetor de predição de acordo com o esquema de predição selecionado. Escalar o vetor de erro de predição compreende selecionar ao menos um de uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado, e escalar o vetor de
Petição 870170068282, de 13/09/2017, pág. 14/52 / 30 erro de predição de acordo com o esquema de escalonamento selecionado.
[0020] Também de acordo com a presente invenção, é fornecido um dispositivo para quantizar os parâmetros de predição linear na codificação de sinal do som em uma taxa de bit variável, compreendendo um dispositivo para receber o vetor de entrada do parâmetro de predição linear, um dispositivo para classificar o quadro do sinal de som correspondente ao vetor de entrada do parâmetro de predição linear, um dispositivo para calcular o vetor de predição, um dispositivo para remover o vetor de predição calculado do vetor de entrada do parâmetro de predição linear para produzir um vetor de erro de predição, um dispositivo para escalar o vetor de erro de predição, e um dispositivo para quantizar o vetor de erro de predição escalonado. O dispositivo para calcular o vetor de predição compreende um dispositivo para selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro de sinal do som, e um dispositivo para calcular o vetor de predição de acordo com o esquema de predição selecionado. Em adição, um dispositivo para escalonar o vetor de erro de predição compreendendo um dispositivo para selecionar ao menos um de uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado, e um dispositivo para escalar o vetor de erro de predição de acordo com o esquema de escalonamento selecionado.
[0021] A presente invenção também relaciona a um dispositivo para quantizar os parâmetros de predição linear na codificação de sinal do som em uma taxa de bit variável, compreendendo uma entrada para receber o vetor de entrada do parâmetro de predição linear, um classificador do quadro do sinal de som correspondente ao vetor de entrada do parâmetro de predição linear, um calculador do vetor de predição, um subtrator para remover o vetor de predição calculado do vetor de entrada do parâmetro de predição linear para produzir um vetor de erro de predição, uma unidade de escala fornecida com o vetor de erro de predição, esta unidade escalonando o vetor de erro de predição, e um quantizador do vetor de erro de predição escalonado. O calculador do vetor de predição compreende um seletor de
Petição 870170068282, de 13/09/2017, pág. 15/52 / 30 um de uma pluralidade de esquemas de predição em relação à classificação do quadro de sinal do som, para calcular o vetor de predição de acordo com o esquema de predição selecionado. A unidade de escala compreende o seletor de ao menos um de uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado, para escalar o vetor de erro de predição de acordo com 0 esquema de escalonamento selecionado.
[0022] A presente invenção é também referenciada a um método de dêsquantização dos parâmetros de predição linear na decodificação do sinal de som de taxa de bit variável, compreendendo receber ao menos um índice de quantização, receber a informação sobre a classificação do quadro de sinal de som correspondendo a ao menos um índice de quantização, recuperar o vetor de erro de predição ao aplicar ao menos um índice para ao menos uma tabela de quantização, reconstruir o vetor de predição, e produzir um vetor de parâmetro de predição linear em resposta ao vetor de erro de predição recuperado e ao vetor de predição reconstruído. A reconstrução do vetor de predição compreende processar o vetor de erro de predição recuperado através de um de uma pluralidade de esquemas de predição dependendo da informação de classificação do quadro.
[0023] A presente invenção é também referenciada a um dispositivo de dêsquantização dos parâmetros de predição linear na decodificação do sinal de som de taxa de bi t variável, compreendendo um dispositivo para receber ao menos um índice de quantização, um dispositivo para receber a informação sobre a classificação do quadro de sinal de som correspondendo ao menos a um índice de quantização, um dispositivo para recuperar o vetor de erro de predição ao aplicar ao menos um índice para ao menos uma tabela de quantização, um dispositivo para reconstruir o vetor de predição, e um dispositivo para produzir o vetor de parâmetro de predição linear em resposta ao vetor de erro de predição recuperado e ao vetor de predição reconstruído. Um dispositivo de reconstrução do vetor de predição compreende um dispositivo para processar o vetor de erro de predição recuperado através de um de uma pluralidade de esquemas de predição dependendo da informação de
Petição 870170068282, de 13/09/2017, pág. 16/52 / 30 classificação do quadro.
[0024] De acordo com o último aspecto da presente invenção é também fornecido um dispositivo de dês-quantização dos parâmetros de predição linear na decodificação do sinal de som de taxa de bit variável, compreendendo um dispositivo para receber ao menos um índice de quantização, um dispositivo para receber a informação sobre a classificação do quadro de sinal de som correspondendo ao menos a um índice de quantização, ao menos uma tabela de quantização fornecida com ao menos um índice de quantização para recuperar o vetor de erro de predição, uma unidade de reconstrução do vetor de predição, e um gerador do vetor de parâmetro de predição linear em resposta ao vetor de erro de predição recuperado e ao vetor de predição reconstruído. A unidade de reconstrução do vetor de predição compreende ao menos um preditor fornecido com o vetor de erro de predição recuperado para processar o vetor de erro de predição recuperado através de um de urna pluralidade de esquemas de predição dependendo da informação de classificação do quadro.
[0025] Os objetos anteriores e outros, as vantagens e as características da presente invenção se tomarão aparentes da leitura da descrição não restritiva a seguir das incorporações ilustrativas desta, dado por meio de exemplo apenas com referência aos desenhos apensos.
Breve Descrição dos Desenhos [0026] Figura 1 - é um diagrama em blocos esquemático ilustrando um exemplo não limitativo do quantizador vetorial de múltiplos estágios;
[0027] Figura 2 - é um diagrama em blocos esquemático ilustrando um exemplo não limitativo do quantizador vetorial do vetor particionado;
[0028] Figura 3 - é um diagrama em blocos esquemático ilustrando um exemplo não limitativo do quantizador de vetor preditivo usando predição auto-regressiva (AR);
Petição 870170068282, de 13/09/2017, pág. 17/52 / 30 [0029] Figura 4 - é um diagrama em blocos esquemático ilustrando um exemplo não-limitativo do quantizador de vetor preditivo usando a predição de média móvel (MA);
[0030] Figura 5 - é um diagrama em blocos esquemático de um exemplo de um quantizador de vetor preditivo comutado no codificador, de acordo com uma incorporação ilustrativa não-restritiva da presente invenção;
[0031] Figura 6 - é um diagrama em blocos esquemático de um exemplo de um quantizador de vetor preditivo comutado no decodificador, de acordo com uma incorporação ilustrativa não restritiva da presente invenção;
[0032] Figura 7 - é um exemplo ilustrativo não restritivo de uma distribuição da frequência sobre ISFs, onde cada distribuição é uma função da probabilidade para encontrar um ISF na posição determinada no vetor ISF; e [0033] Figura 8 - é um gráfico apresentando um exemplo típico de evolução dos parâmetros ISF através de sucessivos quadros de fala.
Descrição Detalhada da Invenção [0034] Embora as incorporações ilustrativas da presente invenção sejam descritas na descrição a seguir em relação a uma aplicação do sinal de fala, deveria ser mantido em mente que a presente invenção pode também ser aplicada a outros tipos de sinal de som.
[0035] As técnicas de codificação de fala mais recentes são baseadas na análise de predição linear, tal como a codificação CELP. Os parâmetros LP são calculados e quantificados nos quadros de 10-30ms. Na incorporação ilustrativa atual, os quadros de 20ms são usados e urna análise LP da ordem de 16 é assumida. Um exemplo de cálculo dos parâmetros LP no sistema de codificação de fala é encontrado na referência [Recomendação ITU-T G.722.2 Codificação de fala de banda larga em
Petição 870170068282, de 13/09/2017, pág. 18/52
13/30 tomo de 16kbit/s usando banda larga de múltiplas taxas adaptativo (AMR-WB), Geneva, 2002]. Neste exemplo ilustrativo, o sinal de fala pré-processado é em cascata e as auto-correlações da fala em cascata são calculadas. A recursividade de Levinson-Durbin é então usada para calcular os coeficientes de predição linear a,, i= I , M das auto-correlações R(k}, k=0, M, onde Méa ordem de predição.
[0036] Os coeficientes de predição linear a, não podem ser quantificados diretamente para transmissão para o decodificador. A razão é que os erros de quantização menores nos coeficientes de predição linear pode produzir erros espectrais amplos na função de transferência do filtro LP, e pode causar as instabilidades do filtro. Consequentemente, uma transformação é aplicada aos coeficientes de predição linear a, antes da quantização. A transformação produz o que é chamado de representação dos coeficientes de predição linear. Após receber os coeficientes de predição linear transformados e quantizados, o decodificador pode então aplicar a transformação inversa para obter os coeficientes de predição linear quantizados. Uma representação amplamente usada para os coeficientes de predição linear a, são as frequências espectrais de linha (LSF, Line Spectral Frequency) também conhecida corno pares espectrais de linha (LSP, Line Spectral Pairs). Detalhes do cálculo das Frequências Espectrais de Linha podem ser encontrados na (Recomendação ΓΤυ-Τ G.729 Codificação de fala a 8kbit/s usando predição linear de código algébrico excitado de estrutura conjugada (CS-ACELP), Geneva, Março de 1996]. Os LSFs consistem dos pólos dos polinômios:
fiCíÔ - (<«) z”w+lí ΑζΓ1 >)/ÇL “ ) [0037] Para os valores pares de M, cada polinômio tem M/2 raízes conjugadas na unidade de círculo (e±jO1). Em adição, os polinômios podem ser escritos corno:
Petição 870170068282, de 13/09/2017, pág. 19/52
14/30 ρω- rU-nU·^)
Μ,Βϊ,.^Μ-Ι e
βί?·)53 Π(^“ + £ )» onde qi=cos(Oi) com ©,, sendo as frequências espectrais de linha (LSF) que satisfazem a propriedade de ordenação 0< Οι < θ2<···< π. Neste exemplo particular, os LSFs constituem os parâmetros LP (Linear Prediction/Predição Linear).
[0038] Uma representação similar é as Frequências Espectrais de Imitância (ISF, Immitance Spectral Frequencies), que tem sido usada no padrão de codificação AMR-WB. Detalhes do cálculo dos ISFs podem ser encontrados na referência [Recomendação ITU-T G.722.2 Codificação de fala de banda larga em tomo de 16kbit/s usando banda larga de múltiplas taxas adaptativo (AMR-WB), Geneva, 2002]. Outras representações são também possíveis e têm sido usadas. Sem perda de generalidade, a descrição a seguir considerará o caso de uma representação ISF como um exemplo ilustrativo não restritivo.
[0039] Para um filtro de ordem Mth, onde M é par, os ISPs são definidos as raízes dos polinômios:
C<) = Afe) + Àfe“l)
Petição 870170068282, de 13/09/2017, pág. 20/52
15/30
Fj(z)=(a(z) -2-^-7)/(1-^) [0040] Os polinômios Fi(z) e F2(z) tem raízes conjugadas M/2 e M/2-1 na unidade de círculo da (e±joi), respectiva mente. Então, os polinômios podem ser escritos como:
^(2) = 0 + ¾). Π^,
Figure BRPI0317652B1_D0002
íi(z) = £-«„) ΠΗ^)
Figure BRPI0317652B1_D0003
onde qi=cos(Oi) com o, sendo as frequências espectrais de imitância (ISF), e aMé o último coeficiente de predição linear. Os ISFs satisfazem a propriedade de ordenação 0< Οι < θ2<···< Om-i <n. Neste exemplo particular, os ISFs constituem os parâmetros LP. Então, os ISFs consistem das frequências M-l em adição aos últimos coeficientes de predição linear. Na incorporação ilustrativa atual, os ISFs são mapeados nas frequências na faixa de 0 a fs/2, onde fs, é a frequência de amostragem, usando a relação a seguir:
Figure BRPI0317652B1_D0004
M
Petição 870170068282, de 13/09/2017, pág. 21/52
16/30
Figure BRPI0317652B1_D0005
[0041] Os LSFs e os ISFs (parâmetros LP) têm sido amplamente usados devido às várias propriedades que os tornam adequados aos propósitos de quantização. Dentre estas propriedades que são bem definidas na faixa dinâmica, sua evolução leve resultante das correlações fortes dos quadros inter e intra, e a existência da propriedade de ordenação que garante a estabilidade do filtro LP quantizado.
[0042] Neste documento, o termo parâmetro LP é usado para referenciar quaisquer representações dos coeficientes LP, por exemplo LSF, ISF. O LSF médioremovido, ou o ISF médio-removido.
[0043] As propriedades principais dos ISFs (parâmetros de predição linear LP) serão descritas, de forma a entender as aproximações de quantização usadas. A Figura 7 apresenta um exemplo típico da função de distribuição da probabilidade (PDF, Probability Distribution Function) dos coeficientes ISF. Cada curva representa o PDF de um coeficiente ISF individual. A metade de cada distribuição é apresentada no eixo horizontal (pk). Por exemplo, a curva para o ISFi indica todos os valores, com a sua probabilidade de ocorrência, que pode ser obtida pelo primeiro coeficiente ISF no quadro. A curva para ISF2 indica todos os valores, com a sua probabilidade de ocorrência, que podem ser obtidos pelo segundo coeficiente ISF no quadro, e assim por diante. A função PDF é tipicamente obtida ao aplicar o histograma para os valores obtidos por um determinado coeficiente corno observado através dos vários quadros consecutivos. Observamos que cada coeficiente ISF ocupa um intervalo restrito sobre todos os valores ISF possíveis. Isto eficientemente reduz o espaço que o quantizador tem de cobrir e aumenta a eficiência da taxa de bit. É também importante observar que, enquanto os PDFs dos coeficientes ISF podem sobrepor, os coeficientes ISF em um determinado quadro são sempre ordenados. (ISFk+i - ISFk > 0, onde k é a posição do coeficiente ISF dentro do vetor dos coeficientes ISF).
Petição 870170068282, de 13/09/2017, pág. 22/52
17/30 [0044] Com os comprimentos de quadro típicos de 10 a 30 ms no codificador de fala, os coeficientes ISF exibem uma correlação de inter-quadro. A Figura 8 ilustra como os coeficientes ISF evoluem através dos quadros no sinal de fala. A Figura 8 foi obtida ao executar a análise LP sobre 30 quadros consecutivos de 20ms no segmento de fala compreendendo ambos os quadros vozeado e não-vozeado. Os coeficientes LP ( 16 por quadro) foram transformados nos coeficientes ISF. A Figura 8 apresenta que as linhas nunca atravessam entre si, o que significa que os ISFs são sempre ordenados. A Figura 8 também apresenta que os coeficientes ISF tipicamente evoluem lentamente, comparados à taxa do quadro. Isto significa na prática que a quantização preditiva pode ser aplicada para reduzir o erro de quantização.
[0045] A Figura 3 ilustra um exemplo do quantizador de vetor preditivo 300 usando a predição auto-regressiva (AR). Como ilustrado na Figura 3, o vetor de erro de predição en é o primeiro obtido ao subtrair (Processador 301) o vetor de predição pn do vetor doparâmetro LP de entrada a ser quantificado xn. O símbolo n aqui refere ao índice do quadro no tempo. O vetor de predição pn é calculado pelo preditor P (Processador 302) usando os vetores do parâmetro LP quantizados passados ’ e~2 etc. O vetor do erro de predição en é então quantizado (Processador 303) para produzir um índice / para transmissão por exemplo através do canal e do vetor afS
X de erro de predição quantizado ên. O vetor do parâmetro LP quantizado total é obtido ao adicionar (Processador 304) o vetor de erro de predição quantizado ên e o vetor de predição pn' Uma forma geral do preditor P (Processador 302) é:
onde Ak são as matrizes de predição de dimensão MxM e K é a ordem do preditor. Uma forma simples para o preditor P (Processador 302) é o uso da predição de primeira ordem:
Petição 870170068282, de 13/09/2017, pág. 23/52
18/30
X (2) onde A é uma matriz de predição de dimensão MxM, onde M é a dimensão do vetor de parâmetro LP xn. Uma forma simples da matriz de predição A é uma matriz diagonal com elementos diagonais ai, 02,üm, onde cu são os fatores de predição para os parâmetros LP individuais. Se 0 mesmo fator α for usado para todos os parâmetros LP então a equação 2 reduz para:
Jr η ’ιλλ·λ-1 (3) [0046] Usando a forma de predição simples da Equação (3), então na Figura 3, 0 vetor do parâmetro LP quantizado é dado X pela relação auto-regressiva (AR) a seguir:
Ssn+cdK_i (4) [0047] A forma recursiva da Equação (4) implica que, ao usar um quantizador preditivo AR 300 da forma corno ilustrado na Figura 3, os erros do canal propagarão através de vários quadros. Isto pode ser visto mais claramente se a Equação (4) for escrita na forma matemática equivalente a seguir:
isé» δ»=β»+Σα*®»-ι (5) [0048] Esta forma claramente apresenta que no início de cada vetor de erro de predição decodificado passado ên-k contribui para 0 valor do vetor do parâmetro LP quantificado x . Consequentemente, no caso dos erros do canal, 0 que modificaria 0 valor de ên recebido pelo decodificador relativo ao que foi enviado pelo codificador,
Petição 870170068282, de 13/09/2017, pág. 24/52
19/30 o vetor decodificado obtido na Equação (4) não seria o mesmo no decodificador e no codificador. Por causa da natureza recursiva do preditor P, esta dês-associação codificador- decodificador propagará no futuro e afetará os próximos vetores etc., mesmo se não existirem erros de canal nos últimos quadros. Então, a quantização do vetor preditivo não é robusta para os erros de canal, especialmente quando os fatores de predição são altos(a próximo de 1 nas Equações (4) e (5)).
[0049] Para aliviar este problema de propagação, a predição de média móvel (MA) pode ser usada ao invés da predição AR. Na predição MA, as séries infinitas da Equação (5) são truncadas para um número finito de termos. A ideia é aproximar a forma auto-regressiva do preditor P na Equação (4) ao usar um número pequeno de termo na Equação (5). Note que as ponderações no somatório podem ser modificadas para aproximar melhor o preditor P da Equação (4).
[0050] Um exemplo não-limitativo do quantizador de vetor preditivo MA 400 é apresentado na Figura 4, onde os processos 401, 402, 403 e 404 correspondem aos processos 301, 302, 303 e 304, respectiva mente. Uma forma geral do preditor P (Processo 402) é:
P, =®Â-1 +®Â-Í+- + BÀ-K onde Bk são matrizes de predição de dimensão MxM e K é a ordem do preditor. Deveria ser observado que na predição MA, os erros de transmissão propagam apenas nos próximos quadros K.
[0051] Uma forma simples para o preditor P (Processador 402) é usar a predição de primeira ordem:
Prt (6) onde B é uma matriz de predição de dimensão MxM , onde M é a dimensão do vetor
Petição 870170068282, de 13/09/2017, pág. 25/52
20/30 de parâmetro LP xn. Uma forma simples da matriz de predição B é urna matriz diagonal com elementos diagonais βι, β2,Pm, onde βι são os fatores de predição para os parâmetros LP individuais. Se o mesmo fator p for usado para todos os parâmetros LP então a equação (6) reduz para:
P. = Λ-ι (7) [0052] Usando a forma de predição simples da Equação (7). Então na Figura 4, o vetor do parâmetro LP quantizado , é dado pela relação de média móvel (MA) a seguir:
*»“«,+0e„-l (8) [0053] No exemplo ilustrativo do quantizador de vetor preditivo 400 usando a predição MA como apresentado na Figura 4, a memória do preditor (no Processador 402) é formada pelos vetores de erro de predição decodificados passado ên-i, ên-2 Consequentemente, o número máximo de quadros sobre o qual o erro de canal propaga é da ordem do preditor P (Processador 402). No exemplo ilustrativo do preditor da Equação (8), a predição de primeira ordem é usada, de forma que o erro de predição MA pode apenas propagar apenas sobre um quadro.
[0054] Enquanto mais robusta para os erros de transmissão do que a predição AR, a predição MA não alcança o mesmo ganho de predição para uma determinada ordem de predição. O erro de predição tem consequentemente uma faixa dinâmica maior, e pode requerer mais bits para alcançar o mesmo ganho de codificação do que com a quantização preditiva AR. O compromisso é então a robustez para os erros de canal versos o ganho de codificação em uma determinada taxa de bit.
[0055] Na codificação de taxa de bit variável controlada por fonte VBR, o codificador opera nas várias taxas de bit, e o modo de seleção de taxa é usado para determinar a taxa de bit usada para codificar cada quadro de fala baseado na natureza do
Petição 870170068282, de 13/09/2017, pág. 26/52 / 30 quadro de fala, por exemplo, vozeado, não vozeado, transiente, ruído de fundo, etc. A natureza do quadro de fala, por exemplo, vozeado, não vozeado, transiente, ruído de fundo, etc, pode ser determinada da mesma maneira do CDMA VBR. A meta é obter a melhor qualidade de fala em uma taxa de bit média determinada, também referenciada como a taxa de dados média (ADR, Average Data Rate). Como um exemplo ilustrativo, nos sistemas COMA, por exemplo, CDMA-one e CDMA2000, tipicamente 4 taxas de bit são usadas e referenciadas como taxa-máxima (FR, Full Rate), meia-taxa (HR, Half Rate), um quarto- taxa (QR, Quarter-Rate), e um oitavotaxa (ER, Eighth -Rate). Neste sistema CDMA, dois grupos de taxas são suportados e referenciados como Grupo de Taxa I e Grupo de Taxa II, um codificador de taxa variável com o mecanismo de seleção de taxa opera nas taxas de bit de codificação de fonte de 13.3 (FR), 6.2 (HR), 2.7 (QR), e 1.0 (ER) kbit/s.
[0056] Na codificação VBR, a classificação e o mecanismo de seleção de taxa são usados para classificar o quadro de fala de acordo com a sua natureza (vozeado, não- vozeado, transiente, ruído, etc.) e selecionar a taxa de bit necessária para codificar o quadro de acordo com a classificação e a taxa de dados média requerida (ADR). A codificação de meia-taxa é tipicamente escolhida nos quadros onde o sinal de entrada de fala é estacionário. As armazenagens de bit, comparadas à taxa máxima, são alcançadas ao atualizar os parâmetros de codificação menos frequentemente ou ao usar poucos bits para codificar alguns destes parâmetros de codificação. Em adição, estes quadros exibem uma correlação forte que pode ser explodida para reduzir a taxa de bit. Mais especificamente, nos segmentos vozeados estacionários, a informação de passo é codificada apenas uma vez por quadro, e poucos bits são usados para representar os parâmetros do livro código fixo e os parâmetros de predição linear.
[0057] Uma vez que, o VQ preditivo com a predição MA é tipicamente aplicado para codificar os coeficientes de predição linear, isto resulta em um aumento desnecessário no ruído de quantização. A predição MA, como oposta à predição AR, é usada para aumentar a robustez das perdas do quadro; contudo, nos quadros
Petição 870170068282, de 13/09/2017, pág. 27/52 / 30 estacionários os coeficientes de predição linear evoluem lentamente ao usar a predição AR, neste caso particular teria um impacto menor na propagação de erro no caso dos quadros perdidos. Isto é detectado ao observar que, no caso dos quadros perdidos, a maioria dos decodificadores aplica o procedimento de encobrimento, o que essencialmente extrapola os coeficientes de predição linear do último quadro. Se o quadro perdido for vozeado estacionário, esta extrapolação produz valores muito similares ao atualmente transmitido, mas não os parâmetros LP recebidos. O vetor do parâmetro LP reconstruído está então próximo ao que teria sido decodificado se o quadro não tivesse sido perdido. Neste caso específico, então, ao usar a predição AR no procedimento de quantização dos coeficientes de predição linear, não poderia ter um efeito muito adverso na propagação do erro de quantização.
[0058] Assim, de acordo com uma incorporação ilustrativa não-restritiva da presente invenção, o método VQ preditivo para os parâmetros LP é descrito, de forma que o preditor é comutado entre a predição MA e AR de acordo com a natureza do quadro de fala sendo processado. Mais especificamente, nos quadros transientes e nãoestacionários, a predição MA é usada enquanto que nos quadros estacionários, a predição AR é usada. Além disso, uma vez que a predição AR resulta no vetor de erro de predição en com uma faixa dinâmica menor do que a predição MA, esta predição não é eficiente para usar as mesmas tabelas de quantização para ambos os tipos de predição. Para solucionar este problema, o vetor de erro de predição após a predição AR é apropriadamente escalonado, de forma que este pode ser quantizado usando as mesmas tabelas de quantização como no caso da predição MA. Quando VQ de múltiplos estágios é usado para quantizar o vetor de erro de predição, o primeiro estágio pode ser usado para ambos os tipos de predição após escalonar apropriadamente o vetor de erro de predição AR. Uma vez que este é suficiente para usar o VQ de divisão no segundo estágio não requerendo uma memória ampla, as tabelas de quantização deste segundo estágio podem ser treinadas e designadas separadamente para ambos os tipos de predição. É claro que, ao invés de designar as tabelas de quantização do primeiro estágio com a predição MA e escalar o vetor de erro de predição AR, o oposto é também válido, quer dizer, o primeiro estágio
Petição 870170068282, de 13/09/2017, pág. 28/52
23/30 pode ser designado para a predição AR e o vetor de erro de predição MA é escalado antes da quantização.
[0059] Assim, de acordo com a incorporação ilustrativa não-restritiva da presente invenção, o método de quantização do vetor preditivo é também descrito, para quantizar os parâmetros LP em um codec de fala de taxa de bit variável, desse modo o preditor P é comutado entre a predição MA e AR de acordo com a informação de classificação, considerando a natureza do quadro de fala sendo processado, e desse modo o vetor de erro de predição é apropriadamente escalado, tal que as mesmas tabelas de quantização do primeiro estágio no VQ de múltiplos estágios de erro de predição podem ser usadas para ambos os tipos de predição.
Exemplo 1
Λ
A [0060] A Figura 1 apresenta um exemplo não-limitativo do quantizador de T, vetor de dois-estágios 100. Um vetor de entrada x é primeiro quantizado com o quantizador Ql (Processador 101) para produzi r um vetor quantizado e um índice de quantização i i. A d iferença entre o vetor de entrada x e o vetor quantizado de primeiro estágio é calculado (Processador 102) para produzir o vetor de erro x2 também quantizado com o VQ de segundo estágio (Processador 103) para produzir o vetor de erro do segundo
Λ estágio quant izado com o índice de quantização iz Os índices ix e i2 são
A transmitidos (Processador 104) através do canal e o vetor quantizado é reconstruído no decodificador [0061] A Figura 2 apresenta um exemplo ilustrativo do quantizador de vetor particionadoo 200. Um vetor de entrada x de dimensão M é dividido em K subvetores de dimensões Ni, N2 , ..., NK, e quantificados com os quantizadores de vetor Qi , Q2 ,, Qk, respectiva mente (Processadores 201 . 1, 201 .2, ..., 201.K). Os subPetição 870170068282, de 13/09/2017, pág. 29/52
24/30 vetores quantificados ^2* , com os índices de quantificação ii, 12, e ík são encontrados. Os índices de quantização são transmitidos (Processador 202) através de um canal e do vetor quantificado A’ que é reconstruído por uma concatenação simples dos sub-vetores quantificados.
[0061] Uma aproximação eficiente para a quantização do vetor é combinar ambos 0 VQ de múltiplos-estágios e de divisão, 0 que resulta em uma boa oferta entre a qualidade e a complexidade. No primeiro exemplo ilustrativo, um VQ de dois-estágios pode ser usado, desse modo 0 vetor de erro do segundo estágio ê2 é dividido em vários sub-vetores e quantificados com os quantificadores do segundo estágio Q21, Q22, , Q2K, respectiva mente. No segundo exemplo ilustrativo, 0 vetor de entrada pode ser dividido em dois sub-vetores, então cada sub-vetor é quantificado com 0 VQ de dois-estágios usando também a divisão no segundo estágio como no primeiro exemplo ilustrativo.
[0062] A Figura 5 é um diagrama em blocos esquemático ilustrando um exemplo não-limitativo do quantizador de vetor preditivo comutado 500 de acordo com a presente invenção. Primeira mente, um vetor dos parâmetros LP médios μ é removido do vetor de parâmetro LP de entrada z para produzir um vetor de parâmetro LP médio-removido x (Processador 501). Como indicado na descrição anterior, os vetores do parâmetro LP podem ser vetores dos parâmetros LSF, dos parâmetros ISF, ou qualquer outra representação do parâmetro LP relevante. Ao remover 0 vetor de parâmetro LP médio μ do vetor do parâmetro LP de entrada z que é opcional, resulta em uma performance de predição melhorada. Se 0 Processador 501 é desabilitado então 0 vetor do parâmetro LP médio- removido x será 0 mesmo do vetor do parâmetro LP de entrada z. Deveria ser observado que, 0 índice do quadro n usado nas Figuras 3 e 4 tem sido omitido por motivo de simplificação. O vetor de predição p é então calculado e removido do vetor de parâmetro LP médio-removido x para produzir 0 vetor de erro de predição e (Processador 502). Então, baseado na informação de classificação do quadro, se 0 quadro correspondente ao vetor do parâmetro LP de entrada z é estacionário vozeado, então a predição AR é usada e 0
Petição 870170068282, de 13/09/2017, pág. 30/52 / 30 vetor de erro e é escalonado por um certo fator (Processador 503) para obter o vetor de erro de predição escalonado e'. Se o quadro for não estacionário vozeado, a predição MA é usada e o fator de escala (Processador 503) é igual a l . Novamente, a classificação do quadro, por exemplo, vozeado, não-vozeado, transiente, ruído de fundo, etc., pode ser determinado, por exemplo, da mesma maneira do CDMA VBR. O fator de escala é tipicamente maior do que 1 e resulta no escalonamento ascendente da faixa dinâmica do vetor de erro de predição, de forma que este pode ser quantificado com o quantizador designado para a predição MA. O valor do fator de escala depende dos coeficientes usados para a predição MA e AR. Os valores típicos não-restritivos são: o coeficiente de predição MA β=0.33, o coeficiente de predição AR α=0.65, e o fator de escala = l .25. Se o quantizador for projetado para a predição AR então uma operação oposta será executada: o vetor de erro de predição para a predição MA será escalonado e o fator de escala será menor do que 1.
[0063] O vetor de erro de predição escalonado e' é então um vetor quantificado (Processador 508) para produzir um vetor de erro de predição escalonado e quantificado ê'· No exemplo da Figura 5, o processo 508 consiste de um quantizador de vetor de dois- estágios onde o VQ de divisão é usado em ambos os estágios e onde as tabelas de quantização do vetor do primeiro estágio são as mesmas tanto para a predição MA quanto para a predição AR. O quantizador do vetor de doisestágios 508 consiste dos processadores 504, 505, 506, 507 e 509. No quantizador do primeiro-estágio Q1, o vetor de erro de predição escalonado e' é quantificado para produzir o vetor de erro de predição quantificado de primeiro estágio êi (Processador 504). Este vetor êi é removido do vetor de erro de predição escalonado e' (Processador 505) para produzir um vetor de erro de predição de segundo estágio e2 . Este vetor de erro de predição de segundo estágio e2 é então quantificado (Processador 506) pelo quantizador do vetor do segundo estágio QMA ou pelo quantizador do vetor do segundo estágio Qar para produzir o vetor de erro de predição quantificado do segundo estágio ê2. A escolha entre os quantizadores do vetor do segundo-estágio Qma e Qar depende da informação de classificação do
Petição 870170068282, de 13/09/2017, pág. 31/52
26/30 quadro (por exemplo, como indicado acima, o AR se o quadro for estacionário vozeado e o MA se o quadro for não estacionário vozeado). O vetor de erro de predição escalonado quantificado ê' é reconstruído (Processador 509) pelo somatório dos vetores de erro de predição quantificados êi e ê2 dos dois estágios ê'=êi + ê2. Finalmente, a escala inversa para o processador 503 é aplicada ao vetor de erro de predição escalonado e quanti ficado ê' (Processador 510) para produzir o vetor de erro de predição quantificado ê. No exemplo ilustrativo atual, a dimensão do vetor é 16, e o VQ de divisão é usado em ambos os estágios. Os índices de quantização ii e Í2 do quantizador Ql e do quantizador Qma ou Qar são multiplexados e transmitidos através do canal de comunicação (Processador 507).
[0064] O vetor de predição p é calculado no preditor MA (Processador 511) ou no preditor AR (Processador 512) dependendo da informação de classificação do quadro (por exemplo, corno indicado acima, o AR se o quadro for estacionário vozeado e MA se o quadro for não estacionário vozeado). Se o quadro for estacionário vozeado então o vetor de predição é igual à saída do preditor AR 512. Por outro lado, o vetor de predição é igual à saída do preditor MA 511. Como explicado acima, o preditor MA 511 opera nos vetores de erro de predição quantificados dos quadros prévios enquanto o preditor AR 512 opera nos vetores do vetores do parâmetro LP de entrada quantificados dos quadros prévios. O vetor do parâmetro LP de entrada quantificado (médio-removido) é 1 construído ao adicionar o vetor do erro de predição quantificado ê ao vetor de predição p (Processador 514):
[0065] A Figura 6 é um diagrama em blocos esquemático apresentando uma incorporação ilustrativa do quantizador do vetor preditivo comutado 600 no decodificador de acordo com a presente invenção. No lado do decodificador, os grupos recebidos dos índices de quantização ii e 12 são usados pelas tabelas de quantização (Processadores 601 e 602) para produzir os vetores de erro de predição quantificados do primeiro-estágio e do segundo-estágio êi e ê2 . Note que a quantização do segundo estágio (Processador 602) consiste de dois grupos de
Petição 870170068282, de 13/09/2017, pág. 32/52
27/30 tabelas para a predição MA e AR como descrito acima com referência ao lado do codificador da Figura 5. O vetor de erro de predição escalonado é então reconstruído no processador 603 ao somar os vetores de erro de predição quantificados de dois estágios: ê'=êi + ê2 . A escala inversa é aplicada no processador 609 para produzir o vetor de erro de predição quantificado ê. Note que a escala inversa é uma função da informação de classificação do quadro recebido ® + P* e corresponde ao inverso da escala executada pelo processador 503 da Figura 5. O vetor do parâmetro LP de entrada médio-removido e quantificado X é então reconstruído no processador
604 ao adicionar o vetor de predição p ao vetor do erro de predição quantificado ê: No caso o vetor dos parâmetros LP médios μ tem sido removido no lado do codificador, este é adicionado no processador 608 para produzir o vetor do parâmetro LP de entrada quantificado z . Deveria ser observado que como no caso do lado do codificador da Figura 5, o vetor de predição p é a saída do preditor MA
605 ou do preditor AR 606 dependendo da informação de classificação do quadro, esta seleção é feita de acordo com a lógica do processador 607 em resposta à informação de classificação do quadro. Mais especifica mente, se o quadro for estacionário vozeado então o vetor de predição p é igual à saída do preditor AR 606. Por outro lado, o vetor de predição p é igual à saída do preditor MA 605.
[0066] É claro que, a despeito do fato de que apenas o preditor MA ou o preditor AR é usado em um certo quadro, as memórias de ambos os preditores serão atualizadas a cada quadro, assumindo que a predição MA ou AR podem ser usadas no próximo quadro. Isto é válido para ambos os lados do codificador e do decodificador.
[0067] De forma a otimizar o ganho de codificação, alguns vetores do primeiro estágio, designado para a predição MA, podem ser substituídos pelos novos vetores designados para a predição AR. Na incorporação ilustrativa não-restritiva, o tamanho do livro código do primeiro estágio é 256, e tem o mesmo conteúdo como no padrão AMR-WB a 12.65 kbit/s, e os 28 vetores são substituídos no livro código do primeiro estágio ao usar a predição AR. Um livro código do primeiro estágio estendido é então formado como a seguir: primeiro, os 28 vetores do primeiro-estágio menos usados
Petição 870170068282, de 13/09/2017, pág. 33/52 / 30 ao aplicar a predição AR mas usados para a predição MA são colocados no início da tabela, então o restante de 256- 28=228 vetores de primeiro-estágio usados para ambas a predição AR e a MA são anexados na tabela, e finalmente os 28 novos vetores usados para a predição AR são colocados no final da tabela. O comprimento da tabela é então 256 + 28= 284 vetores. Ao usar a predição MA, os primeiros 256 vetores da tabela são usados no primeiro estágio; ao usar a predição AR, os últimos 256 vetores da tabela são usados. Para assegurar a interoperabilidade com o padrão AMR-WB, a tabela é usada a qual contém o mapeamento entre a posição do vetor do primeiro estágio neste novo livro código, e a sua posição original no livro código AMR-WB do primeiro estágio.
[0068] Para resumir, as incorporações ilustrativas não-restritivas descritas acima da presente invenção, com relação às Figuras 5 e 6, apresentam as características a seguir:
- A predição AR/MA comutada é usada dependendo do modo de codificação do codificador de taxa variável, e também depende da natureza do quadro de fala atual.
- Essencialmente, o mesmo quantizador de primeiro estágio é usado se a predição AR ou MA é aplicada, o que resulta nas economias de memória. Na incorporação ilustrativa não-restritiva, a predição LP de 16a ordem é usada e os parâmetros LP são representados no domínio ISF. O livro código do primeiro estágio é o mesmo que o usado no modo de 12.65 kbit/s do codificador AMR WB, onde o livro código foi designado usando a predição MA (O vetor do parâmetro LP de 16 dimensões é dividido por 2 para obter os dois subvetores com dimensão 7 e 9, e no primeiro estágio da quantização, dois livroscódigo de 256-entradas são usados).
- Ao invés da predição MA, a predição AR é usada nos modos estacionários, especialmente o modo de meia-taxa vozeado; caso contrário, a predição MA é usada.
- No caso da predição AR, o primeiro estágio do quantizador é o mesmo
Petição 870170068282, de 13/09/2017, pág. 34/52 / 30 que o caso da predição MA. Contudo, o segundo estágio pode ser designado e treinado apropriadamente para a predição AR.
- Para levar em conta esta comutação no modo preditor, as memórias de ambos os preditores MA e AR são atualizadas em cada quadro, assumindo que ambas as predições MA ou AR podem ser usadas para o próximo quadro.
[0069] Em adição, para otimizar o ganho de codificação, alguns vetores do primeiro estágio, designados para a predição MA, podem ser substituídos pelos novos vetores designados para a predição AR.
[0070] De acordo com esta incorporação ilustrativa não restritiva, os 28 vetores são substituídos no livro código do primeiro estágio ao usar a predição AR.
- O livro código do primeiro estágio ampliado pode então ser formado como a seguir: primeiro, os 28 vetores do primeiro estágio menos usados ao aplicar a predição AR são colocados no início da tabela, então os restantes 256-28= 228 vetores do primeiro estágio são anexados na tabela, e finalmente os 28 novos vetores são colocados no final da tabela. O comprimento da tabela é então de 256 + 28 = 284 vetores. Ao usar a predição MA, os primeiros 256 vetores da tabela são usados no primeiro estágio; ao usar a predição AR os últimos 256 vetores da tabela são usados.
- Para assegurar a interoperabilidade com o padrão AMR-WB, a tabela éusada a qual contém o mapeamento entre a posição do vetor do primeiro estágio neste novo livro código, e a sua posição original no livro código do primeiro estágio AMR-WB.
- Uma vez que a predição AR alcança uma energia de erro de predição inferior a da predição MA quando usada nos sinais estacionários, o fator de escala é aplicado ao erro de predição. Na incorporação ilustrativa não-restritiva, o fator de escala é 1 quando a predição MA é usada, e l /0.8 quando a predição AR é usada. Isto aumenta o erro de predição AR ao equivalente dinâmico para o erro de predição MA. Consequentemente, o mesmo quantizador pode ser usado para ambas as predições MA e AR no primeiro estágio.
Petição 870170068282, de 13/09/2017, pág. 35/52 / 30 [0071] Embora a presente invenção tenha sido descrita na descrição precedente em relação às incorporações ilustrativas não-restritivas desta, estas incorporações podem ser modificadas dentro do escopo das reivindicações apensas, sem sair da natureza e escopo da presente invenção.
Petição 870170068282, de 13/09/2017, pág. 36/52 / 16

Claims (55)

  1. REIVINDICAÇÕES
    1 . Método para quantizar os parâmetros de predição linear na codificação do sinal de som de taxa de bit variável, é CARACTERIZADO pelo fato de que compreende (500):
    - receber um vetor de entrada do parâmetro de predição linear;
    - classificar um quadro do sinal de som correspondente ao vetor de entrada do parâmetro de predição linear;
    - calcular um vetor de predição (513);
    - remover o vetor de predição calculado do vetor de entrada do parâmetro de predição linear para produzir um vetor de erro de predição (502);
    - escalar o vetor de erro de predição (503);
    - quantizar o vetor de erro de predição escalonado (508);
    onde:
    - calcular o vetor de predição compreende selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro de sinal do som, e calcular o vetor de predição de acordo com o esquema de predição selecionado (512) (511); e
    - escalar o vetor de erro de predição compreende selecionar ao menos um de uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado, e escalar o vetor de erro de predição de acordo com o esquema de escalonamento selecionado.
  2. 2. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que quantizar o vetor de erro de predição compreende:
    - processar o vetor de erro de predição através de ao menos um quantizador usando o esquema de predição selecionado (506).
  3. 3. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que a pluralidade de esquemas de predição compreende a predição de média móvel e a predição auto-regressiva.
    Petição 870170098841, de 18/12/2017, pág. 8/23
    2 / 16
  4. 4. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que também compreende:
    - produzir um vetor de parâmetros de predição linear médios; e
    - remover o vetor de parâmetros de predição linear médios do vetor de entrada de parâmetro de predição linear para produzir um vetor do parâmetro de predição linear médios-removido (501).
  5. 5. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que também compreende:
    - classificar o quadro do sinal de som compreende determinar que o quadro do sinal de som é um quadro vozeado estacionário;
    - selecionar um de uma pluralidade de esquemas compreende selecionar a predição auto-regressiva;
    - calcular o vetor de predição compreende calcular o vetor de erro de predição através da predição auto-regressiva;
    - selecionar um de uma pluralidade de esquemas de escalonamento compreende selecionar um fator de escala; e
    - escalar o vetor de erro de predição compreende escalar o vetor de erro de predição antes da quantização usando o fator de escala.
  6. 6. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que também compreende:
    - classificar o quadro do sinal de som compreende determinar que o quadro do sinal de som é um quadro vozeado não estacionário;
    - calcular o vetor de predição compreende calcular o vetor de erro de predição através da predição de média de móvel.
  7. 7. Método de acordo com a reivindicação 5, é CARACTERIZADO pelo fato de que o fator de escala é maior do que 1.
  8. 8. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que
    Petição 870170098841, de 18/12/2017, pág. 9/23
    3 / 16 quantizar o vetor de erro de predição compreende:
    - processar o vetor de erro de predição através de um processo de quantização do vetor de dois-estágios (504) (506).
  9. 9. Método de acordo com a reivindicação 8, é CARACTERIZADO pelo fato de que também compreende usar a quantização vetorial particionada em dois estágios do processo de quantização do vetor.
  10. 10. Método de acordo com a reivindicação 3, é CARACTERIZADO pelo fato de que também compreende:
    - quantizar o vetor de erro de predição compreende processar o vetor de erro de predição através do processo de quantização do vetor de dois estágios compreendendo o primeiro e o segundo estágios (504) (506); e
    - processar o erro de predição através de um processo de quantização de vetor de dois-estágios compreende aplicar o vetor de erro de predição para as tabelas de quantização do vetor do primeiro estágio, as quais são as mesmas para ambas as predições de média móvel e auto-regressiva.
  11. 11. Método de acordo com a reivindicação 8, é CARACTERIZADO pelo fato de que quantizar o vetor de erro de predição compreende:
    - no primeiro estágio do processo de quantização do vetor de dois-estágios, quantizar o vetor de erro de predição para produzir um vetor de erro de predição quantificado do primeiro estágio (504);
    - remover do vetor de erro de predição o vetor de erro de predição quantizado do primeiro estágio para produzir um vetor de erro de predição do segundo estágio (505);
    - no segundo estágio do processo de quantização do vetor de dois-estágios, quantizar o vetor de erro de predição para produzir um vetor de erro de predição quantificado do segundo estágio (506); e
    - produzir um vetor de erro de predição quantizado ao somar os vetores de erro de predição quantificados do primeiro estágio e do segundo estágio (509).
    Petição 870170098841, de 18/12/2017, pág. 10/23
    4 / 16
  12. 12. Método de acordo com a reivindicação 11, é CARACTERIZADO pelo fato de que quantizar o vetor de erro de predição do segundo estágio compreende:
    - processar o vetor de erro de predição do segundo estágio através de um quantizador de predição de média móvel ou de um quantizador de predição autoregressiva dependendo da informação de classificação do quadro do sinal de som.
  13. 13. Método de acordo com a reivindicação 8, é CARACTERIZADO pelo fato de que quantizar o vetor de erro de predição compreende:
    - produzir os índices de quantização para o processo de quantização do vetor de dois estágios;
    - transmitir os índices de quantização através de um canal de comunicação.
  14. 14. Método de acordo com a reivindicação 8, é CARACTERIZADO pelo fato de que compreende:
    - classificar o quadro de sinal do som compreende determinar que o quadro do sinal do som é um quadro vozeado estacionário; e
    - calcular o vetor de predição compreende:
    - adicionar (a) o vetor de erro de predição quantizado produzido ao somar os vetores de erro de predição quantificados do primeiro estágio e do segundo estágio e (b) o vetor de predição calculado para produzir o vetor de entrada quantificado; e
    - processar o vetor de entrada quantificado através de predição auto-regressiva.
  15. 15. Método de acordo com a reivindicação 2, é CARACTERIZADO pelo fato de que compreende:
    - a pluralidade de esquemas de predição compreende a predição de média móvel e a predição auto-regressiva;
    - quantizar o vetor de erro de predição compreende:
    - processar o vetor de erro de predição através de um quantizador do vetor de dois-estágios compreendendo um livro código do primeiro estágio compreendendo ele mesmo, na sequência:
    - um primeiro grupo de vetores usado ao aplicar
    Petição 870170098841, de 18/12/2017, pág. 11/23
    5 / 16 a predição de média móvel e colocado no início da tabela;
    - um segundo grupo dos vetores usado ao aplicar ou a predição de média móvel ou a predição auto-regressiva e, colocado na tabela intermediária ao primeiro grupo de vetores e a um terceiro grupo de vetores;
    - um terceiro grupo de vetores usado ao aplicar a predição auto-regressiva e colocado no final da tabela;
    - processar o vetor de erro de predição através de ao menos um quantizador usando o esquema de predição selecionado compreende:
    - quando o esquema de predição selecionado for a predição de média móvel, processar o vetor de erro de predição através do primeiro e do segundo grupos de vetores da tabela; e
    - quando o esquema de predição selecionado for a predição auto-regressiva, processar o vetor de erro de predição através do segundo e do terceiro grupos de vetores.
  16. 16. Método de acordo com a reivindicação 15, é CARACTERIZADO pelo fato de que assegura a interoperabilidade com o padrão AMR-WB, mapeando entre a posição de um vetor de primeiro estágio na tabela do livro código do primeiro estágio e, a posição original do vetor do primeiro estágio no livro código do primeiro-estágio AMR-WB é feita através de uma tabela de mapeamento.
  17. 17. Método de acordo com a reivindicação 1, é CARACTERIZADO pelo fato de que compreende:
    - classificar o quadro do sinal do som compreende determinar que o quadro do sinal de som é um quadro vozeado estacionário ou um quadro vozeado não-estacionário; e
    - para os quadros vozeados estacionários, selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro do sinal do som compreendendo selecionar a predição auto-regressiva, calcular o vetor de predição de acordo com o esquema de predição selecionado compreendendo calcular o vetor de erro de predição através da predição auto-regressiva, selecionar ao menos um de
    Petição 870170098841, de 18/12/2017, pág. 12/23
    6 / 16 uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado compreendendo selecionar um fator de escalonamento maior do que 1, e escalar o vetor de erro de predição de acordo com o esquema de escalonamento selecionado compreendendo escalar o vetor de erro de predição antes da quantização usando um fator de escalonamento maior do que 1;
    - para os quadros vozeados não-estacionários, selecionar um de uma pluralidade de esquemas de predição em relação à classificação do quadro do sinal do som compreendendo selecionar a predição de média móvel, calcular o vetor de predição de acordo com o esquema de predição selecionado compreendendo calcular o vetor de erro de predição através da predição de média móvel, selecionar ao menos um de uma pluralidade de esquemas de escalonamento em relação ao esquema de predição selecionado compreendendo selecionar o fator de escalonamento igual a 1, e escalar o vetor de erro de predição de acordo com o esquema de escalonamento selecionado compreendendo escalar o vetor de erro de predição antes da quantização usando um fator de escalonamento igual a 1.
  18. 18. Método de dês-quantização dos parâmetros de predição linear na decodificação do sinal de som de taxa de bit variável, é CARACTERIZADO pelo fato de que compreende:
    - receber ao menos um índice de quantização (600);
    - receber a informação sobre a classificação do quadro de sinal de som correspondendo o ao menos um índice de quantização;
    - recuperar o vetor de erro de predição ao aplicar o ao menos um índice para ao menos uma tabela de quantização (602);
    - reconstruir um vetor de predição (603); e
    - produzir um vetor de parâmetro de predição linear em resposta ao vetor de erro de predição recuperado e um vetor de predição reconstruído;
    onde:
    - reconstruir o vetor de predição compreende processar o vetor de erro de predição recuperado através de um de uma pluralidade de esquemas de predição dependendo da informação de classificação do quadro (605) (607) (606).
    Petição 870170098841, de 18/12/2017, pág. 13/23
    7 / 16
  19. 19. Método de acordo com a reivindicação 18, é CARACTERIZADO pelo fato de que recuperar o vetor de erro de predição compreende:
    - aplicar o ao menos um índice e a informação de classificação para o ao menos uma tabela de quantização usando o dito esquema de predição.
  20. 20. Método de acordo com a reivindicação 18, é CARACTERIZADO pelo fato de que compreende:
    - receber ao menos um índice de quantização compreende receber um índice de quantização do primeiro-estágio e um índice de quantização do segundo estágio; e
    - aplicar dito ao menos um índice para ao menos uma tabela de quantização compreende aplicar o índice de quantização do primeiro-estágio para a tabela de quantização do primeiro estágio, para produzir o vetor de erro de predição do primeiro-estágio, e aplicar o índice de quantização do segundo-estágio para a tabela de quantização do segundo-estágio para produzir o vetor de erro de predição do segundo-estágio.
  21. 21. Método de acordo com a reivindicação 20, é CARACTERIZADO pelo fato de que compreende:
    - a pluralidade dos esquemas de predição compreende a predição de média móvel e a predição auto-regressiva;
    - a tabela de quantização do segundo estágio compreende a tabela de predição de média de móvel e a tabela de predição auto-regressiva; e
    - o método também compreende aplicar a classificação do quadro do sinal de som para a tabela de quantização do segundo estágio para processar o índice de quantização do segundo estágio através da tabela de média móvel ou a tabela de predição auto-regressiva dependendo da informação de classificação do quadro recebida.
  22. 22. Método de acordo com a reivindicação 20, é CARACTERIZADO pelo fato de que a recuperação do vetor de erro de predição compreende:
    - somar o vetor de erro de predição do primeiro-estágio e o vetor de erro de
    Petição 870170098841, de 18/12/2017, pág. 14/23
    8 / 16 predição do segundo estágio para produzir o vetor de erro de predição recuperado.
  23. 23. Método de acordo com a reivindicação 22, é CARACTERIZADO pelo fato de que também compreende:
    - conduzir no vetor de predição recuperado uma operação de escalonamento in versa como uma função da informação de classificação do quadro recebida (609).
  24. 24. Método de acordo com a reivindicação 18, é CARACTERIZADO pelo fato de que produzir o vetor do parâmetro de predição linear compreende:
    - adicionar o vetor de erro de predição recuperado e o vetor de predição reconstruído para produzir o vetor do parâmetro de predição linear (604).
  25. 25. Método de acordo com a reivindicação 24, é CARACTERIZADO pelo fato de que também compreende adicionar um vetor de parâmetros de predição linear médios ao vetor de erro de predição recuperado e ao vetor de predição reconstruído para produzir o vetor do parâmetro de predição linear (608).
  26. 26. Método de acordo com a reivindicação 18, é CARACTERIZADO pelo fato de que compreende:
    - urna pluralidade de esquemas de predição compreende a predição de média móvel e a predição auto-regressiva; e
    - reconstruir o vetor de predição compreende processar o vetor de erro de predição recuperado através da predição de média móvel ou processar o vetor do parâmetro produzido através da predição auto-regressiva dependendo da informação de classificação do quadro.
  27. 27. Método de acordo com a reivindicação 26, é CARACTERIZADO pelo fato de que a reconstrução do vetor de predição compreende:
    - processar o vetor do parâmetro produzido através da predição auto- regressiva quando a informação de classificação do quadro indica que o quadro do sinal de som é vozeado estacionário; e
    Petição 870170098841, de 18/12/2017, pág. 15/23
    9 / 16
    - processar o vetor de erro de predição recuperado através da predição de média móvel quando a informação de classificação do quadro indica que o quadro do sinal de som é vozeado não-estacionário.
  28. 28. Dispositivo para quantizar os parâmetros de predição linear na codificação de sinal do som em uma taxa de bit variável, é CARACTERIZADO pelo fato de que compreende (500):
    - uma entrada para receber um vetor de entrada de parâmetro de predição linear;
    - um classificador de um quadro do sinal de som correspondente ao vetor de entrada de parâmetro de predição linear;
    - um calculador do vetor de predição (513);
    - um subtrator para remover o vetor de predição calculado do vetor de entrada de parâmetro de predição linear para produzir um vetor de erro de predição (502);
    - uma unidade de escala fornecida com o vetor de erro de predição, esta unidade escalonando o vetor de erro de predição (503); e
    - um quantizador do vetor de erro de predição escalonado (508);
    onde:
    - calculador do vetor de predição compreende um seletor de um de uma pluralidade de esquemas de predição em relação à classificação do quadro de sinal do som, para calcular o vetor de predição de acordo com o esquema de predição selecionado (512) (511);
    e
    -unidade de escala compreende o seletor de ao menos um de uma pluralidade de esquemas escalonamento em relação ao esquema de predição selecionado, para escalar o vetor de erro de predição de acordo com o esquema de escalonamento selecionado.
  29. 29. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que o quantizador é fornecido com o vetor de erro de predição para processar o vetor de erro de predição através do esquema de predição selecionado (506).
    Petição 870170098841, de 18/12/2017, pág. 16/23
    10 / 16
  30. 30. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que a pluralidade de esquemas de predição compreende a predição de média móvel e a predição autouegressiva.
  31. 31. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que também compreende:
    - um dispositivo para produzir um vetor de parâmetros de predição linear médios; e
    - um subtrator para remover o vetor de parâmetros de predição linear médios do vetor de entrada de parâmetro de predição linear para produzir um vetor do parâmetro de predição linear médio-removido (501).
  32. 32. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que quando o classificador determina que o quadro do sinal de som é um quadro vozeado estacionário; o calculador do vetor de predição compreende:
    - um preditor auto-regressivo para aplicar a predição auto-regressiva para o vetor de erro de predição.
  33. 33. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que quando o classificador determina que o quadro do sinal de som é um quadro vozeado não-estacionário: o calculador do vetor de predição compreende:
    - um preditor de média móvel para aplicar a predição de média móvel para o vetor de erro de predição.
  34. 34. Dispositivo de acordo com a reivindicação 32, é CARACTERIZADO pelo fato de que a unidade de escalonamento compreende:
    - um multiplicador para aplicar o vetor de erro de predição um fator de escala maior do que 1.
  35. 35. Dispositivo de acordo com a reivindicação 28, é CARACTERIZADO pelo fato de que o quantizador compreende um quantizador de vetor de dois-estágios (504) (506).
    Petição 870170098841, de 18/12/2017, pág. 17/23
    11 / 16
  36. 36. Dispositivo de acordo com a reivindicação 35, é CARACTERIZADO pelo fato de que o quantizador de vetor de dois-estágios compreende dois estágios usando a quantização vetorial particionada.
  37. 37. Dispositivo de acordo com a reivindicação 30, é CARACTERIZADO pelo fato de que:
    - o quantizador compreende um quantizador do vetor de dois-estágios compreendendo o primeiro e o segundo estágios (504) (506);
    - o quantizador do vetor de dois-estágios compreende as tabelas de quantização do primeiro estágio que são idênticas para ambas as predições de média móvel e auto-regressiva.
  38. 38. Dispositivo de acordo com a reivindicação 35, é CARACTERIZADO pelo fato de que o quantizador do vetor de dois-estágios compreende:
    - o quantificador do vetor do primeiro estágio fornecido com o vetor de erro de predição para quantizar o vetor de erro de predição e produzir o vetor de erro de predição quantificado do primeiro estágio (504);
    - um subtrator para remover do vetor de erro de predição o vetor de erro de predição quantizado do primeiro estágio para produzir o vetor de erro de predição do segundo estágio (505);
    - o quantificador do vetor do segundo estágio fornecido com o vetor de erro de predição do segundo estágio para quantizar o vetor de erro de predição do segundo estágio e para produzir o vetor de erro de predição quantificado do segundo estágio (506); e
    - um somador para produzir o vetor de erro de predição quantizado ao somar os vetores de erro de predição quantificados do primeiro estágio e do segundo estágio (509).
  39. 39. Dispositivo de acordo com a reivindicação 38, é CARACTERIZADO pelo fato de que o quantizador do vetor do segundo estágio compreende:
    - um quantificador do vetor de segundo estágio de média móvel para quantizar o
    Petição 870170098841, de 18/12/2017, pág. 18/23
    12 / 16 vetor de erro de predição do segundo estágio usando a predição de média móvel; e
    - um quantificador do vetor de segundo estágio auto-regressivo para quantizar o vetor de erro de predição do segundo estágio usando a predição auto-regressiva.
  40. 40. Dispositivo de acordo com a reivindicação 35, é CARACTERIZADO pelo fato de que o quantizador do vetor de dois-estágios compreende:
    - um quantizador do vetor de primeiro estágio para produzir um índice de quantização do primeiro estágio;
    - um quantizador do vetor do segundo estágio para produzir o índice de quantização do segundo estágio;
    - transmitir os índices de quantização do primeiro estágio e do segundo estágio através de um canal de comunicação.
  41. 41. Dispositivo de acordo com a reivindicação 38, é CARACTERIZADO pelo fato de que o classificador determina que o quadro de sinal do som é um quadro vozeado estacionário, o calculador do vetor de predição compreende:
    - um somador para somar (a) o vetor de erro de predição quantizado produzido ao somar os vetores de erro de predição quantificados do primeiro estágio e do segundo estágio e (b) o vetor de predição calculado para produzir o vetor de entrada quantificado; e
    - um preditor auto-regressivo para processar o vetor de entrada quantificado.
  42. 42. Dispositivo de acordo com a reivindicação 29, é CARACTERIZADO pelo fato de que compreende:
    - a pluralidade de esquemas de predição compreende a predição de média móvel e a predição auto-regressiva;
    - quantizador compreende:
    - um quantizador de vetor de dois-estágios compreendendo o próprio livro código do primeiro estágio que compreende, na sequência:
    - um primeiro grupo de vetores usado ao aplicar a predição de média móvel e colocado no início da tabela;
    Petição 870170098841, de 18/12/2017, pág. 19/23
    13 / 16
    - um segundo grupo de vetores usado ao aplicar ou a predição de média móvel ou a predição auto-regressiva e, colocado na tabela intermediária ao primeiro grupo de vetores e a um terceiro grupo de vetores;
    - um terceiro grupo de vetores usado ao aplicar a predição auto-regressiva e colocado no final da tabela;
    - um dispositivo para processar o vetor de erro de predição compreende:
    - quando o esquema de predição selecionado for a predição de média móvel, processar o vetor de erro de predição através do primeiro e do segundo grupos de vetores da tabela; e
    - quando o esquema de predição selecionado for a predição auto-regressiva, processar o vetor de erro de predição através do segundo e do terceiro grupos de vetores.
  43. 43. Dispositivo de acordo com a reivindicação 42, é CARACTERIZADO pelo fato de que também compreende, assegurar a interoperabilidade com o padrão AMR- WB, mapeando a tabela que estabelece o mapeamento entre a posição do vetor de primeiro estágio na tabela do livro código do primeiro estágio e, a posição original do vetor do primeiro estágio no livro código do primeiro-estágio AMR-WB.
  44. 44. Dispositivo de acordo com a reivindicação 30, é CARACTERIZADO pelo fato de que:
    - o calculador do vetor de predição compreende um preditor auto-regressivo para aplicar a predição auto-regressiva ao vetor de erro de predição e um preditor de média móvel para aplicar a predição de média móvel ao vetor de erro de predição; e
    - o preditor auto-regressivo e o preditor de média móvel compreende as respectivas memórias que são atualizadas a cada quadro de sinal de som, assumindo que ou a predição de média móvel ou a auto-regressiva pode ser usada no próximo quadro.
  45. 45. Dispositivo de dês-quantização dos parâmetros de predição linear na decodificação do sinal de som de taxa de bit variável, é CARACTERIZADO pelo fato de que compreende (600):
    Petição 870170098841, de 18/12/2017, pág. 20/23
    14 / 16
    - um dispositivo para receber o ao menos um índice de quantização;
    - um dispositivo para receber a informação sobre a classificação do quadro de sinal de som correspondendo o ao menos a um índice de quantização;
    - a ao menos uma tabela de quantização fornecida com ao menos um índice de quantização para recuperar um vetor de erro de predição (602);
    - uma unidade de reconstrução do vetor de predição (603), e
    - um gerador do vetor de parâmetro de predição linear em resposta ao vetor de erro de predição recuperado e ao vetor de predição reconstruído;
    onde:
    - a unidade de reconstrução do vetor de predição compreende ao menos um preditor fornecido com o vetor de erro de predição recuperado para processar o vetor de erro de predição recuperado através de um de uma pluralidade de esquemas de predição dependendo da informação de classificação do quadro (605) (607) (606).
  46. 46. Dispositivo de acordo com a reivindicação 45, é CARACTERIZADO pelo fato de que o ao menos uma tabela de quantização compreende:
    - uma tabela de quantização usando um esquema de predição e fornecido com ambos, ao menos um índice e a informação de classificação.
  47. 47. Dispositivo de acordo com a reivindicação 45, é CARACTERIZADO pelo fato de que:
    - o dispositivo de recepção do índice de quantização compreende duas entradas para receber o índice de quantização do primeiro-estágio e o índice de quantização do segundo-estágio; e
    - a ao menos uma tabela de quantização compreende uma tabela de quantização de primeiro-estágio fornecido com o índice de quantização de primeiro-estágio para produzir o vetor de erro de predição de primeiro-estágio, e a tabela de quantização do segundo-estágio fornecido com o índice de quantização do segundo-estágio para produzir o vetor de erro de predição do segundo-estágio.
  48. 48. Dispositivo de acordo com a reivindicação 47, é CARACTERIZADO pelo fato de
    Petição 870170098841, de 18/12/2017, pág. 21/23
    15 / 16 que:
    - a pluralidade dos esquemas de predição compreende a predição de média móvel e a predição auto-regressiva;
    - a tabela de quantização do segundo estágio compreende a tabela de predição de média móvel e a tabela de predição auto-regressiva; e
    - o dispositivo também compreende um dispositivo para aplicar a classificação do quadro do sinal de som para a tabela de quantização do segundo estágio processar o índice de quantização do segundo estágio através da tabela de média móvel ou a tabela de predição auto-regressiva dependendo da informação de classificação do quadro recebida.
  49. 49. Dispositivo de acordo com a reivindicação 47, é CARACTERIZADO pelo fato de que:
    - um somador para somar o vetor de erro de predição do primeiro-estágio e o vetor de erro de predição do segundo estágio para produzir o vetor de erro de predição recuperado.
  50. 50. Dispositivo de acordo com a reivindicação 49, é CARACTERIZADO pelo fato de que também compreende:
    - um dispositivo para conduzir no vetor de predição recuperado uma operação de escalonamento inversa como uma função da informação de classificação do quadro recebida (609).
  51. 51. Dispositivo de acordo com a reivindicação 45, é CARACTERIZADO pelo fato de que o gerador do vetor de parâmetro de predição linear compreende:
    - um somador do vetor de erro de predição recuperado e do vetor de predição reconstruído para produzir o vetor do parâmetro de predição linear (604).
  52. 52. Dispositivo de acordo com a reivindicação 51, é CARACTERIZADO pelo fato de que também compreende um dispositivo para adicionar o vetor de parâmetros de predição linear médios ao vetor de erro de predição recuperado e ao vetor de
    Petição 870170098841, de 18/12/2017, pág. 22/23
    16 / 16 predição reconstruído para produzir o vetor do parâmetro de predição linear (608).
  53. 53. Dispositivo de acordo com a reivindicação 45, é CARACTERIZADO pelo fato de que:
    -a pluralidade de esquemas de predição compreende a predição de média móvel e a predição auto-regressiva; e
    - a unidade de reconstrução do vetor de predição compreende um média móvel e um preditor auto-regressivo para processar o vetor de erro de predição recuperado através da predição média móvel ou para processar o vetor do parâmetro produzido através da predição auto-regressiva dependendo da informação de classificação do quadro.
  54. 54. Dispositivo de acordo com a reivindicação 53, é CARACTERIZADO pelo fato de que compreende:
    - um dispositivo para processar o vetor do parâmetro produzido através do preditor auto-regressivo quando a informação de classificação do quadro indica que o quadro do sinal de som é vozeado estacionário; e
    - um dispositivo para processar o vetor de erro de predição recuperado através do preditor de média móvel quando a informação de classificação do quadro indica que o quadro do sinal de som é vozeado não-estacionário.
  55. 55. Dispositivo de acordo com a reivindicação 53, é CARACTERIZADO pelo fato de que compreende:
    - o ao menos um preditor compreende um preditor auto-regressivo para aplicar a predição auto-regressiva ao vetor de erro de predição e o preditor de média móvel para aplicar a predição de média móvel ao vetor de erro de predição; e
    - o preditor auto-regressivo e o preditor de média móvel compreendem as respectivas memórias que são atualizadas a cada quadro do sinal, assumindo que ou a predição de média móvel ou a predição auto-regressiva pode ser usada no próximo quadro.
    Petição 870170098841, de 18/12/2017, pág. 23/23
    1/8
    ·« • · • · • · ♦ ♦ · · • • • · • · · • • · • • · · • • · • · · • · • · • · · • · • · « · · «
    • « ♦
    • · ·
    104
    •·· ·· ··· • · · • · · ·« • · · · • · · ♦ · · • · ·
    N DIMENSÕES
    Á
    2/8 ο
    CN
    CL
    Q.
    a
    H w
    O CANAL
    O
    O
    CN
    UJ
    UJ a
    CL
    O l·UJ
    3/8
    • · « • · ·* • ·· ·· • · · « • · • · · » ·· ·· · • · ·· · « • · ·♦
    4/8
    Φ · Μ» • · ·· φ φ φ φ φ φ * · • · · φ · φ φ φ » · ♦ φ • · φ φ • · φφ φ φ φ φ φ φ φ • ··
    5/8
    507
    INFO bE CLASSIFICAÇÃO dsi vipNanbaaj
BRPI0317652-5A 2002-12-24 2003-12-18 Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável BRPI0317652B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2,415,105 2002-12-24
CA002415105A CA2415105A1 (en) 2002-12-24 2002-12-24 A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
PCT/CA2003/001985 WO2004059618A1 (en) 2002-12-24 2003-12-18 Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding

Publications (1)

Publication Number Publication Date
BRPI0317652B1 true BRPI0317652B1 (pt) 2018-05-22

Family

ID=32514130

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0317652-5A BRPI0317652B1 (pt) 2002-12-24 2003-12-18 Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável
BR0317652-5A BR0317652A (pt) 2002-12-24 2003-12-18 Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR0317652-5A BR0317652A (pt) 2002-12-24 2003-12-18 Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável

Country Status (16)

Country Link
US (2) US7149683B2 (pt)
EP (1) EP1576585B1 (pt)
JP (1) JP4394578B2 (pt)
KR (1) KR100712056B1 (pt)
CN (1) CN100576319C (pt)
AT (1) ATE410771T1 (pt)
AU (1) AU2003294528A1 (pt)
BR (2) BRPI0317652B1 (pt)
CA (1) CA2415105A1 (pt)
DE (1) DE60324025D1 (pt)
HK (1) HK1082587A1 (pt)
MX (1) MXPA05006664A (pt)
MY (1) MY141174A (pt)
RU (1) RU2326450C2 (pt)
UA (1) UA83207C2 (pt)
WO (1) WO2004059618A1 (pt)

Families Citing this family (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
CA2603246C (en) 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
SI1875463T1 (sl) * 2005-04-22 2019-02-28 Qualcomm Incorporated Sistemi, postopki in naprava za glajenje faktorja ojačenja
US8594252B2 (en) * 2005-08-22 2013-11-26 Qualcomm Incorporated Interference cancellation for wireless communications
US8611305B2 (en) * 2005-08-22 2013-12-17 Qualcomm Incorporated Interference cancellation for wireless communications
US8743909B2 (en) * 2008-02-20 2014-06-03 Qualcomm Incorporated Frame termination
US9071344B2 (en) * 2005-08-22 2015-06-30 Qualcomm Incorporated Reverse link interference cancellation
US8630602B2 (en) * 2005-08-22 2014-01-14 Qualcomm Incorporated Pilot interference cancellation
US7587314B2 (en) * 2005-08-29 2009-09-08 Nokia Corporation Single-codebook vector quantization for multiple-rate applications
KR100717401B1 (ko) * 2006-03-02 2007-05-11 삼성전자주식회사 역방향 누적 히스토그램을 이용한 음성 특징 벡터의 정규화방법 및 그 장치
GB2436191B (en) * 2006-03-14 2008-06-25 Motorola Inc Communication Unit, Intergrated Circuit And Method Therefor
US20090299738A1 (en) * 2006-03-31 2009-12-03 Matsushita Electric Industrial Co., Ltd. Vector quantizing device, vector dequantizing device, vector quantizing method, and vector dequantizing method
KR100900438B1 (ko) * 2006-04-25 2009-06-01 삼성전자주식회사 음성 패킷 복구 장치 및 방법
WO2008022207A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Time-warping of decoded audio signal after packet loss
JP5291004B2 (ja) 2007-03-02 2013-09-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信ネットワークにおける方法及び装置
US8160872B2 (en) * 2007-04-05 2012-04-17 Texas Instruments Incorporated Method and apparatus for layered code-excited linear prediction speech utilizing linear prediction excitation corresponding to optimal gains
US8438020B2 (en) * 2007-10-12 2013-05-07 Panasonic Corporation Vector quantization apparatus, vector dequantization apparatus, and the methods
CN101335004B (zh) * 2007-11-02 2010-04-21 华为技术有限公司 一种多级量化的方法及装置
US8995417B2 (en) * 2008-06-09 2015-03-31 Qualcomm Incorporated Increasing capacity in wireless communication
US9277487B2 (en) 2008-08-01 2016-03-01 Qualcomm Incorporated Cell detection with interference cancellation
US9237515B2 (en) * 2008-08-01 2016-01-12 Qualcomm Incorporated Successive detection and cancellation for cell pilot detection
JP5188913B2 (ja) * 2008-09-26 2013-04-24 株式会社エヌ・ティ・ティ・ドコモ 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置
US20100097955A1 (en) * 2008-10-16 2010-04-22 Qualcomm Incorporated Rate determination
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
WO2010092827A1 (ja) * 2009-02-13 2010-08-19 パナソニック株式会社 ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US9160577B2 (en) 2009-04-30 2015-10-13 Qualcomm Incorporated Hybrid SAIC receiver
US8787509B2 (en) * 2009-06-04 2014-07-22 Qualcomm Incorporated Iterative interference cancellation receiver
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
US8831149B2 (en) * 2009-09-03 2014-09-09 Qualcomm Incorporated Symbol estimation methods and apparatuses
US8452606B2 (en) 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP6091895B2 (ja) 2009-11-27 2017-03-08 クゥアルコム・インコーポレイテッドQualcomm Incorporated 無線通信における容量の増加
CN102668628B (zh) 2009-11-27 2015-02-11 高通股份有限公司 增加无线通信中的容量的方法和装置
IN2012DN05235A (pt) * 2010-01-08 2015-10-23 Nippon Telegraph & Telephone
DE102010010736A1 (de) * 2010-03-09 2011-09-15 Arnold & Richter Cine Technik Gmbh & Co. Betriebs Kg Verfahren zur Kompression von Bilddaten
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
GB2486663A (en) * 2010-12-21 2012-06-27 Sony Comp Entertainment Europe Audio data generation using parametric description of features of sounds
EP2700173A4 (en) 2011-04-21 2014-05-28 Samsung Electronics Co Ltd METHOD FOR QUANTIFYING LINEAR PREDICTIVE ENCODING COEFFICIENTS, METHOD FOR SOUND ENCODING, METHOD FOR DEQUANTIFYING LINEAR PREDICTIVE ENCODING COEFFICIENTS, METHOD FOR DECODING SOUND, AND RECORDING MEDIUM
RU2606552C2 (ru) 2011-04-21 2017-01-10 Самсунг Электроникс Ко., Лтд. Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для этого
CN103477388A (zh) * 2011-10-28 2013-12-25 松下电器产业株式会社 声音信号混合解码器、声音信号混合编码器、声音信号解码方法及声音信号编码方法
FI3547261T3 (fi) 2012-03-29 2023-09-26 Ericsson Telefon Ab L M Vektorikvantisoija
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN104112451B (zh) * 2013-04-18 2017-07-28 华为技术有限公司 一种选择编码模式的方法及装置
CN107316647B (zh) * 2013-07-04 2021-02-09 超清编解码有限公司 频域包络的矢量量化方法和装置
EP3637620A1 (en) * 2013-11-07 2020-04-15 Telefonaktiebolaget LM Ericsson (publ) Methods and devices for vector segmentation for coding
EP2916319A1 (en) 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
EA035903B1 (ru) * 2016-01-03 2020-08-28 Ауро Текнолоджиз Нв Кодер сигнала, декодер и способы их работы с использованием прогностической модели
CN105811995A (zh) * 2016-03-04 2016-07-27 广东工业大学 一种减少量化噪声的方法
US10002086B1 (en) * 2016-12-20 2018-06-19 Sandisk Technologies Llc Multi-channel memory operations based on bit error rates
US11343301B2 (en) * 2017-11-30 2022-05-24 Goto Group, Inc. Managing jitter buffer length for improved audio quality

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0286231A (ja) * 1988-09-21 1990-03-27 Matsushita Electric Ind Co Ltd 音声予測符号化装置
JP3254696B2 (ja) * 1991-09-25 2002-02-12 三菱電機株式会社 音声符号化装置、音声復号化装置および音源生成方法
US5614996A (en) * 1994-03-03 1997-03-25 Kyocera Corporation Toner storage unit, residual toner collect unit, toner container with these units and image forming apparatus with such toner container
DE69517325T2 (de) * 1994-08-18 2000-12-28 British Telecommunications P.L.C., London Tonqualitätsanalyse
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
KR100322706B1 (ko) * 1995-09-25 2002-06-20 윤종용 선형예측부호화계수의부호화및복호화방법
US5774839A (en) * 1995-09-29 1998-06-30 Rockwell International Corporation Delayed decision switched prediction multi-stage LSF vector quantization
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
JP3067676B2 (ja) * 1997-02-13 2000-07-17 日本電気株式会社 Lspの予測符号化装置及び方法
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
WO1999021174A1 (en) * 1997-10-22 1999-04-29 Matsushita Electric Industrial Co., Ltd. Sound encoder and sound decoder
DE69735262D1 (de) * 1997-11-24 2006-04-20 St Microelectronics Srl MPEG-2 Dekodierung mit reduziertem Speicherbedarf durch Rekomprimierung mit adaptiver baumstrukturierter Vektorquantisierung
US6141640A (en) * 1998-02-20 2000-10-31 General Electric Company Multistage positive product vector quantization for line spectral frequencies in low rate speech coding
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP3578933B2 (ja) * 1999-02-17 2004-10-20 日本電信電話株式会社 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP2000305597A (ja) * 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6505222B1 (en) * 1999-10-29 2003-01-07 International Business Machines Corporation Systems methods and computer program products for controlling undesirable bias in an equalizer
KR100324204B1 (ko) * 1999-12-24 2002-02-16 오길록 예측분할벡터양자화 및 예측분할행렬양자화 방식에 의한선스펙트럼쌍 양자화기의 고속탐색방법
US7010482B2 (en) * 2000-03-17 2006-03-07 The Regents Of The University Of California REW parametric vector quantization and dual-predictive SEW vector quantization for waveform interpolative coding
US6785805B1 (en) * 2000-08-08 2004-08-31 Vi Technology, Inc. Network-based configuration method for systems integration in test, measurement, and automation environments
JP3916934B2 (ja) * 2000-11-27 2007-05-23 日本電信電話株式会社 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
US7392179B2 (en) * 2000-11-30 2008-06-24 Matsushita Electric Industrial Co., Ltd. LPC vector quantization apparatus
KR20020075592A (ko) * 2001-03-26 2002-10-05 한국전자통신연구원 광대역 음성 부호화기용 lsf 양자화기
US7042841B2 (en) 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
EP1425562B1 (en) * 2001-08-17 2007-01-10 Broadcom Corporation Improved bit error concealment methods for speech coding
CA2415105A1 (en) * 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding

Also Published As

Publication number Publication date
MY141174A (en) 2010-03-31
US20070112564A1 (en) 2007-05-17
KR20050089071A (ko) 2005-09-07
CA2415105A1 (en) 2004-06-24
US7502734B2 (en) 2009-03-10
UA83207C2 (ru) 2008-06-25
HK1082587A1 (en) 2006-06-09
KR100712056B1 (ko) 2007-05-02
BR0317652A (pt) 2005-12-06
CN1739142A (zh) 2006-02-22
US20050261897A1 (en) 2005-11-24
RU2005123381A (ru) 2006-01-20
WO2004059618A1 (en) 2004-07-15
JP2006510947A (ja) 2006-03-30
ATE410771T1 (de) 2008-10-15
EP1576585B1 (en) 2008-10-08
EP1576585A1 (en) 2005-09-21
US7149683B2 (en) 2006-12-12
CN100576319C (zh) 2009-12-30
DE60324025D1 (de) 2008-11-20
JP4394578B2 (ja) 2010-01-06
MXPA05006664A (es) 2005-08-16
AU2003294528A1 (en) 2004-07-22
RU2326450C2 (ru) 2008-06-10

Similar Documents

Publication Publication Date Title
BRPI0317652B1 (pt) Método e dispositivo para quantizar os parâmetros de predição linear na codificação do sinal do som a uma taxa de bit variável, e, método e dispositivo para dês-quantizar os parâmetros de predição linear na decodificação do sinal do som a uma taxa de bit variável
US6134518A (en) Digital audio signal coding using a CELP coder and a transform coder
US8306007B2 (en) Vector quantizer, vector inverse quantizer, and methods therefor
KR102222838B1 (ko) 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
US20130185085A1 (en) Audio Signal Encoding Method, Audio Signal Decoding Method, Encoding Device, Decoding Device, Audio Signal Processing System, Audio Signal Encoding Program, and Audio Signal Decoding Program
EP2650878B1 (en) Encoding method, encoder, periodic feature amount determination method, periodic feature amount determination apparatus, program and recording medium
JP2011503653A (ja) スケーラブルなスピーチおよびオーディオコーデックにおける、量子化mdctスペクトルに対するコードブックインデックスのエンコーディング/デコーディングのための技術
JPH09120299A (ja) 適応コードブックに基づく音声圧縮システム
BR122020017853B1 (pt) Sistema e aparelho para codificar um sinal de voz em um fluxo de bits, e método e aparelho para decodificar sinal de áudio
JPWO2008047795A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
KR101390051B1 (ko) 벡터 양자화 장치, 벡터 역양자화 장치, 및 이러한 방법
KR101350285B1 (ko) 신호를 부호화 및 복호화하는 방법, 장치 및 시스템
EP2398149B1 (en) Vector quantization device, vector inverse-quantization device, and associated methods
US6611797B1 (en) Speech coding/decoding method and apparatus
KR20230129581A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
EP2571170B1 (en) Encoding method, decoding method, encoding device, decoding device, program, and recording medium
US20130268268A1 (en) Encoding of an improvement stage in a hierarchical encoder
WO2010098130A1 (ja) トーン判定装置およびトーン判定方法
JPWO2008018464A1 (ja) 音声符号化装置および音声符号化方法
CA2511516C (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US20230186928A1 (en) Methods and apparatus for unified speech and audio decoding improvements
KR100463577B1 (ko) 음성 부호화기용 선스펙트럼주파수 벡터 양자화 장치
Sridharan et al. Two novel lossless algorithms to exploit index redundancy in VQ speech compression
JP3700310B2 (ja) ベクトル量子化装置及びベクトル量子化方法
Djamah et al. Fine granularity scalable speech coding using embedded tree-structured vector quantization