PT1864282T - Sistemas, métodos, e aparelho para codificação de fala em banda larga - Google Patents

Sistemas, métodos, e aparelho para codificação de fala em banda larga Download PDF

Info

Publication number
PT1864282T
PT1864282T PT67403584T PT06740358T PT1864282T PT 1864282 T PT1864282 T PT 1864282T PT 67403584 T PT67403584 T PT 67403584T PT 06740358 T PT06740358 T PT 06740358T PT 1864282 T PT1864282 T PT 1864282T
Authority
PT
Portugal
Prior art keywords
signal
highband
speech
excitation
excitation signal
Prior art date
Application number
PT67403584T
Other languages
English (en)
Inventor
Bernard Vos Koen
A Kandhadai Ananthapadmanabhan
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT1864282(T) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of PT1864282T publication Critical patent/PT1864282T/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Control Of Eletrric Generators (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Amplitude Modulation (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Image Analysis (AREA)
  • Finish Polishing, Edge Sharpening, And Grinding By Specific Grinding Devices (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Crystals, And After-Treatments Of Crystals (AREA)
  • Filtration Of Liquid (AREA)
  • Solid-Sorbent Or Filter-Aiding Compositions (AREA)
  • Filtering Of Dispersed Particles In Gases (AREA)
  • Telephonic Communication Services (AREA)
  • Developing Agents For Electrophotography (AREA)
  • Transmitters (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Separation Using Semi-Permeable Membranes (AREA)
  • Filters And Equalizers (AREA)
  • Air Conditioning Control Device (AREA)
  • Ticket-Dispensing Machines (AREA)
  • Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)

Description

DESCRIÇÃO
"SISTEMAS, MÉTODOS, E APARELHO PARA CODIFICAÇÃO DE FALA EM BANDA LARGA"
ÁREA DA INVENÇÃO
Esta invenção refere-se a processamento de sinais.
ANTECEDENTES
As comunicações de voz sobre a rede telefónica comutada pública (PSTN) tem tradicionalmente estado limitadas em largura de banda ao intervalo de frequências de 300-3400 kHz. As novas redes para comunicações de voz, tais como telefonia celular e voz sobre IP (Protocolo Internet, VoIP), podem não ter os mesmos limites de largura de banda, e pode ser desejável transmitir e receber comunicações de voz que incluam um intervalo de frequências de banda larga sobre tais redes. Por exemplo, pode ser desejável suportar um intervalo de frequências de áudio que se estenda para baixo até 50 Hz e/ou para cima até 7 ou 8 kHz. Também pode ser desejável suportar outras aplicações, tais como áudio ou áudio/videoconferência de alta qualidade, que podem ter conteúdo de áudio falado em intervalos fora dos limites tradicionais da PSTN. A extensão do intervalo suportado por um codificador de fala para frequências mais elevadas pode melhorar a inteligibilidade.
Por exemplo, a informação que diferencia fricativas, tais como 's' e 'f' é em grande parte nas altas frequências. A extensão da banda alta também pode melhorar outras qualidades da fala, tais como presença. Por exemplo, mesmo uma vogal falada pode ter energia espectral muito acima do limite da PSTN.
Uma abordagem à codificação de fala de banda larga envolve escalar uma técnica de codificação de fala em banda estreita (e. g. , uma configurada para codificar o intervalo de 0-4 kHz) para cobrir o espectro de banda larga. Por exemplo, um sinal de fala pode ser amostra a uma velocidade mais alta para incluir componentes a altas frequências, e uma técnica de codificação em banda estreita pode ser reconfigurada para utilizar mais coeficientes de filtragem para representar este sinal de banda larga. Técnicas de codificação em banda estreita tais como CELP (predição linear com excitação por livro de código) são computacionalmente intensivos, no entanto, e um codificador CELP de banda larga pode consumir demasiados ciclos de processamento para ser prático para muitas aplicações móveis e outras embebidas. Codificar todo o espectro de um sinal de banda larga até uma qualidade desejada utilizando uma tal técnica também pode conduzir a um aumento inaceitavelmente grande em largura de banda. Além disso, seria necessário transcodificar um tal sinal codificado antes mesmo da sua parte de banda estreita poder ser transmitida para e/ou descodificada por um sistema que suporta apenas codificação em banda estreita.
Outra abordagem à codificação de fala de banda larga envolve extrapolar o envelope espectral de banda alta a partir do envelope espectral de banda estreita codificado. Embora uma tal abordagem possa ser implementada sem qualquer aumento em largura de banda e sem uma necessidade de transcodificar, o envelope espectral grosseiro ou estrutura formante da parte de banda alta de um sinal de fala geralmente não pode ser predita com precisão a partir do envelope espectral da parte de banda estreita.
Pode ser desejável implementar codificação de fala de banda larga de modo a que, pelo menos, a parte de banda estreita do sinal codificado possa ser enviada através um canal de banda estreita (tal como um canal PSN) sem transcodificação ou outra modificação significativa. A eficiência da extensão de codificação em banda larga também pode ser desejável, por exemplo, para evitar uma redução significativa no número de utilizadores que podem ser servidos em aplicações tais como telefonia celular sem fios e difusão sobre canais com fios e sem f ios.
Os documentos US 5978759 e US 5455888 descrevem aparelhos para alargar a largura de banda de um sinal de fala, que recebem uma entrada de sinal de fala em banda estreita e produzir um sinal de fala com uma largura de banda alargada. 0 documento EP 1089258 A2 divulga um codec de fala por banda estendendo um sinal de excitação em banda baixa para obter um sinal de excitação de banda alta e misturar o sinal de excitação de banda alta com ruído.
SUMARIO
Numa forma de realização, é divulgado um método de processamento de sinais de acordo com a reivindicação 1.
Numa outra forma de realização, é divulgado um aparelho de acordo com a reivindicação 9.
Numa outra forma de realização, é divulgado um método de processamento de sinais de acordo com a reivindicação 18.
Numa outra forma de realização, é divulgado um aparelho de acordo com a reivindicação 26.
DESCRIÇÃO BREVE DOS DESENHOS A FIGURA la mostra um diagrama de blocos de um codificador A100 de fala de banda larga de acordo com uma forma de realização. A FIGURA lb mostra um diagrama de blocos de uma implementação A102 do codificador A100 de fala de banda larga. A FIGURA 2a mostra um diagrama de blocos de um descodificador B100 de fala de banda larga de acordo com uma forma de realização. A FIGURA 2b mostra um diagrama de blocos de uma implementação B102 do codificador B100 de fala de banda larga. A FIGURA 3a mostra um diagrama de blocos de uma implementação A112 do banco A110 de filtros. A FIGURA 3b mostra um diagrama de blocos de uma implementação B122 do banco B120 de filtros. A FIGURA 4a mostra a cobertura de largura de banda das bandas baixa e alta para um exemplo do banco A110 de filtros . A FIGURA 4b mostra a cobertura de largura de banda das bandas baixa e alta para um outro exemplo do banco A110 de filtros. A FIGURA 4c mostra um diagrama de blocos de uma implementação A114 do banco A112 de filtros. A FIGURA 4d mostra um diagrama de blocos de uma implementação B124 do banco B122 de filtros. A FIGURA 5a mostra um exemplo de um gráfico de frequência vs. amplitude de estabelecimento de ligação para um sinal de fala. A FIGURA 5b mostra um diagrama de blocos de um sistema de codificação por predição linear básico. A FIGURA 6 mostra um diagrama de blocos de uma implementação A122 do codificador A120 de banda estreita. A FIGURA 7 mostra um diagrama de blocos de uma implementação B112 do descodificador B110 de banda estreita. A FIGURA 8a mostra um exemplo de um gráfico de frequência vs. amplitude de estabelecimento de ligação para um sinal residual para voz falada. A FIGURA 8b mostra um exemplo de um gráfico de tempo vs. amplitude de estabelecimento de ligação para um sinal residual para voz falada. A FIGURA 9 mostra um diagrama de blocos de um sistema de codificação por predição linear básico que também realiza predição de longo prazo. A FIGURA 10 mostra um diagrama de blocos de uma implementação A202 do codificador A200 de banda alta. A FIGURA 11 mostra um diagrama de blocos de uma implementação A302 do gerador A300 de excitação de banda alta. A FIGURA 12 mostra um diagrama de blocos de uma implementação A402 do extensor A400 de espectro. A FIGURA 12a mostra gráficos de espectros de sinais em diversos pontos num exemplo de uma operação de extensão espectral. A FIGURA 12b mostra gráficos de espectros de sinais em diversos pontos num outro exemplo de uma operação de extensão espectral. A FIGURA 13 mostra um diagrama de blocos de uma implementação A304 do gerador A302 de excitação de banda alta. A FIGURA 14 mostra um diagrama de blocos de uma implementação A30 6 do gerador A302 de excitação de banda alta. A FIGURA 15 mostra um fluxograma para uma tarefa T100 de cálculo de envelope. A FIGURA 16 mostra um diagrama de blocos de uma implementação 492 do combinador 490. A FIGURA 17 ilustra uma abordagem ao cálculo de uma medição de periodicidade do sinal S30 de banda alta. A FIGURA 18 mostra um diagrama de blocos de uma implementação A312 do gerador A302 de excitação de banda alta. A FIGURA 19 mostra um diagrama de blocos de uma implementação A314 do gerador A302 de excitação de banda alta. A FIGURA 20 mostra um diagrama de blocos de uma implementação A316 do gerador A302 de excitação de banda alta. A FIGURA 21 mostra um fluxograma para uma tarefa T200 de cálculo de ganho. A FIGURA 22 mostra um fluxograma para uma implementação T210 da tarefa T200 de cálculo de ganho. A FIGURA 23a mostra um diagrama de uma função janela. A FIGURA 23b mostra uma aplicação de uma função janela como mostrado na FIGURA 23a a subquadros de um sinal de fala. A FIGURA 24 mostra um diagrama de blocos para uma implementação B202 do codificador B200 de banda alta. A FIGURA 25 mostra um diagrama de blocos de uma implementação ADIO do codificador A100 de fala de banda larga. A FIGURA 26a mostra um diagrama esquemático de uma implementação D122 da linha D120 de atraso. A FIGURA 26b mostra um diagrama esquemático de uma implementação D124 da linha D120 de atraso. A FIGURA 27 mostra um diagrama esquemático de uma implementação D130 da linha D120 de atraso. A FIGURA 28 mostra um diagrama de blocos de uma implementação AD12 do codificador ADIO de fala de banda larga. A FIGURA 29 mostra um fluxograma de um método de processamento de sinais MD100 de acordo com uma forma de realização. A FIGURA 30 mostra um fluxograma para um método M100 de acordo com uma forma de realização. A FIGURA 31a mostra um fluxograma para um método M200 de acordo com uma forma de realização. A FIGURA 31b mostra um fluxograma para uma implementação M210 do método M200. A FIGURA 32 mostra um fluxograma para um método M300 de acordo com uma forma de realização.
Nas figuras e descrição em anexo, as mesmas etiquetas de referência referem-se aos mesmos elementos ou sinais, ou semelhantes.
DESCRIÇÃO PORMENORIZADA
Formas de realização como aqui descrito incluem sistemas, métodos, e aparelhos que podem ser configurados para proporcionar uma extensão a um codificador de fala de banda estreita para suportar transmissão e/ou armazenamento de sinais de fala de banda larga com um aumento de largura de banda de apenas cerca de 800 a 1000 bps (bits por segundo) . As vantagens potenciais de tais implementações incluem codificação embebida para suportar compatibilidade com sistemas de banda estreita, relativamente fácil atribuição e reatribuição de bits entre os canais de codificação em banda estreita e banda alta, evitando uma operação de síntese de banda larga computacionalmente intensiva, e mantendo uma baixa velocidade de amostragem para sinais a ser processados por rotinas de codificação de forma de onda computacionalmente intensivas. A menos que expressamente limitado pelo seu contexto, o termo "calcular" é aqui utilizado para indicar qualquer dos seus significados habituais, tal como computar, gerar e selecionar a partir de uma lista de valores. Onde o termo "compreendendo" é utilizado na presente descrição e reivindicações, aquele não exclui outros elementos ou operações. A expressão "A é baseado em B" é utilizada para indicar qualquer dos seus significados habituais, incluindo os casos (i) "A é igual a B" e (ii) "A é baseado, em pelo, menos B". A expressão "Protocolo Internet" inclui a versão 4, como descrito em IETF (Grupo de Trabalho de Engenharia de Internet) RFC (Solicitação de Comentários) 791, e versões subsequentes tais como a versão 6. A FIGURA la mostra um diagrama de blocos de um codificador AlOO de fala de banda larga de acordo com uma forma de realização. 0 banco A110 de filtros está configurado para filtrar um sinal S10 de fala de banda larga para produzir um sinal S20 de banda estreita e um sinal S30 de banda alta. 0 codificador A120 de banda estreita está configurado para codificar um sinal S20 de banda estreita para produzir parâmetros S40 de filtro de banda estreita (NB) e um sinal S50 residual de banda estreita. Como descrito com mais pormenor aqui, o codificador A120 de banda estreita está tipicamente configurado para produzir parâmetros S40 de filtro de banda estreita e sinal S50 de excitação de banda estreita codificado como indices de livro de código ou noutra forma quantificada. 0 codificador A200 de banda alta está configurado para codificar o sinal S30 de banda alta de acordo com informação no sinal S50 de excitação de banda estreita codificado para produzir parâmetros S60 de codificação de banda alta. Como descrito com mais pormenor aqui, o codificador A200 de banda alta está tipicamente configurado para produzir parâmetros S60 de codificação de banda alta como indices de livro de código ou noutra forma quantificada. Um exemplo particular de codificador A100 de fala de banda larga está configurado para codificar o sinal S10 de fala de banda larga a uma velocidade de cerca de 8,55 kbps (quilobits por segundo), com cerca de 7,55 kbps sendo utilizados para parâmetros S40 de filtro de banda estreita e sinal S50 de excitação de banda estreita codificado, e cerca de 1 kbps sendo utilizados para parâmetros S60 de codificação de banda alta.
Pode ser desejado combinar os sinais de banda estreita e banda alta codificados numa única corrente de bits. Por exemplo, pode ser desejado multiplexar os sinais codificados em conjunto para transmissão (e. g., sobre um canal de transmissão com fios, ótico, ou sem fios) , ou para armazenamento, como um sinal de fala de banda larga codificado. A FIGURA lb mostra um diagrama de blocos de uma implementação A102 do codificador A100 de fala de banda larga que inclui um multiplexador A130 configurado para combinar os parâmetros S40 de filtro de banda estreita, sinal S50 de excitação de banda estreita codificado e parâmetros S60 de filtro de banda alta num sinal S70 multiplexado.
Um aparelho incluindo o codificador A102 também pode incluir circuitos configurados para transmitir o sinal S70 multiplexado num canal de transmissão tal como um canal com fios, ótico, ou sem fios. Um tal aparelho também pode ser configurado para realizar uma ou mais operações de codificação de canal sobre o sinal, tal como codificação de correção de erros (e. g., codificação convolucional de velocidade compatível) e/ou codificação de deteção de erros (e. g., codificação com redundância cíclica), e/ou uma ou mais camadas de codificação de protocolo de rede (e. g., Ethernet, TCP/IP, cdma2000).
Pode ser desejável que o multiplexador A130 seja configurado para integrar o sinal de banda estreita codificado (incluindo parâmetros S40 de filtro de banda estreita e sinal S50 de excitação de banda estreita codificado) como uma subcorrente separável do sinal S70 multiplexado, de modo a que o sinal de banda estreita codificado possa ser recuperado e descodificado independentemente de outra parte do sinal S70 multiplexado tal como um sinal de banda alta e/ou banda baixa. Por exemplo, o sinal S70 multiplexado pode ser disposto de modo a que o sinal de banda estreita codificado possa ser recuperado eliminando os parâmetros S60 de filtro de banda alta. Uma vantagem potencial de uma tal característica é evitar a necessidade de transcodificar o sinal de banda larga codificado antes de o passar a um sistema que suporta descodificação do sinal de banda estreita, mas não suporta descodificação da parte de banda alta. A FIGURA 2a é um diagrama de blocos de um descodificador B100 de fala de banda larga de acordo com uma forma de realização. 0 descodificador B110 de banda estreita está configurado para descodificar os parâmetros S40 de filtro de banda estreita e sinal S50 de excitação de banda estreita codificado para produzir um sinal S90 de banda estreita. 0 descodificador B200 de banda alta está configurado para descodificar os parâmetros S60 de codificação de banda alta de acordo com um sinal S80 de excitação de banda estreita com base no sinal S50 de excitação de banda estreita codificado, para produzir um sinal S100 de banda alta. Neste exemplo, o descodificador B110 de banda estreita está configurado para proporcionar o sinal S80 de excitação de banda estreita ao descodificador B200 de banda alta. 0 banco B120 de filtros está configurado para combinar o sinal S90 de banda estreita e sinal S100 de banda alta para produzir um sinal S110 de fala de banda larga. A FIGURA 2b é um diagrama de blocos de uma implementação B102 do descodificador B100 de fala de banda larga que inclui um desmultiplexador B130 configurado para produzir sinais S40, S50 e S60 codificados a partir de um sinal S70 multiplexado. Um aparelho incluindo o descodificador B102 pode incluir circuitos configurados para receber o sinal S70 multiplexado a partir de um canal de transmissão tal como um canal com fios, ótico, ou sem fios. Um tal aparelho também pode ser configurado para realizar uma ou mais operações de descodificação de canal sobre o sinal, tal como descodificação de correção de erros (e. g., descodificação convolucional de velocidade compatível) e/ou descodificação de deteção de erros (e. g., descodificação com redundância cíclica), e/ou uma ou mais camadas de descodificação de protocolo de rede (e. g. , Ethernet, TCP/IP, cdma2000). 0 banco A110 de filtros está configurado para filtrar um sinal de entrada de acordo com um esquema de banda dividida para produzir uma sub-banda de baixa frequência e uma sub-banda de alta frequência. Dependendo dos critérios de conceção para a aplicação particular, as sub-bandas de saída podem ter larguras de banda iguais ou desiguais e podem estar sobrepostas ou não sobrepostas. Uma configuração do banco A110 de filtros que produz mais do que duas sub-bandas é também possível. Por exemplo, um tal banco de filtros pode ser configurado para produzir um ou mais sinais de banda baixa que incluam componentes num intervalo de frequências abaixo daquele do sinal S20 de banda estreita (tal como o intervalo de 50-300 Hz). É também possível que um tal banco de filtros seja configurado para produzir um ou mais sinais de banda alta adicionais que incluam componentes num intervalo de frequências acima daquele do sinal S30 de banda alta (tal como o intervalo de 14-20, 16-20 ou 16-32 kHz) . Em tal caso, o codificador A100 de fala de banda larga pode ser implementado para codificar este sinal ou sinais separadamente, e o multiplexador A130 pode ser configurado para incluir o sinal codificado adicional ou sinais no sinal S70 multiplexado (e. g., como uma parte separável). A FIGURA 3a mostra um diagrama de blocos de uma implementação A112 do banco A110 de filtros que está configurada para produzir dois sinais de sub-banda tendo velocidades de amostragem reduzidas. O banco A110 de filtros está disposto para receber um sinal S10 de fala de banda larga tendo uma parte de alta frequência (ou banda alta) e uma parte de baixa frequência (ou banda baixa). O banco A112 de filtros inclui um trajeto de processamento de banda baixa configurado para receber o sinal S10 de fala de banda larga e produzir o sinal S20 de fala de banda estreita, e um trajeto de processamento de banda alta configurado para receber o sinal S10 de fala de banda larga e produzir o sinal S30 de fala de banda alta. O filtro 110 passa-baixo filtra o sinal S10 de fala de banda larga para passar uma sub-banda de baixa frequência selecionada, e o filtro 130 passa-alto filtra o sinal S10 de fala de banda larga para passar uma sub-banda de alta frequência selecionada. Porque ambos os sinais de sub-banda têm larguras de banda mais estreitas do que o sinal S10 de fala de banda larga, as suas velocidades de amostragem podem ser reduzidas em alguma extensão sem perda de informação. O redutor 120 de velocidade de amostragem reduz a velocidade de amostragem do sinal passa-baixo de acordo com um fator de dizimação desejado (e. g., removendo amostras do sinal e/ou substituindo amostras com valores médios), e o redutor 140 de velocidade de amostragem reduz de igual modo a velocidade de amostragem do sinal passa-alto de acordo com outro fator de dizimação desejado. A FIGURA 3b mostra um diagrama de blocos de uma implementação B122 correspondente do banco B120 de filtros. O aumentador 150 de velocidade de amostragem aumenta a velocidade de amostragem do sinal S90 de banda estreita (e. g., preenchendo com zeros e/ou duplicando amostras), e o filtro 160 passa-baixo filtra o sinal com velocidade de amostragem aumentada para passar apenas uma parte de banda baixa (e. g., para evitar aliasing). De igual modo, o aumentador 170 de velocidade de amostragem aumenta a velocidade de amostragem do sinal S100 de banda alta e o filtro 180 passa-alto filtra o sinal com velocidade de amostragem aumentada para passar apenas uma parte de banda alta. Os dois sinais de banda passante são então somados para formar o sinal S110 de fala de banda larga. Em algumas implementações do descodificador B100, o banco B120 de filtros está configurado para produzir uma soma ponderada dos dois sinais de banda passante de acordo com uma ou mais ponderações recebidas e/ou calculadas pelo descodificador B200 de banda alta. Uma configuração do banco B120 de filtros que combina mais do que dois sinais de banda passante é também contemplada.
Cada um dos filtros 110, 130, 160, 180 pode ser implementado como um filtro resposta-impulso-finito (FIR) ou como um filtro resposta-impulso-infinito (HR) . As respostas em frequência dos filtros 110 e 130 codificadores podem ter regiões de transição simétricas ou formadas de modo diferente entre banda atenuada e banda passante. De igual modo, as respostas em frequência dos filtros 160 e 180 descodificadores podem ter regiões de transição simétricas ou formadas de modo diferente entre banda atenuada e banda passante. Pode ser desejável, mas não é estritamente necessário que o filtro 110 passa-baixo tenha a mesma resposta que o filtro 160 passa-baixo, e que o filtro 130 passa-alto tenha a mesma resposta que o filtro 180 passa-alto. Num exemplo, os dois pares de filtros 110, 130 e 160, 180 são bancos de filtros espelho em quadratura (QMF), com o par de filtros 110, 130 tendo os mesmos coeficientes que o par de filtros 160, 180.
Num exemplo típico, o filtro 110 passa-baixo tem uma banda passante que inclui o intervalo PSTN limitado de 300-3400 Hz (e. g., a banda de 0 a 4 kHz) . As FIGURAS 4a e 4b mostram larguras de banda relativas do sinal S10 de fala de banda larga, sinal S20 de banda estreita, e sinal S30 de banda alta em dois diferentes exemplos de implementação. Em ambos estes exemplos particulares, o sinal S10 de fala de banda larga tem uma velocidade de amostragem de 16 kHz (representando componentes de frequência no intervalo de 0 a 8 kHz), e o sinal S20 de banda estreita tem uma velocidade de amostragem de 8 kHz (representando componentes de frequência no intervalo de 0 a 4 kHz).
No exemplo da FIGURA 4a, não existe sobreposição significativa entre as duas sub-bandas. Um sinal S30 de banda alta como mostrado neste exemplo pode ser obtido utilizando um filtro 130 passa-alto com uma banda passante de 4—8 kHz. Num caso como este, pode ser desejável reduzir a velocidade de amostragem para 8 kHz reduzindo a velocidade de amostragem do sinal filtrado por um fator de dois. Uma tal operação, que se pode esperar que reduza significativamente a complexidade computacional de operações de processamento adicional sobre o sinal, irá mover a energia da banda passante para baixo para o intervalo de 0 a 4 kHz sem perda de informação.
No exemplo alternativo da FIGURA 4b, as sub-bandas superior e inferior têm uma sobreposição apreciável, de tal modo que a região de 3,5 a 4 kHz é descrita por ambos os sinais de sub-banda. Um sinal S30 de banda alta como neste exemplo pode ser obtido utilizando um filtro 130 passa-alto com uma banda passante de 3,5—7 kHz. Num caso como este, pode ser desejável reduzir a velocidade de amostragem para 7 kHz reduzindo a velocidade de amostragem do sinal filtrado por um fator de 16/7. Uma tal operação, que se pode esperar que reduza significativamente a complexidade computacional de operações de processamento adicional sobre o sinal, irá mover a energia da banda passante para baixo para o intervalo de 0 a 3,5 kHz sem perda de informação.
Num telefone típico para comunicação telefónica, um ou mais dos transdutores (i. e., o microfone e o auricular ou altifalante) carecem de resposta apreciável no intervalo de frequências de 7-8 kHz No exemplo da FIGURA 4b, a parte do sinal S10 de fala de banda larga entre 7 e 8 kHz não é incluída no sinal codificado. Outros exemplos particulares do filtro 130 passa-alto têm bandas passantes de 3,5-7,5 kHz e 3,5-8 kHz.
Em algumas implementações, proporcionar uma sobreposição entre sub-bandas como no exemplo da FIGURA 4b permite a utilização de um filtro passa-baixo e/ou um passa-alto tendo um deslizamento suave sobre a região sobreposta. Tais filtros são tipicamente mais fáceis de conceber, computacionalmente menos complexos, e/ou introduzem menos atraso do que filtros com respostas mais acentuadas ou "parede de tijolo". Filtros tendo regiões de transição acentuadas tendem a ter lóbulos laterais mais altos (o que pode causar aliasing) do que filtros de ordem semelhante que têm deslizamentos suaves. Filtros tendo regiões de transição acentuadas também podem ter respostas de impulso longas o que pode causar artefactos em anel. Para implementações de bancos de filtros tendo um ou mais filtros IIR, permitindo um deslizamento suave sobre a região sobreposta pode permitir a utilização de um filtro ou filtros cujos polos estão mais afastados do círculo unitário, o que pode ser importante para assegurar uma implementação de ponto fixo estável. A sobreposição de sub-bandas permite uma mistura uniforme da banda baixa e banda alta que pode conduzir a menos artefactos audíveis, aliasing reduzido, e/ou uma transição menos percetível de uma banda para a outra. Além disso, a eficiência de codificação do codificador A120 de banda estreita (por exemplo, um codificador de forma de onda) pode cair com frequência crescente. Por exemplo, a qualidade de codificação do codificador de banda estreita pode ser reduzida a baixas velocidades de bit, especialmente na presença de ruído de fundo. Em tais casos, proporcionar uma sobreposição das sub-bandas pode aumentar a qualidade de componentes de frequência reproduzidos na região sobreposta.
Além disso, a sobreposição de sub-bandas permite uma mistura uniforme da banda baixa e banda alta que pode conduzir a menos artefactos audíveis, aliasing reduzido, e/ou uma transição menos percetível de uma banda para a outra. Uma tal característica pode ser especialmente desejável para uma implementação na qual o codificador A120 de banda estreita e o codificador A200 de banda alta funcionam de acordo com diferentes metodologias de codificação. Por exemplo, técnicas de codificação diferentes podem produzir sinais que soam bastante diferentes. Um codificador que codifica um envelope espectral na forma de índices de livro de código pode produzir um sinal tendo um som diferente de um codificador que, em vez disso, codifica o espectro de amplitude. Um codificador do domínio do tempo (e. g., um codificador modulação-código-impulso ou PCM) pode produzir um sinal tendo um som diferente de um codificador do domínio da frequência. Um codificador que codifica um sinal com uma representação do envelope espectral e o sinal residual correspondente pode produzir um sinal tendo um som diferente de um codificador que codifica um sinal apenas com uma representação do envelope espectral. Um codificador que codifica um sinal como uma representação da sua forma de onda pode produzir uma saída tendo um som diferente daquele de um codificador sinusoidal. Em tais casos, utilizar filtros tendo regiões de transição acentuadas para definir sub-bandas não sobrepostas pode conduzir a uma transição brusca e percetível entre as sub-bandas no sinal de banda larga sintetizado.
Embora os bancos de filtros QMF tendo respostas em frequência sobrepostas complementares sejam utilizados frequentemente em técnicas de sub-banda, tais filtros são inadequados para, pelo menos, algumas das implementações de codificação de banda larga aqui descritas. Um banco de filtros QMF no codificador está configurado para criar um grau significativo de aliasing que é cancelado no correspondente banco de filtros QMF no descodificador. Uma tal disposição pode não ser apropriada para uma aplicação na qual o sinal sofre uma quantidade significativa de distorção entre os bancos de filtros, na medida em que a distorção pode reduzir a efetividade da propriedade de cancelamento de alias. Por exemplo, aplicações aqui descritas incluem implementações de codificação configuradas para funcionar a muito baixas velocidades de bit. Em consequência velocidade de bits muito reduzida, é provável que o sinal descodificado apareça significativamente distorcido quando comparado com o sinal original, de tal modo que a utilização de bancos de filtros QMF pode conduzir a aliasing não cancelado. Aplicações que utilizam bancos de filtros QMF tipicamente têm velocidades de bit mais elevadas (e. g., acima de 12 kbps para AMR, e 64 kbps para G.722).
Adicionalmente, um codificador pode ser configurado para produzir um sinal sintetizado que é perceptualmente semelhante ao sinal original, mas que na realidade, é significativamente diferente do sinal original. Por exemplo, um codificador que deriva a excitação de banda alta a partir do resíduo de banda estreita como aqui descrito pode produzir um tal sinal, uma vez que o resíduo de banda alta real pode estar completamente ausente do sinal descodificado. A utilização de bancos de filtros QMF em tais aplicações pode conduzir a um grau de distorção significativo causado por aliasing não cancelado. A quantidade de distorção causada por aliasing QMF pode ser reduzida se a sub-banda afetada é estreita, uma vez que o efeito do aliasing é limitado a uma largura de banda igual à largura da sub-banda. Para exemplos como aqui descritos nos quais cada sub-banda inclui cerca de metade da largura de banda da banda larga, no entanto, a distorção causada por aliasing não cancelado poderia afetar uma parte significativa do sinal. A qualidade do sinal também pode ser afetada pela localização da banda de frequência sobre a qual o aliasing não cancelado ocorre. Por exemplo, distorção criada próximo do centro de um sinal de fala de banda larga (e. g., entre 3 e 4 kHz) pode ser muito mais questionável do que a distorção que ocorre próximo de uma periferia do sinal (e. g., acima de 6 kHz).
Embora as respostas dos filtros de um banco de filtros QMF estejam estritamente relacionadas umas com as outras, os trajetos de banda baixa e banda alta de bancos de filtros A110 e B120 podem ser configurados para ter espectros que são completamente não relacionados a não ser pela sobreposição das duas sub-bandas. Define-se a sobreposição das duas sub-bandas como a distância a partir do ponto no qual a resposta em frequência do filtro de banda alta cai até -20 dB até ao ponto no qual a resposta em frequência do filtro de banda baixa cai até -20 dB. Em diversos exemplos de banco A110 e/ou B120 de filtros, esta sobreposição varia de cerca de 200 Hz até cerca de 1 kHz. O intervalo de cerca de 400 até cerca de 600 Hz pode representar um compromisso desejável entre eficiência de codificação e uniformidade percetual. Num exemplo particular como mencionado acima, a sobreposição é em torno de 500 Hz.
Pode ser desejável implementar o banco A112 e/ou B122 de filtros para realizar operações como ilustradas nas FIGURAS 4a e 4b em várias etapas. Por exemplo, a FIGURA 4c mostra um diagrama de blocos de uma implementação A114 do banco A112 de filtros que realiza um equivalente funcional das operações de filtragem passa-alto e redução da velocidade de amostragem, utilizando uma série de operações de interpolação, reamostragem, dizimação e outras. Uma tal implementação pode ser mais fácil de conceber e/ou pode permitir a reutilização de blocos funcionais de lógica e/ou código. Por exemplo, o mesmo bloco funcional pode ser utilizado para realizar as operações de dizimação para 14 kHz e dizimação para 7 kHz como mostrado na FIGURA 4c. A operação de inversão espectral pode ser implementada multiplicando o sinal pela função e^nu a sequência (~l)n, cujos valores alternam entre +1 e -1. A operação de modelação espectral pode ser implementada como um filtro passa-baixo configurado para formar o sinal para obter uma resposta global de filtro desejada.
Salienta-se que, como uma consequência da operação de inversão espectral, o espectro do sinal S30 de banda alta é invertido. Subsequentes operações no codificador e correspondente descodificador podem ser configuradas em conformidade. Por exemplo, o gerador A300 de excitação de banda alta como aqui descrito pode ser configurado para produzir um sinal S120 de excitação de banda alta que também tem uma forma espectralmente invertida. A FIGURA 4d mostra um diagrama de blocos de uma implementação B124 do banco B122 de filtros que realiza um equivalente funcional das operações de aumento da velocidade de amostragem e filtragem passa-alto e redução, utilizando uma série de operações de interpolação, reamostragem, dizimação e outras. 0 banco B124 de filtros inclui uma operação de inversão espectral na banda alta que inverte uma operação semelhante como realizado, por exemplo, num banco de filtros do codificador tal como o banco A114 de filtros. Neste exemplo particular, o banco B124 de filtros também inclui filtros em degrau na banda baixa e banda alta que atenuam uma componente do sinal a 7100 Hz, embora tais filtros sejam opcionais e não necessitem de ser incluídos. O Pedido de Patente "SISTEMAS, MÉTODOS, E APARELHOS PARA FILTRAGEM DE SINAIS DE FALA" aqui apresentado, Registo Legal 050551, inclui descrição adicional e figuras relacionadas com respostas de elementos de implementações particulares de bancos A110 e B120 de filtros, e este material é aqui integrado por referência. 0 codificador A120 de banda estreita é implementado de acordo com um modelo fonte-filtro que codifica o sinal de entrada de fala como (A) um conjunto de parâmetros que descrevem um filtro e (B) um sinal de excitação que move o filtro descrito para produzir uma reprodução sintetizada do sinal de entrada de fala. A FIGURA 5a mostra um exemplo de um envelope espectral de um sinal de fala. Os picos que caracterizam este envelope espectral representam ressonâncias do trato vocal e são chamadas formantes. A maior parte dos codificadores de fala codificam pelo menos esta estrutura espectral grosseira como um conjunto de parâmetros tais como coeficientes de filtragem. A FIGURA 5b mostra um exemplo de uma disposição de filtro-fonte básica como aplicada à codificação do envelope espectral do sinal S20 de banda estreita. Um módulo de análise calcula um conjunto de parâmetros que caracterizam um filtro correspondente ao som da fala durante um período de tempo (tipicamente 20 ms) . Um filtro de branqueamento (também chamado um filtro de análise ou de erro de predição) configurado de acordo com aqueles parâmetros de filtragem remove o envelope espectral para nivelar espectralmente o sinal. O sinal branqueado resultante (também chamado um resíduo) tem menos energia e, assim, menos variância e é mais fácil de codificar que o sinal de fala original. Erros resultantes da codificação do sinal residual também podem ser dispersos de modo mais regular sobre o espectro. Os parâmetros de filtragem e residuais são tipicamente quantificados para transmissão eficiente sobre o canal. No descodificador, um filtro de síntese configurado de acordo com os parâmetros de filtragem é excitado por um sinal baseado no resíduo para produzir uma versão sintetizada do som de fala original. 0 filtro de síntese é tipicamente configurado para ter uma função de transferência que é a inversa da função transferência do filtro de branqueamento. A FIGURA 6 mostra um diagrama de blocos de uma implementação A122 básica do codificador A120 de banda estreita. Neste exemplo, um módulo 210 de análise de codificação por predição linear (LPC) codifica o envelope espectral do sinal S20 de banda estreita como um conjunto de coeficientes de predição linear (LP) (e. g., coeficientes de um filtro todos os polos 1/A(z)). O módulo de análise tipicamente processa o sinal de entrada como uma série de quadros não sobrepostos, com um novo conjunto de coeficientes sendo calculado para cada quadro. O período de quadro é geralmente um período ao longo do qual se pode esperar que o sinal seja localmente estacionário; um exemplo comum é 20 milissegundos (equivalente a 160 amostras a uma velocidade de amostragem de 8 kHz) . Num exemplo, o módulo 210 de análise LPC está configurado para calcular um conjunto de dez coeficientes de filtragem LP para caracterizar a estrutura formante de cada quadro de 20-milissegundos. É igualmente possível implementar o módulo de análise para processar o sinal de entrada como uma série de quadros não sobrepostos. O módulo de análise pode ser configurado para analisar as amostras de cada quadro diretamente, ou as amostras podem ser ponderadas primeiro de acordo com uma função janela (por exemplo, uma janela Hamming). A análise também pode ser realizada sobre uma janela que é maior que o quadro, tal como uma janela de 30-ms. Esta janela pode ser simétrica (e. g. 5-20-5, de modo a incluir os 5 milissegundos imediatamente antes e após o quadro de 20-milissegundo) ou assimétrica (e. g. 10-20, de modo a incluir os últimos 10 milissegundos do quadro anterior). Um módulo de análise LPC é tipicamente configurado para calcular os coeficientes de filtragem LP utilizando uma recursão Levinson-Durbin ou o algoritmo Leroux-Gueguen. Noutra implementação, o módulo de análise pode ser configurado para calcular um conjunto de coeficientes cepstrais para cada quadro em vez de um conjunto de coeficientes de filtragem LP. A velocidade de saida do codificador A120 pode ser reduzida significativamente, com um efeito relativamente pequeno na qualidade de reprodução, quantificando os parâmetros de filtragem. Os coeficientes de filtragem de predição linear são difíceis de quantificar de modo eficiente e são habitualmente mapeados numa outra representação, tal como pares espectrais de linha (LSPs) ou frequências espectrais de linha (LSFs), para codificação de quantificação e/ou entropia. No exemplo da FIGURA 6, a transformada 220 de coeficiente de filtragem LP para LSF transforma o conjunto de coeficientes de filtragem LP num correspondente conjunto de LSFs. Outras representações um-para-um de coeficientes de filtragem LP incluem coeficientes parcor; valores registo-área-relação; pares de imitância espectral (ISP); e frequências de imitância espectral (ISF), que são utilizadas no codec AMR-WB (Banda Larga-Multivelocidade-Adaptativa) de GSM (Sistema Global para Comunicações Móveis). Tipicamente uma transformada entre um conjunto de coeficientes de filtragem LP e um correspondente conjunto de LSFs é reversível, mas formas de realização também incluem implementações do codificador A120 nas quais a transformada não é reversível sem erro. 0 quantificador 230 está configurado para quantificar o conjunto de LSFs de banda estreita (ou outra representação de coeficiente), e o codificador A122 de banda estreita está configurado para produzir o resultado desta quantificação como os parâmetros S40 de filtro de banda estreita. Um tal quantificador tipicamente inclui um quantificador de vetor que codifica o vetor de entrada como um índice para uma correspondente entrada de vetor numa tabela ou livro de código.
Como se vê na FIGURA 6, o codificador A122 de banda estreita também gera um sinal residual passando o sinal S20 de banda estreita através um filtro 260 de branqueamento (também chamado um filtro de análise ou de erro de predição) que está configurado de acordo com o conjunto d coeficientes de filtragem. Neste exemplo particular, o filtro 260 de branqueamento é implementado como um filtro FIR, embora também possam ser utilizadas implementações HR. Este sinal residual irá tipicamente conter informação perceptualmente importante do quadro de fala, tal como estrutura de longo prazo relacionada com o tom, que não é representada nos parâmetros S40 de filtro de banda estreita. O quantificador 270 está configurado para calcular uma representação quantificada deste sinal residual para saída como sinal S50 de excitação de banda estreita codificado. Um tal quantificador tipicamente inclui um quantificador de vetor que codifica o vetor de entrada como um índice para uma correspondente entrada de vetor numa tabela ou livro de código. De modo alternativo, um tal quantif icador pode ser configurado para enviar um ou mais parâmetros a partir dos quais o vetor pode ser gerado dinamicamente no descodificador, em vez de recuperado a partir de armazenamento, como num método de livro de código disperso. Um tal método é utilizado em esquemas de codificação tal como CELP (predição linear por excitação de livro de código) algébrica e codecs tais como 3GPP2 (Parceria 2 de Terceira Geração) EVRC (Codec de Velocidade Variável Melhorado). É desejável que o codificador A120 de banda estreita gere o sinal de excitação de banda estreita codificado de acordo com os mesmos valores de parâmetros de filtragem que estarão disponíveis para o correspondente descodificador de banda estreita. Deste modo, o sinal de excitação de banda estreita codificado resultante pode já considerar em alguma extensão condições não ideais nestes valores de parâmetros, tais como erro de quantificação. Em conformidade, é desejável configurar o filtro de branqueamento utilizando os mesmos valores de coeficiente que estarão disponíveis no descodificador. No exemplo básico do codificador A122 como mostrado na FIGURA 6, o quantificador 240 inverso desquantifica os parâmetros S40 de codificação em banda estreita, a transformada 250 do coeficiente de filtragem LSF-para-LP mapeia os valores resultantes de volta para um correspondente conjunto de coeficientes de filtragem LP, e este conjunto de coeficientes é utilizado para configurar o filtro 260 de branqueamento para gerar o sinal residual que é quantificado pelo quantificador 270.
Algumas implementações do codificador A120 de banda estreita são configuradas para calcular o sinal S50 de excitação de banda estreita codificado identificando um entre um conjunto de vetores de livro de código que combina melhor com o sinal residual. Salienta-se, no entanto, que o codificador A120 de banda estreita também pode ser implementado para calcular uma representação quantificada do sinal residual sem realmente gerar o sinal residual. Por exemplo, o codificador A120 de banda estreita pode ser configurado para utilizar um número de vetores de livro de código para gerar correspondentes sinais sintetizados (e. g., de acordo com um corrente conjunto de parâmetros de filtragem), e para selecionar o vetor de livro de código associado ao sinal gerado que combina melhor com o sinal S20 de banda estreita original num domínio perceptualmente ponderado. A FIGURA 7 mostra um diagrama de blocos de uma implementação B112 do descodificador B110 de banda estreita. 0 quantificador 310 inverso desquantifica os parâmetros S40 de filtro de banda estreita (neste caso, para um conjunto de LSFs), e a transformada 320 de coeficiente de filtragem LSF-para-LP transforma os LSFs num conjunto de coeficientes de filtragem (por exemplo, como descrito acima com referência ao quantificador 240 inverso e transformada 250 do codificador A122 de banda estreita) . O quantificador 340 inverso desquantifica o sinal S40 residual de banda estreita para produzir um sinal S80 de excitação de banda estreita. Com base nos coeficientes de filtragem e sinal S80 de excitação de banda estreita, o filtro 330 de síntese de banda estreita sintetiza o sinal S90 de banda estreita. Por outras palavras, o filtro 330 de síntese de banda estreita está configurado para modelar espectralmente o sinal S80 de excitação de banda estreita de acordo com os coeficientes de filtragem desquantifiçados para produzir o sinal S90 de banda estreita. O descodif icador B112 de banda estreita também proporciona o sinal S80 de excitação de banda estreita ao codificador A200 de banda alta, que utiliza aquele para derivar o sinal S120 de excitação de banda alta como aqui descrito. Em algumas implementações como descrito abaixo, o descodificador B110 de banda estreita pode ser configurado para proporcionar informação adicional ao descodificador B200 de banda alta que se refere ao sinal de banda estreita, tal como inclinação espectral, ganho e desfasamento de tom, e modo de fala. 0 sistema do codificador A122 de banda estreita e descodificador B112 de banda estreita é um exemplo básico de um codec de fala análise-por-sintese. A codificação por predição linear por excitação de livro de código (CELP) é uma família popular de codificação análise-por-sintese, e implementações de tais codificadores pode realizar codificação de forma de onda do resíduo, incluindo operações tais como seleção de entradas a partir de livros de código fixos e adaptativos, operações de minimização de erro, e/ou operações de ponderação percetual. Outras implementações de codificação análise-por-sintese incluem predição linear por excitação mista (MELP), CELP algébrica (ACELP), CELP de relaxe (RCELP), excitação por impulso normal (RPE), CELP multi-impulso (MPE), e codificação de predição linear excitada de vetor-soma (VSELP). Métodos de codificação relacionados incluem excitação multi-banda (MBE) e codificação por interpolação de forma de onda protótipo (PWI). Exemplos de codecs de fala análise-por-sintese normalizados incluem o codec ETSI (Instituto Europeu de Normas de Telecomunicações)-3GSM de velocidade máxima (3GSM 06.10), que utiliza predição linear excitada residual (RELP); o codec 3GSM de velocidade máxima melhorado (ETSI-3GSM 06,60); o codificador da norma ITU (União Internacional de Telecomunicações) 11,8 kb/s G.729 Anexo E; os codecs IS (Padrão ínterim)-641 para IS-136 (um esquema de acesso múltiplo por divisão de tempo); os codecs 3GSM adaptativos multivelocidade (3GSM-AMR); e o codec 4GV™ (Vocoder™ de quarta geração) (QUALCOMM Incorporated, San Diego, CA) . O codificador A120 de banda estreita e correspondente descodificador B110 podem ser implementados de acordo com qualquer destas tecnologias, ou qualquer outra tecnologia de codificação de fala (conhecida ou a ser desenvolvida) que represente um sinal de fala como (A) um conjunto de parâmetros que descrevem um filtro e (B) um sinal de excitação utilizado para controlar o filtro descrito para reproduzir um sinal de fala.
Mesmo após o filtro de branqueamento ter removido o envelope espectral qrosseiro do sinal S20 de banda estreita, pode subsistir uma quantidade considerável de estrutura harmónica fina, especialmente para voz falada. A FIGURA 8a mostra um gráfico espectral de um exemplo de um sinal residual, como pode ser produzido por um filtro de branqueamento, para um sinal vocalizado tal como uma vogal. A estrutura periódica visível neste exemplo está relacionada com o tom, e diferentes sons de voz falados pelo mesmo orador podem ter estruturas formantes diferentes, mas estruturas de tom semelhantes. A FIGURA 8b mostra um gráfico do domínio do tempo de um exemplo de um tal sinal residual que mostra uma sequência de impulsos de tom em tempo. A eficiência de codificação e/ou qualidade da fala podem ser aumentadas utilizando um ou mais valores de parâmetros para codificar características da estrutura de tom. Uma característica importante da estrutura de tom é a frequência da primeira harmónica (também chamada a frequência fundamental), que está tipicamente no intervalo de 60 a 400 Hz. Esta característica é tipicamente codificada como o inverso da frequência fundamental, também chamado o desfasamento de tom. O desfasamento de tom indica o número de amostras num período de tom e pode ser codificado como um ou mais índices de livro de código. Os sinais de fala de oradores masculinos tendem a ter maior desfasamento de tom do que sinais de fala de oradores femininos.
Outro sinal caracteristico relacionado com a estrutura de tom é a periodicidade, que indica a resistência da estrutura harmónica ou, por outras palavras, o grau no qual o sinal é harmónico ou não harmónico. Dois indicadores de periodicidade típicos são as funções interseções zero e auto-correlação normalizada (NACFs). A periodicidade também pode ser indicada pelo ganho em tom, que é habitualmente codificado como um ganho de livro de código (e. g., um ganho de livro de código adaptativo quantificado). 0 codificador A120 de banda estreita pode incluir um ou mais módulos configurados para codificar a estrutura harmónica de longo prazo do sinal S20 de banda estreita. Como mostrado na FIGURA 9, um paradigma CELP típico que pode ser utilizado inclui um módulo de análise LPC de ciclo aberto, que codifica as características de curto prazo ou envelope espectral grosseiro, seguido de uma etapa de análise predição de longo prazo de ciclo fechado, que codifica o tom fino ou estrutura harmónica. As características de curto prazo são codificadas como coeficientes de filtragem, e as características de longo prazo são codificadas como valores para parâmetros tal como desfasamento de tom e ganho de tom. Por exemplo, o codificador A120 de banda estreita pode ser configurado para produzir o sinal S50 de excitação de banda estreita codificado numa forma que inclui um ou mais índices de livro de código (e. g., um índice de livro de código fixo e um índice de livro de código adaptativo) e correspondentes valores de ganho. 0 cálculo desta representação quantificada do sinal residual de banda estreita (e. g., pelo quantificador 270) pode incluir selecionar tais índices e calcular tais valores. A codificação da estrutura de tom também pode incluir interpolação de uma forma de onda protótipo de tom, operação que pode incluir calcular uma diferença entre sucessivos impulsos de tom. A modelação da estrutura de longo prazo pode ser desativada para quadros correspondendo a fala não vocalizada, que é tipicamente semelhante a ruído e não estruturada.
Uma implementação do descodificador B110 de banda estreita de acordo com um paradigma como mostrado na FIGURA 9 pode ser configurada para produzir o sinal S80 de excitação de banda estreita para o descodificador B200 de banda alta após a estrutura de longo prazo (tom ou estrutura harmónica) ter sido restaurada. Por exemplo, um tal descodificador pode ser configurado para produzir o sinal S80 de excitação de banda estreita como uma versão desquantifiçada do sinal S50 de excitação de banda estreita codificado. Naturalmente, também é possível implementar o descodificador BllO de banda estreita de tal modo que o descodif icador B200 de banda alta realize a desquantificação do sinal S50 de excitação de banda estreita codificado para obter o sinal S80 de excitação de banda estreita.
Numa implementação do codificador A100 de fala de banda larga de acordo com um paradigma como mostrado na FIGURA 9, o codificador A200 de banda alta pode ser configurado para receber o sinal de excitação de banda estreita como produzido pela análise de curto prazo ou filtro de branqueamento. Por outras palavras, o codificador A120 de banda estreita pode ser configurado para produzir o sinal de excitação de banda estreita para o codificador A200 de banda alta antes codificar a estrutura de longo prazo. É desejável, no entanto, que o codificador A200 de banda alta receba do canal de banda estreita a mesma informação de codificação que será recebida pelo descodificador B200 de banda alta, de tal modo que os parâmetros de codificação produzidos pelo codificador A200 de banda alta já pode considerar em alguma extensão condições não ideais nessa informação. Assim, pode ser preferível que o codificador A200 de banda alta reconstrua o sinal S80 de excitação de banda estreita a partir do mesmo sinal S50 de excitação de banda estreita codificado parametrizado e/ou quantificado a ser produzido pelo codificador A100 de fala de banda larga. Uma vantagem potencial desta abordagem é o cálculo mais preciso dos fatores S60b de ganho de banda alta descritos abaixo.
Além dos parâmetros que caracterizam a estrutura de curto prazo e/ou de longo prazo do sinal S20 de banda estreita, o codificador A120 de banda estreita pode produzir valores de parâmetros que se referem a outras características do sinal S20 de banda estreita. Estes valores, que podem ser quantificados de modo apropriado para saída pelo codificador A100 de fala de banda larga, podem ser incluídos entre os parâmetros S40 de filtro de banda estreita ou produzidos separadamente. 0 codificador A200 de banda alta também pode ser configurado para calcular parâmetros S60 de codificação de banda alta de acordo com um ou mais destes parâmetros adicionais (e. g., após desquantificação). No descodificador B100 de fala de banda larga, o descodificador B200 de banda alta pode ser configurado para receber os valores de parâmetros através do descodificador B110 de banda estreita (e. g., após desquantificação). De modo alternativo, o descodificador B200 de banda alta pode ser configurado para receber (e possivelmente desquantificar) os valores de parâmetros diretamente.
Num exemplo de parâmetros de codificação em banda estreita adicionais, o codificador A120 de banda estreita produz valores para inclinação espectral e parâmetros de modo de fala para cada quadro. A inclinação espectral refere-se à forma do envelope espectral sobre a banda passante e é tipicamente representada pelo primeiro coeficiente de reflexão quantificado. Para a maior parte dos sons vocalizados, a energia espectral diminui com a frequência crescente, de tal modo que o primeiro coeficiente de reflexão é negativo e pode aproximar-se de -1. A maior parte dos sons não vocalizados têm um espectro que é plano, de tal modo que o primeiro coeficiente de reflexão é próximo de zero, ou tem mais energia em altas frequências, de tal modo que o primeiro coeficiente de reflexão é positivo e pode aproximar-se de +1. 0 modo de fala (também chamado modo de voz) indica se o corrente quadro representa fala vocalizada ou não vocalizada. Este parâmetro pode ter um valor binário com base em uma ou mais medições de periodicidade (e. g., interseções zero, NACFs, ganho de tom) e/ou atividade de voz para o quadro, tal como uma relação entre uma tal medição e um valor limiar. Noutras implementações, o parâmetro modo de fala tem um ou mais outros estados para indicar modos tais como silêncio ou ruído de fundo, ou uma transição entre silêncio e voz falada. 0 codificador A200 de banda alta está configurado para codificar o sinal S30 de banda alta de acordo com um modelo filtro-fonte, com a excitação para este filtro sendo baseada no sinal de excitação de banda estreita codificado. A FIGURA 10 mostra um diagrama de blocos de uma implementação A202 do codificador A200 de banda alta que está configurado para produzir uma corrente de parâmetros S60 de codificação de banda alta incluindo parâmetros S60a de filtragem de banda alta e fatores S60b de ganho de banda alta. 0 gerador A300 de excitação de banda alta deriva um sinal S120 de excitação de banda alta a partir do sinal S50 de excitação de banda estreita codificado. 0 módulo A210 de análise produz um conjunto de valores de parâmetros que caracteriza o envelope espectral do sinal S30 de banda alta. Neste exemplo particular, o módulo A210 de análise está configurado para realizar análise LPC para produzir um conjunto de coeficientes de filtragem LP para cada quadro do sinal S30 de banda alta. A transformada 410 de coeficiente de filtragem de predição linear para LSF transforma o conjunto de coeficientes de filtragem LP num correspondente conjunto de LSF. Como observado acima com referência ao módulo 210 de análise e transformada 220, o módulo A210 de análise e/ou transformada 410 podem ser configurados para utilizar outros conjuntos de coeficientes (e. g., coeficientes cepstrais) e/ou representações de coeficientes (e. g., ISPs). O quantificador 420 está configurado para quantificar o conjunto de LSFs de banda alta (ou outra representação de coeficiente, tal como ISPs) , e o codificador A202 de banda alta está configurado para produzir o resultado desta quantificação como os parâmetros S60a de filtragem de banda alta. Um tal quantificador tipicamente inclui um quantificador de vetor que codifica o vetor de entrada como um índice para uma correspondente entrada de vetor numa tabela ou livro de código. O codificador A202 de banda alta também inclui um filtro A220 de síntese configurado para produzir um sinal S130 de banda alta sintetizado de acordo com o sinal S120 de excitação de banda alta e o envelope espectral codificado (e. g., o conjunto de coeficientes de filtragem LP) produzidos pelo módulo A210 de análise. O filtro A220 de síntese é tipicamente implementado como um filtro ITR, embora também possam ser utilizadas implementações FIR. Num exemplo particular, o filtro A220 de síntese é implementado como um filtro autoregressivo linear de sexta ordem. 0 calculador A230 de fator de ganho de banda alta calcula uma ou mais diferenças entre os níveis do sinal S30 de banda alta original e sinal S130 de banda alta sintetizado para especificar um envelope de ganho para o quadro. 0 quantificador 430, que pode ser implementado como um quantif icador de vetor que codifica o vetor de entrada como um índice para uma correspondente entrada de vetor numa tabela ou livro de código, quantifica o valor ou valores especificando o envelope de ganho, e o codificador A202 de banda alta está configurado para produzir o resultado desta quantificação como fatores S60b de ganho de banda alta.
Numa implementação como mostrado na FIGURA 10, o filtro A220 de síntese está disposto para receber os coeficientes de filtragem a partir do módulo A210 de análise. Uma implementação alternativa do codificador A202 de banda alta inclui um quantificador inverso e transformada inversa configurada para descodificar os coeficientes de filtragem a partir dos parâmetros S60a de filtragem de banda alta, e neste caso o filtro A220 de síntese está disposto, em vez disso, para receber os coeficientes de filtragem descodificados. Uma tal disposição alternativa pode suportar cálculo mais preciso do envelope de ganho pelo calculador A230 de ganho de banda alta.
Num exemplo particular, o módulo A210 de análise e calculador A230 de ganho de banda alta produzem um conjunto de seis LSFs e um conjunto de cinco valores de ganho por quadro, respetivamente, de tal modo que uma extensão de banda larga do sinal S20 de banda estreita pode ser obtida com apenas onze valores adicionais por quadro. 0 ouvido tende a ser menos sensivel a erros de frequência em altas frequências, de tal modo que a codificação de banda alta numa ordem LPC baixa pode produzir um sinal tendo uma qualidade percetual comparável para codificação em banda estreita numa ordem LPC mais elevada. Uma implementação típica do codificador A200 de banda alta pode ser configurada para produzir 8 a 12 bits por quadro para reconstrução de alta qualidade do envelope espectral e outros 8 a 12 bits por quadro para reconstrução de alta qualidade do envelope temporal. Noutro exemplo particular, o módulo A210 de análise envia um conjunto de oito LSFs por quadro.
Algumas implementações do codificador A200 de banda alta são configuradas para produzir o sinal S120 de excitação de banda alta gerando um sinal de ruído aleatório tendo componentes de frequência de banda alta e modular em amplitude o sinal de ruído de acordo com o envelope do domínio do tempo do sinal S20 de banda estreita, sinal S80 de excitação de banda estreita, ou sinal S30 de banda alta. Embora um tal método baseado em ruído possa produzir resultados adequados para sons não vocalizados, no entanto, pode não ser desejável para sons vocalizados, cujos resíduos são habitualmente harmónicos e consequentemente têm alguma estrutura periódica. 0 gerador A300 de excitação de banda alta está configurado para gerar um sinal S120 de excitação de banda alta estendendo o espectro do sinal S80 de excitação de banda estreita para dentro do intervalo de frequências de banda alta. A FIGURA 11 mostra um diagrama de blocos de uma implementação A302 do gerador A300 de excitação de banda alta. 0 quantificador 450 inverso está configurado para desquantificar o sinal S50 de excitação de banda estreita codificado para produzir um sinal S80 de excitação de banda estreita. 0 extensor A400 de espectro está configurado para produzir um sinal S160 estendido harmonicamente com base no sinal S80 de excitação de banda estreita. 0 combinador 470 está configurado para combinar um sinal de ruido aleatório gerado pelo gerador 480 de ruido e um envelope do domínio do tempo calculado pelo calculador 460 de envelope para produzir um sinal S170 de ruído modulado. O combinador 490 está configurado para misturar o sinal S60 estendido harmonicamente e o sinal S170 de ruído modulado para produzir o sinal S120 de excitação de banda alta.
Num exemplo, o extensor A400 de espectro está configurado para realizar uma operação de dobragem espectral (também chamada espelhagem) sobre o sinal S80 de excitação de banda estreita para produzir o sinal S160 estendido harmonicamente. A dobragem espectral pode ser realizada preenchendo com zeros o sinal S80 de excitação e aplicando então um filtro passa-alto para reter o alias. Num outro exemplo, o extensor A400 de espectro está configurado para produzir um sinal S160 estendido harmonicamente traduzindo espectralmente o sinal S80 de excitação de banda estreita para banda alta (e. g., através de aumento da velocidade de amostragem seguida pela multiplicação com um sinal cosseno de frequência constante.
Os métodos de dobragem e translação espectral podem produzir sinais estendidos espectralmente cuja estrutura harmónica é descontínua com a estrutura harmónica original do sinal S80 de excitação de banda estreita em fase e/ou frequência. Por exemplo, tais métodos podem produzir sinais tendo picos que não estão geralmente localizados em múltiplos da frequência fundamental, o que pode causar artefactos pouco audíveis no sinal de fala reconstruído. Estes métodos também tendem a produzir harmónicas de alta frequência que têm, artificialmente, fortes características tonais. Além disso, porque um sinal PSTN pode ser amostrado a 8 kHz, mas limitado em banda a não mais do que 3400 Hz, o espectro superior do sinal S80 de excitação de banda estreita pode conter pouca ou nenhuma energia, de tal modo que um sinal estendido gerado de acordo com uma operação de dobragem espectral ou translação espectral pode ter um furo espectral acima de 3400 Hz.
Outros métodos de gerar o sinal S160 estendido harmonicamente incluem identificar uma ou mais frequências fundamentais do sinal S80 de excitação de banda estreita e gerar tons harmónicos de acordo com essa informação. Por exemplo, a estrutura harmónica de um sinal de excitação pode ser caracterizada pela frequência fundamental em conjunto com informação de amplitude e fase. Outra implementação do gerador A300 de excitação de banda alta gera um sinal S160 estendido harmonicamente com base na frequência fundamental e amplitude (como indicado, por exemplo, pelo desfasamento de tom e ganho de tom) . A menos que o sinal estendido harmonicamente seja coerente em fase com o sinal S80 de excitação de banda estreita, no entanto, a qualidade da fala descodificada resultante pode não ser aceitável.
Uma função não linear pode ser utilizada para criar um sinal de excitação em banda alta que seja coerente em fase com a excitação em banda estreita e preserve a estrutura harmónica sem descontinuidade de fase. Uma função não linear também pode proporcionar um nível de ruído aumentado entre harmónicas de alta frequência, o que tende a soar mais natural do que as harmónicas de alta frequência tonal produzidas por métodos tais como dobragem espectral e translação espectral. Funções não lineares sem memória típicas que podem ser aplicadas por diversas implementações do extensor A400 de espectro incluem a função valor absoluto (também chamada retificação de onda completa), retificação de meia-onda, elevação ao quadrado, elevação ao cubo, e recorte. Outras implementações do extensor A400 de espectro podem ser configuradas para aplicar uma função não linear tendo memória.
A FIGURA 12 é um diagrama de blocos de uma implementação A402 do extensor A400 de espectro que está configurado para aplicar uma função não linear para estender o espectro do sinal S80 de excitação de banda estreita. 0 aumentador 510 de velocidade de amostragem está configurado para aumentar a velocidade de amostragem do sinal S80 de excitação de banda estreita. Pode ser desejável aumentar suficientemente a velocidade de amostragem do sinal para minimizar o aliasing após aplicação da função não linear. Num exemplo particular, o aumentador 510 de velocidade de amostragem aumenta a velocidade de amostragem do sinal por um fator de oito. O aumentador 510 de velocidade de amostragem pode ser configurado para realizar a operação de aumento da velocidade de amostragem preenchendo com zeros o sinal de entrada e aplicando filtragem passa-baixo ao resultado. O calculador 520 de função não linear está configurado para aplicar uma função não linear ao sinal com velocidade de amostragem aumentada. Uma vantagem potencial da função valor absoluto sobre outras funções não lineares para extensão espectral, tal como elevação ao quadrado, é que não é necessária a normalização de energia. Em algumas implementações, a função valor absoluto pode ser aplicada de modo eficiente removendo ou apagando o bit de sinal de cada amostra. O calculador 520 de função não linear também pode ser configurado para realizar uma deformação em amplitude do sinal com velocidade de amostragem aumentada ou espectralmente estendido. O redutor 530 de velocidade de amostragem está configurado para reduzir a velocidade de amostragem do resultado espectralmente estendido da aplicação da função não linear. Pode ser desejável que o redutor 530 de velocidade de amostragem realize uma operação de filtragem passa-banda para selecionar uma banda de frequência desejada do sinal espectralmente estendido antes de reduzir a velocidade de amostragem (por exemplo, para reduzir ou evitar aliasing ou corrupção por uma imagem indesejada). Também pode ser desejável que o redutor 530 de velocidade de amostragem reduza a velocidade de amostragem em mais do que uma etapa. A FIGURA 12a é um diagrama que mostra os espectros do sinal em diversos pontos num exemplo de uma operação de extensão espectral, onde a escala de frequência é a mesma ao longo dos diferentes gráficos. O gráfico (a) mostra o espectro de um exemplo de sinal S80 de excitação de banda estreita. O gráfico (b) mostra o espectro após o sinal S80 ter sido amostrado com velocidade aumentada por um fator de oito. O gráfico (c) mostra um exemplo do espectro estendido após aplicação de uma função não linear. O gráfico (d) mostra o espectro após filtragem passa-baixo. Neste exemplo, a banda passante estende-se até ao limite superior de frequência do sinal S30 de banda alta (e. g., 7 kHz ou 8 kHz) . O gráfico (e) mostra o espectro após uma primeira etapa de redução da velocidade de amostragem, na qual a velocidade de amostragem é reduzida por um fator de quatro para obter um sinal de banda larga. 0 gráfico (f) mostra o espectro após uma operação de filtragem passa-alto para selecionar a parte de banda alta do sinal estendido, e o gráfico (g) mostra o espectro após uma segunda etapa de redução da velocidade de amostragem, na qual a velocidade de amostragem é reduzida por um fator de dois. Num exemplo particular, o redutor 530 de velocidade de amostragem realiza a filtragem passa-alto e a segunda etapa de redução da velocidade de amostragem passando o sinal de banda larga através do filtro 130 passa-alto e redutor 140 de velocidade de amostragem do banco A112 de filtros (ou outras estruturas ou rotinas tendo a mesma resposta) para produzir um sinal espectralmente estendido tendo o intervalo de frequências e velocidade de amostragem do sinal S30 de banda alta.
Como pode ver-se no gráfico (g), a redução da velocidade de amostragem do sinal passa-alto mostrada no gráfico (f) causa uma inversão do seu espectro. Neste exemplo, o redutor 530 de velocidade de amostragem também está configurado para realizar uma operação de inversão espectral sobre o sinal. O gráfico (h) mostra um resultado de aplicar a operação de inversão espectral, o que pode ser realizado multiplicando o sinal pela função e^nu ou a sequência (~l)n, cujos valores alternam entre +1 e -1. Uma tal operação é equivalente a deslocar o espectro digital do sinal no domínio da frequência por uma distância de μ.Salienta-se que o mesmo resultado também pode ser obtido aplicando as operações de redução da velocidade de amostragem e inversão espectral numa ordem diferente. As operações de aumento da velocidade de amostragem e/ou redução da velocidade de amostragem também podem ser configuradas para incluir reamostragem para obter um sinal espectralmente estendido tendo a velocidade de amostragem do sinal S30 de banda alta (e. g., 7 kHz) .
Como observado acima, os bancos A110 e B120 de filtros podem ser implementados de tal modo que um ou ambos os sinais S20, S30 de banda estreita e banda alta tem uma forma espectralmente invertida à saida do banco A110 de filtros, é codificado e descodificado na forma espectralmente invertida, e é novamente espectralmente invertida no banco B120 de filtros antes produzida no sinal S110 de fala de banda larga. Em tal caso, naturalmente, uma operação de inversão espectral como mostrado na FIGURA 12a não seria necessária, na medida em que seria desejável que o sinal S120 de excitação de banda alta tivesse igualmente uma forma espectralmente invertida.
As diversas tarefas de aumento da velocidade de amostragem e redução da velocidade de amostragem de uma operação de extensão espectral como realizada pelo extensor A402 de espectro podem ser configuradas e dispostas de muitos modos diferentes. Por exemplo, a FIGURA 12b é um diagrama que mostra os espectros do sinal em diversos pontos em outro exemplo de uma operação de extensão espectral, onde a escala de frequência é a mesma ao longo dos diferentes gráficos. 0 gráfico (a) mostra o espectro de um exemplo de sinal S80 de excitação de banda estreita. 0 gráfico (b) mostra o espectro após o sinal S80 ter sido amostrado com velocidade aumentada por um fator de dois. 0 gráfico (c) mostra um exemplo do espectro estendido após aplicação de uma função não linear. Neste caso, o aliasing que pode ocorrer nas frequências mais elevadas é aceite. 0 gráfico (d) mostra o espectro após uma operação de inversão espectral. 0 gráfico (e) mostra o espectro após uma única etapa de redução da velocidade de amostragem, na qual a velocidade de amostragem é reduzida por um fator de dois para obter o sinal espectralmente estendido desejado. Neste exemplo, o sinal está em forma espectralmente invertida e pode ser utilizado numa implementação do codificador A200 de banda alta que processou o sinal S30 de banda alta numa tal forma. É provável que o sinal espectralmente estendido produzido pelo calculador 520 de função não linear tenha uma queda acentuada em amplitude à medida que a frequência aumenta. O extensor A402 espectral inclui um nivelador 540 espectral configurado para realizar uma operação de branqueamento sobre o sinal com velocidade de amostragem reduzida. O nivelador 540 espectral pode ser configurado para realizar uma operação de branqueamento fixa ou realizar uma operação de branqueamento adaptativa. Num exemplo particular de branqueamento adaptativo, o nivelador 540 espectral inclui um módulo de análise LPC configurado para calcular um conjunto de quatro coeficientes de filtragem a partir do sinal com velocidade de amostragem reduzida e um filtro de análise de quarta ordem configurado para branquear o sinal de acordo com aqueles coeficientes. Outras implementações do extensor A400 de espectro incluem configurações nas quais o nivelador 540 espectral opera sobre o sinal espectralmente estendido antes do redutor 530 de velocidade de amostragem. O gerador A300 de excitação de banda alta pode ser implementado para produzir o sinal S160 estendido harmonicamente como o sinal S120 de excitação de banda alta. Em alguns casos, no entanto, utilizando apenas um sinal estendido harmonicamente como a excitação de banda alta pode resultar em artefactos audíveis. A estrutura harmónica da fala é geralmente menos acentuada na banda alta do que na banda baixa, e utilizar demasiada estrutura harmónica no sinal de excitação em banda alta pode resultar num som semelhante a zumbido. Este artefacto pode ser especialmente percetível em sinais de fala de oradores femininos.
Formas de realização incluem implementações do gerador A300 de excitação de banda alta que são configuradas para misturar o sinal S160 estendido harmonicamente com um sinal de ruído. Como mostrado na FIGURA 11, o gerador A302 de excitação de banda alta inclui um gerador 480 de ruído que está configurado para produzir um sinal de ruído aleatório. Num exemplo, o gerador 480 de ruído está configurado para produzir um sinal de ruído pseudoaleatório branco de variância unitária, embora em outras implementações o sinal de ruído não necessite de ser branco e possa ter uma densidade de potência que varia com a frequência. Pode ser desejável que o gerador 480 de ruído seja configurado para produzir o sinal de ruído como uma função determinística de modo que o seu estado possa ser duplicado no descodificador. Por exemplo, o gerador 480 de ruído pode ser configurado para produzir o sinal de ruído como uma função determinística de informação codificada anteriormente no interior do mesmo quadro, tal como os parâmetros S40 de filtro de banda estreita e/ou o sinal S50 de excitação de banda estreita codificado.
Antes de ser misturado com o sinal S160 estendido harmonicamente, o sinal de ruído aleatório produzido pelo gerador 480 de ruído pode ser modulado em amplitude para ter um envelope do domínio do tempo que aproxima a distribuição de energia ao longo do tempo do sinal S20 de banda estreita, sinal S30 de banda alta, sinal S80 de excitação de banda estreita, ou sinal S160 estendido harmonicamente. Como mostrado na FIGURA 11, o gerador A302 de excitação de banda alta inclui um combinador 470 de ruído configurado para modular em amplitude o sinal de ruído produzido pelo gerador 480 de ruído de acordo com um envelope do domínio do tempo calculado pelo calculador 460 de envelope. Por exemplo, o combinador 470 pode ser implementado como um multiplicador disposto para escalar a saída do gerador 480 de ruído de acordo com o envelope do domínio do tempo calculado pelo calculador 460 de envelope para produzir o sinal S170 de ruído modulado.
Numa implementação A304 do gerador A302 de excitação de banda alta, como mostrado no diagrama de blocos da FIGURA 13, o calculador 460 de envelope está disposto para calcular o envelope do sinal S160 estendido harmonicamente. Numa implementação A306 do gerador A302 de excitação de banda alta, como mostrado no diagrama de blocos da FIGURA 14, o calculador 460 de envelope está disposto para calcular o envelope do sinal S80 de excitação de banda estreita. Outras implementações do gerador A302 de excitação de banda alta podem ser, de outra forma, configuradas para adicionar ruído ao sinal S160 estendido harmonicamente de acordo com localizações dos impulsos de tom de banda estreita no tempo. O calculador 460 de envelope pode ser configurado para realizar um cálculo de envelope como uma tarefa que inclui uma série de subtarefas. A FIGURA 15 mostra um fluxograma de um exemplo T100 de uma tal tarefa. A subtarefa T110 calcula o quadrado de cada amostra do quadro do sinal cujo envelope deve ser modelado (por exemplo, o sinal S80 de excitação de banda estreita ou o sinal S160 estendido harmonicamente) para produzir uma sequência de valores elevados ao quadrado. A subtarefa T120 realiza uma operação de nivelamento sobre a sequência de valores elevados ao quadrado. Num exemplo, a subtarefa T120 aplica um filtro passa-baixo IIR de primeira ordem à sequência de acordo com a expressão y(n) = ax(n) + (l~a)y(n-l), (1) onde x é a entrada do filtro, y é a saida do filtro, n é um indice do domínio do tempo, e a é um coeficiente de nivelamento tendo um valor entre 0,5 e 1. O valor do coeficiente de nivelamento a pode ser fixo ou, numa implementação alternativa, pode ser adaptativo de acordo com uma indicação de ruído no sinal de entrada, de tal modo que a é mais próximo de 1 na ausência de ruído e mais próximo de 0,5 na presença de ruído. A subtarefa ΊΊ30 aplica uma função raiz quadrada a cada amostra da sequência nivelada para produzir o envelope do domínio do tempo.
Uma tal implementação do calculador 460 de envelope pode ser configurada para realizar as diversas subtarefas da tarefa T100, em série e/ou em paralelo. Em outras implementações da tarefa T100, a subtarefa T110 pode ser precedida por uma operação passa-banda configurada para selecionar uma parte de frequência desejado do sinal cujo envelope deve ser modelado, tal como o intervalo de 3-4 kHz. O combinador 490 está configurado para misturar o sinal S160 estendido harmonicamente e o sinal S170 de ruído modulado para produzir o sinal S120 de excitação de banda alta. Implementações do combinador 490 podem ser configuradas, por exemplo, para calcular o sinal S120 de excitação de banda alta como uma soma do sinal S160 estendido harmonicamente e sinal S170 de ruído modulado. Uma tal implementação do combinador 490 pode ser configurada para calcular o sinal S120 de excitação de banda alta como uma soma ponderada, aplicando um fator de ponderação ao sinal S160 estendido harmonicamente e/ou sinal S170 de ruído modulado, antes da adição. Cada um destes fatores de ponderação pode ser calculado de acordo com um ou mais critérios e pode ser um valor fixo ou, de modo alternativo, um valor adaptativo que é calculado numa base quadro-a-quadro ou subquadro-a-subquadro. A FIGURA 16 mostra um diagrama de blocos de uma implementação 492 do combinador 490 que está configurada para calcular o sinal S120 de excitação de banda alta como uma soma ponderada do sinal S160 estendido harmonicamente e sinal S170 de ruído modulado. O combinador 492 está configurado para ponderar o sinal S160 estendido harmonicamente de acordo com um fator S180 de ponderação harmónica para ponderar o sinal S170 de ruído modulado de acordo com o fator S190 de ponderação de ruído, e produzir o sinal S120 de excitação de banda alta como uma soma dos sinais ponderados. Neste exemplo, o combinador 492 inclui um calculador 550 de fator de ponderação que está configurado para calcular o fator S180 de ponderação harmónica e o fator S190 de ponderação de ruído. O calculador 550 de fator de ponderação pode ser configurado para calcular os fatores S180 e S190 de ponderação de acordo com uma relação desejada de conteúdo harmónico por conteúdo de ruído no sinal S120 de excitação de banda alta. Por exemplo, pode ser desejável que o combinador 492 para produzir o sinal S120 de excitação de banda alta tenha uma relação de energia harmónica por energia de ruído semelhante àquela do sinal S30 de banda alta. Em algumas implementações do calculador 550 de fator de ponderação, os fatores S180, S190 de ponderação são calculados de acordo com um ou mais parâmetros relacionados com uma periodicidade do sinal S20 de banda estreita ou do sinal residual de banda estreita, tal como ganho de tom e/ou modo de fala. Uma tal implementação do calculador 550 de fator de ponderação pode ser configurada para atribuir um valor ao fator S180 de ponderação harmónica que é proporcional ao ganho de tom, por exemplo, e/ou atribuir um valor mais elevado ao fator S190 de ponderação de ruido para sinais de fala não vocalizada, do que para sinais voz falada.
Em outras implementações, o calculador 550 de fator de ponderação está configurado para calcular valores para o fator S180 de ponderação harmónica e/ou o fator S190 de ponderação de ruido de acordo com uma medição de periodicidade do sinal S30 de banda alta. Num tal exemplo, o calculador 550 de fator de ponderação calcula o fator S180 de ponderação harmónica como o valor máximo do coeficiente de auto-correlação do sinal S30 de banda alta para o quadro ou subquadro atual, onde a auto-correlação é realizada sobre um intervalo de busca que inclui um atraso de um desfasamento de tom e não inclui um atraso de zero amostras. A FIGURA 17 mostra um exemplo de um tal intervalo de busca de comprimento n amostras que está centrado em redor de um atraso de um desfasamento de tom e tem uma largura não maior do que um desfasamento de tom. A FIGURA 17 também mostra um exemplo de outra abordagem na qual o calculador 550 de fator de ponderação calcula uma medição de periodicidade do sinal S30 de banda alta e várias etapas. Numa primeira etapa, o quadro atual é dividido num número de subquadros, e o atraso para o qual o coeficiente de auto-correlação é máximo é identificado separadamente para cada subquadro. Como mencionado acima, a auto-correlação é realizada sobre um intervalo de busca que inclui um atraso de um desfasamento de tom e não inclui um atraso de zero amostras.
Numa segunda etapa, um quadro retardado é construído aplicando o atraso identificado correspondente a cada subquadro, concatenando os subquadros resultantes para construir um quadro otimamente retardado, e calculando o fator S180 de ponderação harmónica como o coeficiente de correlação entre o quadro original e o quadro otimamente retardado. Numa outra alternativa, o calculador 550 de fator de ponderação calcula o fator S180 de ponderação harmónica como uma média dos coeficientes de auto-correlação máxima obtidos na primeira etapa para cada subquadro. Implementações do calculador 550 de fator de ponderação também podem ser configuradas para escalar o coeficiente de correlação, e/ou combinar este com outro valor, para calcular o valor para o fator S180 de ponderação harmónica.
Pode ser desejável que o calculador 550 de fator de ponderação calcule uma medição de periodicidade do sinal S30 de banda alta apenas em casos onde uma presença de periodicidade na estrutura é, de outra forma, indicada. Por exemplo, o calculador 550 de fator de ponderação pode ser configurado para calcular uma medição de periodicidade do sinal S30 de banda alta de acordo com uma relação entre outro indicador de periodicidade do quadro atual, tal como ganho de tom e um valor limiar. Num exemplo, o calculador 550 de fator de ponderação está configurado para realizar uma operação de auto-correlação sobre o sinal S30 de banda alta apenas se o ganho de tom do quadro (e. g., o ganho do livro de código adaptativo da banda estreita residual) tem um valor de mais de 0,5 (de modo alternativo, pelo menos 0,5) . Num outro exemplo, o calculador 550 de fator de ponderação está configurado para realizar uma operação de auto-correlação sobre o sinal S30 de banda alta apenas para quadros tendo estados particulares de modo de fala (e. g., apenas para sinais vocalizados. Em tais casos, o calculador 550 de fator de ponderação pode ser configurado para atribuir um fator de ponderação por defeito para quadros tendo outros estados de modo de fala e/ou valores menores de ganho de tom.
Formas de realização incluem outras implementações do calculador 550 de fator de ponderação que são configuradas para calcular fatores de ponderação de acordo com caracteristicas além de ou em adição à periodicidade. Por exemplo, uma tal implementação pode ser configurada para atribuir um valor mais alto ao fator S190 de ganho de ruido para sinais de fala tendo um grande desfasamento de tom do que para sinais de fala tendo um pequeno desfasamento de tom. Outra destas implementações do calculador 550 de fator de ponderação está configurada para determinar uma medição de harmonicidade do sinal S10 de fala de banda larga, ou do sinal S30 de banda alta, de acordo com uma medição da energia do sinal em múltiplos da frequência fundamental relativamente à energia do sinal em outros componentes de frequência.
Algumas implementações do codificador A100 de fala de banda larga são configuradas para produzir uma indicação de periodicidade ou harmonicidade (e. g. um indicador de um bit indicando se o quadro é harmónico ou não harmónico) com base no ganho de tom e/ou outra medição de periodicidade ou harmonicidade como aqui descrito. Num exemplo, um correspondente descodificador B100 de fala de banda larga utiliza esta indicação para configurar uma operação tal como o cálculo de fator de ponderação. Num outro exemplo, uma tal indicação é utilizada no codificador e/ou descodificador para calcular um valor para um parâmetro de modo de fala.
Pode ser desejável que o gerador A302 de excitação de banda alta gere o sinal S120 de excitação de banda alta de tal modo que a energia do sinal de excitação não seja substancialmente afetada pelos valores particulares dos fatores S180 e S190 de ponderação. Em tal caso, calculador 550 de fator de ponderação pode ser configurado para calcular um valor para o fator S180 de ponderação harmónica ou para o fator S190 de ponderação de ruído (ou para receber um tal valor a partir de armazenamento ou outro elemento do codificador A200 de banda alta) e para derivar um valor para o outro fator de ponderação de acordo com uma expressão tal como
(2) onde Wharmonlc representa o fator S180 de ponderação harmónica e Wnoise representa o fator SI 90 de ponderação de ruído. De modo alternativo, o calculador 550 de fator de ponderação pode ser configurado para selecionar, de acordo com um valor de uma medição de periodicidade para o quadro ou subquadro atual, um correspondente entre uma pluralidade de pares de fatores S180, S190 de ponderação, onde os pares são pré calculados para satisfazer uma relação constante-energia tal como a expressão (2) . Para uma implementação do calculador 550 de fator de ponderação na qual a expressão (2) é observada, os valores típicos para o fator S180 de ponderação harmónica variam desde cerca de 0,7 até cerca de 1,0, e os valores típicos para o fator S190 de ponderação de ruído variam desde cerca de 0,1 até cerca de 0,7. Outras implementações do calculador 550 de fator de ponderação podem ser configuradas para operar de acordo com uma versão da expressão (2) que é modificada de acordo com uma ponderação inicial desejada entre o sinal S160 estendido harmonicamente e sinal S170 de ruído modulado.
Podem ocorrer artefactos num sinal de fala sintetizado quando um livro de código disperso (um cujas entradas são sobretudo valores zero) tiver sido utilizado para calcular a representação quantificada do resíduo. A dispersão do livro de código ocorre especialmente quando o sinal de banda estreita é codificado a uma baixa velocidade de bits. Artefactos causados por dispersão do livro de código são tipicamente quase periódicos em tempo e ocorrem sobretudo acima de 3 kHz. Porque o ouvido humano tem melhor resolução no tempo a frequências mais elevadas, estes artefactos podem ser mais percetíveis na banda alta. A formas de realização incluem implementações do gerador A300 de excitação de banda alta que são configuradas para realizar filtragem anti-dispersão. A FIGURA 18 mostra um diagrama de blocos de uma implementação A312 do gerador A302 de excitação de banda alta que inclui um filtro 600 anti-dispersão disposto para filtrar o sinal de excitação de banda estreita desquantifiçado produzido pelo quantificador 450 inverso. A FIGURA 19 mostra um diagrama de blocos de uma implementação A314 do gerador A302 de excitação de banda alta que inclui um filtro 600 anti-dispersão disposto para filtrar o sinal espectralmente estendido produzido pelo extensor A400 de espectro. A FIGURA 20 mostra um diagrama de blocos de uma implementação A316 do gerador A302 de excitação de banda alta que inclui um filtro 600 anti-dispersão disposto para filtrar a saída do combinador 490 para produzir o sinal S120 de excitação de banda alta. Naturalmente, implementações do gerador A300 de excitação de banda alta que combinam as características de qualquer das implementações A304 e A306 com as características de qualquer das implementações A312, A314 e A316 são contempladas e pela presente expressamente divulgadas. 0 filtro 600 anti-dispersão também pode ser dispostos no interior do extensor A400 de espectro: por exemplo, após qualquer dos elementos 510, 520, 530, e 540 no extensor A402 de espectro. Salienta-se expressamente que o filtro 600 anti-dispersão também pode ser utilizado com implementações do extensor A400 de espectro que realizam dobragem espectral, translação espectral, ou extensão harmónica. O filtro 600 anti-dispersão pode ser configurado para alterar a fase do seu sinal de entrada. Por exemplo, pode ser desejável que o filtro 600 anti-dispersão seja configurado e disposto de tal modo que a fase do sinal S120 de excitação de banda alta seja aleatória ou, de outra forma, distribuída de modo mais regular, ao longo do tempo. Também pode ser desejável que a resposta de um filtro 600 anti-dispersão seja espectralmente plana, de modo a que o espectro de magnitude do sinal filtrado não seja sensivelmente modificado. Num exemplo, o filtro 600 anti-dispersão é implementado como um filtro passa-tudo tendo uma função de transferência de acordo com a seguinte expressão:
(3).
Um efeito de um tal filtro pode ser dispersar a energia do sinal de entrada de modo a que já não esteja concentrada apenas numas poucas amostras.
Artefactos causados por dispersão do livro de código são habitualmente mais percetíveis para sinais semelhantes a ruído, onde o resíduo inclui menos informação de tom, e também para fala em ruído de fundo. A dispersão tipicamente causa menos artefactos em casos onde a excitação tem estrutura de longo prazo e realmente a modificação de fase pode causar ruido em sinais vocalizados. Assim pode ser desejável configurar o filtro 600 anti-dispersão para filtrar sinais não vocalizados e passar, pelo menos, alguns sinais vocalizados sem alteração. Sinais não vocalizados são caracterizados por um reduzido ganho de tom (e. g. ganho de livro de código adaptativo de banda estreita quantificado) e uma inclinação espectral (e. g. primeiro coeficiente de reflexão quantificado) que é próximo de zero ou positivo, indicando um envelope espectral que é plano ou inclinado para cima com frequência crescente. Implementações típicas de um-filtro 600 anti-dispersão são configuradas para filtrar sons não vocalizados (e. g., como indicado pelo valor da inclinação espectral) , para filtrar sons vocalizados quando o ganho de tom está abaixo de um valor limiar (de modo alternativo, não maior do que o valor limiar) , e de outra forma para passar o sinal sem alteração.
Além disso implementações de filtro 600 anti-dispersão incluem dois ou mais filtros que são configurados para ter diferentes ângulos máximos de modificação de fase (e. g., até 180 graus) . Em tal caso, o filtro 600 anti-dispersão pode ser configurado para selecionar entre estes filtros componentes de acordo com um valor do ganho de tom (e. g., o livro de código adaptativo quantificado ou ganho LTP) , de modo a que um maior ângulo máximo de modificação de fase seja utilizado para quadros tendo valores inferiores de ganho de tom. Uma implementação de um filtro 600 anti-dispersão também pode incluir diferentes filtros componentes que são configurados para modificar a fase sobre mais ou menos do espectro de frequência, de tal modo que um filtro configurado para modificar a fase sobre um mais largo intervalo de frequências do sinal de entrada é utilizado para quadros tendo valores inferiores de ganho de tom.
Para reprodução precisa do sinal de fala codificado, pode ser desejável que a relação entre os níveis das partes de banda alta e de banda estreita do sinal S100 de fala de banda larga sintetizado seja semelhante àquela no sinal S10 de fala de banda larga original. Além de um envelope espectral como representado pelos parâmetros S60a de codificação de banda alta, o codificador A200 de banda alta pode ser configurado para caracterizar o sinal S30 de banda alta especificando um envelope temporal ou de ganho. Como mostrado na FIGURA 10, o codificador A202 de banda alta inclui um calculador A230 de fator de ganho de banda alta que está configurado e disposto para calcular um ou mais fatores de ganho de acordo com uma relação entre o sinal S30 de banda alta e o sinal S130 de banda alta sintetizado, tal como uma diferença ou relação entre as energias dos dois sinais sobre um quadro ou alguma parte deste. Em outras implementações do codificador A202 de banda alta, o calculador A230 de ganho de banda alta pode ser configurado de igual modo mas, em vez disso, disposto para calcular o envelope de ganho de acordo com uma tal relação variável no tempo entre o sinal S30 de banda alta e o sinal S80 de excitação de banda estreita ou sinal S120 de excitação de banda alta.
Os envelopes temporais do sinal S80 de excitação de banda estreita e sinal S30 de banda alta são provavelmente semelhantes. Consequentemente, codificar um envelope de ganho que é baseado numa relação entre o sinal S30 de banda alta e o sinal S80 de excitação de banda estreita (ou um sinal derivado daquele, tal como o sinal S120 de excitação de banda alta ou o sinal S130 de banda alta sintetizado) em geral será mais eficiente do que codificar um envelope de ganho com base apenas no sinal S30 de banda alta. Numa implementação típica, o codificador A202 de banda alta está configurado para produzir um índice quantificado de oito por doze bits que especifica cinco fatores de ganho para cada quadro. 0 calculador A230 de fator de ganho de banda alta pode ser configurado para realizar um cálculo de fator de ganho como uma tarefa que inclui uma ou mais séries de subtarefas. A FIGURA 21 mostra um fluxograma de um exemplo T200 de uma tal tarefa que calcula um valor de ganho para um subquadro correspondente de acordo com as energias relativas do sinal S30 de banda alta e o sinal S130 de banda alta sintetizado. As tarefas 220a e 220b calculam as energias dos subquadros correspondentes dos respetivos sinais. Por exemplo, as tarefas 220a e 220b podem ser configuradas para calcular a energia como uma soma dos quadrados das amostras do respetivo subquadro. A tarefa T230 calcula um fator de ganho para o subquadro como a raiz quadrada da relação dessas energias. Neste exemplo, a tarefa T230 calcula o fator de ganho como a raiz quadrada da relação da energia do sinal S30 de banda alta pela energia do sinal S130 de banda alta sintetizado sobre o subquadro.
Pode ser desejável que o calculador A230 de fator de ganho de banda alta seja configurado para calcular as energias do subquadro de acordo com uma função janela. A FIGURA 22 mostra um fluxograma de uma tal implementação T210 da tarefa T200 de cálculo de fator de ganho. A tarefa T215a aplica uma função janela ao sinal S30 de banda alta, e a tarefa T215b aplica a mesma função janela ao sinal S130 de banda alta sintetizado. Implementações 222a e 222b das tarefas 220a e 220b calculam as energias e respetivas janelas e a tarefa T230 calcula um fator de ganho para o subquadro como a raiz quadrada da relação das energias.
Pode ser desejável aplicar uma função janela que recubra subquadros adjacentes. Por exemplo, uma função janela que produza fatores de ganho que possam ser aplicados num modo sobreposição-adição pode ajudar a reduzir ou evitar descontinuidade entre subquadros. Num exemplo, o calculador A230 de fator de ganho de banda alta está configurado para aplicar uma função janela trapezoidal como mostrado na FIGURA 23a, na qual a janela recobre cada um dos dois subquadros adjacentes por um milissegundo. A FIGURA 23b mostra uma aplicação desta função janela a cada um dos cinco subquadros de um quadro de 2 0 milissegundos. Outras implementações do calculador A230 de fator de ganho de banda alta podem ser configuradas para aplicar funções janela tendo diferentes períodos de sobreposição e/ou diferentes formas de janela (e. g. , retangulares, Hamming) que podem ser simétricas ou assimétricas. Também é possível que uma implementação do calculador A230 de fator de ganho de banda alta seja configurada para aplicar diferentes funções janela a diferentes subquadros no interior de um quadro e/ou que um quadro inclua subquadros de diferentes comprimentos.
Sem limitação, os valores seguintes são apresentados como exemplos para implementações particulares. Pressupõe-se um quadro de 20 ms para estes casos, embora possa ser utilizada qualquer outra duração. Para um sinal de banda alta amostrado a 7 kHz, cada quadro tem 140 amostras. Se um tal quadro é dividido em cinco subquadros de igual comprimento, cada subquadro terá 28 amostras, e a janela como mostrado na Figura 23a terá 42 amostras de largura. Para um sinal de banda alta amostrado a 8 kHz, cada quadro tem 160 amostras. Se um tal quadro é dividido em cinco subquadros de igual comprimento, cada subquadro terá 32 amostras, e a janela como mostrado na FIGURA 23a terá 48 amostras de largura. Em outras implementações, podem ser utilizados subquadros de qualquer largura, e é mesmo possível que uma implementação do calculador A230 de ganho de banda alta seja configurada para produzir um fator de ganho diferente para cada amostra de um quadro. A FIGURA 24 mostra um diagrama de blocos de uma implementação B202 do descodificador B200 de banda alta. O descodificador B202 de banda alta inclui um gerador B300 de excitação de banda alta que está configurado para produzir o sinal S120 de excitação de banda alta com base no sinal S80 de excitação de banda estreita. Dependendo das escolhas de conceção do sistema particular, o gerador B300 de excitação de banda alta pode ser implementado de acordo com qualquer das implementações do gerador A300 de excitação de banda alta como aqui descrito. Tipicamente é desejável implementar gerador B300 de excitação de banda alta para ter a mesma resposta que o gerador de excitação de banda alta do codificador de banda alta do sistema de codificação particular. Porque o descodificador B110 de banda estreita realizará tipicamente desquantificação do sinal S50 de excitação de banda estreita codificado, no entanto, na maior parte dos casos o gerador B300 de excitação de banda alta pode ser implementado para receber o sinal S80 de excitação de banda estreita a partir do descodificador B110 de banda estreita e não necessita de incluir um quantificador inverso configurado para desquantificar o sinal S50 de excitação de banda estreita codificado. Também é possível que o descodificador B110 de banda estreita seja implementado para incluir uma instância de um filtro 600 anti-dispersão dispostos para filtrar the sinal de excitação de banda estreita desquantifiçado antes de ser introduzido num filtro de sintese de banda estreita tal como o filtro 330. O quantificador 560 inverso está configurado para desquantificar os parâmetros S60a de filtragem de banda alta (neste exemplo, para um conjunto de LSFs), e uma transformada 570 de coeficiente de filtragem LSF-para-LP está configurada para transformar os LSFs num conjunto de coeficientes de filtragem (por exemplo, como descrito acima com referência ao quantificador 240 inverso e transformada 250 do codificador A122 de banda estreita). Em outras implementações, como mencionado acima, podem ser utilizados conjuntos de coeficientes diferentes (e. g., coeficientes cepstrais) e/ou representações de coeficientes (e. g., ISPs) . O filtro B200 de sintese de banda alta está configurado para produzir um sinal de banda alta sintetizado de acordo com o sinal S120 de excitação de banda alta e o conjunto de coeficientes de filtragem. Para um sistema no qual o codificador de banda alta inclui um filtro de sintese (e. g., como no exemplo do codificador A202 descrito acima), pode ser desejável implementar o filtro B200 de sintese de banda alta para ter a mesma resposta (e. g., a mesma função de transferência) que esse filtro de sintese. O descodificador B202 de banda alta também inclui um quantificador 580 inverso configurado para desquantificar fatores S60b de ganho de banda alta, e um elemento 590 de controlo de ganho (e. g., um multiplicador ou amplificador) configurado e disposto para aplicar os fatores de ganho desquantifiçados ao sinal de banda alta sintetizado para produzir o sinal S100 de banda alta. Para um caso em que o envelope de ganho de um quadro é especificado por mais do que um fator de ganho, o elemento 590 de controlo de ganho pode incluir lógica configurada para aplicar os fatores de ganho aos respetivos subquadros, possivelmente de acordo com uma função janela que pode ser a mesma função janela ou uma diferente como aplicada por um calculador de ganho (e. g., calculador A230 de ganho de banda alta) do correspondente codificador de banda alta. Em outras implementações do descodificador B202 de banda alta, o elemento 590 de controlo de ganho está configurado de modo semelhante, mas, em vez disso, está disposto para aplicar os fatores de ganho desquantifiçados ao sinal S80 de excitação de banda estreita ou ao sinal S120 de excitação de banda alta.
Como mencionado acima, pode ser desejável obter o mesmo estado no codificador de banda alta e descodificador de banda alta (e. g., utilizando valores desquantifiçados durante a codificação). Assim, pode ser desejável num sistema de codificação de acordo com uma tal implementação, assegurar o mesmo estado para os correspondentes geradores de ruido nos geradores A300 e B300 de excitação de banda alta. Por exemplo, os geradores A300 e B300 de excitação de banda alta de uma tal implementação podem ser configurados de modo a que o estado do gerador de ruido seja uma função deterministica de informação já codificada no interior do mesmo quadro, (e. g. , os parâmetros S40 de filtro de banda estreita ou uma parte destes e/ou o sinal S50 de excitação de banda estreita codificado ou uma parte deste.
Um ou mais dos quantificadores dos elementos descritos aqui (e. g. , quantif icador 230, 420, ou 430) pode ser configurado para realizar quantificação de vetores classificados. Por exemplo, um tal quantificador pode ser configurado para selecionar um de um conjunto de livros de código com base em informação que já foi codificada no interior do mesmo quadro no canal de banda estreita e/ou no canal de banda alta. Uma tal técnica tipicamente proporciona eficiência de codificação aumentada à custa de armazenamento adicional de livro de código.
Como discutido acima com referência, e. g., às FIGURAS 8 e 9, uma quantidade considerável de estrutura periódica pode subsistir no sinal residual após remoção do envelope espectral grosseiro do sinal S20 de fala de banda estreita. Por exemplo, o sinal residual pode conter uma sequência de impulsos ou picos aproximadamente periódicos ao longo do tempo. Tal estrutura, que está tipicamente relacionada com tom, é especialmente provável de ocorrer em sinais de voz falada. 0 cálculo de uma representação quantificada do sinal residual de banda estreita pode incluir codificação desta estrutura de tom de acordo com um modelo de periodicidade de longo prazo como representado, por exemplo, por um ou mais livros de código. A estrutura de tom de um sinal residual real pode não corresponder exatamente ao modelo de periodicidade. Por exemplo, o sinal residual pode incluir pequenas perturbações na regularidade das localizações dos impulsos de tom, de tal modo que as distâncias entre sucessivos impulsos de tom num quadro não são exatamente iguais e a estrutura é não totalmente regular. Estas irregularidades tendem a reduzir a eficiência de codificação.
Algumas implementações do codificador A120 de banda estreita são configuradas para realizar uma regularização da estrutura de tom aplicando uma deformação adaptativa do tempo ao resíduo antes ou durante a quantificação, ou de outra forma incluindo uma deformação adaptativa do tempo no sinal de excitação codificado. Por exemplo, um tal codificador pode ser configurado para selecionar ou de outra forma calcular um grau de deformação no tempo (e. g., de acordo com um ou mais critérios de ponderação percetual e/ou de minimização de erro) de tal modo que o sinal de excitação resultante ajusta-se otimamente ao modelo de periodicidade de longo prazo. A regularização da estrutura de tom é realizada por um subconjunto de codificadores CELP chamados codificadores de Predição Linear Excitada por Código de Relaxamento (RCELP).
Um codificador RCELP está tipicamente configurado para realizar a deformação no tempo como um deslocamento adaptativo de tempo. Este deslocamento de tempo pode ser um atraso variando de uns poucos milissegundos negativos até uns poucos milissegundos positivos, e é habitualmente variado gradualmente para evitar descontinuidades audiveis. Em algumas implementações, um tal codificador está configurado para aplicar a regularização num modo definido por segmentos, em que cada quadro ou subquadro é deformado por um correspondente deslocamento fixo de tempo. Em outras implementações, o codificador está configurado para aplicar a regularização como uma função de deformação continua, de modo a que um quadro ou subquadro seja deformado de acordo com um perfil de tom (também chamado uma trajetória de tom) . Em alguns casos (e. g., como descrito no Pedido de Patente Publicado US 2004/0098255), o codificador está configurado para incluir uma deformação no tempo no sinal de excitação codificado aplicando o deslocamento a um sinal de entrada perceptualmente ponderado que é utilizado para calcular o sinal de excitação codificado. 0 codificador calcula um sinal de excitação codificado que é regularizado e quantificado, e o descodificador desquantifica o sinal de excitação codificado para obter um sinal de excitação que é utilizado para sintetizar o sinal de fala descodificado. 0 sinal de saida descodificado apresenta assim o mesmo atraso variável que foi incluído no sinal de excitação codificado pela regularização. Tipicamente, nenhuma informação especificando as quantidades de regularização é transmitida ao descodificador. A regularização tende a tornar o sinal residual mais fácil de codificar, o que melhora o ganho de codificação a partir do prognosticador de longo prazo e assim aumenta a eficiência de codificação global, geralmente sem gerar artefactos. Pode ser desejável realizar regularização apenas sobre quadros que são vocalizados. Por exemplo, o codificador A124 de banda estreita pode ser configurado para deslocar apenas aqueles quadros ou subquadros tendo uma estrutura de longo prazo, tais como sinais vocalizados. Pode mesmo ser desejável realizar regularização apenas sobre subquadros que incluem energia de impulso de tom. Diversas implementações de codificação RCELP são descritas nas Patentes US N° 5704003 (Kleijn et al.) e 6879955 (Rao) e no Pedido de Patente Publicado US 2004/0098255 (Kovesi et al.). Implementações existentes de codificadores RCELP incluem o Codec de Velocidade Variável Melhorado (EVRC), como descrito na Associação da Indústria de Telecomunicações (TIA) IS-127, e o Projeto 2 de Parceria de Terceira Geração (3GPP2) Vocoder de Modo Selecionável (SMV).
Infelizmente, a regularização pode causar problemas para um codificador de fala de banda larga no qual a excitação de banda alta é derivada do sinal de excitação de banda estreita codificado (tal como um sistema incluindo o codificador A100 de fala de banda larga e o descodificador B100 de fala de banda larga). Devido à sua derivação de um sinal deformado no tempo, o sinal de excitação em banda alta terá geralmente um perfil de tempo que é diferente do sinal de fala banda alta original. Por outras palavras, o sinal de excitação em banda alta já não será síncrono com o sinal de fala de banda alta original.
Um desalinhamento em tempo entre o sinal de excitação em banda alta deformado e o sinal de fala de banda alta original pode causar vários problemas. Por exemplo, o sinal de excitação em banda alta deformado pode já não proporcionar uma fonte de excitação adequada para um filtro de síntese que está configurado de acordo com os parâmetros de filtragem extraídos do sinal de fala de banda alta original. Como resultado, o sinal de banda alta sintetizado pode conter artefactos audíveis que reduzem a qualidade percecionada do sinal de fala de banda larga descodificado. 0 desalinhamento em tempo também pode causar ineficiências na codificação do envelope de ganho. Como mencionado acima, é provável que exista uma correlação entre os envelopes temporais do sinal S80 de excitação de banda estreita e sinal S30 de banda alta. Codificando o envelope de ganho do sinal de banda alta de acordo com uma relação entre estes dois envelopes temporais, pode ser obtido um aumento em eficiência de codificação quando comparada com codificar diretamente o envelope de ganho. Quando o sinal de excitação de banda estreita codificado é regularizado, no entanto, esta correlação pode ser enfraquecida. 0 desalinhamento em tempo entre o sinal S80 de excitação de banda estreita e o sinal S30 de banda alta pode fazer aparecer flutuações em fatores S60b de ganho de banda alta, e a eficiência de codificação pode cair. A formas de realização incluem métodos de codificação de fala de banda larga que realizam deformação no tempo de um sinal de fala de banda alta de acordo com uma deformação no tempo incluída num correspondente sinal de excitação de banda estreita codificado. Vantagens potenciais de tais métodos incluem melhorar a qualidade de um sinal de fala de banda larga descodificado e/ou melhorar a eficiência de codificação de um envelope de ganho de banda alta. A FIGURA 25 mostra um diagrama de blocos de uma implementação ADIO do codificador A100 de fala de banda larga. 0 codificador ADIO inclui uma implementação A124 do codificador A120 de banda estreita que está configurada para realizar regularização durante o cálculo do sinal S50 de excitação de banda estreita codificado. Por exemplo, o codificador A124 de banda estreita pode ser configurado de acordo com uma ou mais das implementações RCELP discutidas acima. 0 codificador A124 de banda estreita também está configurado para produzir um sinal SD10 de dados de regularização que especifica o grau de deformação no tempo aplicado. Para diversos casos nos quais o codificador A124 de banda estreita está configurado para aplicar um deslocamento fixo de tempo a cada quadro ou subquadro, o sinal SD10 de dados de regularização pode incluir uma série de valores indicando cada quantidade de deslocamento de tempo como um valor inteiro ou não inteiro em termos de amostras, milissegundos, ou algum outro incremento de tempo. Para um caso no qual o codificador A124 de banda estreita está configurado para, de outra forma, modificar a escala de tempo de um quadro ou outra sequência de amostras (e. g. , comprimindo uma parte e expandindo outra parte), o sinal SD10 de regularização de informação pode incluir uma correspondente descrição da modificação, tal como um conjunto de parâmetros de função. Num exemplo particular, o codificador A124 de banda estreita está configurado para dividir um quadro em três subquadros e para calcular um deslocamento fixo de tempo para cada subquadro, de modo a que o sinal SD10 de dados de regularização indique três quantidades de deslocamento de tempo para cada quadro regularizado do sinal de banda estreita codificado. 0 codificador ADIO de fala de banda larga inclui uma linha D120 de atraso configurada para adiantar ou retardar partes do sinal S30 de fala de banda alta, de acordo com quantidades de atraso indicadas por um sinal de entrada, para produzir o sinal S30 de fala de banda alta deformado no tempo. No exemplo mostrado na FIGURA 25, a linha D120 de atraso está configurada para deformar no tempo o sinal S30 de fala de banda alta de acordo com a deformação indicada pelo sinal SD10 de dados de regularização. Deste modo, a mesma quantidade de deformação no tempo que estava incluída no sinal S50 de excitação de banda estreita codificado também é aplicada à parte correspondente do sinal S30 de fala de banda alta antes da análise. Embora este exemplo mostre a linha D120 de atraso como um elemento separado do codificador A200 de banda alta, em outras implementações a linha D120 de atraso está disposta como parte do codificador de banda alta.
Outras implementações do codificador A200 de banda alta podem ser configuradas para realizar análise espectral (e. g., análise LPC) do sinal S30 de fala de banda alta não deformado e para realizar deformação no tempo do sinal S30 de fala de banda alta antes do cálculo dos parâmetros S60b de ganho de banda alta. Um tal codificador pode incluir, por exemplo, uma implementação da linha D120 de atraso disposta para realizar a deformação no tempo. Em tais casos, no entanto, os parâmetros S60a de filtragem de banda alta com base na análise do sinal S30 não deformado podem descrever um envelope espectral que está desalinhado no tempo com o sinal S120 de excitação de banda alta. A linha D120 de atraso pode ser configurada de acordo com qualquer combinação de elementos lógicos e elementos de armazenamento adequados para aplicar as desejadas operações de deformação no tempo ao sinal S30 de fala de banda alta. Por exemplo, a linha D120 de atraso pode ser configurada para ler o sinal S30 de fala de banda alta a partir de uma zona de armazenamento temporário de acordo com os deslocamentos de tempo desejados. A FIGURA 26a mostra um diagrama esquemático de uma tal implementação D122 da linha D120 de atraso que inclui o registo SRl de deslocamento. 0 registo SRl de deslocamento é uma zona de armazenamento temporário de algum comprimento m que está configurado para receber e armazenar as m amostras mais recentes do sinal S30 de fala de banda alta. 0 valor m é igual a, pelo menos, a soma dos deslocamentos de tempo máximo positivo (ou "avanço") e negativo (ou "atraso") a ser suportados. Pode ser conveniente que o valor m seja igual ao comprimento de um quadro ou subquadro do sinal S30 de banda alta. A linha D122 de atraso está configurada para produzir o sinal S30a de banda alta deformado no tempo a partir de uma localização OL de desfasamento do registo SRl de deslocamento. A posição da localização OL de desfasamento varia em redor de uma posição de referência (zero deslocamento de tempo) de acordo com a deslocamento de tempo atual como indicado, por exemplo, pelo sinal SD10 de dados de regularização. A linha D122 de atraso pode ser configurada para suportar limites de avanço e atraso iguais ou, de modo alternativo, um limite maior do que o outro de modo a que um deslocamento maior possa ser realizado numa direção do que na outra. A FIGURA 26a mostra um exemplo particular que suporta um maior deslocamento de tempo positivo do que negativo. A linha D122 de atraso pode ser configurada para produzir uma ou mais amostras de cada vez (dependendo de uma largura do barramento de saída, por exemplo).
Um deslocamento de tempo de regularização tendo uma magnitude de mais de uns poucos milissegundos pode causar artefactos audíveis no sinal descodificado. Tipicamente, a magnitude de um deslocamento de tempo de regularização como realizado por um codificador A124 de banda estreita não excederá uns poucos milissegundos, de tal modo que os deslocamentos de tempo indicados pelo sinal SD10 de dados de regularização serão limitados. No entanto, pode ser desejado em tais casos que a linha de atraso D122 esteja configurada para impor um limite máximo nos deslocamentos de tempo na direção positiva e/ou negativa (por exemplo, para observar um limite mais apertado do que o imposto pelo codificador de banda estreita). A FIGURA 26b mostra um diagrama esquemático de uma tal implementação D124 da linha D122 de atraso que inclui uma janela SW de deslocamento. Neste exemplo, a posição da localização OL de desfasamento está limitada pela janela SW de deslocamento. Embora a FIGURA 26b mostre um caso no qual o comprimento m da zona de armazenamento temporário é maior do que a largura da janela SW de deslocamento, a linha D124 de atraso também pode ser implementada de tal modo que a largura da janela SW de deslocamento seja igual a m.
Em outras implementações, a linha D120 de atraso está configurada para escrever o sinal S30 de fala de banda alta numa zona de armazenamento temporário de acordo com os deslocamentos de tempo desejados. A FIGURA 27 mostra um diagrama esquemático de uma tal implementação D130 da linha D120 de atraso que inclui dois registos SR2 e SR3 de deslocamento configurados para receber e armazenar o sinal S30 de fala de banda alta. A linha D130 de atraso está configurada para escrever um quadro ou subquadro do registo SR2 de deslocamento para o registo SR3 de deslocamento de acordo com um deslocamento de tempo como indicado, por exemplo, pelo sinal SD10 de dados de regularização. 0 registo SR3 de deslocamento está configurado como uma zona de armazenamento temporário FIFO disposta para produzir o sinal S30 de banda alta deformado no tempo.
No exemplo particular mostrado na Figura 27, o registo SR2 de deslocamento inclui uma parte FBI de zona de armazenamento temporário de quadro e uma parte DB de zona de armazenamento temporário de atraso, e o registo SR3 de deslocamento inclui uma parte FB2 de zona de armazenamento temporário de quadro, uma parte AB de zona de armazenamento temporário de avanço, e uma parte RB de zona de armazenamento temporário de atraso. Os comprimentos da zona AB de armazenamento temporário de avanço e zona RB de armazenamento temporário de atraso podem ser iguais ou um pode ser maior do que o outro, de modo a que possa ser suportado um deslocamento maior numa direção do que na outra. A zona DB de armazenamento temporário de atraso e a parte RB de zona de armazenamento temporário de atraso podem ser configuradas para ter o mesmo comprimento. De modo alternativo, a zona DB de armazenamento temporário de atraso pode ser mais curta do que a zona RB de armazenamento temporário de atraso, para levar em consideração um intervalo de tempo requerido para transferir amostras da zona FBI de armazenamento temporário de quadro para o registo SR3 de deslocamento, o qual pode incluir outras operações de processamento tais como deformação das amostras antes de armazenamento no registo SR3 de deslocamento.
No exemplo da FIGURA 27, a zona FBI de armazenamento temporário de quadro está configurada para ter um comprimento igual àquele de um quadro do sinal S30 de banda alta. Num outro exemplo, a zona FBI de armazenamento temporário de quadro está configurada para ter um comprimento igual àquele de um subquadro do sinal S30 de banda alta. Em tal caso, a linha D130 de atraso pode ser configurada para incluir lógica para aplicar o mesmo atraso (e. g. , uma média) a todos os subquadros de um quadro a ser deslocado. A linha D130 de atraso também pode incluir lógica para valores médios da zona FBI de armazenamento temporário de quadro com valores a serem substituídos na zona RB de armazenamento temporário de atraso ou zona AB de armazenamento temporário de avanço. Num outro exemplo, o registo SR3 de deslocamento pode ser configurado para receber valores do sinal S30 de banda alta apenas através da zona FBI de armazenamento temporário de quadro e, neste caso, a linha D130 de atraso pode incluir lógica para interpolar através de lacunas entre sucessivos quadros ou subquadros escritos no registo SR3 de deslocamento. Em outras implementações, a linha D130 de atraso pode ser configurada para realizar uma operação de deformação sobre amostras da zona FBI de armazenamento temporário de quadro antes de escrever aquelas no registo SR3 de deslocamento (e. g., de acordo com uma função descrita pelo sinal SD10 de dados de regularização).
Pode ser desejável que a linha D120 de atraso aplique uma deformação no tempo que é baseada na, mas não é idêntica à deformação especificada pelo sinal SD10 de dados de regularização. A FIGURA 28 mostra um diagrama de blocos de uma implementação AD12 do codificador ADIO de fala de banda larga que inclui um mapeador D110 de valores de atraso. 0 mapeador D110 de valores de atraso está configurado para mapear a deformação indicada pelo sinal SD10 de dados de regularização em valores SDlOa de atraso mapeados. A linha D120 de atraso está disposta para produzir o sinal S30a de fala de banda alta deformado no tempo de acordo com a deformação indicada por valores SDlOa de atraso mapeados. É expectável que o deslocamento de tempo aplicado pelo codificador de banda estreita evolua gradualmente ao longo do tempo. Consequentemente, é tipicamente suficiente computar o deslocamento de tempo de banda estreita médio aplicado aos subquadros durante um quadro de fala, e deslocar um correspondente quadro do sinal S30 de fala de banda alta de acordo com esta média. Num tal exemplo, o mapeador D110 de valores de atraso está configurado para calcular uma média dos valores de atraso de subquadro para cada quadro, e a linha D120 de atraso é configurada para aplicar a média calculada a um correspondente quadro do sinal S30 de banda alta. Noutros exemplos, uma média sobre um período mais curto (tal como dois subquadros, ou metade de um quadro) ou um período mais longo (tal como dois quadros) pode ser calculada e aplicada. Num caso onde a média é um valor não inteiro de amostras, o mapeador D110 de valores de atraso pode ser configurado para arredondar o valor para um número inteiro de amostras antes produzir este para a linha D120 de atraso. 0 codificador Α124 de banda estreita pode ser configurado para incluir um deslocamento de tempo de regularização de um número não inteiro de amostras no sinal de excitação de banda estreita codificado. Num caso como este, pode ser desejável que o mapeador D110 de valores de atraso seja configurado para arredondar o deslocamento de tempo de banda estreita para um número inteiro de amostras e que a linha D120 de atraso aplique o deslocamento de tempo arredondado ao sinal S30 de fala de banda alta.
Em algumas implementações do codificador ADIO de fala de banda larga, as velocidades de amostragem do sinal S20 de fala de banda estreita e do sinal S30 de fala de banda alta podem diferir. Em tais casos, o mapeador D110 de valores de atraso pode ser configurado para ajustar as quantidades de deslocamento de tempo indicadas no sinal SD10 de dados de regularização para levar em consideração uma diferença entre as velocidades de amostragem do sinal S20 de fala de banda estreita (ou sinal S80 de excitação de banda estreita) e o sinal S30 de fala de banda alta. Por exemplo, o mapeador D110 de valores de atraso pode ser configurado para escalar as quantidades de deslocamento de tempo de acordo com uma relação das velocidades de amostragem. Num exemplo particular como mencionado acima, o sinal S20 de fala de banda estreita é amostrado a 8 kHz, e o sinal S30 de fala de banda alta é amostrado a 7 kHz. Neste caso, o mapeador D110 de valores de atraso está configurado para multiplicar cada quantidade de deslocamento por 7/8. Implementações do mapeador D110 de valores de atraso também podem ser configuradas para realizar uma tal operação de escalamento em conjunto com uma operação de arredondamento para inteiro e/ou cálculo da média do deslocamento de tempo, como aqui descrito.
Noutras implementações, a linha D120 de atraso está configurada para, de outra forma, modificar a escala de tempo de um quadro ou outra sequência de amostras (e. g., comprimindo uma parte e expandindo outra parte). Por exemplo, o codificador A124 de banda estreita pode ser configurado para realizar a regularização de acordo com uma função tal como um perfil de tom ou trajetória. Em tal caso, o sinal SD10 de dados de regularização pode incluir uma correspondente descrição da função, tal como um conjunto de parâmetros, e a linha D120 de atraso pode incluir lógica configurada para deformar quadros ou subquadros do sinal S30 de fala de banda alta de acordo com a função. Em outras implementações, o mapeador D110 de valores de atraso está configurado para calcular a média, escalar e/ou arredondar a função antes desta ser aplicada ao sinal S30 de fala de banda alta pela linha D120 de atraso. Por exemplo, o mapeador D110 de valores de atraso pode ser configurado para calcular um ou mais valores de atraso de acordo com a função, cada valor de atraso indicando um número de amostras, que são então aplicadas pela linha D120 de atraso para deformar no tempo um ou mais corrsespondente quadros ou subquadros do sinal S30 de fala de banda alta. A FIGURA 29 mostra um fluxograma para um método MD100 de deformar no tempo um sinal de fala de banda alta de acordo com uma deformação no tempo incluída num correspondente sinal de excitação de banda estreita codificado. A tarefa TD100 processa um sinal de fala de banda larga para obter um sinal de fala de banda estreita e um sinal de fala de banda alta. Por exemplo, a tarefa TD100 pode ser configurada para filtrar o sinal de fala de banda larga utilizando um banco de filtros tendo filtros passa-baixo e passa-alto, tal como uma implementação do banco A110 de filtros. A tarefa TD200 codifica o sinal de fala de banda estreita em, pelo menos, um sinal de excitação de banda estreita codificado e uma pluralidade de parâmetros de filtragem de banda estreita. 0 sinal de excitação de banda estreita codificado e/ou os parâmetros de filtragem podem ser quantificados, e o sinal de fala de banda estreita codificado também pode incluir outros parâmetros tais como um parâmetro de modo de fala. A tarefa TD200 também inclui uma deformação no tempo no sinal de excitação de banda estreita codificado. A tarefa TD300 gera um sinal de excitação em banda alta com base num sinal de excitação de banda estreita. Neste caso, o sinal de excitação de banda estreita é baseado no sinal de excitação de banda estreita codificado. De acordo com, pelo menos, o sinal de excitação em banda alta, a tarefa TD400 codifica o sinal de fala de banda alta em, pelo menos, uma pluralidade de parâmetros de filtragem de banda alta. Por exemplo, a tarefa TD400 pode ser configurada para codificar o sinal de fala de banda alta numa pluralidade de LSFs quantificados. A tarefa TD500 aplica um deslocamento de tempo ao sinal de fala de banda alta que é baseado em informação relacionada com uma deformação no tempo incluída no sinal de excitação de banda estreita codificado. A tarefa TD400 pode ser configurada para realizar uma análise espectral (tal como uma análise LPC) sobre o sinal de fala de banda alta, e/ou para calcular um envelope de ganho do sinal de fala de banda alta. Em tais casos, a tarefa TD500 pode ser configurada para aplicar o deslocamento de tempo ao sinal de fala de banda alta antes da análise e/ou ao cálculo de envelope de ganho.
Outras implementações do codificador A100 de fala de banda larga são configuradas para inverter uma deformação no tempo do sinal S120 de excitação de banda alta causada por uma deformação no tempo incluida no sinal de excitação de banda estreita codificado. Por exemplo, o gerador A300 de excitação de banda alta pode ser implementado para incluir uma implementação da linha D120 de atraso que está configurada para receber o sinal SD10 de dados de regularização ou os valores SDlOa de atraso mapeados, e aplicar um correspondente deslocamento de tempo inverso ao sinal S80 de excitação de banda estreita, e/ou a um subsequente sinal baseado naquele tal como o sinal S160 estendido harmonicamente ou o sinal S120 de excitação de banda alta.
Outras implementações do codificador de fala de banda larga podem ser configuradas para codificar o sinal S20 de fala de banda estreita e o sinal S30 de fala de banda alta independentemente um do outro, de modo a que o sinal S30 de fala de banda alta seja codificado como uma representação de um envelope espectral e um sinal de excitação de banda alta. Uma tal implementação pode ser configurada para realizar deformação no tempo do sinal residual de banda alta ou para, de outra forma, incluir uma deformação no tempo num sinal de excitação de banda alta codificado, de acordo com informação relacionada com uma deformação no tempo incluida no sinal de excitação de banda estreita codificado. Por exemplo, ou codificador de banda alta pode incluir uma implementação da linha D120 de atraso e/ou mapeador D110 de valores de atraso como aqui descrito, que são configuradas para aplicar uma deformação no tempo ao sinal residual de banda alta. Vantagens potenciais de uma tal operação incluem codificação mais eficiente do sinal residual de banda alta e uma melhor correspondência entre os sinais de banda estreita sintetizada e de fala de banda alta.
Como mencionado acima, formas de realização como aqui descritas incluem implementações que podem ser utilizadas para realizar codificação embebida, suportando compatibilidade com sistemas de banda estreita e evitando uma necessidade de transcodificar. 0 suporte para codificação de banda alta também pode servir para diferenciar numa base de custo entre circuitos integrados, conjuntos de circuitos integrados, dispositivos, e/ou redes tendo suporte para banda larga com retrocompatibilidade, e aqueles tendo apenas suporte para banda estreita. 0 suporte para codificação de banda alta como aqui descrito também pode ser utilizado em conjugação com uma técnica para suportar codificação de banda baixa, e um sistema, método, ou aparelho de acordo com uma tal forma de realização pode suportar codificação de componentes de frequência desde, por exemplo, cerca de 50 ou 100 Hz até cerca de 7 ou 8 kHz.
Como mencionado acima, adicionar suporte de banda alta a um codificador de fala pode melhorar a inteligibilidade, especialmente relativamente à diferenciação de fricativas. Embora tal diferenciação possa habitualmente ser derivada por um ouvinte humano a partir do contexto particular, o suporte de banda alta pode servir como uma característica capacitante em reconhecimento de fala e outras aplicações de interpretação por máquina, tais como sistemas para navegação por menu de voz automatizado e/ou processamento automático de chamadas.
Um aparelho de acordo com uma forma de realização pode ser integrado num dispositivo portátil para comunicações sem fios tal como um telefone celular ou assistente digital pessoal (PDA) . De modo alternativo, um tal aparelho pode estar incluído noutro dispositivo de comunicações, tal como um telefone VoIP, um computador pessoal configurado para suportar comunicações VoIP, ou um dispositivo de rede configurado encaminhar comunicações telefónicas ou VoIP. Por exemplo, um aparelho de acordo com uma forma de realização pode ser implementado num circuito integrado ou conjunto de circuitos integrados para um dispositivo de comunicações. Dependendo da aplicação particular, um tal dispositivo também pode incluir características tais como conversão analógico-digital e/ou digital-analógico de um sinal de fala, circuitos para realizar amplificação e/ou outras operações de processamento de sinais sobre um sinal de fala, e/ou circuitos de rádiofrequência para transmissão e/ou receção do sinal de fala codificado. É explicitamente contemplado e divulgado que as formas de realização podem incluir e/ou ser utilizadas com qualquer uma ou mais das outras características divulgadas nos Pedidos de Patente Provisória US N° 60/667901 e 60/673965 dos quais este pedido reivindica benefício. Tais características incluem remoção de surtos de elevada energia de curta duração que ocorrem na banda alta e estão substancialmente ausentes da banda estreita. Tais características incluem nivelamento fixo ou adaptativo de representações de coeficientes tais como LSFs de banda alta. Tais características incluem modelação fixa ou adaptativa de ruído associado à quantificação de representações de coeficientes tais como LSFs. Tais características também incluem nivelamento fixo ou adaptativo de um envelope de ganho, e atenuação adaptativa de um envelope de ganho. A anterior apresentação das formas de realização descritas é proporcionada para permitir a qualquer especialista na técnica fazer ou utilizar a presente invenção. São possíveis diversas modificações a estas formas de realização, e os princípios genéricos apresentados aqui podem ser aplicados igualmente a outras formas de realização. Por exemplo, uma forma de realização pode ser implementada em parte ou na totalidade como um circuito cablado, como uma configuração de circuito fabricado num circuito integrado específico da aplicação, ou como um programa de firmware carregado num armazenamento não volátil ou um programa de software carregado a partir de ou para um meio de armazenamento de dados como código legível por máquina, tal código sendo instruções executáveis por uma disposição de elementos lógicos tais como um microprocessador ou outra unidade de processamento de sinais digitais. 0 meio de armazenamento de dados pode ser uma disposição de elementos de armazenamento tal como memória semicondutora (que pode incluir, sem limitação, RAM dinâmica ou estática (memória de acesso aleatório), ROM (memória apenas de leitura), e/ou flash RAM), ou memória ferroelétrica, magnetoresistiva, ovónica, polimérica, ou de mudança de fase; ou um meio de disco tal como um disco magnético ou ótico. 0 termo "software" deverá compreender-se para incluir código fonte, código em linguagem assembly, código máquina, código binário, firmware, macrocódigo, microcódigo, qualquer um ou mais conjuntos ou sequências de instruções executáveis por uma disposição de elementos lógicos e qualquer combinação de tais exemplos.
Os diversos elementos de implementações de geradores A300 e B300 de excitação de banda alta, codificador A100 de banda alta, descodificador B200 de banda alta, codificador A100 de fala de banda larga, e descodif icador B100 de fala de banda larga podem ser implementados como dispositivos eletrónicos e/ou óticos residindo, por exemplo, no mesmo circuito integrado ou entre dois ou mais circuitos integrados num conjunto de circuitos integrados, embora outras disposições sem tal limitação também sejam contemplados. Um ou mais elementos de um tal aparelho podem ser implementados na totalidade ou em parte como um ou mais conjuntos de instruções dispostos para executar sobre uma ou mais disposições de elementos lógicos fixos ou programáveis (e. g., transístores, portas lógicas) tais como microprocessadores, processadores integrados, núcleos IP, processadores de sinais digitais, FPGAs (disposições de portas lógicas programáveis em campo), ASSPs (produtos normalizados específicos da aplicação) , e ASICs (circuitos integrados específicos da aplicação) . Também é possível que um ou mais destes elementos tenham estrutura em comum (e. g., um processador utilizado para executar partes de código correspondente a diferentes elementos em momentos diferentes, um conjunto de instruções executadas para realizar tarefas correspondentes a diferentes elementos em momentos diferentes, ou uma disposição de dispositivos eletrónicos e/ou óticos realizando operações para diferente elementos em momentos diferentes) . Além disso, é possível que um ou mais destes elementos sejam utilizados para realizar tarefas ou executar outros conjuntos de instruções que não estão diretamente relacionadas com uma operação do aparelho, tal como uma tarefa relacionada com outra operação de um dispositivo ou sistema no qual o aparelho está integrado. A FIGURA 30 mostra um fluxograma de um método M100, de acordo com uma forma de realização, de codificar uma parte de banda alta de um sinal de fala tendo uma parte de banda estreita e a parte de banda alta. A tarefa X100 calcula um conjunto de parâmetros de filtragem que caracterizam um envelope espectral da parte de banda alta. A tarefa X200 calcula um sinal espectralmente estendido aplicando uma função não linear a um sinal derivado da parte de banda estreita. A tarefa X300 gera um sinal de banda alta sintetizado de acordo com (A) o conjunto d parâmetros de filtragem e (B) um sinal de excitação de banda alta baseado no sinal espectralmente estendido. A tarefa X400 calcula um envelope de ganho com base numa relação entre (C) energia da parte de banda alta e (D) energia de um sinal derivado da parte de banda estreita. A FIGURA 31a mostra um fluxograma de um método M200 de gerar um sinal de excitação de banda alta de acordo com uma forma de realização. A tarefa Y100 calcula um sinal harmonicamente estendido aplicando uma função não linear a um sinal de excitação de banda estreita derivado de uma parte de banda estreita de um sinal de fala. A tarefa Y200 mistura o sinal harmonicamente estendido com um sinal de ruído modulado para gerar um sinal de excitação de banda alta. A FIGURA 31b mostra um fluxograma de um método M210 de gerar um sinal de excitação de banda alta de acordo com outra forma de realização, incluindo as tarefas Y300 e Y400. A tarefa Y300 calcula um envelope do domínio do tempo de acordo com energia ao longo do tempo de um entre o sinal de excitação de banda estreita e o sinal harmonicamente estendido. A tarefa Y400 modula um sinal de ruído de acordo com o envelope do domínio do tempo para produzir o sinal de ruído modulado. A FIGURA 32 mostra um fluxograma de um método M300 de acordo com uma forma de realização, de descodificar uma parte de banda alta de um sinal de fala tendo uma parte de banda estreita e a parte de banda alta. A tarefa Z100 recebe um conjunto de parâmetros de filtragem que caracterizam um envelope espectral da parte de banda alta e um conjunto de fatores de ganho que caracterizam um envelope temporal da parte de banda alta. A tarefa Z200 calcula um sinal espectralmente estendido aplicando uma função não linear a um sinal derivado da parte de banda estreita. A tarefa Z300 gera um sinal de banda alta sintetizado de acordo com (A) o conjunto d parâmetros de filtragem e (B) um sinal de excitação de banda alta baseado no sinal espectralmente estendido. A tarefa Z400 modula um envelope de ganho do sinal de banda alta sintetizado com base no conjunto de fatores de ganho. Por exemplo, a tarefa Z400 pode ser configurada para modular o envelope de ganho do sinal de banda alta sintetizado aplicando o conjunto de fatores de ganho a um sinal de excitação derivado da parte de banda estreita, para o sinal espectralmente estendido, para o sinal de excitação de banda alta, ou para o sinal de banda alta sintetizado.

Claims (34)

  1. REIVINDICAÇÕES
    1. Método de processamento de sinais para gerar um sinal de fala de banda larga a partir de entradas compreendendo parâmetros de filtragem de banda baixa, um sinal de excitação de banda baixa e parâmetros de filtragem de banda alta, o referido método compreendendo: de acordo com, pelo menos, o sinal de excitação de banda baixa e uma pluralidade dos parâmetros de filtragem de banda baixa, sintetizar um sinal de fala de banda baixa; gerar um sinal de excitação de banda alta com base no sinal de excitação de banda baixa; de acordo com, pelo menos, o sinal de excitação de banda alta e uma pluralidade dos parâmetros de filtragem de banda alta, sintetizar um sinal de fala de banda alta; combinar o sinal de fala de banda baixa e o sinal de fala de banda alta para obter um sinal de fala de banda larga, em que a referida geração de um sinal de excitação de banda alta inclui aplicar uma função não linear a um sinal que é baseado no sinal de excitação de banda baixa para gerar um sinal espectralmente estendido e misturar um sinal que é baseado no sinal espectralmente estendido com um sinal de ruido modulado, em que o sinal de excitação de banda alta é baseado no sinal misturado, e em que o sinal de ruido modulado é baseado num resultado de modular um sinal de ruido de acordo com um envelope do domínio do tempo de um sinal com baseado em, pelo menos, um entre o sinal de fala de banda baixa, o sinal de excitação de banda baixa, e o sinal espectralmente estendido.
  2. 2. Método de processamento de sinais de acordo com a reivindicação 1, em que a referida sintetização de um sinal de fala de banda baixa inclui sintetizar o sinal de fala de banda baixa de acordo com, pelo menos, o sinal de excitação de banda baixa e uma pluralidade de coeficientes de filtragem de predição linear.
  3. 3. Método de processamento de sinais de acordo com a reivindicação 1, em que a referida sintetização de um sinal de fala de banda alta inclui sintetizar o sinal de fala de banda alta de acordo com, pelo menos, o sinal de excitação de banda alta e uma pluralidade de coeficientes de filtragem de predição linear.
  4. 4. Método de processamento de sinais de acordo com a reivindicação 1, em que a função não linear é uma função não linear sem memória.
  5. 5. Método de processamento de sinais de acordo com a reivindicação 1, em que a função não linear é a função valor absoluto.
  6. 6. Método de processamento de sinais de acordo com a reivindicação 1, o referido método compreendendo, antes da referida combinação, e de acordo com uma pluralidade de acordo com fatores de ganho, modificar uma amplitude do sinal de fala de banda alta ao longo do tempo.
  7. 7. Método de processamento de sinais de acordo com a reivindicação 6, em que a referida modificação de uma amplitude do sinal de fala de banda alta compreende modificar, de acordo com a pluralidade de fatores de ganho, uma amplitude ao longo do tempo de, pelo menos, um entre o sinal de excitação de banda baixa, o sinal espectralmente estendido, o sinal de excitação de banda alta e o sinal de fala de banda alta.
  8. 8. Meio de armazenamento de dados tendo instruções executáveis por máquina descrevendo o método de processamento de sinais de acordo com qualquer uma das reivindicações anteriores.
  9. 9. Aparelho para gerar um sinal de fala de banda larga a partir de entradas compreendendo parâmetros de filtragem de banda baixa, um sinal de excitação de banda baixa e parâmetros de filtragem de banda alta, o aparelho compreendendo: um descodificador de banda estreita configurado para sintetizar um sinal de fala de banda baixa de acordo com, pelo menos, o sinal de excitação de banda baixa e uma pluralidade dos parâmetros de filtragem de banda baixa; um descodificador de banda alta configurado para gerar um sinal de excitação de banda alta baseado no sinal de excitação de banda baixa e sintetizar um sinal de fala de banda alta de acordo com, pelo menos, o sinal de excitação de banda alta e uma pluralidade dos parâmetros de filtragem de banda alta; e um banco de filtros configurado para combinar o sinal de fala de banda baixa e o sinal de fala de banda alta para obter o sinal de fala de banda larga, em que o referido descodif icador de banda alta está ainda configurado para realizar modulação de um sinal de ruido de acordo com um envelope do domínio do tempo de um sinal com base em, pelo menos, um entre o sinal de fala de banda baixa, o sinal de excitação de banda baixa, e o sinal espectralmente estendido; em que o referido descodif icador de banda alta está ainda configurado para aplicar uma função não linear a um sinal que é baseado no sinal de excitação de banda baixa para gerar um sinal espectralmente estendido, e misturar um sinal que é baseado no sinal espectralmente estendido com o sinal de ruído modulado, em que o referido descodif icador de banda alta está ainda configurado para gerar o sinal de excitação de banda alta com base no sinal misturado.
  10. 10. Aparelho de acordo com a reivindicação 9, em que o referido descodificador de banda estreita está configurado para sintetizar o sinal de fala de banda baixa de acordo com, pelo menos, o sinal de excitação de banda baixa e uma pluralidade de coeficientes de filtragem de predição linear.
  11. 11. Aparelho de acordo com a reivindicação 9, em que o referido descodificador de banda alta está configurado para sintetizar o sinal de fala de banda alta de acordo com, pelo menos, o sinal de excitação de banda alta e uma pluralidade de coeficientes de filtragem de predição linear.
  12. 12. Aparelho de acordo com a reivindicação 9, em que o referido descodificador de banda alta está configurado para aplicar uma função não linear sem memória a um sinal que é baseado no sinal de excitação de banda estreita para gerar o sinal espectralmente estendido.
  13. 13. Aparelho de acordo com a reivindicação 9, em que o referido descodificador de banda alta está configurado para aplicar a função valor absoluto a um sinal que é baseado no sinal de excitação de banda baixa para gerar o sinal espectralmente estendido.
  14. 14. Aparelho de acordo com a reivindicação 9, em que o referido descodificador de banda alta está configurado para modificar uma amplitude do sinal de fala de banda alta ao longo do tempo, de acordo com uma pluralidade de fatores de ganho.
  15. 15. Aparelho de acordo com a reivindicação 14, em que o referido descodificador de banda alta está configurado para modificar uma amplitude do sinal de fala de banda alta de acordo com uma pluralidade de fatores de ganho, uma amplitude ao longo do tempo de, pelo menos, um entre o sinal de excitação de banda baixa, o sinal espectralmente estendido, o sinal de excitação de banda alta e o sinal de fala de banda alta.
  16. 16. Aparelho de acordo com reivindicação 9, o referidoaparelho compreendendo um telefone celular.
  17. 17. Aparelho de acordo com reivindicação 9, o referido aparelho compreendendo um dispositivo configurado para receber uma pluralidade de pacotes conformes com uma versão do Protocolo de Internet, em que a pluralidade de pacotes descreve o sinal de excitação de banda baixa, a pluralidade de parâmetros de filtragem de banda baixa, e a pluralidade de parâmetros de filtragem de banda alta.
  18. 18. Método de processamento de sinais para gerar saídas compreendendo parâmetros de filtragem de banda baixa, um sinal de excitação de banda baixa e parâmetros de filtragem de banda alta a partir de uma entrada compreendendo um sinal de fala de banda larga, o referido método compreendendo: processar o sinal de fala de banda larga para obter um sinal de fala de banda baixa e um sinal de fala de banda alta; codificar o sinal de fala de banda baixa em, pelo menos, um sinal de excitação de banda baixa codificado e uma pluralidade dos parâmetros de filtragem de banda baixa; gerar um sinal de excitação de banda alta com base no sinal de excitação de banda baixa codificado. de acordo com o sinal de excitação de banda alta, codificar o sinal de fala de banda alta em, pelo menos, uma pluralidade dos parâmetros de filtragem de banda alta; e em que a referida geração de um sinal de excitação de banda alta inclui aplicar uma função não linear a um sinal que é baseado no sinal de excitação de banda baixa codificado para gerar um sinal espectralmente estendido e misturar um sinal que é baseado no sinal espectralmente estendido com um sinal de ruído modulado, em que o sinal de excitação de banda alta é baseado no sinal misturado, e em que o sinal de ruído modulado é baseado num resultado de modular um sinal de ruído de acordo com um envelope do domínio do tempo de um sinal baseado em, pelo menos, um entre o sinal de fala de banda baixa, o sinal de excitação de banda baixa, e o sinal espectralmente estendido.
  19. 19. Método de processamento de sinais de acordo com a reivindicação 18, em que a referida codificação do sinal de fala de banda baixa em, pelo menos, um sinal de excitação de banda baixa codificado e uma pluralidade de parâmetros de filtragem de banda baixa inclui codificar o sinal de fala de banda baixa em, pelo menos, um sinal de excitação de banda baixa codificado e uma pluralidade de coeficientes de filtragem de predição linear.
  20. 20. Método de processamento de sinais de acordo com a reivindicação 18, em que a referida codificação do sinal de fala de banda alta em, pelo menos, uma pluralidade de parâmetros de filtragem de banda alta inclui codificar o sinal de fala de banda alta em, pelo menos, uma pluralidade de coeficientes de filtragem de predição linear.
  21. 21. Método de processamento de sinais de acordo com a reivindicação 18, em que a função não linear é uma função não linear sem memória.
  22. 22. Método de processamento de sinais de acordo com a reivindicação 18, em que a função não linear é a função valor absoluto.
  23. 23. Método de processamento de sinais de acordo com reivindicação 18, referido método compreendendo calcular um envelope de ganho de acordo com uma relação variável no tempo entre o sinal de banda alta e um sinal baseado no sinal de excitação de banda baixa.
  24. 24. Método de processamento de sinais de acordo com a reivindicação 23, em que o referido cálculo de um envelope de ganho compreende: com base no sinal de excitação de banda alta e na pluralidade de parâmetros de filtragem de banda alta, gerar um sinal de banda alta sintetizado; e calcular um envelope de ganho de acordo com uma relação variável no tempo entre o sinal de banda alta e o sinal de banda alta sintetizado.
  25. 25. Meio de armazenamento de dados tendo instruções executáveis por máquina descrevendo o método de processamento de sinais de acordo com qualquer uma das reivindicações 18 a 24.
  26. 26. Aparelho para gerar saldas compreendendo parâmetros de filtragem de banda baixa, um sinal de excitação de banda baixa e parâmetros de filtragem de banda alta a partir de uma entrada compreendendo um sinal de fala de banda larga compreendendo: um banco de filtros configurado para filtrar o sinal de fala de banda larga para obter um sinal de fala de banda baixa e um sinal de fala de banda alta; um codificador de banda baixa configurado para codificar o sinal de fala de banda baixa em, pelo menos, um sinal de excitação de banda baixa codificado e uma pluralidade dos parâmetros de filtragem de banda baixa; e um codificador de banda alta configurado para gerar um sinal de excitação de banda baixa codificado com base no sinal de excitação de banda baixa e sintetizar o sinal de fala de banda alta de acordo com o sinal de excitação de banda alta em, pelo menos, uma pluralidade dos parâmetros de filtragem de banda alta, em que o referido codificador de banda alta está configurado para aplicar uma função não linear a um sinal que é baseado no sinal de excitação de banda baixa codificado para gerar um sinal espectralmente estendido, e misturar um sinal que é baseado no sinal espectralmente estendido com um sinal de ruido modulado; e em que o referido descodif icador de banda alta está configurado para gerar o sinal de excitação de banda alta com base no sinal misturado; e em que o sinal de ruído modulado é baseado num resultado de modular um sinal de ruído de acordo com um envelope do domínio do tempo de um sinal com base em, pelo menos, um entre o sinal de fala de banda baixa, o sinal de excitação de banda baixa codificado, e o sinal espectralmente estendido.
  27. 27. Aparelho de acordo com a reivindicação 26, em que o referido codificador de banda estreita está configurado para codificar o sinal de fala de banda baixa em, pelo menos, um sinal de excitação de banda baixa codificado e uma pluralidade de coeficientes de filtragem de predição linear.
  28. 28. Aparelho de acordo com a reivindicação 26, em que o referido codificador de banda alta está configurado para codificar o sinal de fala de banda alta em, pelo menos, uma pluralidade de coeficientes de filtragem de predição linear.
  29. 29. Aparelho de acordo com a reivindicação 26, em que o referido codificador de banda alta está configurado para aplicar uma função não linear sem memória a um sinal que é baseado no sinal de excitação de banda baixa codificado para gerar o sinal espectralmente estendido.
  30. 30. Aparelho de acordo com a reivindicação 26, em que o referido codificador de banda alta está configurado para aplicar a função valor absoluto a um sinal que é baseado no sinal de excitação de banda baixa codificado para gerar o sinal espectralmente estendido.
  31. 31. Aparelho de acordo com reivindicação 26, em que o referido codificador de banda alta está configurado para calcular um envelope de ganho de acordo com uma relação variável no tempo entre o sinal de banda alta e um sinal baseado no sinal de excitação de banda baixa codificado.
  32. 32. Aparelho de acordo com reivindicação 31, em que o referido codificador de banda alta está configurado para gerar um sinal de banda alta sintetizado com base no sinal de excitação de banda alta e a pluralidade de parâmetros de filtragem de banda alta, e para calcular o envelope de ganho de acordo com uma relação variável no tempo entre o sinal de banda alta e o sinal de banda alta sintetizado.
  33. 33. Aparelho de acordo com reivindicação 26, o referido aparelho compreendendo um telefone celular.
  34. 34. Aparelho de acordo com reivindicação 26, o referido aparelho compreendendo um dispositivo configurado para transmitir uma pluralidade de pacotes conformes com uma versão do Protocolo de Internet, em que a pluralidade de pacotes descreve o sinal de excitação de banda baixa codificado, a pluralidade de parâmetros de filtragem de banda baixa, e a pluralidade de parâmetros de filtragem de banda alta.
PT67403584T 2005-04-01 2006-04-03 Sistemas, métodos, e aparelho para codificação de fala em banda larga PT1864282T (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US67396505P 2005-04-22 2005-04-22

Publications (1)

Publication Number Publication Date
PT1864282T true PT1864282T (pt) 2017-08-10

Family

ID=36588741

Family Applications (2)

Application Number Title Priority Date Filing Date
PT67403584T PT1864282T (pt) 2005-04-01 2006-04-03 Sistemas, métodos, e aparelho para codificação de fala em banda larga
PT06784345T PT1864101E (pt) 2005-04-01 2006-04-03 Sistemas, métodos e aparelhos para geração de excitação em banda alta

Family Applications After (1)

Application Number Title Priority Date Filing Date
PT06784345T PT1864101E (pt) 2005-04-01 2006-04-03 Sistemas, métodos e aparelhos para geração de excitação em banda alta

Country Status (24)

Country Link
US (8) US8140324B2 (pt)
EP (8) EP1866914B1 (pt)
JP (8) JP4955649B2 (pt)
KR (8) KR100982638B1 (pt)
CN (1) CN102411935B (pt)
AT (4) ATE485582T1 (pt)
AU (8) AU2006232358B2 (pt)
BR (8) BRPI0607691B1 (pt)
CA (8) CA2603246C (pt)
DE (4) DE602006017050D1 (pt)
DK (2) DK1864101T3 (pt)
ES (3) ES2340608T3 (pt)
HK (5) HK1113848A1 (pt)
IL (8) IL186443A (pt)
MX (8) MX2007012183A (pt)
NO (7) NO20075510L (pt)
NZ (6) NZ562188A (pt)
PL (4) PL1864101T3 (pt)
PT (2) PT1864282T (pt)
RU (9) RU2491659C2 (pt)
SG (4) SG161223A1 (pt)
SI (1) SI1864282T1 (pt)
TW (8) TWI321315B (pt)
WO (8) WO2006107834A1 (pt)

Families Citing this family (323)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
KR101213840B1 (ko) * 2004-05-14 2012-12-20 파나소닉 주식회사 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
EP2189978A1 (en) * 2004-08-30 2010-05-26 QUALCOMM Incorporated Adaptive De-Jitter Buffer for voice over IP
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
EP1872364B1 (en) * 2005-03-30 2010-11-24 Nokia Corporation Source coding and/or decoding
CA2603246C (en) 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
SI1875463T1 (sl) * 2005-04-22 2019-02-28 Qualcomm Incorporated Sistemi, postopki in naprava za glajenje faktorja ojačenja
ES2327566T3 (es) * 2005-04-28 2009-10-30 Siemens Aktiengesellschaft Procedimiento y dispositivo para la supresion de ruidos.
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
ATE443318T1 (de) * 2005-07-14 2009-10-15 Koninkl Philips Electronics Nv Audiosignalsynthese
WO2007013973A2 (en) * 2005-07-20 2007-02-01 Shattil, Steve Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
KR20080049085A (ko) * 2005-09-30 2008-06-03 마츠시타 덴끼 산교 가부시키가이샤 음성 부호화 장치 및 음성 부호화 방법
RU2008114382A (ru) * 2005-10-14 2009-10-20 Панасоник Корпорэйшн (Jp) Кодер с преобразованием и способ кодирования с преобразованием
JPWO2007043643A1 (ja) * 2005-10-14 2009-04-16 パナソニック株式会社 音声符号化装置、音声復号装置、音声符号化方法、及び音声復号化方法
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
WO2008022207A2 (en) * 2006-08-15 2008-02-21 Broadcom Corporation Time-warping of decoded audio signal after packet loss
JP5096468B2 (ja) * 2006-08-15 2012-12-12 ドルビー ラボラトリーズ ライセンシング コーポレイション サイド情報なしの時間的ノイズエンベロープの自由な整形
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
USRE50009E1 (en) * 2006-10-25 2024-06-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
KR101375582B1 (ko) * 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
DK2186089T3 (en) * 2007-08-27 2019-01-07 Ericsson Telefon Ab L M Method and apparatus for perceptual spectral decoding of an audio signal including filling in spectral holes
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
EP2220646A1 (en) * 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
WO2009059633A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
MX2010002629A (es) * 2007-11-21 2010-06-02 Lg Electronics Inc Metodo y aparato para procesar una señal.
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
US8983832B2 (en) * 2008-07-03 2015-03-17 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729751C (en) 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2621965C2 (ru) 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
RU2443028C2 (ru) 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
WO2010028301A1 (en) * 2008-09-06 2010-03-11 GH Innovation, Inc. Spectrum harmonic/noise sharpness control
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
WO2010028299A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
WO2010031003A1 (en) 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
WO2010036061A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2010053287A2 (en) * 2008-11-04 2010-05-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
GB2466673B (en) * 2009-01-06 2012-11-07 Skype Quantization
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
BR122019023704B1 (pt) * 2009-01-16 2020-05-05 Dolby Int Ab sistema para gerar um componente de frequência alta de um sinal de áudio e método para realizar reconstrução de frequência alta de um componente de frequência alta
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
KR101320963B1 (ko) * 2009-03-31 2013-10-23 후아웨이 테크놀러지 컴퍼니 리미티드 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP5730860B2 (ja) * 2009-05-19 2015-06-10 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 階層型正弦波パルスコーディングを用いるオーディオ信号の符号化及び復号化方法及び装置
WO2011047887A1 (en) 2009-10-21 2011-04-28 Dolby International Ab Oversampling in a combined transposer filter bank
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
MX2012004569A (es) 2009-10-20 2012-06-08 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodo para codificar informacion de audio, metodo para decodificar informacion de audio y programa de computacion que usa la deteccion de un grupo de valores espectrales previamente decodificados.
EP2704143B1 (en) 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CA2780971A1 (en) * 2009-11-19 2011-05-26 Telefonaktiebolaget L M Ericsson (Publ) Improved excitation signal bandwidth extension
RU2568278C2 (ru) * 2009-11-19 2015-11-20 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы пропускания звукового сигнала нижней полосы
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US20110167445A1 (en) * 2010-01-06 2011-07-07 Reams Robert W Audiovisual content channelization system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
WO2011086066A1 (en) 2010-01-12 2011-07-21 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a modification of a number representation of a numeric previous context value
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
KR101445294B1 (ko) * 2010-03-10 2014-09-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩 컨텍스트의 피치 의존 적응을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 오디오 신호 디코딩 방법, 오디오 신호 인코딩 방법, 및 컴퓨터 프로그램
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
US20130024191A1 (en) * 2010-04-12 2013-01-24 Freescale Semiconductor, Inc. Audio communication device, method for outputting an audio signal, and communication system
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
BR112012026326B1 (pt) * 2010-04-13 2021-05-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V método e codificador e decodificador para representação com amostragem precisa de um sinal de áudio
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9443534B2 (en) 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
RU2527735C2 (ru) 2010-04-16 2014-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство, способ и компьютерная программа для выработки широкополосного сигнала с использованием управляемого расширения ширины полосы и слепого расширения ширины полосы
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
CA3160488C (en) 2010-07-02 2023-09-05 Dolby International Ab Audio decoding with selective post filtering
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
US8977542B2 (en) 2010-07-16 2015-03-10 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20130310422A1 (en) 2010-09-01 2013-11-21 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
CA2961088C (en) 2010-09-16 2019-07-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
AU2012217216B2 (en) 2011-02-14 2015-09-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
CN103620672B (zh) 2011-02-14 2016-04-27 弗劳恩霍夫应用研究促进协会 用于低延迟联合语音及音频编码(usac)中的错误隐藏的装置和方法
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
KR101624019B1 (ko) * 2011-02-14 2016-06-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코덱에서 잡음 생성
MY164797A (en) 2011-02-14 2018-01-30 Fraunhofer Ges Zur Foederung Der Angewandten Forschung E V Apparatus and method for processing a decoded audio signal in a spectral domain
US9343076B2 (en) * 2011-02-16 2016-05-17 Dolby Laboratories Licensing Corporation Methods and systems for generating filter coefficients and configuring filters
DK3407352T3 (da) * 2011-02-18 2022-06-07 Ntt Docomo Inc Taleafkoder, talekoder, taleafkodningsfremgangsmåde, talekodningsfremgangsmåde, taleafkodningsprogram og talekodningsprogram
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
CN104321815B (zh) * 2012-03-21 2018-10-16 三星电子株式会社 用于带宽扩展的高频编码/高频解码方法和设备
FI3547261T3 (fi) 2012-03-29 2023-09-26 Ericsson Telefon Ab L M Vektorikvantisoija
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
EP3113184B1 (en) 2012-08-31 2017-12-06 Telefonaktiebolaget LM Ericsson (publ) Method and device for voice activity detection
WO2014046916A1 (en) 2012-09-21 2014-03-27 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
PL3067890T3 (pl) * 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
PL2951819T3 (pl) * 2013-01-29 2017-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie, sposób i nośnik komputerowy do syntetyzowania sygnału audio
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9601125B2 (en) 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
US9715885B2 (en) 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
US9558785B2 (en) * 2013-04-05 2017-01-31 Dts, Inc. Layered audio coding and transmission
CA3029037C (en) * 2013-04-05 2021-12-28 Dolby International Ab Audio encoder and decoder
CN117275495A (zh) 2013-04-05 2023-12-22 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
JP6482540B2 (ja) * 2013-06-21 2019-03-13 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 改善されたピッチラグ推定を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法
MY169410A (en) 2013-06-21 2019-04-01 Fraunhofer Ges Forschung Audio decoder having a bandwidth extension module with an energy adjusting module
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
JP6660878B2 (ja) 2013-06-27 2020-03-11 ザ ジェネラル ホスピタル コーポレイション 生理学的データにおける動的構造を追跡するためのシステムおよび該システムの作動方法
US10383574B2 (en) 2013-06-28 2019-08-20 The General Hospital Corporation Systems and methods to infer brain state during burst suppression
CN107316647B (zh) * 2013-07-04 2021-02-09 超清编解码有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
KR101790641B1 (ko) 2013-08-28 2017-10-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 하이브리드 파형-코딩 및 파라미터-코딩된 스피치 인핸스
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP3043696B1 (en) 2013-09-13 2022-11-02 The General Hospital Corporation Systems and methods for improved brain monitoring during general anesthesia and sedation
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
CN105761723B (zh) * 2013-09-26 2019-01-15 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
WO2015077641A1 (en) 2013-11-22 2015-05-28 Qualcomm Incorporated Selective phase compensation in high band coding
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
BR112016019838B1 (pt) * 2014-03-31 2023-02-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN106409304B (zh) 2014-06-12 2020-08-25 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424622B (zh) * 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
US9626983B2 (en) * 2014-06-26 2017-04-18 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的***和方法
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
EP3262639B1 (en) * 2015-02-26 2020-10-07 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
NO339664B1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
MY191093A (en) * 2016-02-17 2022-05-30 Fraunhofer Ges Forschung Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing
FR3049084B1 (fr) * 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
FI3696813T3 (fi) * 2016-04-12 2023-01-31 Audiokooderi audiosignaalin koodaamiseksi, menetelmä audiosignaalin koodaamiseksi ja tietokoneohjelma havaitulla huippuspektrialeella tarkastettuna ylemmällä taajuuskaistalla
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
CA3024167A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
US10786168B2 (en) 2016-11-29 2020-09-29 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
PL3555885T3 (pl) 2016-12-16 2021-01-11 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i koder do obsługi współczynników reprezentacji obwiedni
EP4401370A2 (en) 2017-01-06 2024-07-17 Telefonaktiebolaget LM Ericsson (publ) Methods and apparatuses for signaling and determining reference signal offsets
US10714080B2 (en) * 2017-02-10 2020-07-14 Samsung Electronics Co., Ltd. WFST decoding system, speech recognition system including the same and method for storing WFST data
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
KR102438549B1 (ko) * 2017-10-27 2022-08-31 테라웨이브, 엘엘씨 인코딩된 정현파 파형들을 이용한 고 스펙트럼 효율의 데이터 통신 시스템을 위한 수신기
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信***的语音业务处理方法及设备
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
JP7088403B2 (ja) * 2019-02-20 2022-06-21 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及***
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) * 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理***

Family Cites Families (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US526468A (en) * 1894-09-25 Charles d
US596689A (en) * 1898-01-04 Hose holder or support
US525147A (en) * 1894-08-28 Steam-cooker
US321993A (en) * 1885-07-14 Lantern
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) * 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) * 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) * 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) * 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) * 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) * 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
JPH05502539A (ja) 1990-09-19 1993-04-28 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 主データファイル及び制御ファイルが記録された記録担体、その記録方法及び装置、及びその読取装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US5765126A (en) 1993-06-30 1998-06-09 Sony Corporation Method and apparatus for variable length encoding of separated tone and noise characteristic components of an acoustic signal
AU7960994A (en) * 1993-10-08 1995-05-04 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
EP0768569B1 (en) * 1995-10-16 2003-04-02 Agfa-Gevaert New class of yellow dyes for use in photographic materials
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
DE69730779T2 (de) 1996-06-19 2005-02-10 Texas Instruments Inc., Dallas Verbesserungen bei oder in Bezug auf Sprachkodierung
JP3246715B2 (ja) * 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
CN102129862B (zh) 1996-11-07 2013-05-29 松下电器产业株式会社 降噪装置及包括降噪装置的声音编码装置
US6009395A (en) 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US5890126A (en) 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
US6041297A (en) 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6029125A (en) 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) * 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) * 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
JP3696091B2 (ja) * 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) * 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) * 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
EP1147514B1 (en) 1999-11-16 2005-04-06 Koninklijke Philips Electronics N.V. Wideband audio transmission system
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
WO2001052241A1 (en) 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US6757395B1 (en) * 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US7136810B2 (en) 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60118627T2 (de) 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
CZ20021423A3 (cs) * 2000-08-25 2002-08-14 Koninklijke Philips Electronics N. V. Způsob a zařízení pro sniľování délky slova v digitálním vstupním signálu, a způsob a zařízení pro zpětné získání signálu
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) * 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
WO2002039430A1 (en) 2000-11-09 2002-05-16 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7392179B2 (en) * 2000-11-30 2008-06-24 Matsushita Electric Industrial Co., Ltd. LPC vector quantization apparatus
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
WO2002093561A1 (de) 2001-05-11 2002-11-21 Siemens Aktiengesellschaft Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
WO2003003350A1 (en) * 2001-06-28 2003-01-09 Koninklijke Philips Electronics N.V. Wideband signal transmission system
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
ATE331280T1 (de) * 2001-11-23 2006-07-15 Koninkl Philips Electronics Nv Bandbreitenvergrösserung für audiosignale
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) * 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
AU2003260958A1 (en) 2002-09-19 2004-04-08 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) * 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) * 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
RU2316059C2 (ru) 2003-05-01 2008-01-27 Нокиа Корпорейшн Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
WO2005004113A1 (ja) * 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7689579B2 (en) * 2003-12-03 2010-03-30 Siemens Aktiengesellschaft Tag modeling within a decision, support, and reporting environment
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) * 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
CA2603246C (en) 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
UA95776C2 (ru) 2005-04-01 2011-09-12 Квелкомм Инкорпорейтед Система, способ и устройство генерирования возбуждения в диапазоне высоких частот
SI1875463T1 (sl) 2005-04-22 2019-02-28 Qualcomm Incorporated Sistemi, postopki in naprava za glajenje faktorja ojačenja

Also Published As

Publication number Publication date
TWI321315B (en) 2010-03-01
US20080126086A1 (en) 2008-05-29
CA2603229C (en) 2012-07-31
BRPI0607691A2 (pt) 2009-09-22
US8260611B2 (en) 2012-09-04
TW200707405A (en) 2007-02-16
KR100982638B1 (ko) 2010-09-15
JP2008536169A (ja) 2008-09-04
AU2006232361B2 (en) 2010-12-23
CA2603219A1 (en) 2006-10-12
WO2006130221A1 (en) 2006-12-07
NO20075515L (no) 2007-12-28
RU2390856C2 (ru) 2010-05-27
US8078474B2 (en) 2011-12-13
TW200703237A (en) 2007-01-16
US8484036B2 (en) 2013-07-09
CN102411935A (zh) 2012-04-11
EP1864281A1 (en) 2007-12-12
EP1869670B1 (en) 2010-10-20
KR100956524B1 (ko) 2010-05-07
DE602006017673D1 (de) 2010-12-02
BRPI0607646A2 (pt) 2009-09-22
KR20070118170A (ko) 2007-12-13
JP5203929B2 (ja) 2013-06-05
RU2007140382A (ru) 2009-05-10
PL1866915T3 (pl) 2011-05-31
KR20070118174A (ko) 2007-12-13
WO2006107838A1 (en) 2006-10-12
JP2008535025A (ja) 2008-08-28
JP2008535026A (ja) 2008-08-28
BRPI0608269B1 (pt) 2019-07-30
WO2006107839A3 (en) 2007-04-05
ATE492016T1 (de) 2011-01-15
KR20070118167A (ko) 2007-12-13
US20060271356A1 (en) 2006-11-30
JP5129116B2 (ja) 2013-01-23
IL186442A (en) 2012-06-28
AU2006232357A1 (en) 2006-10-12
ES2391292T3 (es) 2012-11-23
AU2006232362B2 (en) 2009-10-08
NZ562183A (en) 2010-09-30
JP4955649B2 (ja) 2012-06-20
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
US8332228B2 (en) 2012-12-11
US8069040B2 (en) 2011-11-29
KR20070118173A (ko) 2007-12-13
BRPI0608269B8 (pt) 2019-09-03
SG163555A1 (en) 2010-08-30
IL186438A0 (en) 2008-01-20
CA2603231A1 (en) 2006-10-12
NZ562188A (en) 2010-05-28
HK1115023A1 (en) 2008-11-14
KR101019940B1 (ko) 2011-03-09
US20060277038A1 (en) 2006-12-07
WO2006107839A2 (en) 2006-10-12
BRPI0607646B1 (pt) 2021-05-25
WO2006107833A1 (en) 2006-10-12
KR20070118172A (ko) 2007-12-13
TWI320923B (en) 2010-02-21
SG161223A1 (en) 2010-05-27
CA2603255C (en) 2015-06-23
JP2008537165A (ja) 2008-09-11
IL186436A0 (en) 2008-01-20
AU2006232360B2 (en) 2010-04-29
CA2602806C (en) 2011-05-31
PL1869673T3 (pl) 2011-03-31
EP1869673B1 (en) 2010-09-22
RU2007140394A (ru) 2009-05-10
NO340434B1 (no) 2017-04-24
RU2402826C2 (ru) 2010-10-27
WO2006107836A1 (en) 2006-10-12
WO2006107837A1 (en) 2006-10-12
DE602006017050D1 (de) 2010-11-04
TW200705388A (en) 2007-02-01
CA2602806A1 (en) 2006-10-12
MX2007012182A (es) 2007-12-10
RU2376657C2 (ru) 2009-12-20
NZ562182A (en) 2010-03-26
AU2006232360A1 (en) 2006-10-12
TWI321777B (en) 2010-03-11
AU2006232358A1 (en) 2006-10-12
PT1864101E (pt) 2012-10-09
CN102411935B (zh) 2014-05-07
IL186443A0 (en) 2008-01-20
TWI321314B (en) 2010-03-01
ES2340608T3 (es) 2010-06-07
IL186439A0 (en) 2008-01-20
KR20070119722A (ko) 2007-12-20
KR20070118175A (ko) 2007-12-13
IL186441A0 (en) 2008-01-20
JP2008536170A (ja) 2008-09-04
EP1869670A1 (en) 2007-12-26
IL186442A0 (en) 2008-01-20
US8364494B2 (en) 2013-01-29
TWI316225B (en) 2009-10-21
RU2387025C2 (ru) 2010-04-20
EP1866914B1 (en) 2010-03-03
SG161224A1 (en) 2010-05-27
AU2006232364B2 (en) 2010-11-25
US20070088541A1 (en) 2007-04-19
RU2007140429A (ru) 2009-05-20
BRPI0607690A8 (pt) 2017-07-11
PL1864101T3 (pl) 2012-11-30
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
EP1866914A1 (en) 2007-12-19
AU2006252957B2 (en) 2011-01-20
EP1864282B1 (en) 2017-05-17
JP5129117B2 (ja) 2013-01-23
CA2603231C (en) 2012-11-06
TW200705389A (en) 2007-02-01
BRPI0607691B1 (pt) 2019-08-13
TWI324335B (en) 2010-05-01
EP1864282A1 (en) 2007-12-12
TWI319565B (en) 2010-01-11
MX2007012189A (es) 2007-12-11
BRPI0608306A2 (pt) 2009-12-08
NO20075503L (no) 2007-12-28
BRPI0608270A2 (pt) 2009-10-06
MX2007012191A (es) 2007-12-11
IL186405A (en) 2013-07-31
RU2009131435A (ru) 2011-02-27
IL186404A0 (en) 2008-01-20
IL186405A0 (en) 2008-01-20
CA2603187A1 (en) 2006-12-07
NO340566B1 (no) 2017-05-15
US20070088558A1 (en) 2007-04-19
KR100956624B1 (ko) 2010-05-11
HK1114901A1 (en) 2008-11-14
JP5203930B2 (ja) 2013-06-05
US20060282263A1 (en) 2006-12-14
HK1115024A1 (en) 2008-11-14
MX2007012185A (es) 2007-12-11
JP5129118B2 (ja) 2013-01-23
BRPI0607690A2 (pt) 2009-09-22
US8244526B2 (en) 2012-08-14
TWI330828B (en) 2010-09-21
MX2007012184A (es) 2007-12-11
AU2006232361A1 (en) 2006-10-12
EP1864283A1 (en) 2007-12-12
RU2386179C2 (ru) 2010-04-10
RU2491659C2 (ru) 2013-08-27
EP1869673A1 (en) 2007-12-26
BRPI0608305A2 (pt) 2009-10-06
NZ562185A (en) 2010-06-25
MX2007012187A (es) 2007-12-11
HK1113848A1 (en) 2008-10-17
EP1864283B1 (en) 2013-02-13
DK1864282T3 (en) 2017-08-21
MX2007012183A (es) 2007-12-11
NO340428B1 (no) 2017-04-18
AU2006232363B2 (en) 2011-01-27
IL186443A (en) 2012-09-24
CA2603229A1 (en) 2006-10-12
KR20070118168A (ko) 2007-12-13
TW200703240A (en) 2007-01-16
DE602006018884D1 (de) 2011-01-27
ATE459958T1 (de) 2010-03-15
BRPI0608305B1 (pt) 2019-08-06
US8140324B2 (en) 2012-03-20
MX2007012181A (es) 2007-12-11
NZ562186A (en) 2010-03-26
AU2006232362A1 (en) 2006-10-12
RU2413191C2 (ru) 2011-02-27
CA2603255A1 (en) 2006-10-12
BRPI0608269A2 (pt) 2009-12-08
RU2402827C2 (ru) 2010-10-27
IL186404A (en) 2011-04-28
NO20075511L (no) 2007-12-27
CA2602804C (en) 2013-12-24
JP2008537606A (ja) 2008-09-18
BRPI0609530A2 (pt) 2010-04-13
AU2006232357B2 (en) 2010-07-01
SI1864282T1 (sl) 2017-09-29
RU2381572C2 (ru) 2010-02-10
RU2007140426A (ru) 2009-05-10
ATE482449T1 (de) 2010-10-15
CA2603187C (en) 2012-05-08
KR100956876B1 (ko) 2010-05-11
AU2006252957A1 (en) 2006-12-07
EP1866915B1 (en) 2010-12-15
US20060277042A1 (en) 2006-12-07
KR100956525B1 (ko) 2010-05-07
NZ562190A (en) 2010-06-25
DE602006012637D1 (de) 2010-04-15
ATE485582T1 (de) 2010-11-15
RU2007140406A (ru) 2009-05-10
EP1864101A1 (en) 2007-12-12
TW200705390A (en) 2007-02-01
NO20075513L (no) 2007-12-28
JP5161069B2 (ja) 2013-03-13
ES2636443T3 (es) 2017-10-05
BRPI0609530B1 (pt) 2019-10-29
RU2007140365A (ru) 2009-05-10
CA2603246A1 (en) 2006-10-12
SG163556A1 (en) 2010-08-30
HK1169509A1 (en) 2013-01-25
DK1864101T3 (da) 2012-10-08
IL186438A (en) 2011-09-27
CA2603219C (en) 2011-10-11
KR100956523B1 (ko) 2010-05-07
CA2603246C (en) 2012-07-17
JP2008535027A (ja) 2008-08-28
EP1864101B1 (en) 2012-08-08
PL1864282T3 (pl) 2017-10-31
TW200707408A (en) 2007-02-16
CA2602804A1 (en) 2006-10-12
JP2008535024A (ja) 2008-08-28
AU2006232364A1 (en) 2006-10-12
WO2006107834A1 (en) 2006-10-12
KR100956877B1 (ko) 2010-05-11
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
US20070088542A1 (en) 2007-04-19
TW200705387A (en) 2007-02-01
AU2006232357C1 (en) 2010-11-25
AU2006232358B2 (en) 2010-11-25
RU2007140383A (ru) 2009-05-10
NO20075514L (no) 2007-12-28
JP5129115B2 (ja) 2013-01-23

Similar Documents

Publication Publication Date Title
PT1864282T (pt) Sistemas, métodos, e aparelho para codificação de fala em banda larga
ES2358125T3 (es) Procedimiento y aparato para un filtrado de antidispersión de una señal ensanchada de excitación de predicción de velocidad de ancho de banda.
ES2705589T3 (es) Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia