PT2951819T - Aparelho, método e meio computacional para sintetizar um sinal de áudio - Google Patents

Aparelho, método e meio computacional para sintetizar um sinal de áudio Download PDF

Info

Publication number
PT2951819T
PT2951819T PT147025118T PT14702511T PT2951819T PT 2951819 T PT2951819 T PT 2951819T PT 147025118 T PT147025118 T PT 147025118T PT 14702511 T PT14702511 T PT 14702511T PT 2951819 T PT2951819 T PT 2951819T
Authority
PT
Portugal
Prior art keywords
audio signal
codebook
spectral
code
current frame
Prior art date
Application number
PT147025118T
Other languages
English (en)
Inventor
Geiger Ralf
Jaegers Wolfgang
Ravelli Emmanuel
Fuchs Guillaume
Bäckström Tom
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of PT2951819T publication Critical patent/PT2951819T/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

DESCRIÇÃO
APARELHO, MÉTODO E MEIO COMPUTACIONAL PARA SINTETIZAR UM SINAL
DE ÁUDIO A presente invenção refere-se ao campo de codificação de áudio, mais especificamente ao campo de sintetização de um sinal de áudio. As formas de realização referem-se à codificação da fala, particularmente à técnica de codificação da fala chamada codificação preditiva linear excitada por código (CELP | code excited linear predictive) . As formas de realização fornecem uma abordagem para a compensação de inclinação adaptativa na modelação dos códigos de uma CELP num codebook inovador ou fixo. 0 esquema de codificação de CELP é amplamente utilizado nas comunicações de fala e é uma forma eficiente para codificar a fala. CELP sintetiza um sinal de áudio pela passagem num filtro preditivo linear (por exemplo, filtro de síntese de LPC 1/A(z)) a soma de duas excitações. Uma excitação é oriunda do passado codificado, que é chamada de codebook adaptativo, e a outra contribuição é oriunda de um codebook fixo ou inovador que é povoado por códigos fixos. Um problema com o esquema de codificação de CELP é que em baixas taxas de bit o codebook inovador não é povoado suficientemente para modelar eficientemente a estrutura fina da fala de tal modo que a qualidade perceptual fica degradada e o sinal de saída sintetizado apresenta ruído.
Para mitigar os artefactos de codificação, diferentes soluções foram já propostas e são descritas na referência [1] e na referência [2]. Nestas referências, os códigos do codebook inovador são adaptativamente e espectralmente modelados pela enfatização das regiões espectrais correspondentes aos formantes do frame atual do sinal de áudio. As posições dos formantes e as suas modelações podem ser deduzidas diretamente dos coeficientes de LPC que são coeficientes disponíveis tanto no codificador como no descodificador. A melhoria dos formantes dos códigos c(n) do codebook inovador são feitos por uma operação simples de filtragem:
Neste processo de filtragem fe(n) é a resposta de impulso do filtro que tem a seguinte função de transferência:
onde wl e w2 são duas constantes de ponderação que enfatizam mais ou menos a estrutura formântica da função de transferência Fe(z). Os códigos modelados resultantes do codebook inovador herdam uma característica do sinal de fala e o sinal sintetizado apresenta menos ruído.
No esquema de codificação CELP é ainda comum adicionar uma inclinação espectral aos códigos do codebook inovador, que é feito pela filtragem dos códigos do codebook inovador como se segue:
0 fator β é relacionado com a vocalização do frame de áudio anterior, e a vocalização pode ser estimada da contribuição de energia do codebook adaptativo. Por exemplo, se o frame anterior contém voz, espera-se que o frame atual também tenha voz e que os códigos terão mais energia nas frequências baixas, isto é, o espectro tem uma inclinação negativa. É um objeto da presente invenção fornecer uma abordagem melhorada para sintetizar um sinal de áudio.
Este objeto é obtido por um aparelho, de acordo com a reivindicação 1, e por um método, de acordo com a reivindicação 15. A presente invenção fornece um aparelho para sintetizar um sinal de áudio que compreende uma unidade de processamento configurada para aplicar uma inclinação espectral ao código de codebook utilizado para sintetizar um frame atual do sinal de áudio, em que a inclinação espectral é baseada na inclinação espectral do frame atual do sinal de áudio. A presente invenção fornece um método para sintetizar um sinal de áudio, o método compreendendo aplicar uma inclinação espectral ao código de um codebook utilizado para sintetizar uma estrutura atual do sinal de áudio, em que a inclinação espectral é determinada com base na inclinação espectral do frame atual do sinal de áudio. A inclinação espectral do frame atual do sinal de áudio é determinada com base na informação do envelope espectral para o frame atual do sinal de áudio, em que a informação do envelope espectral pode ser definida pelos coeficientes LPC. Isto é vantajoso dado que permite determinar a inclinação espectral em função da informação disponível imediatamente tanto no codificador como no descodificador, nomeadamente os coeficientes LPC. A inclinação espectral determinada é aplicada ao respetivo código pela filtragem do código a partir do codebook baseado na função de transferência que inclui a inclinação espectral. Isto é vantajoso dado que através de uma simples filtragem o melhoramento pode ser alcançado.
Os inventores do presente pedido observaram que a sintetização de um sinal de áudio pode ser ainda melhorada tanto em taxas de bit baixas quanto em mais altas explorando a natureza da inclinação espectral do sinal de áudio na sintetização do sinal para melhorar o ganho de codificação alcançável. De acordo com as formas de realização, a presente invenção fornece uma codificação de fala, por exemplo, utilizando a técnica de codificação de fala de CELP, que permite melhorar o ganho de codificação de CELP, dessa forma melhorando a qualidade perceptual do sinal descodificado ou sintetizado. A abordagem inventiva é baseada na constatação dos inventores de que esta melhoria pode ser obtida adaptando a inclinação espectral dos códigos de um codebook, por exemplo, os códigos do codebook inovador de CELP, como uma função da inclinação espectral do sinal de entrada real atualmente processado. A abordagem inventiva é vantajosa por, além do ganho de codificação melhorado, em baixas taxas de bit, onde o codebook inovador não é povoado suficiente para modelar eficientemente a estrutura fina da fala, também permite a uma melhoria adicional do formante. Em taxas de bit mais altas, onde o codebook inovador é suficientemente povoado, aplicar a abordagem inventiva melhorará o ganho de codificação. Mais especificamente, em taxas de bit mais altas a melhoria do formante pode não ser necessária, pois o codebook inovador é grande o suficiente para modelar corretamente a estrutura fina da fala, e outro melhoramento do formante tornará o som do sinal sintetizado muito sintético. Contudo, os códigos ótimos não são espectralmente planos e adicionar uma inclinação espectral melhorará o ganho de codificação. De acordo com as formas de realização a inclinação ideal para aplicar aos códigos do codebook inovador é estimada mais precisamente, mais especificamente, está correlacionada com a inclinação do frame atual do sinal de entrada.
De acordo com outras formas de realização, a inclinação espectral do frame atual do sinal de áudio, com base nos coeficientes de LPC, pode ser determinada com base numa resposta de impulso infinito truncada do filtro de síntese de LPC. De acordo com as formas de realização, o truncamento pode ser determinado pelo tamanho do codebook inovador, isto é, pelo número de códigos no codebook inovador. Esta abordagem é vantajosa, pois permite a relação direta da determinação da inclinação espectral ao tamanho real do codebook inovador.
De acordo com outras formas de realização, a resposta de impulso infinito pode ser de um filtro de síntese de LPC tendo uma função de transferência não ponderada ou uma função de transferência ponderada. A Utilização da função de transferência não ponderada permite uma determinação simplificada da inclinação espectral, ao passo que a utilização da função de transferência ponderada é vantajoso, dado que permite uma inclinação espectral tendo um declive mais próximo da inclinação ideal.
De acordo com ainda outra forma de realização, a inclinação espectral do frame atual pode ser combinada com um fator relacionado a vocalização do frame anterior do sinal de áudio, por exemplo, pela filtragem do código do codebook com base numa função de transferência incluindo a inclinação espectral e o fator. Esta abordagem é vantajosa, pois fornece uma possibilidade de obter uma ainda melhor estimativa da inclinação ótima. A presente invenção fornece um descodificador de áudio compreendendo o aparelho inventivo para sintetizar um sinal de áudio. A presente invenção fornece um descodificador de áudio para descodificar um sinal de áudio, em que o descodificador de áudio é configurado para aplicar uma inclinação espectral ao código de um codebook utilizado para sintetizar um frame atual do sinal de áudio, em que a inclinação espectral é baseada na inclinação espectral do frame atual do sinal de áudio. A presente invenção fornece um codificador para codificar um sinal de áudio, em que o codificador de áudio é configurado para determinar a partir de uma inclinação espectral de um frame atual do sinal de áudio uma inclinação espectral para um código de um codebook que representa um frame atual do sinal de áudio. A presente invenção fornece um sistema, compreendendo o descodificador de áudio inventivo e o codificador de áudio inventivo. A presente invenção fornece um meio computacional não transitório que armazena instruções para realizar, ao ser executado num computador, o método inventivo para sintetizar um sinal de áudio. As formas de realização da presente invenção serão agora descritas com mais detalhes com referência aos desenhos anexos, nos quais: A Figura 1 mostra uma representação esquemática do aparelho inventivo para sintetizar um sinal de áudio de acordo com uma primeira forma de realização; A Figura 2 mostra um diagrama de blocos simplificado de um sintetizador de sinal de acordo com uma segunda forma de realização da invenção, que opera com base no esquema de CELP; A Figura 3 mostra um diagrama de blocos simplificado de um sintetizador de sinal de acordo com outra forma de realização da presente invenção, novamente aplicando o esquema de codificação de CELP que incorpora a vocalização de um frame anterior; A Figura 4 mostra uma forma de realização de um descodificador, por exemplo, um descodificador de fala operando de acordo com os ensinamentos da presente invenção; e A Figura 5 mostra uma forma de realização de um codificador, por exemplo, um codificador de fala operando de acordo com os ensinamentos da presente invenção.
No que se segue, as formas de realização da abordagem inventiva serão descritas. É observado que na descrição subsequente elementos/etapas semelhantes são referidos pelos mesmos sinais de referência. A figura 1 mostra uma representação esquemática do aparelho inventivo para sintetizar um sinal de áudio de acordo com uma primeira forma de realização. 0 aparelho 100 recebe numa entrada 102 um sinal codificado, por exemplo, um sinal de áudio codificado, como um sinal de fala. Para codificar o sinal de áudio, o aparelho 100 compreende um codebook 104 incluindo uma pluralidade de códigos. Para sintetizar o sinal, ao processar um frame atual, com base no sinal codificado recebido na entrada 102, um código ou palavra código apropriado é selecionado do codebook 104 e fornecido ao sintetizador ou filtro de síntese 106. De acordo com a presente invenção, o aparelho compreende a unidade de processamento 108 que determina, com base na inclinação espectral do frame atual do sinal de áudio, isto é, o frame do sinal de áudio atualmente processado pelo aparelho 100, uma inclinação espectral a ser aplicada ao código c (n) lido do codebook 104, como é esquematicamente representado em 110. O código modificado c(η)*γ é aplicado ao filtro de síntese 106 que gera com base no código modificado um sinal sintetizado que é fornecido à saida 112 do aparelho 100. A unidade de processamento 108 pode determinar a inclinação espectral com base na informação do envelope espectral para o frame atual, por exemplo, coeficientes de filtro para o filtro de síntese 106 que estão disponíveis no aparelho 100.
De acordo com outras formas de realização, uma compensação de
inclinação adaptativa para formar os códigos de um codebook inovador de CELP será descrita. A figura 2 mostra um diagrama de blocos simplificado de um sintetizador de sinal 200 de acordo com uma segunda forma de realização da invenção, que opera com base no esquema de CELP. De acordo com o esquema de CELP, o sintetizador 200 inclui um codebook fixo ou inovador 202 e um codebook adaptativo 204. Dependente do sinal codificado, para um frame atual que é atualmente processado pelo sintetizador 200, um código é emitido dos respetivos codebooks 202 e 204. O sintetizador 200 compreende um somador ou combinador 206 para combinar os códigos recebidos dos respetivos codebooks 202 e 204. A saída do somador 206 é conectada a um filtro de síntese de LPC 208 para sintetizar o sinal de áudio de saída e emitir numa saída 210. De acordo com as formas de realização, o sintetizador 200 pode incluir um primeiro amplificador 212 para multiplicar uma contribuição do codebook fixo 202 por um ganho de código desejado. Ainda, um segundo amplificador 214 pode ser fornecido para multiplicar a contribuição do codebook adaptativo 204 de acordo com um ganho de tom, pois a contribuição do codebook adaptativo modela o tom da fala. De acordo com outra forma de realização ainda um armazenamento do coeficiente de LPC 216, como uma memória ou semelhante, pode ser fornecido para armazenar os coeficientes de LPC que estão disponíveis no descodificador incluindo o sintetizador 200. Os coeficientes de LPC são fornecidos ao filtro de síntese 208 para fornecer a filtragem de síntese de LPC desejada. O sintetizador 200 inclui o filtro 218 que é conectado entre o codebook fixo 202 e o primeiro amplificador 212. O filtro 218 recebe do armazenamento 216 os coeficientes de LPC para o frame atual. Por meios da estrutura inventiva a inclinação do frame de áudio que é atualmente processado é recuperada dos coeficientes de LPC já transmitidos que são armazenados no armazenamento 216. De acordo com a forma de realização da figura 2, assume-se que fs(n) é a resposta de impulso do filtro de síntese de LPC 208 tendo a função de transferência Fs(z) = lA4(z), e a inclinação é determinada como se segue pelo filtro 218:
onde N é o tamanho do truncamento da resposta de impulso
infinito fs (n) . De acordo com uma forma de realização, N é igual ao tamanho do codebook inovador, ou seja, N é igual ao número de códigos ou palavras código armazenados no codebook inovador. A inclinação espectral é aplicada, de acordo com a forma de realização da figura 2, ao código c(n) recuperado do codebook fixo 202 por uma operação de filtragem fornecida no filtro 218. A operação de filtragem é definida como se segue:
onde fti (n) é a resposta de impulso da seguinte função de transferência:
A forma de realização da figura 2 é vantajosa, pois permite melhorar a qualidade perceptual do sinal descodificado pelo melhoramento do ganho de codificação. A melhoria do ganho de codificação é obtida pela filtragem de uma palavra código ou código recuperado do codebook fixo 202 por uma função de transferência incluindo uma inclinação espectral que é determinada com base na resposta de impulso da função de transferência do filtro de síntese de LPC 208.
De acordo com uma terceira forma de realização, para melhorar ainda mais a inclinação espectral de forma a estar mais próxima a uma inclinação ideal, isto é, para estar mais próxima da inclinação do frame atual real do sinal de entrada, o filtro de síntese de LPC 208 tem a seguinte função de transferência:
com wl = 0,8 e w2 = 0,9. Neste caso, a inclinação espectral é definida como se segue:
As constantes de ponderação wl e w2 são utilizados para controlar a dinâmica do envelope espectral. Por exemplo, se wl = 0 e w2 = 1, então Fe(z) segue de forma próxima o envelope do sinal verdadeiro. A inclinação espectral resultante γ mostrará uma alta dinâmica e pode flutuar muito. Essa pode ser a solução para taxas de bit muito baixas onde o codebook definitivamente não possui estrutura de inclinação. Entretanto, foi observado perceptualmente que é melhor deduzir a inclinação espectral γ de uma versão amaciada do envelope espectral. Um bom amaciamento foi observado ser obtido com os valores acima wl = 0,8 e w2 = 0,9, que mostra um bom equilíbrio para uma qrande faixa de taxas de bit. De acordo com as formas de realização, wl e w2 são dependentes da taxa de bit. Em taxas muito altas se o codebook for qrande o suficiente e puder modelar quaisquer inclinações espectrais γ, pode desligar-se a influência da inclinação espectral γ definindo wl = w2 = 1.
Quando comparado com a segunda forma de realização, que produz uma inclinação tendo um declive mais íngreme do que a inclinação ideal teria, a terceira forma de realização utilizando uma função de transferência "ponderada" fornece uma inclinação que é mais próxima à inclinação real do frame atual. A figura 3 mostra outro diagrama de blocos simplificado de um sintetizador de sinal 200' de acordo com uma quarta forma de realização da presente invenção, novamente aplicando o esquema de codificação de CELP. Quando comparado às formas de realização descritas em relação à figura 2, a forma de realização descrita em relação à figura 3 aplica ainda o fator mencionado acima relacionado com a vocalização de um frame anterior. Como pode ser visto pela figura 3, o frame do sintetizador 200' é substancialmente o mesmo que o frame do sintetizador 200 da figura 2, exceto que adicionalmente um estimador de voz 220 é fornecido que recebe a saída no amplificador 214 e as contribuições combinadas dos codebooks adaptativos e inovadores emitidos pelo somador 206. O estimador de voz emite um sinal ao filtro 280 de modo que o código ou palavra código obtido do codebook inovador 202 seja modificado com base numa inclinação determinada (veja a figura 2 e a descrição acima) combinada com um fator de voz. Mais especificamente, de acordo com a forma de realização da figura 3, a inclinação espectral determinada é combinada com o fator β que se refere a voz do frame anterior. A abordagem descrita com relação à figura 3 é vantajosa, pois permite obter uma estimativa ainda melhor da inclinação a ser aplicada à palavra código quando comparada às formas de realização descritas em relação às figuras 1 e 2. A modificação do código ou formação do código podem ainda ser consideradas como uma operação de filtragem utilizando uma função de transferência como se segue:
onde a e b são constantes. Numa forma de realização preferida, a = 0,5 e b = 0,25. O fator β pode ser deduzido da voz de um frame anterior como se segue:
e o fator real β pode ser determinado como se segue:
As constantes a e b são aplicadas para controlar a mistura de inclinação de voz β e a inclinação espectral γ. Conforme mencionado acima em relação às constantes de ponderação wl e w2, para taxas de bit médias ou baixas, pode ser relevante modelar o codebook afinando as baixas frequências ou altas frequências com base na inclinação espectral γ. Também foi observado que quanto mais vocal for o sinal melhor é para afinar as altas frequências. As constantes a e b podem ser utilizadas para normalizar os fatores de inclinação β e γ e ponderar as suas tensões de forma a combinar os dois efeitos conforme desejado. De acordo com as formas de realização, as constantes a e b podem ser encontradas empiricamente avaliando a qualidade perceptual. Isto fornece aproximadamente a mesma tensão a ambos os fatores: γ é limitado entre -1 e 1, assim b-γ está entre -0,25 e 0,25 e β é limitado entre 0 e 0,5 assim a-β é limitado entre 0 e 0,25. Como para as constantes de ponderação wl e w2, ainda as constantes a e b podem tornar-se dependentes da taxa de bit.
De acordo com a quarta forma de realização, a síntese de áudio conforme mostrado na figura 3 é de tal modo que a contribuição do codebook adaptativo é multiplicada por um ganho designado por ganho de tom dado que a contribuição modela o tom da fala. O código inovador é primeiro filtrado por Ft2(z) para adicionar a inclinação espectral ao código, em que a inclinação, conforme descrito acima, é correlacionada a inclinação do frame atual do sinal a ser sintetizado. A saída do filtro 218 é multiplicada pelo ganho de código, e as duas contribuições, a contribuição multiplicada do codebook adaptativo e a contribuição multiplicada modificada do codebook inovador são adicionadas pelo somador 206 antes de serem filtrados pelo filtro de síntese para gerar o sinal de saída sintetizado na saída 210. A figura 4 mostra uma forma de realização de um descodificador, por exemplo um descodif icador de fala operando de acordo com os ensinamentos da presente invenção. O descodificador 300 inclui um sintetizador 100, 200, 200' de acordo com uma das formas de realização descritas acima. O descodificador tem uma entrada 302 que recebe um sinal codificado que é processado pelo descodificador e o sintetizador para gerar numa saída 304 do descodificador 300 um sinal descodificado. A figura 5 mostra uma forma de realização de um codificador, por exemplo, um codificador de fala operando de acordo com os ensinamentos da presente invenção. O codificador 400 inclui uma unidade de processamento 402 para codificar um sinal de áudio. Adicionalmente, a unidade de processamento determina a partir de uma inclinação espectral de um frame atual da informação do sinal de áudio (por exemplo, dos coeficientes de LPC disponíveis no codificador) informação que representa uma inclinação espectral para um código de um codebook no descodificador que representa um frame atual do sinal de áudio. Esta informação pode ser transmitida conjuntamente com os códigos do sinal de áudio para o lado do descodif icador onde pode ser aplicada na sintetização do sinal de áudio. A inclinação espectral pode ser determinada no codificador de uma forma descrita acima com relação às figuras de 1 a 3 e pode ser aplicada no descodificador conforme descrito acima em relação às figuras de 1 a 3. Portanto, as formas de realização da invenção fornecem o codificador de áudio acima conforme mostrado na figura 5 em conjunto com um descodificador de áudio para descodificar um sinal de áudio, em que o descodif icador de áudio não precisa necessariamente de determinar a inclinação espectral, ao invés, é configurado para aplicar a inclinação espectral recebida do codificador ao código de um codebook utilizado para sintetizar um frame atual do sinal de áudio. Por exemplo, o descodificador pode ter um sintetizador como o das figuras de 1 a 3, exceto que a unidade de processamento 108 ou filtro 218 recebem a
inclinação calculada no e transmitida do codificador. A inclinação recebida pode ser armazenada, por exemplo, no armazenamento 216 ou noutro armazenamento.
Embora alguns aspetos tenham sido descritos no contexto de um aparelho, é claro que estes aspetos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou um recurso de uma etapa do método. Analogamente, os aspetos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou recurso correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrónico. Nalgumas formas de realização, uma ou mais das etapas do método mais importantes podem ser executadas por tal aparelho.
Dependendo de certas exigências da implementação, as formas de realização da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento não transitório como um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma memória ROM, uma PROM, e EPROM, uma EEPROM ou uma memória FLASH, tendo sinais de controlo eletronicamente legíveis armazenados nelas, que cooperam (ou podem cooperar) com um sistema de computador programável de modo a que o respetivo método seja realizado. Assim, o meio de armazenamento digital pode ser legível por computador.
Algumas formas de realização de acordo com a invenção compreendem um transportador de dados tendo sinais de controlo eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
Geralmente, as formas de realização da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, o código do programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado num computador. 0 código do programa pode, por exemplo, ser armazenado num transportador legível por máquina.
Outras formas de realização compreendem o programa de computador para realizar um dos métodos aqui descritos, armazenados num transportador legível por máquina.
Por outras palavras, uma forma de realização do método inventivo é, assim, um programa de computador tendo um código do programa para realizar um dos métodos aqui descritos, quando o programa de computador é executado num computador.
Outra forma de realização do método inventivo é, assim, um transportador de dados (ou um meio de armazenamento digital, ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos aqui descritos. 0 transportador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitório.
Outra forma de realização do método inventivo é, assim, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos descritos aqui. 0 fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da internet.
Outra forma de realização compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado para, ou programado, para realizar um dos métodos descritos aqui.
Outra forma de realização compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descritos aqui.
Outra forma de realização de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou opticamente) um programa de computador para realizar um dos métodos aqui descritos a um recetor. 0 recetor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhantes. 0 aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador para o recetor.
Nalgumas formas de realização, um dispositivo lógico programável (por exemplo, uma matriz de campo de portas programáveis) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Nalgumas formas de realização, uma matriz de campo de portas programáveis pode cooperar com um microprocessador a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
As formas de realização descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que as modificações e variações das disposições e detalhes descritos aqui serão evidentes aos técnicos versados na arte. É a intensão, assim, ser limitada apenas pelo âmbito das reivindicações da patente iminentes e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.
REFERÊNCIAS
[1] Recomendation ITU-T G.718 : "Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s" [2] Patente Norte-Americana 6,678,651 B2, "Short-Term
Enhancement in CELP Speech Coding"
REFERÊNCIAS CITADAS NA DESCRIÇÃO A lista de referências citada pelo proponente é somente para conveniência do leitor. Não é parte do documento europeu de patente. Apesar de todo o cuidado que foi tido na compilação das referências, erros ou omissões não podem ser excluídas e o EPO recusa quaisquer responsabilidades nesse sentido.
Documentos de Patente Citados na Descrição US 6678651 B2

Claims (20)

  1. REIVINDICAÇÕES
    1. Um aparelho para sintetizar um sinal de áudio, compreendendo: uma unidade de processamento (108, 110, 218) configurada para aplicar uma inclinação espectral ao código de um codebook (104, 202) utilizado para sintetizar um frame atual do sinal de áudio, caracterizado por a inclinação espectral ser baseada na inclinação espectral do frame atual do sinal de áudio, em que o aparelho está configurado para determinar a inclinação espectral do frame atual do sinal de áudio com base na informação do envelope espectral para o frame atual do sinal de áudio, e em que a unidade de processamento (108, 110, 218) está configurada para aplicar uma inclinação espectral pela filtragem do código do codebook (104, 202) baseada numa função de transferência incluindo a inclinação espectral.
  2. 2. O aparelho, de acordo com a reivindicação 1, caracterizado por a informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral γ do frame atual do sinal de áudio é definida como se segue:
    com: fs(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência Fs(.z) = 1/A (z), e N o tamanho do truncamento da resposta de impulso infinito fs(n). 3. 0 aparelho, de acordo com a reivindicação 1, caracterizado por a informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral γ do frame atual do sinal de áudio é definida como se segue:
    com: fe(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência
    N o tamanho do truncamento da resposta de impulso infinito fs(n), e wl, w2 constantes de ponderação para definir a estrutura formântica da função de transferência Fe(z) ·
  3. 4. O aparelho, de acordo com a reivindicação 2 ou 3, caracterizado por N ser igual ao número de códigos no codebook (104, 202).
  4. 5. O aparelho, de acordo com a reivindicação 1, caracterizado por a função de transferência incluindo a inclinação espectral ser definida como se segue:
    com inclinação espectral y.
  5. 6. O aparelho, de acordo com qualquer uma das reivindicações de 1 a 5, caracterizado por a unidade de processamento (108, 110, 218) ser ainda configurada para combinar a inclinação espectral determinada do frame atual do sinal de áudio com um fator relacionado com a vocalização do frame anterior do sinal de áudio.
  6. 7. O aparelho, de acordo com a reivindicação 6, caracterizado por o fator relacionado com a vocalização do frame anterior do sinal de áudio ser definido como se segue:
    com:
  7. 8. O aparelho, de acordo com a reivindicação 6 ou 7, caracterizado por a unidade de processamento (108, 110, 218) ser configurada para aplicar a inclinação espectral pela filtragem do código do codebook (104, 202) com base numa função de transferência incluindo a inclinação espectral e o fator relacionado com a vocalização do frame anterior do sinal de áudio.
  8. 9. O aparelho, de acordo com a reivindicação 8, caracterizado pela função de transferência incluindo a inclinação espectral ser definida como se segue:
    com: a, b constantes.
  9. 10. O aparelho, de acordo com qualquer uma das reivindicações de 1 a 9, caracterizado por o sinal de áudio ser um sinal de fala, em que a unidade de processamento para aplicar a inclinação espectral compreende um filtro (218), e em que o aparelho ainda compreende: um codebook adaptativo (204), um codebook fixo (202), o filtro (218) emparelhado ao codebook fixo (202), o filtro (218) sendo configurado para aplicar a inclinação espectral determinada ao código do codebook fixo (202) para obter um código filtrado do codebook fixo (202) , um somador (206) emparelhado ao codebook adaptativo (204) e ao filtro (218), o somador (206) configurado para combinar um código do codebook adaptativo (204) e o código filtrado do codebook fixo (202) para obter um código combinado, e um filtro de síntese de LPC (208) emparelhado ao somador (206) .
  10. 13. O aparelho, de acordo com a reivindicação 10, caracterizado por compreender também: um amplificador de ganho de tom (214) emparelhado entre o codebook adaptativo (204) e o somador (206), o amplificador de ganho de tom (214) configurado para multiplicar o código do codebook adaptativo (204) com um ganho de tom, e um amplificador de ganho de código (212) emparelhado entre o filtro (218) e o somador (206), o amplificador de ganho de código (212) configurado para multiplicar o código filtrado do codebook fixo (202) com um ganho de código.
    12. O aparelho, de acordo com a reivindicação 10 ou 11, caracterizado por compreender também: um estimador de voz (220) emparelhado ao codebook adaptativo (204) e ao somador (206), o estimador de voz (220) configurado para emitir um fator relacionado com a vocalização do frame anterior do sinal de áudio ao filtro (218), e um armazenamento (216) configurado para armazenar coeficientes de LPC que descrevem a informação do envelope espectral para o frame atual do sinal de áudio, o armazenamento (216) sendo emparelhado ao filtro (218).
    13. Um descodificador de áudio caracterizado por compreender um aparelho para sintetizar um sinal de áudio, de acordo com qualquer uma das reivindicações 1 ou 12.
  11. 14. Um sistema, caracterizado por compreender: um descodificador de áudio, de acordo com a reivindicação 13, e um codificador de áudio configurado para determinar a partir de uma inclinação espectral de um frame atual do sinal de áudio uma inclinação espectral para um código de um codebook (104, 202) que representa o frame atual do sinal de áudio.
  12. 15. Um método para sintetizar um sinal de áudio, o método compreendendo: aplicar uma inclinação espectral ao código de um codebook (104, 202) utilizado para sintetizar um frame atual do sinal de áudio, em que a inclinação espectral é determinada com base na inclinação espectral do frame atual do sinal de áudio, em que a inclinação espectral do frame atual do sinal de áudio é determinada com base na informação do envelope espectral para o frame atual do sinal de áudio, e em que a aplicação da inclinação espectral compreende a filtragem de um código do codebook (104, 202) baseado numa função de transferência que inclui a inclinação espectral. 16. 0 método de acordo com a reivindicação 15, caracterizado por a informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral y do frame atual do sinal de áudio é determinada como se segue:
    com: fs(n) a resposta de impulso infinito de um filtro de síntese de LPC (106, 208) tendo a função de transferência Fs(.z) = 1/A (z), e N o tamanho do truncamento da resposta de impulso infinito fs(n).
  13. 17. O método, de acordo com a reivindicação 15, caracterizado por a informação do envelope espectral ser definida pelos coeficientes de LPC, e em que a inclinação espectral do frame atual do sinal de áudio é determinada como se segue:
    com: fe(n)a resposta de impulso infinito de um filtro de síntesede LPC (106, 208) tendo a função de transferência
    N o tamanho do truncamento da resposta de impulso infinito fs(n)r e wl, w2 constantes de ponderação para definir a estrutura formântica da função de transferência Fe O). 18. 0 método, de acordo com a reivindicação 16 ou 17, caracterizado por N ser igual ao número de códigos no codebook (104, 202).
  14. 19. O método, de acordo com a reivindicação 15, caracterizado por a função de transferência incluindo a inclinação espectral ser determinada como se segue:
    com: inclinação espectral y.
  15. 20. O método, de acordo com qualquer uma das reivindicações de 15 a 19, caracterizado por compreender ainda a combinação da inclinação espectral determinada da estrutura atual do sinal de áudio com um fator relacionado com a vocalização do frame anterior do sinal de áudio.
  16. 21. O método, de acordo com a reivindicação 20, caracterizado por o fator relacionado com a vocalização do frame anterior do sinal de áudio ser determinado como se segue:
    com:
  17. 22. O método, de acordo com a reivindicação 20 ou 21, caracterizado por a aplicação da inclinação espectral compreender a filtragem do código do codebook (104, 202) com base numa função de transferência incluindo a inclinação espectral e o fator relacionado com a vocalização do frame anterior do sinal de áudio. 23. 0 método, de acordo com a reivindicação 22, caracterizado por a função de transferência incluindo a inclinação espectral ser determinada como se segue:
    com: a, b constantes. 24. 0 método, de acordo com qualquer uma das reivindicações de 15 a 23, caracterizado por o sinal de áudio ser um sinal de fala, e em que a síntese do sinal de áudio compreende para um frame do sinal de áudio: aplicar a inclinação espectral determinada ao código de um codebook fixo (202) para obter um código filtrado do codebook fixo (202), combinar um código de um codebook adaptativo (204) e o código filtrado do codebook fixo (202) para obter um código combinado, e filtrar o código combinado por um filtro de síntese de LPC (208) .
  18. 25. O método, de acordo com a reivindicação 24, caracterizado por compreender ainda multiplicar o código do codebook adaptativo (204) com um ganho de tom, e multiplicar o código filtrado do codebook fixo (202) com um ganho de código.
  19. 26. O método, de acordo com a reivindicação 24 ou 25, caracterizado por compreender ainda: com base no código do codebook adaptativo (204) e no código combinado, gerar um fator relacionado com a vocalização do frame anterior do sinal de áudio, e armazenar coeficientes de LPC que descrevem a informação do envelope espectral para o frame atual do sinal de áudio.
  20. 27. Um meio computacional não transitório que armazena as instruções para realizar, caracterizado por executar num computador, um método para sintetizar um sinal de áudio, de acordo com qualquer uma das reivindicações de 15 a 26.
PT147025118T 2013-01-29 2014-01-28 Aparelho, método e meio computacional para sintetizar um sinal de áudio PT2951819T (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201361758098P 2013-01-29 2013-01-29

Publications (1)

Publication Number Publication Date
PT2951819T true PT2951819T (pt) 2017-06-06

Family

ID=50033504

Family Applications (1)

Application Number Title Priority Date Filing Date
PT147025118T PT2951819T (pt) 2013-01-29 2014-01-28 Aparelho, método e meio computacional para sintetizar um sinal de áudio

Country Status (20)

Country Link
US (3) US10431232B2 (pt)
EP (1) EP2951819B1 (pt)
JP (1) JP6082126B2 (pt)
KR (1) KR101737254B1 (pt)
CN (1) CN105009210B (pt)
AR (1) AR094683A1 (pt)
AU (1) AU2014211524B2 (pt)
BR (1) BR112015018023B1 (pt)
CA (1) CA2899059C (pt)
ES (1) ES2626977T3 (pt)
HK (1) HK1217564A1 (pt)
MX (1) MX347316B (pt)
MY (1) MY183444A (pt)
PL (1) PL2951819T3 (pt)
PT (1) PT2951819T (pt)
RU (1) RU2618919C2 (pt)
SG (1) SG11201505903UA (pt)
TW (1) TWI544481B (pt)
WO (1) WO2014118156A1 (pt)
ZA (1) ZA201506318B (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2951819T3 (pl) * 2013-01-29 2017-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie, sposób i nośnik komputerowy do syntetyzowania sygnału audio

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6240386B1 (en) 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6242748B1 (en) 1999-08-10 2001-06-05 Edax, Inc. Methods and apparatus for mounting an X-ray detecting unit to an electron microscope
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US6996523B1 (en) 2001-02-13 2006-02-07 Hughes Electronics Corporation Prototype waveform magnitude quantization for a frequency domain interpolative speech codec system
WO2003097258A1 (fr) 2002-05-20 2003-11-27 Matsushita Electric Industrial Co., Ltd. Procede et dispositif de lavage
US20060089836A1 (en) * 2004-10-21 2006-04-27 Motorola, Inc. System and method of signal pre-conditioning with adaptive spectral tilt compensation for audio equalization
US7475103B2 (en) 2005-03-17 2009-01-06 Qualcomm Incorporated Efficient check node message transform approximation for LDPC decoder
CA2603246C (en) * 2005-04-01 2012-07-17 Qualcomm Incorporated Systems, methods, and apparatus for anti-sparseness filtering
SI1875463T1 (sl) * 2005-04-22 2019-02-28 Qualcomm Incorporated Sistemi, postopki in naprava za glajenje faktorja ojačenja
EP1722360B1 (en) 2005-05-13 2014-03-19 Harman Becker Automotive Systems GmbH Audio enhancement system and method
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8239191B2 (en) * 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
MY146431A (en) * 2007-06-11 2012-08-15 Fraunhofer Ges Forschung Audio encoder for encoding an audio signal having an impulse-like portion and stationary portion, encoding methods, decoder, decoding method, and encoded audio signal
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
RU2443028C2 (ru) * 2008-07-11 2012-02-20 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Устройство и способ расчета параметров расширения полосы пропускания посредством управления фреймами наклона спектра
KR101508819B1 (ko) * 2009-10-20 2015-04-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
WO2011148230A1 (en) * 2010-05-25 2011-12-01 Nokia Corporation A bandwidth extender
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US9706314B2 (en) * 2010-11-29 2017-07-11 Wisconsin Alumni Research Foundation System and method for selective enhancement of speech signals
JP5328883B2 (ja) * 2011-12-02 2013-10-30 パナソニック株式会社 Celp型音声復号化装置およびcelp型音声復号化方法
RU2660605C2 (ru) * 2013-01-29 2018-07-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция заполнения шумом
PL2951819T3 (pl) * 2013-01-29 2017-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie, sposób i nośnik komputerowy do syntetyzowania sygnału audio
PL3067890T3 (pl) * 2013-01-29 2018-06-29 Fraunhofer Ges Forschung Koder audio, dekoder audio, sposób dostarczania zakodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i zakodowana reprezentacja, wykorzystujące adaptacyjne względem sygnału powiększanie szerokości pasma
WO2014118192A2 (en) * 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling without side information for celp-like coders
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
BR112016008662B1 (pt) * 2013-10-18 2022-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Método, decodificador e codificador para codificação e decodificação de um sinal de áudio utilizando informação de modulação espectral relacionada com a fala
BR112016008544B1 (pt) * 2013-10-18 2021-12-21 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador para codificar e decodificador para decodificar um sinal de áudio, método para codificar e método para decodificar um sinal de áudio.
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9672843B2 (en) * 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
US9373342B2 (en) * 2014-06-23 2016-06-21 Nuance Communications, Inc. System and method for speech enhancement on compressed speech
CN105225671B (zh) * 2014-06-26 2016-10-26 华为技术有限公司 编解码方法、装置及***
CN105225670B (zh) * 2014-06-27 2016-12-28 华为技术有限公司 一种音频编码方法和装置

Also Published As

Publication number Publication date
ZA201506318B (en) 2016-07-27
CN105009210B (zh) 2018-04-10
EP2951819A1 (en) 2015-12-09
US11996110B2 (en) 2024-05-28
SG11201505903UA (en) 2015-08-28
BR112015018023A2 (pt) 2017-08-22
CA2899059A1 (en) 2014-08-07
TW201435862A (zh) 2014-09-16
US20220293114A1 (en) 2022-09-15
EP2951819B1 (en) 2017-03-01
MY183444A (en) 2021-02-18
RU2015136788A (ru) 2017-03-06
US20150332694A1 (en) 2015-11-19
KR101737254B1 (ko) 2017-05-17
RU2618919C2 (ru) 2017-05-12
BR112015018023B1 (pt) 2022-06-07
US20190378528A1 (en) 2019-12-12
KR20150112028A (ko) 2015-10-06
AU2014211524B2 (en) 2016-07-07
HK1217564A1 (zh) 2017-01-13
MX347316B (es) 2017-04-21
MX2015009749A (es) 2015-11-06
CA2899059C (en) 2018-05-15
TWI544481B (zh) 2016-08-01
AR094683A1 (es) 2015-08-19
US10431232B2 (en) 2019-10-01
US11373664B2 (en) 2022-06-28
JP6082126B2 (ja) 2017-02-15
WO2014118156A1 (en) 2014-08-07
ES2626977T3 (es) 2017-07-26
JP2016509694A (ja) 2016-03-31
CN105009210A (zh) 2015-10-28
PL2951819T3 (pl) 2017-08-31
AU2014211524A1 (en) 2015-09-17

Similar Documents

Publication Publication Date Title
KR101785885B1 (ko) 적응적 대역폭 확장 및 그것을 위한 장치
CN105723455B (zh) 用于编码音频信号的编码器、音频发送***和用于确定校正值的方法
BRPI0607691B1 (pt) método e equipamento para codificação de fala em banda larga
US11881228B2 (en) Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information
WO2010127617A1 (en) Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal
US20190228787A1 (en) Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information
US20220293114A1 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
JP5323144B2 (ja) 復号装置およびスペクトル整形方法
JP6001451B2 (ja) 符号化装置及び符号化方法
Bäckström et al. Pre-and Postfiltering
JP5323145B2 (ja) 復号装置およびスペクトル整形方法