BR112016024372B1 - dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear - Google Patents

dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear Download PDF

Info

Publication number
BR112016024372B1
BR112016024372B1 BR112016024372-2A BR112016024372A BR112016024372B1 BR 112016024372 B1 BR112016024372 B1 BR 112016024372B1 BR 112016024372 A BR112016024372 A BR 112016024372A BR 112016024372 B1 BR112016024372 B1 BR 112016024372B1
Authority
BR
Brazil
Prior art keywords
linear prediction
coefficients
sampling frequency
power spectrum
prediction coefficients
Prior art date
Application number
BR112016024372-2A
Other languages
English (en)
Other versions
BR112016024372A2 (pt
Inventor
Nobuhiko Naka
Vesa Ruoppila
Original Assignee
Ntt Docomo, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo, Inc. filed Critical Ntt Docomo, Inc.
Publication of BR112016024372A2 publication Critical patent/BR112016024372A2/pt
Publication of BR112016024372B1 publication Critical patent/BR112016024372B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • Picture Signal Circuits (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

DISPOSITIVO DE CONVERSÃO DE COEFICIENTE DE PREVISÃO LINEAR E MÉTODO DE CONVERSÃO DE COEFICIENTE DE PREVISÃO LINEAR. O propósito da presente invenção é estimar, com uma pequena quantidade de computação, um filtro de síntese de previsão linear após a conversão de uma frequência de amostragem interna. Um dispositivo de conversão de coeficiente de previsão linear é um dispositivo que converte primeiros coeficientes de previsão linear calculados em uma primeira frequência de amostragem para segundos coeficientes de previsão linear em uma segunda frequência de amostragem diferente da primeira frequência de amostragem, que inclui um meio para calcular, sobre o eixo real do círculo unitário, um espectro de energia correspondendo aos segundos coeficientes de previsão linear na segunda frequência de amostragem baseado nos primeiros coeficientes de primeiros coeficientes de previsão linear ou um parâmetro equivalente, um meio para calcular, sobre o eixo real do círculo unitário, coeficientes de autocorrelação a partir do espectro de energia, e um meio para converter os coeficientes de autocorrelação para os segundos coeficientes de previsão linear na segunda frequência de amostragem.

Description

CAMPO TÉCNICO
[001] A presente invenção refere-se a um dispositivo de conversão de coeficiente de predição linear e a um método de conversão de coeficiente de predição linear.
TÉCNICA ANTERIOR
[002] Um modelo de todos os polos auto-regressivos é um método que é frequentemente usado para modelagem de um envelope espectral em curto prazo na codificação de fala e áudio, onde um sinal de entrada é adquirido para certa unidade coletiva ou um quadro com um comprimento especificado, um parâmetro do modelo é codificado e transmitido para um decodificador junto com outro parâmetro como informação de transmissão. O modelo de todos os polos auto-regressivos é geralmente estimado por predição linear e representado como um filtro de síntese de predição linear.
[003] Uma das últimas técnicas de codificação de fala e de áudio típicas é ITU-T Recommendation G.718. A Recommendation descreve uma estrutura de quadro típica para codificação usando um filtro de síntese de predição linear, e um método de estimativa, um método de codificação, um método de interpolação, e um método de uso de um filtro de síntese de predição linear em detalhe. Além disso, codificação de fala e de áudio na base de predição linear também é descrita em detalhe na Literatura de Patente 2.
[004] Na codificação de fala e de áudio que pode manipular várias frequências de amostragem de entrada/saída e operar em uma ampla faixa de taxas de bits, que variam de quadro para quadro, é geralmente necessário trocar a frequência de amostragem interna de um codificador. Devido a mesma operação ser necessária também em um decodificador, a decodificação é realizada na mesma frequência de amostragem interna como no codificador. A figura 1 mostra um exemplo onde a frequência de amostragem interna muda. Neste exemplo, a frequência de amostragem interna é 16.000 Hz e, um quadro i, e é 12.800 Hz no quadro i-1 anterior. O filtro de síntese de predição linear que representa as características de um sinal de entrada no quadro i-1 anterior precisa ser estimado novamente após reamostrar o sinal de entrada na frequência de amostragem interna alterada de 16.000 Hz, ou convertido para o que corresponde à frequência de amostragem interna alterada de 16.000 Hz. A razão em que o filtro de síntese de predição linear precisa ser calculado e uma frequência de amostragem interna alterada é obter o estado interno correto do filtro de síntese de predição linear para o sinal de entrada atual e realizar interpolação a fim de obter um modelo que é temporariamente mais suave.
[005] Um método para obter outro filtro de síntese de predição linear na base das características de certo filtro de síntese de predição linear é calcular um filtro de síntese de predição linear após conversão de uma frequência de resposta desejada após conversão em um domínio de frequência como mostrado na figura 2. Neste exemplo, os coeficientes de LSF são introduzidos como um parâmetro representando o filtro de síntese de predição linear. Eles podem ser coeficientes de LSP, coeficientes de ISF, coeficientes de ISP ou coeficientes de reflexão, que são geralmente conhecidos como parâmetros equivalentes a coeficientes de predição linear. Primeiro, os coeficientes de predição linear são calculados a fim de obter um espectro de potência Y(ω) do filtro de síntese de predição linear na primeira frequência de amostragem interna (001). Esta etapa pode ser omitida quando os coeficientes de predição linear são conhecidos. Em seguida, o espectro de potência Y(ω) do filtro de síntese de predição linear, que é determinado pelos coeficientes de predição linear obtidos, é calculado (002). Então, o espectro de potência obtido é modificado para um espectro de potência Y'(ω) (003) desejado. Os coeficientes de autocorrelação são calculados a partir do espectro de potência (004) modificado. Os coeficientes de predição linear são calculados a partir dos coeficientes de autocorrelação (005). A relação entre os coeficientes de autocorrelação e os coeficientes de predição linear é conhecida como equação de Yule-Walker, e o algoritmo de Levinson-Durbin é bem conhecido como uma solução dessa equação.
[006] Este algoritmo é eficaz na conversão de uma frequência de amostragem do filtro de síntese de predição linear descrito acima. Isto é porque, embora um sinal que está temporariamente à frente de um sinal em um quadro para ser codificado, que é denominado um sinal de olhar para frente, é geralmente usado em análise de predição linear, o sinal de olhar para frente não pode ser usado ao realizar análise de predição linear novamente em um decodificador.
[007] Como descrito acima, na codificação de fala e de áudio com duas frequências de amostragem internas diferentes, é preferido usar um espectro de potência a fim de converter a frequência de amostragem interna de um filtro de síntese de predição linear conhecido. No entanto, porque o cálculo de um espectro de potência é de computação complexa, existe um problema de que a quantidade de computação é grande.
LISTA DE CITAÇÕES Literatura de Patente
[008] Literatura não Patente 1: Recomendação G.718 ITU-T
[009] Literatura não Patente 2: Codificação e síntese de fala, W.B. Kleijn, K.K. Pariwal, et. al. ELSEVIER.
SUMÁRIO DA INVENÇÃO Problema Técnico
[0010] Como descrito acima, existe um problema de que, em um esquema de codificação que um filtro de síntese de predição linear com duas frequências de amostragem internas diferentes, uma grande quantidade de computação é necessária para converter o filtro de síntese de predição linear em certa frequência de amostragem interna em uma de uma frequência de amostragem interna desejada.
Solução para o Problema
[0011] Para resolver o problema acima, um dispositivo de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção é um dispositivo que converte primeiros coeficientes de predição linear calculados em uma primeira frequência de amostragem para segundos coeficientes de predição linear em uma segunda frequência de amostragem diferente a partir da primeira frequência de amostragem, que inclui um meio para calcular, sobre o eixo real do círculo unitário, um espectro de potência correspondendo aos segundos coeficientes de predição linear na segunda frequência de amostragem baseado nos primeiros coeficientes de predição linear ou um parâmetro equivalente, um meio de calcular, sobre o eixo real do círculo unitário, coeficientes de autocorrelação a partir do espectro de potência, e um meio para converter os coeficientes de autocorrelação para os segundos coeficientes de predição linear na segunda frequência de amostragem. Nesta configuração, é possível reduzir eficazmente a quantidade de computação.
[0012] Além disso, no dispositivo de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção, o espectro de potência correspondendo aos segundos coeficientes de predição linear pode ser obtido calculando um espectro de potência usando os primeiros coeficientes de predição linear nos pontos sobre o eixo real correspondendo ao número NI de frequências diferentes, onde N1=1+(F1/F2)(N2-1), quando a primeira frequência de amostragem é F1 e a segunda frequência de amostragem é F2 (onde F1<F2), e extrapolar o espectro de potência calculado usando os primeiros coeficientes de predição linear para o número (N2-N1) de componentes de espectro de potência. Nesta configuração, é possível reduzir eficazmente a quantidade de computação quando a segunda frequência de amostragem é mais alta do que a primeira frequência de amostragem.
[0013] Além disso, no dispositivo de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção, o espectro de potência correspondendo aos segundos coeficientes de predição linear pode ser obtido calculando um espectro de potência usando os primeiros coeficientes de predição linear nos pontos sobre o eixo real correspondendo ao número NI de frequências diferentes, onde N1=1+(F1/F2)(N2-1), quando a primeira frequência de amostragem é F1 e a segunda frequência de amostragem é F2 (onde F1<F2). Nesta configuração, é possível reduzir eficazmente a quantidade de computação quando a segunda frequência de amostragem é mais baixa do que a primeira frequência de amostragem.
[0014] Um aspecto da presente invenção pode ser descrito como uma invenção de um dispositivo como mencionado acima e, além disso, também pode ser descrito como uma invenção de um método como a seguir. Eles incidem sob categorias diferentes, mas são substancialmente a mesma invenção e obtêm operação e efeitos similares.
[0015] Especificamente, um método de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção é um método de conversão de coeficiente de predição linear realizado por um dispositivo que converte primeiros coeficientes de predição linear calculados em uma primeira frequência de amostragem para segundos coeficientes de predição linear em uma segunda frequência de amostragem diferente da primeira frequência de amostragem, o método incluindo uma etapa de calcular, sobre o eixo real do círculo unitário, um espectro de potência correspondendo aos segundos coeficientes de predição linear na segunda frequência de amostragem baseado nos primeiros coeficientes de predição linear ou um parâmetro equivalente, uma etapa de calcular, sobre o eixo real do círculo unitário, coeficientes de autocorrelação a partir do espectro de potência e uma etapa de converter os coeficientes de autocorrelação para os segundos coeficientes de predição linear na segunda frequência de amostragem.
[0016] Além disso, um método de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção pode obter o espectro de potência correspondendo aos segundos coeficientes de predição linear calculando um espectro de potência usando os primeiros coeficientes de predição linear nos pontos sobre o eixo real correspondendo ao número NI de frequências diferentes, onde N1=1+(F1/F2)(N2-1), quando a primeira frequência de amostragem é F1 e a segunda frequência de amostragem é F2 (onde F1<F2), e extrapolando o espectro de potência calculado usando os primeiros coeficientes de predição linear para o número (N2-N1) de componentes de espectro de potência.
[0017] Além disso, um método de conversão de coeficiente de predição linear de acordo com um aspecto da presente invenção pode obter o espectro de potência correspondendo aos segundos coeficientes de predição linear calculando um espectro de potência usando os primeiros coeficientes de predição linear nos pontos sobre o eixo real correspondendo ao número NI de frequências diferentes, onde N1=1+(F1/F2)(N2-1), quando a primeira frequência de amostragem é F1 e a segunda frequência de amostragem é F2 (onde F1<F2).
Efeitos Vantajosos da Invenção
[0018] É possível estimar um filtro de síntese de predição linear após a conversão de uma frequência de amostragem interna com uma quantidade menor de computação do que os meios existentes.
BREVE DESCRIÇÃO DOS DESENHOS
[0019] A figura 1 é uma vista mostrando a relação entre a comutação de uma frequência de amostragem interna e um filtro de síntese de predição linear.
[0020] A figura 2 é uma vista mostrando a conversão de coeficientes de predição linear.
[0021] A figura 3 é um fluxograma de conversão 1.
[0022] A figura 4 é um fluxograma de conversão 2.
[0023] A figura 5 é um diagrama de bloco de uma modalidade da presente invenção.
[0024] A figura 6 é uma vista mostrando a relação entre um círculo unitário e função de cosseno.
DESCRIÇÃO DAS MODALIDADES
[0025] As modalidades de um dispositivo, um método e um programa são descritos a seguir com referência aos desenhos. Notar que, na descrição dos desenhos, os mesmos elementos são indicados pelos mesmos símbolos de referência e a descrição redundante dos mesmos é omitida.
[0026] Primeiro, as definições necessárias para descrever as modalidades são descritas a seguir.
[0027] Uma resposta de um filtro linear de predição auto-regressiva na ordem de N- (que é referida a seguir como um filtro de síntese de predição linear) (1)
Figure img0001
pode ser adaptada ao espectro de potência Y(ω) calculando a autocorrelação (2)
Figure img0002
para um espectro de potência Y(ω) conhecido em uma frequência angular ωG[-π, π] e, usando os coeficientes de autocorrelação da ordem de N-, resolver os coeficientes de predição linear ai,a2,...,anpelo método de Levinson-Durbin como um método típico, por exemplo.
[0028] Tal geração de um modelo auto-regressivo usando um espectro de potência conhecido pode ser usado também para modificação de um filtro de síntese de predição linear 1/A(z) no domínio de frequência. Isto é obtido calculando o espectro de potência de um filtro conhecido (3)
Figure img0003
e modificando o espectro de potência Y(ω) obtido por um método apropriado que é adequado para o fim de obter o espectro de potência Y'(ω) modificado, então calculando os coeficientes de autocorrelação de Y'(ω) pela equação (2) acima, e obtendo os coeficientes de predição linear do filtro 1/A'(z) modificado pelo algoritmo de Levinson-Durbin ou um método similar.
[0029] Enquanto a equação (2) não pode ser calculada analiticamente exceto para casos simples, a aproximação de retângulo pode ser usada como a seguir, por exemplo, (4)
Figure img0004
onde Ω indica o número M de frequências colocadas a intervalos regulares na frequência angular [-π,π]. Quando a propriedade simétrica de Y(-ω)=-Y(ω) é usada, a adição mencionada acima precisa somente avaliar a frequência angular ω£[0, π], que corresponde à metade superior do círculo unitário. Assim, é preferido em termos da quantidade de computação que a aproximação de retângulo representada pela equação (4) acima seja alterada como a seguir (5)
Figure img0005
onde Ω indica o número (N-2) de frequências colocadas a intervalos regulares em (0, π), excluindo Oeπ.
[0030] Doravante, as frequências espectrais de linha (que são referidas a seguir como LSF) como um meio equivalente de expressão de coeficientes de predição linear são descritas a seguir.
[0031] A representação por LSF é usada em várias técnicas de codificação de fala e de áudio para a quantidade de recursos de um filtro de síntese de predição linear, e a operação e codificação de um filtro de síntese de predição linear. O LSF caracteriza unicamente a ordem polinomial A(z) Nâ pelo número n de parâmetros que são diferentes de coeficientes de predição linear. O LSF tem características tal como ele garante facilmente a estabilidade de um filtro de síntese de predição linear, é interpretada intuitivamente no domínio de frequência, é menos provável de ser afetado por erros de quantização do que outros parâmetros tais como coeficientes de predição linear e coeficientes de reflexão, é apropriado para interpolação e semelhantes.
[0032] Para o fim de uma modalidade da presente invenção, LSF é definido como a seguir.
[0033] A decomposição de LSF da ordem polinomial A(z) Nâ pode ser representada como a seguir usando o deslocamento de um número inteiro onde K≥0 (6) A(z)={P(z)+Q(z)}/2 onde
Figure img0006
[0034] A equação (6) indica que P(z) é simétrica e Q(z) é anti-simétrica como a seguir
Figure img0007
[0035] Tal propriedade simétrica é uma característica importante na decomposição de LSF.
[0036] É óbvio que P(z) e Q(z) têm, cada um, uma raiz em z=±l. Estas raízes óbvias são como mostrado na tabela 1 como n e K. Assim, polinomiais representando as raízes óbvias de P(z) e Q(z) são definidas como PT(Z) e QT(Z), respectivamente. Quando P(z) não tem uma raiz óbvia, PT(Z) é 1. O mesmo se aplica a Q(z).
[0037] LSF de A(z) é uma raiz trivial do ângulo de fase positiva de P(z) e Q(z). Quando o polinomial A(z) é a fase mínima, isto é, quando todas as raízes de P(z) e Q(z) são dispostas alternadamente sobre o círculo unitário. O número de raízes complexas de P(z) e Q(z) e mp é ma, respectivamente. A tabela 1 mostra a relação de mp e ma com a ordem n e deslocamento K.
[0038] Quando as raízes complexas de P(z), que é o ângulo de fase positiva, são representadas como
Figure img0008
-7, e as raízes de Q(z) são representadas como
Figure img0009
[0039] As posições das raízes do polinomial A(z), que é a fase mínima, podem ser representadas como a seguir. (7)
Figure img0010
[0040] Na codificação de fala e de áudio, o deslocamento K=0 OU K=1 é usado. Quando K=0, ele é geralmente chamado de frequência espectral de transcondutância (ISF), e quando K=1, ele é geralmente chamado de LSF em um sentido mais estreito do que na descrição de uma modalidade da presente invenção. Notar que, no entanto, a representação usando deslocamento pode manipular tanto ISF como LSF em uma forma unificada. Em muitos casos, um resultado obtido por LSF pode ser aplicado como é para dar K>0 OU pode ser generalizado.
[0041] Quando K=0, a representação de LSF tem somente o número (mp+mQ=n-l) de parâmetros de frequência como mostrado na tabela 1. Assim, um parâmetro mais é requerido para unicamente representar A(z), e o enésimo coeficiente de reflexão (que é referido a seguir como yn) de A(z) é tipicamente usado. Este parâmetro é introduzido na decomposição de LSF como o próximo fator. (8)
Figure img0011
onde yn é o enésimo coeficiente de reflexão de A(z) que começa com Q(z), e é tipicamente yn=an.
[0042] Quando K=1, O número de parâmetros (mp+mQ=n) é obtido pela decomposição de LSF, e é possível representar unicamente A(z). Neste caso, u=l TABELA 1
Figure img0012
[0043] Em consideração ao fato de que raízes não óbvias, excluindo raízes óbvias, são um par de números complexos sobre o círculo unitário e obtêm polinomiais simétricos, a seguinte equação é obtida.
Figure img0013
[0044] Do mesmo modo
Figure img0014
[0045] Nesses polinomiais,
Figure img0015
[0046] Representam completamente P(z) e Q(z) usando o deslocamento dado K e v que é determinado pela ordem n de A(z). Esses coeficientes podem ser obtidos diretamente a partir das expressões (6) e (8).
[0047] Quando z=ejωe usando a seguinte relação
Figure img0016
as expressões (9) e (10) podem ser representadas como a seguir
Figure img0017
Figure img0018
onde
Figure img0019
Figure img0020
[0048] Especificamente, LSF do polinomial A(z) são as raízes de R(ω) e S(ω) na frequência angular ωe(0, π).
[0049] Os polinomiais Chebyshev do primeiro tipo, que é usado em uma modalidade da presente invenção, são descritos a seguir.
[0050] Os polinomiais Chebyshev do primeiro tipo são definidos como a seguir usando uma relação de recorrência
Figure img0021
[0051] Notar que os valores iniciais são To(x)=l e Ti(x)=x, respectivamente. Para x onde [-1, 1], os polinomiais Chebyshev podem ser representados como a seguir
Figure img0022
[0052] Uma modalidade da presente invenção explica que a equação (15) provê um método simples para calcular coskω (onde k=2,3,...) que começa com cosω e cosO=l. Especificamente, com o uso da equação (16), a equação (15) é reescrita na seguinte forma
Figure img0023
[0053] Quando a conversão ω=arccosx é usada. Os primeiros polinomiais obtidos a partir da equação (15) são como a seguir
Figure img0024
[0054] Quando as equações (13) e (14) para xe[-l,l] são substituídas por esses polinomiais Chebyshev, as seguintes equações são obtidas
Figure img0025
[0055] Quando LSFωi é conhecido para i=0,l,...,mp+mQ-l, as seguintes equações são obtidas usando o cosseno de LSF XÍ=COSOÜÍ(LSP)
Figure img0026
Figure img0027
[0056] Os coeficientes roe so podem ser obtidos comparando as equações (18) e (19) com (20) e (21) na base de mP e mQ.
[0057] As equações (20) e (21) são escritas como
Figure img0028
[0058] Esses polinomiais podem ser calculados eficazmente para um determinado x por um método conhecido como o método de Horner. O método de Horner obtém R(x)=bo(x) pelo uso da seguinte relação recursiva bk(x)=xbk+i(x)+rk onde o valor inicial é bmp{x) = rmp O mesmo se aplica a S(x).
[0059] Um método de calcular os coeficientes dos polinomiais das equações (22) e (23) é descrito a seguir usando um exemplo. Presume-se neste exemplo que a ordem de A(z) é 16 (n=16). Consequentemente, mp=ma=8 neste caso. A expansão em série da equação (18) pode ser representada na forma da equação (22) pela substituição e simplificação pelos polinomiais Chebyshev. Como um resultado, os coeficientes do polinomial da equação (22) são representados como a seguir usando o coeficiente pi do polinomial P(z).
Figure img0029
[0060] Os coeficientes de P(z) podem ser obtidos a partir da equação (6). Este exemplo pode ser aplicado também ao polinomial da equação (23) usando a mesma equação e usando os coeficientes de Q(z). Além disso, a mesma equação para calcular os coeficientes de R(x) e S(x) pode derivar facilmente outra ordem n e deslocamento K também.
[0061] Além disso, quando as raízes das equações (20) e (21) são conhecidas, os coeficientes podem ser obtidos a partir das equações (20) e (21).
[0062] O esboço de processamento de acordo com uma modalidade da presente invenção é descrito a seguir.
[0063] Uma modalidade da presente invenção provê um método e dispositivo de cálculo efetivo para, ao converter um filtro de síntese de predição linear calculado antecipadamente por um codificador ou um decodificador em uma primeira frequência de amostragem para um em uma segunda frequência de amostragem, calcular o espectro de potência do filtro de síntese de predição linear e modificar o mesmo para a segunda frequência de amostragem, e então obter coeficientes de autocorrelação a partir do espectro de potência modificado.
[0064] Um método de cálculo para o espectro de potência de um filtro de síntese de predição linear de acordo com uma modalidade da presente invenção é descrito a seguir. O cálculo do espectro de potência usa a decomposição de LSF da equação (6) e as propriedades dos polinomiais P(z) e Q(z). Usando a decomposição de LSF e os polinomiais Chebyshev descritos acima, o espectro de potência pode ser convertido para o eixo real do círculo unitário.
[0065] Com a conversão para o eixo real, é possível obter um método eficaz para calcular um espectro de potência em uma frequência arbitrária em ωG[0, π]. Isto é porque é possível eliminar as funções transcendentais uma vez que o espectro de potência é representado por polinomiais. Particularmente, é possível simplificar o cálculo do espectro de potência em ω=0, ω=π/2 e ω=π. A mesma simplificação é aplicável também para LSF onde tanto um de P(z) ou de Q(z) é zero. Tais propriedades são vantajosas comparadas com FFT, que é geralmente usado para o cálculo do espectro de potência.
[0066] Sabe-se que o espectro de potência de A(z) pode ser representado como a seguir usando a decomposição de LSF. (26) |A(ω)|2={|P(ω)|2+|Q(ω)|2}/4
[0067] Uma modalidade da presente invenção usa os polinomiais Chebyshev como um modo para calcular mais eficazmente o espectro de potência |A(ω)|2de A(z) comparado com o caso de aplicar diretamente a equação (26). Especificamente, o espectro de potência |A(ω)|2é calculado sobre o eixo real do círculo unitário como representado pela seguinte equação, convertendo uma variável para x=cosω e usando a decomposição de LSF pelos polinomiais Chebyshev.
Figure img0030
(1) para (4) corresponde a (1) a (4) na tabela 1, respectivamente.
[0068] A equação (27) é provada como segue.
[0069] As seguintes equações são obtidas a partir das equações (11) e (12).
Figure img0031
[0070] Os fatores que representam as raízes óbvias de P(ω) e Q(ω) são, respectivamente, como a seguir.
Figure img0032
[0071] A aplicação da substituição cosω=x e cos2ω=2x2-l para | Pηω;| e I Q.T((JÜ) I, respectivamente, dá a equação (27).
[0072] Os polinomiais R(x) e S(x) podem ser calculados pelo método de Horner descrito acima. Além disso, quando x para calcular R(x) e S(x) é conhecido, o cálculo de uma função trigonométrica pode ser omitido armazenando x em uma memória.
[0073] O cálculo do espectro de potência de A(z) pode ser mais simplificado. Primeiro, no caso de cálculo com LSF, um de R(x) e S(x) na equação (27) correspondente é zero. Quando o deslocamento é K=1 e a ordem n é um número para a equação (27) é simplificada como a seguir, z
Figure img0033
[0074] Além disso, no caso de ω={0,π/2,π}, ele é simplificado quando x={l,O,-l}. As equações são como a seguir quando o deslocamento é K=1 e a ordem n é um número par, que são os mesmos como no exemplo acima.
Figure img0034
[0075] Os resultados similares podem ser obtidos facilmente também quando o deslocamento é K=0 e a ordem n é um número ímpar.
[0076] O cálculo dos coeficientes de autocorrelação de acordo com uma modalidade da presente invenção é descrito abaixo.
[0077] Na equação (5), quando um frequência Ω+=Δ,2Δ,...,(N-1)Δ onde N é um número ímpar e o intervalo das frequências é Δ=π/(N-1) é definido, o cálculo de autocorrelação contém o espectro de potência ω=0,π/2,π simplificado descrito acima. Porque a normalização dos coeficientes de autocorrelação por 1/N não afeta os coeficientes de predição linear a serem obtidos como um resultado, qualquer valor positivo pode ser usado.
[0078] Ainda, no entanto, o cálculo da equação (5) necessita de coskω onde k=l,2,...,n para cada um do número (N-2) de frequências. Assim, a propriedade simétrica de coskω é usada.
Figure img0035
[0079] As seguintes características também são usadas.
Figure img0036
onde |x| indica que o número inteiro maior não excede x. Notar que a equação (29) é simplificada para 2,0,-2,0,2,0,... para k=0,l,2,....
[0080] Além disso, pela conversão para x=cosω, os coeficientes de autocorrelação são movidos para o eixo real do círculo unitário. Para este fim, a variável X(x)=Y(arccos x) é introduzida. Isto possibilita o cálculo de coskω pelo uso da equação (15).
[0081] Devido ao acima, a aproximação de autocorrelação da equação (5) pode ser substituída pela seguinte equação.
Figure img0037
onde Tk(x)=2xTk-i(x)-Tk-2(x) k=2,3,...,n, e To(x)=l, Ti(x)=cosx como descrito acima. Quando a propriedade simétrica da equação (28) é tomada em consideração, o último termo da equação (30) precisa ser calculado somente quando xeA={cosΔ,cos2Δ,...,(N-3)Δ/2}, e o número (N-3)/2 de valores de cosseno pode ser armazenado em uma memória. A figura 6 mostra a relação entre a frequência A e a função de cosseno quando N=31.
[0082] Um exemplo da presente invenção é descrito a seguir. Neste exemplo, um caso de converter um filtro de síntese de predição linear calculado em uma primeira frequência de amostragem de 16.000 Hz para o em uma segunda frequência de amostragem de 12.800 Hz (que é referida a seguir como conversão 1) e um caso de converter um filtro de síntese de predição linear calculado em uma primeira frequência de amostragem de 12.800 Hz para o em uma segunda frequência de amostragem de 16.000 Hz (a seguir como conversão 2) são usados. Essas duas frequências de amostragem têm uma relação de 4,5 e são geralmente usadas na codificação de fala e áudio. Cada uma da conversão 1 e da conversão 2 deste exemplo é realizada no filtro de síntese de predição linear no quadro anterior quando a frequência de amostragem interna mudou e pode ser realizada em qualquer um de um codificador e um decodificador. Tal conversão é necessária para estabelecer o estado interno correto para o filtro de síntese de predição linear no quadro atual e para realizar interpolação do filtro de síntese de predição linear de acordo com o tempo.
[0083] O processamento neste exemplo é descrito a seguir com referência aos fluxogramas das figuras 3 e 4.
[0084] Para calcular um espectro de potência e coeficientes de autocorrelação usando um ponto de frequência comum em ambos os casos das conversões 1 e 2, o número de frequências quando uma frequência de amostragem é 12.800 Hz é determinado como NL=1+(12,800HZ/16,000HZ)(N- 1). Notar que N é o número de frequências em uma frequência de amostragem de 16.000 Hz. Como descrito anteriormente, é preferido que N e NL sejam ambos os números ímpares a fim de conter frequências em que o cálculo de um espectro de potência e de coeficientes de autocorrelação é simplificado. Por exemplo, quando N é 31, 41, 51, 61, o NL correspondente é 25, 33, 41, 49. O caso onde N=31 e NL=25 são descritos como um exemplo abaixo (etapa S000).
[0085] Quando o número de frequências a ser usado para o cálculo de um espectro de potência e coeficientes de autocorrelação no domínio onde a frequência de amostragem é 16.000 Hz é N=31, o intervalo de frequências é Δ=π/30, e o número de elementos requeridos para o cálculo de autocorrelação contido em A é (N-3)/2=14.
[0086] A conversão 1 que é realizada em um codificador e um decodificador sob aas condições acima é realizada no procedimento seguinte.
[0087] Determinar os coeficientes de polinomiais R(x) e S(x) usando as equações (20) e (21) de raízes obtidas pelo deslocamento K=0 OU K=1e LSF que correspondem a um filtro de síntese de predição linear obtido em uma frequência de amostragem de 16.000 Hz, que é a primeira frequência de amostragem (etapa S001).
[0088] Calcular o espectro de potência do filtro de síntese de predição linear na segunda frequência de amostragem até 6.400 Hz, que é a frequência de Nyquist da segunda frequência de amostragem. Devido a esta frequência de corte corresponder a ω=(4/5)π na primeira frequência de amostragem, um espectro de potência é calculado usando a equação (27) no número NL=25 de frequências no lado baixo. Para o cálculo de R(x) e S(x), o método de Horner pode ser usado para reduzir o cálculo. Não há necessidade de calcular um espectro de potência para as 6 (=N-NL) frequências restantes sobre o lado alto (etapa S002).
[0089] Calcular os coeficientes de autocorrelação correspondendo aos espectros de energia obtidos na etapa S002 usando a equação (30). Nesta etapa, N na equação (30) é fixado em NL=25, que é p número de frequências na segunda frequência de amostragem (etapa S003).
[0090] Derivar os coeficientes de predição linear pelo método de Levinson-Durbin ou um método similar com uso do coeficiente de autocorrelação obtido na etapa S003, e obter um filtro de síntese de predição linear na segunda frequência de amostragem (etapa S004).
[0091] Converter o coeficiente de predição linear obtido na etapa S004 em LSF (etapa S005).
[0092] A conversão 2 que é realizada em um codificador ou um decodificador pode ser obtida no procedimento seguinte, do mesmo modo como a conversão 1.
[0093] Determinar os coeficientes de polinomiais R(x) e S(x) usando as equações (20) e (21) de raízes obtidas pelo deslocamento K=0 OU K=1e LSF que correspondem a um filtro de síntese de predição linear obtido em uma frequência de amostragem de 12.800 Hz, que é a primeira frequência de amostragem (etapa S011).
[0094] Calcular o espectro de potência do filtro de síntese de predição linear na segunda frequência de amostragem até 6.400 Hz, que é a Frequência de Nyquist da primeira frequência de amostragem, primeiro. Esta frequência de corte corresponde a ω=π, e um espectro de potência é calculado usando a equação (27) no número NL=25 de frequências. Para o cálculo de R(x) e S(x), o método de Horner pode ser usado para reduzir o cálculo. Para as 6 frequências excedendo 6.400 Hz na segunda frequência de amostragem, um espectro de potência é extrapolado. Como um exemplo de extrapolação, o espectro de potência obtido na NL frequência pode ser usado (etapa S012).
[0095] Calcular os coeficientes de autocorrelação correspondendo ao espectro de potência obtido na etapa S012 usando a equação (30). Nesta etapa, N na equação (30) é fixado em N=31, que é o número de frequências na segunda frequência de amostragem (etapa S013).
[0096] Derivar os coeficientes de predição linear pelo método de Levinson-Durbin ou um método similar com uso do coeficiente de autocorrelação obtido na etapa S013, e obter um filtro de síntese de predição linear na segunda frequência de amostragem (etapa S014).
[0097] Converter o coeficiente de predição linear obtido na etapa S014 a LSF (etapa S015).
[0098] A figura 5 é um diagrama de bloco no exemplo da presente invenção. Uma unidade de conversão de espectro de potência real 100 é composta de uma unidade de cálculo polinomial 101, uma unidade de cálculo de espectro de potência real 102, e uma unidade de extrapolação de espectro de potência real 103, e, além disso, uma unidade de cálculo de autocorrelação real 104 e uma unidade de cálculo de coeficiente de predição linear 105 são providas. Isto é para obter as conversões 1 e 2 descritas acima. Como a descrição dos fluxogramas descritos acima, a unidade de conversão de espectro de potência real 100 recebe, como uma entrada, LSF representando um filtro de síntese de predição linear na primeira frequência de amostragem, e saídas de espectro de potência de um filtro de síntese de predição linear desejado na segunda frequência de amostragem. Primeiro, a unidade de cálculo polinomial 101 realiza o processamento nas etapas S001, S011 descritos acima para calcular os polinomiais R(x) e S(x) de LSF. Em seguida, a unidade de cálculo de espectro de potência real 102 realiza o processamento nas etapas S002 ou S012 para calcular o espectro de potência. Além disso, a unidade de extrapolação de espectro de potência real 103 realiza extrapolação do espectro, que é realizada na etapa S012 no caso da conversão 2. Pelo processo acima, o espectro de potência de um filtro de síntese de predição linear desejado é obtido na segunda frequência de amostragem. Após isso, a unidade de cálculo de autocorrelação real 104 realiza o processamento nas etapas S003 e S013 para converter o espectro de potência em coeficientes de autocorrelação. Finalmente, a unidade de cálculo de coeficiente de predição linear 105 realiza o processamento nas etapas S004 e S014 para obter os coeficientes de predição linear a partir dos coeficientes de autocorrelação. Notar que, embora este diagrama de bloco não mostre o bloco correspondendo a S005 e S015, a conversão dos coeficientes de predição linear em LSF ou outros coeficientes equivalentes podem ser facilmente obtidos por uma técnica conhecida.
EXEMPLO ALTERNATIVO
[0099] Embora os coeficientes dos polinomiais R(x) e S(x) sejam calculados usando as equações (20) e (21) nas etapas S001 e S011 do exemplo descrito acima, o cálculo pode ser realizado usando os coeficientes dos polinomiais das equações (9) e (10), que podem ser obtidos a partir dos coeficientes de predição linear. Além disso, os coeficientes de predição linear podem ser convertidos de coeficientes de LSP ou coeficientes de ISP.
[00100] Além disso, no caso onde um espectro de potência na primeira frequência de amostragem ou na segunda frequência de amostragem é TA/IA conhecido por algum método, o espectro de potência pode ser convertido naquele na segunda frequência de amostragem, e as etapas S001, S002, S011 e S012 podem ser omitidas.
[00101] Além disso, a fim de atribuir pesos no domínio de frequência, um espectro de potência pode ser deformado, e os coeficientes de predição linear na segunda frequência de amostragem pode ser obtido. LISTA DE SINAIS DE REFERÊNCIA 100 unidade de conversão de espectro de potência real, 101 unidade de cálculo polinomial, 102 unidade de cálculo de espectro de potência real, 103 unidade de extrapolação de espectro de potência real, 104 unidade de cálculo de autocorrelação real, 105 unidade de cálculo de coeficiente de predição linear

Claims (2)

1. Dispositivo de conversão de coeficiente de predição linear que converte primeiros coeficientes de predição linear calculados em uma primeira frequência de amostragem para segundos coeficientes de predição linear em uma segunda frequência de amostragem diferente da primeira frequência de amostragem, caracterizado por compreender: um meio para calcular, em pontos no eixo real do círculo unitário, usando decomposição LSF e polinómios de Chebyshev, um espectro de potência correspondendo aos segundos coeficientes de predição linear na segunda frequência de amostragem com base nos primeiros coeficientes de predição linear (S002); um meio para calcular, em pontos no eixo real do círculo unitário, os coeficientes de autocorrelação do espectro de potência (S003); um meio para converter os coeficientes de autocorrelação para os segundos coeficientes de predição linear na segunda frequência de amostragem (S004); e em que o espectro de potência correspondendo aos segundos coeficientes de predição linear é obtido calculando um espectro de potência usando os primeiros coeficientes de predição linear em pontos no eixo real correspondendo ao número de frequências diferentes na segunda frequência de amostragem.
2. Método de conversão de coeficiente de predição linear realizado por um dispositivo que converte primeiros coeficientes de predição linear calculados em uma primeira frequência de amostragem para segundos coeficientes de predição linear em uma segunda frequência de amostragem diferente da primeira frequência de amostragem, caracterizado por compreender: uma etapa de calcular, em pontos no eixo real do círculo unitário, usando decomposição LSF e polinómios de Chebyshev, um espectro de potência correspondendo aos segundos coeficientes de predição linear na segunda frequência de amostragem com base nos primeiros coeficientes de predição linear (S002); uma etapa de calcular, em pontos no eixo real do círculo unitário, os coeficientes de autocorrelação do espectro de potência (S003); uma etapa de converter os coeficientes de autocorrelação para os segundos coeficientes de predição linear na segunda frequência de amostragem (S004); e em que o espectro de potência correspondendo aos segundos coeficientes de predição linear é obtido calculando um espectro de potência usando os primeiros coeficientes de predição linear em pontos no eixo real correspondendo ao número de frequências diferentes na segunda frequência de amostragem.
BR112016024372-2A 2014-04-25 2015-04-16 dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear BR112016024372B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014-090781 2014-04-25
JP2014090781 2014-04-25
PCT/JP2015/061763 WO2015163240A1 (ja) 2014-04-25 2015-04-16 線形予測係数変換装置および線形予測係数変換方法

Publications (2)

Publication Number Publication Date
BR112016024372A2 BR112016024372A2 (pt) 2017-08-15
BR112016024372B1 true BR112016024372B1 (pt) 2020-11-03

Family

ID=54332406

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112016024372-2A BR112016024372B1 (pt) 2014-04-25 2015-04-16 dispositivo de conversão de coeficiente de predição linear e método de conversão de coeficiente de predição linear

Country Status (21)

Country Link
US (4) US10163448B2 (pt)
EP (3) EP3471095B1 (pt)
JP (4) JP6018724B2 (pt)
KR (4) KR101772501B1 (pt)
CN (2) CN106233381B (pt)
AU (4) AU2015251609B2 (pt)
BR (1) BR112016024372B1 (pt)
CA (4) CA3042066C (pt)
DK (2) DK3471095T3 (pt)
ES (1) ES2709329T3 (pt)
FI (1) FI3471095T3 (pt)
HK (1) HK1226547B (pt)
MX (1) MX352479B (pt)
MY (1) MY167352A (pt)
PH (1) PH12016502076A1 (pt)
PL (2) PL3471095T3 (pt)
PT (2) PT3136384T (pt)
RU (4) RU2673691C1 (pt)
TR (1) TR201901328T4 (pt)
TW (1) TWI576831B (pt)
WO (1) WO2015163240A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2827278T3 (es) 2014-04-17 2021-05-20 Voiceage Corp Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo
US10897262B2 (en) * 2017-03-20 2021-01-19 Texas Instruments Incorporated Methods and apparatus to determine non linearity in analog-to-digital converters
CN111210837B (zh) * 2018-11-02 2022-12-06 北京微播视界科技有限公司 音频处理方法和装置

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2131659B (en) * 1979-10-03 1984-12-12 Nippon Telegraph & Telephone Sound synthesizer
JPS5853352B2 (ja) * 1979-10-03 1983-11-29 日本電信電話株式会社 音声合成器
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
KR970063031U (ko) * 1996-05-07 1997-12-11 차량의 브레이크 패드
US6253172B1 (en) * 1997-10-16 2001-06-26 Texas Instruments Incorporated Spectral transformation of acoustic signals
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
KR20020028226A (ko) * 2000-07-05 2002-04-16 요트.게.아. 롤페즈 선 스펙트럼 주파수 추산 방법
US7739052B2 (en) 2001-05-18 2010-06-15 International Business Machines Corporation Pattern discovery techniques for determining maximal irredundant and redundant motifs
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US7027980B2 (en) * 2002-03-28 2006-04-11 Motorola, Inc. Method for modeling speech harmonic magnitudes
EP1383109A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie
KR100579797B1 (ko) * 2004-05-31 2006-05-12 에스케이 텔레콤주식회사 음성 코드북 구축 시스템 및 방법
DE602005009374D1 (de) * 2004-09-06 2008-10-09 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
KR100721537B1 (ko) * 2004-12-08 2007-05-23 한국전자통신연구원 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법
US7676362B2 (en) * 2004-12-31 2010-03-09 Motorola, Inc. Method and apparatus for enhancing loudness of a speech signal
RU2008114382A (ru) * 2005-10-14 2009-10-20 Панасоник Корпорэйшн (Jp) Кодер с преобразованием и способ кодирования с преобразованием
US8219392B2 (en) * 2005-12-05 2012-07-10 Qualcomm Incorporated Systems, methods, and apparatus for detection of tonal components employing a coding operation with monotone function
CN101149927B (zh) * 2006-09-18 2011-05-04 展讯通信(上海)有限公司 在线性预测分析中确定isf参数的方法
CN101479785B (zh) * 2006-09-29 2013-08-07 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
CN101266797B (zh) * 2007-03-16 2011-06-01 展讯通信(上海)有限公司 语音信号后处理滤波方法
CN101030375B (zh) * 2007-04-13 2011-01-26 清华大学 一种基于动态规划的基音周期提取方法
JP4691082B2 (ja) * 2007-09-11 2011-06-01 日本電信電話株式会社 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
CN101388214B (zh) * 2007-09-14 2012-07-04 向为 一种变速率的声码器及其编码方法
TR201810466T4 (tr) * 2008-08-05 2018-08-27 Fraunhofer Ges Forschung Özellik çıkarımı kullanılarak konuşmanın iyileştirilmesi için bir ses sinyalinin işlenmesine yönelik aparat ve yöntem.
JP4918074B2 (ja) * 2008-08-18 2012-04-18 日本電信電話株式会社 符号化装置、符号化方法、符号化プログラム、及び記録媒体
CN101770777B (zh) * 2008-12-31 2012-04-25 华为技术有限公司 一种线性预测编码频带扩展方法、装置和编解码***
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
KR101747917B1 (ko) * 2010-10-18 2017-06-15 삼성전자주식회사 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법
CN102065291B (zh) * 2010-11-09 2012-11-21 北京工业大学 基于稀疏表示模型的图像解码方法
SE536046C2 (sv) * 2011-01-19 2013-04-16 Limes Audio Ab Metod och anordning för mikrofonval
WO2012103686A1 (en) * 2011-02-01 2012-08-09 Huawei Technologies Co., Ltd. Method and apparatus for providing signal processing coefficients
CN102325090B (zh) * 2011-09-21 2014-04-09 电子科技大学 一种网络流量估计方法
PL2777041T3 (pl) * 2011-11-10 2016-09-30 Sposób i urządzenie do wykrywania częstotliwości próbkowania audio
CN103366749B (zh) * 2012-03-28 2016-01-27 北京天籁传音数字技术有限公司 一种声音编解码装置及其方法
CN102867516B (zh) * 2012-09-10 2014-08-27 大连理工大学 一种采用高阶线性预测系数分组矢量量化的语音编解方法
CN103021405A (zh) * 2012-12-05 2013-04-03 渤海大学 基于music和调制谱滤波的语音信号动态特征提取方法
CN103050121A (zh) 2012-12-31 2013-04-17 北京迅光达通信技术有限公司 线性预测语音编码方法及语音合成方法
ES2703565T3 (es) * 2014-01-24 2019-03-11 Nippon Telegraph & Telephone Aparato, método, programa y soporte de registro de análisis predictivo lineal
EP2916319A1 (en) * 2014-03-07 2015-09-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for encoding of information
KR20240010550A (ko) * 2014-03-28 2024-01-23 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
ES2827278T3 (es) * 2014-04-17 2021-05-20 Voiceage Corp Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo
CN107534800B (zh) * 2014-12-01 2020-07-03 构造数据有限责任公司 用于连续介质片段识别的***和方法

Also Published As

Publication number Publication date
CA3042070A1 (en) 2015-10-29
EP3471095B1 (en) 2024-05-01
PH12016502076B1 (en) 2017-01-09
ES2709329T3 (es) 2019-04-16
CN106233381B (zh) 2018-01-02
WO2015163240A1 (ja) 2015-10-29
JP2018077524A (ja) 2018-05-17
JP6715269B2 (ja) 2020-07-01
RU2694150C1 (ru) 2019-07-09
DK3136384T3 (en) 2019-04-15
BR112016024372A2 (pt) 2017-08-15
CN107945812B (zh) 2022-01-25
AU2019280041A1 (en) 2020-01-16
EP3136384B1 (en) 2019-01-02
CA3042066C (en) 2021-03-02
RU2639656C1 (ru) 2017-12-21
KR20180081181A (ko) 2018-07-13
MY167352A (en) 2018-08-16
KR101772501B1 (ko) 2017-08-29
US10714108B2 (en) 2020-07-14
US20170053655A1 (en) 2017-02-23
PT3471095T (pt) 2024-05-20
US20190080706A1 (en) 2019-03-14
CA2946824C (en) 2019-06-18
RU2714390C1 (ru) 2020-02-14
PL3471095T3 (pl) 2024-07-15
FI3471095T3 (fi) 2024-05-28
CA3042066A1 (en) 2015-10-29
HK1226547B (zh) 2017-09-29
AU2015251609A1 (en) 2016-11-17
PH12016502076A1 (en) 2017-01-09
DK3471095T3 (da) 2024-05-21
EP3471095A1 (en) 2019-04-17
KR20180123742A (ko) 2018-11-19
CA3042069C (en) 2021-03-02
TW201606756A (zh) 2016-02-16
TR201901328T4 (tr) 2019-02-21
KR20160129904A (ko) 2016-11-09
US11222644B2 (en) 2022-01-11
US10163448B2 (en) 2018-12-25
KR101878292B1 (ko) 2018-07-13
EP4343763A2 (en) 2024-03-27
JP2017058683A (ja) 2017-03-23
CA2946824A1 (en) 2015-10-29
EP4343763A3 (en) 2024-06-05
CA3042070C (en) 2021-03-02
JPWO2015163240A1 (ja) 2017-04-13
EP3136384A4 (en) 2017-03-29
JP2020144397A (ja) 2020-09-10
US20200302942A1 (en) 2020-09-24
KR20170098989A (ko) 2017-08-30
PL3136384T3 (pl) 2019-04-30
AU2015251609B2 (en) 2018-05-17
MX2016013797A (es) 2016-11-11
JP6018724B2 (ja) 2016-11-02
AU2019280040A1 (en) 2020-01-16
US20190080705A1 (en) 2019-03-14
AU2019280041B2 (en) 2021-02-25
AU2018204572A1 (en) 2018-07-19
KR101957276B1 (ko) 2019-03-12
TWI576831B (zh) 2017-04-01
JP6936363B2 (ja) 2021-09-15
AU2018204572B2 (en) 2019-09-12
EP3136384A1 (en) 2017-03-01
US10714107B2 (en) 2020-07-14
AU2019280040B2 (en) 2021-01-28
CN107945812A (zh) 2018-04-20
KR101920297B1 (ko) 2018-11-20
CN106233381A (zh) 2016-12-14
CA3042069A1 (en) 2015-10-29
RU2673691C1 (ru) 2018-11-29
JP6277245B2 (ja) 2018-02-07
PT3136384T (pt) 2019-04-22
MX352479B (es) 2017-11-27

Similar Documents

Publication Publication Date Title
AU2019280041B2 (en) Linear prediction coefficient conversion device and linear prediction coefficient conversion method

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 16/04/2015, OBSERVADAS AS CONDICOES LEGAIS.