BR122017028149B1 - METHOD FOR EXTENDING A FREQUENCY RANGE IN AN AUDIO SIGNAL DECODER - Google Patents

METHOD FOR EXTENDING A FREQUENCY RANGE IN AN AUDIO SIGNAL DECODER Download PDF

Info

Publication number
BR122017028149B1
BR122017028149B1 BR122017028149-6A BR122017028149A BR122017028149B1 BR 122017028149 B1 BR122017028149 B1 BR 122017028149B1 BR 122017028149 A BR122017028149 A BR 122017028149A BR 122017028149 B1 BR122017028149 B1 BR 122017028149B1
Authority
BR
Brazil
Prior art keywords
signal
band
frequency
low
factor
Prior art date
Application number
BR122017028149-6A
Other languages
Portuguese (pt)
Inventor
Magdalena Kaniewska
Stéphane Ragot
Original Assignee
Koninklijke Philips N.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips N.V filed Critical Koninklijke Philips N.V
Publication of BR122017028149B1 publication Critical patent/BR122017028149B1/en

Links

Abstract

A invenção se refere a um processo de extensão de banda de frequência de um sinal de audiofrequência no momento de um processo de decodificação ou de melhoria compreendendo uma etapa de obtenção do sinal decodificado, em uma primeira banda de frequência chamada banda baixa. O processo é tal que compreende as etapas seguintes: - extração (E402) de componentes tonais e de um sinal ambiente a partir de um sinal proveniente do sinal de banda baixa; - combinação (E403) dos componentes tonais e do sinal ambiente por mixagem adaptativa utilizando fatores de controle de nível de energia para obter um sinal áudio, chamado sinal combinado; - extensão (E401a) em pelo menos uma segunda banda de frequência superior à primeira banda de frequência do sinal decodificado de banda baixa antes da etapa de extração ou do sinal combinado após a etapa de combinação. A invenção se refere também a um dispositivo de extensão de banda de frequência implementando o processo descrito e um decodificador compreendendo um tal dispositivo.The invention relates to a process of extending the frequency band of an audio frequency signal at the time of a decoding or improvement process comprising a step of obtaining the decoded signal, in a first frequency band called low band. The process is such that it comprises the following steps: - extraction (E402) of tonal components and an ambient signal from a signal originating from the low band signal; - combination (E403) of the tonal components and the ambient signal by adaptive mixing using energy level control factors to obtain an audio signal, called combined signal; - extension (E401a) in at least a second frequency band higher than the first frequency band of the low-band decoded signal before the extraction step or the combined signal after the combination step. The invention also relates to a frequency band extending device implementing the described process and a decoder comprising such a device.

Description

[001] O presente pedido é dividido do BR 11 2016 017616 2, de 04/02/2015.[001] This request is divided from BR 11 2016 017616 2, of 02/04/2015.

[002] A presente invenção se refere ao domínio da codificação/ decodificação e do processamento de sinais de audiofrequências (como sinais de palavra, de música ou outros) para sua transmissão ou sua armazenagem.[002] The present invention refers to the field of encoding/decoding and processing audio frequency signals (such as word, music or other signals) for their transmission or storage.

[003] Mais particularmente, a invenção se refere a um processo e a um dispositivo de extensão de banda de frequência em um decodificador ou em um processador realizando uma melhoria de sinal de audiofrequência.[003] More particularly, the invention relates to a process and a frequency band extension device in a decoder or in a processor performing an audio frequency signal enhancement.

[004] Há numerosas técnicas para comprimir (com perda) um sinal de audiofrequência como a palavra ou a música.[004] There are numerous techniques for compressing (lossily) an audiofrequency signal such as words or music.

[005] Os métodos convencionais de codificação para as aplicações interativas são em geral classificados de codificação de forma de onda (MIC para "Modulação por Impulso e codificação", MICDA para "Modulação por Impulso e Codificação Diferencial Adaptativa", codificação por transformada, etc), codificação paramétrica (LPC para "Linear Predictive Coding" em inglês, codificação sinusoidal, etc) e codificação paramétrica híbrida com uma quantificação dos parâmetros por "análise por síntese" cuja codificação CELP (para "Code Excited Linear Prediction" em inglês) é o exemplo mais conhecido.[005] Conventional coding methods for interactive applications are generally classified as waveform coding (MIC for "Impulse Modulation and Coding", MICDA for "Impulse Modulation and Adaptive Differential Coding", transform coding, etc. ), parametric coding (LPC for "Linear Predictive Coding" in English, sinusoidal coding, etc.) and hybrid parametric coding with a quantification of the parameters by "analysis by synthesis" whose CELP coding (for "Code Excited Linear Prediction" in English) is the best-known example.

[006] Para as aplicações não interativas, o estado da técnica de codificação de sinal áudio (mono) é constituído pela codificação perceptual por transformada ou em sub-bandas, com uma codificação paramétrica das altas frequências por replicação de banda (SBR para Spectral Band Replication em inglês).[006] For non-interactive applications, the state of the art audio signal coding (mono) consists of perceptual coding by transform or in sub-bands, with parametric coding of high frequencies by band replication (SBR for Spectral Band Replication in English).

[007] Uma revisão dos métodos convencionais de codificação de palavra e de áudio existe nas obras W.B Kleijn and K.K Paliwal (Eds.), Speech Coding and Synthesis, Elsevier, 1995; M. Bosi, R.E. Goldberg, Introduction to Digital Audio Coding and Standards, Springer 2002; J. Benesty, M.M. Sondhi, Y. Huang (Eds), Handbook of Speech Processing, Springer 2008.[007] A review of conventional word and audio coding methods exists in the works W.B Kleijn and K.K Paliwal (Eds.), Speech Coding and Synthesis, Elsevier, 1995; M. Bosi, R. E. Goldberg, Introduction to Digital Audio Coding and Standards, Springer 2002; J. Benesty, M.M. Sondhi, Y. Huang (Eds), Handbook of Speech Processing, Springer 2008.

[008] Há interesse aqui mais particularmente no codec (codificador e decodificador) normalizado 3GPP AMR-WB (para "Adaptive Multi- Rate Wideband" em inglês) que funciona com uma frequência de entrada/ saída de 16 kHz e onde o sinal é dividido em duas sub-bandas , a banda baixa (0-6,4 kHz) que é amostrada a 12,8 kHz e codificada por modelo CELP e a banda alta (6,4-7 kHz) que é reconstruída de modo paramétrico por «extensão de banda» (ou BWE para "Bandwidth Extension" em inglês) com ou sem informação suplementar de acordo com o modo do quadro corrente. Se pode notar aqui que a limitação da banda codificada do codec AMR-WB a 7 kHz está essencialmente ligada ao fato de que a resposta de frequência na transmissão dos terminais de banda larga foi aproximada no momento da normalização (ETSI/3GPP depois UIT-T) de acordo com a máscara de frequência definida na norma UIT-T P.341 e mais precisamente utilizando um filtro chamado «P341» definido na norma UIT-T G.191 que corta as frequências acima de 7 kHz (esse filtro respeita a máscara definida em P.341). No entanto, em teoria, é bem sabido que um sinal amostrado de 16 kHz pode ter uma banda áudio definida de 0 a 8000 Hz; o codec AMR-WB introduz, portanto, uma limitação da banda alta em comparação com a largura de banda teórica de 8 kHz.[008] There is interest here more particularly in the standard 3GPP AMR-WB (for "Adaptive Multi-Rate Wideband") codec (encoder and decoder) which works with an input/output frequency of 16 kHz and where the signal is split in two sub-bands, the low band (0-6.4 kHz) which is sampled at 12.8 kHz and encoded by CELP model and the high band (6.4-7 kHz) which is parametrically reconstructed by « bandwidth extension» (or BWE for "Bandwidth Extension" in English) with or without supplementary information according to the current frame mode. It can be noted here that the limitation of the encoded bandwidth of the AMR-WB codec to 7 kHz is essentially linked to the fact that the frequency response in the transmission of broadband terminals was approximated at the time of standardization (ETSI/3GPP after ITU-T ) according to the frequency mask defined in the ITU-T P.341 standard and more precisely using a filter called «P341» defined in the ITU-T G.191 standard that cuts frequencies above 7 kHz (this filter respects the mask defined in P.341). However, in theory, it is well known that a 16 kHz sampled signal can have a defined audio band of 0 to 8000 Hz; the AMR-WB codec therefore introduces a high bandwidth limitation compared to the theoretical bandwidth of 8 kHz.

[009] O codec de palavra 3GPP AMR-WB foi normalizado em 2001 principalmente para as aplicações de telefonia em modo de circuito (CS) em GSM (2G) e UMTS (3G). Esse mesmo codec foi também normalizado em 2003 em UIT-T como recomendação G.722.2 "Wideband coding speech at around 16 kbit/s using Adaptive Multi- Rate Wideband (AMR-WB) ".[009] The 3GPP AMR-WB word codec was standardized in 2001 mainly for circuit mode (CS) telephony applications in GSM (2G) and UMTS (3G). This same codec was also standardized in 2003 in ITU-T as recommendation G.722.2 "Wideband coding speech at around 16 kbit/s using Adaptive Multi-Rate Wideband (AMR-WB)".

[010] Compreende nove débitos, chamados modos, de 6,6 a 23,85 kbit/s, e compreende mecanismos de transmissão contínua (DTX para "Discontinuous Transmission") com detecção de atividade vocal (VAD para "Voice Activity Detection") e geração de ruído de conforto (CNG para "Confort Noise Generation") a partir de quadros de descrição de silêncio (SID para "Silence Insertion Descriptor"), assim como mecanismos de correção de quadros perdidos (FEC para "Frame Erasure Concealment", por vezes chamado PLC para "Packet Loss Concealment").[010] It comprises nine speeds, called modes, from 6.6 to 23.85 kbit/s, and comprises continuous transmission mechanisms (DTX for "Discontinuous Transmission") with vocal activity detection (VAD for "Voice Activity Detection") and comfort noise generation (CNG for "Comfort Noise Generation") from silence description frames (SID for "Silence Insertion Descriptor"), as well as lost frame correction mechanisms (FEC for "Frame Erasure Concealment", sometimes called PLC for "Packet Loss Concealment").

[011] Não se retomam aqui os detalhes do algoritmo de codificação e de decodificação AMR-WB, uma descrição detalhada desse codec existe nas especificações 3GPP (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204) e UIT-T-G.722.2 (e os Anexos e Apêndice correspondentes) assim como no artigo de B. Bessette e outro intitulado «The Adaptive multirate wideband speech codec (AMR-WB)», IEEE Transactions on Speech and Audio Processing, volume 10, n° 8, pp. 620-636 e os códigos fontes dos padrões 3GPP e UIT-T associados.[011] The details of the AMR-WB coding and decoding algorithm are not discussed here, a detailed description of this codec exists in the 3GPP specifications (TS 26.190, 26.191, 26.192, 26.193, 26.194, 26.204) and ITU-T-G.722.2 ( and the corresponding Annexes and Appendix) as well as in the article by B. Bessette and another entitled «The Adaptive multirate wideband speech codec (AMR-WB)», IEEE Transactions on Speech and Audio Processing, volume 10, no. 8, pp. 620-636 and the associated 3GPP and ITU-T standards source codes.

[012] O princípio da extensão de banda no codec AMR-WB é bastante rudimentar. Com efeito, a banda alta (6,4-7 kHz) é gerada modelizando um ruído branco através de um invólucro temporal (aplicado na forma de ganhos por subquadro) e de frequência (pela aplicação de um filtro de síntese de predição linear ou LPC para "Linear Predictive Coding"). Essa técnica de extensão de banda está ilustrada na figura 1.[012] The principle of bandwidth extension in the AMR-WB codec is quite rudimentary. In effect, the high band (6.4-7 kHz) is generated by modeling white noise through a temporal wrapper (applied in the form of gains per subframe) and frequency (by applying a linear prediction synthesis filter or LPC for "Linear Predictive Coding"). This band extension technique is illustrated in figure 1.

[013] Um ruído branco, uHB1 (n), n = 0, .,79, é gerado a 16 kHz por sub-quadro de 5 ms por gerador de congruência linear (bloco 100). Esse ruído uHB1 (n) é modelizado no tempo por aplicação de ganhos por sub-quadro; essa operação é decomposta em duas etapas de processamento (blocos 102, 106 ou 109):[013] A white noise, uHB1 (n), n = 0, .,79, is generated at 16 kHz per 5 ms sub-frame by linear congruence generator (block 100). This noise uHB1 (n) is modeled in time by applying gains per sub-frame; this operation is decomposed into two processing steps (blocks 102, 106 or 109):

[014] Um primeiro fator é calculado (bloco 101) para colocar o ruído branco uHB1 (n) (bloco 102) em um nível semelhante ao da exci- tação, u (n), n = 0, ..., 63, decodificado a 12,8 kHz na banda baixa: [014] A first factor is calculated (block 101) to place the white noise uHB1 (n) (block 102) at a level similar to that of the excitation, u (n), n = 0, ..., 63, decoded at 12.8 kHz in the low band:

[015] Se pode notar aqui que a normalização das energias é feita comparando blocos de tamanho diferente (64 para u (n) e 80 para uHB1 (n), sem compensação das diferenças de frequências de amostragem (12,8 ou 16 kHz).[015] It can be noted here that the normalization of energies is done by comparing blocks of different sizes (64 for u (n) and 80 for uHB1 (n), without compensation for differences in sampling frequencies (12.8 or 16 kHz) .

[016] A excitação na banda alta é em seguida obtida (bloco 106 ou 109) na forma: uHB (n) = βHBuHB2 (n)[016] High band excitation is then obtained (block 106 or 109) in the form: uHB (n) = βHBuHB2 (n)

[017] onde o ganho βHB é obtido diferentemente de acordo com o débito. Se o débito do quadro atual é <23,85 kbit/s, o ganho βHB é estimado «às cegas» (isto é, sem informação suplementar); nesse caso, o bloco 103 filtra o sinal decodificado de banda baixa por um filtro passa alto tendo uma frequência de corte de 400 Hz para obter um sinal βhp (n), n = 0, ..., 63 - esse filtro passa alto elimina a influência das frequências muito baixas que podem distorcer a estimativa feita no bloco 104 - depois é calculado o «tilt» (indicador de inclinação espectral) anotado etilt do sinal βhp (n) por autocorrelação normalizada (bloco 104): [017] where the βHB gain is obtained differently according to the flow rate. If the current frame rate is <23.85 kbit/s, the βHB gain is estimated “blindly” (i.e., without additional information); in this case, block 103 filters the low-band decoded signal by a high-pass filter having a cutoff frequency of 400 Hz to obtain a signal βhp(n), n = 0, ..., 63 - this high-pass filter eliminates the influence of very low frequencies that can distort the estimate made in block 104 - then the «tilt» (indicator of spectral inclination) noted etilt of the signal βhp (n) is calculated by normalized autocorrelation (block 104):

[018] e finalmente se calcula βHB na forma: [018] and finally βHB is calculated in the form:

[019] Onde gSP = 1 – etilt é o ganho aplicado nos quadros ativos de palavra (SP para speech), gBG = 1,25 gSP é o ganho aplicado nos quadros inativos de palavra associados a um ruído de fundo (BG para Background) e wSP é uma função de ponderação que depende da de- tecção de atividade vocal (VAD). Se compreende que a estimativa do tilt (etilt) permite adaptar o nível da banda alta em função da natureza espectral do sinal; essa estimativa é particularmente importante quando a inclinação espectral do sinal decodificado CELP é tal que a energia média diminui quando a frequência aumenta (caso de um sinal de voz onde etilt está próximo de 1, portanto gSP = 1- etilt é assim reduzido). De notar também que o fator βHB na decodificação AMR-WB é limitado para assumir valores no intervalo [0,1, 1,0]. Efetivamente, para os sinais cujo espectro tem mais energia em altas frequências (etilt próximo de -1, gSP próximo de 2), o ganho βHB é como sempre subestimado.[019] Where gSP = 1 – etilt is the gain applied to active word frames (SP for speech), gBG = 1.25 gSP is the gain applied to inactive word frames associated with background noise (BG for Background) and wSP is a weighting function that depends on vocal activity detection (VAD). It is understood that the tilt estimate (etilt) allows the high band level to be adapted depending on the spectral nature of the signal; this estimate is particularly important when the spectral slope of the CELP decoded signal is such that the average energy decreases when the frequency increases (case of a speech signal where etilt is close to 1, therefore gSP = 1- etilt is thus reduced). It should also be noted that the βHB factor in AMR-WB decoding is limited to assume values in the range [0.1, 1.0]. Effectively, for signals whose spectrum has more energy at high frequencies (etilt close to -1, gSP close to 2), the βHB gain is always underestimated.

[020] Para 23,85 kbit/s, uma informação de correção é transmitida pelo codificador AMR-WB e decodificada (blocos 107, 108) para refinar o ganho estimado por subquadro (4 bits a cada 5 ms, ou seja 0,8 kbit/s).[020] For 23.85 kbit/s, correction information is transmitted by the AMR-WB encoder and decoded (blocks 107, 108) to refine the estimated gain per subframe (4 bits every 5 ms, i.e. 0.8 kbit/s).

[021] A excitação artificial uHB (n) é em seguida filtrada (bloco 111) por um filtro de síntese LPC de função de transferência 1/ AHB (Z) e funcionando na frequência de amostragem de 16 kHz. A realização desse filtro depende do débito do quadro corrente:[021] The artificial excitation uHB (n) is then filtered (block 111) by an LPC synthesis filter with transfer function 1/AHB (Z) and operating at a sampling frequency of 16 kHz. The implementation of this filter depends on the flow rate of the current frame:

[022] Para 6,6 kbit/s, o filtro 1/ AHB (Z) é obtido ponderando por um fator Y^= 0,9 um filtro LPC de ordem 20, 1/ Aext (Z) que «extrapola» o filtro LPC de ordem 16, 1/Â (Z), decodificado na banda baixa (a 12,8 kHz) - os detalhes da extrapolação no domínio dos parâmetros ISF (para "Imittance Spectral Frequency" em inglês) são descritos na norma G-722.2 na secção 6.3.2.1; nesse caso, 1/ AHB (Z) = 1/ Âext (Z /Y)[022] For 6.6 kbit/s, the 1/ AHB (Z) filter is obtained by weighting by a factor Y^= 0.9 an LPC filter of order 20, 1/ Aext (Z) that “extrapolates” the filter LPC of order 16, 1/Â (Z), decoded in the low band (at 12.8 kHz) - the details of the extrapolation in the domain of the ISF parameters (for "Imittance Spectral Frequency" in English) are described in the G-722.2 standard in section 6.3.2.1; in this case, 1/ AHB (Z) = 1/ Âext (Z /Y)

[023] Para os débitos> 6,6 kbit/s, o filtro 1/AHB (Z) é de ordem 16 e corresponde simplesmente a:[023] For speeds > 6.6 kbit/s, the 1/AHB (Z) filter is of order 16 and simply corresponds to:

[024] 1/ AHB (Z) = 1/ Â /Z/Y)[024] 1/ AHB (Z) = 1/ Â /Z/Y)

[025] onde yθ= 0,6. De notar que nesse caso o filtro 1/ Â (Z/yD) é utilizado a 16 kHz, o que resulta em uma dispersão (por homotetia da resposta de frequência desse filtro de [0, 6,4 kHz] a [0, 8 kHz].[025] where yθ= 0.6. It should be noted that in this case the 1/ Â (Z/yD) filter is used at 16 kHz, which results in a dispersion (due to homothety of the frequency response of this filter from [0, 6.4 kHz] to [0, 8 kHz].

[026] O resultado sHB (n) é finalmente processado por um filtro passa banda (bloco 112) de tipo FIR ("Finite Impulse Response"), para só manter a banda 6 - 7 kHz; para 23,85 kbit/s, um filtro passa baixo também de tipo FIR (bloco 113) é acrescentado ao processamento para atenuar ainda mais as frequências superiores a 7 kHz. Finalmente, é adicionada a síntese de altas frequências (HF) (bloco 130) à síntese de baixas frequências (BF) obtida com os blocos de 120 a 123 e reamostrada a 16 kHz (bloco 123). Assim, mesmo que a banda alta se estenda em teoria de 6,4 a 7 kHz no codec AMR-WB, a síntese HF está de preferência compreendida na banda 6-7 kHz antes de adição com a síntese BF.[026] The sHB (n) result is finally processed by a band pass filter (block 112) of type FIR ("Finite Impulse Response"), to only maintain the 6 - 7 kHz band; for 23.85 kbit/s, a low-pass filter also of FIR type (block 113) is added to the processing to further attenuate frequencies above 7 kHz. Finally, the high frequency (HF) synthesis (block 130) is added to the low frequency (BF) synthesis obtained with blocks 120 to 123 and resampled at 16 kHz (block 123). Thus, even though the high band theoretically extends from 6.4 to 7 kHz in the AMR-WB codec, HF synthesis is preferably comprised in the 6-7 kHz band before addition with BF synthesis.

[027] Podem ser identificados vários inconvenientes na técnica de extensão de banda do codec AMR- WB:[027] Several drawbacks can be identified in the AMR-WB codec bandwidth extension technique:

[028] O sinal na banda alta é um ruído branco modelizado (por ganhos temporais por sub-quadro, por filtragem por 1/ AHB (Z) e filtragem passa banda), o que não é um bom modelo geral do sinal na banda 6,4-7 kHz. Há por exemplo sinais de música muito harmônicos para os quais a banda 6,4-7 kHz contém componentes sinusoidais (ou tons) e nenhum ruído (ou pouco ruído), para esses sinais a extensão de banda do codec AMR-WB degrada fortemente a qualidade.[028] The signal in the high band is modeled white noise (by temporal gains per sub-frame, by 1/ AHB (Z) filtering and band pass filtering), which is not a good general model of the signal in band 6 .4-7 kHz. There are for example very harmonic music signals for which the 6.4-7 kHz band contains sinusoidal components (or tones) and no noise (or little noise), for these signals the bandwidth extension of the AMR-WB codec strongly degrades the quality.

[029] O filtro passa banda a 7 kHz (bloco 113) introduz uma distância de perto de 1 ms entre as bandas baixas e altas, o que pode potencialmente degradar a qualidade de alguns sinais dessincronizando ligeiramente as duas bandas para 23,85 kbit/s - essa dessincronização pode também causar problemas no momento de uma comutação de débito de 23,85 kbit/s a outros modos.[029] The 7 kHz bandpass filter (block 113) introduces a distance of close to 1 ms between the low and high bands, which can potentially degrade the quality of some signals by slightly desynchronizing the two bands to 23.85 kbit/ s - this desynchronization can also cause problems when switching at a speed of 23.85 kbit/s to other modes.

[030] A estimativa de ganhos por subquadro (bloco 101, de 103 a 105) não é ótima. Parcialmente é baseada em uma igualização da energia «absoluta» por subquadro (bloco 101) entre sinais com frequências diferentes: a excitação artificial a 16 kHz (ruído branco) e um sinal a 12,8 kHz (excitação ACELP decodificada). Se pode notar em particular que essa abordagem induz implicitamente uma atenuação da excitação de banda alta (por uma razão de 12,8/16=0,8); assim, se notará também que nenhuma desacentuação (ou de ênfase) é efetuada na banda alta no codec AMR-WB, o que induz implicitamente uma amplificação relativa perto de 0,6 (que corresponde ao valor da resposta na frequência de 1/ (1- 0,68Z-1) a 6400 Hz).[030] The estimate of gains per subframe (block 101, from 103 to 105) is not optimal. Partially it is based on an equalization of the «absolute» energy per subframe (block 101) between signals with different frequencies: the artificial excitation at 16 kHz (white noise) and a signal at 12.8 kHz (decoded ACELP excitation). It may be noted in particular that this approach implicitly induces an attenuation of the high-band excitation (by a ratio of 12.8/16=0.8); Thus, it will also be noted that no de-emphasis (or de-emphasis) is performed in the high band in the AMR-WB codec, which implicitly induces a relative amplification close to 0.6 (which corresponds to the frequency response value of 1/ (1 - 0.68Z-1) at 6400 Hz).

[031] Na verdade, os fatores de 1/0,8 e de 0,6 são compensados aproximadamente.[031] In fact, the factors of 1/0.8 and 0.6 are approximately compensated.

[032] Na palavra, os testes de caracterização do codec 3GPP AMR-WB documentados na relação 3GPP TR 26,976 mostraram que o modo a 23,85 kbit/s tem uma qualidade menos boa do que a 23,05 kbit/s, sua qualidade é na verdade semelhante à do modo a 15,85 kbit/s. Em particular isso mostra que o nível do sinal HF artificial deve ser controlado de maneira muito cautelosa, porque a qualidade é degradada a 23,85 kbit/s enquanto os 4 bits por quadro devem permitir uma abordagem melhor de energia das altas frequências originais.[032] In short, the 3GPP AMR-WB codec characterization tests documented in the 3GPP TR 26.976 relationship showed that the 23.85 kbit/s mode has a less good quality than the 23.05 kbit/s mode, its quality is actually similar to the 15.85 kbit/s mode. In particular this shows that the level of the artificial HF signal must be controlled very carefully, because the quality is degraded at 23.85 kbit/s while the 4 bits per frame should allow a better approach to the energy of the original high frequencies.

[033] A limitação da banda codificada a 7 kHz resulta da aplicação de um modelo estrito da resposta na transmissão dos terminais acústicos (filtro P.341 na norma UIT-T G.191). Ora, para uma frequência de amostragem de 16 kHz, as frequências na banda 7-8 kHz permanecem significativas, em particular para os sinais de música, para garantir um bom nível de qualidade.[033] The limitation of the coded band to 7 kHz results from the application of a strict model of the response in the transmission of the acoustic terminals (filter P.341 in the ITU-T G.191 standard). Now, for a sampling frequency of 16 kHz, the frequencies in the 7-8 kHz band remain significant, particularly for music signals, to guarantee a good level of quality.

[034] O algoritmo de decodificação AMR-WB foi melhorado em parte com o desenvolvimento do codec escalável UIT-T G.718 que foi normalizado em 2008.[034] The AMR-WB decoding algorithm was improved in part with the development of the UIT-T G.718 scalable codec which was standardized in 2008.

[035] A norma UIT-T G.718 compreende um modo chamado interoperável, para o qual a codificação do núcleo é compatível com a codificação G.722.2 (AMR-WB) a 12,65 kbit/s; para além disso, o decodificador G.718 tem a particularidade de poder decodificar um trem binário AMR-WB/G.722.2 para todos os débitos possíveis do codec AMRWB (de 6,6 a 23,85 kbit/s).[035] The ITU-T G.718 standard comprises a so-called interoperable mode, for which the core coding is compatible with the G.722.2 (AMR-WB) coding at 12.65 kbit/s; Furthermore, the G.718 decoder has the particularity of being able to decode an AMR-WB/G.722.2 binary train for all possible speeds of the AMRWB codec (from 6.6 to 23.85 kbit/s).

[036] O decodificador interoperável G.718 no modo de baixo atraso («low delay» em inglês) (G.718-LD) está ilustrado na figura 2. Se listam mais abaixo as melhorias para a funcionalidade de decodificação de trem binário AMR-WB no decodificador G.718, com referências à figura 1 quando necessário:[036] The G.718 interoperable decoder in low delay mode (G.718-LD) is illustrated in figure 2. The improvements to the AMR binary train decoding functionality are listed below -WB in G.718 decoder, with references to figure 1 when necessary:

[037] A extensão de banda (descrita por exemplo, na cláusula 7.13.1 da recomendação G.718, bloco 206) é idêntica à do decodificador AMR-WB, mas o filtro passa banda 6-7 kHz e o filtro de síntese 1/AHB (z) (blocos 111 e 112) estão em ordem inversa. Para além disso, a 23,85 kbit/s os 4 bits transmitidos por subquadros pelo codificador AMR-WB não são utilizados no decodificador G.718 interoperável; a síntese das altas frequências (HF) a 23,85 kbit/s é, portanto, idêntica a 23,05 kbit/s o que evita o problema conhecido de qualidade da decodificação AMR-WB a 23,85 kbit/s. A fortiori, o filtro passa baixo de 7 kHz (bloco 113) não é utilizado, e a decodificação específica do modo a 23,85 kbit/s é omitida (blocos de 107 a 109).[037] The bandwidth (described, for example, in clause 7.13.1 of the G.718 recommendation, block 206) is identical to that of the AMR-WB decoder, but the 6-7 kHz bandpass filter and the synthesis filter 1 /AHB (z) (blocks 111 and 112) are in reverse order. Furthermore, at 23.85 kbit/s the 4 bits transmitted per subframe by the AMR-WB encoder are not used in the interoperable G.718 decoder; high frequency (HF) synthesis at 23.85 kbit/s is therefore identical to 23.05 kbit/s which avoids the known quality issue of AMR-WB decoding at 23.85 kbit/s. A fortiori, the 7 kHz low pass filter (block 113) is not used, and mode-specific decoding at 23.85 kbit/s is omitted (blocks 107 to 109).

[038] Um pós-tratamento da síntese a 16 kHz (ver cláusula 7.14 de G.718) é implementado em G.718 por "noise gate" no bloco 208 (para «melhorar» a qualidade dos silêncios por diminuição do nível), filtragem passa alto (bloco 209), pós-filtro de baixas frequências (chamado «bas posfilter») no bloco 210 atenuando o ruído inter-harmônico em baixas frequências e uma conversão em números inteiros de 16 bits com controle de saturação (com controle de ganho ou AGC) no bloco 211.[038] A post-treatment of synthesis at 16 kHz (see clause 7.14 of G.718) is implemented in G.718 by "noise gate" in block 208 (to «improve» the quality of silences by decreasing the level), high pass filtering (block 209), low frequency post-filter (called «bas postfilter») in block 210 attenuating inter-harmonic noise at low frequencies and a conversion into 16-bit integers with saturation control (with gain or AGC) in block 211.

[039] No entanto, a extensão de banda nos codecs AMR-WB e/ou G.718 (modo interoperável) permanece ainda limitada em vários aspetos.[039] However, the bandwidth in AMR-WB and/or G.718 (interoperable mode) codecs still remains limited in several aspects.

[040] Em particular, a síntese de altas frequências por ruído branco modelizado (por uma aproximação temporal de tipo fonte-filtro LPC) é um modelo muito limitado do sinal na banda das frequências superiores a 6,4 kHz.[040] In particular, high frequency synthesis by modeled white noise (by an LPC source-filter temporal approach) is a very limited model of the signal in the frequency band above 6.4 kHz.

[041] Somente a banda 6,4-7 kHz é ressintetizada de modo artificial, enquanto na prática uma banda mais larga (até 8 kHz) é em teoria possível para a frequência de amostragem de 16 kHz, o que pode potencialmente melhorar a qualidade dos sinais, se não são pré-tratados por um filtro de tipo P.341 (50-7000 Hz) tal como definido no Software Tool Library (norma G.191) da UIT-T.[041] Only the 6.4-7 kHz band is artificially resynthesized, while in practice a wider band (up to 8 kHz) is in theory possible for the 16 kHz sampling frequency, which can potentially improve quality of the signals, if they are not pre-treated by a P.341 type filter (50-7000 Hz) as defined in the ITU-T Software Tool Library (G.191 standard).

[042] Há, portanto, uma necessidade de melhorar a extensão de banda em um codec de tipo AMR-WB ou em uma versão interoperável desse codec ou mais em geral para melhorar a extensão de banda de um sinal áudio, nomeadamente para melhorar o conteúdo de frequência da extensão de banda.[042] There is therefore a need to improve the bandwidth in an AMR-WB type codec or in an interoperable version of that codec or more generally to improve the bandwidth of an audio signal, in particular to improve the content frequency range of the band span.

[043] A presente invenção vem melhorar a situação.[043] The present invention improves the situation.

[044] A invenção propõe para esse fim, um processo de extensão de banda de frequência de um sinal de audiofrequência no momento de um processo de decodificação ou de melhoria compreendendo uma etapa de obtenção do sinal decodificado em uma primeira banda de frequência chamada banda baixa. O processo é tal que compreende as etapas seguintes:[044] The invention proposes for this purpose, a process for extending the frequency band of an audiofrequency signal at the time of a decoding or improvement process, comprising a step of obtaining the decoded signal in a first frequency band called low band . The process is such that it comprises the following steps:

[045] - extração de componentes tonais e de um sinal ambiente a partir de um sinal proveniente do sinal de banda baixa decodificado;[045] - extraction of tonal components and an ambient signal from a signal originating from the decoded low band signal;

[046] - combinação dos componentes tonais e do sinal ambiente por mixagem adaptativa utilizando fatores de controle de nível de energia para obter um sinal áudio, chamado sinal combinado;[046] - combination of tonal components and the ambient signal by adaptive mixing using energy level control factors to obtain an audio signal, called combined signal;

[047] - extensão em pelo menos uma segunda banda de frequência superior à primeira banda de frequência do sinal decodificado de banda baixa antes da etapa de extração ou do sinal combinado após a etapa de combinação.[047] - extension in at least a second frequency band higher than the first frequency band of the low-band decoded signal before the extraction step or the combined signal after the combination step.

[048] Nota-se que a seguir a «extensão de banda» será tomada em sentido lato e incluirá não só o caso da extensão de uma subbanda de altas frequências, mas também o caso de uma substituição de sub-bandas colocadas a zero (de tipo «noise filling» em codificação por transformada).[048] Note that in the following "band extension" will be taken in a broad sense and will include not only the case of the extension of a high frequency subband, but also the case of a replacement of subbands set to zero ( of type «noise filling» in transform coding).

[049] Assim, ao mesmo tempo a tomada em conta de componentes tonais e de um sinal ambiente extraído do sinal proveniente da decodificação da banda baixa permite efetuar a extensão de banda com um modelo de sinal adaptado à verdadeira natureza do sinal contrariamente à utilização de um ruído artificial. A qualidade da extensão de banda é assim melhorada e nomeadamente para alguns tipos de sinais como os sinais de música.[049] Thus, at the same time, taking into account tonal components and an ambient signal extracted from the signal originating from low band decoding allows band extension to be carried out with a signal model adapted to the true nature of the signal, contrary to the use of an artificial noise. The quality of band extension is thus improved, particularly for some types of signals such as music signals.

[050] Com efeito, o sinal decodificado na banda baixa compreende uma parte correspondente ao ambiente sonoro que pode ser transportada em alta frequência de tal modo que uma mixagem dos componentes harmônicos e do ambiente existente permite garantir uma banda alta reconstruída coerente.[050] In effect, the signal decoded in the low band comprises a part corresponding to the sound environment that can be transported at high frequency in such a way that a mix of the harmonic components and the existing environment makes it possible to guarantee a coherent reconstructed high band.

[051] Nota-se que mesmo que a invenção seja motivada pela melhoria da qualidade da extensão de banda no contexto da codificação AMR-WB interoperável, as diferentes modalidades de realização são aplicadas no caso mais geral da extensão de banda de um sinal áudio, em particular em um dispositivo de melhoria efetuando uma análise do sinal áudio para extrair os parâmetros necessários à extensão de banda.[051] It should be noted that even if the invention is motivated by improving the quality of bandwidth extension in the context of interoperable AMR-WB coding, the different embodiments are applied in the more general case of bandwidth extension of an audio signal, in particular in an enhancement device carrying out an analysis of the audio signal to extract the parameters necessary for bandwidth extension.

[052] As diferentes modalidades particulares de realização mencionadas mais abaixo podem ser acrescentadas independentemente ou em combinação umas com as outras, nas etapas do processo de extensão definido mais acima.[052] The different particular embodiments mentioned below can be added independently or in combination with each other, in the steps of the extension process defined above.

[053] Em uma modalidade de realização, a extensão da banda é efetuada no domínio da excitação e o sinal de banda baixa decodificado é um sinal de excitação de banda baixa decodificado.[053] In one embodiment, the band extension is performed in the excitation domain and the decoded low-band signal is a decoded low-band excitation signal.

[054] A vantagem dessa modalidade de realização é que uma transformação sem abertura de janelas (ou de modo equivalente com uma janela retangular implícita do comprimento do quadro) é possível no domínio da excitação. Nesse caso nenhum artefato (efeitos de bloco) é então audível.[054] The advantage of this embodiment is that a transformation without opening windows (or equivalently with an implicit rectangular window of the length of the frame) is possible in the excitation domain. In this case no artifacts (block effects) are then audible.

[055] Em uma primeira modalidade de realização, a extração dos componentes tonais e do sinal ambiente é efetuada de acordo com as etapas seguintes:[055] In a first embodiment, the extraction of the tonal components and the ambient signal is carried out according to the following steps:

[056] - detecção dos componentes tonais dominantes do sinal de banda baixa decodificado ou decodificado e estendido, no domínio de frequência;[056] - detection of the dominant tonal components of the decoded or decoded and extended low-band signal, in the frequency domain;

[057] - cálculo de um sinal residual por extração dos componentes tonais dominantes para obter o sinal ambiente.[057] - calculation of a residual signal by extracting the dominant tonal components to obtain the ambient signal.

[058] Essa modalidade de realização permite uma detecção exata dos componentes tonais.[058] This embodiment allows accurate detection of tonal components.

[059] Em uma segunda modalidade de realização, de baixa complexidade, a extração dos componentes tonais e do sinal ambiente é efetuada de acordo com as etapas seguintes:[059] In a second embodiment, of low complexity, the extraction of the tonal components and the ambient signal is carried out according to the following steps:

[060] - obtenção do sinal ambiente por cálculo de um valor médio do espectro do sinal de banda baixa decodificado ou decodificado e estendido;[060] - obtaining the ambient signal by calculating an average value of the spectrum of the decoded or decoded and extended low-band signal;

[061] - obtenção dos componentes tonais por subtração do sinal ambiente calculado no sinal de banda baixa decodificado ou decodificado e estendido.[061] - obtaining the tonal components by subtracting the ambient signal calculated from the decoded or decoded and extended low-band signal.

[062] Em uma modalidade de realização da etapa de combinação, um fator de controle do nível de energia utilizado para a mixagem adaptativa, é calculado em função da energia total do sinal de banda baixa decodificado ou decodificado e estendido e dos componentes tonais.[062] In one embodiment of the combination step, an energy level control factor used for adaptive mixing is calculated as a function of the total energy of the decoded or decoded and extended low-band signal and the tonal components.

[063] A aplicação desse fator de controle permite à etapa de combinação se adaptar às características do sinal para otimizar a proporção relativa de sinal ambiente na mistura. O nível de energia é assim controlado de modo a evitar os artefatos audíveis.[063] Applying this control factor allows the combination stage to adapt to the signal characteristics to optimize the relative proportion of ambient signal in the mix. The energy level is thus controlled to avoid audible artifacts.

[064] Em uma modalidade de realização preferida, o sinal de banda baixa decodificado suporta uma etapa de decomposição em sub-bandas por transformada ou por banco de filtros, as etapas de extração e de combinação se efetuando então no domínio de frequência ou em sub-bandas.[064] In a preferred embodiment, the decoded low-band signal supports a decomposition step into sub-bands by transform or filter bank, the extraction and combination steps then taking place in the frequency domain or in sub-bands. -bands.

[065] A implementação da extensão de banda no domínio de frequência permite obter uma precisão de análise de frequência que não está disponível com uma abordagem temporal, e permite também ter uma resolução de frequência suficiente para detectar os componentes tonais.[065] The implementation of band extension in the frequency domain allows to obtain frequency analysis precision that is not available with a temporal approach, and also allows to have sufficient frequency resolution to detect tonal components.

[066] Em uma modalidade de realização detalhada, o sinal de banda baixa decodificado e estendido é obtido de acordo com a equação seguinte: [066] In a detailed embodiment, the decoded and extended low-band signal is obtained according to the following equation:

[067] Com k o índice da amostra, U (k) o espectro do sinal obtido após uma etapa de transformada UHB1 (k) o espectro do sinal estendido, e startβband uma variável predefinida. Assim, essa função compreende uma reamostragem do sinal acrescentando amostras ao espectro desse sinal. Outros modos de estender o sinal são, no entanto, possíveis, por exemplo por translação em um processamento de subbandas.[067] With k the sample index, U (k) the signal spectrum obtained after a UHB1 transform step (k) the extended signal spectrum, and startβband a predefined variable. Thus, this function comprises resampling the signal by adding samples to the spectrum of that signal. Other ways of extending the signal are, however, possible, for example by translation in subband processing.

[068] A presente invenção visa também um dispositivo de extensão de banda de frequência de um sinal de audiofrequência, o sinal tendo sido decodificado em uma primeira banda de frequência chamada banda baixa. O dispositivo é tal que compreende:[068] The present invention also aims at a device for extending the frequency band of an audio frequency signal, the signal having been decoded in a first frequency band called low band. The device is such that it comprises:

[069] - um módulo de extração de componentes tonais e de um sinal ambiente a partir de um sinal proveniente do sinal de banda baixa decodificado;[069] - a module for extracting tonal components and an ambient signal from a signal originating from the decoded low-band signal;

[070] - um módulo de combinação dos componentes tonais e do sinal ambiente por mixagem adaptativa utilizando fatores de controle de nível de energia para obter um sinal áudio, chamado sinal combinado;[070] - a module for combining tonal components and the ambient signal by adaptive mixing using power level control factors to obtain an audio signal, called a combined signal;

[071] - um módulo de extensão em pelo menos uma segunda banda de frequência superior à primeira banda de frequência implementado no sinal decodificado de banda baixa antes do módulo de extração ou no sinal combinado depois do módulo de combinação.[071] - an extension module in at least a second frequency band higher than the first frequency band implemented in the low-band decoded signal before the extraction module or in the combined signal after the combination module.

[072] Esse dispositivo tem as mesmas vantagens que o processo descrito anteriormente, que ele implementa.[072] This device has the same advantages as the previously described process that it implements.

[073] A invenção visa um decodificador compreendendo um dispositivo tal como descrito.[073] The invention relates to a decoder comprising a device as described.

[074] Visa um programa informático compreendendo instruções de código para a implementação das etapas do processo de extensão de banda tal como descrito, quando essas instruções são executadas por um processador.[074] It aims at a computer program comprising code instructions for implementing the steps of the bandwidth extension process as described, when these instructions are executed by a processor.

[075] Finalmente, a invenção se refere a um suporte de armazenagem, legível por um processador, integrado ou não no dispositivo de extensão de banda, eventualmente amovível, memorizando um programa informático que implementa um processo de extensão de banda tal como descrito anteriormente.[075] Finally, the invention refers to a storage medium, readable by a processor, integrated or not in the bandwidth extension device, possibly removable, memorizing a computer program that implements a bandwidth extension process as described previously.

[076] Outras características e vantagens da invenção irão aparecer mais claramente na leitura da descrição que se segue, dada unicamente a título de exemplo não limitativo, e feita com referência aos desenhos anexados nos quais:[076] Other characteristics and advantages of the invention will appear more clearly when reading the following description, given solely by way of non-limiting example, and made with reference to the attached drawings in which:

[077] - a figura 1 ilustra uma parte de um decodificador de tipo AMR-WB implementando etapas de extensão de banda de frequência do estado da técnica e tal como descrito anteriormente;[077] - figure 1 illustrates a part of an AMR-WB type decoder implementing prior art frequency band extension steps as described previously;

[078] - a figura 2 ilustra um decodificador de tipo interoperável G.718-LD a 16 kHz de acordo com o estado da técnica e tal como descrito anteriormente;[078] - figure 2 illustrates an interoperable G.718-LD type decoder at 16 kHz according to the state of the art and as previously described;

[079] - a figura 3 ilustra um decodificador interoperável com a codificação AMR-WB e integrando um dispositivo de extensão de banda de acordo com uma modalidade de realização da invenção;[079] - figure 3 illustrates an interoperable decoder with AMR-WB coding and integrating a band extension device according to an embodiment of the invention;

[080] - a figura 4 ilustra na forma de organograma, as etapas principais de um processo de extensão de banda de acordo com uma modalidade de realização da invenção;[080] - figure 4 illustrates, in the form of an organizational chart, the main steps of a bandwidth extension process according to an embodiment of the invention;

[081] - a figura 5 ilustra uma modalidade de realização no domínio de frequência de um dispositivo de extensão de banda de acordo com a invenção integrado em um decodificador; e[081] - figure 5 illustrates an embodiment in the frequency domain of a band extension device according to the invention integrated into a decoder; It is

[082] - a figura 6 ilustra uma realização material de um dispositivo de extensão de banda de acordo com a invenção.[082] - Figure 6 illustrates a material embodiment of a band extension device according to the invention.

[083] A figura 3 ilustra um exemplo de decodificador, compatível com a norma AMR-WB/G.722.2 onde se encontra um pósprocessamento semelhante ao introduzido em G.718 e descrito com referência à figura 2 e uma extensão de banda melhorada de acordo com o processo de extensão da invenção, implementado pelo dispositivo de extensão de banda ilustrado pelo bloco 309.[083] Figure 3 illustrates an example of a decoder, compatible with the AMR-WB/G.722.2 standard, which features post-processing similar to that introduced in G.718 and described with reference to Figure 2 and an improved bandwidth extension in accordance with with the extension process of the invention, implemented by the bandwidth extension device illustrated by block 309.

[084] Contrariamente à decodificação AMR-WB que funciona com uma frequência de amostragem de saída de 16 kHz e à decodificação G.718 que funciona a 8 ou 16 kHz, é aqui considerado um decodificador que pode funcionar com um sinal de saída (síntese) para a frequência fs = 8, 16, 32 ou 48 kHz. De notar que se supõe aqui que a codificação foi efetuada de acordo com o algoritmo AMR-WB com uma frequência interna de 12,8 kHz para a codificação CELP de banda bai- xa e a 23,85 kbit/s para uma codificação de ganho por subquadro na frequência de 16 kHz, mas são também possíveis variantes interoperáveis do codificador AMR-WB; mesmo que a invenção seja descrita ao nível da decodificação, se supõe aqui que a codificação também pode funcionar com um sinal de entrada para a frequência fs = 8, 16, 32 ou 48 kHz e operações de reamostragem adequadas, ultrapassando o quadro da invenção, são implementadas na codificação em função do valor fs. Se pode notar que quando fs = 8 kHz para o decodificador, no caso de uma decodificação compatível com AMR-WB, não é necessário estender a banda baixa 0-6,4 kHz, porque a banda áudio reconstruída para a frequência fs está limitada a 04000 Hz.[084] Contrary to AMR-WB decoding that works with an output sampling frequency of 16 kHz and G.718 decoding that works at 8 or 16 kHz, a decoder that can work with an output signal (synthesis) is considered here. ) for the frequency fs = 8, 16, 32 or 48 kHz. Note that it is assumed here that coding was performed according to the AMR-WB algorithm with an internal frequency of 12.8 kHz for low-band CELP coding and 23.85 kbit/s for gain coding. per subframe at a frequency of 16 kHz, but interoperable variants of the AMR-WB encoder are also possible; Even though the invention is described at the decoding level, it is assumed here that the coding can also work with an input signal for the frequency fs = 8, 16, 32 or 48 kHz and suitable resampling operations, going beyond the scope of the invention, are implemented in the coding as a function of the fs value. It can be noted that when fs = 8 kHz for the decoder, in the case of AMR-WB compatible decoding, it is not necessary to extend the low band 0-6.4 kHz, because the reconstructed audio band for the fs frequency is limited to 04000Hz.

[085] Para a figura 3, a decodificação CELP (BF para baixas frequências) funciona sempre na frequência interna de 12,8 kHz, como em AMR-WB e G.718, e a extensão de banda (HF para altas frequências) tendo sido objeto da invenção funciona na frequência de 16 kHz, as sínteses BF e HF são combinadas (bloco 312) para a frequência fs após reamostragem adequada (blocos 307 e 311). Em variantes da invenção, a combinação das bandas baixa e alta poderá ser feita a 16 kHz, após reamostrada a banda baixa de 12,8 a 16 kHz, antes de reamostrar o sinal combinado para a frequência fs.[085] For figure 3, CELP decoding (BF for low frequencies) always works at the internal frequency of 12.8 kHz, as in AMR-WB and G.718, and the band extension (HF for high frequencies) having Since the object of the invention works at a frequency of 16 kHz, the BF and HF syntheses are combined (block 312) to the fs frequency after appropriate resampling (blocks 307 and 311). In variants of the invention, the combination of the low and high bands may be done at 16 kHz, after resampling the low band from 12.8 to 16 kHz, before resampling the combined signal to the fs frequency.

[086] A decodificação de acordo com a figura 3 depende do modo (ou débito) AMR-WB associado ao quadro corrente recebido. A título indicativo e sem que isso impacte o bloco 309, a decodificação da parte CELP de banda baixa compreende as etapas seguintes:[086] Decoding according to figure 3 depends on the AMR-WB mode (or rate) associated with the current frame received. As an indication and without impacting block 309, decoding the low-band CELP part comprises the following steps:

[087] Desmultiplexagem dos parâmetros codificados (bloco 300) no caso de quadro corretamente recebido (bfi=0 onde bfi é o «bad frame indicator» valendo 0 para um quadro recebido e 1 para um quadro perdido).[087] Demultiplexing of the coded parameters (block 300) in the case of a correctly received frame (bfi=0 where bfi is the “bad frame indicator” worth 0 for a received frame and 1 for a lost frame).

[088] Decodificação dos parâmetros ISF com interpolação e conversão em coeficientes LPC (bloco 301) como descrito na cláusula 6.1 da norma G.722.2[088] Decoding of ISF parameters with interpolation and conversion into LPC coefficients (block 301) as described in clause 6.1 of standard G.722.2

[089] Decodificação da excitação CELP (bloco 302), com uma parte adaptativa e fixa para reconstruir a excitação (exc. ou u’(n)) em cada sub-quadro de comprimento 64 a 12,8 kHz: u’ (n) = βp v(n) + βc c(n), n = 0,..., 63[089] CELP excitation decoding (block 302), with an adaptive and fixed part to reconstruct the excitation (exc. or u'(n)) in each sub-frame of length 64 to 12.8 kHz: u' (n ) = βp v(n) + βc c(n), n = 0,..., 63

[090] seguindo as notações da cláusula 7.1.2.1 de G.718 referindo a decodificação CELP, onde v/n) e c(n) são respectivamente as palavras de código dos dicionários adaptativo e fixo, e βp e βc são os ganhos decodificados associados. Essa excitação u’(n) é utilizada no dicionário adaptativo do sub-quadro seguinte; é em seguida pós processada e se distingue com em G.718 a excitação u’(n) (também marcada exc.) da sua versão pós-processada modificada u(n) (também marcada exc 2) que serve de entrada ao filtro de síntese, 1/ Â(z), no bloco 303. Em variantes que podem ser implementadas pela invenção, os pós-processamentos aplicados à excitação podem ser modificados (por exemplo, a dispersão de fase pode ser melhorada) ou esses pós-processamentos podem ser estendidos (por exemplo, uma diminuição do ruído inter- harmônico pode ser implementada), sem afetar a natureza do processo de extensão de banda de acordo com a invenção.[090] following the notations of clause 7.1.2.1 of G.718 referring to CELP decoding, where v/n) and c(n) are respectively the code words of the adaptive and fixed dictionaries, and βp and βc are the associated decoded gains . This excitation u’(n) is used in the adaptive dictionary of the following sub-frame; is then post-processed and is distinguished with in G.718 the excitation u'(n) (also marked exc.) from its modified post-processed version u(n) (also marked exc 2) which serves as input to the synthesis, 1/ Â(z), in block 303. In variants that can be implemented by the invention, the post-processings applied to the excitation can be modified (e.g., phase dispersion can be improved) or these post-processings can be extended (for example, a decrease in inter-harmonic noise can be implemented), without affecting the nature of the band extension process according to the invention.

[091] Filtragem de síntese por 1/Â(z) (bloco 303) onde o filtro LPC decodificado Â(z) é de ordem 16.[091] Synthesis filtering by 1/Â(z) (block 303) where the decoded LPC filter Â(z) is of order 16.

[092] Pós-processamento de banda estreita (bloco 304) de acordo com a cláusula 7,3 de G.718 se fs= 8 kHz.[092] Narrowband post-processing (block 304) according to clause 7.3 of G.718 if fs= 8 kHz.

[093] Desacentuação (bloco 305) pelo filtro 1/ (1 - 0,68z-1)[093] De-emphasis (block 305) by filter 1/ (1 - 0.68z-1)

[094] Pós-processamento das baixas frequências (bloco 306) tal como descrito na cláusula 7.14.1.1 de G.718. Esse processamento introduz um atraso que é tido em conta na decodificação da banda alta (>6,4 kHz).[094] Post-processing of low frequencies (block 306) as described in clause 7.14.1.1 of G.718. This processing introduces a delay that is taken into account when decoding the high band (>6.4 kHz).

[095] Reamostragem da frequência interna de 12,8 kHz para a frequência de saída fs (bloco 307). São possíveis várias realizações. Sem perda de generalidade, se considera aqui a título de exemplo que se fs=8 ou 16 kHz, a reamostragem descrita na cláusula 7,6 de G.718 é aqui retomada, e se fs=32 ou 48 kHz, são utilizados filtros de resposta impulsional finita (FIR) suplementares.[095] Resampling the internal frequency of 12.8 kHz to the output frequency fs (block 307). Several realizations are possible. Without loss of generality, it is considered here as an example that if fs=8 or 16 kHz, the resampling described in clause 7.6 of G.718 is resumed here, and if fs=32 or 48 kHz, filters are used. supplementary finite impulse response (FIR).

[096] Cálculo dos parâmetros do "noise gate" (bloco 308) que é realizado de modo preferencial como descrito na cláusula 7.14.3 de G.718.[096] Calculation of the "noise gate" parameters (block 308) which is preferably carried out as described in clause 7.14.3 of G.718.

[097] Em variantes que podem ser implementadas para a invenção, os pós-processamentos aplicados na excitação podem ser modificados (por exemplo a dispersão de fase pode ser melhorada) ou esses pós-processamentos podem ser estendidos (por exemplo, pode ser implementada uma redução do ruído inter-harmônico), sem afetar a natureza da extensão de banda. Não é aqui descrito o caso da decodificação da banda baixa quando o quadro corrente está perdido (bfi=1) que é informativo na norma 3GPP AMR-WB; em geral, quer se trate do decodificador AMR-WB ou de um decodificador geral se apoiando no modelo fonte-filtro, se trata tipicamente de estimar da melhor maneira a excitação LPC e os coeficientes do filtro LPC de síntese para reconstituir o sinal perdido guardando o modelo fonte-filtro. Quando bfi=1 se considera aqui que a extensão de banda (bloco 309) pode funcionar como no caso bfi=0 e um débito <23,85 kbit/s; assim, a descrição da invenção vai supor a seguir e sem perda de generalidade que bfi=0.[097] In variants that can be implemented for the invention, the post-processings applied to the excitation can be modified (for example, phase dispersion can be improved) or these post-processings can be extended (for example, a reduction of inter-harmonic noise), without affecting the nature of the band extension. The case of low band decoding when the current frame is lost (bfi=1) which is informative in the 3GPP AMR-WB standard is not described here; In general, whether it is the AMR-WB decoder or a general decoder relying on the source-filter model, it is typically a question of best estimating the LPC excitation and synthesis LPC filter coefficients to reconstitute the lost signal while keeping the source-filter model. When bfi=1 it is considered here that the bandwidth extension (block 309) can work as in the case bfi=0 and a speed <23.85 kbit/s; therefore, the description of the invention will assume below and without loss of generality that bfi=0.

[098] Pode-se notar que a utilização dos blocos 306, 308, 314 é opcional.[098] It can be noted that the use of blocks 306, 308, 314 is optional.

[099] Poder-se-á notar também que a decodificação da banda baixa descrita mais acima supõe um quadro corrente chamado «ativo» com um débito entre 6,6 e 23,85 kbit/s. Efetivamente, quando o modo DTX (transmissão contínua em francês) é ativado, alguns quadros po- dem ser codificados como «inativos» e nesse caso se pode ou transmitir um descritor de silêncio (de 35 bits) ou não transmitir nada. Em particular, se recorda que o quadro SID do codificador AMR-WB descreve vários parâmetros: parâmetros ISF em média de 8 quadros, energia média de 8 quadros, "flag de dithering" para a reconstrução de ruído não estacionário. Em todos os casos, no decodificador, existe o mesmo modelo de decodificação que para um quadro ativo, com uma reconstrução de excitação e de um filtro LPC para o quadro corrente, o que permite aplicar a invenção mesmo em quadros inativos. A mesma constante é aplicada para a decodificação de «quadros perdidos» ou (FEC, PLC) em que é aplicado o modelo LPC.[099] It may also be noted that the low band decoding described above assumes a current frame called “active” with a speed between 6.6 and 23.85 kbit/s. Indeed, when the DTX mode (continuous transmission in French) is activated, some frames can be coded as “inactive” and in this case it is possible to either transmit a silence descriptor (of 35 bits) or not transmit anything. In particular, remember that the SID frame of the AMR-WB encoder describes several parameters: ISF parameters averaged over 8 frames, average energy over 8 frames, "dithering flag" for non-stationary noise reconstruction. In all cases, in the decoder, there is the same decoding model as for an active frame, with an excitation reconstruction and an LPC filter for the current frame, which allows the invention to be applied even in inactive frames. The same constant is applied for the decoding of “lost frames” or (FEC, PLC) where the LPC model is applied.

[0100] Esse exemplo de decodificador funciona no domínio da excitação e compreende, portanto, uma etapa de decodificação do sinal de excitação de banda baixa. O dispositivo de extensão de banda e o processo de extensão de banda no sentido da invenção funcionam também em um domínio diferente do domínio da excitação e nomeadamente com um sinal direto decodificado de banda baixa ou um sinal ponderado ou um sinal ponderado por um filtro perceptual.[0100] This example decoder works in the excitation domain and therefore comprises a low-band excitation signal decoding step. The band extension device and the band extension process in the sense of the invention also work in a domain other than the excitation domain and namely with a low-band decoded direct signal or a weighted signal or a signal weighted by a perceptual filter.

[0101] Contrariamente à decodificação AMR-WB ou G.718, o decodificador descrito permite estender a banda baixa decodificada (50- 6400 Hz tendo em conta a filtragem passa alto a 50 Hz do decodificador, 0-6400 Hz no caso geral) a uma banda estendida cuja largura varia, indo aproximadamente 50-6900 Hz a 50-7700 Hz em função do modo implementado no quadro corrente. Se pode assim falar de uma primeira banda de frequência de 0 a 6400 Hz e de uma segunda banda de 6400 a 8000 Hz. Na realidade, na modalidade de realização privilegiada, a excitação para as altas frequências e gerada no domínio de frequência em uma banda de 5000 a 8000 Hz, para permitir uma filtragem passa banda com largura de 6000 a 6900 ou 7700 Hz cuja inclinação não é demasiado rígida na banda superior rejeitada.[0101] Contrary to AMR-WB or G.718 decoding, the described decoder allows extending the decoded low band (50-6400 Hz taking into account the decoder's 50 Hz high pass filtering, 0-6400 Hz in the general case) to an extended band whose width varies, ranging from approximately 50-6900 Hz to 50-7700 Hz depending on the mode implemented in the current board. One can thus speak of a first frequency band from 0 to 6400 Hz and a second band from 6400 to 8000 Hz. In reality, in the privileged embodiment, the excitation for high frequencies is generated in the frequency domain in a band from 5000 to 8000 Hz, to allow bandpass filtering with a width of 6000 to 6900 or 7700 Hz whose slope is not too rigid in the upper rejected band.

[0102] A parte síntese de banda alta é realizada no bloco 309 representando o dispositivo de extensão de banda de acordo com a invenção e que é detalhado na figura 5 em uma modalidade de realização.[0102] The high-band synthesis part is carried out in block 309 representing the band extension device according to the invention and which is detailed in figure 5 in one embodiment.

[0103] Para alinhar as bandas baixas e altas decodificadas, é introduzido um atraso (bloco 310) para sincronizar as saídas dos blocos 306 e 309 e a banda alta sintetizada a 16 kHz é reamostrada de 16 kHz para a frequência fs (saída de bloco 311). O valor do atraso T deverá ser adaptado para os outros casos (fs=32, 48 kHz) em função dos processamentos implementados. Se recorda que, quando (fs=8 kHz), não é necessário aplicar os blocos de 309 a 311 porque a banda do sinal de saída do decodificador está limitada para 0-4000 Hz.[0103] To align the decoded low and high bands, a delay (block 310) is introduced to synchronize the outputs of blocks 306 and 309 and the synthesized high band at 16 kHz is resampled from 16 kHz to the frequency fs (block output 311). The value of the delay T must be adapted for other cases (fs=32, 48 kHz) depending on the processing implemented. Remember that, when (fs=8 kHz), it is not necessary to apply blocks from 309 to 311 because the decoder output signal band is limited to 0-4000 Hz.

[0104] Se nota que o processo de extensão da invenção implementado no bloco 309 de acordo com a primeira modalidade de realização não introduz de modo preferencial nenhum atraso suplementar em relação à banda baixa reconstruída a 12,8 kHz; no entanto, em variantes da invenção (por exemplo utilizando uma transformação tempo/ frequência com sobreposição), poderá ser introduzido um atraso. Assim, de modo geral o valor de T no bloco 310 deverá ser ajustado em função da implementação específica. Por exemplo, se o pósprocessamento das baixas frequências (bloco 306) não é utilizado, o atraso a ser introduzido para fs=16 kHz poderá ser fixado em T=15.[0104] It is noted that the invention extension process implemented in block 309 according to the first embodiment preferably does not introduce any additional delay in relation to the reconstructed low band at 12.8 kHz; however, in variants of the invention (for example using a time/frequency transformation with overlap), a delay may be introduced. Thus, in general the value of T in block 310 should be adjusted depending on the specific implementation. For example, if low frequency post-processing (block 306) is not used, the delay to be introduced for fs=16 kHz could be fixed at T=15.

[0105] As bandas baixa e alta são em seguida combinadas (adicionadas) no bloco 312 e a síntese obtida é pós-processada por filtragem passa alto a 50 Hz (de tipo IIR) de ordem 2 cujos coeficientes dependem da frequência fs (bloco 313) e pós-processamento de saída com aplicação opcional do "noise gate" de modo semelhante a G.718 (bloco 314).[0105] The low and high bands are then combined (added) in block 312 and the synthesis obtained is post-processed by high pass filtering at 50 Hz (type IIR) of order 2 whose coefficients depend on the frequency fs (block 313 ) and output post-processing with optional application of the "noise gate" in a similar way to G.718 (block 314).

[0106] O dispositivo de extensão de banda de acordo com a invenção, ilustrado pelo bloco 309 de acordo com o modo de realização do decodificador da figura 5, implementa um processo de extensão de banda (no sentido lato) descrito presentemente com referência à figura 4.[0106] The bandwidth extension device according to the invention, illustrated by block 309 according to the decoder embodiment of figure 5, implements a bandwidth extension process (in the broad sense) described presently with reference to figure 4.

[0107] Esse dispositivo de extensão também pode ser independente do decodificador e pode implementar o processo descrito na figura 4 para efetuar uma extensão de banda de um sinal áudio existente armazenado ou transmitido ao dispositivo, com uma análise do sinal áudio para extrair por exemplo uma excitação e um filtro LPC.[0107] This extension device may also be independent of the decoder and may implement the process described in Figure 4 to perform a bandwidth extension of an existing audio signal stored or transmitted to the device, with an analysis of the audio signal to extract, for example, a excitation and an LPC filter.

[0108] Esse dispositivo recebe na entrada um sinal decodificado em uma primeira banda de frequência chamada banda baixa u(n) que pode ser no domínio da excitação ou no do sinal. Na modalidade de realização descrita aqui, uma etapa de decomposição em sub-bandas (E401b) por transformada de tempo de frequência ou banco de filtros é aplicada ao sinal decodificado de banda baixa para obter o espectro do sinal decodificado de banda baixa U (k) para uma implementação no domínio de frequência.[0108] This device receives at its input a signal decoded in a first frequency band called low band u(n) which can be in the excitation or signal domain. In the embodiment described here, a subband decomposition step (E401b) by frequency-time transform or filter bank is applied to the low-band decoded signal to obtain the spectrum of the low-band decoded signal U(k) for a frequency domain implementation.

[0109] Uma etapa E401a de extensão do sinal decodificado de banda baixa em uma segunda banda de frequência superior à primeira banda de frequência, para obter um sinal decodificado de banda baixa estendido UHB1 (k), pode ser efetuada sobre esse sinal decodificado de banda baixa antes ou depois da etapa de análise (decomposição em sub-bandas). Essa etapa de extensão pode compreender ao mesmo tempo uma etapa de reamostragem e uma etapa de extensão ou simplesmente uma etapa de translação ou de transposição de frequência em função do sinal obtido na entrada. Nota-se que em variantes, a etapa E401a poderá ser efetuada no final do processamento descrito na figura 4, isto é, sobre o sinal combinado, esse processamento sendo então principalmente realizado no sinal de banda baixa antes da extensão, sendo o resultado equivalente.[0109] A step E401a of extending the low-band decoded signal into a second frequency band higher than the first frequency band, to obtain an extended low-band decoded signal UHB1 (k), can be carried out on this low-band decoded signal. low before or after the analysis stage (decomposition into sub-bands). This extension step may comprise at the same time a resampling step and an extension step or simply a translation or frequency transposition step depending on the signal obtained at the input. Note that in variants, step E401a may be carried out at the end of the processing described in figure 4, that is, on the combined signal, this processing being then mainly carried out on the low band signal before extension, with the result being equivalent.

[0110] Essa etapa é detalhada ulteriormente na modalidade de realização descrita com referência à figura 5.[0110] This step is further detailed in the embodiment described with reference to figure 5.

[0111] Uma etapa E402 de extração de um sinal ambiente (UHBA (k)) e de componentes tonais (y(k)) é efetuada a partir do sinal de banda baixa decodificado (U (k)) ou decodificado e estendido (UHB1 (k)). Se define aqui o ambiente como o sinal residual que é obtido suprimindo no sinal existente as harmônicas (ou componentes tonais) principais (ou dominantes).[0111] A step E402 of extracting an ambient signal (UHBA (k)) and tonal components (y (k)) is carried out from the decoded (U (k)) or decoded and extended (UHB1) low-band signal (k)). The environment is defined here as the residual signal that is obtained by suppressing the main (or dominant) harmonics (or tonal components) in the existing signal.

[0112] Na maior parte dos sinais de banda larga (amostrada a 16 kHz), a banda alta (>6 kHz) contém uma informação de ambiente que é geralmente semelhante à presente na banda baixa.[0112] In most broadband signals (sampled at 16 kHz), the high band (>6 kHz) contains ambient information that is generally similar to that present in the low band.

[0113] A etapa de extração dos componentes tonais e do sinal ambiente compreende por exemplo as etapas seguintes:[0113] The stage of extracting the tonal components and the ambient signal comprises, for example, the following steps:

[0114] - detecção dos componentes tonais dominantes do sinal de banda baixa decodificado (ou decodificado e estendido) no domínio de frequência; e[0114] - detection of the dominant tonal components of the decoded (or decoded and extended) low-band signal in the frequency domain; It is

[0115] - cálculo de um sinal residual por extração dos componentes tonais dominantes para obter o sinal ambiente.[0115] - calculation of a residual signal by extracting the dominant tonal components to obtain the ambient signal.

[0116] Essa etapa pode também ser obtida por:[0116] This step can also be achieved by:

[0117] - obtenção do sinal ambiente por cálculo de uma média do sinal de banda baixa decodificado (ou decodificado e estendido); e[0117] - obtaining the ambient signal by calculating an average of the decoded (or decoded and extended) low band signal; It is

[0118] - obtenção dos componentes tonais por subtração do sinal ambiente calculado ao sinal de banda baixa decodificado (ou decodificado e estendido).[0118] - obtaining the tonal components by subtracting the calculated ambient signal from the decoded (or decoded and extended) low band signal.

[0119] Os componentes tonais e o sinal ambiente são em seguida combinados de modo adaptativo com a ajuda de fatores de controle de nível de energia na etapa E403 para obter um sinal chamado combinado (UHB2 (k)). A etapa de extensão E401a pode então ser implementada se não foi já efetuada no sinal de banda baixa decodificado.[0119] The tonal components and the ambient signal are then adaptively combined with the help of power level control factors in step E403 to obtain a so-called combined signal (UHB2 (k)). The extension step E401a can then be implemented if it has not already been carried out on the decoded low band signal.

[0120] Assim, a combinação desses dois tipos de sinais permite obter um sinal combinado com características mais adaptadas a certos tipos de sinais como sinais musicais e mais rico em conteúdo de frequência e na banda de frequência estendida correspondente a qualquer banda de frequência incluindo a primeira e a segunda banda de frequência.[0120] Thus, the combination of these two types of signals allows obtaining a combined signal with characteristics more adapted to certain types of signals such as musical signals and richer in frequency content and in the extended frequency band corresponding to any frequency band including the first and second frequency bands.

[0121] extensão de banda de acordo com o processo melhora a qualidade desse tipo de sinais em relação à extensão descrita na norma AMR-WB.[0121] band extension according to the process improves the quality of this type of signals in relation to the extension described in the AMR-WB standard.

[0122] O fato de utilizar uma combinação de sinal ambiente e de componentes tonais permite enriquecer esse sinal de extensão para o colocar mais próximo das características do verdadeiro sinal e não de um sinal artificial.[0122] The fact of using a combination of ambient signal and tonal components allows this extension signal to be enriched to bring it closer to the characteristics of the true signal and not an artificial signal.

[0123] Essa etapa de combinação será detalhada ulteriormente com referência à figura 5.[0123] This combination step will be detailed later with reference to figure 5.

[0124] Uma etapa de síntese, que corresponde à análise de 401b, é efetuada em E404b para reconduzir o sinal no domínio temporal.[0124] A synthesis step, which corresponds to the analysis of 401b, is carried out in E404b to redirect the signal in the temporal domain.

[0125] De modo opcional, uma etapa de ajustamento de nível de energia do sinal de banda alta pode ser efetuada em E404a, antes e/ou depois da etapa de síntese, para aplicação de um ganho e/ou por filtragem adequada. Essa etapa será explicada mais em detalhes na modalidade de realização descrita na figura 5 para os blocos de 501 a 507.[0125] Optionally, an energy level adjustment step for the high-band signal can be carried out in E404a, before and/or after the synthesis step, to apply a gain and/or by suitable filtering. This step will be explained in more detail in the embodiment described in figure 5 for blocks 501 to 507.

[0126] Em um exemplo de realização, o dispositivo de extensão de banda 500 é descrito agora em referência à figura 5 ilustrando ao mesmo tempo esse dispositivo mas também módulos de processamento adaptados à implementação em um decodificador de tipo interoperável com uma codificação AMR-WB. Esse dispositivo 500 implementa o processo de extensão de banda descrito anteriormente com referência à figura 4.[0126] In an exemplary embodiment, the bandwidth extension device 500 is now described with reference to Figure 5 illustrating at the same time this device but also processing modules adapted for implementation in an interoperable type decoder with an AMR-WB encoding . This device 500 implements the bandwidth extension process described previously with reference to Figure 4.

[0127] Assim, o bloco de processamento 510 recebe o sinal de banda baixa decodificado (u(n)). Em uma modalidade de realização particular, a extensão de banda utiliza a excitação decodificada a 12,8 kHz (exc 2 ou u (n)) na saída do bloco 302 da figura 3.[0127] Thus, the processing block 510 receives the decoded low-band signal (u(n)). In a particular embodiment, the band extension uses the excitation decoded at 12.8 kHz (exc 2 or u (n)) at the output of block 302 of figure 3.

[0128] Esse sinal é decomposto em sub-bandas de frequência pelo módulo de decomposição em sub-bandas 510 (que implementa a etapa E401b da figura 4) que realiza em geral uma transformada ou aplica um banco de filtros, para obter uma decomposição em subbandas U (k) do sinal u (n).[0128] This signal is decomposed into frequency sub-bands by the sub-band decomposition module 510 (which implements step E401b of Figure 4) which generally performs a transform or applies a bank of filters, to obtain a decomposition into subbands U (k) of signal u (n).

[0129] Em uma modalidade de realização particular, uma transformada de tipo DCT-IV (para "Discret Cosine Transform" - Tipo IV em inglês) (bloco 510) é aplicada no quadro corrente de 20 ms (256 amostras), sem abertura de janelas, o que equivale a transformar diretamente u (n) com n = 0, ..., 255 de acordo com a fórmula seguinte: [0129] In a particular embodiment, a DCT-IV type transform (for "Discret Cosine Transform" - Type IV in English) (block 510) is applied to the current 20 ms frame (256 samples), without opening windows, which is equivalent to directly transforming u (n) with n = 0, ..., 255 according to the following formula:

[0130] onde N = 256 e k = 0, ... , 255[0130] where N = 256 and k = 0, ... , 255

[0131] Uma transformação sem abertura de janelas (ou de modo equivalente com uma janela retangular implícita do comprimento do quadro) é possível quando o processamento é efetuado no domínio da excitação, e não no domínio do sinal. Nesse caso nenhum artefato (efeitos de bloco) é audível, o que constitui uma vantagem significativa dessa modalidade de realização da invenção.[0131] A windowless transformation (or equivalently with an implicit rectangular frame-length window) is possible when processing is carried out in the excitation domain rather than the signal domain. In this case, no artifacts (block effects) are audible, which constitutes a significant advantage of this embodiment of the invention.

[0132] Nessa modalidade de realização, a transformação DCT-IV é implementada por FFT segundo o algoritmo chamado «Evolved DCT (EDCT) » descrito no artigo de D.M. Zhang, H.T. Li, A Low Complexity Transform - Evolved DCT, IEEE 14th, International Conference on Computational Science and Engineering (CSE), Aug 2011, pp. 144- 149, e implementado nas normas UIT-T G.718 Anexo B e G.729.1 Anexo E.[0132] In this embodiment, the DCT-IV transformation is implemented by FFT according to the algorithm called «Evolved DCT (EDCT)» described in the article by D.M. Zhang, H. T. Li, A Low Complexity Transform - Evolved DCT, IEEE 14th, International Conference on Computational Science and Engineering (CSE), Aug 2011, pp. 144- 149, and implemented in ITU-T standards G.718 Annex B and G.729.1 Annex E.

[0133] Em variantes da invenção e sem perda de generalidade, a transformação DCT-IV poderá ser substituída por outras transformações tempo-frequências a curto prazo com o mesmo comprimento e no domínio da excitação ou no domínio do sinal, como uma FFT (para "Fast Fourier Transform" em inglês) ou uma DCT-II (Discrete Cosine Transform -Tipo II) . De modo alternativo, se poderá substituir a DCTIV no quadro por uma transformação com sobreposição-adição e abertura de janelas com comprimento superior ao comprimento do quadro corrente, por exemplo utilizando uma MDCT (para "Modified Discrete Cosine Transform" em inglês). Nesse caso o atraso T no bloco 310 da figura 3, deverá ser ajustado (reduzido) de modo adequado em função do atraso adicional devido à análise/síntese por essa transformada.[0133] In variants of the invention and without loss of generality, the DCT-IV transformation may be replaced by other short-term time-frequency transformations of the same length and in the excitation domain or in the signal domain, such as an FFT (for "Fast Fourier Transform" in English) or a DCT-II (Discrete Cosine Transform -Type II). Alternatively, you can replace the DCTIV in the frame with a transformation with overlap-addition and opening of windows longer than the length of the current frame, for example using an MDCT (for "Modified Discrete Cosine Transform" in English). In this case, the delay T in block 310 of figure 3 must be adjusted (reduced) appropriately depending on the additional delay due to analysis/synthesis by this transform.

[0134] E uma outra modalidade de realização, a decomposição em sub-bandas é efetuada pela aplicação de um banco de filtros, por exemplo de tipo PQMF (Pseudo-QMF) reais ou complexos. Para alguns bancos de filtros, se obtém para cada sub-banda em um quadro dado, não um valor espectral, mas uma série de valores temporais associados à sub-banda; nesse caso, a modalidade de realização privilegiada na invenção pode ser aplicada realizando por exemplo, uma transformada de cada sub-banda e calculando o sinal ambiente no domínio dos valores absolutos, os componentes tonais sendo sempre obtidos por diferença entre o sinal (de valor absoluto) e o sinal ambiente. No caso de um banco de filtro complexo, o módulo complexo das amostras substituirá o valor absoluto.[0134] And another embodiment, the decomposition into sub-bands is carried out by applying a bank of filters, for example real or complex PQMF (Pseudo-QMF) type. For some filter banks, one obtains for each sub-band in a given frame, not a spectral value, but a series of temporal values associated with the sub-band; In this case, the privileged embodiment of the invention can be applied by performing, for example, a transform of each sub-band and calculating the ambient signal in the domain of absolute values, the tonal components always being obtained by the difference between the signal (of absolute value ) and the ambient signal. In the case of a complex filter bank, the complex modulus of the samples will replace the absolute value.

[0135] Em outras modalidades de realização, a invenção será aplicada em um sistema utilizando duas sub-bandas, a banda baixa sendo analisada por transformada ou pelo banco de filtros.[0135] In other embodiments, the invention will be applied to a system using two sub-bands, the low band being analyzed by transform or by the filter bank.

[0136] No caso de uma DCT, o espectro DCT, U (k), de 256 amostras cobrindo a banda 0-6400 Hz (a 12,8 kHz), é em seguida estendido (bloco 511) em um espectro de 320 amostras cobrindo a banda 0-8000 Hz (a 16 kHz) na forma seguinte: [0136] In the case of a DCT, the DCT spectrum, U(k), of 256 samples covering the band 0-6400 Hz (at 12.8 kHz), is then extended (block 511) into a spectrum of 320 samples covering the band 0-8000 Hz (to 16 kHz) in the following form:

[0137] onde se tem de modo preferencial startβband = 160.[0137] where we preferably have startβband = 160.

[0138] O bloco 511 implementa E401a da figura 4, isto é a extensão do sinal decodificado de banda baixa. Essa etapa pode também compreender uma reamostragem de 12,8 a 16 kHz no domínio de frequência, acrescentando % de amostras (k = 240, ... ,319) ao espectro, a razão entre 16 e 12,8 sendo de 5/4.[0138] Block 511 implements E401a of Figure 4, that is, the extension of the low-band decoded signal. This step may also comprise a resampling from 12.8 to 16 kHz in the frequency domain, adding % of samples (k = 240, ... ,319) to the spectrum, the ratio between 16 and 12.8 being 5/4 .

[0139] Na banda de frequência correspondente às amostras indo dos índices 200 a 239, o espectro original é mantido, para se poder aplicar uma resposta de atenuação progressiva do filtro passa alto nessa banda de frequência e também para não introduzir falhas audíveis no momento da etapa de adição da síntese de baixa frequência para a síntese de alta frequência.[0139] In the frequency band corresponding to the samples ranging from indices 200 to 239, the original spectrum is maintained, in order to be able to apply a progressive attenuation response of the high-pass filter in this frequency band and also to not introduce audible gaps at the time of step of adding low-frequency synthesis to high-frequency synthesis.

[0140] Nota-se que nessa modalidade de realização, a geração do espectro estendido sobre-amostrado é efetuada em uma banda de frequência indo de 5 a 8 kHz incluindo, portanto, uma segunda banda de frequência (6,4-8 kHz) superior à primeira banda de frequência (0- 6,4 kHz).[0140] Note that in this embodiment, the generation of the oversampled extended spectrum is carried out in a frequency band ranging from 5 to 8 kHz, therefore including a second frequency band (6.4-8 kHz) higher than the first frequency band (0- 6.4 kHz).

[0141] Assim, a extensão do sinal de banda baixa decodificado é efetuada pelo menos na segunda banda de frequência mas também em uma parte da primeira banda de frequência.[0141] Thus, the extension of the decoded low-band signal is carried out at least in the second frequency band but also in a part of the first frequency band.

[0142] Bem evidentemente, os valores definindo essas bandas de frequência podem ser diferentes de acordo com o decodificador ou com o dispositivo de processamento onde é aplicada a invenção.[0142] Clearly, the values defining these frequency bands may be different depending on the decoder or processing device where the invention is applied.

[0143] Para além disso, o bloco 511 realiza uma filtragem passa alto na banda 0-5000 Hz visto que as 200 primeiras amostras de UHB1 (k) são colocadas a zero; como explicado mais tarde, essa filtragem passa alto pode também ser completada por uma parte de atenuação progressiva dos valores espectrais de índices k = 200, ...,255 na ban- da 50006400 Hz, essa atenuação progressiva é implementada no bloco 501 mas se poderia realizar separadamente fora do bloco 501. De modo equivalente e em variantes da invenção, a implementação da filtragem passa alto separada em blocos de coeficientes de índice k = 0, .,199 colocados a zero, de coeficientes k = 200, ., 255 atenuados, no domínio transformado, poderá, portanto, se efetuar em uma única etapa.[0143] Furthermore, block 511 performs high-pass filtering in the 0-5000 Hz band as the first 200 samples of UHB1 (k) are set to zero; As explained later, this high pass filtering can also be completed by a progressive attenuation part of the spectral values of indices k = 200, ..., 255 in the 50006400 Hz band, this progressive attenuation is implemented in block 501 but if could be carried out separately outside of block 501. Equivalently and in variants of the invention, the implementation of high pass filtering separated into blocks of index coefficients k = 0, .,199 set to zero, of coefficients k = 200, ., 255 attenuated, in the transformed domain, can, therefore, be carried out in a single step.

[0144] Nesse exemplo de realização e de acordo com a definição de UHB1 (k), se nota que a banda 5000-6000 Hz de UHB1 (k) que corresponde aos índices k = 200, ., 239) é copiada a partir da banda 5000-6000 Hz de U (k). Essa aproximação permite manter o espectro original nessa banda e evita introduzir distorções na banda 5000-6000 Hz no momento da adição da síntese HF com a síntese BF - em particular a fase do sinal (implicitamente representada no domínio DCT-IV) nessa banda é preservada.[0144] In this embodiment and in accordance with the definition of UHB1 (k), it is noted that the 5000-6000 Hz band of UHB1 (k) which corresponds to the indices k = 200, ., 239) is copied from the U(k) band 5000-6000 Hz. This approach allows maintaining the original spectrum in this band and avoids introducing distortions in the 5000-6000 Hz band when adding HF synthesis with BF synthesis - in particular the signal phase (implicitly represented in the DCT-IV domain) in this band is preserved .

[0145] A banda 6000-8000 Hz de UHB1 (k) é aqui definida copiando a banda 4000-6000 Hz de U(k) visto que o valor de startβband é fixado preferencialmente a 160.[0145] The 6000-8000 Hz band of UHB1 (k) is defined here by copying the 4000-6000 Hz band of U(k) since the startβband value is preferably set at 160.

[0146] Em uma variante da modalidade de realização, o valor de startβband se poderá tornar adaptativo em torno do valor de 160, sem modificar a natureza da invenção. Os detalhes da adaptação do valor startβband não são descritos aqui porque ultrapassam o quadro da invenção sem mudar o alcance.[0146] In a variant of the embodiment, the startβband value may become adaptive around the value of 160, without changing the nature of the invention. The details of adapting the startβband value are not described here because they go beyond the scope of the invention without changing the range.

[0147] Na maior parte dos sinais de banda larga (amostrada a 16 kHz), a banda alta (<6 khz) contém uma informação de ambiente que é naturalmente semelhante à presente na banda baixa. Se define aqui ambiente como o sinal residual que é obtido suprimindo no sinal existente as harmônicas principais (ou dominantes). O nível de harmonicidade na banda 6000-8000 Hz está geralmente correlacionado com o das bandas de frequências inferiores.[0147] In most broadband signals (sampled at 16 kHz), the high band (<6 kHz) contains ambient information that is naturally similar to that present in the low band. Ambient is defined here as the residual signal that is obtained by suppressing the main (or dominant) harmonics in the existing signal. The level of harmonicity in the 6000-8000 Hz band is generally correlated with that of the lower frequency bands.

[0148] Esse sinal de banda baixa decodificado e estendido é fornecido na entrada do dispositivo de extensão 500 e nomeadamente na entrada do módulo 512. Assim, o bloco 512 de extração de componentes tonais e de um sinal ambiente, implementa a etapa E402 da figura 4 no domínio de frequência. O sinal ambiente, UHBA (k) para k = 240, ...,319 (80 amostras) é assim obtido para uma segunda banda de frequência chamada de alta frequência para a combinar em seguida de modo adaptativo com os componentes tonais y(k) no bloco de combinação 513.[0148] This decoded and extended low-band signal is provided at the input of the extension device 500 and in particular at the input of the module 512. Thus, the block 512 for extracting tonal components and an ambient signal implements step E402 of figure 4 in the frequency domain. The ambient signal, UHBA (k) for k = 240, ...,319 (80 samples) is thus obtained for a second frequency band called high frequency to then combine it adaptively with the tonal components y(k ) in combination block 513.

[0149] Em uma modalidade de realização particular, a extração dos componentes tonais e do sinal de ambiente (na banda 6000-8000 Hz) é efetuada de acordo com as operações seguintes:[0149] In a particular embodiment, the extraction of the tonal components and the ambient signal (in the 6000-8000 Hz band) is carried out according to the following operations:

[0150] Cálculo da energia total do sinal de banda baixa decodificado estendido enerHB: 319 [0150] Calculation of the total energy of the extended decoded low-band signal enerHB: 319

[0151] onde ε = 0,1 (esse valor pode ser diferente, é aqui fixado a título de exemplo).[0151] where ε = 0.1 (this value may be different, it is set here as an example).

[0152] Cálculo de ambiente (em valor absoluto) que corresponde aqui ao nível médio do espectro lev(i) (linha por linha) e cálculo da energia enertonal das partes tonais dominantes (no espectro de altas frequências)[0152] Ambient calculation (in absolute value) that corresponds here to the average level of the lev(i) spectrum (line by line) and calculation of the enertonal energy of the dominant tonal parts (in the high frequency spectrum)

[0153] Para i = 0...L - 1, se obtém esse nível médio pela equação seguinte: [0153] For i = 0...L - 1, this average level is obtained by the following equation:

[0154] Isso corresponde ao nível médio (em valor absoluto) e representa, portanto, uma espécie de invólucro do espectro. Nessa modalidade de realização, L = 80 e representa o comprimento do espectro e o índice i de 0 a L-1 corresponde aos índices j + 240 de 240 a 319, ou seja, o espectro de 6 a 8 kHz.[0154] This corresponds to the average level (in absolute value) and therefore represents a kind of spectrum envelope. In this embodiment, L = 80 and represents the length of the spectrum and the index i from 0 to L-1 corresponds to the indexes j + 240 from 240 to 319, that is, the spectrum from 6 to 8 kHz.

[0155] Em geral fb(i) = i - 7 e fn(i) = i + 7, no entanto os 7 primeiros e últimos índices (i = 0,..., 6 e i = L - 7,., L - 1) requerem um processamento especial sem perda da generalidade são então definidos:[0155] In general fb(i) = i - 7 and fn(i) = i + 7, however the 7 first and last indices (i = 0,..., 6 and i = L - 7,., L - 1) require special processing without loss of generality are then defined:

[0156] fb (i) = 0 e fn(i) = i + 7 para i = 0,..., 6[0156] fb (i) = 0 and fn(i) = i + 7 for i = 0,..., 6

[0157] fb(i) = i - 7 e fn(i) = L - 1 para i = L - 7,., L - 1[0157] fb(i) = i - 7 and fn(i) = L - 1 for i = L - 7,., L - 1

[0158] Em variantes da invenção, a média de βUHB1 (j + 240) β, j = fb(i),., fn(i), poderá ser substituída por um valor mediano sobre o mesmo conjunto de valores, ou seja lev(i) = medianj=fb(i),..., fn(i) (βUHB1 (j + 240)β). Essa variante tem o defeito de ser mais complexa (em termos de número de cálculos) do que uma média deslizante. Em outras variantes uma ponderação não uniforme poderá ser aplicada aos termos médios, ou a filtragem mediana poderá ser substituída por exemplo por outros filtros não lineares de tipo «stack filters».[0158] In variants of the invention, the average of βUHB1 (j + 240) β, j = fb(i),., fn(i), may be replaced by a median value over the same set of values, i.e. lev (i) = medianj=fb(i),..., fn(i) (βUHB1 (j + 240)β). This variant has the drawback of being more complex (in terms of number of calculations) than a sliding average. In other variants, a non-uniform weighting may be applied to the average terms, or the median filtering may be replaced, for example, by other non-linear filters of the “stack filters” type.

[0159] É também calculado o sinal residual:[0159] The residual signal is also calculated:

[0160] y(i) = βUHB1 (i + 240)β - lev(i), i = 0,., L - 1[0160] y(i) = βUHB1 (i + 240)β - lev(i), i = 0,., L - 1

[0161] que corresponde (aproximadamente) aos componentes tonais se o valor y(i) para uma linha i dada é positivo (y(i)>0).[0161] which corresponds (approximately) to the tonal components if the value y(i) for a given line i is positive (y(i)>0).

[0162] Esse cálculo faz, portanto, intervir uma detecção implícita dos componentes tonais. As partes tonais são portanto implicitamente detectadas usando o termo intermediário y(i) representando um limiar adaptativo. A condição de detecção sendo y(i)>0. Em variantes da invenção essa condição pode ser alterada por exemplo, definindo um limiar adaptativo em função do invólucro local do sinal ou na forma y(i)> lev(i) + xdB onde x tem um valor predefinido (por exemplo, x = 10 db).[0162] This calculation therefore involves an implicit detection of tonal components. Tonal parts are therefore implicitly detected using the intermediate term y(i) representing an adaptive threshold. The detection condition being y(i)>0. In variants of the invention this condition can be changed, for example, by defining an adaptive threshold depending on the local envelope of the signal or in the form y(i)> lev(i) + xdB where x has a predefined value (for example, x = 10 db).

[0163] A energia das partes tonais dominantes é definida pela equação seguinte: [0163] The energy of the dominant tonal parts is defined by the following equation:

[0164] Outros métodos de extração do sinal ambiente podem evidentemente ser considerados. Por exemplo, esse sinal ambiente pode ser extraído de um sinal de baixa frequência ou eventualmente de uma outra banda de frequência (ou de várias bandas de frequência).[0164] Other methods of extracting the ambient signal can obviously be considered. For example, this ambient signal can be extracted from a low frequency signal or possibly from another frequency band (or several frequency bands).

[0165] A detecção dos picos ou componentes tonais poderá ser feita diferentemente.[0165] The detection of peaks or tonal components may be done differently.

[0166] A extração desse sinal ambiente poderia também ser feita sobre a excitação decodificada, mas não estendida, isto é, antes da etapa de extensão ou de translação espectral, isto é, por exemplo em uma porção do sinal de baixa frequência em vez de diretamente sobre o sinal de alta frequência.[0166] The extraction of this ambient signal could also be done on the decoded but not extended excitation, that is, before the extension or spectral translation step, that is, for example on a portion of the low frequency signal instead of directly on the high frequency signal.

[0167] Em uma variante de realização, a extração dos componentes tonais e do sinal ambiente é efetuada em uma ordem diferente e de acordo com as etapas seguintes:[0167] In a variant of embodiment, the extraction of the tonal components and the ambient signal is carried out in a different order and according to the following steps:

[0168] - detecção dos componentes tonais dominantes do sinal de banda baixa decodificado (ou decodificado e estendido), no domínio de frequência;[0168] - detection of the dominant tonal components of the decoded (or decoded and extended) low-band signal in the frequency domain;

[0169] - cálculo de um sinal residual por extração dos componentes tonais dominantes para obter o sinal ambiente.[0169] - calculation of a residual signal by extracting the dominant tonal components to obtain the ambient signal.

[0170] Essa variante pode por exemplo ser realizada do seguinte modo: Um pico (ou componente tonal) é detectado em uma linha de índice i no espectro de amplitude βUHB1 (i+240) β se o critério seguinte é verificado: [0170] This variant can for example be carried out in the following way: A peak (or tonal component) is detected in a line with index i in the amplitude spectrum βUHB1 (i+240) β if the following criterion is met:

[0171] Para i = 0, ..., L - 1. Desde que é detectado um pico na linha mde índice i se aplica um modelo sinusoidal para estimar os parâmetros de amplitude de frequência e eventualmente de fase de um componente tonal associado a esse pico. Os detalhes dessa estimativa não são aqui apresentados, mas a estimativa da frequência pode tipicamente recorrer a uma interpolação parabólica sobre 3 pontos PA ra localizar o máximo da parábola aproximando os 3 pontos de amplitude βUHB1 (i+240) β (reconduzido em dB), a estimativa de amplitude sendo obtida através dessa mesma interpolação. O domínio por transformada utilizado aqui (DCT- IV) não permitindo obter diretamente a fase, poderá em uma modalidade de realização, negligenciar esse termo, mas em variantes se poderá aplicar uma transformada em quadratura de tipo DST para estimar um termo de fase. O valor inicial de y(i) é colocado a zero para i = 0, ..., L - 1. Os parâmetros sinusoidais (frequência, amplitude, e eventualmente fase) de cada componente tonal sendo estimados, o termo y(i) é então calculado como a soma de protótipos (espectros) predefinidos de sinusoides puros de transformadas no domínio DCT-IV (ou outro se é utilizada uma outra decomposição em sub-bandas) de acordo com os parâmetros sinusoidais estimados. Finalmente é aplicado um valor absoluto aos termos y(i) para ser reconduzido ao domínio do espectro de amplitude em valores absolutos.[0171] For i = 0, ..., L - 1. Since a peak is detected on the m index line i, a sinusoidal model is applied to estimate the frequency amplitude and eventually phase parameters of a tonal component associated with this peak. The details of this estimate are not presented here, but the frequency estimate can typically resort to a parabolic interpolation over 3 PA points to locate the maximum of the parabola by approaching the 3 amplitude points βUHB1 (i+240) β (reduced in dB), the amplitude estimate being obtained through this same interpolation. The transform domain used here (DCT-IV), not allowing the phase to be obtained directly, may, in one embodiment, neglect this term, but in variants a DST-type quadrature transform may be applied to estimate a phase term. The initial value of y(i) is set to zero for i = 0, ..., L - 1. The sinusoidal parameters (frequency, amplitude, and eventually phase) of each tonal component are estimated, the term y(i) is then calculated as the sum of predefined prototypes (spectra) of pure sinusoids of transforms in the DCT-IV domain (or another if another decomposition into sub-bands is used) according to the estimated sinusoidal parameters. Finally, an absolute value is applied to the terms y(i) to be returned to the domain of the amplitude spectrum in absolute values.

[0172] Outros métodos de determinação dos componentes tonais são possíveis, por exemplo seria também possível calcular um invólucro do sinal env(i) por interpolação por splines dos valores máximos locais (picos detectados) de βUHB1 (i+240)β, abaixar esse invólucro para um certo nível de dB para detectar os componentes tonais como os picos que ultrapassam esse invólucro e definir y(i) como[0172] Other methods of determining the tonal components are possible, for example it would also be possible to calculate an envelope of the env(i) signal by spline interpolation of the local maximum values (detected peaks) of βUHB1 (i+240)β, lowering this casing to a certain dB level to detect tonal components such as peaks that exceed this casing and define y(i) as

[0173] y(i) = max (βUHB1 (i+240)β - env(i),0)[0173] y(i) = max (βUHB1 (i+240)β - env(i),0)

[0174] Nessa variante o ambiente é obtido, portanto, pela equação:[0174] In this variant, the environment is therefore obtained by the equation:

[0175] lev(i) = β UHB1 (i + 240)β - y(i), i = 0,..., L- 1[0175] lev(i) = β UHB1 (i + 240)β - y(i), i = 0,..., L- 1

[0176] Em outras variantes da invenção, o valor absoluto dos valores espectrais será substituído por exemplo o quadrado dos valores espectrais, sem mudar o princípio da invenção; nesse caso uma raiz quadrada será necessária para voltar para o domínio do sinal, o que mais complexo para realizar.[0176] In other variants of the invention, the absolute value of the spectral values will be replaced, for example, the square of the spectral values, without changing the principle of the invention; in this case a square root will be needed to return to the signal domain, which is more complex to accomplish.

[0177] O módulo de combinação 513 efetua uma etapa de combinação por mixagem adaptativa do sinal ambiente e dos componentes tonais. Para isso, um fator rβ de controle do nível de ambiente e definido pela equação seguinte: [0177] The combination module 513 performs a combination step by adaptive mixing of the ambient signal and tonal components. For this, a factor rβ to control the level of environment is defined by the following equation:

[0178] sendo um fator em que um exemplo de cálculo é dado mais abaixo.[0178] being a factor in which an example calculation is given below.

[0179] Para obter o sinal estendido, se obtém primeiro o sinal combinado em valores absolutos para i = 0.L - 1: [0179] To obtain the extended signal, the combined signal in absolute values for i = 0.L - 1 is first obtained:

[0180] Ao qual se aplicam os sinais UHB1 (k):[0180] To which the UHB1 (k) signals apply:

[0181] y"(i) = sgn(UHB1 (i+240)).y’(i) 182] onde a função sgn (.) dá o sinal: [0181] y"(i) = sgn(UHB1 (i+240)).y'(i) 182] where the function sgn (.) gives the sign:

[0182] Por definição o fator rβ é >1. Os componentes tonais, detectados linha por linha pela condição y(i) > 0, são reduzidos pelo fator rü: o nível médio é ampliado pelo fator 1/rü.[0182] By definition, the rβ factor is >1. The tonal components, detected line by line by the condition y(i) > 0, are reduced by the factor rü: the average level is increased by the factor 1/rü.

[0183] No bloco 513 de mixagem adaptativa, um fator de controle do nível de energia é calculado em função da energia total do sinal de banda baixa decodificado (ou decodificado e estendido) e dos componentes tonais.[0183] In adaptive mixing block 513, an energy level control factor is calculated as a function of the total energy of the decoded (or decoded and extended) low-band signal and the tonal components.

[0184] Em uma modalidade de realização preferida da mixagem adaptativa, o ajustamento de energia é efetuado do modo seguinte: UHB2 (k) = fac.y" (k - 240), k = 240, ..., 319[0184] In a preferred embodiment of adaptive mixing, the energy adjustment is carried out as follows: UHB2 (k) = fac.y" (k - 240), k = 240, ..., 319

[0185] UHB2 (k) sendo o sinal combinado de extensão de banda.[0185] UHB2 (k) being the combined band extension signal.

[0186] O fator de ajustamento é definido pela equação seguinte: [0186] The adjustment factor is defined by the following equation:

[0187] Onde y permite evitar uma sobre- estimativa da energia. Em um exemplo de realização, é calculado β de modo a manter o mesmo nível de sinal ambiente em relação à energia dos componentes tonais nas bandas consecutivas do sinal. É calculada a energia dos componentes tonais em três bandas: 2000-4000 Hz, 4000-6000 Hz e 6000- 8000 Hz, com onde [0187] Where y allows avoiding an overestimation of the energy. In an example embodiment, β is calculated in order to maintain the same ambient signal level in relation to the energy of the tonal components in consecutive signal bands. The energy of the tonal components is calculated in three bands: 2000-4000 Hz, 4000-6000 Hz and 6000-8000 Hz, with where

[0188] E onde N (k1, k2) é o conjunto dos índices k para os quais o coeficiente de índice k é classificado como estando associado aos componentes tonais. Esse conjunto pode ser por exemplo, obtido detectando os picos locais em U‘(k) verificando |U‘(k)| >lev(k) onde lev(k) é calculado como o nível médio do espectro linha por linha.[0188] And where N (k1, k2) is the set of k indices for which the k index coefficient is classified as being associated with the tonal components. This set can be, for example, obtained by detecting the local peaks in U‘(k) by checking |U‘(k)| >lev(k) where lev(k) is calculated as the average level of the line-by-line spectrum.

[0189] Se pode notar que são possíveis outros métodos de cálculo da energia dos componentes tonais, por exemplo tomando o valor mediano do espectro na banda considerada.[0189] It can be noted that other methods of calculating the energy of the tonal components are possible, for example taking the median value of the spectrum in the band considered.

[0190] Se fixa β de tal modo que a razão entre a energia dos componentes tonais nas bandas 4-6 kHz e 6-8 kHz é a mesma entre as bandas 2-4 kHz e 4-6 kHz: Onde [0190] β is fixed in such a way that the ratio between the energy of the tonal components in the 4-6 kHz and 6-8 kHz bands is the same between the 2-4 kHz and 4-6 kHz bands: Where

[0191] - e max (.,.) é a função que dá o máximo dos dois argumentos.[0191] - and max (.,.) is the function that gives the maximum of the two arguments.

[0192] Em variantes da invenção, o cálculo de β poderá ser substituído por outros métodos. Por exemplo, em uma variante, se poderão extrair (calcular) diferentes parâmetros (ou «features» em inglês) caracterizando o sinal de banda baixa, onde um parâmetro «tilt» semelhante ao calculado no codec AMR-WB e se estimará o fator β em função de uma regressão linear a partir desses diferentes parâmetros limitando seu valor entre 0 e 1. A regressão linear poderá por exemplo ser estimada de modo supervisionado estimando o fator β dando a banda alta original em uma base de aprendizagem. Nota-se que o modo de cálculo β não limita a natureza da invenção.[0192] In variants of the invention, the calculation of β may be replaced by other methods. For example, in one variant, it will be possible to extract (calculate) different parameters (or «features» in English) characterizing the low band signal, where a «tilt» parameter similar to that calculated in the AMR-WB codec and the β factor will be estimated. as a function of a linear regression based on these different parameters limiting their value between 0 and 1. The linear regression can, for example, be estimated in a supervised way by estimating the factor β giving the original high bandwidth on a learning basis. It should be noted that the β calculation mode does not limit the nature of the invention.

[0193] Em seguida, o parâmetro β pode ser utilizado para calcular Yβ tendo em conta o fato de que um sinal com um sinal ambiente acrescentado em uma dada banda é percebido em geral como mais forte do que um sinal harmônico com a mesma energia na mesma banda. Define-se α como a quantidade de sinal ambiente adicionado ao sinal harmônico: [0193] Then, the parameter β can be used to calculate Yβ taking into account the fact that a signal with an added ambient signal in a given band is generally perceived as stronger than a harmonic signal with the same energy in the same band. α is defined as the amount of ambient signal added to the harmonic signal:

[0194] Poder-se-á calcular y como uma função decrescente de α, por exemplo, Y = b-a ^α; b= 1,1; a =1,2; e Yβ limitado de 0,3 a 1. Lá ainda outras definições de α e Yβ são possíveis no quadro da invenção.[0194] You can calculate y as a decreasing function of α, for example, Y = b-a ^α; b= 1.1; a =1.2; and Yβ limited from 0.3 to 1. Still other definitions of α and Yβ are possible within the scope of the invention.

[0195] Na saída do dispositivo de extensão de banda 500, o bloco 501, em uma modalidade de realização particular efetua de modo ótimo, uma operação dupla de aplicação de resposta na frequência de filtro passa banda e de filtragem de desacentuação ou (de ênfase) no domínio de frequência. Em uma variante da invenção, a filtragem de desacentuação poderá ser realizada no domínio temporal, depois do bloco 502 ou até antes do bloco 510; no entanto, nesse caso, a filtragem passa banda efetuada no bloco 501 pode deixar alguns componentes de baixa frequência com níveis muito fracos que se amplificam por desacentuação, o que pode modificar de modo ligeiramente perceptível a banda baixa decodificada. Por essa razão se prefere realizar aqui a desacentuação no domínio de frequência. Na modalidade de realização privilegiada, os coeficientes de índice k = 0, ...,199 são colocados a zero, assim a desacentuação está limitada aos coeficientes superiores.[0195] At the output of the band extension device 500, the block 501, in a particular embodiment, optimally performs a dual operation of applying bandpass filter frequency response and de-emphasis or (emphasis) filtering. ) in the frequency domain. In a variant of the invention, de-emphasis filtering may be performed in the temporal domain, after block 502 or even before block 510; however, in this case, the bandpass filtering carried out in block 501 may leave some low frequency components with very weak levels that are amplified by de-emphasis, which may slightly modify the decoded low band. For this reason, it is preferred to perform the de-emphasis here in the frequency domain. In the privileged implementation mode, the index coefficients k = 0, ...,199 are set to zero, so the de-emphasis is limited to the higher coefficients.

[0196] A excitação é desacentuada primeiro de acordo com a equação seguinte: [0196] The excitation is first de-escalated according to the following equation:

[0197] onde Gdeemph (k) é a resposta na frequência do filtro 1/(1-0,68z-1) em uma banda de frequência discreta restrita. Tendo em conta as frequências discretas (ímpares) da DCT-IV, se define aqui Gdeemph (k) como [0197] where Gdeemph (k) is the frequency response of the 1/(1-0.68z-1) filter in a restricted discrete frequency band. Taking into account the discrete (odd) frequencies of DCT-IV, Gdeemph (k) is defined here as

[0198] Se uma outra transformação como a DCT-IV é utilizada, a definição de θk poderá ser ajustada (por exemplo para frequências pares).[0198] If another transformation such as DCT-IV is used, the definition of θk may be adjusted (for example for even frequencies).

[0199] Se nota que a desacentuação é aplicada em duas fases para k = 200, ..., 255 correspondentes à banda de frequência 5000- 6400 kHz, onde a resposta 1/ (1 - 0,68z-1) é aplicada como a 12,8 kHz, e para k = 256, ., 319 correspondente à banda de frequência 6400- 8000 Hz, onde a resposta é estendida de 16 kHz aqui até a um valor constante na banda 6,4-8 kHz.[0199] Note that the deaccentuation is applied in two phases for k = 200, ..., 255 corresponding to the frequency band 5000- 6400 kHz, where the response 1/ (1 - 0.68z-1) is applied as at 12.8 kHz, and for k = 256, ., 319 corresponding to the frequency band 6400-8000 Hz, where the response is extended from 16 kHz here up to a constant value in the band 6.4-8 kHz.

[0200] Se pode notar que no codec AMR-WB a síntese HF não é desacentuada. Na modalidade de realização apresentada aqui, o sinal de alta frequência é em contrapartida desacentuado de modo a levá-lo para um domínio coerente com o sinal de baixa frequência (0-6,4 kHz) que sai do bloco 305 da figura 3. Isso é importante para a estimativa e para o ajustamento ulterior da energia da síntese HF.[0200] It can be noted that in the AMR-WB codec the HF synthesis is not de-emphasized. In the embodiment presented here, the high-frequency signal is instead de-emphasized in order to bring it into a domain coherent with the low-frequency signal (0-6.4 kHz) leaving block 305 of Figure 3. This is important for the estimation and subsequent adjustment of the HF synthesis energy.

[0201] Em uma variante da modalidade de realização, para reduzir a complexidade, se poderá fixar Gdeemph (k) para um valor constante independente de k, tomando por exemplo Gdeemph (k) = 0,6 o que corresponde aproximadamente ao valor médio de Gdeemph (k) para k = 200, ..., 319 nas condições da modalidade de realização descrita mais acima.[0201] In a variant of the embodiment, to reduce complexity, Gdeemph (k) can be fixed to a constant value independent of k, taking for example Gdeemph (k) = 0.6 which approximately corresponds to the average value of Gdeemph (k) for k = 200, ..., 319 under the conditions of the embodiment described above.

[0202] Em uma outra variante da modalidade de realização do decodificador, a desacentuação poderá ser realizada de modo equivalente no domínio temporal após DCT inversa.[0202] In another variant of the decoder embodiment, the de-emphasis may be performed in an equivalent way in the temporal domain after inverse DCT.

[0203] Além da desacentuação, é aplicada uma filtragem passa banda com duas partes separadas: uma passa alto fixa, outra passa baixo adaptativa (função do débito).[0203] In addition to de-emphasis, a band-pass filtering is applied with two separate parts: a fixed high-pass, another adaptive low-pass (throughput function).

[0204] Essa filtragem é efetuada no domínio de frequência.[0204] This filtering is carried out in the frequency domain.

[0205] Em uma modalidade de realização privilegiada, é calculada a resposta parcial de filtro passa banda no domínio de frequência como se segue: [0205] In a preferred embodiment, the partial bandpass filter response in the frequency domain is calculated as follows:

[0206] onde Nlp = 60 a 6,6 kbit/s, 40 a 8,85 kbit/s para débitos >8,85 bit/s[0206] where Nlp = 60 to 6.6 kbit/s, 40 to 8.85 kbit/s for speeds >8.85 bit/s

[0207] Em seguida é aplicado um filtro passa banda na forma: [0207] Then a band pass filter is applied in the form:

[0208] A definição de Ghp (k), k = 0, ..., 55 é dada, por exemplo, na tabela 1 mais abaixo: [0208] The definition of Ghp (k), k = 0, ..., 55 is given, for example, in table 1 below:

[0209] Nota-se que em variantes da invenção os valores Ghp (k) poderão ser modificados mantendo uma atenuação progressiva. Do mesmo modo a filtragem passa baixo com largura de banda variável, Glp (k), poderá ser ajustada com valores ou um suporte de frequência diferentes, sem mudar o princípio dessa etapa de filtragem.[0209] It should be noted that in variants of the invention the Ghp (k) values may be modified while maintaining a progressive attenuation. Likewise, low-pass filtering with variable bandwidth, Glp (k), can be adjusted with different values or frequency support, without changing the principle of this filtering step.

[0210] Nota-se também que a filtragem passa banda pode ser adaptada definindo uma única etapa de filtragem combinando as filtragens passa alto e passa baixo.[0210] It is also noted that band pass filtering can be adapted by defining a single filtering step combining high pass and low pass filtering.

[0211] Em uma outra modalidade de realização, a filtragem passa banda poderá ser realizada de modo equivalente no domínio temporal (como no bloco 112 da figura 1) com diferentes coeficientes de filtro de acordo com o débito, depois de uma etapa de DCT inversa. No entanto, nota- se que é vantajoso realizar essa etapa diretamente no domínio de frequência porque a filtragem é efetuada no domínio da excitação LPC e, portanto, os problemas de convolução circular e de efeitos de borda são muito limitados nessa área.[0211] In another embodiment, bandpass filtering may be performed equivalently in the temporal domain (as in block 112 of Figure 1) with different filter coefficients according to the throughput, after an inverse DCT step . However, it is noted that it is advantageous to perform this step directly in the frequency domain because the filtering is carried out in the LPC excitation domain and, therefore, the problems of circular convolution and edge effects are very limited in this area.

[0212] O bloco 502 de transformada inversa efetua uma DCT inversa em 320 amostras para encontrar o sinal de alta frequência amostrada a 16 kHz. Sua implementação é idêntica ao bloco 510, porque a DCT-IV é ortonormal, mas o comprimento da transformada é de 320 em vez de 256, e se obtém: [0212] Inverse transform block 502 performs an inverse DCT on 320 samples to find the high frequency signal sampled at 16 kHz. Its implementation is identical to block 510, because DCT-IV is orthonormal, but the transform length is 320 instead of 256, and we obtain:

[0213] onde N16k = 320 e k = 0, ..., 319.[0213] where N16k = 320 and k = 0, ..., 319.

[0214] No caso em que o bloco 510 não é uma DCT, mas uma outra transformação ou decomposição em sub-bandas, o bloco 502 realiza a síntese correspondente à análise feita no bloco 510.[0214] In the case where block 510 is not a DCT, but another transformation or decomposition into sub-bands, block 502 performs the synthesis corresponding to the analysis carried out in block 510.

[0215] O sinal amostrado a 16 kHz é em seguida de modo opcional colocado em escala por ganhos definidos por sub-quadro de 80 amostras (bloco 504).[0215] The signal sampled at 16 kHz is then optionally scaled by gains defined by subframe of 80 samples (block 504).

[0216] Em uma modalidade de realização privilegiada, é calculado primeiro (bloco 503) um ganho gHB1 (m) por sub-quadro por razões de energia dos sub-quadros tal como em cada sub-quadro de índice m = 0, 1, 2 ou 3 do quadro corrente: Onde [0216] In a preferred embodiment, a gain gHB1 (m) per subframe is first calculated (block 503) by energy ratios of the subframes such as in each subframe of index m = 0, 1, 2 or 3 of the current table: Where

[0217] com ε = 0,01. Se pode escrever o ganho por sub-quadro gHB1 (m) na forma: [0217] with ε = 0.01. The gain per sub-frame gHB1 (m) can be written in the form:

[0218] O que mostra que se garante no sinal uHB a mesma razão entre energia por subquadro e energia por quadro como no sinal u (n).[0218] This shows that the same ratio between energy per subframe and energy per frame is guaranteed in the uHB signal as in the u (n) signal.

[0219] O bloco 504 efetua a colocação em escala do sinal combinado (compreendida na etapa E404a da figura 4) de acordo com a equação seguinte: uHB ‘(n) = gHB1 (m)uHB (n), n = 80m, ..., 89(m + 1) - 1[0219] Block 504 scales the combined signal (understood in step E404a of figure 4) according to the following equation: uHB '(n) = gHB1 (m) uHB (n), n = 80m, . .., 89(m + 1) - 1

[0220] Nota-se que a realização do bloco 503 difere da do bloco 101 da figura 1, porque a energia ao nível do quadro corrente é tida em conta além daquela da subtração. Isso permite ter a razão da energia de cada subquadro em relação à energia do quadro. Se comparam, portanto, razões de energia (ou energias relativas) em vez das energias absolutas entre banda baixa e banda alta.[0220] It is noted that the realization of block 503 differs from that of block 101 of figure 1, because the energy at the level of the current frame is taken into account in addition to that of subtraction. This allows us to have the ratio of the energy of each subframe in relation to the energy of the frame. Therefore, energy ratios (or relative energies) are compared instead of absolute energies between low band and high band.

[0221] Assim, essa etapa de colocação em escala permite manter na banda alta a razão de energia entre o subquadro e o quadro do mesmo modo que na banda baixa.[0221] Thus, this scaling step allows maintaining the energy ratio between the subframe and the frame in the high band in the same way as in the low band.

[0222] De modo opcional, o bloco 506 efetua em seguida a colocação em escala do sinal (compreendida na etapa E404a da figura 4) de acordo com a equação seguinte: UHB "(n) = gHB2 (m) uHB ‘(n), n = 80m,..., 80(m+1) - 1 onde o ganho gHB2 (m) é obtido a partir do bloco 505 executando os blocos 103, 104 e 105 do codec AMR-WB (a entrada do bloco 103 sendo a excitação decodificada em banda baixa, u (n)). Os blocos 505 e 506 são úteis para ajustar o nível do filtro de síntese LPC (bloco 507), aqui em função do tilt do sinal. Outros métodos de cálculo do ganho gHB2 (m) são possíveis sem mudar a natureza da invenção.[0222] Optionally, block 506 then scales the signal (understood in step E404a of figure 4) according to the following equation: UHB "(n) = gHB2 (m) uHB '(n) , n = 80m,..., 80(m+1) - 1 where the gain gHB2 (m) is obtained from block 505 executing blocks 103, 104 and 105 of the AMR-WB codec (the input of block 103 the excitation being decoded in low band, u (n)). Blocks 505 and 506 are useful for adjusting the level of the LPC synthesis filter (block 507), here as a function of the signal tilt. Other methods for calculating the gHB2 gain (m) are possible without changing the nature of the invention.

[0223] Finalmente, o sinal uHB ‘(n) ou uHB "(n), é filtrado pelo módulo de filtragem 507 que pode ser realizado aqui tomando como função de transferência 1/ Â(z)/ y, ou y = 0,9 a 6,6 kbit/s e y = 0,6 para outros débitos, o que limita a ordem do filtro para a ordem 16.[0223] Finally, the signal uHB '(n) or uHB "(n), is filtered by the filtering module 507 which can be performed here taking as transfer function 1/ Â(z)/ y, or y = 0, 9 to 6.6 kbit/s and y = 0.6 for other speeds, which limits the filter order to order 16.

[0224] Em uma variante, essa filtragem poderá ser realizada do mesmo modo que a descrita para o bloco 111 da figura 1 do decodificador AMR-WB, no entanto a ordem do filtro passa para 20 no débito de 6,6, o que não muda de modo significativo a qualidade do sinal sintetizado. Em uma outra variante, se poderá efetuar a filtragem de síntese LPC no domínio de frequência, após ter calculado a resposta na frequência do filtro implementado no bloco 507.[0224] In a variant, this filtering may be carried out in the same way as described for block 111 of Figure 1 of the AMR-WB decoder, however the filter order changes to 20 at a rate of 6.6, which does not significantly changes the quality of the synthesized signal. In another variant, LPC synthesis filtering can be carried out in the frequency domain, after calculating the frequency response of the filter implemented in block 507.

[0225] Em variantes de realização da invenção, a codificação da banda baixa (0-6,4 Khz) poderá ser substituída por um codificador CELP além do utilizado em AMR-WB, como por exemplo o codificador CELP em G.718 a 8 kbit/s. Sem perda de generalidade de outros codificadores de banda larga ou funcionando com frequências superiores a 16 kHz, onde a codificação da banda baixa funciona a uma frequência interna de 12,8 kHz poderiam ser utilizadas. Por outro lado, a invenção pode ser adaptada de modo evidente a outras frequências de amostragem de 12,8 kHz, quando um codificador de baixas frequências fun- ciona com uma frequência de amostragem inferior à do sinal original ou reconstruído. Quando a decodificação de banda baixa não utiliza predição linear, não se dispõe de um sinal de excitação para estender, nesse caso se poderá realizar uma análise LPC do sinal reconstruído no quadro corrente e se vai calcular uma excitação LPC de modo a poder aplicar a invenção.[0225] In embodiments of the invention, the low band coding (0-6.4 Khz) may be replaced by a CELP encoder in addition to that used in AMR-WB, such as the CELP encoder in G.718 to 8 kbit/s. Without loss of generality, other wideband encoders or those operating at frequencies higher than 16 kHz, where low band coding operates at an internal frequency of 12.8 kHz could be used. On the other hand, the invention can obviously be adapted to sampling frequencies other than 12.8 kHz, when a low frequency encoder operates with a sampling frequency lower than that of the original or reconstructed signal. When low-band decoding does not use linear prediction, there is no excitation signal to extend, in which case an LPC analysis of the reconstructed signal in the current frame will be carried out and an LPC excitation will be calculated in order to apply the invention .

[0226] Finalmente, em uma outra variante da invenção, a excitação ou o sinal de banda baixa (u(n)) é reamostrado, por exemplo por interpolação linear ou "spline" cúbico, de 12,8 a 16 kHz antes da transformação (por exemplo DCT-IV) de comprimento 320. Essa variante tem o defeito de ser mais complexa, porque a transformada (DCT-IV) da excitação ou do sinal é então calculada em um comprimento maior e a reamostragem não é efetuada no domínio da transformada.[0226] Finally, in another variant of the invention, the excitation or low band signal (u(n)) is resampled, for example by linear interpolation or cubic spline, from 12.8 to 16 kHz before transformation (e.g. DCT-IV) of length 320. This variant has the drawback of being more complex, because the transform (DCT-IV) of the excitation or signal is then calculated at a longer length and the resampling is not carried out in the domain of transformed.

[0227] Para além disso, em variantes da invenção, todos os cálculos necessários para a estimativa dos ganhos (GHBN, gHB1 (m), gHB2 (m), gHBN, etc) poderão ser efetuados em um domínio logarítmico.[0227] Furthermore, in variants of the invention, all calculations necessary to estimate gains (GHBN, gHB1 (m), gHB2 (m), gHBN, etc.) may be carried out in a logarithmic domain.

[0228] A figura 6 representa um exemplo de realização material de um dispositivo de extensão de banda 600 de acordo com a invenção. Esse pode fazer parte integrante de um decodificador de sinal de audiofrequência ou de um equipamento recebendo sinais de audiofrequências decodificados ou não.[0228] Figure 6 represents an example of a material embodiment of a band extension device 600 according to the invention. This may be an integral part of an audio frequency signal decoder or equipment receiving decoded or undecoded audio frequency signals.

[0229] Esse tipo de dispositivo compreende um processador PROC cooperando com um bloco de memória BM compreendendo uma memória de armazenagem e/ou de trabalho MEM.[0229] This type of device comprises a PROC processor cooperating with a BM memory block comprising a MEM storage and/or working memory.

[0230] Um tal dispositivo compreende um módulo de entrada E apto para receber um sinal áudio decodificado ou extraído em uma primeira banda de frequência chamada banda baixa reconduzida no domínio de frequência (U (k)). Compreende um módulo de saída S apto para transmitir o sinal de extensão em uma segunda banda de frequência (UHB2 (k)) por exemplo, a um módulo de filtragem 501 da figura 5.[0230] Such a device comprises an input module E capable of receiving a decoded or extracted audio signal in a first frequency band called low band re-conducted in the frequency domain (U (k)). It comprises an output module S capable of transmitting the extension signal in a second frequency band (UHB2 (k)), for example, to a filtering module 501 of figure 5.

[0231] O bloco de memória pode vantajosamente compreender um programa informático incluindo instruções de código para a implementação das etapas do processo de extensão de banda no sentido da invenção, quando essas instruções são executadas pelo processador PROC, e nomeadamente as etapas de extração (E402) de componentes tonais e de um sinal ambiente a partir de um sinal proveniente do sinal de banda baixa decodificado (U (k)), de combinação (E403) dos componentes tonais (y(k)) e do sinal ambiente (UHBA (k)) por mixagem adaptativa utilizando fatores de controle de nível de energia para obter um sinal áudio, chamado sinal combinado (UHB2 (k)), de extensão (E401a) em pelo menos uma segunda banda de frequência superior à primeira banda de frequência do sinal decodificado de banda baixa antes da etapa de extração ou do sinal combinado depois da etapa de combinação.[0231] The memory block may advantageously comprise a computer program including code instructions for implementing the steps of the bandwidth extension process in the sense of the invention, when these instructions are executed by the PROC processor, and in particular the extraction steps (E402 ) of tonal components and an ambient signal from a signal originating from the decoded low-band signal (U (k)), combination (E403) of the tonal components (y(k)) and the ambient signal (UHBA (k )) by adaptive mixing using power level control factors to obtain an audio signal, called a combined signal (UHB2 (k)), of extension (E401a) in at least a second frequency band higher than the first frequency band of the signal low-band decoded before the extraction step or the combined signal after the combining step.

[0232] Tipicamente, a descrição da figura 4 retoma as etapas de um algoritmo de um tal programa informático. O programa informático pode também ser armazenado em um suporte de memória legível por um leitor do dispositivo ou carregável no espaço de memória desse.[0232] Typically, the description of figure 4 resumes the steps of an algorithm of such a computer program. The computer program may also be stored on a memory medium readable by a device reader or loadable into the device's memory space.

[0233] A memória MEM registra de modo geral, todos os dados necessários para a implementação do processo.[0233] The MEM memory generally records all the data necessary to implement the process.

[0234] Em uma modalidade possível de realização, o dispositivo assim descrito pode também compreender as funções de decodificação de banda baixa e outras funções de processamento descritas, por exemplo, na figura 5 e 3 além das funções de extensão de banda de acordo com a invenção.[0234] In a possible embodiment, the device thus described may also comprise the low-band decoding functions and other processing functions described, for example, in Figures 5 and 3 in addition to the bandwidth extension functions in accordance with the invention.

Claims (15)

1. MÉTODO, caracterizado por compreender: obter um sinal de faixa baixa, em que o sinal de faixa baixa é decodificado em uma primeira faixa de frequência de modo a produzir um sinal de faixa baixa decodificado, estender (E401a) o sinal de faixa baixa decodificado em pelo menos uma segunda faixa de frequência, em que a pelo menos uma segunda faixa de frequência é superior à primeira faixa de frequência, em que estender o sinal de faixa baixa decodificado forma um sinal de faixa baixa decodificado estendido em frequência; extrair (E402) componentes tonais dominantes e um sinal ambiente proveniente do sinal de faixa baixa decodificado estendido em frequência; combinar (E403) os componentes tonais dominantes e o sinal ambiente mediante a mixagem adaptativa que usa fatores de controle de nível de energia para obter um sinal de áudio combinado; sendo que os fatores de controle de nível de energia compreendem um fator que controla o ambiente (r) e um fator de ajustamento, em que o fator que controla o ambiente (r) controla o ambiente, em que o fator de ajustamento é baseado na energia total do sinal de faixa baixa decodificado estendido em frequência e dos componentes tonais dominantes, em que o fator que controla o ambiente (r) é definido por: onde enertonal é a energia dos componentes tonais dominantes, em que enerHB é a energia total do sinal de faixa baixa decodificado estendido em frequência, em que β é um fator multiplicativo.1. METHOD, characterized by comprising: obtaining a low band signal, wherein the low band signal is decoded in a first frequency band so as to produce a decoded low band signal, extending (E401a) the low band signal decoded in at least a second frequency band, wherein the at least one second frequency band is higher than the first frequency band, wherein extending the decoded low band signal forms a frequency extended decoded low band signal; extracting (E402) dominant tonal components and an ambient signal from the frequency-extended decoded low-band signal; combining (E403) the dominant tonal components and the ambient signal through adaptive mixing that uses power level control factors to obtain a combined audio signal; wherein the energy level control factors comprise a factor that controls the environment (r) and an adjustment factor, wherein the factor that controls the environment (r) controls the environment, wherein the adjustment factor is based on total energy of the frequency-extended decoded low-band signal and the dominant tonal components, where the ambiance-controlling factor (r) is defined by: where enertonal is the energy of the dominant tonal components, where enerHB is the total energy of the frequency-extended decoded low-band signal, where β is a multiplicative factor. 2. MÉTODO, de acordo com a reivindicação 1, caracterizado pela etapa de combinação compreender a obtenção do sinal combinado com base nos valores absolutos dos componentes tonais dominantes.2. METHOD, according to claim 1, characterized in that the combination step comprises obtaining the combined signal based on the absolute values of the dominant tonal components. 3. MÉTODO, de acordo com a reivindicação 2, caracterizado pela combinação compreender um ajuste de energia do sinal combinado com base no fator de ajustamento.3. METHOD according to claim 2, characterized in that the combination comprises an energy adjustment of the combined signal based on the adjustment factor. 4. MÉTODO, de acordo com a reivindicação 3, caracterizado pelo fator de ajustamento ser calculado como: onde y’’(i) corresponde ao sinal y’(i) ao qual são aplicados os sinais do sinal de faixa baixa decodificado estendido em frequência, em que y’(i) é o sinal combinado, em que Y é um fator multiplicativo.4. METHOD, according to claim 3, characterized in that the adjustment factor is calculated as: where y''(i) corresponds to the signal y'(i) to which the frequency-extended decoded low-band signal signals are applied, where y'(i) is the combined signal, where Y is a multiplicative factor . 5. MÉTODO, de acordo com a reivindicação 4, caracterizado por y ser selecionado para evitar uma superestimação da energia do sinal combinado.5. METHOD, according to claim 4, characterized in that y is selected to avoid an overestimation of the energy of the combined signal. 6. MÉTODO, de acordo com a reivindicação 2, caracterizado pelos componentes tonais dominantes serem reduzidos pelo fator que controla o ambiente r, em que o sinal ambiente é amplificado por 1/r.6. METHOD, according to claim 2, characterized in that the dominant tonal components are reduced by the factor that controls the environment r, in which the ambient signal is amplified by 1/r. 7. MÉTODO, de acordo com a reivindicação 6, caracterizado pela combinação compreender um ajuste de energia do sinal combinado com base no fator de ajustamento.7. METHOD according to claim 6, characterized in that the combination comprises an energy adjustment of the combined signal based on the adjustment factor. 8. MÉTODO, de acordo com a reivindicação 7, caracterizado pelo fator de ajustamento ser calculado como: onde y’’(i) corresponde ao sinal y’(i) ao qual são aplicados os sinais do sinal de faixa baixa decodificado estendido em frequência, em que y’(i) é o sinal combinado, em que Y é um fator multiplicativo.8. METHOD, according to claim 7, characterized in that the adjustment factor is calculated as: where y''(i) corresponds to the signal y'(i) to which the frequency-extended decoded low-band signal signals are applied, where y'(i) is the combined signal, where Y is a multiplicative factor . 9. MÉTODO, de acordo com a reivindicação 8, caracterizado por y ser selecionado para evitar uma superestimação da energia do sinal combinado.9. METHOD, according to claim 8, characterized in that y is selected to avoid an overestimation of the energy of the combined signal. 10. MÉTODO, de acordo com a reivindicação 6, caracterizado pela obtenção do sinal combinado em valores absolutos ser executada mediante o cálculo de: onde y(i) é o sinal residual que define os componentes tonais dominantes, e lev(i) é o nível médio do espectro.10. METHOD, according to claim 6, characterized in that obtaining the combined signal in absolute values is carried out by calculating: where y(i) is the residual signal that defines the dominant tonal components, and lev(i) is the average level of the spectrum. 11. MÉTODO, de acordo com a reivindicação 10, caracterizado pela combinação compreender um ajuste de energia do sinal combinado com base no fator de ajustamento.11. METHOD, according to claim 10, characterized in that the combination comprises an energy adjustment of the combined signal based on the adjustment factor. 12. MÉTODO, de acordo com a reivindicação 11, caracterizado pelo fator de controle do nível de energia ser calculado como: onde y’’(i) corresponde ao sinal y’(i) ao qual são aplicados os sinais do sinal de faixa baixa decodificado estendido em frequência, em que y’(i) é o sinal combinado, em que Y é um fator multiplicativo.12. METHOD, according to claim 11, characterized in that the energy level control factor is calculated as: where y''(i) corresponds to the signal y'(i) to which the frequency-extended decoded low-band signal signals are applied, where y'(i) is the combined signal, where Y is a multiplicative factor . 13. MÉTODO, de acordo com a reivindicação 12, caracterizado por y ser selecionado para evitar uma superestimação da energia do sinal combinado.13. METHOD, according to claim 12, characterized in that y is selected to avoid an overestimation of the energy of the combined signal. 14. MÉTODO, de acordo com a reivindicação 10, caracterizado pelo fator de controle do nível de energia ser calculado como: onde y’’(i) corresponde ao sinal y’(i) ao qual são aplicados os sinais do sinal de faixa baixa decodificado estendido em frequência, em que y’(i) é o sinal combinado, em que Y é um fator multiplicativo.14. METHOD, according to claim 10, characterized in that the energy level control factor is calculated as: where y''(i) corresponds to the signal y'(i) to which the frequency-extended decoded low-band signal signals are applied, where y'(i) is the combined signal, where Y is a multiplicative factor . 15. MÉTODO, de acordo com a reivindicação caracterizado por y ser selecionado para evitar superestimação da energia do sinal combinado.15. METHOD, according to claim characterized in that y is selected to avoid overestimation of the energy of the combined signal.
BR122017028149-6A 2014-02-07 2015-02-04 METHOD FOR EXTENDING A FREQUENCY RANGE IN AN AUDIO SIGNAL DECODER BR122017028149B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1450969 2014-02-07

Publications (1)

Publication Number Publication Date
BR122017028149B1 true BR122017028149B1 (en) 2023-08-15

Family

ID=

Similar Documents

Publication Publication Date Title
JP6515158B2 (en) Method and apparatus for determining optimized scale factor for frequency band extension in speech frequency signal decoder
US11325407B2 (en) Frequency band extension in an audio signal decoder
JP2016528539A5 (en)
BR122017028149B1 (en) METHOD FOR EXTENDING A FREQUENCY RANGE IN AN AUDIO SIGNAL DECODER
BR122017028041B1 (en) METHOD AND DEVICE FOR EXTENDING A FREQUENCY RANGE IN AN AUDIO SIGNAL DECODER