EP2277172A1 - Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique - Google Patents

Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique

Info

Publication number
EP2277172A1
EP2277172A1 EP09730641A EP09730641A EP2277172A1 EP 2277172 A1 EP2277172 A1 EP 2277172A1 EP 09730641 A EP09730641 A EP 09730641A EP 09730641 A EP09730641 A EP 09730641A EP 2277172 A1 EP2277172 A1 EP 2277172A1
Authority
EP
European Patent Office
Prior art keywords
frame
signal
samples
erased
missing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP09730641A
Other languages
German (de)
English (en)
Other versions
EP2277172B1 (fr
Inventor
David Virette
Pierrick Philippe
Balazs Kovesi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP2277172A1 publication Critical patent/EP2277172A1/fr
Application granted granted Critical
Publication of EP2277172B1 publication Critical patent/EP2277172B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Definitions

  • the present invention relates to the processing of digital signals in the telecommunications field. These signals may be, for example, speech and music signals.
  • the present invention intervenes in a coding / decoding system adapted for the transmission / reception of such signals. More particularly, the present invention relates to a reception processing for improving the quality of the decoded signals in the presence of data block losses.
  • CELP coding for "Code Excited Linear Prediction"
  • the current frame to be decoded is then declared erased ("bad frame" in English). These procedures make it possible to extrapolate to the decoder the samples of the missing signal from the signals and data from the previous frames.
  • Such techniques have been implemented mainly in the case of parametric and predictive coders (techniques for recovery / concealment of erased frames). They make it possible to strongly limit the subjective degradation of the signal perceived at the decoder in the presence of erased frames. These algorithms rely on the technique used for the encoder and decoder, and are in fact an extension of the decoder.
  • the purpose of the hiding devices of erased frames is to extrapolate the parameters of the erased frame from the last (or more) previous frames considered valid.
  • Some parameters manipulated or coded by predictive coders have a strong inter-frame correlation (in the case of Linear Predictive Coding (LPC) parameters which represent the spectral envelope, and LTP parameters (for Long Term Prediction). English) long-term prediction that represents the periodicity of the signal (for voiced sounds, for example) . This correlation makes it much more advantageous to reuse the parameters of the last valid frame to synthesize the erased frame than use erroneous or random parameters.
  • LPC Linear Predictive Cod
  • an excitation signal can be randomly generated (by drawing a codeword of the past excitation, by a slight damping of the gain of the past excitation, by random selection in the past excitement, or still using transmitted codes that may be totally wrong).
  • FIG. 1a illustrates the hierarchical coding of CELP frames CO to C5 and the transforms M1 to M5 applied to these frames.
  • the decoder in the presence of errors on the bitstream, the decoder operates as follows.
  • FEC frame Erasure Concealment
  • a valid frame includes information on the previous frame to improve the concealment of erased frames and resynchronization between erased frames and valid frames.
  • the decoder receives in the bit stream of the frame 5 information on the nature of the previous frame (for example classification indication, information on the spectral envelope).
  • Classification information means information on voicing, non-voicing, the presence of attacks, etc.
  • the decoder synthesizes the previous erroneous frame (frame 4) by using a technique for concealing erased frames that benefits from the information received with the frame 5, before synthesizing the CELP signal C5.
  • this transition step can be provided by a linear prediction synthesis filtering step using to generate the second set of missing samples the transition point filter memories stored in the first step of concealment.
  • the memories of the synthesis filter at the transition point are stored in the first concealment step.
  • the excitation is determined according to the information received. The synthesis is performed from the transition point using on the one hand the excitation obtained, on the other hand the memories of the stored synthesis filter.
  • the first set of samples is all the missing samples of the erased frame and the second set of samples is a part of the missing samples of the erased frame.
  • the information present in a valid frame is for example information on the classification of the signal and / or on the spectral envelope of the signal.
  • the signal classification information makes it possible, for example, for the step of concealing the second set of missing samples to adapt respective gains of a harmonic part of the excitation signal and of a random part of the excitation signal. for the signal corresponding to the erased frame.
  • a step of preparing the step of concealing the second set of missing samples is implemented in the first time interval.
  • the step of preparing the step of concealing the second set of missing samples is performed in a time interval different from that corresponding to the decoding of the valid frame. This therefore makes it possible to distribute the calculation load of the concealment step of the second set of samples and thus to reduce the peak of complexity in the time interval corresponding to the reception of the first valid frame. As shown above, it is indeed in this time interval corresponding to the valid frame that is the peak complexity or worse case of complexity of the decoding.
  • the distribution of the complexity thus carried out makes it possible to review downward the sizing of the processor of a transmission error concealment device which is dimensioned according to the worst case of complexity.
  • the preparation step comprises a step of generating a harmonic portion of the excitation signal and a step of generating a random portion of the excitation signal for the signal corresponding to the erased frame.
  • the present invention also relates to a transmission error concealment device in a digital signal divided into a plurality of successive frames associated with different time intervals in which, on reception, the signal may comprise erased frames and frames. valid, valid frames with information (inf.) relating to the loss of frame concealment.
  • the device is such that it intervenes during a hierarchical decoding using a core decoding and a transform decoding using low delay windows introducing a time delay less than one frame with respect to the decoding heart, and that it comprises: a concealment module able to generate, in a first time interval, a first set of missing samples for at least the last frame erased before a valid frame and able to generate, in a second time slot, a second set of missing samples for the erased frame taking into account information of said valid frame, and a transition module able to make a transition between the first set of missing samples and the second set of missing samples to obtain at least part of the missing frame.
  • This device implements the steps of the concealment method as described above.
  • the invention also relates to a digital signal decoder comprising a transmission error concealment device according to the invention.
  • the invention relates to a computer program intended to be stored in a memory of a transmission error concealment device.
  • This computer program is such that it includes code instructions for implementing the steps of the error concealment method according to the invention, when executed by a processor of said transmission error concealment device.
  • It relates to a storage medium, readable by a computer or by a processor, integrated or not into the device, storing a computer program as described above.
  • FIG. 2 illustrates the concealment method according to the invention in a first embodiment
  • FIG. 3 illustrates the concealment method according to the invention in a second embodiment
  • FIGS. 4a and 4b illustrate the synchronization of the reconstruction using the concealment method according to the invention
  • FIG. 5 illustrates an exemplary hierarchical coder that can be used in the context of the invention
  • FIG. 6 illustrates a hierarchical decoder according to the invention
  • - Figure 7 illustrates a concealment device according to the invention.
  • the transmission error concealment method according to a first embodiment of the invention is now described.
  • the frame N received at the decoder is erased.
  • a valid N-I frame received at the decoder is processed by a demultiplexing module DEMUX, normally decoded at 21 by a DE-NO decoding module.
  • the decoded signal is then stored in a memory buffer MEM during a step 22. At least part of this memorized decoded signal is sent to the sound card 30 at the output of the decoder of the frame NI, the decoded signal remaining in the memory buffer is retained to be sent to the sound card after decoding the next frame.
  • this extrapolated signal memorized, together with the decoded signal of the NI frame remaining stored, is sent to the sound card 30 at the output of the decoder of the frame N.
  • the extrapolated signal remaining in the buffer memory is retained to be sent to the sound card after decoding the next frame.
  • a step of concealing a second set of missing samples for the erased N frame is performed at 25 by the DE-MISS error concealment module. This step uses information present in the valid frame N + 1 that is obtained during a step
  • the information present in a valid frame includes information on the previous frame of the bit stream. These include signal classification information (voiced, unvoiced, transient signal) or information on the spectral envelope of the signal.
  • harmonic excitation is meant the excitation calculated from the pitch value (number of samples in a period corresponding to the inverse of the fundamental frequency) of the signal of the preceding frame, the harmonic part of the excitation signal. is thus obtained by copying the excitation passed to the moments corresponding to the delay of the pitch.
  • random excitation is meant the excitation signal obtained from a random signal generator or by random draw of a code word of the past excitation or in a dictionary.
  • a larger gain is calculated for the harmonic part of the excitation and in the case where the classification of the signal indicates an unvoiced frame, a larger gain is calculated for the random part of the excitation.
  • the part of the harmonic excitation is completely erroneous. In this case, several frames may be necessary before the decoder regains normal excitation and therefore an acceptable quality. Thus, a new artificial version of the harmonic excitation can be used to allow the decoder to find normal operation more quickly.
  • the information on the spectral envelope can be a stability information of the LPC linear prediction filter.
  • this information indicates that the filter is stable between the previous frame and the current (valid) frame
  • the step of concealing a second set of missing samples uses the linear prediction filter of the valid frame. Otherwise, the filter from the past is used.
  • a transition step 29 by a TRANS transition module is performed.
  • This module takes into account the first set of samples generated at step 23 not yet played on the sound card and the second set of samples generated in step 25 to obtain a smooth transition between the first set and the second set.
  • this transition step is a step of crossfading or addition-overlap which consists in gradually decreasing the weight of the extrapolated signal in the first set and gradually increasing the weight of the signal extrapolated in the second set to get the missing samples from the erased frame.
  • this fade-in step corresponds to the multiplication of all the samples of the extrapolated signal stored at the frame N with a weighting function decreasing progressively from 1 to 0, and the addition of this weighted signal with the samples of the signal extrapolated to the N + 1 frame multiplied with the complementary weighting function of the weighting function of the memorized signal.
  • complementary weighting function is meant the function obtained by subtracting one by the preceding weighting function.
  • this fade-in step is performed on only a part (at least one sample) of the stored signal.
  • this transition step is provided by the linear prediction synthesis filtering.
  • the memories of the synthesis filter at the transition point are stored in the first concealment step.
  • the excitation is determined according to the information received.
  • the synthesis is performed from the transition point using on the one hand the excitation obtained, on the other hand the memories of the stored synthesis filter.
  • the valid frame is therefore demultiplexed at 26, decoded normally at 27 and the decoded signal is stored at 28 in the memory buffer MEM.
  • the signal from the transition module TRANS is sent together with the decoded signal of the N + 1 frame to the sound card 30 at the output of the decoder of the N + 1 frame.
  • the signal received by the sound card 30 is intended to be restored by speaker type reproduction means 31.
  • the first set of samples and the second set of samples are the set of samples of the missing frame.
  • a signal corresponding to the erased frame is generated, the crossfade is then performed on the part of the two signals corresponding to the second half of the erased frame (one half-frame) to obtain the samples of the frame missing.
  • the concealment step in the time interval corresponding to the erased frame, the concealment step generates all the samples of the missing frame (these samples will be necessary if the next frame is also erased), while in the time interval corresponding to the decoding of the valid frame, the concealment step generates only a second portion of the samples, for example, the second half of the samples of the missing frame.
  • the overlap addition step is performed to ensure a transition on this second half of the samples of the missing frame.
  • the number of samples generated for the missing frame in the time interval corresponding to the valid frame is smaller than in the case of the first embodiment described above.
  • the decoding complexity in this time interval is therefore reduced.
  • FIG. 3 a second embodiment of the method according to the invention is illustrated in the case where the frame N received at the decoder is erased.
  • a preparation step E1 referenced 32 is performed.
  • This preparation step is for example a step of obtaining the harmonic part of the excitation using the value of the LTP delay of the previous frame, and of obtaining the random part of the excitation in a CELP decoding structure.
  • This preparation step uses parameters of the previous frame stored in memory MEM. It is not useful for this step to use the classification information or the spectral envelope information of the erased frame.
  • the concealment step 23 of the first set of samples as described with reference to FIG. 2 is also performed.
  • the extrapolated signal derived therefrom is stored at 24 in the memory MEM. At least a part of this extrapolated signal memorized, together with the decoded signal remaining stored in the frame NI, is sent to the sound card 30 at the output of the decoder of the frame N.
  • the extrapolated signal remaining in The buffer is kept for sending to the sound card after decoding the next frame.
  • the step E2 referenced 33 of concealment including the extrapolation of the second set of missing samples corresponding to the erased N frame, is performed in the time interval corresponding to the N + 1 frame received at the decoder.
  • This step comprises taking into account the information contained in the valid frame N + 1 and which concern the frame N.
  • the concealment step corresponds to the calculation of the gains associated with the two parts of the excitation, and possibly to the correction of the phase of the harmonic excitation. Based on the classification information received in the first valid frame, the respective gains of the two portions of the excitation are matched. Thus, for example based on the classification information of the last valid frame received before the erased frames and the classification information received, the concealment step adapts the choice of the excitations and the associated gains to best represent the class of the frame. In this, the quality of the signal generated during the concealment step is improved by benefiting from the information received.
  • step E2 favors the harmonic excitation obtained at the preparation step E1 rather than the random excitation and vice versa for a signal frame unvoiced.
  • step E2 will generate missing samples according to the precise classification of the transient (voiced to unvoiced or voiceless to voiced).
  • a step 29 addition-overlap or cross-fade as described with reference to Figure 2 is then performed between the first set of samples generated in step 23 and the second set of samples generated in step 33 .
  • N + 1 is processed by the DEMUX demultiplexing module, is decoded at 27 and stored at 28 as previously described with reference to FIG. extrapolated obtained by the cross-fading step 29 and the decoded signal of the N + 1 frame are jointly sent to the sound card 30 at the output of the decoder of the N + 1 frame.
  • FIGS. 4a and 4b illustrate the implementation of this method and the synchronization between the CELP type decoding and the transform decoding which uses low delay windows represented here in the form of windows as described in the patent application FR 0760258.
  • FIG. 4a illustrates the hierarchical coding of CELP frames CO to C5 and the low-delay transforms M1 to M5 applied to these frames.
  • the output frame 4 of the decoder is constructed using a portion of extrapolated samples for C3 (FEC-C3) and a portion of the first set of extrapolated samples for C4 (FEC 1 -C4).
  • a step of concealing a second set of samples for the frame C4 is performed. This step uses the information on the C4 frame that is present in the valid frame C5. This second set of samples is reference FEC2-C4. A transition step between the first set of samples FEC1-C4 and the second set of samples FEC2-C4 is performed by overlapping or cross faded addition to obtain the missing samples FEC-C4 of the second half of the erased frame C4.
  • the output frame 05 of the decoder is constructed using a portion of samples from the cross-fading step (FEC-C4) and a portion of the decoded samples for the valid frame C5.
  • the core decoding is a CELP type decoding.
  • This decoding heart can be of any other type. For example, it can be replaced by an ADPCM decoder
  • a decoder according to the invention is described.
  • This includes a demultiplexing module 60 able to process the incoming bit stream T.
  • a first ACELP decoding stage 61 is performed.
  • the signal thus decoded is oversampled by the module 62 at the frequency of the signal. It is then processed by an MDCT transform module 63.
  • the transform used here is a weak delay transform as described in the "Low-Overlap" document presented in "Real-Time Implementation of the MPEG-4 Low-Delay Advanced Audio Coding".
  • Algorithm (AAC-LD) is Motorola's DSP56300 "J. Hilpert et al published in the 108 th AES convention in February 2000 or as described in the patent application FR 07 60258.
  • the time offset between the first decoding stage ACELP and that of the transform is therefore half a frame.
  • the decoder includes a transmission error concealment device 70 which receives from the demultiplexing module erased frame information bf.
  • This device comprises a concealment module 71 which according to the invention receives when decoding a valid frame, information inf. relating to the concealment of frame loss.
  • the output signal of the heart of the hierarchical decoder is either the signal from the ACELP decoder 61 or the signal from the concealment module 70.
  • the continuity between the two signals is ensured by the fact that they share the synthesis memories of the filter LPC linear prediction.
  • the transmission error concealment device 70 according to the invention is, for example, as illustrated in FIG. 7.
  • This device in the sense of the invention, typically comprises a ⁇ P processor cooperating with a memory block BM including a memory storage and / or work, as well as a aforementioned MEM memory buffer as a means for storing the decoded frames and sent with a time shift.
  • This device receives as input successive frames of the digital signal Se and delivers the synthesized signal Ss comprising the samples of an erased frame.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

L'invention concerne un procédé de dissimulation d'erreur de transmission dans un signal numérique découpé en une pluralité de trames successives associées à des intervalles temporels différents dans lequel, à la réception, le signal est susceptible de comporter des trames effacées et des trames valides, les trames valides comportant des informations (inf.) relatives à la dissimulation de perte de trame. Le procédé est mis en oevre lors d'un décodage hiérarchique utilisant un décodage coer et un décodage par transformée utilisant des fenêtres à faible retard introduisant un retard temporel inférieur à une trame par rapport au décodage coer. Pour remplacer au moins la dernière trame effacée avant une trame valide, le procédé comporte une étape (23) de dissimulation d'un premier ensemble d'échantillons manquants pour la trame effacée, mise en oevre dans un premier intervalle temporel; une étape (25) de dissimulation d'un deuxième ensemble d'échantillons manquants prenant en compte des informations de ladite trame valide et mise en oevre dans un second intervalle temporel; et une étape (29) de transition entre le premier et le deuxième ensemble d'échantillons manquants pour obtenir au moins une partie de la trame manquante.

Description

DISSIMULATION D'ERREUR DE TRANSMISSION DANS UN
SIGNAL AUDIONUMERIQUE DANS UNE STRUCTURE DE
DECODAGE HIERARCHIQUE
La présente invention concerne le traitement de signaux numériques dans le domaine des télécommunications. Ces signaux peuvent être par exemple des signaux de parole, de musique.
La présente invention intervient dans un système de codage/décodage adapté pour la transmission/réception de tels signaux. Plus particulièrement, la présente invention porte sur un traitement à la réception permettant d'améliorer la qualité des signaux décodés en présence de pertes de blocs de données.
Différentes techniques existent pour convertir sous forme numérique et compresser un signal audionumérique. Les techniques les plus courantes sont :
- les méthodes de codage de forme d'onde, telles que le codage MIC (pour "Modulation par Impulsions Codées") et MICDA (pour "Modulation par Impulsion et Codage Différentiel Adaptatif), dits aussi "PCM" et "ADPCM" en anglais,
- les méthodes de codage paramétrique par analyse par synthèse comme le codage CELP (pour "Code Excited Linear Prédiction"), et
- les méthodes de codage perceptuel en sous-bandes ou par transformée.
Ces techniques traitent le signal d'entrée de façon séquentielle échantillon par échantillon (MIC ou MICDA) ou par blocs d'échantillons dits "trames" (CELP et codage par transformée). Pour tous ces codeurs, les valeurs codées sont ensuite transformées en un train binaire qui est transmis sur un canal de transmission.
Selon la qualité de ce canal et le type de transport, des perturbations peuvent affecter le signal transmis et produire des erreurs sur le train binaire reçu par le décodeur. Ces erreurs peuvent intervenir de manière isolée dans le train binaire mais se produisent très fréquemment par rafales. C'est alors un paquet de bits correspondant à une portion complète de signal qui est erroné ou non reçue. Ce type de problème se rencontre par exemple pour les transmissions sur les réseaux mobiles. Il se rencontre aussi dans les transmissions sur les réseaux par paquets et en particulier sur les réseaux de type internet.
Lorsque le système de transmission ou les modules chargés de la réception permettent de détecter que les données reçues sont fortement erronées (par exemple sur les réseaux mobiles), ou qu'un bloc de données n'a pas été reçu ou est corrompu par des erreurs binaires (cas de systèmes à transmission par paquets par exemple), des procédures de dissimulation des erreurs sont alors mises en œuvre.
La trame courante à décoder est alors déclarée effacée ("bad frame" en anglais). Ces procédures permettent d'extrapoler au décodeur les échantillons du signal manquant à partir des signaux et données issus des trames précédentes.
De telles techniques ont été mises en œuvre principalement dans le cas des codeurs paramétriques et prédictifs (techniques de récupération/dissimulation des trames effacées). Elles permettent de limiter fortement la dégradation subjective du signal perçue au décodeur en présence de trames effacées. Ces algorithmes reposent sur la technique utilisée pour le codeur et le décodeur, et constituent en fait une extension du décodeur. Les dispositifs de dissimulation de trames effacées ont pour objectif d'extrapoler les paramètres de la trame effacée à partir de la (ou des) dernières trames précédentes considérées comme valides. Certains paramètres manipulés ou codés par les codeurs prédictifs présentent une forte corrélation inter-trames (cas des paramètres LPC (pour « Linear Prédictive Coding » en anglais) qui représentent l'enveloppe spectrale, et des paramètres LTP (pour « Long Term Prédiction » en anglais) de prédiction à long terme qui représente la périodicité du signal (pour les sons voisés, par exemple). Du fait de cette corrélation, il est beaucoup plus avantageux de réutiliser les paramètres de la dernière trame valide pour synthétiser la trame effacée que d'utiliser des paramètres erronés ou aléatoires.
Dans le contexte d'un décodage CELP, les paramètres de la trame effacée sont classiquement obtenus comme suit. Les paramètres LPC d'une trame à reconstruire sont obtenus à partir des paramètres LPC de la dernière trame valide, par simple recopie des paramètres ou encore avec introduction d'un certain amortissement (technique utilisée par exemple dans le codeur normalisé G723.1). Ensuite, on détecte un voisement ou un non voisement dans le signal de parole pour déterminer un degré d'harmonicité du signal au niveau de la trame effacée.
Si le signal est non voisé, un signal d'excitation peut être généré de manière aléatoire (par tirage d'un mot de code de l'excitation passée, par léger amortissement du gain de l'excitation passée, par sélection aléatoire dans l'excitation passée, ou en utilisant encore des codes transmis qui peuvent être totalement erronés).
Si le signal est voisé, la période de pitch (appelée aussi "délai LTP") est généralement celle calculée pour la trame précédente, éventuellement avec une légère "gigue" (augmentation de la valeur du délai LTP pour les trames d'erreur consécutive, le gain LTP étant pris très voisin de 1 ou égal à 1). Le signal d'excitation est donc limité à la prédiction à long terme effectuée à partir d'une excitation passée.
La complexité de calcul de ce type d'extrapolation de trames effacées est généralement comparable à celle d'un décodage d'une trame valide (ou "goodframe" en anglais) : à la place du décodage et de la quantification inverse des paramètres on utilise les paramètres estimés à partir du passé, éventuellement légèrement modifiés, puis on synthétise le signal reconstruit de la même manière que pour une trame valide en utilisant les paramètres ainsi obtenus.
Dans une structure de codage hiérarchique, utilisant en codage cœur une technique de type CELP et en codage du signal d'erreur, un codage par transformée, il peut être intéressant d'utiliser le décalage temporel généré par ce système de décodage hiérarchique pour la dissimulation de trame effacée.
La figure la illustre le codage hiérarchique des trames CELP CO à C5 et les transformées Ml à M5 appliquées à ces trames.
Lors de la transmission de ces trames à un décodeur correspondant, les trames C3 et C4 grisées et les transformées M3 et M4 sont effacées. Ainsi, au décodeur, en référence à la figure Ib, la ligne référencée 10 correspond à la réception des trames, la ligne référencée 11 correspond à la synthèse CELP et la ligne référencée 12 correspond à la synthèse totale après transformée MDCT. On peut noter que lors de la réception de la trame 1 (codage CELP Cl et codage par transformée Ml), le décodeur synthétise la trame CELP Cl qui sera utilisée pour calculer le signal de synthèse total de la trame suivante, et calcule le signal de synthèse total de la trame courante Ol (ligne 12) à partir de la synthèse CELP CO, de la transformée MO et de la transformée Ml. Ce retard supplémentaire dans la synthèse totale est bien connu dans le contexte de codage par transformée.
Dans ce cas, en présence d'erreurs sur le train binaire, le décodeur fonctionne comme suit.
Lors de la première erreur sur le train binaire, le décodeur contient en mémoire la synthèse CELP de la trame précédente. Ainsi sur la figure Ib, lorsque la trame 3 (C3 + M3) est erronée, le décodeur utilise la synthèse CELP C2 décodée à la trame précédente.
Le remplacement de la trame erronée (C3) est nécessaire pour générer la sortie suivante (04), pour faire cela une technique de dissimulation de trames effacées encore appelée FEC (pour "frame Erasure Concealment" en anglais) est utilisée, comme par exemple décrit dans le document intitulé "Method of packet errors cancellation suitable for any speech and sound compression scheme" de B. KOVESI et D. Massaloux, ISIVC-2004.
Ce décalage temporel entre la détection de trame erronée et la nécessité de synthétiser le signal correspondant permet d'utiliser des techniques de transmission d'information de correction d'erreurs pour la trame CELP précédente comme décrit dans "Efficient frame erasure concealment in prédictive speech codées using glotal puise resynchronisation" T. Vaillancourt et al publié à ICASSP 2007.
Dans ce document, une trame valide comporte des informations sur la trame précédente pour améliorer la dissimulation des trames effacées et la resynchronisation entre les trames effacées et les trames valides. Ainsi, sur la figure Ib, lors de la réception de la trame 5 (C5 + M5) après la détection de deux trames erronées (trame 3 et 4), le décodeur reçoit dans le train binaire de la trame 5 des informations sur la nature de la trame précédente (par exemple indication de classification, information sur l'enveloppe spectrale). Par information de classification, on entend une information sur le voisement, le non voisement, la présence d'attaques, etc...
Ce type d'informations dans le train binaire est par exemple décrit dans le document "Wideband Speech Coding Advances in VMR-WV Standard" de M. Jelinek et R. Salami publié dans IEEE Transactions on audio, speech and language processing Mai 2007.
Ainsi, le décodeur synthétise la trame erronée précédente (trame 4) en utilisant une technique de dissimulation de trames effacées qui bénéficie de l'information reçue avec la trame 5, avant de synthétiser le signal CELP C5.
D'autre part, des techniques de codage hiérarchique ont été développées pour diminuer le décalage temporel entre les deux étages de codage. Ainsi, il existe des transformées à faible retard qui diminue le décalage temporel à une demi-trame.
C'est par exemple le cas de l'utilisation d'une fenêtre appelée "Low-Overlap" présentée dans "Real-Time Implementation of the MPEG-4 Low-Delay Advanced
Audio Coding Algorithm (AAC-LD) on Motorola's DSP56300" de J. Hilpert et al publié à la 108ème convention AES en février 2000.
Dans ces techniques de transformée à faible retard, il n'est alors plus possible de bénéficier de l'information de la trame courante valide pour générer les échantillons manquants d'une trame effacée comme pour les techniques décrites précédemment, le décalage temporel étant inférieur à une trame. La qualité du signal en cas de trames erronées est donc plus faible.
Il existe donc un besoin d'améliorer la qualité de la dissimulation de trames effacées dans un système de décodage hiérarchique à faible retard sans pour autant introduire de retard temporel supplémentaire.
La présente invention vient améliorer la situation. ElIe propose à cet effet un procédé de dissimulation d'erreur de transmission dans un signal numérique découpé en une pluralité de trames successives associées à des intervalles temporels différents dans lequel, à la réception, le signal est susceptible de comporter des trames effacées et des trames valides, les trames valides comportant des informations (inf.) relatives à la dissimulation de perte de trame. Le procédé est tel qu'il est mis en œuvre lors d'un décodage hiérarchique utilisant un décodage cœur et un décodage par transformée utilisant des fenêtres à faible retard introduisant un retard temporel inférieur à une trame par rapport au décodage cœur, et que pour remplacer au moins la dernière trame effacée avant une trame valide, il comporte:
- une étape de dissimulation d'un premier ensemble d'échantillons manquants pour la trame effacée, mise en œuvre dans un premier intervalle temporel;
- une étape de dissimulation d'un deuxième ensemble d'échantillons manquants pour la trame effacée prenant en compte des informations de ladite trame valide et mise en œuvre dans un second intervalle temporel; et
- une étape de transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants pour obtenir au moins une partie de la trame manquante.
Ainsi, l'utilisation d'informations présentes dans une trame valide pour générer un deuxième ensemble des échantillons manquants d'une trame effacée précédente, permet d'augmenter la qualité du signal audio décodée en adaptant au mieux les échantillons manquants. L'étape de transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble permet d'assurer la continuité dans les échantillons manquants produits. Cette étape de transition peut être avantageusement une étape d'addition recouvrement.
Dans un second mode de réalisation, cette étape de transition peut être assurée par une étape de filtrage de synthèse de prédiction linéaire utilisant pour générer le deuxième ensemble d'échantillons manquants les mémoires de filtre au point de transition, stockées lors de la première étape de dissimulation. Dans ce cas, les mémoires du filtre de synthèse au point de transition sont stockées dans la première étape de dissimulation. Lors de la deuxième étape de dissimulation on détermine l'excitation en fonction des informations reçues. La synthèse est effectuée à partir du point de transition en utilisant d'une part l'excitation obtenue, d'autre part les mémoires du filtre de synthèse stockées.
Dans un mode particulier de réalisation le premier ensemble d'échantillons est la totalité des échantillons manquants de la trame effacée et le deuxième ensemble d'échantillons est une partie des échantillons manquants de la trame effacée. Ainsi, la répartition de la génération des échantillons entre deux intervalles temporels différents et le fait de ne générer qu'une partie des échantillons dans le deuxième intervalle temporel, permet de réduire le pic de complexité qui peut se trouver dans l'intervalle temporel correspondant à la trame valide. En effet, dans cet intervalle temporel, le décodeur doit à la fois générer des échantillons manquants de la trame précédente, effectuer l'étape de transition et décoder la trame valide. C'est donc dans cet intervalle temporel que se situe le pic de complexité du décodage.
Les informations présentes dans une trame valide sont par exemple des informations sur la classification du signal et/ou sur l'enveloppe spectrale du signal.
L'information de classement du signal permet par exemple à l'étape de dissimulation du deuxième ensemble d'échantillons manquants d'adapter des gains respectifs d'une partie harmonique du signal d'excitation et d'une partie aléatoire du signal d'excitation pour le signal correspondant à la trame effacée.
Ces informations assurent donc une meilleure adaptation des échantillons manquants générés par l'étape de dissimulation. Dans un mode particulier de réalisation, le premier intervalle temporel étant associé à ladite dernière trame effacée et le deuxième intervalle temporel étant associé à la dite trame valide, une étape de préparation de l'étape de dissimulation du deuxième ensemble d'échantillons manquants, ne produisant aucun échantillon manquant, est mise en œuvre dans le premier intervalle temporel. Ainsi, l'étape de préparation de l'étape de dissimulation du deuxième ensemble d'échantillons manquants s'effectue dans un intervalle temporel différent de celui correspondant au décodage de la trame valide. Ceci permet donc de répartir la charge de calcul de l'étape de dissimulation du deuxième ensemble d'échantillons et ainsi de réduire le pic de complexité dans l'intervalle temporel correspondant à la réception de la première trame valide. Comme présenté ci-dessus, c'est en effet dans cet intervalle temporel correspondant à la trame valide que se situe le pic de complexité ou pire cas de complexité du décodage.
La répartition de la complexité ainsi effectuée permet de revoir à la baisse le dimensionnement du processeur d'un dispositif de dissimulation d'erreur de transmission qui est dimensionné en fonction du pire cas de complexité.
Dans un mode de réalisation particulier l'étape de préparation comprend une étape de génération d'une partie harmonique du signal d'excitation et une étape de génération d'une partie aléatoire du signal d'excitation pour le signal correspondant à la trame effacée
La présente invention vise également un dispositif de dissimulation d'erreur de transmission dans un signal numérique découpé en une pluralité de trames successives associées à des intervalles temporels différents dans lequel, à la réception, le signal est susceptible de comporter des trames effacées et des trames valides, les trames valides comportant des informations (inf.) relatives à la dissimulation de perte de trame. Le dispositif est tel qu'il intervient lors d'un décodage hiérarchique utilisant un décodage cœur et un décodage par transformée utilisant des fenêtres à faible retard introduisant un retard temporel inférieur à une trame par rapport au décodage cœur, et qu'il comprend: - un module de dissimulation apte à générer, dans un premier intervalle temporel, un premier ensemble d'échantillons manquants pour au moins la dernière trame effacée avant une trame valide et apte à générer, dans un second intervalle temporel, un deuxième ensemble d'échantillons manquants pour la trame effacée prenant en compte des informations de ladite trame valide ;et - un module de transition apte à effectuer une transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants pour obtenir au moins une partie de la trame manquante.
Ce dispositif met en œuvre les étapes du procédé de dissimulation tel que décrit ci-dessus.
L'invention vise aussi un décodeur de signal numérique comportant un dispositif de dissimulation d'erreur de transmission selon l'invention.
Enfin, l'invention se rapporte à un programme informatique destiné à être stocké dans une mémoire d'un dispositif de dissimulation d'erreur de transmission. Ce programme informatique est tel qu'il comporte des instructions de code pour la mise en œuvre des étapes du procédé de dissimulation d'erreur selon l'invention, lorsqu'il est exécuté par un processeur dudit dispositif de dissimulation d'erreur de transmission.
Elle se rapporte à un support de stockage, lisible par un ordinateur ou par un processeur, intégré ou non au dispositif, mémorisant un programme informatique tel que décrit ci-dessus.
D'autres avantages et caractéristiques de l'invention apparaîtront à l'examen de la description détaillée, donnée à titre d'exemple ci-après, et des dessins annexés sur lesquels : - les figures la et Ib illustrent la technique de l'art antérieur de dissimulation de trames erronées dans le contexte de codage hiérarchique;
- la figure 2 illustre le procédé de dissimulation selon l'invention dans un premier mode de réalisation;
- la figure 3 illustre le procédé de dissimulation selon l'invention dans un second mode de réalisation;
- les figures 4a et 4b illustrent la synchronisation de la reconstruction en utilisant le procédé de dissimulation selon l'invention;
- la figure 5 illustre un exemple de codeur hiérarchique qui peut être utilisé dans le cadre de l'invention; - la figure 6 illustre un décodeur hiérarchique selon l'invention; - la figure 7 illustre un dispositif de dissimulation selon l'invention.
En référence à la figure 2, le procédé de dissimulation d'erreur de transmission selon un premier mode de réalisation de l'invention est maintenant décrit. Dans cet exemple, la trame N reçue au décodeur est effacée.
Une trame valide N-I reçue au décodeur, est traitée en 20 par un module de démultiplexage DEMUX, est décodée normalement en 21 par un module de décodage DE-NO. Le signal décodé est ensuite mémorisé dans une mémoire tampon MEM lors d'une étape 22. Au moins une partie de ce signal décodé mémorisé est envoyé à la carte son 30 en sortie du décodeur de la trame N-I, le signal décodé restant dans la mémoire tampon est conservé pour être envoyé à la carte son 30 après décodage de la trame suivante.
Ainsi, à la détection de la trame effacée N, on effectue une étape de dissimulation d'un premier ensemble d'échantillons pour cette trame manquante en 23 à l'aide d'un module de dissimulation d'erreurs DE-DISS et en utilisant le signal décodé d'une trame précédente. Le signal ainsi extrapolé est mémorisé en mémoire
MEM lors de l'étape 24.
Au moins une partie de ce signal extrapolé mémorisé, conjointement avec le signal décodé de la trame N-I restant mémorisé, est envoyé à la carte son 30 en sortie du décodeur de la trame N. Le signal extrapolé restant dans la mémoire tampon est conservé pour être envoyé à la carte son après décodage de la trame suivante.
A la réception de la trame valide N+l, une étape de dissimulation d'un deuxième ensemble d'échantillons manquants pour la trame N effacée est effectuée en 25 par le module de dissimulation d'erreurs DE-MISS. Cette étape utilise des informations présentes dans la trame valide N+l qui sont obtenues lors d'une étape
26 de démultiplexage de la trame N+l par le module de démultiplexage DEMUX.
Les informations présentes dans une trame valide comportent des informations sur la trame précédente du train binaire. Ce sont notamment des informations de classement du signal (signal voisé, non-voisé, transitoire) ou encore des informations sur l'enveloppe spectrale du signal.
Ces informations vont permettre d'adapter au mieux l'étape de dissimulation des erreurs en calculant par exemple des gains respectifs pour partie harmonique de l'excitation et la partie aléatoire de l'excitation. Par excitation harmonique, on entend l'excitation calculée à partir de la valeur de pitch (nombre d'échantillons dans une période correspondant à l'inverse de la fréquence fondamentale) du signal de la trame précédente, la partie harmonique du signal d'excitation est donc obtenu par recopie de l'excitation passée aux instants correspondant au retard du pitch. Par excitation aléatoire, on entend le signal d'excitation obtenu à partir d'un générateur de signal aléatoire ou par tirage aléatoire d'un mot de code de l'excitation passée ou dans un dictionnaire.
Ainsi, dans le cas où le classement du signal indique une trame voisée, un gain plus important est calculé pour la partie harmonique de l'excitation et dans le cas où le classement du signal indique une trame non- voisée, un gain plus important est calculé pour la partie aléatoire de l'excitation.
D'autre part, dans le cas d'une transition entre non voisée vers voisée, la partie de l'excitation harmonique est complètement erronée. Dans ce cas plusieurs trames peuvent être nécessaires avant que le décodeur retrouve une excitation normale et donc une qualité acceptable. Ainsi, une nouvelle version artificielle de l'excitation harmonique peut être utilisée pour permettre au décodeur de retrouver plus rapidement un fonctionnement normal.
L'information sur l'enveloppe spectrale peut être une information de stabilité du filtre de prédiction linéaire LPC. Ainsi si cette information indique que le filtre est stable entre la trame précédente et la trame courante (valide), l'étape de dissimulation d'un deuxième ensemble d'échantillons manquants utilise le filtre de prédiction linéaire de la trame valide. Dans le cas contraire, le filtre issu du passé est utilisé.
Une étape 29 de transition par un module de transition TRANS est effectuée. Ce module prend en compte le premier ensemble d'échantillons générés à l'étape 23 pas encore joué sur la carte son et le deuxième ensemble d'échantillons générés à l'étape 25 pour obtenir une transition douce entre le premier ensemble et le deuxième ensemble. Dans un mode de réalisation, cette étape de transition est une étape de fondu enchainé ou d'addition-recouvrement qui consiste à diminuer progressivement le poids du signal extrapolé dans le premier ensemble et à augmenter progressivement le poids du signal extrapolé dans le deuxième ensemble pour obtenir les échantillons manquants de la trame effacée.
Par exemple, cette étape de fondu enchainé correspond à la multiplication de tous les échantillons du signal extrapolé mémorisé à la trame N avec une fonction de pondération décroissante progressivement de 1 à 0, et l'addition de ce signal pondéré avec les échantillons du signal extrapolé à la trame N+l multiplié avec la fonction de pondération complémentaire de la fonction de pondération du signal mémorisé. Par fonction de pondération complémentaire, on entend la fonction obtenu en effectuant la soustraction de un par la fonction de pondération précédente.
Dans une variante de ce mode de réalisation, cette étape de fondu enchainé est effectuée sur une partie seulement (au moins un échantillon) du signal mémorisé.
Dans un autre mode de réalisation, cette étape de transition est assurée par le filtrage de synthèse de prédiction linéaire. Dans ce cas, les mémoires du filtre de synthèse au point de transition sont stockées dans la première étape de dissimulation. Lors de la deuxième étape de dissimulation on détermine l'excitation en fonction des informations reçues. La synthèse est effectuée à partir du point de transition en utilisant d'une part l'excitation obtenue, d'autre part les mémoires du filtre de synthèse stockées.
Dans le même intervalle temporel, la trame valide est donc démultiplexée en 26, décodée normalement en 27 et le signal décodé est mémorisé en 28 en mémoire tampon MEM. Le signal issu du module de transition TRANS est envoyé conjointement avec le signal décodé de la trame N+l à la carte son 30 en sortie du décodeur de la trame N+ 1. Le signal reçu par la carte son 30 est destiné à être restitué par des moyens de restitution de type haut-parleur 31.
Dans un mode de réalisation du procédé selon l'invention, le premier ensemble d'échantillons et le deuxième ensemble d'échantillons sont l'ensemble des échantillons de la trame manquante. A chaque intervalle temporel, un signal correspondant à la trame effacée est généré, le fondu enchainé s'effectue alors sur la partie des deux signaux correspondants à la deuxième moitié de la trame effacée (une demi-trame) pour obtenir les échantillons de la trame manquante. Ce mode de réalisation a l'avantage d'utiliser plus facilement les structures de dissimulation d'erreur habituelles qui fonctionnent sur une trame entière.
Dans une variante de réalisation, dans l'intervalle temporel correspondant à la trame effacée, l'étape de dissimulation génère la totalité des échantillons de la trame manquante (ces échantillons seront nécessaire si la trame suivante est aussi effacée), alors que dans l'intervalle temporel correspondant au décodage de la trame valide, l'étape de dissimulation génère seulement une seconde partie des échantillons, par exemple, la deuxième moitié des échantillons de la trame manquante. L'étape d'addition recouvrement est effectuée pour assurer une transition sur cette deuxième moitié des échantillons de la trame manquante.
Dans cette variante de réalisation, le nombre d'échantillons générés pour la trame manquante dans l'intervalle temporel correspondant à la trame valide, est moins important que dans le cas du premier mode de réalisation décrit ci-dessus. La complexité de décodage dans cet intervalle temporel est donc réduite.
C'est en effet dans cet intervalle temporel que le pire cas de complexité se situe. En effet, dans cet intervalle temporel, à la fois le décodage de la trame valide s'effectue mais également l'étape de dissimulation du deuxième ensemble d'échantillons. En réduisant le nombre d'échantillons à générer, on réduit le pire cas de complexité et donc le dimensionnement d'un processeur de type DSP (pour "Digital Signal Processor" en anglais). Dans un second mode de réalisation de l'invention, une distribution de la complexité est effectuée permettant de réduire encore plus le pire cas de complexité sans augmenter pour autant la complexité moyenne.
Ainsi, en référence à la figure 3, un deuxième mode de réalisation du procédé selon l'invention est illustré dans le cas où la trame N reçue au décodeur est effacée.
Dans cet exemple, l'étape de dissimulation du deuxième ensemble d'échantillons est scindée en deux étapes. Une première étape El de préparation ne produisant pas d'échantillons manquants et n'utilisant pas l'information issu de la trame valide, est effectuée dans l'intervalle temporel précédent. Une deuxième étape E2 générant des échantillons manquants et utilisant les informations issues de la trame valide est effectuée dans l'intervalle temporel correspondant à la trame valide.
Ainsi, les mêmes opérations que celles décrites en référence à la figure 2, pour la trame N-I reçue au décodeur, sont effectuées, c'est-à-dire démultiplexage 20, décodage normal 21 et mémorisation 22.
Dans l'intervalle temporel correspondant à la trame N effacée, une étape de préparation El référencée 32 est effectuée. Cette étape de préparation est par exemple une étape d'obtention de la partie harmonique de l'excitation utilisant la valeur du retard LTP de la trame précédente, et d'obtention de la partie aléatoire de l'excitation dans une structure de décodage CELP.
Cette étape de préparation utilise des paramètres de la trame précédente mémorisée en mémoire MEM. Il n'est pas utile pour cette étape d'utiliser les informations de classement ou les informations sur l'enveloppe spectrale de la trame effacée. Dans ce même intervalle temporel correspondant à la trame effacée, l'étape de dissimulation 23 du premier ensemble d'échantillons tel que décrit en référence à la figure 2 est également effectuée. Le signal extrapolé qui en est issu est mémorisé en 24 dans la mémoire MEM. Au moins une partie de ce signal extrapolé mémorisé, conjointement avec le signal décodé restant mémorisé de la trame N-I, est envoyée à la carte son 30 en sortie du décodeur de la trame N. Le signal extrapolé restant dans Ia mémoire tampon est conservé pour être envoyé à la carte son après décodage de la trame suivante.
L'étape E2 référencé 33 de dissimulation comprenant l'extrapolation du deuxième ensemble d'échantillons manquants correspondant à la trame N effacée, est réalisée dans l'intervalle temporel correspondant à la trame N+l reçue au décodeur.
Cette étape comprend la prise en compte des informations contenue dans la trame valide N+l et qui concernent la trame N.
Dans ce mode de réalisation particulier, l'étape de dissimulation correspond alors au calcul des gains associés aux deux parties de l'excitation, et éventuellement à la correction de la phase de l'excitation harmonique. En fonction de l'information de classification reçue dans la première trame valide, les gains respectifs des deux parties de l'excitation sont adaptés. Ainsi, par exemple en fonction de l'information de classification de la dernière trame valide reçue avant les trames effacées et de l'information de classification reçue, l'étape de dissimulation adapte le choix des excitations et les gains associés pour représenter au mieux la classe de la trame. En cela, la qualité du signal généré lors de l'étape de dissimulation est améliorée en bénéficiant de l'information reçue.
Par exemple, si l'information est que la trame N est une trame de signal voisé, l'étape E2 privilégie l'excitation harmonique obtenue à l'étape de préparation El plutôt que l'excitation aléatoire et vice versa pour une trame de signal non-voisée. Dans le cas où l'information décrit une trame N transitoire, l'étape E2 va générer des échantillons manquants en fonction de la classification précise du transitoire (voisée vers non-voisée ou non-voisée vers voisée).
Une étape 29 d'addition-recouvrement ou de fondu enchainé comme celle décrite en référence à la figure 2 est ensuite effectuée entre le premier ensemble d'échantillons généré à l'étape 23 et le deuxième ensemble d'échantillons généré à l'étape 33.
Pendant l'intervalle temporel correspondant à la trame valide N+l, la trame
N+l est traitée par le module de démultiplexage DEMUX, est décodée en 27 et mémorisée en 28 comme décrit précédemment en référence à la figure 2. Le signal extrapolé obtenu par l'étape de fondu enchainé 29 et le signal décodé de la trame N+l sont conjointement envoyés à la carte son 30 en sortie du décodeur de la trame N+l.
Les figures 4a et 4b illustrent la mise en œuvre de ce procédé et la synchronisation entre le décodage de type CELP et le décodage par transformée qui utilise des fenêtres à faible retard représentée ici sous la forme de fenêtres telles que décrites dans la demande de brevet FR 0760258.
Dans ce contexte de décodage hiérarchique, la figure 4a illustre le codage hiérarchique des trames CELP CO à C5 et les transformées à faible retard Ml à M5 appliquées à ces trames.
Lors de la transmission de ces trames à un décodeur correspondant, les trames C3 et C4 grisées sont effacées.
La figure 4b illustre le décodage des trames CO à C5. La ligne 40 illustre le signal reçu au décodeur, la ligne 41 illustre la synthèse CELP dans le premier étage de décodage, la ligne 42 illustre la synthèse totale utilisant la transformée (MDCT) à faible retard.
On voit bien que dans cet exemple, le décalage temporel entre les deux étages de décodage est inférieur à une trame, il est représenté ici dans un souci de simplicité à un décalage d'une demi-trame. Ainsi, pour décoder la trame Ol (ligne 42) du décodeur, une partie de la synthèse CELP de la trame précédente CO et la transformée MO est utilisée ainsi qu'une partie de la synthèse CELP de la trame courante Cl et la transformée Ml.
Il en est de même pour la trame 02 qui utilise une partie de la synthèse CELP de la trame 1 (Cl) et la transformée Ml et une partie de la synthèse CELP de la trame 2 (C2) et la transformée M2.
Lors de la détection de la première trame effacée (C3+M3), le décodeur utilise la synthèse CELP de la trame précédente 2 (C2) pour construire le signal de synthèse total (03). Il est également nécessaire de générer à partir d'un algorithme de dissimulation d'erreur, le signal correspondant à la synthèse CELP de la trame 3 (C3). Ce signal régénéré est nommé FEC-C3 sur la figure 4b. Le signal de sortie du décodeur 03 est donc composé de la dernière moitié du signal C2 et de la première moitié du signal extrapolé FEC-C3.
Lors de la seconde trame erronée C4, une étape de dissimulation pour la trame C4 est effectuée pour générer des échantillons correspondants à la trame manquante C4. On obtient ainsi un premier ensemble d'échantillons noté FEC1-C4 pour la trame manquante C4.
Ainsi, la trame 4 de sortie 04 du décodeur est construite en utilisant une partie d'échantillons extrapolés pour C3 (FEC-C3) et une partie du premier ensemble d'échantillons extrapolés pour C4 (FEC 1 -C4).
Lors de la réception de la première trame valide (C5+M5), une étape de dissimulation d'un deuxième ensemble d'échantillons pour la trame C4 est effectuée. Cette étape utilise les informations 15 sur la trame C4 qui sont présentes dans la trame valide C5. Ce second ensemble d'échantillons est référence FEC2-C4. Une étape de transition entre le premier ensemble d'échantillons FEC1-C4 et le deuxième ensemble d'échantillons FEC2-C4 est effectuée par addition recouvrement ou fondu enchainé pour obtenir les échantillons manquants FEC-C4 de la seconde moitié de la trame effacée C4.
La trame 5 de sortie 05 du décodeur est construite en utilisant une partie d'échantillons issus de l'étape de fondu enchainé (FEC-C4) et une partie des échantillons décodés pour la trame valide C5.
Dans une variante de ce mode de réalisation, lors de l'étape de dissimulation d'un deuxième ensemble d'échantillons pour la trame C4, seule la deuxième moitié des échantillons manquants FEC2-C4 est généré pour réduire la complexité. L'étape de fondu enchainé est réalisée sur cette deuxième moitié.
L'invention a été décrite ici avec un exemple de réalisation où le décodage cœur est un décodage de type CELP. Ce décodage cœur peut être de tout autre type. Par exemple, il peut être remplacé par un décodeur de type ADPCM
(comme par exemple le codeur/décodeur normalisé G.722). Dans ce mode de réalisation, à la différence du décodage CELP, la continuité entre deux trames n'est pas obligatoirement assurée par le filtrage de synthèse de prédiction linéaire (LPC). Ainsi, à la réception de la première trame valide après une ou des trames effacées, le procédé comprend en plus une étape de prolongement du signal d'extrapolation des trames effacées et une étape d'addition recouvrement entre le signal d'au moins une partie de la première trame valide et de ce prolongement du signal d'extrapolation.
En référence à la figure 5, un exemple de codeur hiérarchique avec un étage de codage par transformée est décrit.
Le signal d'entrée S du codeur est filtré par un filtre passe-haut HP 50. Dans un premier étage de codage ce signal filtré est sous-échantillonné par le module 51 à la fréquence du codeur ACELP (pour "Algebraic Code Excited Linear Prédiction" en anglais) pour ensuite être codé par une méthode de codage ACELP. Le signal issu de cet étage de codage est ensuite multiplexe dans le module de multiplexage 56. Une information concernant la trame précédente (inf.) est également envoyé au module de multiplexage pour former le train binaire T. Le signal issu du codage ACELP est également sur-échantillonné à une fréquence d'échantillonnage correspondant au signal d'origine, par le module 53. Ce signal sur-échantillonné est soustrait du signal filtré en 54 pour entrer dans un second étage de codage où une transformée MDCT est effectuée dans le module 55. Le signal est ensuite quantifié dans le module 57 et est multiplexe par le module de multiplexage MUX pour former le train binaire T.
En référence à la figure 6, un décodeur selon l'invention est décrit. Celui-ci comporte un module de démultiplexage 60 apte à traiter le train binaire T entrant. Un premier étage de décodage ACELP 61 est effectué. Le signal ainsi décodé est sur-échantillonné par le module 62 à la fréquence du signal. Il est ensuite traité par un module de transformée MDCT 63. La transformée utilisée ici est une transformée faible retard tel que décrit dans le document "Low-Overlap" présentée dans "Real-Time Implementation of the MPEG-4 Low-Delay Advanced Audio Coding Algorithm (AAC-LD) on Motorola's DSP56300" de J. Hilpert et al publié à la 108eme convention AES en février 2000 ou encore tel que décrit dans la demande de brevet FR 07 60258. Le décalage temporel entre le premier étage de décodage ACELP et celui de la transformée est donc d'une demi trame.
A la sortie du module de démultiplexage, le signal est, dans un deuxième étage de décodage, déquantifïé dans le module 68 et additionné en 67 au signal issu de la transformée. Une transformée inverse est ensuite appliqué en 64. Le signal qui en est issu est ensuite post-traité (PF) 65 en utilisant le signal issu du module 62 puis filtré en 66 par un filtre passe-haut qui fournit le signal de sortie Ss du décodeur.
Le décodeur comporte un dispositif 70 de dissimulation d'erreur de transmission qui reçoit du module de démultiplexage une information de trame effacée bfî. Ce dispositif comporte un module de dissimulation 71 qui selon l'invention reçoit lors du décodage d'une trame valide, des informations inf. relative à la dissimulation de perte de trame.
Ce module effectue dans un premier intervalle temporel la dissimulation d'un premier ensemble d'échantillons d'une trame effacée puis dans un intervalle temporel correspondant au décodage d'une trame valide, il effectue la dissimulation d'un second ensemble d'échantillons de la trame effacée.
Le dispositif 70 comporte également un module 72 TRANS de transition apte à effectuer une transition entre le premier ensemble d'échantillons et le deuxième ensemble d'échantillons pour fournir au moins une partie des échantillons de la trame effacée.
Le signal de sortie du cœur du décodeur hiérarchique est soit le signal issu du décodeur ACELP 61, soit le signal issu du module de dissimulation 70. La continuité entre les deux signaux est assurée par le fait qu'ils partagent les mémoires de synthèse du filtre de prédiction linéaire LPC. Le dispositif 70 de dissimulation d'erreur de transmission selon l'invention est par exemple tel qu'illustré en figure 7. Matériellement, ce dispositif au sens de l'invention comporte typiquement, un processeur μP coopérant avec un bloc mémoire BM incluant une mémoire de stockage et/ou de travail, ainsi qu'une mémoire tampon MEM précitée en tant que moyen pour mémoriser les trames décodées et envoyées avec un décalage temporel. Ce dispositif reçoit en entrée des trames successives du signal numérique Se et délivre le signal synthétisé Ss comportant les échantillons d'une trame effacée.
Le bloc mémoire BM peut comporter un programme informatique comportant les instructions de code pour la mise en œuvre des étapes du procédé selon l'invention lorsque ces instructions sont exécutées par un processeur μP du dispositif et notamment une étape de dissimulation d'un premier ensemble d'échantillons manquants pour la trame effacée, mise en œuvre dans un premier intervalle temporel, une étape de dissimulation d'un deuxième ensemble d'échantillons manquants pour la trame effacée prenant en compte des informations de ladite trame valide et mise en œuvre dans un second intervalle temporel; et une étape d'addition recouvrement entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants pour obtenir (au moins une partie de?) la trame manquante.
Les figures 2 et 3 peuvent illustrer l'algorithme d'un tel programme informatique.
Ce dispositif de dissimulation selon l'invention peut être indépendant ou intégré dans un décodeur de signal numérique.

Claims

REVENDICATIONS
1. Procédé de dissimulation d'erreur de transmission dans un signal numérique découpé en une pluralité de trames successives associées à des intervalles temporels différents dans lequel, à la réception, le signal est susceptible de comporter des trames effacées et des trames valides, les trames valides comportant des informations (inf.) relatives à la dissimulation de perte de trame, le procédé est caractérisé en ce qu'il est mis en œuvre lors d'un décodage hiérarchique utilisant un décodage cœur et un décodage par transformée utilisant des fenêtres à faible retard introduisant un retard temporel inférieur à une trame par rapport au décodage cœur, et en ce que pour remplacer au moins la dernière trame effacée avant une trame valide, il comporte:
- une étape (23) de dissimulation d'un premier ensemble d'échantillons manquants pour la trame effacée, mise en œuvre dans un premier intervalle temporel; - une étape (25) de dissimulation d'un deuxième ensemble d'échantillons manquants pour la trame effacée prenant en compte des informations de ladite trame valide et mise en œuvre dans un second intervalle temporel; et
- une étape (29) de transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants pour obtenir au moins une partie de la trame manquante.
2. Procédé selon la revendication 1, caractérisé en ce que l'étape de transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants est assurée par une étape d'addition recouvrement.
3. Procédé selon la revendication 1, caractérisé en ce que l'étape de transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants est assurée par une étape de filtrage de synthèse de prédiction linéaire utilisant pour générer le deuxième ensemble d'échantillons manquants les mémoires de filtre au point de transition, stockées lors de la première étape de dissimulation.
4. Procédé selon la revendication 1, caractérisé en ce que le premier ensemble d'échantillons est la totalité des échantillons manquants de la trame effacée et le deuxième ensemble d'échantillons est une partie des échantillons manquants de la trame effacée.
5. Procédé selon la revendication 1, caractérisé en ce que les informations d'une trame valide relatives à la dissimulation de perte de trame sont des informations sur la classification du signal et/ou sur l'enveloppe spectrale du signal.
6. Procédé selon la revendication 1, caractérisé en ce que l'étape de dissimulation du deuxième ensemble d'échantillons manquants utilise une information de classement du signal pour adapter des gains respectifs d'une partie harmonique du signal d'excitation et d'une partie aléatoire du signal d'excitation pour le signal correspondant à la trame effacée.
7. Procédé selon la revendication 1, caractérisé en ce que le premier intervalle temporel étant associé à ladite dernière trame effacée et le deuxième intervalle temporel étant associé à la dite trame valide, une étape de préparation de l'étape de dissimulation du deuxième ensemble d'échantillons manquants, ne produisant aucun échantillon manquant, est mise en œuvre dans le premier intervalle temporel.
8. Procédé selon la revendication 7, caractérisé en ce que l'étape de préparation comprend une étape de génération d'une partie harmonique du signal d'excitation et une étape de génération d'une partie aléatoire du signal d'excitation pour le signal correspondant à la trame effacée
9. Dispositif de dissimulation d'erreur de transmission dans un signal numérique découpé en une pluralité de trames successives associées à des intervalles temporels différents dans lequel, à la réception, le signal est susceptible de comporter des trames effacées et des trames valides, les trames valides comportant des informations (inf.) relatives à la dissimulation de perte de trame, le dispositif est caractérisé en ce qu'il intervient lors d'un décodage hiérarchique utilisant un décodage cœur et un décodage par transformée utilisant des fenêtres à faible retard introduisant un retard temporel inférieur à une trame par rapport au décodage cœur, et en ce qu'il comprend:
- un module de dissimulation (DE-DISS) apte à générer, dans un premier intervalle temporel, un premier ensemble d'échantillons manquants pour au moins la dernière trame effacée avant une trame valide et apte à générer, dans un second intervalle temporel, un deuxième ensemble d'échantillons manquants pour la trame effacée prenant en compte des informations de ladite trame valide ;et
- un module (TRANS) de transition apte à effectuer une transition entre le premier ensemble d'échantillons manquants et le deuxième ensemble d'échantillons manquants pour obtenir au moins une partie de la trame manquante.
10. Décodeur de signal numérique caractérisé en ce qu'il comporte un dispositif de dissimulation d'erreur de transmission selon la revendication 9.
11. Programme informatique destiné à être stocké dans une mémoire d'un dispositif de dissimulation d'erreur de transmission, caractérisé en ce qu'il comporte des instructions de code pour la mise en œuvre des étapes du procédé selon l'une des revendications 1 à 8, lorsqu'il est exécuté par un processeur dudit dispositif de dissimulation d'erreur de transmission.
EP09730641A 2008-03-28 2009-03-20 Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique Active EP2277172B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0852043A FR2929466A1 (fr) 2008-03-28 2008-03-28 Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
PCT/FR2009/050489 WO2009125114A1 (fr) 2008-03-28 2009-03-20 Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique

Publications (2)

Publication Number Publication Date
EP2277172A1 true EP2277172A1 (fr) 2011-01-26
EP2277172B1 EP2277172B1 (fr) 2012-05-16

Family

ID=39639207

Family Applications (1)

Application Number Title Priority Date Filing Date
EP09730641A Active EP2277172B1 (fr) 2008-03-28 2009-03-20 Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique

Country Status (10)

Country Link
US (1) US8391373B2 (fr)
EP (1) EP2277172B1 (fr)
JP (1) JP5247878B2 (fr)
KR (1) KR101513184B1 (fr)
CN (1) CN101981615B (fr)
BR (1) BRPI0910327B1 (fr)
ES (1) ES2387943T3 (fr)
FR (1) FR2929466A1 (fr)
RU (1) RU2496156C2 (fr)
WO (1) WO2009125114A1 (fr)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120265542A1 (en) * 2009-10-16 2012-10-18 France Telecom Optimized parametric stereo decoding
GB0920729D0 (en) * 2009-11-26 2010-01-13 Icera Inc Signal fading
DK2559028T3 (en) * 2010-04-14 2015-11-09 Voiceage Corp FLEXIBLE AND SCALABLE COMBINED INNOVATIONSKODEBOG FOR USE IN CELPKODER encoder and decoder
SG185519A1 (en) 2011-02-14 2012-12-28 Fraunhofer Ges Forschung Information signal representation using lapped transform
TWI488177B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 使用頻譜域雜訊整形之基於線性預測的編碼方案
ES2639646T3 (es) 2011-02-14 2017-10-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificación y decodificación de posiciones de impulso de pistas de una señal de audio
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
MX2013009304A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
CA2827000C (fr) * 2011-02-14 2016-04-05 Jeremie Lecomte Dispositif et procede de masquage d'erreurs dans le codage de la parole et audio unifie (usac) a faible retard
US9053699B2 (en) * 2012-07-10 2015-06-09 Google Technology Holdings LLC Apparatus and method for audio frame loss recovery
KR101788484B1 (ko) 2013-06-21 2017-10-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. Tcx ltp를 이용하여 붕괴되거나 붕괴되지 않은 수신된 프레임들의 재구성을 갖는 오디오 디코딩
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
KR20150032390A (ko) * 2013-09-16 2015-03-26 삼성전자주식회사 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법
EP2922056A1 (fr) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil,procédé et programme d'ordinateur correspondant pour générer un signal de masquage d'erreurs utilisant une compensation de puissance
EP2922054A1 (fr) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil, procédé et programme d'ordinateur correspondant permettant de générer un signal de masquage d'erreurs utilisant une estimation de bruit adaptatif
EP2922055A1 (fr) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil, procédé et programme d'ordinateur correspondant pour générer un signal de dissimulation d'erreurs au moyen de représentations LPC de remplacement individuel pour les informations de liste de codage individuel
JP6439296B2 (ja) * 2014-03-24 2018-12-19 ソニー株式会社 復号装置および方法、並びにプログラム
NO2780522T3 (fr) 2014-05-15 2018-06-09
CN104050968B (zh) * 2014-06-23 2017-02-15 东南大学 一种嵌入式音频采集端aac音频编码方法
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
US20160014600A1 (en) * 2014-07-10 2016-01-14 Bank Of America Corporation Identification of Potential Improper Transaction
EP3000110B1 (fr) * 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sélection d'un premier algorithme d'encodage ou d'un deuxième algorithme d'encodage au moyen d'une réduction des harmoniques
BR112018068060A2 (pt) 2016-03-07 2019-01-08 Fraunhofer Ges Forschung unidade de ocultação de erros, codificador de áudio e método relacionado e programa de computador usando características de uma representação decodificada de um quadro de áudio adequadamente decodificado
EP3427257B1 (fr) * 2016-03-07 2021-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Unité de dissimulation d'erreur, décodeur audio, et procédé et programme informatique associés permettant d'atténuer une trame audio dissimulée en fonction de différents facteurs d'amortissement pour différentes bandes de fréquence
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
WO2020164753A1 (fr) 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Décodeur et procédé de décodage sélectionnant un mode de dissimulation d'erreur, et encodeur et procédé d'encodage
CN111404638B (zh) * 2019-12-16 2022-10-04 王振江 一种数字信号传输方法

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL120788A (en) * 1997-05-06 2000-07-16 Audiocodes Ltd Systems and methods for encoding and decoding speech for lossy transmission networks
JP2001339368A (ja) * 2000-03-22 2001-12-07 Toshiba Corp 誤り補償回路及び誤り補償機能を備えた復号装置
JP4458635B2 (ja) * 2000-07-19 2010-04-28 クラリオン株式会社 フレーム補正装置
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
BRPI0212000B1 (pt) * 2001-08-23 2017-12-12 Polycom, Inc. "system and method for processing video data"
JP2003223194A (ja) * 2002-01-31 2003-08-08 Toshiba Corp 移動無線端末装置および誤り補償回路
CA2388439A1 (fr) * 2002-05-31 2003-11-30 Voiceage Corporation Methode et dispositif de dissimulation d'effacement de cadres dans des codecs de la parole a prevision lineaire
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
EP1604352A4 (fr) * 2003-03-15 2007-12-19 Mindspeed Tech Inc Modele de suppression de bruit simple
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
JP5420175B2 (ja) * 2005-01-31 2014-02-19 スカイプ 通信システムにおける隠蔽フレームの生成方法
US7359409B2 (en) * 2005-02-02 2008-04-15 Texas Instruments Incorporated Packet loss concealment for voice over packet networks

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO2009125114A1 *

Also Published As

Publication number Publication date
JP2011515712A (ja) 2011-05-19
BRPI0910327A2 (pt) 2015-10-06
BRPI0910327B1 (pt) 2020-10-20
EP2277172B1 (fr) 2012-05-16
WO2009125114A1 (fr) 2009-10-15
RU2496156C2 (ru) 2013-10-20
CN101981615B (zh) 2012-08-29
US20110007827A1 (en) 2011-01-13
KR20100134709A (ko) 2010-12-23
FR2929466A1 (fr) 2009-10-02
JP5247878B2 (ja) 2013-07-24
US8391373B2 (en) 2013-03-05
KR101513184B1 (ko) 2015-04-17
ES2387943T3 (es) 2012-10-04
RU2010144057A (ru) 2012-05-10
CN101981615A (zh) 2011-02-23

Similar Documents

Publication Publication Date Title
EP2277172B1 (fr) Dissimulation d'erreur de transmission dans un signal audionumerique dans une structure de decodage hierarchique
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP2080195B1 (fr) Synthèse de blocs perdus d'un signal audionumérique
AU2003233724B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
EP2080194B1 (fr) Attenuation du survoisement, notamment pour la generation d'une excitation aupres d'un decodeur, en absence d'information
EP1051703A1 (fr) Procede decodage d'un signal audio avec correction des erreurs de transmission
EP1356455B1 (fr) Methode et dispositif de traitement d'une pluralite de flux binaires audio
EP3175443B1 (fr) Détermination d'un budget de codage d'une trame de transition lpd/fd
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
WO2007107670A2 (fr) Procede de post-traitement d'un signal dans un decodeur audio
EP2203915B1 (fr) Dissimulation d'erreur de transmission dans un signal numerique avec repartition de la complexite
EP1665234B1 (fr) Procede de transmission d un flux d information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
WO2007006958A2 (fr) Procédé et dispositif d'atténuation des échos d'un signal audionumérioue issu d'un codeur multicouches
WO2009080982A2 (fr) Traitement d'erreurs binaires dans une trame binaire audionumerique
FR2830970A1 (fr) Procede et dispositif de synthese de trames de substitution, dans une succession de trames representant un signal de parole
MX2008008477A (es) Metodo y dispositivo para ocultamiento eficiente de borrado de cuadros en codec de voz

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20101012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK TR

AX Request for extension of the european patent

Extension state: AL BA RS

DAX Request for extension of the european patent (deleted)
GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO SE SI SK TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 558409

Country of ref document: AT

Kind code of ref document: T

Effective date: 20120615

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602009007073

Country of ref document: DE

Effective date: 20120712

REG Reference to a national code

Ref country code: NL

Ref legal event code: VDEP

Effective date: 20120516

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2387943

Country of ref document: ES

Kind code of ref document: T3

Effective date: 20121004

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

Effective date: 20120516

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120916

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120816

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 558409

Country of ref document: AT

Kind code of ref document: T

Effective date: 20120516

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120817

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120917

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20130219

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602009007073

Country of ref document: DE

Effective date: 20130219

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120816

BERE Be: lapsed

Owner name: FRANCE TELECOM

Effective date: 20130331

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MC

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130331

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130331

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130331

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130320

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130331

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20090320

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20120516

Ref country code: LU

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20130320

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 8

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 9

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 10

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: ES

Payment date: 20230403

Year of fee payment: 15

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20240220

Year of fee payment: 16

Ref country code: GB

Payment date: 20240220

Year of fee payment: 16

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20240220

Year of fee payment: 16

Ref country code: FR

Payment date: 20240220

Year of fee payment: 16