EP1145227B1 - Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code - Google Patents

Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code Download PDF

Info

Publication number
EP1145227B1
EP1145227B1 EP00926896A EP00926896A EP1145227B1 EP 1145227 B1 EP1145227 B1 EP 1145227B1 EP 00926896 A EP00926896 A EP 00926896A EP 00926896 A EP00926896 A EP 00926896A EP 1145227 B1 EP1145227 B1 EP 1145227B1
Authority
EP
European Patent Office
Prior art keywords
sub
spectral
spectral coefficients
band
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
EP00926896A
Other languages
German (de)
English (en)
Other versions
EP1145227A1 (fr
Inventor
Pierre Lauber
Martin Dietz
Jürgen HERRE
Reinhold BÖHM
Ralph Sperschneider
Daniel Homm
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of EP1145227A1 publication Critical patent/EP1145227A1/fr
Application granted granted Critical
Publication of EP1145227B1 publication Critical patent/EP1145227B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Definitions

  • the present invention relates to coding or Decoding audio signals and in particular on obfuscation of errors ("Error Concealment”) in digital encoded audio signals.
  • Muting method also known as "muting" becomes.
  • a decoder detects that data is missing or incorrect the playback is switched off.
  • the Missing data are thus replaced by a zero signal. This avoids that due to a transmission error too loud or unpleasant noises from a decoder become. This is due to psychoacoustic effects sudden drop and rise in signal energy when the decoder outputs error-free data again, but as felt uncomfortable.
  • Spectral values in a block are incorrect, so can these spectral values based on the spectral values of a previous blocks or several previous blocks predicted, d. H. be predicted or estimated.
  • the predicted spectral values correspond within certain limits the incorrect spectral values when the audio signal is relative is stationary, d. H. if the audio signal is not like that undergoes rapid changes in the signal envelope.
  • a according to the MPEG-AAC standard ISO / IEC 13818-7 MPEG-2 Advanced Audio Coding
  • spectral value Prediction will therefore be 1024 in parallel working predictors in the decoder needed to e.g. B. in In the event of a complete block failure ("frame loss") to be able to predict all spectral values.
  • a disadvantage of this method is the relatively high computing effort, which is currently receiving real-time decoding of a Multimedia or audio data signal impossible.
  • MDCT modified discrete cosine transformation
  • DE 40 34 017 A1 relates to a method for recognition errors in the transmission of frequency-coded digital signals.
  • the frequency coefficient previous and possibly future blocks an error function formed on the basis of which the occurrence of an error is determined. An incorrect frequency coefficient will no longer used for the evaluation of subsequent blocks.
  • DE 197 35 675 A1 discloses a method for concealing errors in an audio data stream. For this, the spectral energy of a subset of intact audio data calculated. After creating a template for replacement data based on those calculated for the subset of the intact audio data spectral energy will be substitute data for faulty or non-existent audio data belonging to the subgroup correspond, generated based on the template.
  • the object of the present invention is a precise and flexible error concealment for audio signals to create that implemented with limited computational effort can be.
  • This task is accomplished by a method of disguising a Fault according to claim 1 and a device for Disguising an error according to claim 12 solved.
  • Another object of the present invention is a robust and flexible decoding of audio signals to accomplish.
  • This task is accomplished by a method for decoding a encoded audio signal according to claim 10 and by a Device for decoding an encoded audio signal according to Claim 13 solved.
  • the present invention is based on the finding that that the disadvantages of the spectral-value prediction, which in the dependence on the transformation algorithm used and depending on the window shape and block length exist, can be avoided that for Error concealment a prediction is used, which in "Quasi" time range works.
  • a set of spectral values preferably a long block or one Corresponds to the number of short blocks, divided into subbands.
  • a subband of the current set of spectral coefficients can then undergo a backward transformation to obtain a time signal that corresponds to the spectral coefficient of the subband.
  • For generation of estimates for a subsequent set of spectral coefficients is a prediction based on the Time signal of this subband performed.
  • this prediction is in the quasi-time range takes place because the temporal signal on which Basis of which the prediction is made, only that Time signal of a subband of the encoded audio signal and not the time signal of the entire spectrum of the audio signal is.
  • the time signal generated by prediction becomes one Subjected to forward transformation to estimated, i.e. H. predicted Spectral coefficients for the subband of the following Obtain set of spectral coefficients. Now it is found that in the following set of spectral coefficients one or more incorrect spectral coefficients , the incorrect spectral coefficients can be caused by the estimated, d. H. predicted, spectral coefficients be replaced.
  • the inventive method for concealing Errors require less computing effort because of the Grouping of spectral coefficient predictions only for each subband and no longer for each spectral coefficient must be carried out.
  • the invention provides Processes high flexibility because of the properties of the signals to be processed are taken into account can be.
  • noise substitution according to the present invention works especially good for tonal signals.
  • tonal signal components tend to be in the lower frequency range Range of the spectrum of an audio signal occur while the higher-frequency signal components tend to be non-stationary, d. H. are intoxicated.
  • "Noisy signal components” are signal components in the sense of the present description that are not very stationary. These noisy signal components do not necessarily have to have noise in the classic Represent meaning, but only rapidly changing Useful signals.
  • This feature of the present invention compares to a complete transformation of the whole Audio signal in the time domain and a prediction of the whole temporal audio signal from block to block below Using a so-called "long-term" predictor one represents significant advantage, since the advantages according to the invention the prediction in the time domain with the advantages of the spectral Decomposition can be combined.
  • Spectral decomposition only allows properties of the audio signal that are dependent on the frequency. The Number of subbands that are used when dividing the set of Spectral coefficients are generated, can be selected as desired. If only two subbands are selected, the result is already the advantage of considering the tonality in the lower Frequency range of the audio signal.
  • the method according to the invention is particularly suitable good for a combination with an error concealment technique, which is described in DE 197 35 675 A1, those for the substitution of noisy signal components suitable is. If tonal signal components of a missing Blocks obscured by the inventive method, and become noisy signal components through the just mentioned known methods that on an energy similarity between builds substituted data and intact data, combines, so completely failed blocks can almost be inaudibly obscured by a normal listener.
  • Fig. 1 shows a block diagram of a decoder according to one preferred embodiment of the present invention.
  • the decoder block diagram shown in Fig. 1 corresponds basically the MPEG-2 AAC decoder, as in Standard MPEG-2 AAC 13818-7 is set.
  • the encoded audio signal first gets into a bitstream demultiplexer 100 to separate spectral data and side information.
  • the Huffman encoded spectral coefficients are then in a Huffman decoder 200 is input to from the Huffman code words to obtain quantized spectral values.
  • the quantized spectral values are then converted into an inverse Quantizer 300 fed in and then by scale factor band multiplied by corresponding scale factors.
  • the encoder according to the invention can follow the inverse quantizer 300 several other functionalities have, such as B. a middle / side step, a predictor step, a TNS level etc. as specified in the standard.
  • the present Invention comprises the decoder immediately before a synthesis filter bank 400 an error concealer 500, which works according to the invention and ensures that the Effects of transmission errors in the encoded audio signal, which is fed into the bitstream demultiplexer 100 will be alleviated or made completely inaudible can.
  • the error concealer does 500 that transmission errors disguised become, d. H. that they are in a temporal audio signal on Synthesis filter bank output not or only weakly are audible.
  • the error encryption facility 500 also includes a parallel branch, around the input spectral coefficients below Bypassing the reverse transformer 502, the Means for generating estimates 504 and the forward transform means 506 directly from the entrance to To direct output.
  • This parallel branch includes one Time delay stage 510 to ensure that behind forward transformer 506 estimated spectral coefficients for a subsequent block at the same time with "real", possibly faulty Spectral coefficients for the following block on one Error selection facility 512 may be pending incorrect spectral coefficients in the real spectral coefficients for the following block by estimated spectral coefficients to be able to replace for the following block.
  • This spectral value replacement is by a Switch symbol 512 shown in Fig. 2. It was on it indicated that the error replacement device 512 either spectral value or block or block can work. Depending on the requirement, the same can also work sub-band.
  • the error replacement device 512 At the exit of the error replacement device 512 then lies the following set of spectral coefficients in which may have been originally incorrect Spectral coefficients through estimated spectral coefficients have been replaced, d. H. in which errors are obscured.
  • the circuit shown in FIG. 2 is a device upstream for subdivision into subbands.
  • the error replacement device 512 is a device to undo the division into subbands downstream, such that the filter bank 400 (Fig. 1) one "normal" set of spectral coefficients obtained without anything from the previous concealment of errors notice.
  • the error concealment device 500 (FIG. 1) thus includes a plurality of those described with reference to FIG. 2 Circuits, one circuit for each Subband.
  • the parallel circuits are on the input side connected by the partitioning device and on the output side through the undo facility Subdivision as detailed later.
  • FIG. 7 includes a time axis 700, the extent of a long block 702 is shown is.
  • a long block contains 2048 samples, from which 1024 spectral coefficients result if a 50% Window overlap is used as is known. Background information on the modified discrete cosine transformation used (MDCT) and the window overlap itself in the standard already cited.
  • MDCT modified discrete cosine transformation used
  • Fig. 7 are also eight short blocks 704 are drawn, each 256 Samples back to due to the 50% overlap 128 spectral coefficients.
  • the overlap of the short Blocks as well as the overlap of the long block with one preceding long block or with a preceding one or a subsequent start or stop window located.
  • the number of spectral coefficients of a long block equal to eight times the number of spectral coefficients of a short block. In other words, includes long block the same duration of the audio signal as eight short blocks.
  • the backward transformation means 502 via block type line 508 such controlled to have eight consecutive backward transformations of the spectral coefficients in corresponding Sub-bands of short blocks and the the quasi-time signals obtained simply line up in series, around means 504 for generating estimated values to be supplied with a time signal of a certain length.
  • the forward transformation device 506 again eight consecutive forward transformations perform, one after the other, with the values given by the means 504 for generating estimated values serially be issued.
  • this "duty cycle" requires that in the case of short blocks, the same number of spectral coefficients is spent, as in the case of long Blocks.
  • the spectral coefficients generated by the error concealer 500 spent in a "duty cycle" are in the sense of the present invention as Denoted set of estimated spectral coefficients.
  • the number of spectral coefficients corresponds in a set the number of spectral coefficients in a long block and the number of spectral coefficients of eight short blocks. Of course can be any other relationship between long and short block, for example 2, 4 or 16. Usually the situation will be such that the number the spectral coefficients of a long block through the Number of spectral coefficients of a short block divisible is.
  • Case would be the number of a set of spectral coefficients the smallest common multiple of correspond to long and short block, such that independence of the block type at the predictor level, d. H. in the Device 504 for generating estimated values has been reached becomes.
  • Fig. 3 is discussed, which is a preferred one Further development of the error concealment device of Fig. 2.
  • the error concealment device a noise generator 514 extended depending on a prediction gain signal 516 instead of with the forward transformation device 506 the error replacement device via a noise substitution switch 518 can be connected.
  • the Noise Substitution Device 514 works according to that in DE 197 35 675 A1 described method to get noisy signal components in the Approach audio signal. Since it is noisy spectral components is no longer the phase of the spectral coefficients considered, but only the energy several spectral coefficients in a subgroup.
  • the Noise generator 514 generates depending on the Energy in a subset of the most recent ones intact audio data a corresponding subset of Spectral coefficients, the energy in the subgroup the generated spectral coefficients of the energy of the corresponding Subset of the previous spectral coefficients corresponds to or is derived from the same.
  • the phases of spectral coefficients generated in the noise replacement however set at random.
  • Noise substitution switch 518 is provided by a prediction gain signal 516 controlled.
  • the prediction gain relates on the ratio of the output signal of the Means 504 for generating estimates of the input signal. Is it found that the Output signal differs relatively little from the input signal, it can be assumed that the audio signal relatively stationary in this subband, i. H. tonal, is. In contrast, the output signal of the predictor differs very strongly from the input signal, so it can be assumed become that the signal is transient, d. H. atonal or intoxicating. In this case there is a noise replacement deliver better results than a prediction, because noisy Signals per se cannot be reliably predicted can.
  • the noise substitution switch 518 can be controlled such that it is the forward transformation device 506 with the error replacement facility 512 connects when the prediction gain a certain one Threshold exceeds, or that the noise replacement device 514 connected to the error replacement device 512 if the prediction gain falls below this threshold, to optimize both substitution processes combine.
  • a current set of spectral coefficients received (10). 4 is shown assumed for reasons of clarity that the current Set of spectral coefficients only intact Has spectral coefficients or already an error concealment method subjected to Fig. 2 or 3 has been.
  • the current set of spectral coefficients will be processed on the one hand by the filter bank 400 (FIG. 1) and output to a loudspeaker, for example (12). on the other hand becomes the current set of spectral coefficients used a following set of spectral coefficients predict, d. H. to estimate or to predict.
  • a division of the current Set of spectral coefficients performed in subbands (14).
  • the subdivision takes place in subbands in such a way that only one subband per set is generated with a corresponding frequency range.
  • the current set of spectral coefficients a plurality of successive ones complete spectra. Then in the crotch 14 corresponding subbands for each complete spectrum generated, d. H. several per set of spectral coefficients Sub-bands.
  • the prediction 18 takes place in the quasi-time range, i. H. for each subband "time" signal to an estimated subband time signal to get for the following sentence.
  • This esteemed Quasi-time signal then becomes one again Undergone forward transformation 20, the forward transformation for a long block again only once is executed or for short blocks N times, where N is the Relationship between the number of spectral coefficients long blocks to the number of spectral coefficients of a short block.
  • step 20 there are estimated for each subband Spectral coefficients.
  • step 22 the in the subdivision introduced in step 14 is reversed again made such that after step 22 a following sentence of spectral coefficients is present.
  • step 24 the decoder does the following Set of spectral coefficients received.
  • This sentence will error detection 26 to determine if one spectral coefficient, several spectral coefficients or even all spectral coefficients of the following set are incorrect are.
  • the flow chart of Fig. 4 represents a snapshot, so to speak processing a set of spectral coefficients to a next set of spectral coefficients If the flowchart of FIG. 4 is implemented, for example, of course, only one Filter bank 400 (FIG. 1) used to complete steps 12 and 30 perform. Of course, only one will be the same only device for receiving the current set of Spectral coefficients or to receive the following Set of spectral coefficients may be required to obtain the Implement steps 10 and 24.
  • Fig. 5 shows a more detailed representation of the general 2 using the example of an MPEG-2 AAC transform encoder, the fault concealment device according to the invention 500 has.
  • the Error concealment device 500 (FIG. 1) 520 for dividing the blocks of spectral coefficients in preferably 32 subbands.
  • each subband has 32 spectral coefficients.
  • the subbands the short blocks cover the same frequency ranges, in the case of short blocks each subband has 4 Spectral coefficients.
  • Every subband will then an inverse modified discrete cosine transform subjected.
  • the IMDCT runs once and receives 32 input values.
  • eight are consecutive IMDCTs performed, each with 4 of the spectral coefficients, such that there are again 32 quasi-time samples at the output result. These then become the predictor 504 supplied, which in turn estimated 32 quasi-time samples generated, which are transformed using the MDCT 506.
  • a single MDCT with 32 temporal values performed while in the case of short Blocks eight consecutive MDCTS with each 4 samples can be executed.
  • the subbands have different lengths, they are The regulations of the IMDCT and MDCT have been adapted accordingly. For one practical implementation offers a parallel Processing. Of course, there is also one serial processing of the subbands possible in succession, if appropriate storage capacities are provided.
  • the output values of the MDCT 506 for each subband are shown in means 522 for undoing the subdivision, d. H. fed into an inverse subdivision device, um in the case of the preferred embodiment at the AAC-MDCT level an estimated set of spectral values issue.
  • the LMSL predictor 504a is a time delay stage 504b upstream.
  • Predictor 504 includes on the input side also a parallel-serial converter 504c and on the output side a serial-to-parallel converter 504d.
  • the predictor 504 also has a prediction gain calculator 504e, which is the output signal of the predictor 504a compared to the input signal to determine whether a stationary signal or a transient signal has been processed.
  • the prediction profit calculator 504e supplies the prediction gain signal on the output side 516, which is used to control the switch 518 (FIG. 3) is used to either predict spectral coefficients or spectral coefficients obtained by noise substitution to be used for concealing errors.
  • the predictor 504 also includes two in its implementation as an LMSL predictor Switches 504f and 504g, which have two switch positions. The switch position "1" affects the case that spectral coefficients of the following block are correct while the switch position "2" relates to the case that spectral coefficients of the following sentence are incorrect.
  • Fig. 6 shows the case where the spectral coefficients are faulty.
  • the switch is held at 504g of the input signal is a reference signal with a value of 0 fed into the predictor.
  • the output values of the parallel-serial converter fed into the LMSL predictor from below.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Claims (13)

  1. Procédé pour masquer une erreur dans un signal audio codé, le signal audio codé présentant des jeux successifs de coefficients spectraux, un jeu de coefficients spectraux étant une représentation spectrale d'un jeu de valeurs de balayage audio, aux étapes suivantes consistant à :
    subdiviser (14) un jeu actuel de coefficients spectraux en au moins deux sous-bandes à plages de fréquences différentes, une sous-bande des au moins deux sous-bandes présentant au moins deux coefficients spectraux ;
    transformer inversement (16) les coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande ;
    effectuer (18) une prédiction à l'aide de la représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps estimée d'une sous-bande d'un jeu suivant le jeu actuel, la sous-bande du jeu suivant comportant la même plage de fréquences que la sous-bande du jeu actuel ;
    transformer directement (20) la représentation dans le temps estimée, pour obtenir au moins deux coefficients spectraux estimés de la sous-bande du jeu suivant ;
    déterminer (26) si un coefficient spectral de la sous-bande du jeu suivant est erroné ; et
    en réaction à l'étape de détermination, si un coefficient spectral erroné est présent, utiliser (28) un coefficient spectral estimé au lieu d'un coefficient spectral erroné du jeu suivant, pour masquer le coefficient spectral erroné du jeu suivant.
  2. Procédé selon la revendication 1, dans lequel l'une sous-bande traitée à l'étape de transformation inverse (16) présente des coefficients spectraux à basse fréquence, tandis que l'autre des aux moins deux sous-bandes présente des coefficients spectraux à fréquence plus élevée.
  3. Procédé selon la revendication 1 ou 2, dans lequel le nombre de coefficients spectraux dans un jeu de coefficients spectraux est égal au nombre de coefficients spectraux dans un bloc (702) d'une première longueur et est de N fois les coefficients spectraux dans un bloc (704) d'une seconde longueur, et dans lequel se présentent l'un après l'autre N blocs (704) de la seconde longueur,
       l'étape de subdivision (14) étant effectuée de telle sorte que les sous-bandes des blocs à la première longueur comportent les mêmes plages de fréquences que les sous-bandes des blocs à la seconde longueur, de sorte que le nombre de coefficients spectraux d'une sous-bande du bloc à la première longueur est égal à N fois le nombre de coefficients spectraux de la sous-bande correspondante du bloc à la seconde longueur;
       l'étape de transformation inverse (16) étant effectuée successivement pour chaque sous-bande correspondante des N blocs à la seconde longueur, pour obtenir une représentation dans le temps des coefficients spectraux de sous-bandes correspondantes des N blocs à la seconde longueur ;
       l'étape de réalisation (18) d'une prédiction est réalisée avec la représentation dans le temps de toutes les sous-bandes correspondantes des N blocs à la seconde longueur ; et
       l'étape de transformation directe (20) est réalisée successivement pour chaque sous-bande correspondante des N blocs à la seconde longueur.
  4. Procédé selon l'une ou l'autre des revendications précédentes, dans lequel à l'étape de subdivision (14) est générée une pluralité de sous-bandes de telle sorte que toutes les sous-bandes constituent, ensemble, la représentation spectrale du signal audio codé dans un jeu de coefficients spectraux.
  5. Procédé selon l'une des revendications précédentes, dans lequel est réalisée, après l'étape consistant à déterminer (26) si un coefficient spectral d'une sous-bande est erroné, l'étape suivante consistant à :
    déterminer (504e) si le coefficient spectral représente une part tonale du signal audio non codé, sur base d'une comparaison du coefficient spectral avec le coefficient spectral estimé correspondant ;
    si le coefficient spectral est déterminé comme étant tonal, utiliser le coefficient spectral estimé et, si le coefficient spectral est déterminé comme étant non-tonal, effectuer une substitution de bruit (514) pour un coefficient spectral erroné du jeu suivant.
  6. Procédé selon l'une des revendications 3 à 5, dans lequel les coefficients spectraux sont des coefficients MDCT, la longueur d'un jeu correspond à la longueur d'un bloc long et est de 1024 coefficients MDCT, tandis qu'un jeu de coefficients spectraux comporte huit blocs de courte longueur présentant, chacun, 128 coefficients MDCT, et dans lequel sont formées, à l'étape de subdivision, 32 sous-bandes de 32 coefficients MDCT chacune pour un bloc long ou de 4 coefficients MDCT chacune pour un bloc court.
  7. Procédé selon l'une des revendications précédentes, dans lequel est utilisé, à l'étape de réalisation (18) de la prédiction, un prédicteur à couplage réactif adaptatif (504a) qui est, de préférence, un prédicteur LMSL.
  8. Procédé selon l'une des revendications précédentes, dans lequel l'algorithme de transformation sur lequel se base le signal audio codé est le même algorithme de transformation que celui utilisé à l'étape de transformation inverse (16) et à l'étape de transformation directe (20).
  9. Procédé selon l'une des revendications précédentes, dans lequel l'algorithme de transformation utilisé à l'étape de transformation inverse (16) est exactement inverse à l'algorithme de transformation utilisé à l'étape de transformation directe (20).
  10. Procédé pour décoder un signal audio codé présentant des jeux successifs de coefficients spectraux, un jeu de coefficients spectraux étant une représentation spectrale d'un jeu de valeurs de balayage audio :
    recevoir (10) un jeu actuel de coefficients spectraux ;
    subdiviser (14) un jeu actuel de coefficients spectraux en au moins deux sous-bandes à plages de fréquences différentes, une sous-bande des au moins deux sous-bandes présentant au moins deux coefficients spectraux ;
    transformer inversement (16) les coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande ;
    effectuer (18) une prédiction à l'aide de la représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps estimée d'une sous-bande d'un jeu suivant le jeu actuel, la sous-bande du jeu suivant comportant la même plage de fréquences que la sous-bande du jeu actuel ;
    transformer directement (20) la représentation dans le temps estimée, pour obtenir au moins deux coefficients spectraux estimés de la sous-bande du jeu suivant ;
    recevoir (24) un jeu suivant de coefficients spectraux et subdiviser le jeu suivant en sous-bandes comportant la même plage de fréquences que les sous-bandes du jeu actuel ;
    déterminer (26) si un coefficient spectral de la sous-bande du jeu suivant est erroné ;
    en réaction à l'étape de détermination, si un coefficient spectral erroné est présent, utiliser (28) un coefficient spectral estimé au lieu d'un coefficient spectral erroné du jeu suivant, pour masquer le coefficient spectral erroné du jeu suivant ; et
    traiter (30) le jeu suivant en utilisant le coefficient spectral estimé utilisé à l'étape d'utilisation (28), pour obtenir le jeu suivant de valeurs de balayage audio.
  11. Procédé selon la revendication 10, dans lequel les coefficients spectraux du signal audio codé sont codés entropiquement et quantifiés, présentant, avant l'étape de réception (10) du jeu actuel ou du jeu suivant, les étapes suivantes consistant à :
    défaire (200) le codage entropique, pour obtenir des coefficients spectraux quantifiés ;
    requantifier (300) les coefficients spectraux quantifiés, pour obtenir des coefficients spectraux requantifiés ;
    et dans lequel l'étape de traitement présente l'étape suivante consistant à :
    transformer inversement (400) le jeu suivant en utilisant un algorithme de transformation inverse à l'algorithme de transformation qui a été utilisé pour la transformation, pour obtenir les coefficients spectraux du signal audio codé.
  12. Dispositif pour masquer une erreur dans un signal audio codé, le signal audio codé présentant des jeux successifs de coefficients spectraux, un jeu de coefficients spectraux étant une représentation spectrale d'un jeu de valeurs de balayage audio, aux caractéristiques suivantes :
    un dispositif (520) destiné à subdiviser (14) un jeu actuel de coefficients spectraux en au moins deux sous-bandes à plages de fréquences différentes, une sous-bande des au moins deux sous-bandes présentant au moins deux coefficients spectraux ;
    un dispositif (502) destiné à transformer inversement (16) les coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande ;
    un dispositif (504) destiné à effectuer (18) une prédiction à l'aide de la représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps estimée d'une sous-bande d'un jeu suivant le jeu actuel, la sous-bande du jeu suivant comportant la même plage de fréquences que la sous-bande du jeu actuel ;
    un dispositif (506) destiné à transformer directement (20) la représentation dans le temps estimée, pour obtenir au moins deux coefficients spectraux estimés de la sous-bande du jeu suivant ;
    un dispositif destiné à déterminer (26) si un coefficient spectral de la sous-bande du jeu suivant est erroné ; et
    un dispositif (512) destiné à utiliser (28) un coefficient spectral estimé au lieu d'un coefficient spectral erroné du jeu suivant, pour masquer le coefficient spectral erroné du jeu suivant.
  13. Dispositif pour décoder un signal audio codé présentant des jeux successifs de coefficients spectraux, un jeu de coefficients spectraux étant une représentation spectrale d'un jeu de valeurs de balayage audio, aux caractéristiques suivantes :
    un dispositif (100) destiné à recevoir (10) un jeu actuel de coefficients spectraux;
    un dispositif (520) destiné à subdiviser (14) un jeu actuel de coefficients spectraux en au moins deux sous-bandes à plages de fréquences différentes, une sous-bande des au moins deux sous-bandes présentant au moins deux coefficients spectraux ;
    un dispositif (502) destiné à transformer inversement (16) les coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande ;
    un dispositif (504) destiné à effectuer (18) une prédiction à l'aide de la représentation dans le temps des au moins deux coefficients spectraux de l'une sous-bande, pour obtenir une représentation dans le temps estimée d'une sous-bande d'un jeu suivant le jeu actuel, la sous-bande du jeu suivant comportant la même plage de fréquences que la sous-bande du jeu actuel ;
    un dispositif (506) destiné à transformer directement (20) la représentation dans le temps estimée, pour obtenir au moins deux coefficients spectraux estimés de la sous-bande du jeu suivant ;
    un dispositif (502, 510) destiné à recevoir (24) un jeu suivant de coefficients spectraux et à subdiviser le jeu suivant en sous-bandes comportant la même plage de fréquences que les sous-bandes du jeu actuel ;
    un dispositif destiné à déterminer (26) si un coefficient spectral de la sous-bande du jeu suivant est erroné ;
    un dispositif (512) destiné à utiliser (28) un coefficient spectral estimé au lieu d'un coefficient spectral erroné du jeu suivant, pour masquer le coefficient spectral erroné du jeu suivant ; et
    un dispositif destiné à traiter (30) le jeu suivant en utilisant le coefficient spectral estimé, pour obtenir le jeu suivant de valeurs de balayage audio.
EP00926896A 1999-05-07 2000-04-12 Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code Expired - Lifetime EP1145227B1 (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19921122 1999-05-07
DE19921122A DE19921122C1 (de) 1999-05-07 1999-05-07 Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
PCT/EP2000/003294 WO2000068934A1 (fr) 1999-05-07 2000-04-12 Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code

Publications (2)

Publication Number Publication Date
EP1145227A1 EP1145227A1 (fr) 2001-10-17
EP1145227B1 true EP1145227B1 (fr) 2002-07-24

Family

ID=7907325

Family Applications (1)

Application Number Title Priority Date Filing Date
EP00926896A Expired - Lifetime EP1145227B1 (fr) 1999-05-07 2000-04-12 Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code

Country Status (6)

Country Link
US (1) US7003448B1 (fr)
EP (1) EP1145227B1 (fr)
JP (1) JP3623449B2 (fr)
AT (1) ATE221244T1 (fr)
DE (2) DE19921122C1 (fr)
WO (1) WO2000068934A1 (fr)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7315815B1 (en) 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
DE19959038A1 (de) * 1999-12-08 2001-06-28 Bosch Gmbh Robert Verfahren zur Dekodierung von digitalen Audiodaten
EP1199709A1 (fr) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Masquage d'erreur par rapport au décodage de signaux acoustiques codés
US7428684B2 (en) * 2002-04-29 2008-09-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Device and method for concealing an error
DE10219133B4 (de) * 2002-04-29 2007-02-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verschleiern eines Fehlers
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
JP4744438B2 (ja) * 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
WO2006046546A1 (fr) * 2004-10-26 2006-05-04 Matsushita Electric Industrial Co., Ltd. Dispositif de codage de son et méthode de codage de son
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
KR100708123B1 (ko) * 2005-02-04 2007-04-16 삼성전자주식회사 자동으로 오디오 볼륨을 조절하는 방법 및 장치
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
JP2006276877A (ja) * 2006-05-22 2006-10-12 Nec Corp 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置
KR101291193B1 (ko) 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
WO2008067834A1 (fr) * 2006-12-07 2008-06-12 Akg Acoustics Gmbh Masquage de perte pour dispositif multicanaux
US20090048828A1 (en) * 2007-08-15 2009-02-19 University Of Washington Gap interpolation in acoustic signals using coherent demodulation
US8126578B2 (en) * 2007-09-26 2012-02-28 University Of Washington Clipped-waveform repair in acoustic signals using generalized linear prediction
EP2242032B1 (fr) * 2008-01-21 2013-10-02 Nippon Telegraph and Telephone Corporation Système informatique sécurisé, procédé informatique sécurisé, dispositif informatique sécurisé et son programme informatique
WO2010111841A1 (fr) * 2009-04-03 2010-10-07 华为技术有限公司 Procédé et appareil de prédiction pour décodage d'impulsions dans le domaine fréquentiel et décodeur
JP2011257575A (ja) * 2010-06-09 2011-12-22 Cri Middleware Co Ltd 音声処理装置、音声処理方法、プログラムおよび記録媒体
WO2011156905A2 (fr) * 2010-06-17 2011-12-22 Voiceage Corporation Quantification de vecteur algébrique multidébit avec codage supplémentaire de sous-bandes spectrales manquantes
EP2458585B1 (fr) * 2010-11-29 2013-07-17 Nxp B.V. Dissimulation d'erreur pour signaux audio codés de sous-bande
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
EP2676268B1 (fr) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Appareil et procédé permettant de traiter un signal audio décodé dans un domaine spectral
EP2676270B1 (fr) 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codage d'une portion d'un signal audio au moyen d'une détection de transitoire et d'un résultat de qualité
TWI483245B (zh) 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
AU2012217215B2 (en) * 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
TWI610296B (zh) 2011-10-21 2018-01-01 三星電子股份有限公司 訊框錯誤修補裝置及音訊解碼裝置
HUE045991T2 (hu) * 2013-02-05 2020-01-28 Ericsson Telefon Ab L M Hangkeret-elvesztés elrejtése
MY181026A (en) 2013-06-21 2020-12-16 Fraunhofer Ges Forschung Apparatus and method realizing improved concepts for tcx ltp
PL3336840T3 (pl) 2013-10-31 2020-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
PT3285255T (pt) 2013-10-31 2019-08-02 Fraunhofer Ges Forschung Descodificador de áudio e método para fornecer uma informação de áudio descodificada utilizando uma ocultação de erro baseada num sinal de excitação no domínio de tempo
CN107004417B (zh) * 2014-12-09 2021-05-07 杜比国际公司 Mdct域错误掩盖
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
US10803876B2 (en) * 2018-12-21 2020-10-13 Microsoft Technology Licensing, Llc Combined forward and backward extrapolation of lost network data
US10784988B2 (en) 2018-12-21 2020-09-22 Microsoft Technology Licensing, Llc Conditional forward error correction for network data
CN111711493B (zh) * 2020-06-16 2022-03-11 中国电子科技集团公司第三研究所 具有加密解密能力的水下通信设备及发射器和接收器

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
JPH03245370A (ja) 1990-02-22 1991-10-31 Matsushita Electric Ind Co Ltd 音声帯域分割復号化装置
US5455833A (en) * 1990-10-25 1995-10-03 Fraunhofer Gesellschaft Zur Forschung E.V. Process for the detecting of errors in the transmission of frequency-coded digital signals
JPH07123242B2 (ja) 1993-07-06 1995-12-25 日本電気株式会社 音声信号復号化装置
KR970011728B1 (ko) * 1994-12-21 1997-07-14 김광호 음향신호의 에러은닉방법 및 그 장치
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
DE19735675C2 (de) * 1997-04-23 2002-12-12 Fraunhofer Ges Forschung Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom
AU4190200A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A frequency domain interpolative speech codec system

Also Published As

Publication number Publication date
ATE221244T1 (de) 2002-08-15
EP1145227A1 (fr) 2001-10-17
JP2002544550A (ja) 2002-12-24
JP3623449B2 (ja) 2005-02-23
DE50000306D1 (de) 2002-08-29
DE19921122C1 (de) 2001-01-25
US7003448B1 (en) 2006-02-21
WO2000068934A1 (fr) 2000-11-16

Similar Documents

Publication Publication Date Title
EP1145227B1 (fr) Procede et dispositif pour masquer une erreur dans un signal audio code, et procede et dispositif de decodage d'un signal audio code
EP0954909B1 (fr) Procede de codage d'un signal audio
DE19747132C2 (de) Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE602004005197T2 (de) Vorrichtung und verfahren zum kodieren eines audiosignals und vorrichtung und verfahren zum dekodieren eines kodierten audiosignals
EP1697930B1 (fr) Dispositif et procede pour traiter un signal multicanal
DE69923555T2 (de) Verfahren und vorrichtung zur entropie-kodierung von quantisierten transformationskoeffizienten eines signals
EP1230827B1 (fr) Procede et dispositif pour traiter un signal audio stereo
EP1953739B1 (fr) Procédé et dispositif pour réduire le bruit dans un signal décodé
WO1999004505A1 (fr) Procede de signalisation d'une substitution de bruit lors du codage d'un signal audio
EP0978172B1 (fr) Procede de masquage des erreurs dans un courant de donnees audio
DE102006051673A1 (de) Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
EP1023777B1 (fr) Procede et dispositif pour limiter un courant de donnees audio dont le debit binaire peut etre mis a l'echelle
DE102007029381A1 (de) Digitalsignal-Verarbeitungsvorrichtung, Digitalsignal-Verarbeitungsverfahren, Digitalsignal-Verarbeitungsprogramm, Digitalsignal-Wiedergabevorrichtung und Digitalsignal-Wiedergabeverfahren
DE102004009949A1 (de) Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
DE19742201C1 (de) Verfahren und Vorrichtung zum Codieren von Audiosignalen
DE112008003153B4 (de) Frequenzband-Bestimmungsverfahren zum Formen von Quantisierungsrauschen
DE10065363B4 (de) Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals
DE3733786C2 (fr)
DE19735675A1 (de) Verfahren zum Verschleiern von Fehlern in einem Audiodatenstrom
DE102005032079A1 (de) Verfahren und Vorrichtung zur Geräuschunterdrückung

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20010730

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAG Despatch of communication of intention to grant

Free format text: ORIGINAL CODE: EPIDOS AGRA

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

17Q First examination report despatched

Effective date: 20011228

GRAH Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOS IGRA

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AT CH DE FR GB LI NL

AX Request for extension of the european patent

Free format text: AL;LT;LV;MK;RO;SI

REF Corresponds to:

Ref document number: 221244

Country of ref document: AT

Date of ref document: 20020815

Kind code of ref document: T

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: GERMAN

REF Corresponds to:

Ref document number: 50000306

Country of ref document: DE

Date of ref document: 20020829

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 20020813

ET Fr: translation filed
LTIE Lt: invalidation of european patent or patent extension

Effective date: 20020724

REG Reference to a national code

Ref country code: IE

Ref legal event code: FD4D

Ref document number: 1145227E

Country of ref document: IE

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20030425

REG Reference to a national code

Ref country code: CH

Ref legal event code: PFA

Owner name: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWA

Free format text: FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V.#LEONRODSTRASSE 54#80636 MUENCHEN (DE) -TRANSFER TO- FRAUNHOFER-GESELLSCHAFT ZUR FOERDERUNG DER ANGEWANDTEN FORSCHUNG E.V.#HANSASTRASSE 27 C#80686 MUENCHEN (DE)

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 17

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 18

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 19

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: NL

Payment date: 20190418

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20190418

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20190423

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CH

Payment date: 20190424

Year of fee payment: 20

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20190424

Year of fee payment: 20

Ref country code: AT

Payment date: 20190416

Year of fee payment: 20

REG Reference to a national code

Ref country code: DE

Ref legal event code: R071

Ref document number: 50000306

Country of ref document: DE

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

Ref country code: NL

Ref legal event code: MK

Effective date: 20200411

REG Reference to a national code

Ref country code: GB

Ref legal event code: PE20

Expiry date: 20200411

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK07

Ref document number: 221244

Country of ref document: AT

Kind code of ref document: T

Effective date: 20200412

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION

Effective date: 20200411