EP2515300B1 - Method and system for noise reduction - Google Patents

Method and system for noise reduction Download PDF

Info

Publication number
EP2515300B1
EP2515300B1 EP20120163679 EP12163679A EP2515300B1 EP 2515300 B1 EP2515300 B1 EP 2515300B1 EP 20120163679 EP20120163679 EP 20120163679 EP 12163679 A EP12163679 A EP 12163679A EP 2515300 B1 EP2515300 B1 EP 2515300B1
Authority
EP
European Patent Office
Prior art keywords
signal
module
output
sub
denoised
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Not-in-force
Application number
EP20120163679
Other languages
German (de)
French (fr)
Other versions
EP2515300A1 (en
Inventor
Pascal Saguin
Karim Maouche
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adeunis RF SA
Original Assignee
Adeunis RF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Adeunis RF SA filed Critical Adeunis RF SA
Publication of EP2515300A1 publication Critical patent/EP2515300A1/en
Application granted granted Critical
Publication of EP2515300B1 publication Critical patent/EP2515300B1/en
Not-in-force legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Definitions

  • the present invention relates to a noise reduction method and an associated noise reduction system.
  • It relates more particularly to a method and a system for reducing noise on a noisy acoustic signal y (t) from a microphone operating in a noisy environment.
  • the present invention finds particular application in full-duplex, wireless and mono-sensor audio communication systems, in other words mono-microphone, which make it possible to establish audio communication between several users, in an autonomous manner (ie ie without connection to a transmission base or to a network) and which is easy to use (that is to say not requiring any intervention of a technician to establish the communication).
  • Such communication systems are generally used in a noisy environment, such as a marine environment or a theater, or extremely noisy, such as a construction site or a hall or stadium hosting a sporting event.
  • the object of the present invention is to propose a method according to claim 1 and a system according to claim 10 for noise reduction adapted to highly noisy environments and where the noise component is strongly non-stationary and evolves relatively rapidly over time.
  • this example proposes to implement a multi-band spectral subtraction algorithm "SSMB" which consists of sharing the entire spectral band in sub-bands and to adapt in each subband the subtraction calculation between the noisy signal Y k, l and the noise component D k, 1 for extracting an output denoised signal SD k, l ; applying the spectral subtraction operation in each sub-band to improve the sensitivity of the noise reduction method.
  • SSMB multi-band spectral subtraction algorithm
  • step a the extraction of the phase ⁇ k, 1 , of the noisy signal Y k, 1 is optional. It is indeed possible, during step e), to determine the output denoised signal SD k, l from the square modules
  • the so-called "MCRA" method uses the following principle: on a finite horizon window and for a given frequency, the minimum of the power spectral density (DSP) of the noisy signal Y k, l corresponds to the value of the spectral density of power (DSP) of the noise component D k, l .
  • DSP power spectral density
  • Such an algorithm is particularly advantageous since it takes into account the value of the signal-to-noise ratio SNR k, l, i specific to each sub-band SB i to perform the spectral subtraction in each sub-band.
  • the implementation of this multi-band spectral subtraction algorithm "SSMB" allows processing with different parameters depending on the sub-band where the 'We are.
  • the noise component can be reduced more significantly in a sub-band if it is more dominant, unlike a full-band subtraction algorithm that will reduce noise equally all the sub-bands of the spectrum and will therefore be less precise and therefore less effective.
  • ⁇ c1 , ⁇ c2 , ⁇ c3 and ⁇ c4 are predetermined constants
  • SNR 1 and SNR 2 are predetermined thresholds.
  • ⁇ c1 , ⁇ c2 , ⁇ c3 and ⁇ c4 and SNR 1 and SNR 2 are chosen experimentally, in particular by numerical simulation.
  • SNR 1 - 5 dB
  • SNR 2 20 dB
  • ⁇ vs ⁇ 1 5
  • ⁇ vs ⁇ 2 4
  • ⁇ vs ⁇ 3 - 0.15
  • ⁇ vs ⁇ 4 1
  • step e) consists in determining the denoised signal X k, 1 from the square modules
  • 2 debruitées components of sub-band X k, l, i , and optionally phases ⁇ k, l extracted in step a), so that the output unedited signal SD k, l corresponds to the denoised signal X k , l , ie SD k, l X k, l .
  • the output unedited signal SD k, 1 corresponds to the denoised signal X k, l whose square modules
  • 2 are directly derived from step d) implementing the multi-band spectral subtraction algorithm "SSMB".
  • the processed signal i.e., the denoised signal X k, l
  • the processed signal may suffer in terms of the quality and intelligibility of a distortion problem.
  • This distortion whose origin is usually the noise reduction process, depends on the parameters of noise reduction algorithms ("MCRA” and "SSMB” algorithms) but also on the level and type of noise component to be reduced.
  • step d) implementing the multi-band spectral subtraction algorithm "SSMB"
  • a step of reinjection of the noisy signal Y k , l from the microphone is carried out.
  • the denoised signal X k, l this reinjection being controlled by the amplification coefficient (otherwise called attenuation parameter) chosen very low, of the order of a few percent.
  • the reinjected signal corresponds to the signal ⁇
  • the step f.2) involves reconstructing the voice signal output denoised sd (t) only from the Sd output signals from the the step f.1), these output signals Sd l corresponding to the inverse Fourier transforms of the output denoised signal SD k, l specific to each time frame I.
  • the speech output speech signal sd (t) is reconstructed from the only output signals Sd I from step f.1).
  • This second embodiment allows somehow the deactivation of steps b), c) and d) noise reduction when the noise is not present. As a result, the distortions that can be brought about by the noise reduction processing, in this situation of absence or near absence of noise, will be eliminated.
  • This OLA overlap and add method is a typical time reconstruction method that uses juxtaposed weighting windows (ie overlapping or overlapping windows). then who Adds the output signals taking into account the overlap of the time frames.
  • the system implements a step of reinjection of a very small part of the noisy signal Y k, 1 coming from the microphone into the denoised signal X k, 1 to remedy at least in part the distortion problems induced by the estimation modules "MCRA” and "SSMB".
  • the system 1 comprises a conversion unit 2 of the noisy acoustic signal y (t) in the time domain into a noisy signal Y k, 1 in the frequency domain.
  • This conversion unit 2 comprises a switching module 21 of the noisy acoustic signal y (t) in sampled signals y 1 in successive time frames I.
  • the noisy acoustic signal y (t) is cut into frames of 240 samples, which at a sampling frequency of 8 kHz corresponds to time frames of 30 milliseconds.
  • the successive time frames overlap or overlap.
  • successive time frames overlap on 120 samples, which corresponds to fifty percent (50%) of overlap.
  • This overlap of the time frames is intended to allow the implementation of a method of recovery and addition called "OLA", which allows the initial temporal division of the noisy acoustic signal y (t) then the final restitution at the output of the system 1 in the time domain.
  • OVA a method of recovery and addition
  • This conversion unit 2 comprises, at the output of the chopper module 21, a windowing module 22 of the sampled signals y 1 by application of a weighting window, in particular of the Hanning window or Hamming window type, in order to output weighted sampled signals ⁇ y 1 ⁇ .
  • a weighting window in particular of the Hanning window or Hamming window type
  • time frames are then apodized with a weighting window, before applying a Fourier transform, in order to to minimize the edge effects due to the blanking cut performed by the cutting module 21.
  • This conversion unit 2 comprises, at the output of the windowing module 22, a calculation module 23 of a discrete Fourier transform which outputs the noisy signal Y k, l .
  • the switching module 21 receives as input the noisy acoustic signal y (t) and outputs the sampled signal y 1 , where I is the time index (or index of the time frame).
  • the calculation of the Discrete Fourier Transform is for example carried out by a Fast Fourier Transform (FFT) calculation with a size N which can be equal to 256 (N corresponds to the number of points of the Fourier transform).
  • FFT Fast Fourier Transform
  • the system 1 comprises, at the output of the conversion unit 2, a digital processing unit 3 in the frequency domain which carries out denoising or speech enhancement processing on the noisy signal Y k, l .
  • This digital processing unit 3 comprises a first extraction module 31 of the square module
  • this digital processing unit 3 comprises a second extraction module 32 of the phase ⁇ k, 1 of the noisy signal Y k, l . As detailed later, it is also conceivable to dispense with this second extraction module 32.
  • the digital processing unit 3 comprises, at the output of the first extraction module 31, an estimation module 33, called "MCRA", of a noise component D k, 1 contained in the noisy signal Y k, l from the square module
  • MCRA estimation module 33
  • the estimation module "MCRA” 33 thus outputs the noise component D k, l .
  • the frequency band can for example be divided into three frequency sub-bands, namely SB 1 for f i ⁇ 1000 Hz, SB 2 for 1000 Hz ⁇ f i ⁇ 2000 Hz and finally SB 3 for f i > 2000 Hz, where f i is the subband frequency.
  • the digital processing unit 3 comprises, at the output of the estimation module "MCRA” 33 and the module of division 34 of the frequency band, an estimation module 35, called “SSMB", of the square module
  • the principle of the multi-band spectral subtraction algorithm proceeds from a generalization of the spectral subtraction algorithm which consists in subtracting from the spectral power density of the noisy signal Y k, l coming from the microphone a portion of the spectral power density of the noise component estimated by the "MCRA" method.
  • This multi-band spectral subtraction algorithm is combined with the so-called OLA overlay and addition method.
  • ⁇ i ⁇ ⁇ vs ⁇ 1 if SNR k , l , i ⁇ SNR 1 ⁇ vs ⁇ 2 + ⁇ vs ⁇ 3 ⁇ SNR k , l , i if SNR 1 ⁇ SNR k , l , i ⁇ SNR 2 ⁇ vs ⁇ 4 if SNR k , l , i > SNR 2
  • ⁇ c1 , ⁇ c2 , ⁇ c3 and ⁇ c4 are predetermined constants
  • SNR 1 and SNR 2 are the predetermined thresholds.
  • ⁇ i ⁇ 5 if SNR k , l , i ⁇ - 5 4 - 3 20 ⁇ SNR k , l , i if - 5 ⁇ SNR k , l , i ⁇ 20 1 if SNR k , l , i > 20
  • ⁇ i ⁇ 1 if f i ⁇ 1000 first sub - bandaged SB 1 2.75 if 1000 ⁇ f i ⁇ 2000 second sub - bandaged SB 2 1.75 if f i > 2000 third sub - bandaged SB 3
  • the digital processing unit 3 also comprises, at the output of the estimation module "SSMB" 35 and the second extraction module 32, a module 36 for determining an output denoised signal SD k, l from the modules square
  • the system 1 implements a step of reinjection of a very small part of the noisy signal Y k , 1 , coming from the microphone, into the denoised signal X k, l ; the reinjected signal corresponding to the amplified signal ⁇
  • the distortion problems introduced by the "MCRA” 33 and "SSMB” estimation modules 35 are remedied.
  • the system 1 comprises, at the output of the digital processing unit 3, a conversion unit 4 in the time domain.
  • This conversion unit 4 comprises a calculation module 41 of an output signal Sd 1 specific to each time frame I by the application of an inverse Fourier transform of the output denoised signal SD k, l .
  • IFFT inverse fast Fourier Transform
  • This conversion unit 4 comprises, at the output of the calculation module 41, a reconstruction module 42 of a speech output signal sd (t) in the time domain from the output signals Sd 1 .
  • the time frame of the output denoised signal SD k, 1 passes through the calculation module 41 of the inverse Fourier transform, then its first half (N / 2 first sampling points). is added with the second half (N / 2 last sampling points) saved from the previous frame, while its second half (N / 2 first sampling points) is saved for the next block.
  • N / 2 which is equal to 128, being reminded that the recovery rate of two successive frames is fifty percent (50%).
  • the system 1 does not include the second extraction module 32 of the phase ⁇ k, 1 of the noisy signal Y k, l .
  • the recombination sub-module 362 of the de-banded components of sub-band X k, l, i calculates the denoised signal X k, l from the modules
  • System 1 of the figure 3 is a variant of the system 1 of the figure 2 without the second extraction module 32, but it is of course also conceivable to provide for the removal of the second extraction module 32 in the system 1 of the figure 1 .

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Description

La présente invention se rapporte à un procédé de réduction du bruit et à un système de réduction du bruit associé.The present invention relates to a noise reduction method and an associated noise reduction system.

Elle se rapporte plus particulièrement à un procédé et à un système de réduction du bruit sur un signal acoustique bruité y(t) issu d'un microphone opérant dans un milieu bruité.It relates more particularly to a method and a system for reducing noise on a noisy acoustic signal y (t) from a microphone operating in a noisy environment.

La présente invention trouve une application particulière dans les systèmes de communication audio full-duplex, sans fils et mono-capteur, autrement dit mono-microphone, qui permettent d'établir une communication audio entre plusieurs utilisateurs, de manière autonome (c'est-à-dire sans raccordement à une base de transmission ou à un réseau) et qui soit simple d'utilisation (c'est-à-dire ne nécessitant aucune intervention d'un technicien pour établir la communication).The present invention finds particular application in full-duplex, wireless and mono-sensor audio communication systems, in other words mono-microphone, which make it possible to establish audio communication between several users, in an autonomous manner (ie ie without connection to a transmission base or to a network) and which is easy to use (that is to say not requiring any intervention of a technician to establish the communication).

De tels systèmes de communication sont généralement employés dans un environnement bruité, comme par exemple un milieu marin ou une salle de spectacle, voire extrêmement bruité, comme par exemple un chantier de travaux publics ou une salle ou stade accueillant un évènement sportif.Such communication systems are generally used in a noisy environment, such as a marine environment or a theater, or extremely noisy, such as a construction site or a hall or stadium hosting a sporting event.

Ainsi, il est nécessaire, voire indispensable, de prévoir un procédé et/ou système de réduction du bruit (ou de rehaussement de parole) dans la chaîne de traitement du signal afin d'améliorer la qualité audio pour que la conversation soit audible entre les utilisateurs des systèmes de communication, autrement dit que la communication soit compréhensible.Thus, it is necessary, if not essential, to provide a method and / or system for noise reduction (or speech enhancement) in the signal processing chain in order to improve the audio quality so that the conversation is audible between the speakers. users of communication systems, in other words that the communication is understandable.

Il est connu d'estimer la composante de bruit contenue dans le signal bruité par un algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon une méthode de moyennage récursif des minima contrôlés dite « MCRA » pour « Minima Controlled Recursive Averaging ».It is known to estimate the noise component contained in the noisy signal by an algorithm for estimating the power spectral density of the noise component according to a recursive averaging method of the controlled minima known as "MCRA" for "Minima Controlled Recursive" Averaging ".

Cette méthode d'estimation du bruit dite « MCRA » est connue de la littérature scientifique, notamment des articles suivants :

  • « Speech enhancement for non-stationary noise environments », par I. Cohen et B. Berdugo, Signal Processing, 2001, vol.81 , pp. 2403-2418 ;
  • « Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement », par I. Cohen et B. Berdugo, IEEE Signal Processing Letters, Janvier 2002, vol. 9, No.1, pp. 12-15 ;
This so-called "MCRA" noise estimation method is known from the scientific literature, including the following articles:
  • "Speech enhancement for non-stationary noise environments", by I. Cohen and B. Berdugo, Signal Processing, 2001, vol.81, pp. 2403-2418 ;
  • "Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement", by I. Cohen and B. Berdugo, IEEE Signal Processing Letters, January 2002, vol. 9, No.1, pp. 12-15 ;

« A Modified Spectral Subtraction Method For Speech Enhancement Based on Masking Property of Human Auditory System », par X. Bing-Yin et al, Wireless Communications & Signals Processing, International Conference on IEEE, 13 novembre 2009, pp. 1-5 , XP031594664. "A Modified Spectral Subtraction Method for Speech Enhancement Based on the Masking Property of Human Auditory System," by X. Bing-Yin et al, Wireless Communications & Signal Processing, International Conference on IEEE, November 13, 2009, pp. 1-5 , XP031594664.

La méthode d'estimation du bruit dite « MCRA » est ainsi particulièrement bien adaptée dans les environnements où le signal de bruit est fortement non-stationnaire et évolue relativement rapidement dans le temps.The so-called "MCRA" noise estimation method is thus particularly well suited in environments where the noise signal is highly non-stationary and evolves relatively rapidly over time.

L'état de la technique peut également être illustré par l'enseignement de l'article « Multi-band Spectral Subraction for Enhancing Speech Corrupted by Colored Noise », 2002 IEEE International Conference on Acoustics, Speech And Signal Processing. Proceedings (Car. NO.02CH37334), vol.4, 2002 . Cet article divulgue une méthode de soustraction spectrale multi-bandes.The state of the art can also be illustrated by teaching the article "Multi-band Spectral Subraction for Enhancing Speech Corrupted by Colored Noise", 2002 IEEE International Conference on Acoustics, Speech and Signal Processing. Proceedings (Car NO.02CH37334), vol.4, 2002 . This article discloses a multiband spectral subtraction method.

Un autre état de la technique publié dans « A Multi-Band Spectral Subtraction Method for Enhancing Speech Corrupted by Colored Noise», par S.D. Kamath et P.C. Loizou, Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, Vol.4 , décrit une méthode de soustraction spectrale à décomposition multi-bandes tenant compte des effets de bruit coloré à différentes fréquences.Another state of the art published in "A Multi-Band Spectral Subtraction Method for Enhancing Speech Corrupted by Colored Noise," by SD Kamath and PC Loizou, Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing, 2002, Vol.4 , describes a multi-band decomposition spectral subtraction method taking into account the effects of colored noise at different frequencies.

La présente invention a pour but de proposer un procédé selon la revendication 1 et un système selon la revendication 10 de réduction du bruit adapté à des environnements fortement bruités et où la composante de bruit est fortement non-stationnaire et évolue relativement rapidement dans le temps.The object of the present invention is to propose a method according to claim 1 and a system according to claim 10 for noise reduction adapted to highly noisy environments and where the noise component is strongly non-stationary and evolves relatively rapidly over time.

A titre d'exemple, un procédé de réduction du bruit sur un signal acoustique bruité y(t) issu d'un microphone, de préférence unique, opérant dans un milieu bruité, comporte les étapes successives suivantes :

  1. a) conversion du signal acoustique bruité y(t) dans le domaine temporel en un signal bruité Yk,l dans le domaine fréquentiel, par découpage temporel du signal acoustique bruité y(t) en signaux échantillonnés yl dans des trames temporelles I successives, fenêtrage des signaux échantillonnés yl par application d'une fenêtre de pondération, et application d'une transformée de Fourier discrète, avec extraction du module carré |Yk,l|2, et éventuellement de la phase θk,l, du signal bruité Yk,l ;
  2. b) estimation d'une composante de bruit D̂k,l contenue dans le signal bruité Yk,l à partir du module carré |Yk,l|2, par un algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon une méthode de moyennage récursif des minima contrôlés dite « MCRA » ;
    ledit procédé étant remarquable en ce qu'il comprend en outre, après l'étape b), les étapes successives suivantes :
  3. c) découpage de la bande fréquentielle en plusieurs sous-bandes fréquentielles SBi=[ei, bi], suivie d'une décomposition multi-bandes du module carré |Yk,l|2 et de la composante de bruit D̂k,l, consistant à décomposer le module carré |Yk,l|2 et la composante de bruit D̂k,l en respectivement plusieurs modules carré de sous-bande |Yk,l,i|2 et plusieurs composantes de bruit de sous-bande D̂k,l,i propres à chacune des sous-bandes SBi ;
  4. d) estimation, pour chacune des sous-bandes SBi, du module carré |X̂k,l,i|2 d'une composante débruitée de sous-bande X̂k,l,i propre à chaque sous-bande SBi d'un signal débruité X̂k,l, par un algorithme de soustraction spectrale multi-bandes dit « SSMB » à partir des modules carrés de sous-bande |Yk,l,i|2 et des composantes de bruit de sous-bande D̂k,l,i ;
  5. e) détermination d'un signal débruité de sortie SDk,l à partir des modules carré |X̂k,l,i|2 issus de l'étape d), et éventuellement des phases θ k,l extraites lors de l'étape a) ;
  6. f) conversion du signal débruité de sortie SDk,l en un signal vocal débruité de sortie sd(t) dans le domaine temporel, par une étape f.1) de calcul d'un signal échantillonné de sortie Sdl propre à chaque trame temporelle I pair application d'une transformée de Fourier inverse du signal débruité de sortie SDk,l, suivie d'une étape f.2) de reconstruction temporelle du signal vocal débruité de sortie sd(t) à partir des signaux échantillonnés de sortie Sdl.
For example, a method for reducing noise on a noisy acoustic signal y (t) from a microphone, preferably a single microphone, operating in a noisy medium, comprises the following successive steps:
  1. a) converting the noisy acoustic signal y (t) in the time domain into a noisy signal Y k, 1 in the frequency domain, by time division of the noisy acoustic signal y (t) into sampled signals y 1 in successive time frames I , windowing of sampled signals y l by applying a weighting window, and applying a discrete Fourier transform, with extraction of the squared modulus | Y k, l | 2 , and possibly of the phase θ k, 1 , of the noisy signal Y k, 1 ;
  2. b) estimating a noise component D k, 1 contained in the noisy signal Y k, 1 from the square module | Y k, l | 2 , by an algorithm for estimating the spectral power density of the noise component according to a method of recursive averaging of the controlled minima known as "MCRA";
    said method being remarkable in that it further comprises, after step b), the following successive steps:
  3. c) division of the frequency band into several frequency sub-bands SB i = [e i , b i ], followed by a multi-band decomposition of the module square | Y k, l | 2 and the noise component D k, 1 , consisting in breaking down the square module | Y k, l | 2 and the noise component D k, l respectively at several square subband modules | Y k, l, i | 2 and a plurality of subband noise components D k, l, i specific to each of the subbands SB i ;
  4. d) estimating, for each of the subbands SB i , the square module | X k, l, i | 2 of a denoised component of subband X k, l, i specific to each subband SB i of a denoised signal X k, 1 , by a multiband spectral subtraction algorithm called "SSMB" from square subband modules | Y k, l, i | 2 and subband noise components D k, l, i ;
  5. e) determining an output denoised signal SD k, l from the square modules | X k, l, i | 2 from step d), and optionally phases θ k, l extracted during step a);
  6. f) converting the output denoised signal SD k, l into an output speech output signal sd (t) in the time domain, by a step f.1) of calculating a sampled output signal Sd l specific to each frame temporal I pair application of an inverse Fourier transform of the output denoised signal SD k, l , followed by a step f.2) of temporal reconstruction of the output unfracked speech signal sd (t) from the output sampled signals Sd l .

Ainsi, cet exemple propose de mettre en oeuvre un algorithme de soustraction spectrale multi-bandes « SSMB » qui consiste à partager la bande spectrale entière en sous bandes et à adapter dans chaque sous bande le calcul de soustraction entre le signal bruité Yk,l et la composante de bruit D̂k,l pour extraire un signal débruité de sortie SDk,l ; appliquer l'opération de soustraction spectrale dans chaque sous-bande permettant d'améliorer la sensibilité du procédé de réduction du bruit.Thus, this example proposes to implement a multi-band spectral subtraction algorithm "SSMB" which consists of sharing the entire spectral band in sub-bands and to adapt in each subband the subtraction calculation between the noisy signal Y k, l and the noise component D k, 1 for extracting an output denoised signal SD k, l ; applying the spectral subtraction operation in each sub-band to improve the sensitivity of the noise reduction method.

Les simulations avec ce procédé qui combine les algorithmes « MCRA » et « SSMB » démontrent une nette amélioration de la qualité audio du signal bruité traité. Pour un large éventail de bruits, le résultat s'avère largement supérieur aux procédés classiques.Simulations with this method that combines the "MCRA" and "SSMB" algorithms demonstrate a marked improvement in the audio quality of the processed noisy signal. For a wide range of noises, the result is far superior to conventional methods.

Lors de l'étape a), l'extraction de la phase θk,l, du signal bruité Yk,l est optionnelle. Il est en effet envisageable, lors de l'étape e), de déterminer le signal débruité de sortie SDk,l à partir des modules carré |X̂k,l,i|2 et du signal bruité Yk,l sans avoir à calculer en préalable sa phase.During step a), the extraction of the phase θ k, 1 , of the noisy signal Y k, 1 is optional. It is indeed possible, during step e), to determine the output denoised signal SD k, l from the square modules | X k, l, i | 2 and the noisy signal Y k, l without having to calculate its phase beforehand.

Selon une caractéristique, l'algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon la méthode de moyennage récursif des minimas contrôlés dite « MCRA » lors de l'étape b) met en oeuvre les phases de calcul suivantes :

  1. b.1) calcul d'une composante bruitée filtrée Sk,l répondant à l'équation : S k , l = α s S k , l - 1 + 1 - α s Y k , l 2
    Figure imgb0001

    où αs est une constante prédéterminée caractéristique d'un filtre passe-bas ;
  2. b.2) calcul d'une densité de probabilité de présence de parole p̃k,l par la mise en oeuvre du calcul progressif suivant :
    1. (i) calcul d'une composante minimale spectrale Smink,l avec :
      • si rem(k,1) = 0
        alors Smink,l = min (Smink,l-1 ; Sk,l) et Stmpk,l = Sk,l
      • si rem(k,1) ≠ 0
        alors Smink,l = min (Stmpk,l-1 ; Sk,l) et
        Stmpk,l = min (Stmpk,l-1 ; Sk,l)
        où rem(k,l) est le reste de la division entière de k par I, puis
    2. (ii) calcul d'un rapport spectral Srk,l répondant à l'équation : Sr k , l = S k , l Smin k , l
      Figure imgb0002
    3. (iii) calcul d'une variable indicatrice Ik,l avec :
      • si Srk,l > δTH alors Ik,l = 1
      • si Srk,l ≤ δTH alors Ik,l = 0
        où δTH est un paramètre prédéterminé de seuil fixe de détection de parole ;
    4. (iv) calcul de la densité de probabilité de présence de parole p̃k.l avec : p ˜ k , l = α p p ˜ k , l - 1 + 1 - α p I k , l
      Figure imgb0003

      où αp est une constante prédéterminée ;
  3. b.3) calcul d'un coefficient α̃k,l répondant à l'équation suivante : α ˜ k , l = α + 1 - α p ˜ k , l ,
    Figure imgb0004

    où α est une constante prédéterminée ;
  4. b.4) calcul de la composante de bruit D̂k,l répondant à l'équation suivante : D ^ k , l = α ˜ k , l D ^ k , l - 1 + 1 - α ˜ k , l Y k , l 2 .
    Figure imgb0005
According to one characteristic, the algorithm for estimating the power spectral density of the noise component according to the method of recursive averaging of the controlled minima known as "MCRA" during step b) implements the following calculation phases:
  1. b.1) calculating a filtered noise component S k, l corresponding to the equation: S k , l = α s S k , l - 1 + 1 - α s Y k , l 2
    Figure imgb0001

    where α s is a predetermined constant characteristic of a low-pass filter;
  2. b.2) calculating a probability density of presence of speech p k, 1 by the implementation of the following progressive calculation:
    1. (i) calculating a minimum spectral component Smin k, 1 with:
      • if rem (k, 1) = 0
        then Smin k, l = min (Smin k, l-1 ; S k, l ) and Stmp k, l = S k, l
      • if rem (k, 1) ≠ 0
        then Smin k, l = min (Stmp k, l-1 ; S k, l ) and
        Stmp k, l = min (Stmp k, l-1 ; S k, l )
        where rem (k, l) is the remainder of the integer division of k by I, then
    2. (ii) calculating a spectral ratio Sr k, l corresponding to the equation: Sr k , l = S k , l Smin k , l
      Figure imgb0002
    3. (iii) calculating an indicator variable I k, l with:
      • if Sr k, l > δ TH then I k, l = 1
      • if Sr k, l ≤ δ TH then I k, l = 0
        where δ TH is a predetermined parameter of fixed threshold of speech detection;
    4. (iv) calculating the probability density of speech presence p kl with: p ~ k , l = α p p ~ k , l - 1 + 1 - α p I k , l
      Figure imgb0003

      where α p is a predetermined constant;
  3. b.3) calculating a coefficient α k, l corresponding to the following equation: α ~ k , l = α + 1 - α p ~ k , l ,
    Figure imgb0004

    where α is a predetermined constant;
  4. b.4) calculating the noise component D k, l corresponding to the following equation: D ^ k , l = α ~ k , l D ^ k , l - 1 + 1 - α ~ k , l Y k , l 2 .
    Figure imgb0005

La méthode dite « MCRA » utilise le principe suivant : sur une fenêtre à horizon fini et pour une fréquence donnée, le minimum de la densité spectrale de puissance (DSP) du signal bruité Yk,l correspond à la valeur de la densité spectrale de puissance (DSP) de la composante de bruit D̂k,l. Ainsi, une estimation des différentes valeurs minimales du spectre sur une fenêtre glissante permet d'obtenir une estimation de la densité spectrale de puissance (DSP) de la composante de bruit D̂k,l.The so-called "MCRA" method uses the following principle: on a finite horizon window and for a given frequency, the minimum of the power spectral density (DSP) of the noisy signal Y k, l corresponds to the value of the spectral density of power (DSP) of the noise component D k, l . Thus, an estimation of the different minimum values of the spectrum on a sliding window makes it possible to obtain an estimate of the power spectral density (DSP) of the noise component D k, l .

Selon une autre caractéristique, l'algorithme de soustraction spectrale multi-bande dit « SSMB » de l'étape d) met en oeuvre les phases de calcul suivantes, pour chacune des sous-bandes SBi :

  1. d.1) calcul d'un rapport signal à bruit SNRk,l,i propre à chaque sous-bande SBi répondant à l'équation : SNR k , l , i = 10. log 10 k = ei bi Y k , l , i 2 k = ei bi D ^ k , l , i
    Figure imgb0006
  2. d.2) calcul du module carré |X̂k,l,i|2 de la composante débruitée de sous-bande X̂k,l,i propre à chaque sous-bande SBi, selon l'équation : X ^ k , l , i 2 = { Y k , l , i 2 - α i δ i D ^ k , l , i si Y k , l , i 2 > α i δ i D ^ k , l , i β Y k , l , i 2 si Y k , l , i 2 α i δ i D ^ k , l , i
    Figure imgb0007

    où - δi est un paramètre variable en fonction de la sous-bande SBi correspondante, prenant des valeurs distinctes d'une sous-bande à l'autre ;
    • αi est un paramètre variable qui dépend de la valeur du rapport signal à bruit SNRk,l,i calculée dans la sous-bande SBi correspondante ; et
    • β est une constante.
According to another characteristic, the multi-band spectral subtraction algorithm called "SSMB" of step d) implements the following calculation phases, for each of the sub-bands SB i :
  1. d.1) calculating a signal-to-noise ratio SNR k, l, i specific to each sub-band SB i corresponding to the equation: SNR k , l , i = 10. log 10 Σ k = ei bi Y k , l , i 2 Σ k = ei bi D ^ k , l , i
    Figure imgb0006
  2. d.2) calculation of the square module | X k, l, i | 2 of the denoised component of sub-band X k, l, i specific to each sub-band SB i , according to the equation: X ^ k , l , i 2 = { Y k , l , i 2 - α i δ i D ^ k , l , i if Y k , l , i 2 > α i δ i D ^ k , l , i β Y k , l , i 2 if Y k , l , i 2 α i δ i D ^ k , l , i
    Figure imgb0007

    where - δ i is a variable parameter as a function of the corresponding sub-band SB i , taking values that are distinct from one subband to another;
    • α i is a variable parameter which depends on the value of the signal-to-noise ratio SNR k, l, i calculated in the corresponding sub-band SB i ; and
    • β is a constant.

Un tel algorithme est particulièrement avantageux car il prend en compte la valeur du rapport signal à bruit SNRk,l,i propre à chaque sous-bande SBi pour effectuer la soustraction spectrale dans chaque sous-bande.Such an algorithm is particularly advantageous since it takes into account the value of the signal-to-noise ratio SNR k, l, i specific to each sub-band SB i to perform the spectral subtraction in each sub-band.

Comme la composante de bruit n'est pas distribué de façon uniforme le long des fréquences, la mise en oeuvre de cet algorithme de soustraction spectrale multi-bande « SSMB » permet de faire des traitements avec des paramètres différents selon la sous-bande où l'on se trouve. De ce fait, la composante de bruit pourra être réduite de manière plus significative dans une sous-bande si elle y est plus prépondérante, contrairement à un algorithme de soustraction pleine bande qui réduira le bruit de façon égale sur toutes les sous-bandes du spectre et sera donc moins précis et donc moins efficace.Since the noise component is not distributed uniformly along the frequencies, the implementation of this multi-band spectral subtraction algorithm "SSMB" allows processing with different parameters depending on the sub-band where the 'We are. As a result, the noise component can be reduced more significantly in a sub-band if it is more dominant, unlike a full-band subtraction algorithm that will reduce noise equally all the sub-bands of the spectrum and will therefore be less precise and therefore less effective.

Dans une réalisation particulière, les paramètres α i répondent aux équations suivantes : α i = { α c 1 si SNR k , l , i < SNR 1 α c 2 + α c 3 SNR k , l , i si SNR 1 SNR k , l , i SNR 2 α c 4 si SNR k , l , i > SNR 2

Figure imgb0008

où αc1, αc2, αc3 et αc4 sont des constantes prédéterminées, et SNR1 et SNR2 sont des seuils prédéterminés.In a particular embodiment, the parameters α i respond to the following equations: α i = { α vs 1 if SNR k , l , i < SNR 1 α vs 2 + α vs 3 SNR k , l , i if SNR 1 SNR k , l , i SNR 2 α vs 4 if SNR k , l , i > SNR 2
Figure imgb0008

where α c1 , α c2 , α c3 and α c4 are predetermined constants, and SNR 1 and SNR 2 are predetermined thresholds.

Les valeurs αc1, αc2, αc3 et αc4 et SNR1 et SNR2 sont choisies de façon expérimentale, notamment par simulation numérique. A titre d'exemple non limitatif, les valeurs suivantes ont donné de bons résultats en simulation numérique : SNR 1 = - 5 dB , SNR 2 = 20 dB ;

Figure imgb0009

et α c 1 = 5 , α c 2 = 4 , α c 3 = - 0.15 , α c 4 = 1
Figure imgb0010
The values α c1 , α c2 , α c3 and α c4 and SNR 1 and SNR 2 are chosen experimentally, in particular by numerical simulation. By way of non-limiting example, the following values have given good results in numerical simulation: SNR 1 = - 5 dB , SNR 2 = 20 dB ;
Figure imgb0009

and α vs 1 = 5 , α vs 2 = 4 , α vs 3 = - 0.15 , α vs 4 = 1
Figure imgb0010

Selon le procédé exemplatif, l'étape e) consiste à déterminer le signal débruité X̂k,l à partir des modules carré |X̂k,l,i|2 des composantes débruitées de sous-bande X̂k,l,i, et éventuellement des phases θ k,l extraites lors de l'étape a), de sorte que le signal débruité de sortie SDk,l correspond au signal débruité X̂k,l, soit SDk,l = X̂k,l.According to the exemplary method, step e) consists in determining the denoised signal X k, 1 from the square modules | X k, l, i | 2 debruitées components of sub-band X k, l, i , and optionally phases θ k, l extracted in step a), so that the output unedited signal SD k, l corresponds to the denoised signal X k , l , ie SD k, l = X k, l .

Ainsi, on considère que le signal débruité de sortie SDk,l correspond au signal débruité X̂k,l dont les modules carré |X̂k,l,i|2 sont issus directement de l'étape d) mettant en oeuvre l'algorithme de soustraction spectrale multi-bandes « SSMB ».Thus, it is considered that the output unedited signal SD k, 1 corresponds to the denoised signal X k, l whose square modules | X k, l, i | 2 are directly derived from step d) implementing the multi-band spectral subtraction algorithm "SSMB".

Selon l'invention, en variante de l'exemple, l'étape e) consiste à :

  • déterminer, pour chacune des sous-bandes SBi, le module carré X k , l , i 2
    Figure imgb0011
    d'une composante débruitée combinée de sous-bande X k , l , i
    Figure imgb0012
    propre à chaque sous-bande SBi d'un signal débruité combiné X k , l
    Figure imgb0013
    répondant à l'équation correspondante : X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2
    Figure imgb0014
    où γ est un coefficient d'amplification prédéterminé, préférentiellement compris entre 0,01 et 0,1 ;
  • déterminer un signal débruité combiné X k , l
    Figure imgb0015
    à partir des modules carrés X k , l , i 2
    Figure imgb0016
    k,l,i|2 des composantes débruitées combinées de sous-bande X k , l , i ,
    Figure imgb0017
    et éventuellement des phases θk,l extraites lors de l'étape a), de sorte que le signal débruité de sortie SDk,l corresponde au signal débruité combiné X k , l ,
    Figure imgb0018
    soit SD k , l = X k , l .
    Figure imgb0019
According to the invention, as a variant of the example, step e) consists of:
  • determining, for each of the subbands SB i , the square module X k , l , i 2
    Figure imgb0011
    a combined denoised subband component X k , l , i
    Figure imgb0012
    specific to each sub-band SBi of a combined de-noise signal X k , l
    Figure imgb0013
    responding to the corresponding equation: X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2
    Figure imgb0014
    where γ is a predetermined amplification coefficient, preferably between 0.01 and 0.1;
  • determine a combined debris signal X k , l
    Figure imgb0015
    from the square modules X k , l , i 2
    Figure imgb0016
    k, l, i | 2 combined debris components of subband X k , l , i ,
    Figure imgb0017
    and possibly phases θ k, l extracted during step a), so that the output denoised signal SD k, 1 corresponds to the combined de-noise signal X k , l ,
    Figure imgb0018
    is SD k , l = X k , l .
    Figure imgb0019

Le signal traité, c'est-à-dire le signal débruité X̂k,l, peut souffrir au niveau de la qualité et de l'intelligibilité d'un problème de distorsion. Cette distorsion, dont l'origine est généralement le traitement de réduction du bruit, dépend des paramètres des algorithmes de réduction du bruit (algorithmes « MCRA » et « SSMB ») mais aussi du niveau et du type de composante de bruit à réduire.The processed signal, i.e., the denoised signal X k, l , may suffer in terms of the quality and intelligibility of a distortion problem. This distortion, whose origin is usually the noise reduction process, depends on the parameters of noise reduction algorithms ("MCRA" and "SSMB" algorithms) but also on the level and type of noise component to be reduced.

Ainsi, dans le cadre de l'invention, on procède, après l'étape d) mettant en oeuvre l'algorithme de soustraction spectrale multi-bandes « SSMB », à une étape de réinjection du signal bruité Yk,l issu du microphone dans le signal débruité X̂k,l ; cette réinjection étant contrôlée par le coefficient d'amplification (autrement appelé paramètre d'atténuation) choisi très faible, de l'ordre de quelques pourcents. Le signal réinjecté correspond au signal γ |Yk,l,i|2 et il ne présente pas de distorsion, car il n'a pas fait l'objet d'un traitement par les algorithmes « MCRA » et « SSMB ».Thus, in the context of the invention, after step d) implementing the multi-band spectral subtraction algorithm "SSMB", a step of reinjection of the noisy signal Y k , l from the microphone is carried out. in the denoised signal X k, l ; this reinjection being controlled by the amplification coefficient (otherwise called attenuation parameter) chosen very low, of the order of a few percent. The reinjected signal corresponds to the signal γ | Y k, l, i | 2 and it is not distorted because it has not been processed by the "MCRA" and "SSMB" algorithms.

Ce principe de réinjection d'une partie très faible du signal bruité Yk,l issu du microphone permet de remédier au moins en partie à ce problème de distorsion.This principle of reinjection of a very small part of the noisy signal Y k, l from the microphone makes it possible to remedy at least part of this problem of distortion.

Dans une première réalisation, l'étape f.2) consiste à reconstruire le signal vocal débruité de sortie sd(t) uniquement à partir des signaux de sortie Sdl issus de l'étape f.1), ces signaux de sortie Sdl correspondant aux transformées de Fourier inverse du signal débruité de sortie SDk,l propres à chaque trame temporelle I.In a first embodiment, the step f.2) involves reconstructing the voice signal output denoised sd (t) only from the Sd output signals from the the step f.1), these output signals Sd l corresponding to the inverse Fourier transforms of the output denoised signal SD k, l specific to each time frame I.

Ainsi, dans cette première réalisation, le signal vocal débruité de sortie sd(t) est reconstruit à partir des seuls signaux de sortie Sdl issus de l'étape f.1).Thus, in this first embodiment, the speech output speech signal sd (t) is reconstructed from the only output signals Sd I from step f.1).

Dans une seconde réalisation, en variante de la première réalisation, l'étape f.2) consiste à, pour chaque trame temporelle I :

  1. g) calculer un rapport moyen signal à bruit rl propre à la trame temporelle I à partir du module carré |Yk,l|2 et de la composante de bruit D̂k,l ;
  2. h) comparer le rapport moyen signal à bruit rl avec un seuil ΨTH prédéterminé ;
  3. i) reconstruire le signal vocal débruité de sortie sd(t) à partir en considérant que :
    • si le rapport moyen signal à bruit rl est inférieur audit seuil ΨTH pour la trame temporelle I, alors le signal considéré avant reconstruction temporelle pour cette trame temporelle I correspond au signal de sortie Sdl issu de l'étape f.1) ;
    • si le rapport moyen signal à bruit rl est supérieur audit seuil ΨTH pour la trame temporelle I, alors le signal considéré avant reconstruction temporelle pour cette trame temporelle I correspond au signal échantillonné yl issu de l'étape de découpage de l'étape a).
In a second embodiment, as a variant of the first embodiment, step f.2) consists of, for each time frame I:
  1. g) calculating a signal-to-noise average ratio r I specific to the time frame I from the square module | Y k, l | 2 and the noise component D k, l ;
  2. h) comparing the average signal-to-noise ratio r 1 with a predetermined threshold Ψ TH ;
  3. i) reconstructing the output speechless signal sd (t) from considering that:
    • if the average signal-to-noise ratio r 1 is less than said threshold Ψ TH for the time frame I, then the signal considered before time reconstruction for this time frame I corresponds to the output signal Sd 1 resulting from the step f.1);
    • if the average signal-to-noise ratio r l is greater than said threshold Ψ TH for the time frame I, then the signal considered before time reconstruction for this time frame I corresponds to the sampled signal y 1 resulting from the step of cutting step at).

Ainsi, dans cette seconde réalisation, on met en oeuvre:

  • lors de l'étape g), une détection de bruit par calcul d'un rapport moyen signal à bruit rl ;
  • lors de l'étape h), une comparaison de ce rapport moyen signal à bruit rl avec un seuil ΨTH pour établir si le bruit est présent (rl < ΨTH) ou si le bruit est absent ou du moins est extrémement faible (rl > ΨTH) ; et
  • lors de l'étape i), on fait en sorte, pour chaque trame I, que :
    • si le bruit est présent (rl < ΨTH), alors on prend en compte le signal traité numériquement, c'est-à-dire le signal de sortie Sdl pour la reconstruction temporelle ;
    • si le bruit est absent ou extrémement faible (rl > ΨTH), alors on ne prend pas en compte le signal de sortie Sdl mais on prend en compte directement le signal échantillonné yl pour la reconstruction temporelle, ce qui revient à ignorer les traitements de réduction du bruit (MCRA, SSMB) pour cette trame I, avec l'avantage d'éviter des distorsions inutiles lorsque le niveau de bruit est tel qu'un traitement de réduction du bruit n'est pas nécessaire.
Thus, in this second embodiment, we implement:
  • in step g), a noise detection by calculating a signal-to-noise average ratio r l ;
  • in step h), a comparison of this signal-to-noise ratio r l with a threshold Ψ TH to establish if the noise is present (r lTH ) or if the noise is absent or at least is extremely weak (r l > Ψ TH ); and
  • during step i), it is made, for each frame I, that:
    • if the noise is present (r lTH ), then we take into account the digitally processed signal, that is to say the output signal Sd l for time reconstruction;
    • if the noise is absent or extremely weak (r l > Ψ TH ), then we do not take into account the output signal Sd l but we take into account directly the sampled signal y l for the time reconstruction, which amounts to ignoring the noise reduction processing (MCRA, SSMB) for this frame I, with the advantage of avoiding unnecessary distortions when the noise level is such that a noise reduction treatment is not necessary.

Cette seconde réalisation permet en quelque sorte la désactivation des étapes b), c) et d) de réduction du bruit lorsque le bruit n'est pas présent. De ce fait, les distorsions qui peuvent être apportées par le traitement de réduction du bruit, dans cette situation d'absence ou de quasi-absence de bruit, seront éliminées.This second embodiment allows somehow the deactivation of steps b), c) and d) noise reduction when the noise is not present. As a result, the distortions that can be brought about by the noise reduction processing, in this situation of absence or near absence of noise, will be eliminated.

Pour rendre le procédé plus robuste, il serait avantageux que la même décision (présence ou non de bruit) soit prise sur une succession de trames temporelles I.To make the process more robust, it would be advantageous for the same decision (presence or absence of noise) to be taken on a succession of time frames I.

Dans un mode de réalisation particulier, l'étape g) met en oeuvre l'algorithme de calcul suivant, pour chaque trame temporelle I :

  1. g.1) calcul d'une composante de bruit moyenne D̅1 à partir de la composante de bruit D̂k,l estimée lors de l'étape b) et répondant à l'équation : D 1 = 1 M k = 0 M - 1 D ^ k , l
    Figure imgb0020

    où M est une constante prédéterminée, de préférence égale à N ou à [1+N/2], N étant le nombre de points de la transformée de Fourier ;
  2. g.2) calcul d'un module carré moyen |Yk,l|2 du signal bruité Yk,l répondant à l'équation : Y k , l 2 = 1 M k = 0 M - 1 Y k , l 2
    Figure imgb0021
  3. g.3) calcul d'une composante filtrée Pl du module carré moyen |Yk,l|2 répondant à l'équation : P 1 = λ P l - 1 + 1 - λ Y k , l 2
    Figure imgb0022

    où - λ est une constante prédéterminée caractéristique d'un filtre passe-bas,
    de préférence compris entre 0,80 et 0,99 ;
    - P 0 = D 0 = 1 M k = 0 M - 1 D ^ k , 0
    Figure imgb0023
    pour initialiser l'algorithme.
  4. g.4) calcul du rapport moyen signal à bruit rl répondant à l'équation :
    • si D̅l > 0 alors r l = P l D l ,
      Figure imgb0024
    • si D̅l ≤ 0 alors rl = 0.
In a particular embodiment, step g) implements the following calculation algorithm, for each time frame I:
  1. g.1) calculating a mean noise component D̅ 1 from the noise component D k, l estimated in step b) and corresponding to the equation: D ~ 1 = 1 M Σ k = 0 M - 1 D ^ k , l
    Figure imgb0020

    where M is a predetermined constant, preferably equal to N or [1 + N / 2], where N is the number of points of the Fourier transform;
  2. g.2) calculating a mean square module | Y k, l | 2 of the noisy signal Y k, l corresponding to the equation: Y k , l 2 ~ = 1 M Σ k = 0 M - 1 Y k , l 2
    Figure imgb0021
  3. g.3) calculating a filtered component P l of the average square module | Y k, l | 2 answering the equation: P 1 = λ P l - 1 + 1 - λ Y k , l 2 ~
    Figure imgb0022

    where - λ is a predetermined constant characteristic of a low-pass filter,
    preferably between 0.80 and 0.99;
    - P 0 = D ~ 0 = 1 M Σ k = 0 M - 1 D ^ k , 0
    Figure imgb0023
    to initialize the algorithm.
  4. g.4) calculation of the average signal to noise ratio r l corresponding to the equation:
    • if D̅ l > 0 then r l = P l D ~ l ,
      Figure imgb0024
    • if D̅ l ≤ 0 then r l = 0.

Avantageusement, les étapes a) et f) de conversion mettent en oeuvre une méthode de recouvrement et addition dite « OLA », avec :

  • pour l'étape a), un découpage du signal acoustique bruité y(t) en trames temporelles avec un recouvrement entre les trames temporelles successives ;
  • pour l'étape f.2), la reconstruction du signal vocal débruité de sortie sd(t) est réalisée par les additions successives des parties en recouvrement des signaux de deux trames temporelles successives.
Advantageously, the conversion steps a) and f) implement an OLA recovery and addition method, with:
  • for step a), cutting the noisy acoustic signal y (t) into time frames with an overlap between the successive time frames;
  • for step f.2), the reconstruction of the output defracked speech signal sd (t) is performed by the successive additions of the parts in overlap of the signals of two successive time frames.

Cette méthode de recouvrement et addition dite « OLA » pour « OverLap and Add method » est une méthode classique de reconstruction temporelle qui utilise des fenêtres de pondération juxtaposées (c'est-à-dire des fenêtres qui se superposent ou qui se recouvrent partiellement), puis qui additionne les signaux de sortie en tenant compte du recouvrement des trames temporelles.This OLA overlap and add method is a typical time reconstruction method that uses juxtaposed weighting windows (ie overlapping or overlapping windows). then who Adds the output signals taking into account the overlap of the time frames.

Un autre exemple se rapporte également à un système de réduction du bruit sur un signal acoustique bruité y(t) issu d'un microphone opérant dans un milieu bruité, comportant :

  • une unité de conversion du signal acoustique bruité y(t) dans le domaine temporel en un signal bruité Yk,l dans le domaine fréquentiel, comportant :
    • un module de découpage du signal acoustique bruité y(t) en signaux échantillonnés yl dans des trames temporelles I successives ;
    • en sortie du module de découpage, un module de fenêtrage des signaux échantillonnés yl par application d'une fenêtre de pondération ;
    • en sortie du module de fenêtrage, un module de calcul d'une transformée de Fourier discrète qui délivre en sortie le signal bruité Yk,l ;
  • une unité de traitement numérique dans le domaine fréquentiel comportant, en sortie de l'unité de conversion :
    • un premier module d'extraction du module carré |Yk,l|2 du signal bruité Yk,l ; et éventuellement un deuxième module d'extraction de la phase θk,l du signal bruité Yk,l ;
    • en sortie du premier module d'extraction, un module d'estimation, dit « MCRA », d'une composante de bruit D̃k,l contenue dans le signal bruité Yk,l à partir du module carré |Yk,l|2 issu du premier module d'extraction, par un algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon une méthode de moyennage récursif des minima contrôlés dite « MCRA » ;
    • en sortie du premier module d'extraction, un module de découpage de la bande fréquentielle en plusieurs sous-bandes fréquentielles SBi=[ei, bi] ;
    • en sortie du module d'estimation « MCRA » et du module de découpage de la bande fréquentielle, un module d'estimation, dit « SSMB », du module carré |X̂k,l,i|2 d'une composante débruitée de sous-bande X̂k,l,i propre à chaque sous-bande SBi d'un signal débruité X̂k,l, par un algorithme de soustraction spectrale multi-bandes à partir de modules carrés de sous-bande |Yk,l,i|2 et de composantes de bruit de sous-bande D̂k,l,i ;
    • en sortie du module d'estimation « SSMB », et éventuellement du deuxième module d'extraction, un module de détermination d'un signal débruité de sortie SDk,l à partir des modules carré |X̂k,l,i|2, et éventuellement des phases θk,l ;
  • une unité de conversion dans le domaine temporel comportant, en sortie de l'unité de traitement numérique :
    • un module de calcul d'un signal de sortie Sdl propre à chaque trame temporelle I par application d'une transformée de Fourier inverse du signal débruité de sortie SDk,l ; et
    • un module de reconstruction d'un signal vocal débruité de sortie sd(t) dans le domaine temporel à partir desdits signaux de sortie Sdl.
Another example also relates to a system for reducing noise on a noisy acoustic signal y (t) originating from a microphone operating in a noisy environment, comprising:
  • a noisy acoustic signal conversion unit y (t) in the time domain into a noisy signal Y k, 1 in the frequency domain, comprising:
    • a module for cutting the noisy acoustic signal y (t) into sampled signals y 1 in successive time frames I;
    • the output of the cutting module, a windowing module of the sampled signals y l by applying a weighting window;
    • at the output of the windowing module, a module for calculating a discrete Fourier transform which outputs the noisy signal Y k, l ;
  • a digital processing unit in the frequency domain comprising, at the output of the conversion unit:
    • a first extraction module of the square module | Y k, l | 2 of the noisy signal Y k, l ; and possibly a second extraction module of the phase θ k, 1 of the noisy signal Y k, 1 ;
    • at the output of the first extraction module, an estimation module, called "MCRA", of a noise component D k, 1 contained in the noisy signal Y k, 1 from the square module | Y k, l | 2 from the first extraction module, by an algorithm for estimating the spectral power density of the noise component according to a recursive averaging method of the controlled minima known as "MCRA";
    • at the output of the first extraction module, a frequency band division module in several frequency subbands SB i = [e i , b i ];
    • at the output of the estimation module "MCRA" and the frequency band division module, an estimation module, called "SSMB", of the square module | X k, l, i | 2 of a denoised component of subband X k, l, i specific to each subband SB i of a denoised signal X k, 1 , by a multiband spectral subtraction algorithm from square subband modules | Y k, l, i | 2 and subband noise components D k, l, i ;
    • at the output of the estimating module "SSMB", and possibly of the second extraction module, a module for determining an output denoised signal SD k, l from the square modules | X k, l, i | 2 , and optionally phases θ k, l ;
  • a time domain conversion unit comprising, at the output of the digital processing unit:
    • a module for calculating an output signal Sd 1 specific to each time frame I by applying an inverse Fourier transform of the output denoised signal SD k, l ; and
    • a module for reconstructing a speech output speech signal sd (t) in the time domain from said output signals Sd l .

Selon cet exemple, le module de détermination du signal débruité de sortie SDk,l comprend :

  • un sous-module racine-carré pour calculer le module |X̂k,l,i| des composantes débruitées de sous-bande X̂k,l,i, et
  • un sous-module de recombinaison des composantes débruitées de sous-bande X̂k,l,i pour obtenir le signal débruité X̂k,l à partir des modules |X̂k,l,i|, et éventuellement des phases θk,l, de sorte que le signal débruité de sortie SDk,l corresponde au signal débruité X̂k,l, soit SDk,l = X̂k,l
According to this example, the module for determining the output denoised signal SD k, 1 comprises:
  • a root-square submodule to compute the module | X k, l, i | debrueted components of sub-band X k, l, i , and
  • a recombination sub-module of the de-banded components of sub-band X k, l, i to obtain the denoised signal X k, l from the modules | X k, l, i |, and possibly phases θ k, l , so that the output unedited signal SD k, 1 corresponds to the denoised signal X k, 1 , ie SD k, l = X k, l

Selon l'invention, en variante de cet exemple, le module de détermination d'un signal débruité de sortie SDk,l comprend :

  • en sortie du premier module d'extraction, un sous-module d'amplification selon un coefficient d'amplification γ, préférentiellement compris entre 0,01 et 0,1, afin de délivrer un signal amplifié γ |Yk,l|2 ;
  • en sortie du module d'estimation « SSMB », un sous-module additionneur propre à additionner le signal amplifié γ |Yk,l|2 et les modules carré |X̂k,l,i|2, afin de délivrer en sortie les module carré | X k , l , i 2
    Figure imgb0025
    de composantes débruitées combinées de sous-bande X k , l , i
    Figure imgb0026
    propres à chaque sous-bande SBi d'un signal débruité combiné X k , l ,
    Figure imgb0027
    répondant à l'équation correspondante : X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2 ;
    Figure imgb0028
  • un sous-module racine-carré pour calculer le module X k , l , i
    Figure imgb0029
    des composantes débruitées combinées de sous-bande X k , l , i
    Figure imgb0030
    et
  • un sous-module de recombinaison des composantes combinées de sous-bande X k , l , i
    Figure imgb0031
    pour obtenir le signal débruité combiné X k , l ,
    Figure imgb0032
    à partir des modules X k , l , i ,
    Figure imgb0033
    et éventuellement des phases θk,l, de sorte que le signal débruité de sortie SDk,l correspond au signal débruité combiné X k , l
    Figure imgb0034
    soit SD k , l = X k , l .
    Figure imgb0035
According to the invention, as a variant of this example, the module for determining an output de-let signal SD k, 1 comprises:
  • at the output of the first extraction module, an amplification sub-module according to an amplification coefficient γ, preferably between 0.01 and 0.1, in order to deliver an amplified signal γ | Y k, l | 2 ;
  • at the output of the estimating module "SSMB", an addering sub-module capable of adding the amplified signal γ | Y k, l | 2 and the square modules | X k, l, i | 2 , in order to output the square module | X k , l , i 2
    Figure imgb0025
    of combined debris components of subband X k , l , i
    Figure imgb0026
    specific to each SBi sub-band of a combined de-noise signal X k , l ,
    Figure imgb0027
    responding to the corresponding equation: X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2 ;
    Figure imgb0028
  • a root-square sub-module to calculate the module X k , l , i
    Figure imgb0029
    combined debrueted subband components X k , l , i
    Figure imgb0030
    and
  • a recombination sub-module of the combined subband components X k , l , i
    Figure imgb0031
    to get the combined noise signal X k , l ,
    Figure imgb0032
    from the modules X k , l , i ,
    Figure imgb0033
    and possibly phases θ k, 1 , such that the output denoised signal SD k, 1 corresponds to the combined de-noise signal X k , l
    Figure imgb0034
    is SD k , l = X k , l .
    Figure imgb0035

Dans cette seconde possibilité, le système met en oeuvre une étape de réinjection d'une partie très faible du signal bruité Yk,l issu du microphone dans le signal débruité X̂k,l pour remédier au moins en partie aux problèmes de distorsion induits par les modules d'estimation « MCRA » et « SSMB ».In this second possibility, the system implements a step of reinjection of a very small part of the noisy signal Y k, 1 coming from the microphone into the denoised signal X k, 1 to remedy at least in part the distortion problems induced by the estimation modules "MCRA" and "SSMB".

Dans une réalisation avantageuse, l'unité de traitement numérique comprend en outre, en sortie du module d'estimation « MCRA », un module de détection du bruit comprenant

  • un module de calcul d'un rapport moyen signal à bruit rl propre à chaque trame temporelle I à partir du module carré |Yk,l|2 et de la composante de bruit D̂k,l ;
  • un module de comparaison du rapport moyen signal à bruit rl propre à chaque trame temporelle I avec un seuil ΨTH prédéterminé ;
  • un module de contrôle du module de reconstruction du signal vocal débruité de sortie sd(t) qui est conçu pour que :
    • si le rapport moyen signal à bruit rl est inférieur audit seuil ΨTH pour la trame temporelle I, alors le signal considéré avant reconstruction pour cette trame temporelle I correspond au signal de sortie Sdl issu du module de calcul dudit signal de sortie Sdl ;
    • si le rapport moyen signal à bruit rl est supérieur audit seuil ΨTH pour la trame temporelle I, alors le signal considéré avant reconstruction pour cette trame temporelle I correspond au signal échantillonné yl issu du module de découpage du signal acoustique bruité y(t).
In an advantageous embodiment, the digital processing unit further comprises, at the output of the estimation module "MCRA", a noise detection module comprising
  • a module for calculating a signal-to-noise average ratio r 1 specific to each time frame I from the square module | Y k, l | 2 and the noise component D k, l ;
  • a module for comparing the average signal-to-noise ratio r 1 for each time frame I with a predetermined threshold Ψ TH ;
  • a module for controlling the output defracked speech signal reconstruction module sd (t) which is designed so that:
    • if the average signal-to-noise ratio r 1 is less than said threshold Ψ TH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the output signal Sd 1 from the calculation module of said output signal Sd l ;
    • if the average signal-to-noise ratio r l is greater than said threshold Ψ TH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the sampled signal y 1 from the noisy acoustic signal cutting module y (t ).

D'autres caractéristiques et avantages de la présente invention apparaîtront à la lecture de la description détaillée ci-après, d'un exemple de mise en oeuvre non limitatif, faite en référence aux figures annexées dans lesquelles :

  • la figure 1 est une vue schématique d'un premier système de réduction du bruit exemplatif;
  • la figure 2 est une vue schématique d'un système de réduction du bruit conforme à l'invention ;
  • la figure 3 est une vue schématique d'une variante du second système de la figure 2.
Other features and advantages of the present invention will appear on reading the detailed description below, of an example of non-limiting implementation, with reference to the appended figures in which:
  • the figure 1 is a schematic view of a first exemplary noise reduction system;
  • the figure 2 is a schematic view of a noise reduction system according to the invention;
  • the figure 3 is a schematic view of a variant of the second system of the figure 2 .

La description d'un système 1 de réduction du bruit sur un signal acoustique bruité y(t) issu d'un microphone unique opérant dans un milieu bruité, et du procédé de réduction du bruit associé, est faite en référence aux figures 1 à 3.The description of a system 1 for reducing the noise on a noisy acoustic signal y (t) originating from a single microphone operating in a noisy medium, and the method of reducing the associated noise, is made with reference to the Figures 1 to 3 .

Dans les trois modes de réalisation, le système 1 comprend une unité de conversion 2 du signal acoustique bruité y(t) dans le domaine temporel en un signal bruité Yk,l dans le domaine fréquentiel.In the three embodiments, the system 1 comprises a conversion unit 2 of the noisy acoustic signal y (t) in the time domain into a noisy signal Y k, 1 in the frequency domain.

Cette unité de conversion 2 comporte un module de découpage 21 du signal acoustique bruité y(t) en signaux échantillonnés yl dans des trames temporelles I successives.This conversion unit 2 comprises a switching module 21 of the noisy acoustic signal y (t) in sampled signals y 1 in successive time frames I.

Dans ce module de découpage 21, le signal acoustique bruité y(t) est découpé en trames de 240 échantillons, ce qui à une fréquence d'échantillonnage de 8 kHz correspond à des trames temporelles de 30 millisecondes.In this clipping module 21, the noisy acoustic signal y (t) is cut into frames of 240 samples, which at a sampling frequency of 8 kHz corresponds to time frames of 30 milliseconds.

Il est également envisageable d'avoir un découpage en trames de 256 échantillons, ce qui à une fréquence d'échantillonnage de 8 kHz correspond à des trames temporelles de 32 millisecondes.It is also conceivable to have a frame division of 256 samples, which at a sampling frequency of 8 kHz corresponds to time frames of 32 milliseconds.

Dans ce module de découpage 21, les trames temporelles successives se recouvrent ou se chevauchent. Par exemple, les trames temporelles successives se chevauchent sur 120 échantillons, ce qui correspond à cinquante pourcent (50 %) de recouvrement.In this clipping module 21, the successive time frames overlap or overlap. For example, successive time frames overlap on 120 samples, which corresponds to fifty percent (50%) of overlap.

Ce recouvrement des trames temporelles est destiné à permettre la mise en oeuvre d'une méthode de recouvrement et addition dite « OLA », qui permet le découpage temporel initial du signal acoustique bruité y(t) puis la restitution finale en sortie du système 1 dans le domaine temporel.This overlap of the time frames is intended to allow the implementation of a method of recovery and addition called "OLA", which allows the initial temporal division of the noisy acoustic signal y (t) then the final restitution at the output of the system 1 in the time domain.

Cette unité de conversion 2 comporte, en sortie du module de découpage 21, un module de fenêtrage 22 des signaux échantillonnés yl par application d'une fenêtre de pondération, notamment du type fenêtre de Hanning ou fenêtre de Hamming, afin de délivrer en sortie des signaux échantillonnés pondérés {yl}.This conversion unit 2 comprises, at the output of the chopper module 21, a windowing module 22 of the sampled signals y 1 by application of a weighting window, in particular of the Hanning window or Hamming window type, in order to output weighted sampled signals {y 1 }.

Ainsi, les trames temporelles sont alors apodisées avec une fenêtre de pondération, avant d'appliquer une transformée de Fourier, afin de minimiser les effets de bords dus au découpage-recouvrement effectué par le module de découpage 21.Thus, the time frames are then apodized with a weighting window, before applying a Fourier transform, in order to to minimize the edge effects due to the blanking cut performed by the cutting module 21.

Cette unité de conversion 2 comporte, en sortie du module de fenêtrage 22, un module de calcul 23 d'une transformée de Fourier discrète qui délivre en sortie le signal bruité Yk,l.This conversion unit 2 comprises, at the output of the windowing module 22, a calculation module 23 of a discrete Fourier transform which outputs the noisy signal Y k, l .

D'un point de vue mathématique, on note : y t = x t + d t ,

Figure imgb0036

avec x(t) le signal de parole utile et d(t) la composante de bruit.From a mathematical point of view, we note: there t = x t + d t ,
Figure imgb0036

with x (t) the useful speech signal and d (t) the noise component.

Le module de découpage 21 reçoit en entrée le signal acoustique bruité y(t) et délivre en sortie le signal échantillonnée yl, où I est l'indice temporel (ou indice de la trame temporelle).The switching module 21 receives as input the noisy acoustic signal y (t) and outputs the sampled signal y 1 , where I is the time index (or index of the time frame).

Le module de découpage 21 reçoit en entrée le signal échantillonnée yl et délivre en sortie le signal échantillonnée pondéré {yl}, avec : y l = ω l . y l

Figure imgb0037

avec ωl, le signal représentatif de la fenêtre de pondération.Cutting module 21 receives as input the sampled signal y l and outputs the weighted sampled signal {y t}, with: there l = ω l . there l
Figure imgb0037

with ω l , the signal representative of the weighting window.

Le module de calcul 23 reçoit en entrée le signal échantillonnée pondéré {yl} et délivre en sortie le signal bruité Yk,l qui correspond à la transformée de Fourier Discrète de {y(l)}, où k représente l'indice de fréquence, soit : Y k , l = DFT y l = r k , l + j i k , l

Figure imgb0038
The calculation module 23 receives as input the weighted sampled signal {y 1 } and outputs the noisy signal Y k, 1 which corresponds to the Discrete Fourier transform of {y (1)}, where k represents the index of Frequency: Y k , l = DFT there l = r k , l + j i k , l
Figure imgb0038

Le calcul de la transformée de Fourier Discrète (DFT pour « Discrete Fourier Transform ») est par exemple réalisé par un calcul de transformée de Fourier rapide (FFT pour « Fast Fourier Transform ») avec une taille N qui peut être égale à 256 (N correspond au nombre de points de la transformée de Fourier).The calculation of the Discrete Fourier Transform (DFT) is for example carried out by a Fast Fourier Transform (FFT) calculation with a size N which can be equal to 256 (N corresponds to the number of points of the Fourier transform).

Le système 1 comprend, en sortie de l'unité de conversion 2, une unité de traitement numérique 3 dans le domaine fréquentiel qui réalise le traitement de débruitage ou de rehaussement de la parole sur le signal bruité Yk,l.The system 1 comprises, at the output of the conversion unit 2, a digital processing unit 3 in the frequency domain which carries out denoising or speech enhancement processing on the noisy signal Y k, l .

Cette unité de traitement numérique 3 comprend un premier module d'extraction 31 du module carré |Yk,l|2 du signal bruité Yk,l.This digital processing unit 3 comprises a first extraction module 31 of the square module | Y k, l | 2 of the noisy signal Y k, l .

D'un point de vue mathématique, le premier module d'extraction 31 réalise le calcul suivant : Y k , l 2 = r k , l 2 + i k , l 2 .

Figure imgb0039
From a mathematical point of view, the first extraction module 31 performs the following calculation: Y k , l 2 = r k , l 2 + i k , l 2 .
Figure imgb0039

Dans les modes de réalisation des figures 1 et 2, cette unité de traitement numérique 3 comprend un deuxième module d'extraction 32 de la phase θk,l du signal bruité Yk,l. Comme détaillé ultérieurement, il est également envisageable de se passer de ce deuxième module d'extraction 32.In the embodiments of figures 1 and 2 this digital processing unit 3 comprises a second extraction module 32 of the phase θ k, 1 of the noisy signal Y k, l . As detailed later, it is also conceivable to dispense with this second extraction module 32.

D'un point de vue mathématique, le deuxième module d'extraction 32 réalise le calcul suivant : cos θ k , l = r k , l Y k , l , et sin θ k , l = i k , l Y k , l

Figure imgb0040

avec Y k , l = r k , l 2 + i k , l 2
Figure imgb0041
From a mathematical point of view, the second extraction module 32 performs the following calculation: cos θ k , l = r k , l Y k , l , and sin θ k , l = i k , l Y k , l
Figure imgb0040

with Y k , l = r k , l 2 + i k , l 2
Figure imgb0041

L'unité de traitement numérique 3 comprend, en sortie du premier module d'extraction 31, un module d'estimation 33, dit « MCRA », d'une composante de bruit D̂k,l contenue dans le signal bruité Yk,l à partir du module carré |Yk,l|2 issu du premier module d'extraction 31, par un algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon une méthode de moyennage récursif des minima contrôlés dite « MCRA ».The digital processing unit 3 comprises, at the output of the first extraction module 31, an estimation module 33, called "MCRA", of a noise component D k, 1 contained in the noisy signal Y k, l from the square module | Y k, l | 2 from the first extraction module 31, by an algorithm for estimating the power spectral density of the noise component according to a recursive averaging method of the controlled minima known as "MCRA".

D'un point de vue mathématique, l'algorithme d'estimation de la densité spectrale de puissance de la composante de bruit selon la méthode de moyennage récursif des minimas contrôlés dite « MCRA » met en oeuvre les phases de calcul suivantes :

  1. b.1) calcul d'une composante bruitée filtrée Sk,l répondant à l'équation : S k , l = α s S k , l - 1 + 1 - α s Y k , l 2
    Figure imgb0042

    où αs est une constante prédéterminée caractéristique d'un filtre passe-bas ;
  2. b.2) calcul d'une densité de probabilité de présence de parole p̃k,l par la mise en oeuvre du calcul progressif suivant :
    1. (i) calcul d'une composante minimale spectrale Smink,l avec :
      • si rem(k,1) = 0
      alors Smink,l = min (Smink,l-1 ; Sk,l) et Stmpk,l = Sk,l
      • si rem(k,l) ≠ 0
      alors Smink,l = min (Stmpk,l-1 ; Sk,l) et
      Stmpk,l = min (Stmpk,l-1 ; Sk,l)
      où rem(k,l) est le reste de la division entière de k par I, puis
    2. (ii) calcul d'un rapport spectral Srk,l répondant à l'équation : Sr k , l = S k , l Smin k , l
      Figure imgb0043
    3. (iii) calcul d'une variable indicatrice Ik,l avec :
      • si Srk,l > δTH alors Ik,l = 1
      • si Srk,l ≤ δTH alors Ik,l = 0
        où δTH est un paramètre prédéterminé de seuil fixe de détection de parole ;
    4. (iv) calcul de la densité de probabilité de présence de parole p̃k,l avec : p ˜ k , l = α p p ˜ k , l - 1 + 1 - α p I k , l
      Figure imgb0044

      où αp est une constante prédéterminée ;
  3. b.3) calcul d'un coefficient α̃ k,l répondant à l'équation suivante : α ˜ k , l = α + 1 - α p ˜ k , l ,
    Figure imgb0045

    où α est une constante prédéterminée ;
  4. b.4) calcul de la composante de bruit D̂k,l répondant à l'équation suivante : D ^ k , l = α ˜ k , l D ^ k , l - 1 + 1 - α ˜ k , l Y k , l 2 .
    Figure imgb0046
From a mathematical point of view, the algorithm for estimating the power spectral density of the noise component according to the recursive averaging method of the controlled minima known as "MCRA" implements the following calculation phases:
  1. b.1) calculating a filtered noise component S k, l corresponding to the equation: S k , l = α s S k , l - 1 + 1 - α s Y k , l 2
    Figure imgb0042

    where α s is a predetermined constant characteristic of a low-pass filter;
  2. b.2) calculating a probability density of presence of speech p k, 1 by the implementation of the following progressive calculation:
    1. (i) calculating a minimum spectral component Smin k, 1 with:
      • if rem (k, 1) = 0
      then Smin k, l = min (Smin k, l-1 ; S k, l ) and Stmp k, l = S k, l
      • if rem (k, l) ≠ 0
      then Smin k, l = min (Stmp k, l-1 ; S k, l ) and
      Stmp k, l = min (Stmp k, l-1 ; S k, l )
      where rem (k, l) is the remainder of the integer division of k by I, then
    2. (ii) calculating a spectral ratio Sr k, l corresponding to the equation: Sr k , l = S k , l Smin k , l
      Figure imgb0043
    3. (iii) calculating an indicator variable I k, l with:
      • if Sr k, l > δ TH then I k, l = 1
      • if Sr k, l ≤ δ TH then I k, l = 0
        where δ TH is a predetermined parameter of fixed threshold of speech detection;
    4. (iv) calculating the probability density of speech presence p k, 1 with: p ~ k , l = α p p ~ k , l - 1 + 1 - α p I k , l
      Figure imgb0044

      where α p is a predetermined constant;
  3. b.3) calculating a coefficient α k, l corresponding to the following equation: α ~ k , l = α + 1 - α p ~ k , l ,
    Figure imgb0045

    where α is a predetermined constant;
  4. b.4) calculating the noise component D k, l corresponding to the following equation: D ^ k , l = α ~ k , l D ^ k , l - 1 + 1 - α ~ k , l Y k , l 2 .
    Figure imgb0046

Le module d'estimation « MCRA » 33 délivre ainsi en sortie la composante de bruit D̂k,l.The estimation module "MCRA" 33 thus outputs the noise component D k, l .

L'unité de traitement numérique 3 comprend, en sortie du premier module d'extraction 31, un module de découpage 34 de la bande fréquentielle en plusieurs sous-bandes fréquentielles SBi=[ei, bi].The digital processing unit 3 comprises, at the output of the first extraction module 31, a switching module 34 of the frequency band in several frequency subbands SB i = [e i , b i ].

La bande fréquentielle peut par exemple être divisée en trois sous-bandes fréquentielles, à savoir SB1 pour fi < 1000 Hz, SB2 pour 1000 Hz ≤ fi ≤ 2000 Hz et enfin SB3 pour fi > 2000 Hz, où fi est la fréquence de sous-bande.The frequency band can for example be divided into three frequency sub-bands, namely SB 1 for f i <1000 Hz, SB 2 for 1000 Hz ≤ f i ≤ 2000 Hz and finally SB 3 for f i > 2000 Hz, where f i is the subband frequency.

L'unité de traitement numérique 3 comprend, en sortie du module d'estimation « MCRA » 33 et du module de découpage 34 de la bande fréquentielle, un module d'estimation 35, dit « SSMB », du module carré |X̂k,l,i|2 d'une composante débruitée de sous-bande X̂k,l,i propre à chaque sous-bande SBi d'un signal débruité X̂k,l, par un algorithme de soustraction spectrale multi-bandes à partir de modules carrés de sous-bande |Yk,l,i|2 et de composantes de bruit de sous-bande D̂k,l,i The digital processing unit 3 comprises, at the output of the estimation module "MCRA" 33 and the module of division 34 of the frequency band, an estimation module 35, called "SSMB", of the square module | X k, l, i | 2 of a denoised component of sub-band X k , l , i specific to each sub-band SB i of a denoised signal X k, l , by a multi-band spectral subtraction algorithm from square modules of sub-band | Y k, l, i | 2 and subband noise components D k, l, i

Le principe de l'algorithme de soustraction spectrale multi-bandes (SSMB) procède d'une généralisation de l'algorithme de soustraction spectrale qui consiste à soustraire de la densité spectrale de puissance du signal bruité Yk,l issu du microphone une portion de la densité spectrale de puissance de la composante de bruit estimé par la méthode « MCRA ». L'algorithme de soustraction spectrale multi-bandes applique le même principe en découpant l'espace spectral en plusieurs sous-bandes SBi fréquentielles et, ensuite, dans chaque sous-bande SBi, l'opération de soustraction spectrale est appliquée, comme suit : X ^ k , l , i 2 = Y k , l , i 2 - μ i D ^ k , l , i 2

Figure imgb0047

avec µi un coefficient prédéterminé.The principle of the multi-band spectral subtraction algorithm (SSMB) proceeds from a generalization of the spectral subtraction algorithm which consists in subtracting from the spectral power density of the noisy signal Y k, l coming from the microphone a portion of the spectral power density of the noise component estimated by the "MCRA" method. The multi-band spectral subtraction algorithm applies the same principle by splitting the spectral space into several frequency sub-bands SB i and then, in each sub-band SB i , the spectral subtraction operation is applied, as follows : X ^ k , l , i 2 = Y k , l , i 2 - μ i D ^ k , l , i 2
Figure imgb0047

with μ i a predetermined coefficient.

Cet algorithme de soustraction spectrale multi-bandes est combiné avec la méthode de recouvrement et addition dite « OLA ».This multi-band spectral subtraction algorithm is combined with the so-called OLA overlay and addition method.

Il est bien entendu envisageable d'affiner la relation de soustraction spectrale multi-bandes donnée ci-dessus, comme décrit ci-après.It is of course conceivable to refine the multi-band spectral subtraction relationship given above, as described below.

D'un point de vue mathématique, l'algorithme de soustraction spectrale multi-bande « SSMB » mis en oeuvre par le module d'estimation « SSMB » 35, réalise les phases de calcul suivantes, pour chacune des sous-bandes SBi:

  1. d.1) calcul d'un rapport signal à bruit SNRk,l,i propre à chaque sous-bande SBi répondant à l'équation : SNR k , l , i = 10. log 10 k = ei bi Y k , l , i 2 k = ei bi D ^ k , l , i
    Figure imgb0048
  2. d.2) calcul du module carré |X̂k,l,i|2 de la composante débruitée de sous-bande X̂k,l,i propre à chaque sous-bande SBi, selon l'équation : X ^ k , l , i 2 = { Y k , l , i 2 - α i δ i D ^ k , l , i si Y k , l , i 2 > α i δ i D ^ k , l , i β Y k , l , i 2 si Y k , l , i 2 α i δ i D ^ k , l , i
    Figure imgb0049

    où - δi est un paramètre variable en fonction de la sous-bande SBi
    correspondante, prenant des valeurs distinctes d'une sous-bande à l'autre ;
    • αi est un paramètre variable qui dépend de la valeur du rapport signal à bruit SNRk,l,i calculée dans la sous-bande SBi correspondante ; et
    • β est une constante.
From a mathematical point of view, the multi-band spectral subtraction algorithm "SSMB" implemented by the estimation module "SSMB" 35, performs the following calculation phases, for each of the sub-bands SB i :
  1. d.1) calculating a signal-to-noise ratio SNR k, l, i specific to each sub-band SB i corresponding to the equation: SNR k , l , i = 10. log 10 Σ k = ei bi Y k , l , i 2 Σ k = ei bi D ^ k , l , i
    Figure imgb0048
  2. d.2) calculation of the square module | X k, l, i | 2 of the denoised component of sub-band X k, l, i specific to each sub-band SB i , according to the equation: X ^ k , l , i 2 = { Y k , l , i 2 - α i δ i D ^ k , l , i if Y k , l , i 2 > α i δ i D ^ k , l , i β Y k , l , i 2 if Y k , l , i 2 α i δ i D ^ k , l , i
    Figure imgb0049

    where - δ i is a variable parameter depending on the sub-band SB i
    corresponding, taking values distinct from one subband to another;
    • α i is a variable parameter which depends on the value of the signal-to-noise ratio SNR k, l, i calculated in the corresponding sub-band SB i ; and
    • β is a constant.

Il est envisageable de comparer la valeur du rapport signal à bruit SNRk,l,i avec deux seuils SNR1 et SNR2 pour établir la valeur des paramètres αi. Ainsi, les paramètres αi répondent aux équations suivantes : α i = { α c 1 si SNR k , l , i < SNR 1 α c 2 + α c 3 SNR k , l , i si SNR 1 SNR k , l , i SNR 2 α c 4 si SNR k , l , i > SNR 2

Figure imgb0050

où αc1, αc2, αc3 et αc4 sont des constantes prédéterminées, et SNR1 et SNR2 sont les seuils prédéterminés.It is conceivable to compare the value of the signal-to-noise ratio SNR k, l, i with two thresholds SNR 1 and SNR 2 to establish the value of the parameters α i . Thus, the parameters α i respond to the following equations: α i = { α vs 1 if SNR k , l , i < SNR 1 α vs 2 + α vs 3 SNR k , l , i if SNR 1 SNR k , l , i SNR 2 α vs 4 if SNR k , l , i > SNR 2
Figure imgb0050

where α c1 , α c2 , α c3 and α c4 are predetermined constants, and SNR 1 and SNR 2 are the predetermined thresholds.

Par exemple, il est envisageable d'avoir les relations suivantes pour les paramètres αi : α i = { 5 si SNR k , l , i < - 5 4 - 3 20 SNR k , l , i si - 5 SNR k , l , i 20 1 si SNR k , l , i > 20

Figure imgb0051
For example, it is conceivable to have the following relations for the parameters α i : α i = { 5 if SNR k , l , i < - 5 4 - 3 20 SNR k , l , i if - 5 SNR k , l , i 20 1 if SNR k , l , i > 20
Figure imgb0051

Concernant les paramètres variables δi, il envisageable d'avoir les relations suivantes, dans le cas de la division en trois sous-bandes fréquentielles décrite ci-dessus : δ i = { 1 si f i < 1000 première sous - bande SB 1 2.75 si 1000 f i 2000 deuxième sous - bande SB 2 1.75 si f i > 2000 troisième sous - bande SB 3

Figure imgb0052
Concerning the variable parameters δ i , it is conceivable to have the following relations, in the case of the division into three frequency subbands described above: δ i = { 1 if f i < 1000 first sub - bandaged SB 1 2.75 if 1000 f i 2000 second sub - bandaged SB 2 1.75 if f i > 2000 third sub - bandaged SB 3
Figure imgb0052

Concernant la constante β, il est envisageable d'avoir des valeurs de l'ordre de 0,002 ou 0,0015, soit par exemple β = 0.002 ou β = 0.0015.Regarding the constant β, it is possible to have values of the order of 0.002 or 0.0015, for example β = 0.002 or β = 0.0015.

L'unité de traitement numérique 3 comprend également, en sortie du module d'estimation « SSMB » 35 et du deuxième module d'extraction 32, un module de détermination 36 d'un signal débruité de sortie SDk,l à partir des modules carré |X̃k,l,i|2 et des phases θk,l.The digital processing unit 3 also comprises, at the output of the estimation module "SSMB" 35 and the second extraction module 32, a module 36 for determining an output denoised signal SD k, l from the modules square | X k, l, i | 2 and phases θ k, l .

Dans le premier mode de réalisation illustré sur la figure 1, le module de détermination 36 du signal débruité de sortie SDk,l comprend :

  • un sous-module racine-carré 361 pour calculer le module |X̂k,l,i| des composantes débruitées de sous-bande X̂k,l,i, et
  • un sous-module de recombinaison 362 des composantes débruitées de sous-bande X̂k,l,i pour obtenir le signal débruité X̂k,l à partir des modules |X̂k,l,i| et des phases θk,l, de sorte que le signal débruité de sortie SDk,l corresponde au signal débruité X̂k,l, soit SDk,l = X̂k,l.
In the first embodiment illustrated on the figure 1 , the determination module 36 of the output denoised signal SD k, 1 comprises:
  • a root-square sub-module 361 for calculating the module | X k, l, i | debrueted components of sub-band X k, l, i , and
  • a recombination sub-module 362 of the subband de-waving components X k, l, i to obtain the denoised signal X k, l from the modules | X k, l, i | and phases θ k, 1 , such that the output unedited signal SD k, 1 corresponds to the denoised signal X k, 1 , ie SD k, l = X k, l .

D'un point de vue mathématique, on a :

  • le sous-module racine-carré 361 réalise le calcul : X ^ k , l = X ^ k , l 2 ;
    Figure imgb0053
    et
  • le sous-module de recombinaison 362 effectue la réinjection de la phase, comme suit : SDk,l = X̂k,l = |X̂k,l| cos θk,l + j |X̂k,l| sin θk,l.
From a mathematical point of view, we have:
  • the root-square sub-module 361 performs the calculation: X ^ k , l = X ^ k , l 2 ;
    Figure imgb0053
    and
  • the recombination submodule 362 performs the reinjection of the phase, as follows: SD k, l = X k, l = | X k, l | cos θ k, l + j | X k, l | sin θ k, l .

Dans le second mode de réalisation illustré sur la figure 2, le module de détermination 36 du signal débruité de sortie SDk,l comprend :

  • en sortie du premier module d'extraction 31, un sous-module d'amplification 363 selon un coefficient d'amplification γ, préférentiellement compris entre 0,01 et 0,1, afin de délivrer un signal amplifié γ |Yk,l|2 ;
  • en sortie du module d'estimation « SSMB » 35, un sous-module additionneur 364 propre à additionner le signal amplifié γ |Yk,l|2 et les modules carré |X̂k,l,i|2, afin de délivrer en sortie les module carré |X̂k,l,i|2 de composantes débruitées combinées de sous-bande X̂k,l,i propres à chaque sous-bande SBi d'un signal débruité combiné X̂k,l, répondant à l'équation correspondante : X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2 ;
    Figure imgb0054
  • un sous-module racine-carré 361 pour calculer le module |X̂k,l,i| des composantes débruitées combinées de sous-bande X̂k,l,i ; et
  • un sous-module de recombinaison 362 des composantes combinées de sous-bande X̂k,l,i pour obtenir le signal débruité combiné X̂k,l, à partir des modules |X̂k,l,i| et des phases θk,l, de sorte que le signal débruité de sortie SDk,l correspond au signal débruité combiné X̂k,l, soit SDk,l =k,l.
In the second embodiment illustrated on the figure 2 , the determination module 36 of the output denoised signal SD k, 1 comprises:
  • at the output of the first extraction module 31, an amplification sub-module 363 according to an amplification coefficient γ, preferably between 0.01 and 0.1, in order to deliver an amplified signal γ | Y k, l | 2 ;
  • at the output of the estimation module "SSMB" 35, an adder sub-module 364 capable of adding the amplified signal γ | Y k, l | 2 and the square modules | X k, l, i | 2 , in order to output the square modules | x k, l, i | 2 of combined de-banded components of sub-band X k, l, i specific to each sub-band SBi of a combined de-signaled signal X k, l , responding to the corresponding equation: X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2 ;
    Figure imgb0054
  • a root-square sub-module 361 for calculating the module | X k, l, i | combined de-banded components of sub-band X k, l, i ; and
  • a recombination sub-module 362 of the combined sub-band components X k, l, i to obtain the combined de-signaled signal X k, l , from the modules | X k, l, i | and phases θ k, 1 , so that the output unedited signal SD k, 1 corresponds to the combined de-noise signal X k, 1 , ie SD k, l = X k, l .

D'un point de vue mathématique, on a :

  • le sous-module d'amplification 363 délivre en sortie le signal amplifié γ Y k , l 2 ;
    Figure imgb0055
  • le sous-module additionneur 364 réalise le calcul : X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2
    Figure imgb0056
  • le sous-module racine-carré 361 réalise le calcul : X k , l , i = X k , l , i 2 ;
    Figure imgb0057
    et
  • le sous-module de recombinaison 362 effectue la réinjection de la phase, comme suit : SDk,l =k,l = |X̂k,l| cos θ k,l + j |X̂k,l| sin θ k,l
From a mathematical point of view, we have:
  • the amplification sub-module 363 outputs the amplified signal γ Y k , l 2 ;
    Figure imgb0055
  • the adder submodule 364 performs the calculation: X k , l , i 2 = X ^ k , l , i 2 + γ Y k , l , i 2
    Figure imgb0056
  • the root-square sub-module 361 performs the calculation: X k , l , i = X k , l , i 2 ;
    Figure imgb0057
    and
  • the recombination submodule 362 performs the reinjection of the phase, as follows: SD k, l = X k, l = | X k, l | cos θ k, l + j | X k, l | sin θ k, l

Ainsi, dans ce second mode de réalisation, le système 1 met en oeuvre une étape de réinjection d'une partie très faible du signal bruité Yk,l, issu du microphone, dans le signal débruité X̂k,l ; le signal réinjecté correspondant au signal amplifié γ |Yk,l|2. De cette manière, on remédie au moins en partie aux problèmes de distorsion introduits par les modules d'estimation « MCRA » 33 et « SSMB » 35.Thus, in this second embodiment, the system 1 implements a step of reinjection of a very small part of the noisy signal Y k , 1 , coming from the microphone, into the denoised signal X k, l ; the reinjected signal corresponding to the amplified signal γ | Y k, l | 2. In this way, at least some of the distortion problems introduced by the "MCRA" 33 and "SSMB" estimation modules 35 are remedied.

Le système 1 comprend, en sortie de l'unité de traitement numérique 3, une unité de conversion 4 dans le domaine temporel.The system 1 comprises, at the output of the digital processing unit 3, a conversion unit 4 in the time domain.

Cette unité de conversion 4 comporte un module de calcul 41 d'un signal de sortie Sdl propre à chaque trame temporelle I pair application d'une transformée de Fourier inverse du signal débruité de sortie SDk,l.This conversion unit 4 comprises a calculation module 41 of an output signal Sd 1 specific to each time frame I by the application of an inverse Fourier transform of the output denoised signal SD k, l .

D'un point de vue mathématique, ce module de calcul 41 met en oeuvre le calcul de la transformée de Fourier rapide inverse (IFFT pour « Inverse Fast Fourier Transform ») avec une taille N égale à 256 (N correspondant pour rappel au nombre de points de la transformée de Fourier), avec la relation suivante : Sd 1 = IDFT SD k , l

Figure imgb0058

où IDFT correspond à la fonction de transformée de Fourier discrète inverse, qui peut être du type transformée de Fourier rapide inverse (IFFT).From a mathematical point of view, this calculation module 41 implements the calculation of the inverse fast Fourier Transform (IFFT) with a size N equal to 256 (N corresponding to the number of points of the Fourier transform), with the following relation: sd 1 = IDFT SD k , l
Figure imgb0058

where IDFT corresponds to the inverse discrete Fourier transform function, which can be of the inverse fast Fourier transform (IFFT) type.

En outre, du fait de la symétrie de l'amplitude de la transformée de Fourier (DFT ou FFT) des signaux réels, le traitement de réduction du bruit et de reconstruction selon la méthode « OLA » se fera uniquement sur les premiers [N/2 + 1] premiers points d'échantillonnage, soit sur les 129 premiers points d'échantillonnage pour N égal à 256, sachant que l'on a la relation suivante de symétrie hermitienne : SD - k , l = SD k , l *

Figure imgb0059
In addition, due to the symmetry of the Fourier transform (DFT or FFT) amplitude of the real signals, the noise reduction and reconstruction processing according to the "OLA" method will be done only on the first [N / 2 + 1] first sampling points, ie on the first 129 sampling points for N equal to 256, knowing that we have the following Hermitian symmetry relation: SD - k , l = SD k , l *
Figure imgb0059

Dans le cas du premier mode de réalisation illustré sur la figure 1, on a la relation suivante : Sdl = x̂l = IFFT(X̂k,l).In the case of the first embodiment illustrated on the figure 1 we have the following relation: Sd l = x l = IFFT (X k, l ).

Dans le cas du second mode de réalisation illustré sur la figure 2, on a la relation suivante : Sdl = x̂l = IFFT(X̂k,l).In the case of the second embodiment illustrated on the figure 2 we have the following relation: Sd l = x l = IFFT (X k, l ).

Cette unité de conversion 4 comporte, en sortie du module de calcul 41, un module de reconstruction 42 d'un signal vocal débruité de sortie sd(t) dans le domaine temporel à partir des signaux de sortie Sdl.This conversion unit 4 comprises, at the output of the calculation module 41, a reconstruction module 42 of a speech output signal sd (t) in the time domain from the output signals Sd 1 .

Le signal temporel est restitué selon la méthode de recouvrement et addition « OLA », la reconstruction du signal vocal débruité de sortie sd(t) étant réalisée par les additions successives des parties en recouvrement des signaux de deux trames temporelles successives, selon le principe : sd ˜ l = Sd l - 1 + Sd l ,

Figure imgb0060

qui se traduit dans le premier mode de réalisation par : sd ˜ l = x ^ l - 1 + x ^ l ,
Figure imgb0061
et qui se traduit dans le second mode de réalisation par : sd ˜ 1 = s l - 1 + x l .
Figure imgb0062
The temporal signal is restored according to the "OLA" overlay and addition method, the reconstruction of the output defracked speech signal sd (t) being performed by the successive additions of the parts in recovery of the signals of two successive time frames, according to the principle: sd ~ l = sd l - 1 + sd l ,
Figure imgb0060

which is translated in the first embodiment by: sd ~ l = x ^ l - 1 + x ^ l ,
Figure imgb0061
and which is translated in the second embodiment by: sd ~ 1 = s l - 1 + x l .
Figure imgb0062

A chaque fois qu'une trame temporelle du signal débruité de sortie SDk,l est délivrée dans le domaine fréquentiel et que sa transformée de Fourier inverse Sdl est calculée, les premiers N/2 points d'échantillonnage seront additionnés avec les derniers N/2 points d'échantillonnage de la trame traitée précédente. Les derniers N/2 points d'échantillonnage de la trame traitée en cours seront quand à eux stockés en mémoire pour être à leur tour utilisés lors du traitement de la trame suivante.Whenever a time frame of the output denoised signal SD k , l is delivered in the frequency domain and its inverse Fourier transform Sd l is computed, the first N / 2 sampling points will be added together with the last N / 2 sampling points of the previous processed frame. The last N / 2 sampling points of the current processed frame will be stored in memory for use in processing the next frame.

Autrement dit, après traitement dans le domaine spectral, la trame temporelle du signal débruité de sortie SDk,l passe par le module de calcul 41 de la transformée de Fourier inverse, puis sa première moitié (N/2 premiers points d'échantillonnage) est additionnée avec la seconde moitié (N/2 derniers points d'échantillonnage) sauvegardée de la trame précédente, tandis que sa seconde moitié (N/2 premiers points d'échantillonnage) est sauvegardée pour le prochain bloc.In other words, after processing in the spectral domain, the time frame of the output denoised signal SD k, 1 passes through the calculation module 41 of the inverse Fourier transform, then its first half (N / 2 first sampling points). is added with the second half (N / 2 last sampling points) saved from the previous frame, while its second half (N / 2 first sampling points) is saved for the next block.

Avec N égal à 256, on a N/2 qui est égal à 128, étant rappelé que le taux de recouvrement de deux trames successives est de cinquante pourcent (50 %).With N equal to 256, we have N / 2 which is equal to 128, being reminded that the recovery rate of two successive frames is fifty percent (50%).

De manière optionnelle et avantageuse, l'unité de traitement numérique 3 comprend en outre, en sortie du module d'estimation « MCRA » 33, un module de détection du bruit 37 qui pilote le module de reconstruction 42 selon le principe suivant :

  • mise en oeuvre d'un calcul d'un rapport moyen signal à bruit rl pour effectuer une détection de bruit ;
  • comparaison de ce rapport moyen signal à bruit rl avec un seuil ψTH pour établir si le bruit est présent (rl < ψTH) ou si le bruit est absent ou du moins extrémement faible (rl > ψTH) ; et
  • pilotage du module de reconstruction 42 selon les règles suivantes :
  • si le bruit est présent (rl < ψTH), alors on prend en compte le signal traité numériquement, c'est-à-dire le signal de sortie Sdl pour la reconstruction temporelle ;
  • si le bruit est absent ou extrémement faible (rl > ψTH), alors on ne prend pas en compte le signal de sortie Sdl mais on prend en compte directement le signal échantillonné yl pour la reconstruction temporelle, ce qui revient à ignorer les traitements de réduction du bruit (« MCRA », « SSMB ») pour cette trame I, avec l'avantage d'éviter des distorsions inutiles lorsque le niveau de bruit est tel qu'un traitement de réduction du bruit n'est pas nécessaire.
In an optional and advantageous manner, the digital processing unit 3 further comprises, at the output of the estimation module "MCRA" 33, a noise detection module 37 which drives the reconstruction module 42 according to the following principle:
  • implementing a calculation of a signal-to-noise average ratio r 1 for performing noise detection;
  • comparing this signal to noise ratio r 1 with a threshold ψ TH to establish whether the noise is present (r lTH ) or if the noise is absent or at least extremely low (r l > ψ TH ); and
  • driving the reconstruction module 42 according to the following rules:
  • if the noise is present (r lTH ), then we take into account the digitally processed signal, that is to say the output signal Sd l for time reconstruction;
  • if the noise is absent or extremely weak (r l > ψ TH ), then we do not take into account the output signal Sd l but we take into account directly the sampled signal y l for the time reconstruction, which amounts to ignoring noise reduction processing ("MCRA", "SSMB") for this frame I, with the advantage of avoiding unnecessary distortions when the noise level is such that a noise reduction treatment is not necessary .

De ce fait, dans une situation d'absence ou quasi absence de bruit, les distorsions qui peuvent être apportées par le traitement de réduction du bruit seront éliminées.Therefore, in a situation of absence or near absence of noise, the distortions that can be made by the noise reduction treatment will be eliminated.

D'un point de vue structurel, le module de détection du bruit 37 comprend :

  • un module de calcul d'un rapport moyen signal à bruit rl propre à chaque trame temporelle 1 à partir du module carré |Yk,l|2 et de la composante de bruit Dk,l;
  • un module de comparaison du rapport moyen signal à bruit rl propre à chaque trame temporelle I avec un seuil ψTH prédéterminé ;
  • un module de contrôle du module de reconstruction 42 du signal vocal débruité de sortie sd(t) qui est conçu pour que :
    • si le rapport moyen signal à bruit rl est inférieur audit seuil ψTH pour la trame temporelle I, alors le signal considéré avant reconstruction pour cette trame temporelle I correspond au signal de sortie Sdl issu du module de calcul dudit signal de sortie Sdl ;
    • si le rapport moyen signal à bruit rl est supérieur audit seuil ψTH pour la trame temporelle I, alors le signal considéré avant reconstruction pour cette trame temporelle I correspond au signal échantillonné yl issu du module de découpage du signal acoustique bruité y(t).
From a structural point of view, the noise detection module 37 comprises:
  • a module for calculating a signal-to-noise average ratio r 1 specific to each time frame 1 from the square module | Y k, l | 2 and the noise component D k, l ;
  • a module for comparing the average signal-to-noise ratio r 1 for each time frame I with a predetermined threshold ψ TH ;
  • a module of control of the reconstruction module 42 of the output speech signal noiseless output sd (t) which is designed so that:
    • if the average signal-to-noise ratio r 1 is less than said threshold ψ TH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the output signal Sd 1 from the calculation module of said output signal Sd l ;
    • if the average signal-to-noise ratio r l is greater than said threshold ψ TH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the sampled signal y 1 from the noisy acoustic signal cutting module y (t ).

D'un point de vue mathématique, le module de détection du bruit 37 met en oeuvre l'algorithme de calcul suivant, pour chaque trame temporelle l:

  1. g.1) calcul d'une composante de bruit moyenne Dl à partir de la composante de bruit D̂k,l estimée par le module d'estimation « MCRA » 33 et répondant à l'équation : D 1 = 1 M k = 0 M - 1 D ^ k , l
    Figure imgb0063

    où M est une constante prédéterminée égale à N/2, N étant pour rappel le nombre de points de la transformée de Fourier ;
  2. g.2) calcul d'un module carré moyen |Yk,l|2 du signal bruité Yk,l répondant à l'équation : Y k , l 2 = 1 M k = 0 M - 1 Y k , l 2
    Figure imgb0064
  3. g.3) calcul d'une composante filtrée Pl du module carré moyen |Yk,l|2 répondant à l'équation : P 1 = λ P l - 1 + 1 - λ Y k , l 2
    Figure imgb0065

    où - λ est une constante prédéterminée caractéristique d'un filtre passe-bas, de préférence compris entre 0,80 et 0,99 ;
    • P 0 = D 0 = 1 M k = 0 M - 1
      Figure imgb0066
      k,0 pour initialiser l'algorithme.
  4. g.4) calcul du rapport moyen signal à bruit rl répondant à l'équation :
    • si D l > 0 alors r l = P l D l ,
      Figure imgb0067
    • si D l < 0 alors rl = 0.
From a mathematical point of view, the noise detection module 37 implements the following calculation algorithm, for each time frame 1:
  1. g.1) calculation of an average noise component D l from the noise component D k, l estimated by the estimation module "MCRA" 33 and corresponding to the equation: D ~ 1 = 1 M Σ k = 0 M - 1 D ^ k , l
    Figure imgb0063

    where M is a predetermined constant equal to N / 2, N being for reference the number of points of the Fourier transform;
  2. g.2) calculating a mean square module | Y k, l | 2 of the noisy signal Y k, l corresponding to the equation: Y k , l 2 ~ = 1 M Σ k = 0 M - 1 Y k , l 2
    Figure imgb0064
  3. g.3) calculating a filtered component P l of the average square module | Y k, l | 2 answering the equation: P 1 = λ P l - 1 + 1 - λ Y k , l 2 ~
    Figure imgb0065

    where - λ is a predetermined constant characteristic of a low-pass filter, preferably between 0.80 and 0.99;
    • P 0 = D ~ 0 = 1 M Σ k = 0 M - 1
      Figure imgb0066
      D k, 0 to initialize the algorithm.
  4. g.4) calculation of the average signal to noise ratio r l corresponding to the equation:
    • if D l > 0 then r l = P l D ~ l ,
      Figure imgb0067
    • if D l <0 then r l = 0.

Bien entendu l'exemple de mise en oeuvre évoqué ci-dessus ne présente aucun caractère limitatif et d'autres améliorations et détails peuvent être apportés au système de réduction selon l'invention, sans pour autant sortir du cadre de l'invention.Of course the implementation example mentioned above is not limiting and other improvements and details can be made to the reduction system according to the invention, without departing from the scope of the invention.

Ainsi, il est envisageable de se passer de l'extraction de la phase de la phase θk,l, du signal bruité Yk,l comme illustré sur la figure 3 où le système 1 ne comporte pas le deuxième module d'extraction 32 de la phase θ k,l du signal bruité Yk,l. Dans ce cas, le sous-module de recombinaison 362 des composantes débruitées de sous-bande X̂k,l,i effectue le calcul du signal débruité X̂k,l à partir des modules |Xk,l,i| et du signal bruité Yk,l, En effet, la réinjection de la phase peut être effectuée directement à partir du signal bruité Yk,l qui intègre intrinsèquement cette phase.Thus, it is conceivable to dispense with the extraction of the phase of the phase θ k, 1, from the noisy signal Y k, l as illustrated in FIG. figure 3 where the system 1 does not include the second extraction module 32 of the phase θ k, 1 of the noisy signal Y k, l . In this case, the recombination sub-module 362 of the de-banded components of sub-band X k, l, i calculates the denoised signal X k, l from the modules | X k, l, i | and the noisy signal Y k, l , Indeed, the reinjection of the phase can be carried out directly from the noisy signal Y k, l which intrinsically integrates this phase.

A cet effet, le sous-module de recombinaison 362 réalise le calcul suivant : X ^ k , l = X ^ k , l r k , l Y k , l + j X ^ k , l i k , l Y k , l = G k , l r k , l + j G k , l i k , l ,

Figure imgb0068
soit X̂k,l = Gk,l Yk,l.For this purpose, the recombination sub-module 362 performs the following calculation: X ^ k , l = X ^ k , l r k , l Y k , l + j X ^ k , l i k , l Y k , l = BOY WUT k , l r k , l + j BOY WUT k , l i k , l ,
Figure imgb0068
let X k, l = G k, l Y k, l .

Avec Gk,l le gain de l'algorithme de reduction de bruit. Avec ce calcul, il n'est donc plus nécessaire de calculer, stocker et réinjecter la phase.With G k, l the gain of the noise reduction algorithm. With this calculation, it is no longer necessary to calculate, store and reinject the phase.

Le système 1 de la figure 3 est une variante du système 1 de la figure 2 sans le deuxième module d'extraction 32, mais il est bien entendu également envisageable de prévoir la suppression du deuxième module d'extraction 32 dans le système 1 de la figure 1.System 1 of the figure 3 is a variant of the system 1 of the figure 2 without the second extraction module 32, but it is of course also conceivable to provide for the removal of the second extraction module 32 in the system 1 of the figure 1 .

Claims (12)

  1. A method for reducing noise on a noisy acoustic signal y(t) from a microphone operating in a noisy environment, including the following successive steps:
    a) converting the noisy acoustic signal y(t) in the time domain into a noisy signal Yk,l in the frequency domain, by time slicing the noisy acoustic signal y(t) into sampled signals yl into successive time frames I, windowing the sampled signals yl by applying a weighting window, and applying a discrete Fourier transform, with extraction of the square module |Yk,l|2, and possibly the phase θk,l, from the noisy signal Yk,l;
    b) estimating a noise component D̂k,l contained in the noisy signal Yk,l from the square module |Yk,l|2, by an algorithm of power spectral density estimation of the noise component according to a method of minima controlled recursive averaging called "MCRA";
    characterized in that it further comprises, after the step b), the following successive steps:
    c) slicing the frequency band into several frequency sub-bands SBi=[ei, bi], followed by multi-band decomposing the square module |Yk,l|2 and the noise component D̂k,l, consisting in decomposing the square module |Yk,l|2 and the noise component D̂k,l, into respectively several square modules of sub-band |Yk,l,i|2 and several noise components of sub-band D̂k,l,i specific to each sub-band SBi;
    d) estimating, for each sub-band SBi, the square module |X̂k,l,i|2 of a denoised component of sub-band X̂k,l,¡ specific to each sub-band SBi of a denoised signal X̂k,l, by an algorithm of multi-band spectral subtraction called "SSMB" from the square modules of sub-band |Yk,l,i|2 and noise components of sub-band D̂k,l,i;
    e) determining an output denoised signal SDk,l from the square modules |X̂k,l,i|2 from step d), and possibly the phases θk,l extracted during step a);
    f) converting the output denoised signal SDk,l into an output denoised vocal signal sd(t) in the time domain, by a step f.1) of calculating an output sampled signal sdl specific to each time frame I by applying an inverse Fourier transform of the output denoised signal SDk,l, followed by a step f.2) of time reconstructing the output denoised vocal signal sd(t) from the output sampled signals sdl;
    and wherein the step e) consists of:
    - determining, for each sub-band SBi, the square module X k , l , i 2
    Figure imgb0133
    of a combined denoised component of sub-band X k , l , i
    Figure imgb0134
    specific to each sub-band SBi of a combined denoised signal X k , l ,
    Figure imgb0135
    satisfying the corresponding equation: X k , l , i 2 = X k , l , i 2 + γ Y k , l , i 2
    Figure imgb0136
    where γ is a predetermined amplification coefficient, preferably ranging between 0.01 and 0.1;
    - determining a combined denoised signal X k , l
    Figure imgb0137
    from the square modules
    X k , l , i 2
    Figure imgb0138
    of the combined denoised components of sub-band X k , l , i ,
    Figure imgb0139
    and possibly the phases θk,l extracted during the step a), such that the output denoised signal SDk,l corresponds to the combined denoised signal X k , l ,
    Figure imgb0140
    namely SD k , l = X k , l .
    Figure imgb0141
  2. The method according to claim 1, wherein the algorithm of power spectral density estimation of the noise component according to the method of minima controlled recursive averaging called "MCRA" during step b) implements the following calculation phases:
    b.1) calculating a filtered noisy component Sk,l satisfying the equation: S k , l = α s S k , l - 1 + 1 - α s Y k , l 2
    Figure imgb0142

    where αs is a predetermined constant characteristic of a low-pass filter;
    b.2) calculating a speech presence probability density p̃k,l by implementing the following progressive calculation:
    (i) calculating a spectral minimum component Smink,l with:
    - if rem(k,l) = 0
    then Smink,l = min (Smink,l-1; Sk,l) and Stmpk,l = Sk,l
    - if rem(k,l) ≠ 0
    then Smink,l = min (Stmpk,l-1; Sk,l) and
    Stmpk,l = min (Stmpk,l-1; Sk,l)
    where rem(k,l) is the rest of the integer division of k by I, then
    (ii) calculating a spectral ratio Srk,l satisfying the equation: Sr k , l = S k , l Smin k , l
    Figure imgb0143
    (iii) calculating an indicator variable Ik,l with:
    - if Srk,l > δTH then Ik,l = 1
    - if Srk,l ≤ δTH then Ik,l = 0
    where δTH is a fixed threshold predetermined parameter of speech detection;
    (iv) calculating the speech presence probability density p̃k,l with:
    k,l = αpk,l-1 + (1 - αp) Ik,l
    where αp is a predetermined constant;
    b.3) calculating a coefficient α̃k,l satisfying the following equation:
    α̃k,l = α + (1 - α) p̃k,l,
    where α is a predetermined constant;
    b.4) calculating the noise component D̂k,l satisfying the following equation: D ^ k , l = α ˜ k , l D ^ k , l - 1 + 1 - α ˜ k , l Y k , l 2 .
    Figure imgb0144
  3. The method according to any one of claims 1 and 2, wherein the algorithm of multi-band spectral subtraction called "SSMB" of step d) implements the following calculation phases, for each sub-band SBi:
    d.1) calculating a signal-to-noise ratio SNRk,l,i specific to each sub-band SBi satisfying the following equation: SNR k , l , i = 10. log 10 Σ k = ei bi Y k , l , i 2 Σ k = ei bi D ^ k , l , i
    Figure imgb0145
    d.2) calculating the square module |X̂k,l,i|2 of the denoised component of sub-band X̂k,l,i specific to each sub-band SBi, according to the equation: X ^ k , l , i 2 = { Y k , l , i 2 - α i δ i D ^ k , l , i if Y k , l , i 2 > α i δ i D ^ k , l , i β Y k , l , i 2 if Y k , l , i 2 α i δ i D ^ k , l , i
    Figure imgb0146

    where - δi is a variable parameter according to the corresponding sub-band SBi, taking distinct values from one sub-band to another;
    - αi is a variable parameter which depends on the value of the signal-to-noise ratio SNRk,l,i calculated in the corresponding sub-band SBi; and
    - β is a constant.
  4. The method according to claim 3, wherein the parameters αi satisfy the following equations: α i = { α c 1 if SNR k , l , i < SNR 1 α c 2 + α c 3 SNR k , l , i if SNR 1 SNR k , l , i SNR 2 α c 4 if SNR k , l , i > SNR 2
    Figure imgb0147

    where αc1, αc2, αc3 and αc4 are predetermined constants, and SNR1 and SNR2 are predetermined thresholds.
  5. The method according to any one of claims 1 to 4, wherein the step e) consists of determining the denoised signal Xk,l from the square modules |X̂k,l,i|2 of the denoised components of sub-band Xk,l,i, and possibly of phases θk,l extracted during step a), such that the denoised output signal SDk,l corresponds to the denoised signal X̂k,l, namely SDk,l = X̂k,l.
  6. The method according to any one of claims 1 to 5, wherein the step f.2) consists of reconstructing the output denoised vocal signal sd(t) only from the output signals Sdl from the step f.1), said output signals Sdl corresponding to the inverse Fourier transforms of the output denoised signal SDk,l specific to each time frame I.
  7. The method according to any one of claims 1 to 5, wherein the step f.2) consists, for each time frame I of:
    g) calculating a mean signal-to-noise ratio rl specific to the time frame I from the square module |Yk,l|2 and the noise component D̂k,l;
    h) comparing the mean signal-to-noise ratio rl with a predetermined threshold ψTH;
    i) reconstructing the output denoised vocal signal sd(t) by taking into consideration that:
    - if the mean signal-to-noise ratio rl is lower than said threshold ψTH for the time frame I, then the considered signal before time reconstruction for this time frame I corresponds to the output signal Sdl from step f.1);
    - if the mean signal-to-noise ratio rl is higher than said threshold ψTH for the time frame I, then the considered signal before time reconstruction for this time frame I corresponds to the sampled signal yl from the slicing step of step a).
  8. The method according to claim 7, wherein the step g) implements the following calculation algorithm, for each time frame I:
    g.1) calculating a mean noise component D 1 from the noise component D̂k,l estimated during the step b) and satisfying the equation: D l = 1 M Σ k = 0 M - 1 D ^ k , l
    Figure imgb0148

    where M is a predetermined constant, preferably equal to N or to N/2, N being the number of sampling points of the Fourier transform;
    g.2) calculating a mean square module |Yk,l|2 of the noisy signal Yk,l satisfying the equation: Y k , l 2 = 1 M Σ k = 0 M - 1 Y k , l 2
    Figure imgb0149
    g.3) calculating a filtered component Pl of the mean square module |Yk,l|2 satisfying the equation: P l = λ P l - 1 + 1 - λ Y k , l 2
    Figure imgb0150

    where - λ is a predetermined constant characteristic of a low-pass filter, preferably ranging between 0.80 and 0.99;
    - P 0 = D 0 = 1 M k = 0 M - 1 D ^ k , 0
    Figure imgb0151

    for initializing the algorithm.
    g.4) calculating the mean signal-to-noise ratio rl satisfying the equation:
    - if Dl > 0 then r 1 = P 1 D 1
    Figure imgb0152
    - if Dl ≤ 0 then rl = 0.
  9. The method according to any one of the preceding claims, wherein the steps a) and f) of conversion implement an overlap-add method called "OLA", with:
    - for step a), a slicing of the noisy acoustic signal y(t) into time frames with an overlapping between the successive time frames;
    - for step f.2), the reconstructing of the output denoised vocal signal sd(t) is achieved by the successive additions of the overlapping portions of the signals of two successive time frames.
  10. A system (1) for reducing noise on a noisy acoustic signal y(t) from a microphone operating in a noisy environment, comprising:
    - a unit (2) for converting the noisy acoustic signal y(t) in the time domain into a noisy signal Yk,l in the frequency domain, including:
    - a module (21) for slicing the noisy acoustic signal y(t) into sampled signals yl in successive time frames I;
    - at the output of the slicing module (21), a module (22) for windowing the sampled signals yl by applying a weighting window;
    - at the output of the windowing module (22), a module (23) for calculating a discrete Fourier transform which outputs the noisy signal Yk,l;
    - a digital processing unit (3) in the frequency domain including, at the output of the conversion unit:
    - a first module (31) for extracting the square module |Yk,l|2 from the noisy signal Yk,l; and possibly a second module (32) for extracting the phase θ k,l from the noisy signal Yk,l;
    - at the output of the first extraction module (31), an estimation module (33) called "MCRA", for estimating a noise component D̂k,l contained in the noisy signal Yk,l from the square module |Yk,l|2 from the first extraction module (31), by an algorithm of power spectral density estimation of the noise component according to a minima controlled recursive averaging method called "MCRA";
    - at the output of the first extraction module (31), a module (34) for slicing the frequency band into several frequency sub-bands SBi=[ei, bi], in particular of filter bank type;
    - at the output of the estimation module "MCRA" (33) and the module (34) for slicing the frequency band, an estimation module (35), called "SSMB", for estimating the square module |X̂k,l,i|2 of a denoised component of sub-band X̂k,l,i specific to each sub-band SBi of a denoised signal X̂k,l, by a multi-band spectral subtraction algorithm from the square modules of sub-bands |Yk,l,i|2 and noise components of sub-band D̂k,l,i;
    - at the output of the estimation module "SSMB" (35), and possibly the second extraction module (32), a module (36) for determining an output denoised signal SDk,l from the square module |X̂k,l,i|2 and possibly the phases θk,l;
    - a conversion unit (4) in the time domain including, at the output of the digital processing unit (3):
    - a module (41) for calculating an output signal Sdl specific to each time frame I by applying an inverse Fourier transform of the output denoised signal SDk,l ; and
    - a module (42) for reconstructing an output denoised vocal signal sd(t) in the time domain from said output signals Sdl;
    wherein the module (36) for determining an output denoised signal SDk,l comprises:
    - at the output of the first extraction module (31), an amplification sub-module (363) according to an amplification coefficient γ, preferably ranging between 0.01 and 0.1 in order to output an amplified signal γ |Yk,l|2 ;
    - at the output of the estimation module "SSMB" (35), an adder sub-module (364) suitable for adding the amplified signal γ |Yk,l|2 and the square modules |Xk,l,i|2, in order to output the square module |Xk,l,i|2 of combined denoised components of sub-band X k , l , i
    Figure imgb0153
    specific to each sub-band SBi of a combined denoised signal X k , l , i ,
    Figure imgb0154
    satisfying the corresponding equation: X k , l , i 2 = X k , l , i 2 + γ Y k , l , i 2 ;
    Figure imgb0155
    - a square root sub-module (361) for calculating the module X k , l , i
    Figure imgb0156
    of the combined denoised components of sub-band X k , l , i ;
    Figure imgb0157
    and
    - a sub-module (362) for recombining combined components of sub-band X k , l , i
    Figure imgb0158
    in order to obtain the combined denoised signal X k , l ,
    Figure imgb0159
    from the modules | X k , l , i ,
    Figure imgb0160
    and possibly the phases θ k,l, such that the output denoised signal SDk,l corresponds to the combined denoised signal X k , l ,
    Figure imgb0161
    namely SD k , l = X k , l .
    Figure imgb0162
  11. The system (1) according to claim 10, wherein the module (36) for determining the output denoised signal SDk,l comprises:
    - a square root sub-module (361) for calculating the module |X̂k,l,i| of the denoised components of sub-band X̂k,l,i; and
    - a sub-module (362) for recombining the denoised components of sub-band X̂k,l,i in order to obtain the denoised signal Rk,l based on the modules |X̂k,l,i|, and possibly the phases θk,l, such that the output denoised signal SDk,l corresponds to the denoised signal Rk,l, namely SDk,l = X̂k,l.
  12. The system (1) according to any one of claims 10 and 11, wherein the digital processing unit (3) further comprises, at the output of the estimation module "MCRA" (33), a noise detection module (37) comprising
    - a module for calculating a mean signal-to-noise ratio rl specific to each time frame I from the square module |Yk,l|2 and the noise component D̂k,l;
    - a module for comparing the mean signal-to-noise ratio rl specific to each time frame I with a predetermined threshold ψTH;
    - a module for controlling the module (42) for reconstructing the output denoised vocal signal sd(t) which is designed in such a manner that:
    - if the mean signal-to-noise ratio rl is lower than said threshold ψTH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the output signal Sdl from the calculation module of said output signal Sdl;
    - if the mean signal-to-noise ratio rl is higher than said threshold ψTH for the time frame I, then the signal considered before reconstruction for this time frame I corresponds to the sampled signal yl from the module for slicing the noisy acoustic signal y(t).
EP20120163679 2011-04-22 2012-04-11 Method and system for noise reduction Not-in-force EP2515300B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1153507A FR2974443B1 (en) 2011-04-22 2011-04-22 METHOD AND SYSTEM FOR REDUCING NOISE

Publications (2)

Publication Number Publication Date
EP2515300A1 EP2515300A1 (en) 2012-10-24
EP2515300B1 true EP2515300B1 (en) 2014-05-14

Family

ID=44243603

Family Applications (1)

Application Number Title Priority Date Filing Date
EP20120163679 Not-in-force EP2515300B1 (en) 2011-04-22 2012-04-11 Method and system for noise reduction

Country Status (4)

Country Link
EP (1) EP2515300B1 (en)
ES (1) ES2492698T3 (en)
FR (1) FR2974443B1 (en)
PT (1) PT2515300E (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111854920A (en) * 2020-07-24 2020-10-30 贵州电网有限责任公司 Preprocessing method and system based on DVS vibration monitoring signal
CN113367676B (en) * 2021-06-07 2022-06-21 广东电网有限责任公司 PPG motion noise filtering method and device for wearable equipment
CN116495946B (en) * 2023-06-27 2023-10-13 珠江水利委员会珠江水利科学研究院 Comprehensive treatment method and system for urban rainwater sewage interception, regulation and dredging

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1326479B2 (en) * 1997-04-16 2018-05-23 Emma Mixed Signal C.V. Method and apparatus for noise reduction, particularly in hearing aids

Also Published As

Publication number Publication date
EP2515300A1 (en) 2012-10-24
FR2974443B1 (en) 2013-04-26
PT2515300E (en) 2014-08-27
ES2492698T3 (en) 2014-09-10
FR2974443A1 (en) 2012-10-26

Similar Documents

Publication Publication Date Title
EP1356461B1 (en) Noise reduction method and device
EP1789956B1 (en) Method of processing a noisy sound signal and device for implementing said method
EP2002428B1 (en) Method for trained discrimination and attenuation of echoes of a digital signal in a decoder and corresponding device
EP2293594B1 (en) Method for filtering lateral non stationary noise for a multi-microphone audio device
EP1016072B1 (en) Method and apparatus for suppressing noise in a digital speech signal
US8010355B2 (en) Low complexity noise reduction method
EP2772916B1 (en) Method for suppressing noise in an audio signal by an algorithm with variable spectral gain with dynamically adaptive strength
FR2771542A1 (en) FREQUENTIAL FILTERING METHOD APPLIED TO NOISE NOISE OF SOUND SIGNALS USING A WIENER FILTER
EP0752181A1 (en) Frequency-domain adaptive-filter acoustic echo canceller
EP2936488B1 (en) Effective attenuation of pre-echos in a digital audio signal
EP1016071B1 (en) Method and apparatus for detecting speech activity
EP2515300B1 (en) Method and system for noise reduction
EP3192073B1 (en) Discrimination and attenuation of pre-echoes in a digital audio signal
EP1039736B1 (en) Method and device for adaptive identification and related adaptive echo canceller
EP1429316A1 (en) System and method for multi-referenced correction of spectral voice distortions introduced by a communication network
FR2906070A1 (en) Electronic voice signal preprocessing system for hands free mobile telephone, has non coherent filtering stage filtering output of coherent filtering stage such that signal is successively subjected to coherent and non coherent filterings
EP1016073B1 (en) Method and apparatus for suppressing noise in a digital speech signal
EP1021805B1 (en) Method and apparatus for conditioning a digital speech signal
FR2797343A1 (en) METHOD AND DEVICE FOR DETECTING VOICE ACTIVITY
FR2906071A1 (en) Electronic filter e.g. non-coherent filter, for e.g. hands-free mobile phone in vehicle, has control section limiting calibration gain such that variation threshold of calibration gain does not exceed preset variation threshold
EP4287648A1 (en) Electronic device and associated processing method, acoustic apparatus and computer program
BE1020218A3 (en) METHOD FOR IMPROVING THE TEMPORAL RESOLUTION OF INFORMATION PROVIDED BY A COMPOUND FILTER AND CORRESPONDING DEVICE THEREFOR.
WO1999027523A1 (en) Method for reconstructing sound signals after noise abatement
Malshikare et al. The Speech Enhancement through Elimination of Impulsive Disturbance Using Log MMSE Filtering
FR3054338A1 (en) METHOD OF CORRECTING DEFECTS INTRODUCED BY A SCANNING SYSTEM AND ASSOCIATED DEVICES

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

AX Request for extension of the european patent

Extension state: BA ME

17P Request for examination filed

Effective date: 20130308

REG Reference to a national code

Ref country code: DE

Ref legal event code: R079

Ref document number: 602012001676

Country of ref document: DE

Free format text: PREVIOUS MAIN CLASS: G10L0021020000

Ipc: G10L0021020800

GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 25/18 20130101ALN20131128BHEP

Ipc: G10L 21/0208 20130101AFI20131128BHEP

INTG Intention to grant announced

Effective date: 20131216

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 668811

Country of ref document: AT

Kind code of ref document: T

Effective date: 20140615

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602012001676

Country of ref document: DE

Effective date: 20140703

REG Reference to a national code

Ref country code: CH

Ref legal event code: NV

Representative=s name: CABINET GERMAIN ET MAUREAU, FR

REG Reference to a national code

Ref country code: PT

Ref legal event code: SC4A

Free format text: AVAILABILITY OF NATIONAL TRANSLATION

Effective date: 20140811

REG Reference to a national code

Ref country code: SE

Ref legal event code: TRGR

REG Reference to a national code

Ref country code: NL

Ref legal event code: VDEP

Effective date: 20140514

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140815

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140914

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140814

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602012001676

Country of ref document: DE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20150217

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602012001676

Country of ref document: DE

Effective date: 20150217

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: LU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20150411

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 5

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20150411

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: CH

Payment date: 20160315

Year of fee payment: 5

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: PT

Payment date: 20160317

Year of fee payment: 5

Ref country code: FR

Payment date: 20160310

Year of fee payment: 5

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: ES

Payment date: 20160504

Year of fee payment: 5

Ref country code: DE

Payment date: 20160316

Year of fee payment: 5

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: IT

Payment date: 20160412

Year of fee payment: 5

Ref country code: BE

Payment date: 20160421

Year of fee payment: 5

Ref country code: SE

Payment date: 20160415

Year of fee payment: 5

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 20160411

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20160411

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20120411

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

REG Reference to a national code

Ref country code: DE

Ref legal event code: R119

Ref document number: 602012001676

Country of ref document: DE

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

REG Reference to a national code

Ref country code: FR

Ref legal event code: ST

Effective date: 20171229

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20171103

Ref country code: FR

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170502

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170430

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170430

Ref country code: SE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170412

Ref country code: PT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20171011

REG Reference to a national code

Ref country code: BE

Ref legal event code: MM

Effective date: 20170430

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170411

Ref country code: BE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170430

REG Reference to a national code

Ref country code: AT

Ref legal event code: MM01

Ref document number: 668811

Country of ref document: AT

Kind code of ref document: T

Effective date: 20170411

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514

REG Reference to a national code

Ref country code: ES

Ref legal event code: FD2A

Effective date: 20180629

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170412

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20170411

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140514