FR2875633A1 - Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio - Google Patents

Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio Download PDF

Info

Publication number
FR2875633A1
FR2875633A1 FR0452087A FR0452087A FR2875633A1 FR 2875633 A1 FR2875633 A1 FR 2875633A1 FR 0452087 A FR0452087 A FR 0452087A FR 0452087 A FR0452087 A FR 0452087A FR 2875633 A1 FR2875633 A1 FR 2875633A1
Authority
FR
France
Prior art keywords
signal
noise
frame
loudness
noise reduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
FR0452087A
Other languages
English (en)
Inventor
Turbin Valerie Gauthier
Faucheur Nicolas Le
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0452087A priority Critical patent/FR2875633A1/fr
Priority to US11/663,233 priority patent/US20080255834A1/en
Priority to EP05802558A priority patent/EP1792305A1/fr
Priority to PCT/FR2005/002262 priority patent/WO2006032751A1/fr
Publication of FR2875633A1 publication Critical patent/FR2875633A1/fr
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

Selon l'invention, un procédé d'évaluation de l'efficacité d'une fonction de réduction de bruit destinée à être appli quée à des signaux audio , et comprenant une étape préalable d'obtention d'un signal audio prédéfini de test X[m] contenant un signal utile dépourvu de bruit, d'un signal bruité, Xb[m], obtenu en additionnant un signal de bruit prédéfini au signal de test X[m], et d'un signal traité Y[m], obtenu par application de la fonction de réduction de bruit au signal bruité Xb[m], est remarquable en ce qu'il inclut une étape (E3, E4) de mesures de sonie de tout ou partie des trames m des signaux X[m], Xb[m] et Y[m] précités.

Description

DESCRIPTION
La présente invention a trait de façon générale aux fonctions de réduction de bruit applicables à des signaux audio.
Plus précisément, l'invention concerne un procédé et un dispositif 10 d'évaluation de l'efficacité d'une fonction de réduction de bruit destinée à être appliquée à des signaux audio.
La présente invention vise en particulier à caractériser les performances d'une telle fonction de réduction de bruit appliquée à des signaux de parole.
Dans le domaine de la transmission de signaux audio, une fonction de réduction de bruit a pour but de réduire le niveau de bruit contenu dans un signal, de manière à améliorer la qualité subjective de la restitution sonore du signal, telle que perçue par les humains.
Dans le domaine particulier de la transmission de signaux de parole ou vocaux, une fonction de réduction de bruit appliquée à un signal d'entrée repose de manière générale sur une estimation en continu du niveau de bruit (bruit de fond ou bruit ambiant à l'émission) présent dans le signal d'entrée; sur une détection vocale permettant de distinguer les trames du signal d'entrée ne contenant que du bruit, de celles contenant de la parole (trames de parole active) ; et sur un filtrage du signal d'entrée de manière à réduire la contribution du bruit dans le signal.
Il est important de pouvoir mesurer l'efficacité d'une fonction de réduction de bruit, en particulier lorsqu'il s'agit de vérifier que des équipements de communication, incluant de telles fonctions et connectés à un réseau de transmission, sont conformes à des spécifications prédéfinies concernant la qualité vocale.
Les méthodes connues d'évaluation de l'efficacité d'une fonction de réduction de bruit (RB) repose sur des mesures objectives pour caractériser la fonction RB considérée.
Par exemple, une telle méthode consiste à calculer l'amélioration du Rapport Signal à Bruit (RSB) d'un signal de test, avant et après application de la fonction de réduction de bruit. Cette méthode est connue sous l'acronyme anglais SNRI pour "Signal to Noise Ratio lmprovemenf'. Pour obtenir plus d'informations relatives à ladite méthode SNRI, on pourra se reporter au document: "Draft Recommendation G.160 (Voice Enhancement Devices)'; Appendix Il, point 11.4 - "Objective measures for characterisation of NR algorithm effect"; ITU-T (International Telecomunication Union).
Cependant, les méthodes connues d'évaluation de l'efficacité d'une fonction de réduction de bruit (RB), telles que la méthode SNRI, bien qu'indicatives de l'efficacité d'une fonction de réduction de bruit donnée, ne sont pas suffisamment performantes car elles ne prennent aucunement en compte la perception humaine du signal traité par la fonction RB, pour caractériser son efficacité.
Or, il est connu qu'une fonction de réduction de bruit peut avoir, outre l'effet recherché de réduire le niveau de bruit dans un signal d'entrée, l'effet négatif de réduire simultanément le niveau sonore du signal utile contenu dans le signal d'entrée.
Dans le cadre de la transmission de signaux audio, l'atténuation du signal utile (signal vocal par exemple) par la fonction de réduction de bruit peut être préjudiciable à la perception sonore du signal audio résultant, par l'utilisateur final de l'équipement restituant le signal audio.
La présente invention vise par conséquent à fournir une méthode d'évaluation d'une fonction de réduction de bruit, dont l'efficacité est supérieure aux méthodes connues, du fait de la prise en compte de caractéristiques de la perception humaine dans le processus d'évaluation d'une fonction de réduction de bruit.
A cet effet, l'invention concerne, selon un premier aspect, un procédé d'évaluation de l'efficacité d'une fonction de réduction de bruit destinée à être appliquée à des signaux audio, ce procédé comprenant une étape préalable d'obtention d'un signal audio prédéfini de test X[m] contenant un signal utile dépourvu de bruit, d'un signal bruité, Xb[m], obtenu en additionnant un signal de bruit prédéfini au signal de test X[m] , et d'un signal traité Y[m], obtenu par application de la fonction de réduction de bruit au signal bruité Xb[m]. Conformément à l'invention, le procédé est remarquable en ce qu'il inclut une étape de mesures de sonie de tout ou partie des trames m des signaux X[m], Xb[m] et Y[m] précités.
Un tel procédé d'évaluation d'une fonction de réduction de bruit est nettement plus performant que les méthodes d'évaluation classiques, car il prend en compte une caractéristique relative à la perception auditive humaine (la sonie), calculée en particulier sur les trames des signaux de test et traité.
On rappellera ici que l'expression "sonie psychoacoustique" peut être définie comme le caractère de la sensation auditive lié à la pression acoustique et à la structure du son. En d'autres termes, il s'agit de la force sonore d'un son ou d'un bruit en tant que sensation auditive (cf. Office de la langue française, 1988). La sonie est représentée par une échelle de sonie psychoacoustique (en sones). D'autre part, la densité de sonie, encore désignée par "intensité subjective", est une mesure particulière de la sonie.
Selon un mode de réalisation préféré, le procédé selon l'invention comprend les étapes suivantes: (a) - calcul des densités de sonie moyenne Sx (m _ utile) et y (m _utile) de respectivement chacune des trames de signal utile "m_utile" du signal de test X[m] et du signal traité Y[m], et des densités de sonie moyenne S- xb (m _ bruit) et S- y (m _ bruit) de respectivement chacune des trames de bruit "m_bruit" du signal bruité Xb[m] et du signal traité Y[m] ; (b) - calcul d'un indice d'efficacité, IE, de la fonction de réduction de bruit, à partir des densités de sonie moyenne calculées; (c) - comparaison de l'indice d'efficacité calculé avec au moins une valeur prédéterminée de cet indice, afin de déterminer un niveau d'efficacité de la fonction de réduction de bruit.
Selon une caractéristique préférée de réalisation, l'étape (a) de calcul des densités de sonie moyenne est suivie d'une étape de calcul des moyennes, SXb bruit, SY bruit, SX utile, SY utile, des densités de sonie moyenne sur l'ensemble des trames concernées de chacun des signaux correspondants; et 5 l'indice d'efficacité IE est calculé selon l'équation suivante: i - S- Xb_bruit SY utile IE=a* _ avec 13 = min 1,_ - SY_bruit SX_utile L'indice d'efficacité IE ainsi obtenu, permet de combiner une évaluation de la perception par l'oreille humaine de la réduction de bruit opérée entre le signal bruité (Xb) et le signal traité (Y), avec une évaluation de la perception par l'oreille humaine de l'affaiblissement du niveau du signal utile (effet non désiré) dans le signal traité (Y). Cet affaiblissement du signal utile est pris en compte dans le calcul de l'indice d'efficacité, en particulier par la contribution du coefficient 13 ci-dessus.
Une méthode d'évaluation selon l'invention prend donc en compte la perception subjective, par un être humain, d'une réduction du niveau de signal utile produite par la fonction de réduction de bruit, contrairement aux méthodes connues.
Selon une mise en oeuvre préférée de l'invention, à l'étape (a) susmentionnée, le calcul de la densité de sonie moyenne u (m) d'une trame m quelconque d'un signal audio donné u, comprend les étapes suivantes: fenêtrage, par exemple de type Hanning, de la trame m et obtention d'une trame fenêtrée u-w[m] ; - application d'une transformée de Fourier à la trame fenêtrée u w- [m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiel; 25 - calcul de la densité spectrale de puissance yu(m,f) de la trame U(m,f) ; - application à la densité spectrale de puissance yu(m,f) d'une conversion de l'axe des fréquences à l'échelle des Barks et obtention d'une densité spectrale de puissance Bu (m,b) sur l'échelle des Barks; 2875633 5 - convolution de la densité spectrale de puissance sur l'échelle des Barks, Bu(m,b), avec la fonction d'étalement et obtention d'une densité spectrale étalée sur l'échelle des Barks, Eu(m,b) ; - calibration de la densité spectrale étalée sur l'échelle des Barks, 5 Eu(m,b), par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie; - conversion de la grandeur obtenue à l'étape précédente sur l'échelle des phones puis conversion sur l'échelle des sones de la grandeur précédemment convertie en phones, et obtention en conséquence d'un nombre B de valeurs de densité de sonie, Su(m,b), de la trame m pour la bande critique b, B étant le nombre de bandes critiques considérées dans l'échelle des Barks et l'indice b variant de 1 à B; - calcul de la densité de sonie moyenne Su(m) de la trame m à partir desdites B valeurs de densités de sonie Su(m,b), selon l'équation suivante:
B
Su (m) = 1 E Su (m, b) B b=1 Selon un second aspect, l'invention concerne un équipement de test destiné à évaluer l'efficacité d'une fonction de réduction de bruit. Conformément à l'invention, cet équipement comporte des moyens adaptés à mettre en oeuvre un procédé tel qu'exposé ci-dessus.
La présente invention concerne aussi un programme d'ordinateur sur un support d'informations, ce programme comportant des instructions adaptées à la mise en oeuvre d'un procédé selon l'invention, lorsque le programme est chargé et exécuté dans un système informatique.
Les avantages de cet équipement ou de ce programme d'ordinateur sont 25 identiques à ceux mentionnés plus haut en relation avec le procédé de l'invention.
L'invention sera mieux comprise à la lecture de la description détaillée qui va suivre, donnée uniquement à titre d'exemple et faite en se référant aux dessins sur lesquels: - la figure 1 représente un environnement de test destiné à évaluer une fonction de réduction de bruit conformément à la présente invention; - la figure 2 est un organigramme illustrant un procédé d'évaluation de l'efficacité d'une fonction de réduction de bruit, en conformité avec l'invention; et - la figure 3 est un organigramme illustrant le mode de calcul de la densité de sonie moyenne d'une trame d'un signal audio, selon un mode de réalisation préféré de l'invention.
La figure 1 représente un environnement de test dans lequel la présente invention peut être mise en oeuvre pour évaluer une fonction de réduction de bruit.
Comme illustré à la figure 1, un tel environnement de test, comprend une source de signaux audio 10 délivrant des signaux audio X(n) ne contenant que des signaux utiles (dépourvus de bruit), par exemple des signaux de parole; et une source de bruit 11 délivrant des signaux de bruit prédéfinis.
Aux fins de test, une contribution prédéfinie de bruit est ajoutée au signal de test X(n) choisi, comme représenté par l'opérateur d'addition 15. Le signal audio résultant de cette addition de bruit au signal de test X(n), est noté Xb(n) et est désigné par l'expression "signal bruité".
Le signal bruité Xb(n) constitue alors le signal d'entrée d'un module 12 de réduction de bruit (RB) mettant en oeuvre la fonction de réduction de bruit dont l'efficacité doit être évaluée, conformément à l'invention.
Le module 12 de réduction de bruit délivre en sortie un signal audio, noté Y(n), traité selon l'algorithme de réduction de bruit utilisé. Le signal Y(n) est désigné par l'expression "signal traité".
Le signal traité Y (n) est ensuite délivré à un équipement de test 13 mettant en oeuvre un procédé d'évaluation selon l'invention. Outre le signal Y(n), l'équipement de test 13 reçoit en entrée le signal de test X(n) et le signal bruité Xb(n).
Enfin, l'équipement de test 13 selon l'invention délivre en sortie un résultat d'évaluation 14 de la fonction de réduction de bruit.
En pratique, selon un mode de réalisation préféré, ce résultat d'évaluation est constitué de la valeur d'un indice d'efficacité (IE) dont le mode de calcul sera décrit plus bas.
Les signaux audio précités X(n), Xb(n) et Y(n) sont des signaux 5 échantillonnés dans un format numérique (n désignant un échantillon quelconque).
En pratique l'équipement de test 13 comporte des moyens matériels (électroniques) et/ou logiciels adaptés à mettre en oeuvre un procédé d'évaluation selon l'invention.
Selon une implémentation préférée, les étapes du procédé d'évaluation selon l'invention sont déterminées par les instructions d'un programme d'ordinateur utilisé dans un tel équipement de test.
Le procédé selon l'invention est alors mis en oeuvre lorsque le programme précité est chargé dans des moyens informatiques incorporés dans l'équipement de test, et dont le fonctionnement est alors commandé par l'exécution du programme.
On entend ici par "programme d'ordinateur" un ou plusieurs programmes d'ordinateur formant un ensemble (logiciel) dont la finalité est la mise en oeuvre de l'invention lorsqu'il est exécuté par un système informatique approprié.
En conséquence, l'invention a également pour objet un tel programme d'ordinateur, en particulier sous la forme d'un logiciel stocké sur un support d'informations. Un tel support d'informations peut être constitué par n'importe quelle entité ou dispositif capable de stocker un programme selon l'invention.
Par exemple, le support en question peut comporter un moyen de stockage matériel, tel qu'une ROM, par exemple un CD ROM ou une ROM de circuit microélectronique, ou encore un moyen d'enregistrement magnétique, par exemple un disque dur. En variante, le support d'informations peut être un circuit intégré dans lequel le programme est incorporé, le circuit étant adapté pour exécuter ou pour être utilisé dans l'exécution du procédé en question.
D'autre part, le support d'informations peut être aussi un support immatériel transmissible, tel qu'un signal électrique ou optique pouvant être acheminé via un câble électrique ou optique, par radio ou par d'autres moyens.
Un programme selon l'invention peut être en particulier téléchargé sur un réseau de type Internet.
D'un point de vue conception, un programme d'ordinateur selon l'invention peut utiliser n'importe quel langage de programmation et être sous la forme de code source, code objet, ou de code intermédiaire entre code source et code objet (par ex., une forme partiellement compilée), ou dans n'importe quelle autre forme souhaitable pour implémenter un procédé selon l'invention.
Le procédé d'évaluation de l'efficacité d'une fonction de réduction de bruit, objet de la présente invention, va maintenant être décrit de manière plus détaillée en liaison avec les figures 2 et 3.
Comme représenté à la figure 2, les signaux X(n), Xb(n) et Y(n) obtenus au préalable et correspondant respectivement au signal audio de test, au signal de test bruité et au signal traité par la fonction de réduction de bruit, sont reçus en entrée dans l'équipement de test 13 précité (fig. 1).
Dans le mode de réalisation décrit et représenté ici, le signal de test X(n) est un signal de parole dépourvu de bruit. Le signal bruité Xb(n) représente alors le signal vocal initial X(n) dégradé par un environnement bruité (bruit de fond ou bruit ambiant), et le signal Y(n) le signal Xb(n) après réduction de bruit.
Selon un exemple de mise en oeuvre de l'invention, le signal X(n) est généré dans une chambre anéchoïque. Cependant, le signal X(n) peut être aussi généré dans une pièce "calme" ayant un temps de réverbération "moyen" (inférieur à 0,5 seconde).
Le signal bruité Xb(n) est obtenu en ajoutant une contribution prédéterminée de bruit au signal X(n). Le signal Y(n) est obtenu soit en sortie d'un algorithme de réduction de bruit implanté sur un ordinateur personnel (PC), soit à la sortie d'un réducteur de bruit (équipement de réseau) et dans ce dernier cas, le signal Y(n) est prélevé au niveau d'un codeur MIC (modulation par impulsion et codage).
En référence à la figure 2, lors d'une étape El initiale, les signaux précités sont respectivement découpés en fenêtres temporelles successives appelées trames. Chaque trame, notée m, de signal contient un nombre prédéterminé d'échantillons du signal, l'étape El consiste donc en un changement de cadence de chacun de ces signaux.
Selon une seconde étape E2, les signaux X[m], Xb[m], Y[m] résultant du passage en cadence trame, font l'objet d'une détection d'activité vocale (DAV) de manière à déterminer si chaque trame respective courante d'indice m de ces signaux, est une trame contenant seulement du bruit, "trame de bruit", ou une trame contenant de la parole, "trame de signal utile". En sortie de l'étape E2, chacune des trames de ces signaux est classifiée en trame de bruit ou en trame de signal utile, c'est-à-dire en trame de parole.
7o Comme représenté sur la figure 2, en sortie de l'étape E2, quatre types de trames sont sélectionnés à partir des signaux X[m], Xb[m] et Y[m] : les trames de bruit du signal bruité Xb[m], notées Xb[m_bruit] ; - les trames de bruit du signal traité Y[m], notées Y[m_bruit] ; - les trames de parole active (signal utile) du signal de test X[m], notées X[m_utile] ; les trames de parole active du signal traité Y[m], notées Y[m_utile]. L'étape suivante E3 est une étape de mesures de sonie de tout ou partie des trames des signaux X[m], Xb[m] et Y[m].
Plus précisément, à cette étape, on calcule les densités de sonie moyenne S- x (m _utile) et Sy (m _utile) de respectivement chacune des trames de signal utile "m_utile" du signal de test X[m] et du signal traité Y[m], et les densités de sonie moyenne Sxb (m _bruit) et Sy (m _ bruit) de respectivement chacune des trames de bruit "m_bruit" du signal bruité Xb[m] et du signal traité Y[m].
Le calcul d'une densité de sonie moyenne Su(m) d'une trame m quelconque d'un signal audio donné u, sera détaillé plus loin en liaison avec la figure 3.
Ainsi à l'issue de l'étape E3, on obtient donc un ensemble Dl de valeurs de densité de sonie moyenne.
A l'étape E4 qui suit, on calcu le les moyennes, Sxb bruit, y _bruit Sx_utile, Sy_utile, des densités de sonie moyenne précitées sur l'ensemble des trames concernées (trames de bruit ou trames de parole) de chacun des signaux correspondants (X[m], Y[m] ou Xb[m]).
On obtient alors, d'une part, un premier couple D2 de valeurs de moyenne des densité s de sonie moyenne correspondant aux trames de bruit des signaux bruité (Xb) et traité (Y) : SXb_bruit et Sy_bruit; et, d'autre part, un second couple D3 de valeurs de moyenne des densité s de sonie moyenne correspondant aux trames de parole active des signaux de test (X) et traité (Y) : S- X utile et S- y utile Ensuite, à l'étape E5, le couple D3 de valeurs de moyenne de densité de sonie moyenne, est utilisé pour calculer un coefficient R obtenu par la formule ci-dessous: SY (3=min 1,-utile SX_utile J Le coefficient (3 est donc obtenu en déterminant la valeur la plus faible (fonction minimum min) entre le chiffre "1" et le rapport de la moyenne S- yutile des valeurs de densité de sonie moyenne des trames de parole du
_
signal Y traité par la fonction de réduction de bruit, sur la moyenne x _utile des valeurs de densité de sonie moyenne des trames de parole du signal de test X. Le coefficient (3 est indicatif de l'affaiblissement, tel que perçu par l'oreille humaine, du signal utile (signal de parole active) dû à l'application de la fonction de réduction de bruit au signal bruité (Xb).
De retour à la figure 2, à l'étape E6, les deux valeurs D2 de moyenne des densités de sonie moyenne correspondant aux trames de bruit des signaux bruité (Xb) et traité (Y) : SXb_bruit et Sy_bruit sont utilisées conjointement au coefficient j3 calculé à l'étape E5, pour calculer l'indice d'efficacité IE selon la formule ci-dessous: S- Xb bruit SY utile IE = R * avec (i =min - SY_bruit SX_utile où * symbolise l'opérateur de multiplication dans l'espace des nombres réels.
Ainsi, selon l'indice d'efficacité IE de l'invention, la perception subjective par l'oreille humaine de la réduction du bruit opérée sur le signal bruité (Xb) (signal résultant Y) et "mesurée" par le ratio SXb bruit est pondérée par le S Y bruit coefficient f3 qui est indicatif de la perception subjective par l'oreille humaine de l'affaiblissement du signal utile dans le signal (Y) résultant du traitement par la fonction de réduction de bruit.
Selon l'exemple de réalisation décrit, la valeur (décimale) de cet indice est convertie ensuite en décibels (dB) , puis est sauvegardée (D4) pour être utilisée pour caractériser l'efficacité de la fonction de réduction de bruit.
A cet effet, la valeur obtenue (D4) de l'indice IE est comparée avec au moins une valeur prédéterminée de cet indice, afin de déterminer un niveau d'efficacité de la fonction de réduction de bruit.
Selon l'exemple de réalisation décrit, on détermine le niveau d'efficacité de la fonction de réduction de bruit (RB) selon le tableau suivant: IE Efficacité de la fonction RB (d B) > 4 Bonne 2,5 - 4 Moyenne 1 - 2,5 Faible 0 - 1 Très faible Ainsi, d'après le tableau ci-dessus, si l'indice d'efficacité IE est compris entre 2,5 dB et 4 dB, l'efficacité de la fonction de réduction de bruit est jugée "moyenne".
Selon un exemple de mise en oeuvre de l'invention aux fins de validation du procédé d'évaluation selon l'invention, l'indice d'efficacité IE a été calculé à partir d'une base de données de signaux audio ayant fait par ailleurs l'objet de tests subjectifs selon la Recommandation P.835 de l'UIT-T (Union Internationale des Télécommunications secteur normalisation des Télécommunications). La variation de la valeur de l'indice IE, obtenue en fonction des signaux audio de la base de données, a été jugée conforme aux résultats des tests subjectifs.
En liaison avec la figure 3, on va à présent décrire un calcul de densité de sonie moyenne d'une trame d'un signal audio, selon un mode de réalisation 5 préféré de l'invention.
Selon l'organigramme représenté à la figure 3, le calcul selon l'invention de la densité de sonie moyenne Su(m) d'une trame m quelconque d'un signal audio donné u[m], comprend les étapes exposées ci-après.
Dans ce qui suit, on considère une trame m quelconque d'un signal u[m], sachant que toute ou partie des trames du signal considéré subissent le même traitement. Le signal u[m] représente n'importe lequel des signaux X[m], Xb[m], Y[m] définis plus haut.
A la première étape, E31, on applique à la trame m du signal u[m] un fenêtrage, par exemple un fenêtrage de type Nanning, Hamming ou équivalent. 15 On obtient alors une trame fenêtrée u-w[m].
A l'étape suivante E32 on applique à la trame fenêtrée u -w[m], une transformée de Fourier rapide (FFT) et on obtient en conséquence une trame correspondante U(m,f) dans le domaine fréquentiel.
A l'étape E33, on calcule la densité spectrale de puissance yu(m,f) de la trame U(m,f). Un tel calcul est connu de l'homme du métier et ne sera pas, par conséquent, détaillé ici.
A l'étape suivante, E34, on applique à la densité spectrale de puissance yu(m,f) obtenue à l'étape précédente, une conversion de l'axe des fréquences à l'échelle des Barks, et on obtient en conséquence une densité spectrale de 25 puissance, Bu(m,b), sur l'échelle des Barks. Ce type de conversion est connu de l'homme du métier, le principe de cette conversion Hertz/Bark consiste à additionner toutes les contributions fréquentielles présentes dans la bande critique considérée de l'échelle des Barks.
Ensuite, à l'étape E35, on applique à la densité spectrale de puissance 30 sur l'échelle des Barks, Bu(m,b), une convolution avec la fonction d'étalement, et on obtient en conséquence une densité spectrale étalée sur l'échelle des Barks, notée Eu (m,b) . Cette étape permet de prendre en compte l'interaction des bandes critiques adjacentes.
A l'étape E36, on opère une calibration de la densité spectrale étalée sur l'échelle des Barks, Eu (m, b) , par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie. Le document "Recommandation UIT-T P.862", sections 10.2.1.3 et 10.2.1.4, donne un exemple d'une telle calibration par les facteurs précités.
On convertit ensuite (étape E37), sur l'échelle des phones, la grandeur obtenue à l'étape précédente. La conversion sur l'échelle des phones est effectuée en s'appuyant sur les courbes d'isosonie (courbes de Fletcher) conformément à la norme NF ISO 226 "Lignes isosoniques normales".
On effectue alors (étape E38) une conversion sur l'échelle des sones de la grandeur précédemment convertie en phones. La conversion en sones est effectuée conformément à la loi de Zwicker selon laquelle: (N(phone) 40 N(sone) = 2 10 J Pour obtenir plus d'information sur la conversion phonelsone, on pourra se reporter au document "PSYCHOACOUSTIQUE, L'oreille récepteur d'information", de E. Zwicker et R. Feldtkeller, édition Masson, 1981.
A l'issue de l'étape E38, on dispose d'un nombre B de valeurs de densité de sonie, Su(m,b), de la trame m pour la bande critique b, B étant le nombre de bandes critiques considérées dans l'échelle des Barks et l'indice b variant de 1 à B. Par exemple, si la fréquence d'échantillonnage Fe du signal u(n) considéré est égale à 8 kHz (kilo Hertz), 18 bandes critiques sont considérées 25 dans l'échelle des Barks.
Enfin, à l'étape E39, on calcule la densité de sonie moyenne Su (m) de la trame m à partir desdites B valeurs de densité de sonie, selon l'équation suivante:
B
Su(m)= 1 ESu(m,b) B b=1 Autrement dit, la densité de sonie moyenne Su (m) selon l'invention d'une trame m, est donc la moyenne des B valeurs de densité de sonie, Su (m, b) , de la trame m pour une bande critique b considérée.
A l'issue de l'étape E39, chaque valeur de densité de sonie moyenne est 5 sauvegardée pour être utilisée conformément au procédé d'évaluation d'une fonction de réduction de bruit, selon l'invention (cf. figure 2, Dl).
Bien que dans le mode de réalisation décrit ci-dessus les signaux audio utilisés sont des signaux de parole, la présente invention permet d'évaluer l'efficacité de toute fonction de réduction de bruit s'appliquant à des signaux audio au sens générique du terme.

Claims (8)

REVENDICATIONS
1. Procédé d'évaluation de l'efficacité d'une fonction de réduction de bruit destinée à être appliquée à des signaux audio, ledit procédé comprenant une étape préalable d'obtention d'un signal audio prédéfini de test X[m] contenant un signal utile dépourvu de bruit, d'un signal bruité, Xb[m], obtenu en additionnant un signal de bruit prédéfini au signal de test X[m], et d'un signal trai té Y[m] , obtenu par application de la fonction de réduction de bruit au signal bruité Xb[m], le procédé étant caractérisé en ce qu'il inclut une étape (E3, E4) de mesures de sonie de tout ou partie des trames m desdits signaux X[m], Xb[m] et Y[m].
2. Procédé selon la revendication 1, caractérisé en ce qu'il comprend les étapes suivantes: (a) calcul (E3) de s densités de sonie moyenne Sx(m_utile) et SY(m_utile) de respectivement chacune des trames de signal utile "m_utile" du signal de test X[m] et du signal traité Y[m], et des densités de sonie moyenne Sxb (m _ bruit) et SY (m bruit) de respectivement chacune des trames de bruit "m_bruit" du signal bruité Xb[m] et du signal traité Y[m] ; (b) - calcul (E5, E6) d 'un indice d'efficacité, IE, de la fonction de réduction de bruit, à partir des densités de sonie moyenne calculées; (c) - comparaison de l'indice d'efficacité calculé avec au moins une valeur prédéterminée de cet indice, afin de déterminer un niveau d'efficacité de la fonction de réduction de bruit.
3. Procédé selon la revendication 2, dans lequel l'étape (a) de calcul des densités de sonie moyenne est suivie d'une étape de calcul (E4) des moyennes, S- xb_bruit, SY_bruit, Sx_utile, S- Y_utile, desdites densités de sonie moyenne sur l'ensemble des trames concernées de chacun des signaux correspondants; et dans lequel l'indice d'efficacité IE est calculé selon l'équation suivante: ( SXb_bruit SY utile IE = 3 * _ avec [3 = min 1, - SY_bruit SX_utile
4. Procédé selon la revendication 1, 2 ou 3, dans lequel la fonction de réduction de bruit est destinée à être appliquée à des signaux audio contenant un signal utile constitué d'un signal de parole, ledit signal de test X[m] étant un signal de parole dépourvu de bruit, ledit procédé étant caractérisé en ce que ladite étape de calcul des densités de sonie moyenne est précédée d'une étape (E2) de détection d'activité vocale appliquée aux signaux X[m], Xb[m], Y[m], de manière à déterminer si chaque trame respective courante d'indice m de ces signaux, est une trame contenant seulement du bruit, "trame de bruit", ou une trame contenant de la parole, "trame de signal utile".
5. Procédé selon l'une quelconque des revendications 1 à 4, caractérisé en ce que, à l'étape (a), le calcul de la densité de sonie moyenne Su(m) d'une trame m quelconque d'un signal audio donné u, comprend les étapes suivantes: - fenêtrage (E31) , par exemple de type Nanning, de la trame m et obtention d'une trame fenêtrée u-w[m] ; - application (E32) d'une transformée de Fourier à la trame fenêtrée uw[m] et obtention d'une trame correspondante U(m,f) dans le domaine fréquentiel; - calcul (E33) de la densité spectrale de puissance yu(m,f) de la trame U(m,f) ; - application (E34) à la densité spectrale de puissance yu(m,f) d'une conversion de l'axe des fréquences à l'échelle des Bark s et obtention d'une densité spectrale de puissance Bu(m,b) sur l'échelle des Barks; - convolution (E35) de la densité spectrale de puissance sur l'échelle des Barks, Bu(m,b), avec la fonction d'étalement et obtention d'une densité spectrale étalée sur l'échelle des Barks, Eu(m,b) ; - calibration (E36) de la densité spectrale étalée sur l'échelle des Barks, Eu(m,b), par les facteurs respectifs d'échelonnement en puissance et d'échelonnement en sonie; - conversion (E37) de la grandeur obtenue à l'étape précédente sur l'échelle des phones puis conversion (E38) sur l'échelle des sones de la grandeur précédemment convertie en phones, et obtention en conséquence d'un nombre B de valeurs de densité de sonie, Su(m,b), de la trame m pour la bande critique b, B étant le nombre de bandes critiques considérées dans l'échelle des Barks et l'indice b variant de 1 àB; - calcul (E39) de la densité de sonie moyenne Su(m) de la trame m à partir desdites B valeurs de densités de sonie Su(m,b), selon l'équation suivante:
B
Su(m)= 1 ESu(m,b) B b=1
6. Equipement de test destiné à évaluer l'efficacité d'une fonction de réduction de bruit, caractérisé en ce qu'il comporte des moyens adaptés à mettre en oeuvre un procédé selon l'une quelconque des revendications 1 à 5.
7. Equipement de test selon la revendication 6, caractérisé en ce qu'il inclut des moyens informatiques et un programme d'ordinateur, ledit programme comportant des instructions adaptées à mettre en oeuvre ledit procédé, lorsqu'il est exécuté par lesdits moyens informatiques.
8. Programme d'ordinateur sur un support d'informations, caractérisé en ce qu'il comporte des instructions adaptées à la mise en oeuvre d'un procédé selon l'une quelconque des revendications 1 à 5, lorsque le programme est chargé et exécuté dans un système informatique.
FR0452087A 2004-09-17 2004-09-17 Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio Pending FR2875633A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
FR0452087A FR2875633A1 (fr) 2004-09-17 2004-09-17 Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
US11/663,233 US20080255834A1 (en) 2004-09-17 2005-09-12 Method and Device for Evaluating the Efficiency of a Noise Reducing Function for Audio Signals
EP05802558A EP1792305A1 (fr) 2004-09-17 2005-09-12 Procédé et dispositif d'évaluation de l'efficacité d'une fonction de réduction de bruit destinée à être appliquée à des signaux audio
PCT/FR2005/002262 WO2006032751A1 (fr) 2004-09-17 2005-09-12 Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0452087A FR2875633A1 (fr) 2004-09-17 2004-09-17 Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio

Publications (1)

Publication Number Publication Date
FR2875633A1 true FR2875633A1 (fr) 2006-03-24

Family

ID=34948876

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0452087A Pending FR2875633A1 (fr) 2004-09-17 2004-09-17 Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio

Country Status (4)

Country Link
US (1) US20080255834A1 (fr)
EP (1) EP1792305A1 (fr)
FR (1) FR2875633A1 (fr)
WO (1) WO2006032751A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007066049A1 (fr) * 2005-12-09 2007-06-14 France Telecom Procede de mesure de la qualite percue d'un signal audio degrade par la presence de bruit

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112562740A (zh) * 2020-11-25 2021-03-26 厦门亿联网络技术股份有限公司 一种噪声消除测试方法、***、音视频设备和存储介质
CN112530460A (zh) * 2020-11-30 2021-03-19 厦门亿联网络技术股份有限公司 语音增强质量评估方法、装置、终端及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490552B1 (en) * 1999-10-06 2002-12-03 National Semiconductor Corporation Methods and apparatus for silence quality measurement

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5574824A (en) * 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
US6446038B1 (en) * 1996-04-01 2002-09-03 Qwest Communications International, Inc. Method and system for objectively evaluating speech
FI114833B (fi) * 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
DE60104091T2 (de) * 2001-04-27 2005-08-25 CSEM Centre Suisse d`Electronique et de Microtechnique S.A. - Recherche et Développement Verfahren und Vorrichtung zur Sprachverbesserung in verrauschte Umgebung
DK1760696T3 (en) * 2005-09-03 2016-05-02 Gn Resound As Method and apparatus for improved estimation of non-stationary noise to highlight speech

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6490552B1 (en) * 1999-10-06 2002-12-03 National Semiconductor Corporation Methods and apparatus for silence quality measurement

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VILLE-VEIKKO MATTILA: "Objective measures for the characterization of the basic functioning of noise suppression algorithms", MESAQIN, 12 May 2003 (2003-05-12), PRAGUE, CZ, XP002326952 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007066049A1 (fr) * 2005-12-09 2007-06-14 France Telecom Procede de mesure de la qualite percue d'un signal audio degrade par la presence de bruit
FR2894707A1 (fr) * 2005-12-09 2007-06-15 France Telecom Procede de mesure de la qualite percue d'un signal audio degrade par la presence de bruit

Also Published As

Publication number Publication date
US20080255834A1 (en) 2008-10-16
EP1792305A1 (fr) 2007-06-06
WO2006032751A1 (fr) 2006-03-30

Similar Documents

Publication Publication Date Title
EP2419900B1 (fr) Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal
EP2415047B1 (fr) Classification du bruit de fond contenu dans un signal sonore
EP1789956B1 (fr) Procede de traitement d'un signal sonore bruite et dispositif pour la mise en oeuvre du procede
EP1356461B1 (fr) Procede et dispositif de reduction de bruit
EP1849157B1 (fr) Procede de mesure de la gene due au bruit dans un signal audio
FR2741217A1 (fr) Procede et dispositif permettant d'eliminer les bruits parasites dans un systeme de communication
JP2013517531A (ja) ノイズ抑制システムのための歪み測定
BRPI0707343B1 (pt) Método e aparelho de avaliação de qualidade de sinal não intrusivo
EP2772916B1 (fr) Procédé de débruitage d'un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
CN104919525B (zh) 用于评估退化语音信号的可理解性的方法和装置
EP0998166A1 (fr) Dispositif de traitement audio récepteur et procédé pour filtrer un signal utile et le restituer en présence de bruit ambiant
FR2894707A1 (fr) Procede de mesure de la qualite percue d'un signal audio degrade par la presence de bruit
CN103282960A (zh) 声音控制装置、声音控制方法以及声音控制程序
CN116013367A (zh) 音频质量的分析方法和装置、电子设备以及存储介质
CN112562714B (zh) 一种噪声评估方法及装置
WO2006032751A1 (fr) Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
CN112151055B (zh) 音频处理方法及装置
CN113593604A (zh) 检测音频质量方法、装置及存储介质
FR3051958A1 (fr) Procede et dispositif pour estimer un signal dereverbere
FR3085784A1 (fr) Dispositif de rehaussement de la parole par implementation d'un reseau de neurones dans le domaine temporel
FR2957185A1 (fr) Procede de determination d'un seuil a appliquer a un signal sonore, procede d'attenuation de bruit, dispositif et programme d'ordinateur associes
Santos A non-intrusive objective speech intelligibility metric tailored for cochlear implant users in complex listening environments
Reimes et al. Instrumental speech and noise quality assessment for super-wideband and fullband transmission
FR2736490A1 (fr) Dispositif de test pour la prise de son d'un radiotelephone, notamment destine a etre installe dans un vehicule automobile
CN113838471A (zh) 基于神经网络的降噪方法、***、电子设备及存储介质