EP2673777B1

EP2673777B1 - Suppression de bruit combinée et signaux hors emplacement

Info

Publication number: EP2673777B1
Application number: EP12707412.8A
Authority: EP
Inventors: Glenn N. Dickins; Timothy J. NEAL; Mark S. Vinton
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2011-02-10
Filing date: 2012-02-08
Publication date: 2018-12-26
Anticipated expiration: 2032-02-08
Also published as: WO2012109384A1; JP2014510452A; EP2673778A1; CN103354937A; EP2673777A1; CN103348408B; WO2012109385A1; EP2673778B1; CN103348408A; JP6002690B2; CN103354937B

Claims

Système (100) pour traiter des signaux d'entrée audio (101), comprenant :
un processeur d'entrée (103, 107, 109) pour accepter une pluralité de signaux d'entrée audio échantillonnés pour former un signal abaissé en fréquence (108) dans l'échantillon ou le domaine fréquentiel et, en outre, pour former une métrique d'amplitude de domaine fréquentiel instantanée en bandes abaissée en fréquence (110) des signaux d'entrée (101) pour une pluralité de bandes de fréquences, au moins 90 % des bandes ayant une contribution de deux, ou davantage, groupes de fréquences ;

un estimateur de caractéristiques spatiales en bandes (105) pour estimer des caractéristiques spatiales en bandes (106) à partir de la pluralité de signaux d'entrée échantillonnés ;

un calculateur de gain (129) pour calculer un ensemble d'indicateurs de probabilité de suppression en bandes comprenant un indicateur de probabilité de signal hors site en bandes (1012) déterminé en utilisant deux, ou davantage, des caractéristiques spatiales en bandes (106), et un indicateur de probabilité de suppression de bruit en bandes (1014) indiquant pour chaque bande de fréquences un gain de suppression de bruit qui est déterminé en utilisant une estimation en bandes du contenu spectral de bruit sur la base de la métrique d'amplitude de domaine fréquentiel instantanée en bandes abaissée en fréquence des signaux d'entrée (101), le calculateur de gain étant en outre configuré pour combiner l'ensemble des indicateurs de probabilité pour calculer un gain combiné pour chaque bande de la pluralité des bandes de fréquences ; et

un suppresseur (131) pour appliquer un gain final interpolé déterminé à partir des gains combinés (130) de la pluralité de bandes de fréquences pour procéder à une suppression sur le signal abaissé en fréquence pour former des données de signal supprimé (132).
Système (100) tel que décrit dans la revendication 1, dans lequel les caractéristiques spatiales (106) sont déterminées à partir d'une ou plusieurs matrices de covariance pondérées en bandes des signaux d'entrée échantillonnés.
Système tel que décrit dans l'une quelconque des revendications 1 à 2, comprenant en outre :
un processeur d'entrée de signal de référence (111) pour accepter un ou plusieurs signaux de référence et pour former une représentation métrique d'amplitude de domaine fréquentiel en bandes (116) des un ou plusieurs signaux de référence ;

un prédicteur (117) d'une représentation métrique d'amplitude de domaine fréquentiel en bandes (118) d'un écho, le prédicteur utilisant des coefficients déterminés de manière adaptative,

où le gain final comprend au moins un indicateur de probabilité de suppression en bandes qui inclut la suppression d'écho, l'au moins un indicateur de probabilité de suppression en bandes étant déterminé au moyen d'une estimation spectrale d'écho en bandes déterminée à partir de la sortie du prédicteur (117).
Système tel que décrit dans la revendication 3, comprenant en outre un dispositif de mise à jour de coefficient pour :
mettre à jour (127) les coefficients (128) déterminés de manière adaptative en utilisant une estimation de la métrique d'amplitude de domaine fréquentiel spectral en bandes du bruit (124), un contenu spectral d'écho prédit précédemment (118), et une estimation de la métrique d'amplitude spectrale en bandes du signal abaissé en fréquence (110 ou 122).
Système tel que décrit dans la revendication 4, comprenant en outre :
un détecteur d'activité vocale avec une sortie couplée au dispositif de mise à jour de coefficient, le détecteur d'activité vocale utilisant l'estimation de la métrique d'amplitude spectrale en bandes du signal abaissé en fréquence (110 ou 122), l'estimation de la métrique d'amplitude spectrale en bandes du bruit (124), et le contenu spectral d'écho prédit précédemment (118),

où la mise à jour par le dispositif de mise à jour de coefficient dépend de la sortie du détecteur d'activité vocale.
Système tel que décrit dans l'une quelconque des revendications 3 à 5, dans lequel l'estimation de la métrique d'amplitude de domaine fréquentiel spectral en bandes du bruit utilisée par le dispositif de mise à jour de coefficient est déterminée par un suiveur de minimum à fuite avec un taux de poursuite défini par au moins un paramètre de taux de fuite de suiveur de minimum.
Système tel que décrit dans l'une quelconque des revendications 1 à 6, dans lequel le processeur d'entrée (103, 107, 109) comprend des transformateurs d'entrée (103) pour effectuer des transformations en groupes de fréquences, un mélangeur abaisseur (107) pour former le signal abaissé en fréquence (108) dans l'échantillon ou le domaine de groupe de fréquences, et un élément de mise en bandes spectrales (109) pour former la métrique d'amplitude de domaine fréquentiel instantanée en bandes abaissée en fréquence (101) pour les bandes de fréquences.
Système (100) tel que décrit dans l'une quelconque des revendications 1 à 7, dans lequel le calculateur de gain est en outre adapté pour post-traiter le gain combiné des bandes pour générer un gain post-traité (130) pour chaque bande, de manière à ce que le gain final interpolé soit déterminé à partir des gains post-traités des bandes.
Système tel que décrit dans l'une quelconque des revendications 3 à 8, dans lequel les coefficients déterminés de manière adaptative sont déterminés en utilisant un signal d'activité vocale déterminé par un détecteur d'activité vocale (125), une estimation de la métrique d'amplitude spectrale en bandes du bruit (124), une estimation de la métrique d'amplitude spectrale en bandes du signal abaissé en fréquence, et un contenu spectral d'écho prédit précédemment.
Système tel que décrit dans l'une quelconque des revendications 1 à 9, dans lequel l'indicateur de probabilité de suppression de bruit pour chaque bande de fréquences indique une fonction de gain de suppression de bruit de la métrique d'amplitude instantanée en bandes pour la bande,
où, pour chaque bande de fréquences, une plage de valeurs de valeurs métriques d'amplitude instantanée en bandes est attendue pour le bruit, et une seconde plage de valeurs de valeurs métriques d'amplitude instantanée en bandes est attendue pour une entrée souhaitée, et
où les fonctions de gain de suppression de bruit pour les bandes de fréquences sont configurées pour :
avoir une valeur minimale respective ;

avoir une valeur relativement constante ou un gradient négatif relativement faible dans la plage ;

avoir un gain relativement constant dans la seconde plage ; et

présenter une transition en douceur de la plage vers la seconde plage.
Procédé (200) pour faire fonctionner un appareil de traitement (100) pour supprimer des signaux indésirables comprenant du bruit et des signaux hors site dans des signaux d'entrée audio (101), le procédé comprenant les étapes suivantes :
accepter (201), dans l'appareil de traitement, une pluralité de signaux d'entrée audio échantillonnés (101) ;

former (203, 207, 209) une métrique d'amplitude de domaine fréquentiel instantanée en bandes abaissée en fréquence (110) des signaux d'entrée (101) pour une pluralité de bandes de fréquences, la formation comprenant d'effectuer une transformation (203) en valeurs de domaine fréquentiel à valeurs complexes des signaux d'entrée (101) ou d'un signal abaissé en fréquence pour un ensemble de groupes de fréquences ;

au moins 90 % des bandes ayant une contribution de deux, ou davantage, groupes de fréquences ;

déterminer (205) des caractéristiques spatiales en bandes (106) à partir de la pluralité de signaux d'entrée échantillonnés ;

calculer (223) un ensemble d'indicateurs de probabilité de suppression en bandes, comprenant un indicateur de probabilité de suppression hors site en bandes (1012) déterminé en utilisant deux, ou davantage, des caractéristiques spatiales en bandes (106), et un indicateur de probabilité de suppression de bruit en bandes (1014) pouvant être exprimé pour chaque bande comme un gain de suppression de bruit et déterminé en utilisant une estimation en bandes de contenu spectral de bruit (1006) déterminée sur la base de la métrique d'amplitude de domaine fréquentiel instantanée en bandes abaissée en fréquence du signal abaissé en fréquence (108) ;

combiner l'ensemble d'indicateurs de probabilité en bandes pour déterminer un gain combiné pour chaque bande de la pluralité de bandes de fréquences ;

appliquer (227) un gain final interpolé déterminé à partir des gains combinés de la pluralité de bandes de fréquences pour procéder à une suppression sur le signal abaissé en fréquence pour former des données de signal supprimé (132).
Procédé (200) tel que décrit dans la revendication 11, dans lequel les caractéristiques spatiales (106) sont déterminées à partir d'une ou plusieurs matrices de covariance pondérées en bandes des signaux d'entrée échantillonnés.
Procédé tel que décrit dans la revendication 11 ou la revendication 12, dans lequel la formation (215, 217) de la métrique d'amplitude de domaine fréquentiel en bandes abaissée en fréquence instantanée comprend de transformer (103) les entrées acceptées ou une combinaison de celles-ci en groupes de fréquences, d'effectuer un abaissement en fréquence dans l'échantillon ou le domaine du groupe de fréquences pour former un signal abaissé en fréquence, et de procéder à une mise en bandes spectrales pour former des bandes de fréquences.
Procédé tel que décrit dans l'une quelconque des revendications 11 à 13, dans lequel l'indicateur de probabilité de suppression de bruit pour chaque bande de fréquences peut être exprimé comme une fonction de gain de suppression de bruit de la métrique d'amplitude instantanée en bandes pour la bande,
où, pour chaque bande de fréquences, une plage de valeurs de valeurs métriques d'amplitude instantanée en bandes est attendue pour le bruit, et une seconde plage de valeurs de valeurs métriques d'amplitude instantanée en bandes est attendue pour une entrée souhaitée, et
où les fonctions de gain de suppression de bruit pour les bandes de fréquences sont configurées pour :
avoir une valeur minimale respective ;

avoir une valeur relativement constante ou un gradient négatif relativement faible dans la plage ;

avoir un gain relativement constant dans la seconde plage ; et

présenter une transition en douceur de la plage vers la seconde plage.
Support non transitoire lisible par ordinateur configuré avec des instructions qui, lorsqu'elles sont exécutées par au moins un processeur d'un système de traitement, amènent le matériel de traitement à exécuter un procédé tel que décrit dans l'une quelconque des revendications de procédé précédentes.