FR2952263A1 - Procede et dispositif d'annulation d'echo acoustique par tatouage audio - Google Patents

Procede et dispositif d'annulation d'echo acoustique par tatouage audio Download PDF

Info

Publication number
FR2952263A1
FR2952263A1 FR0957636A FR0957636A FR2952263A1 FR 2952263 A1 FR2952263 A1 FR 2952263A1 FR 0957636 A FR0957636 A FR 0957636A FR 0957636 A FR0957636 A FR 0957636A FR 2952263 A1 FR2952263 A1 FR 2952263A1
Authority
FR
France
Prior art keywords
signal
echo
acoustic channel
characterization
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0957636A
Other languages
English (en)
Other versions
FR2952263B1 (fr
Inventor
Gael Mahe
Imen Mezghani-Marrakchi
Meriem Jaidane
Monia Turki
Larbi Sonia Djaziri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universite Paris 5 Rene Descartes
Original Assignee
Universite Paris 5 Rene Descartes
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to FR0957636A priority Critical patent/FR2952263B1/fr
Application filed by Universite Paris 5 Rene Descartes filed Critical Universite Paris 5 Rene Descartes
Priority to US13/503,607 priority patent/US20120213380A1/en
Priority to EP10788106A priority patent/EP2494772A1/fr
Priority to CA2779157A priority patent/CA2779157A1/fr
Priority to PCT/FR2010/052309 priority patent/WO2011051625A1/fr
Priority to JP2012535905A priority patent/JP5749275B2/ja
Publication of FR2952263A1 publication Critical patent/FR2952263A1/fr
Application granted granted Critical
Publication of FR2952263B1 publication Critical patent/FR2952263B1/fr
Priority to TNP2012000193A priority patent/TN2012000193A1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M9/00Arrangements for interconnection not involving centralised switching
    • H04M9/08Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
    • H04M9/082Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Telephone Function (AREA)

Abstract

Procédé d'annulation d'écho acoustique dans un premier signal comportant un signal d'écho d'un deuxième signal, comportant : - insérer, de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue, - caractériser, dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho, - estimer le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et - annuler le signal d'écho au moyen de l'estimation obtenue.

Description

Procédé et dispositif d'annulation d'écho acoustique par tatouaqe audio Domaine technique La présente invention concerne le traitement de signaux audio. Plus particulièrement, elle vise l'annulation de l'écho acoustique dans les systèmes de prise et de restitution du son, notamment utilisés dans des systèmes de communication.
Arrière-plan technoloqique Dans les systèmes de prise et de restitution du son de type « mains libres » (comme par exemple les dispositifs de visioconférence), un premier terminal transmet un signal de parole vers un deuxième terminal. Un haut parleur du deuxième terminal émet alors le signal. Le signal émis suit alors un ou plusieurs trajets d'écho. Un microphone du deuxième terminal capte ensuite un signal sonore comportant l'écho du signal émis (et correspondant au signal transmis). L'écho est réduit par un système dit d'annulation d'écho acoustique (AEC). Dans ces systèmes, le canal acoustique entre le système de restitution et le système de prise de son, comportant un ou plusieurs trajets d'écho, est déterminé par estimation de la réponse impulsionnelle de ce canal acoustique. L'estimation de la réponse impulsionnelle du canal acoustique se fait le plus souvent en temps réel et de manière adaptative auprès du deuxième terminal. Le filtre numérique utilisé pour l'adaptation est piloté par le signal de parole transmis par le premier terminal.
Les performances de tels systèmes sont dégradées par plusieurs facteurs, notamment : - les caractéristiques statistiques du signal audio (par exemple sa forte corrélation et son caractère non stationnaire, et - le contexte de la double parole, dans le cas où le deuxième terminal capte un signal de parole locale qui s'ajoute à l'écho et au bruit ambiant. En effet, la présence d'une parole locale s'ajoutant au bruit ambiant gêne la convergence de l'AEC. Dans les systèmes existants d'annulation d'écho acoustique, qui se fondent sur des méthodes adaptatives, le problème d'existence d'une parole locale se pose du fait que le filtre adaptatif ne peut plus suivre les variations du canal acoustique et suit alors celles de la parole locale. Dans ce cas, l'algorithme converge vers une fausse solution. Pour remédier à ce problème, l'art antérieur propose de geler l'adaptation en présence de double parole. Cependant, cette solution empêche d'estimer correctement l'écho. En référence à la Figure 1, on décrit un système d'annulation d'écho (AEC) selon l'art antérieur, mis en oeuvre dans un système de communication sonore (par exemple un téléphone en mode « mains libres »).
Un premier interlocuteur envoie, à partir d'un premier terminal, un signal x(n) qui est ensuite diffusé par le haut-parleur HP d'un deuxième terminal. Le signal émis par le haut-parleur est ensuite réfléchi par l'environnement (les murs par exemple) dans lequel le haut-parleur se trouve. La réflexion, ainsi que l'écho direct induit par le passage direct du son entre le haut-parleur et le microphone MIC du deuxième terminal, induisent ainsi un signal d'écho z(n). Le signal d'écho, un signal de bruit ambiant n(n), ainsi que la parole d'un deuxième interlocuteur s(n) sont captés par le microphone MIC, présent pour capter la parole du deuxième interlocuteur, puis transmis vers le terminal. Le signal reçu par le premier haut parleur est alors un mélange de la parole du deuxième interlocuteur et de la parole du premier interlocuteur x(n) filtrée par le canal acoustique f entre le haut-parleur et le micro (z(n)=f*x(n), où * désigne la convolution). Le signal capté par le microphone est alors: y(n)=z(n)+b(n)=( f *x(n))+b(n), où x(n) et f sont respectivement le signal reçu par le haut parleur de réception et la réponse impulsionnelle du couplage, supposée de nature linéaire, entre le haut- parleur et le microphone, et b(n)=n(n)+s(n) est un mélange du bruit ambiant n(n) et de la parole locale s(n). Un système d'annulation d'écho est disposé entre les lignes de transmission des signaux x(n) et y(n), par exemple auprès du deuxième terminal.
Ce système d'annulation d'écho est chargé d'estimer et de simuler au moyen d'un filtre RIF h le canal acoustique f, de manière à retrancher au mélange b(n)+f*x(n) une estimation de f*x(n), donnée par h(n)*x(n). Le canal de propagation acoustique étant amené à varier dans le temps, des algorithmes adaptatifs sont utilisés.
Leur rôle est "d'apprendre" dans un premier temps puis de mettre continuellement à jour les coefficients du filtre RIF h(n) pour conserver une bonne compensation de l'écho malgré ces variations. Cependant ces algorithmes adaptatifs souffrent de problèmes de robustesse dus aux variations temporelles des caractéristiques statistiques du signal sonore émis x(n) et pilotant l'AEC (corrélation, non stationnarité,...). Les coefficients du filtre h(n) = [ho(n), hi(n) ... hp_1(n)]T sont par exemple adaptés selon un algorithme normalisé du type NLMS (« Normalized Least Mean Square »). Cet algorithme minimise l'erreur quadratique moyenne entre la sortie du filtre h(n) et l'écho. L'adaptation de h(n) se fait alors comme suit : h(n +1) = h(n) + µe(n) X(n) X(n) X(n)+E
où g est un pas d'adaptation généralement fixe, e(n) est l'erreur d'estimation qui contrôle l'adaptation du filtre h(n) et X(n)=[x(n),x(n-1),...,x(n-P+1)]T est le vecteur d'entrée de longueur P, et c est une faible valeur strictement positive pour éviter l'annulation du dénominateur de la fraction durant les périodes de silence. Il a été proposé d'insérer dans le signal incident x(n) un tatouage additif afin de modifier les propriétés statistiques du signal (S. Larbi and M. Jaïdane, "Audio watermarking: a way to modify audio statistics", IEEE Trans. on Signal Processing, vol. 53(2), 2005). Néanmoins, cette méthode présente au moins deux inconvénients : - l'AEC atténue trop faiblement l'écho et reste sensible aux statistiques du signal de parole tatoué, et - le problème de la double parole n'est pas résolu. Il a également été proposé par les inventeurs (Marrakchi et al. « Speech processing in the watermarked domain : application in adaptative acoustic echo cancellation », European Signal Processing Conference, Italy, 2006) un système d'annulation d'écho dit « WAEC » qui est fondé sur l'insertion d'un bruit blanc par tatouage audio dans le signal de parole source de manière à estimer le canal acoustique par un signal ayant de meilleures propriétés que le signal de parole source. Dans ce système, deux filtres adaptatifs fonctionnent en parallèle.
La nette supériorité du WAEC par rapport à un AEC classique est due au fait que les signaux impliqués dans le fonctionnement du WAEC sont très peu corrélés et beaucoup plus stationnaires. Avec ce système les inventeurs ont obtenu un gain important dans l'atténuation de l'écho. Toutefois, cette structure peut être améliorée, notamment en présence de double parole. Résumé de l'invention Il existe donc un besoin pour un système d'annulation d'écho acoustique offrant une qualité d'annulation d'écho satisfaisante et qui soit peu sensible aux caractéristiques du signal de parole et au contexte de la double parole. La présente invention vient améliorer la situation. A cet effet, selon un premier aspect de l'invention, on propose un procédé d'annulation d'écho acoustique dans un premier signal comportant un signal d'écho d'un deuxième signal. Le procédé comporte : - insérer, de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire dont l'auto corrélation circulaire comporte une impulsion unité et une composante continue, - caractériser, dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho, - estimer le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et - annuler le signal d'écho au moyen de l'estimation obtenue. La séquence pseudo aléatoire insérée est indépendante du signal de parole locale ce qui améliore la caractérisation (ou identification) du canal (ou chemin) d'écho. Ainsi, la qualité de caractérisation est constante et peu dépendante des variations statistiques des signaux mis en oeuvre dans l'annulation d'écho. Avec le procédé selon la présente invention, la qualité de caractérisation est meilleure, même en contexte de double parole. La présente invention permet de fournir une qualité satisfaisante de conversation téléphonique ou en visioconférence, même en présence des variations statistiques de la parole émise et de la parole locale. En outre, avec le procédé selon la présente invention, l'annulation d'écho est plus rapide et plus précise que dans l'art antérieur. Par exemple, la caractérisation du canal acoustique (ou chemin d'écho) se fait par intercorrélation du premier signal avec la séquence pseudo aléatoire. Cela permet de minimiser l'effet de l'existence d'une parole locale au cours de l'identification à cause de l'indépendance statistique de la séquence pseudo aléatoire et de la parole locale. Par exemple encore, la caractérisation du canal acoustique comporte un filtrage adaptatif du deuxième signal. La caractérisation peut également comporter un filtrage par bloc du deuxième signal.
L'utilisation de la séquence pseudo aléatoire permet de réduire la perturbation du signal en présence de double parole. Dans des modes de réalisation, la caractérisation du canal acoustique comporte les étapes : - effectuer un filtrage adaptatif et/ou par bloc du deuxième signal, et - effectuer une intercorrélation du premier signal avec la séquence pseudo aléatoire. Le filtrage permet d'éliminer l'influence du deuxième signal avant l'intercorrélation, augmentant ainsi la qualité de cette dernière. Par exemple, il est possible de diminuer la puissance du deuxième signal par rapport à la puissance de la séquence pseudo aléatoire. Dans des modes de réalisation, le procédé comporte en outre : - appliquer un filtre de mise en forme à la séquence pseudo aléatoire avant son insertion dans le deuxième signal. Par exemple, le filtre de mise en forme est utilisé pour assurer l'inaudibilité de la séquence pseudo aléatoire, en se fondant sur des modèles psychoacoustiques. Dans ce cas, on peut former le filtre à fournir une séquence inaudible avec une puissance maximale, pour optimiser son utilisation dans l'annulation d'écho. Selon d'autres aspects de l'invention, il est prévu : - un programme informatique comportant des instructions pour la mise en oeuvre du procédé selon l'invention lorsque le programme est exécuté par un processeur, par exemple, le processeur d'un système d'annulation d'écho ; - un support lisible par un ordinateur sur lequel est enregistré un tel programme d'ordinateur ; - un circuit configuré pour la mise en oeuvre du procédé selon l'invention ; et - un système d'annulation d'écho adapté pour la mise en oeuvre du procédé selon l'invention. Les avantages procurés par le programme informatique, le support lisible par ordinateur, le circuit, et le système, tels que succinctement exposés ci-dessus, sont au moins identiques à ceux mentionnés plus haut en liaison avec le procédé de d'annulation d'écho selon l'invention.
Brève description des dessins D'autres caractéristiques et avantages de l'invention apparaîtront encore à la lecture de la description qui va suivre. Celle-ci est purement illustrative et doit être lue en regard des dessins annexés sur lesquels, en outre la Figure 1 : - la figure 2 est un schéma bloc illustrant un procédé selon un premier mode de réalisation de l'invention ; - la figure 3 est un schéma bloc illustrant un procédé selon un deuxième mode de réalisation de l'invention ; - la figure 4 est un organigramme général du procédé selon des modes de réalisation de l'invention ; - la figure 5 illustre un système d'annulation d'écho selon un mode de réalisation de l'invention ; et - les figures 6 à 9 illustrent des résultats de tests montrant quelques avantages apportés par l'invention. Description détaillée de modes de réalisation En référence à la Figure 2, on décrit schématiquement la mise en oeuvre d'un procédé selon un premier mode de réalisation.
Dans ce mode de réalisation, l'annulation d'écho se fait par insertion d'une séquence numérique (procédé également appelé « tatouage numérique »), puis par intercorrélation de la séquence insérée avec le signal comportant le signal d'écho pour la caractérisation (ou identification) du canal acoustique (ou chemin d'écho). L'annulation finale de l'écho se fait par soustraction, dans le signal comportant l'écho, d'une estimation de l'écho fondée sur l'identification du canal acoustique. Dans un premier temps, on décrit de manière générale les étapes mises en oeuvre. Dans un second temps, chacune des étapes sera détaillée. Ce mode de réalisation s'inscrit par exemple dans le cadre d'une communication entre un premier terminal de communication tel qu'un téléphone mobile, et un deuxième terminal en mode mains libres. 7 L'écho que l'on se propose de traiter prend naissance auprès du deuxième terminal, et est traité auprès de ce deuxième terminal. On peut envisager d'autres modes de réalisation dans lesquels l'écho est traité auprès du premier terminal, ou encore dans lesquels l'écho est traité dans un réseau de télécommunications. Le signal de parole x initialement émis par un utilisateur du premier terminal est fourni à un bloc d'insertion INS, pour l'insertion d'une séquence numérique qui sera décrite plus en détails dans la suite. Le signal inséré t provient d'un signal initial w mis en forme par un bloc de 10 mise en forme FORM. Cette mise en forme permet d'adapter le spectre du signal w afin de le rendre inaudible, une fois inséré dans le signal x. Le signal xt obtenu à la sortie du bloc INS est ensuite transmis et suit un ensemble de transformations modélisé par le bloc ECHO. Ces transformations correspondent par exemple à sa transmission et à sa réflexion. 15 A la sortie du bloc ECHO on obtient un signal z, comme celui décrit précédemment en référence à la Figure 1. A ce signal z, un signal de bruit b vient également s'ajouter, pour former le signal y. Le signal y contient l'écho du signal x. Le signal y est ensuite fourni à une unité de mise en forme du signal DEFORM 20 qui effectue sur le signal une transformation inverse de celle effectuée par le bloc FORM. En sortie du bloc DEFORM on obtient un signal yf qui est ensuite fourni à un bloc d'intercorrélation INTERCOR afin de réaliser l'intercorrélation du signal yf avec le signal w. 25 Le bloc INTERCOR fournit alors une caractérisation f du canal acoustique schématisé par le bloc ECHO. Cette caractérisation est ensuite fournie à un bloc ESTIM qui reçoit également en entrée le signal xt, pour obtenir en sortie une estimation du signal z. Le signal y et l'estimation du signal z sont ensuite fournis à un bloc ANNUL 30 pour soustraire l'écho du signal y.
Dans un deuxième mode de réalisation, décrit en référence à la Figure 3, un filtrage adaptatif est effectué sur le signal tatoué pour réaliser une première identification du canal acoustique, avant l'intercorrélation. Dans ce mode de réalisation, on retrouve les blocs FORM, INS, ECHO, 5 ANNUL, INTERCOR, et ESTIM du premier mode de réalisation. En outre, on trouve un deuxième bloc DEFORM identique au premier, et alimenté par le signal xt, la sortie de ce deuxième bloc DEFORM est couplée à l'entrée d'un bloc ADAPT1 de filtrage adaptatif. Le signal w est par ailleurs fourni à un deuxième bloc ADAPT2, qui est une 10 copie du premier bloc ADAPT1. Dans ce deuxième mode de réalisation, la sortie du premier bloc DEFORM est fournie à un bloc de soustraction pour effectuer la soustraction entre le signal yf et la sortie du premier bloc ADAPT1. Le résultat de cette soustraction est délivré au bloc ADAPT1 pour piloter le filtrage. 15 La sortie du deuxième bloc ADAPT2 est ensuite additionnée avec la sortie du bloc de soustraction, et la somme est fournie au bloc INTERCOR. Dans une variante du deuxième mode de réalisation (non représentée), on utilise un filtrage par bloc alternativement au, ou en combinaison avec le, filtrage adaptatif. Par exemple, on implémente un filtre de Wiener. 20 Les étapes du procédé selon les modes de réalisation décrits, sont résumées dans l'organigramme général de la Figure 4. Dans une première étape S40, le signal transmis par l'utilisateur du premier terminal est reçu par le deuxième terminal puis est tatoué par l'AEC par insertion de la séquence numérique. Ensuite, le signal tatoué est diffusé par le haut parleur du 25 deuxième terminal lors de l'étape S41. Lors de l'étape S42, le microphone du deuxième terminal reçoit un signal comportant un signal d'écho du signal précédemment transmis. On réalise alors lors de l'étape S43 une caractérisation du canal acoustique au moyen de la séquence insérée lors du tatouage.
Enfin, lors de l'étape S44 l'écho est annulé dans le signal reçu par le microphone, au moyen de la caractérisation obtenue. Un programme d'ordinateur comportant des instructions pour la mise en oeuvre du procédé selon l'invention peut être réalisé selon un algorithme général déduit de l'organigramme général de la Figure 4, et de la présente description détaillée. Un système d'annulation d'écho selon un mode de réalisation de l'invention est décrit en référence à la Figure 5. Ce système d'annulation d'écho AEC comporte une entrée E2 pour recevoir un signal à retransmettre, une sortie S2 pour retransmettre le signal reçu et tatoué. Il comporte également une entrée El pour recevoir un signal comportant un écho du signal transmis, et une sortie S1 pour envoyer le signal avec l'écho annulé. Le système AEC comporte également une mémoire MEM pour stocker des données de calcul. Dans des modes de réalisation, la mémoire MEM peut également stocker un programme d'ordinateur selon la présente invention. Le système comporte également un processeur PROC pour contrôler un circuit d'annulation d'écho. Par exemple, le processeur exécute un programme d'ordinateur stocké dans la mémoire MEM. Le circuit CIRC comporte une unité d'insertion de séquence numérique INS, une unité de caractérisation de canal acoustique CARACT, une unité d'estimation du signal d'écho ESTIM et une unité d'annulation d'écho ANNUL. Tous ces éléments sont disposés en sorte à fonctionner selon le procédé d'annulation d'écho selon l'invention. Le système d'annulation d'écho peut faire partie d'un terminal de communication. Par exemple, il peut faire partie d'un terminal de communication mettant en oeuvre une communication en mode mains libres. Ainsi, l'écho naissant auprès de ce terminal peut être directement annulé avant de retransmettre le signal de parole capté. Par exemple encore, le système peut faire partie d'un terminal de communication qui ne met pas en oeuvre une communication en mode mains libres, mais qui est en communication avec un terminal mettant en oeuvre une telle communication. Ainsi, le terminal peut éliminer l'écho dans un signal reçu.
Par exemple encore, le système d'annulation d'écho est mis en oeuvre dans un serveur de communication. Ainsi, un opérateur d'un réseau de télécommunications mettant en oeuvre le serveur peut fournir à ses abonnés un service d'annulation d'écho.
L'intégration d'un système selon l'invention dans un terminal ou un serveur, tels que succinctement décrits, peut être réalisée selon des techniques connues de la personne du métier. Dans la suite, on décrit plus en détails les différentes opérations évoquées ci-avant : le tatouage numérique, la caractérisation du canal acoustique, l'annulation d'écho, et le filtrage adaptatif ou par bloc. Enfin, on présente des résultats de tests effectués pour montrer certains avantages apportés par la présente invention. Tatouaqe numérique Le signal w(n) inséré est une séquence pseudo aléatoire de +1 et -1 de longueur L, appelée séquence à longueur maximale (MLS), périodisée. Elle a comme principale propriété de donner une impulsion unité L-périodisée plus une composante continue 1/L lorsque l'on effectue son auto-corrélation circulaire : 1 si n = OmodL (n) si n ≠ 0 L où l'auto-corrélation circulaire est définie par : l L_1 (n) =ùLw(k)w((n+k)modL) L k=0 L'insertion temporelle du signal de tatouage dans les signaux audio se fait de manière inaudible en utilisant des modèles psychoacoustiques. Le seuil de masquage, dans le cas de la parole, est approché par la Densité Spectrale de Puissance (DSP) du signal sur une trame de 20ms, atténuée d'un facteur X<1. Comme la parole est modélisable par la filtrée du bruit blanc de variance 6 par un filtre tout-pôles de fonction de transfert 1/A(z), on peut ajouter un
tatouage inaudible obtenu par le filtrage d'un bruit blanc w(n) par le filtre de fonction G(z) A(z) de transfert . Ce filtre est actualisé tous les L échantillons. Caractérisation du canal par intercorrélation Il s'agit d'exciter le canal par une séquence MLS w(n) de longueur L périodisée. Le signal y(n) obtenu à la sortie du canal est : P-1 y(n) = f * w(n) = L f(j)w(n ù j) j=o où P est la longueur de la réponse impulsionnelle f à estimer. La corrélation entre la sortie y(n) et l'entrée w(n) vaut : 1 L-1 y(n) =ùLw(k)y(n+k) L k=0 1 L-1 P-1 _-LL f( j)w(k)w(n + k û j) L k=0 j=0 P-1 =Lf(j» (nùi) j=0 Ou encore : ~Wy (n) = j '(n) = f (n) + P (n) + Pz (n) avec [p/Li P(n)_ Lf(n+jL) j=1 est la perturbation due à l'effet de sous-modélisation lorsque L<P. 1 P-1 P2(n) _ ùL ù Lf(j) j=1,j≠n+kL est la perturbation due à l'effet de la « «fausse impulsion
unité». La situation idéale est réalisée dans le cas de modélisation exacte (P<L) où P (n) = 0 et pour L suffisamment grand et dans ce cas(") 0 .20 Annulation d'écho Le signal de tatouage obtenu est ajouté temporellement au signal de parole comme illustré par la Figure 2. Le signal tatoué xt(n) obtenu est ensuite transmis vers le canal acoustique f à identifier. L'écho obtenu est donné par : y(n) = f *xt(n) + b(n) = f * x(n) + f * t(n) + b(n) = f * x(n) + f * g * w(n) + b(n) En appliquant au signal d'écho l'inverse du filtre de mise en forme g du bloc FORM, on obtient : yf (n) = g-' * y(n) = f * w(n) + f * xf (n) + bf (n) où xf(n) et bf(n) sont respectivement les signaux x(n) et b(n) filtrés par le filtre g-1 L'estimation du canal se fait par calcul d'intercorrélation par bloc de L échantillons entre le signal d'écho filtré et la séquence MLS originale w(n) : OWyf (n) = f (n) + f * , f (n) +OWbf + ] (n) + PP (n), n = 0 :L -1 L'écho résiduel est donc : e(n) = y(n) û~WVr (n) * xt(n) La qualité de l'estimation est indépendante de la corrélation et de la non stationnarité du signal de parole émis.
Identification adaptative ou par bloc complémentaire Afin d'assurer la rapidité de la caractérisation du canal acoustique, la valeur de L doit être limitée. 13 Dans ce cas, l'intercorrélation ~Wxf n'est pas parfaitement nulle et par conséquent le terme *°Wxf(n), qui est de puissance un peu plus faible que celle de0Wxf (n), ne peut être totalement négligé. Afin de pallier ce problème, on peut prévoir l'annulation de l'effet de ce terme par l'ajout d'une étape de filtrage adaptatif. Ainsi, on obtient une première estimation du canal acoustique f comme illustré par la Figure 3. L'étage de filtrage adaptatif ADAPT (filtre adaptatif h(n) de longueur P) est piloté par le signal tatoué filtré xtf(n) = g ' * xt(n) et contrôlé par l'erreur d'estimation adaptative : er(n) = yf (n) ù h(n) * [xf (n) + w(n)] = f * w(n) + li( *4 n +4f4(s) ù h(n) * w(n) (n) où v(n)=f-h(n) est le vecteur déviation qui représente l'erreur d'estimation du canal. Soit le signal à l'entrée du corrélateur INTERCOR : e(n) = er(n) + h(n) * w(n) = f * w(n) + (n) A la convergence du filtre adaptatif h(n), la puissance de l'erreur (n) converge vers celle du bruit filtré bf(n). L'estimation du canal se fait par calcul de l'intercorrélation : (1) We (n) = :i(n) +(1),,v (n), n = 0 : L -1 Dans le cas où le filtre h(n) converge, le second terme de l'équation devient négligeable et on obtient une qualité d'estimation quasiment constante. Selon une variante de réalisation, on peut utiliser un filtrage par bloc. Par exemple, il s'agit d'utiliser un filtre de Wiener. Comme il apparaîtra à la personne du métier, l'utilisation d'un tel filtre peut nécessiter d'inverser une matrice de corrélation du signal audio.25 Résultats Différents signaux de parole et différents canaux acoustiques ont été utilisés pour tester le procédé selon l'invention. Les tests ont montré que la qualité de la parole à la réception est nettement meilleure avec la méthode proposée qu'avec celles utilisant les méthodes adaptatives classiques dans lesquelles l'AEC est piloté par le signal de parole reçu directement. Avec le procédé selon la présente invention, le temps d'adaptation est plus rapide et une estimation plus stationnaire de l'écho est réalisée.
Pour avoir des résultats comparables, les performances de la méthode proposée, dont l'étage adaptatif est de type NLMS, ont été comparées à celle d'un AEC classique. L'AEC classique en question est un AEC adaptatif type NLMS dont l'entrée est le signal d'entrée x(n) lui-même pilotant le canal acoustique à estimer.
Le même pas d'adaptation p a été utilisé pour les deux AEC (AEC classique et AEC selon la présente invention). Les paramètres de simulation utilisés ont été les suivants : L=511, P=200, en absence de parole locale. La Figure 6 illustre l'évolution de la déviation quadratique moyenne (DQM), pour un procédé selon l'invention (courbe AEC_INV) et pour un procédé selon l'art
antérieur (courbe AEC_CLASS). La DQM représente l'erreur relative d'estimation de
f, et s'exprime selon : DQMdB (n) = 1 OLog La DQM est calculée en l'absence de parole locale et en présence de bruit ambiant avec un rapport signal à bruit de 20dB. Le rapport signal à bruit s'exprime selon: RSB1=10Log xP Fin 15 avec Px la puissance du signal d'entrée x(n) et Pn celle du bruit ambiant n(n). Comme on peut le constater sur la Figure 6, la vitesse de convergence réalisée par la méthode proposée est nettement supérieure à celle d'un AEC classique.
En outre, la déviation finale est plus faible avec la présente invention. Le procédé selon la présente invention est donc plus rapide et plus précis. Afin d'évaluer les performances de l'AEC en régime permanent, on a calculé LERLE (« echo return loss enhancement »). L'ERLE est défini par : ERLE = l OLogio E({Y(n)}Z ) E({e(n)}2 ) avec y(n) l'écho bruité à estimer et e(n) est l'erreur d'estimation. Les Figures 7 et 8 illustrent, pour un signal de parole SIG initialement émis et donnant naissance à un signal d'écho, l'évolution de LERLE respectivement pour la structure proposée (courbe AEC_INV) et pour un AEC classique (par exemple type NLMS, courbe AEC_CLASS) également en absence de parole locale et en présence de bruit ambiant et pour la structure proposée et le WAEC (courbe WAEC) également dans les mêmes conditions. Cette comparaison en régime permanent montre que la structure proposée garantit une qualité d'estimation meilleure et plus stable que celle offerte par un AEC 20 classique et par le WAEC. La figure 9 illustre, pour un signal de parole SIG initialement émis et donnant naissance à un signal d'écho, l'évolution de LERLE en présence de bruit ambiant et de parole locale SIG_LOC, dans le cas de la présente invention et d'un AEC classique. La puissance de la parole locale est généralement liée à celle de l'écho 25 par le rapport : RSB2 = 10Log P cho P s Dans le présent cas, RSB2= -20 dB. Les résultats montrent que la structure proposée donne de meilleures performances même en présence de parole locale.
La présente invention a été décrite et illustrée dans la présente description détaillée et dans les Figures. La présente invention ne se limite pas aux formes de réalisation présentées. D'autres variantes et modes de réalisation peuvent être déduits et mis en oeuvre par la personne du métier à la lecture de la présente description et des Figures annexées. Dans les revendications, le terme "comporter" n'exclut pas d'autres éléments ou d'autres étapes. L'article indéfini « un » n'exclut pas le pluriel. Un seul processeur ou plusieurs autres unités peuvent être utilisées pour mettre en oeuvre l'invention. Les différentes caractéristiques présentées et/ou revendiquées peuvent être avantageusement combinées. Leur présence dans la description ou dans des revendications dépendantes différentes, n'excluent pas cette possibilité. Les signes de référence ne sauraient être compris comme limitant la portée de l'invention.

Claims (13)

  1. REVENDICATIONS1. Procédé d'annulation d'écho acoustique dans un premier signal (y) comportant un signal d'écho d'un deuxième signal (x), caractérisé en ce qu'il comporte : - insérer (S40), de manière inaudible, dans le deuxième signal une séquence pseudo aléatoire (w) dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue, - caractériser (S43), dans le premier signal, au moyen de la séquence insérée, un canal acoustique suivi par le signal d'écho, - estimer (ESTIM) le signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et - annuler (S44) le signal d'écho au moyen de l'estimation obtenue.
  2. 2. Procédé selon la revendication 1, dans lequel la caractérisation du canal acoustique se fait par intercorrélation (INTERCOR) du premier signal avec la séquence pseudo aléatoire.
  3. 3. Procédé selon la revendication 1, dans lequel la caractérisation du canal acoustique comporte un filtrage adaptatif (ADAPT) du deuxième signal.
  4. 4. Procédé selon la revendication 1, dans lequel la caractérisation du canal acoustique comporte un filtrage par bloc du deuxième signal.
  5. 5. Procédé selon la revendication 1, dans lequel la caractérisation du canal 25 acoustique comporte les étapes : - effectuer un filtrage adaptatif et/ou par bloc du deuxième signal, et - effectuer une intercorrélation du premier signal avec la séquence pseudo aléatoire.20
  6. 6. Procédé selon l'une des revendications précédentes, comportant en outre : - appliquer un filtre de mise en forme (FORM) à la séquence pseudo aléatoire avant son insertion dans le deuxième signal.
  7. 7. Programme d'ordinateur comportant des instructions pour la mise en oeuvre d'un procédé selon l'une des revendications précédentes lorsqu'il est exécuté par un processeur.
  8. 8. Circuit configuré pour la mise en oeuvre d'un procédé selon l'une des revendications 1 à 6.
  9. 9. Système d'annulation d'écho (AEC) dans un premier signal (y) comportant un signal d'écho d'un deuxième signal (x), le système comportant : - une unité d'insertion (INS), de manière inaudible, dans le deuxième signal d'une séquence pseudo aléatoire dont l'autocorrélation circulaire comporte une impulsion unité et une composante continue, - une unité de caractérisation (CARACT), dans le premier signal, au moyen de la séquence insérée, d'un canal acoustique suivi par le signal d'écho, - une unité d'estimation (ESTIM) du signal d'écho dans le premier signal au moyen de la caractérisation du canal acoustique, et - une unité d'annulation (ANNUL) du signal d'écho au moyen de l'estimation obtenue.
  10. 10. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte une unité d'intercorrélation du premier signal avec la séquence pseudo aléatoire.
  11. 11. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte un filtre adaptatif du deuxième signal.
  12. 12. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte un filtre par bloc du deuxième signal.
  13. 13. Système selon la revendication 9, dans lequel l'unité de caractérisation du canal acoustique comporte : - un filtre adaptatif et/ou par bloc du deuxième signal, et - une unité d'intercorrélation du premier signal avec la séquence pseudo aléatoire. 16. Système selon l'une des revendications 9 à 13, comportant en outre : - un filtre de mise en forme de la séquence pseudo aléatoire avant son insertion dans le deuxième signal. 17. Système selon l'une des revendications 9 à 14, comportant en outre : - une première entrée (E1) pour recevoir le premier signal, - une première sortie (S1) pour envoyer le premier signal avec le signal d'écho annulé, - une deuxième entrée (E2) pour recevoir le deuxième signal, et - une deuxième sortie (S2) pour envoyer le deuxième signal avec la séquence insérée.
FR0957636A 2009-10-29 2009-10-29 Procede et dispositif d'annulation d'echo acoustique par tatouage audio Expired - Fee Related FR2952263B1 (fr)

Priority Applications (7)

Application Number Priority Date Filing Date Title
FR0957636A FR2952263B1 (fr) 2009-10-29 2009-10-29 Procede et dispositif d'annulation d'echo acoustique par tatouage audio
EP10788106A EP2494772A1 (fr) 2009-10-29 2010-10-27 Procede et dispositif d'annulation d'echo acoustique par tatouage audio
CA2779157A CA2779157A1 (fr) 2009-10-29 2010-10-27 Procede et dispositif d'annulation d'echo acoustique par tatouage audio
PCT/FR2010/052309 WO2011051625A1 (fr) 2009-10-29 2010-10-27 Procede et dispositif d'annulation d'echo acoustique par tatouage audio
US13/503,607 US20120213380A1 (en) 2009-10-29 2010-10-27 Method and Device for Cancelling Acoustic Echo by Audio Watermarking
JP2012535905A JP5749275B2 (ja) 2009-10-29 2010-10-27 オーディオ透かしによって音響エコーをキャンセルするための方法および装置
TNP2012000193A TN2012000193A1 (fr) 2009-10-29 2012-04-25 Procede et dispositif d'annulation d'echo acoustique par tatouage audio

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0957636A FR2952263B1 (fr) 2009-10-29 2009-10-29 Procede et dispositif d'annulation d'echo acoustique par tatouage audio

Publications (2)

Publication Number Publication Date
FR2952263A1 true FR2952263A1 (fr) 2011-05-06
FR2952263B1 FR2952263B1 (fr) 2012-01-06

Family

ID=42106007

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0957636A Expired - Fee Related FR2952263B1 (fr) 2009-10-29 2009-10-29 Procede et dispositif d'annulation d'echo acoustique par tatouage audio

Country Status (7)

Country Link
US (1) US20120213380A1 (fr)
EP (1) EP2494772A1 (fr)
JP (1) JP5749275B2 (fr)
CA (1) CA2779157A1 (fr)
FR (1) FR2952263B1 (fr)
TN (1) TN2012000193A1 (fr)
WO (1) WO2011051625A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2785032A4 (fr) * 2011-12-26 2015-06-10 Zte Corp Annuleur d'écho et procédé d'annulation d'écho
WO2016096339A1 (fr) * 2014-12-15 2016-06-23 Wire Swiss Gmbh Estimation de retard pour annulation d'écho à l'aide de marqueurs ultrasoniques

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103516921A (zh) 2012-06-28 2014-01-15 杜比实验室特许公司 通过隐藏音频信号的回声控制
US9210270B2 (en) 2012-11-15 2015-12-08 Qualcomm Incorporated Echo cancellation for ultrasound
US9065971B2 (en) * 2012-12-19 2015-06-23 Microsoft Technology Licensing, Llc Video and audio tagging for active speaker detection
CN108417199B (zh) * 2013-01-18 2022-11-22 株式会社东芝 音频水印信息检测装置及音频水印信息检测方法
US20160293181A1 (en) * 2014-01-17 2016-10-06 Intel Corporation Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices.
HUP1500264A2 (en) * 2015-06-01 2018-05-02 Femtonics Kft Layered structured acousto-optical deflector and method for optical beam deflection with deflectior
US10122863B2 (en) * 2016-09-13 2018-11-06 Microsemi Semiconductor (U.S.) Inc. Full duplex voice communication system and method
TWI790718B (zh) * 2021-08-19 2023-01-21 宏碁股份有限公司 會議終端及用於會議的回音消除方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000074362A2 (fr) * 1999-05-27 2000-12-07 Telefonaktiebolaget Lm Ericsson (Publ) Procedes et appareil permettant d'ameliorer la performance d'un filtre adaptatif en incluant des informations inaudibles
WO2001026352A1 (fr) * 1999-10-06 2001-04-12 Acoustic Technologies, Inc. Marquage d'echos au moyen de bruit basse frequence
WO2002054719A2 (fr) * 2000-12-28 2002-07-11 At & T Corp. Procede et appareil de reduction active de resonances de telephone haut-parleur

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3212796B2 (ja) * 1994-05-07 2001-09-25 株式会社エヌ・ティ・ティ・ドコモ エコーキャンセラ
DE69734207T2 (de) * 1996-07-16 2006-06-14 Koninkl Philips Electronics Nv Detektion eines eingebetteten wasserzeichens in einem informationssignal
US6888945B2 (en) * 1998-03-11 2005-05-03 Acentech, Inc. Personal sound masking system
JP4348924B2 (ja) * 2002-10-02 2009-10-21 日本電気株式会社 エコーキャンセラ装置及びそれに用いるエコーキャンセラ方法
US8396206B2 (en) * 2007-02-15 2013-03-12 Infineon Technologies Ag Multi-channel communication device and methods for reducing echoes by inserting a training sequence under a spectral mask

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000074362A2 (fr) * 1999-05-27 2000-12-07 Telefonaktiebolaget Lm Ericsson (Publ) Procedes et appareil permettant d'ameliorer la performance d'un filtre adaptatif en incluant des informations inaudibles
WO2001026352A1 (fr) * 1999-10-06 2001-04-12 Acoustic Technologies, Inc. Marquage d'echos au moyen de bruit basse frequence
WO2002054719A2 (fr) * 2000-12-28 2002-07-11 At & T Corp. Procede et appareil de reduction active de resonances de telephone haut-parleur

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2785032A4 (fr) * 2011-12-26 2015-06-10 Zte Corp Annuleur d'écho et procédé d'annulation d'écho
US9282195B2 (en) 2011-12-26 2016-03-08 Zte Corporation Echo canceller and echo cancellation method
WO2016096339A1 (fr) * 2014-12-15 2016-06-23 Wire Swiss Gmbh Estimation de retard pour annulation d'écho à l'aide de marqueurs ultrasoniques

Also Published As

Publication number Publication date
FR2952263B1 (fr) 2012-01-06
TN2012000193A1 (fr) 2013-12-12
CA2779157A1 (fr) 2011-05-05
US20120213380A1 (en) 2012-08-23
EP2494772A1 (fr) 2012-09-05
JP5749275B2 (ja) 2015-07-15
JP2013509774A (ja) 2013-03-14
WO2011051625A1 (fr) 2011-05-05

Similar Documents

Publication Publication Date Title
FR2952263A1 (fr) Procede et dispositif d&#39;annulation d&#39;echo acoustique par tatouage audio
EP2057835B1 (fr) Procédé de réduction de l&#39;écho acoustique résiduel après suppression d&#39;écho dans un dispositif &#34;mains libres&#34;
US9343056B1 (en) Wind noise detection and suppression
FR2770361A1 (fr) Processeur non lineaire pour suppresseur d&#39;echo acoustique
CN104427068B (zh) 一种语音通话方法及装置
EP0767569B1 (fr) Procédé et dispositif d&#39;identification adaptative et annuleur d&#39;écho adaptatif s&#39;y rapportant
Schwarz et al. Spectral feature-based nonlinear residual echo suppression
EP2057834A1 (fr) Circuit de réduction de l&#39;écho acoustique pour un dispositif &#34;mains libres&#34; utilisable avec un téléphone portable
CN104994249B (zh) 声回波消除方法和装置
JP4678349B2 (ja) 通話判定装置
JP3507020B2 (ja) 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
FR2946486A1 (fr) Procede de detection d&#39;une situation de double parole pour dispositif telephonique &#34;mains libres&#34;
US8588404B2 (en) Method and apparatus for acoustic echo cancellation in VoIP terminal
US20060198511A1 (en) Fast echo canceller reconvergence after TDM slips and echo level changes
EP1655857B1 (fr) Dispositif et procédé de détection d&#39;une divergence d&#39;un filtre adaptatif
US7856098B1 (en) Echo cancellation and control in discrete cosine transform domain
CN111210799A (zh) 一种回声消除方法及装置
FR2824982A1 (fr) Procede de controle adaptatif de systeme d&#39;annulation d&#39;echo multivoies et dispositif pour mettre en oeuvre le procede
WO2008049983A1 (fr) Circuit de réduction de l&#39;écho acoustique pour un dispositif &#39;mains libres&#39; utilisable avec un téléphone portable
EP1236340A1 (fr) Annuleur d&#39;echo dans un systeme de communication au niveau d&#39;un terminal
JP2016174233A (ja) 情報処理装置、判定方法及びコンピュータプログラム
Fukui et al. Acoustic echo canceller software for VoIP hands-free application on smartphone and tablet devices
CN109361827B (zh) 一种通信终端的回音二次抑制方法
CN111294474B (zh) 一种双端通话检测方法
FR3115390A1 (fr) Procédé et dispositif pour une annulation d’écho à pas variable

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 7

PLFP Fee payment

Year of fee payment: 8

ST Notification of lapse

Effective date: 20180629