FR2772964A1 - Procede de localisation vocale d'un passager a l'interieur d'un vehicule - Google Patents

Procede de localisation vocale d'un passager a l'interieur d'un vehicule Download PDF

Info

Publication number
FR2772964A1
FR2772964A1 FR9716383A FR9716383A FR2772964A1 FR 2772964 A1 FR2772964 A1 FR 2772964A1 FR 9716383 A FR9716383 A FR 9716383A FR 9716383 A FR9716383 A FR 9716383A FR 2772964 A1 FR2772964 A1 FR 2772964A1
Authority
FR
France
Prior art keywords
calculation
signals
passenger
speakers
stereophonic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9716383A
Other languages
English (en)
Other versions
FR2772964B1 (fr
Inventor
Emmanuel Granier
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Renault SAS
Original Assignee
Renault SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Renault SAS filed Critical Renault SAS
Priority to FR9716383A priority Critical patent/FR2772964B1/fr
Publication of FR2772964A1 publication Critical patent/FR2772964A1/fr
Application granted granted Critical
Publication of FR2772964B1 publication Critical patent/FR2772964B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

L'invention concerne un procédé de localisation vocale d'un passager d'un véhicule doté d'une source sonore numérique stéréophonique, associée à un processeur de traitement du signal et à au moins deux haut-parleurs, positionnés de part et d'autre de l'habitacle du véhicule, lors d'une estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, tel que cette estimation est faite soit par calcul des différences de gain entre les voies gauche et droite, réalisé par calcul des spectres moyens (Sg et Sd ) correspondant aux deux voies, par calcul du rapport (Hgd ) de ces deux spectres gauche (Sg ) et droit (Sd ) et mémorisation de ce rapport par bande de fréquences, soit par calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit.

Description

PROCEDE DE LOCALISATION VOCALE D'UN PASSAGER
A L'INTERIEUR D'UN VEHICULE
L'invention concerne un procédé de localisation du conducteur, ou d'un passager, dans l'habitacle d'un véhicule automobile, à partir de ses paroles captées par les hauts-parleurs d'un auto-radio par exemple.
Cette localisation vocale a essentiellement deux applications : la correction de l'image stéréophonique générée par une chaîne haute fidélité dans l'habitacle d'une voiture et l'amélioration de certaines prestations à l'intérieur du véhicule, telles que le réglage automatique de la position des rétroviseurs ou de la climatisation.
L'habitacle d'un véhicule automobile est un environnement particulièrement défavorable à l'écoute haute fidélité des sons émis par une source sonore stéréophonique, telle qu'un auto-radio ou un lecteur de disques compacts. Les passagers sont fortement décentrés par rapport à la position des haut-parleurs droits et gauches d'une part, et les sons émis se réfléchissent contre les parois intérieures du véhicule, perturbant leur diffusion dans les oreilles des passagers d'autre part. Le conducteur perçoit la musique principalement sur sa gauche, alors que le passager à côté de lui la perçoit plutôt sur sa droite.
Cette dissymétrie de l'image stéréophonique limite la qualité globale de la restitution sonore. Lorsque le conducteur est le seul passager, il peut ajuster le centrage de l'image stéréophonique à l'aide d'un potentiomètre généralement appelé balance, qui modifie le niveau relatif des voix gauche et droite. Cependant, cette correction reste partielle car le même gain correctif est apporté à la totalité du signal.
En fait, la réalité du champ sonore dans l'habitacle d'une voiture est différente car le déséquilibre des signaux reçus par les oreilles droite et gauche dépend de la fréquence du signal sonore.
Actuellement, pour améliorer l'image stéréophonique, il existe des dispositifs proposant une correction automatique des déséquilibres droite/gauche pour différentes bandes de fréquences, mais la position des oreilles des passagers par rapport aux haut-parleurs n'étant pas connue a priori, un tel traitement du signal sonore est difficile à réaliser. De plus, les écarts de niveau entre les signaux reçus par les voies droite et gauche dépendent beaucoup des caractéristiques de l'habitacle du véhicule.
Une solution actuelle est décrite dans le brevet
US 5,386,478, déposé au nom de Harman International
Industries, consistant en un microphone, associé à un autoradio, intégré dans une télécommande. L'utilisateur place ce micro à proximité de ses oreilles et sort du véhicule. L'autoradio génère alors un signal test, qui est amplifié par les haut-parleurs puis capté par le microphone placé à proximité de la zone d'écoute. Les informations déduites des signaux captés sont transmises à l'autoradio par une liaison infrarouge. Le signal reçu est analysé et est comparé au signal test.
Le rapport des deux signaux permet de déduire les caractéristiques du déséquilibre stéréophonique.
L'autoradio peut ensuite corriger l'image stéréophonique à partir de ces données.
Les inconvénients de cette solution viennent du fait que l'utilisateur est contraint de déplacer un microphone, qu'un signal désagréable est émis dans le véhicule et que le coût est élevé car elle nécessite une télécommande avec liaison infra-rouge et probablement des moyens de traitement du signal.
Le but de la présente invention est de pallier ces inconvénients en proposant un dispositif qui exploite les signaux électriques générés par les haut-parleurs, à partir de l'onde acoustique correspondant aux paroles du conducteur ou d'un passager, pour déterminer différentes informations. Ce dispositif permet notamment la correction automatique de l'image stéréophonique.
Pour cela, l'objet de l'invention est un procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique, associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d'autre de l'habitacle du véhicule, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par les
haut-parleurs gauche et droit; - amplification desdits signaux électriques - numérisation desdits signaux électriques amplifiés - estimation du déséquilibre stéréophonique par calcul
des différences de gain entre les voies gauche et
droite, comportant les étapes suivantes . calcul des spectres moyens correspondant aux voies
gauche et droite, sur une durée suffisante . calcul du rapport de ces deux spectres gauche et
droit et mémorisation de ce rapport par bande de
fréquences ;
calcul des gabarits des filtres inverses, respectivement égaux à la racine carrée du rapport des deux spectres et à l'inverse de la racine carrée dudit rapport.
Selon une autre caractéristique de l'invention, l'estimation du déséquilibre stéréophonique est obtenue par calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit.
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description d'un exemple de réalisation du procédé, illustré par les figures suivantes qui sont - la figure 1 : les étapes constitutives du procédé de
localisation du conducteur et de deux types
d'application, selon l'invention - la figure 2 : un schéma électronique d'un exemple de
réalisation du calcul du déséquilibre stéréophonique
entre les voies gauche et droite, selon l'invention - les figures 3a et 3b : un exemple du signal capté par
les deux haut-parleurs gauche et droit
respectivement, en réception de paroles - la figure 4 : un exemple de spectres calculés à
partir des signaux captés par les deux haut-parleurs
selon les figures 3a et 3b - la figure 5 : un exemple de rapport des deux spectres
représentés sur la figure 4 - la figure 6 : un exemple de spectre calculé à partir
du signal gauche capté, représenté sur la figure 3a - les figures 7 et 8 : le schéma électronique de deux
exemples de réalisation du calcul du délai temporel
entre les deux haut-parleurs - la figure 9 : le signal résultant de la corrélation
des signaux droit et gauche - la figure 10 : un exemple de répartition des délais
entre les haut-parleurs - la figure 11 : la prise en compte des haut-parleurs
du véhicule pour le calcul de la position du
conducteur.
Les éléments portant les mêmes références dans les différentes figures remplissent les mêmes fonctions en vue des mêmes résultats.
L'invention propose une solution au problème du déséquilibre stéréophonique des voix droite et gauche dans un véhicule automobile, basée sur les deux principes physiques suivants - le théorème de réciprocité qui stipule que la
fonction de transfert mesurée entre une source sonore
omnidirectionnelle, positionnée en un premier point,
et un capteur omnidirectionnel, positionné en un
autre point distinct du premier, est identique à la
fonction de transfert mesurée lorsque les positions
réciproques de la source et du capteur sont
inversées; - un haut-parleur utilisé généralement comme
transducteur d'une onde électrique en une onde
acoustique peut également convertir une onde
acoustique en onde électrique.
Le déséquilibre stéréophonique est dû à deux causes la première concerne les différences de gain des voix gauche et droite liées à la dissymétrie de l'habitacle, la seconde concerne la différence de distance entre les haut-parleurs droits et gauches et les oreilles des passagers.
Selon une première caractéristique de l'invention, le procédé permet de compenser la première cause, soit la différence de gain.
Pendant une première phase du procédé, représenté sur la figure 1, commandée par l'utilisateur 1, les paroles qu'il prononce sont reçues et converties en ondes électriques par les haut-parleurs droit 2d et gauche 2gt placés de part et d'autre de la planche de bord du véhicule par exemple, de préférence à l'arrêt du véhicule.
Quand le véhicule se déplace, un bruit important s'ajoute aux paroles captées par les haut-parleurs et il est alors nécessaire d'appliquer une étape de débruitage par un traitement classique du signal.
Ces signaux électriques subissent une amplification Ad et Agi puis une numérisation Nd et Nui avant d'être mémorisés dans des mémoires tampon Md et M g à chaque itération i, soit toutes les 0,05 secondes par exemple correspondant à 1024 points à 11 KHz.
Les figures 3a et 3b sont un exemple de ces deux signaux captés par les haut-parleurs gauche et droit respectivement, en réception de paroles, représentés par leur amplitude A en fonction du temps t.
Une étape el de traitement du signal calcule, à partir de ces signaux numériques obtenus, les spectres moyens Sd et 5g correspondant aux voies droite et gauche respectivement, sur une durée suffisante.
La figure 4 montre les spectres des signaux gauche et droit, respectivement en trait continu et en pointillés, calculés à partir des signaux des figures 3a et 3b, soit l'amplitude A en fonction de la fréquence f.
Une seconde étape e2 de traitement consiste à calculer le rapport de ces deux spectres Sd et Sg, référencé et et à le stocker par bande de fréquences dans une mémoire M de l'autoradio à l'étape e3.
La figure 5 est la représentation du rapport des spectres de la figure 4.
L'étape suivante e4 calcule, à chaque itération i, soit toutes les 0,05 secondes, la moyenne entre le rapport calculé H'gd et le rapport moyen précédent Hgd(i-1) mémorisé, établie selon la formule suivante
Hgd(i) = 1/i {[(i-1) x Hgd(i-1)] + H'gd}
Puis, le rapport Hgd(i), établi à l'itération i, est mémorisé en remplacement du rapport Hgd( i-l) établi à l'itération précédente.
Le rapport obtenu Hgd lorsque l'étape est terminée au bout d'un certain temps, correspondant à la durée d'une phrase courte, soit 3 secondes par exemple, représente le déséquilibre stéréophonique.
Le procédé comporte une étape suivante e5 de calcul des coefficients des filtres inverses, de gabarits respectivement égaux à la racine carrée du rapport Hgd, çHgd et à l'inverse de cette racine carrée l/VHg destinés à réaliser la compensation des déformations stéréophoniques, puis une étape e6 de mémorisation de ces filtres dans une mémoire tampon de l'autoradio.
Selon un exemple de réalisation non limitatif, représenté sur la figure 2, les signaux sd et Sg contenus dans les mémoires tampons Md et Mgt sous forme de 1024 points, et représentés sur les figures 3b et 3a respectivement, sont multipliés par une fenêtre, de "hamming" par exemple, de longueur correspondante égale à 1024 points, tous les 512 points à 11 kHz soit toutes les 0,05 secondes, lors d'une étape E1. Le calcul des spectres correspondant aux voies droite et gauche peut être réalisé tout d'abord par une étape E2 de calcul de la transformée de Fourier rapide d'une des voies, la gauche par exemple. Lors d'une étape E3, le cepstre correspondant est calculé, puis une étape E4 détecte un signal de paroles à partir de ce cepstre.
La figure 6 est la représentation du cepstre C e calculé à partir du signal de la voie de gauche, apparaissant à la figure 3a.
Si aucun signal de paroles n' est détecté, le procédé s'arrête jusqu'aux portions de signaux suivants définis dans la fenêtre suivante, 512 points plus tard. Si un signal de paroles a bien été détecté, l'étape E'2 effectue la transformée de Fourier rapide du signal correspondant à la voie droite.
Une étape E5 de troncature des deux spectres sur 513 points, le 513ème point correspondant à la fréquence de
Nyquist, soit la moitié de la fréquence d'échantillonnage, suivie d'une étape E6 de calcul des valeurs absolues des transformées de Fourier tronquées, permet l'obtention des spectres Sd et Sg correspondant aux voies droite et gauche. Les étapes suivantes ont déjà été décrites.
En vue de son application à la correction automatique de l'image stéréophonique en phase d'écoute, les signaux, émis par une source sonore numérique, sont envoyés dans des modules qui assurent leur traitement e7 par les filtres inverses de gabarits égaux à çHgd et l/ < Hgd. Dans le cas d'une source sonore analogique, un récepteur radio par exemple, les signaux correspondant aux deux voies doivent être numérisées au préalable.
Une fois traités, une étape e8 d'amplification modifie leurs gains avant leur envoi vers les haut-parleurs 2d et 2g I1 est possible de supprimer les modules E6 de calcul des valeurs absolues, de sorte que l'étape e2 de calcul du rapport de deux spectres est effectuée sur les fonctions de transfert complexes, ce qui permet de prendre en compte la phase.
Selon une autre caractéristique de l'invention, le procédé compense la différence de distance entre les haut-parleurs gauche et droit et le conducteur, ou un passager, qui fait que les ondes acoustiques émises par ces haut-parleurs arrivent à des instants tg et td différents aux oreilles de l'utilisateur.
Le procédé comporte pour cela une étape e9 de calcul de la corrélation Cgd entre les signaux mémorisés sd et Sg pour une fenêtre temporelle de courte durée se déplaçant sur l'ensemble du signal capté. Pour chaque fenêtre temporelle j, le procédé estime, à l'étape e10, l'instant correspondant au maximum de la corrélation
Cgd (j) qui coïncide avec le décalage temporel tgd (j).
Ce calcul est renouvelé sur l'ensemble du signal. Le procédé estime alors, à l'étape e1l, que le décalage tgd est la valeur la plus fréquente des décalages temporels tgd (j).
Dans son application à la correction automatique de l'image stéréophonique en phase d'écoute, la voie droite, ou la voie gauche si le décalage tgd est négatif, est retardée du temps tgd
La figure 7 est le schéma électronique d'un premier exemple de réalisation de ce calcul du délai temporel entre les deux haut-parleurs gauche et droit effectué dans le domaine temporel. Toutes les 0,05 secondes, les signaux numériques mémorisés sg et sd, sont filtrés lors d'une étape E7 sur une bande de fréquences correspondant à l'étendue spectrale de la voix, entre 500 Hz et 3kHz par exemple.
L'étape E8 suivante calcule la corrélation normalisée
Cgd(t) entre les signaux filtrés pour des temps t variant entre 10 et + 10 millisecondes, ce qui correspond à des différences de distance de 3 mètres, distance maximale généralement atteinte dans un véhicule automobile de tourisme.
La figure 9 montre la corrélation calculée à partir des signaux gauche et droit de la figure 3. Le maximum Cm de Cgdt) est élevé si les signaux correspondent à des paroles et il est faible s'ils correspondent à du bruit.
L'étape Eg calcule ensuite le temps tgd(j) pour lequel la corrélation est maximale Cm temps qui est stocké à l'étape E11 si l'étape E10 de comparaison de ce maximum Cm avec un seuil prédéterminé, égal à 0,7 par exemple, indique la présence de parole.
La figure 10 illustre un exemple de répartition des temps tgd (j), calculés pour différentes fenêtres temporelles successives j.
L'étape E12 suivante évalue, après un nombre déterminé suffisant d'itérations, le délai le plus probable tgd qui est alors mémorisé à l'étape E13.
Le seuil de corrélation permet de déterminer la présence d'une source sonore ponctuelle. I1 est de plus possible d'ajouter un test à partir du cepstre, défini précédemment, pour vérifier que ces signaux correspondent à des paroles.
I1 est également possible de faire le calcul du délai temporel entre deux haut-parleurs dans le domaine fréquentiel, selon un procédé qui est représenté sur la figure 8.
Les signaux sg et sd contenus dans les mémoires tampons M g et Md sont multipliés par une fenêtre de "hamming" de longueur égale à celle des signaux mémorisés soit 1024 points, lors d'une étape E1, puis l'étape E2 calcule leur transformée de Fourier rapide, comme lors de la description de la figure 2. A l'étape E14, le procédé calcule les excès de phase correspondants E g et
Ed, puis à l'étape E15 le rapport entre ces deux excès de phase Eg/Ed. Une étape E16 d'interpolation sur un intervalle de fréquence limité, entre 800 Hz et 3kHz par exemple, permet d'en déduire le délai. Comme pour le délai dans le domaine temporel, ce délai est stocké en mémoire à l'étape E11, puis, au bout d'un nombre suffisant d'itérations, l'étape E12 évalue le délai le plus probable tg mémorisé à l'étape E13.
Le signal correspondant à la parole est un signal dit "quasi-stationnaire" : son autocorrélation est relativement élevée. La différence de niveau entre les lobes secondaires et le lobe principal de son autocorrélation est limitée. Aussi, le calcul du délai dans le domaine fréquentiel peut être limité aux portions du signal correspondant au début d'un mot, comme le montre la figure 3. Dans ce cas, la différence entre le lobe principal et les lobes secondaires de la corrélation est plus importante, ce qui est visible sur la figure 9. Pour déterminer ces portions de signal, il suffit de vérifier que la valeur maximale sur 0.1 seconde, au début du signal est au moins trois fois inférieure à la valeur maximale sur la suite du signal.
Dans son application à la correction automatique de l'image stéréophonique en phase d'écoute, le signal émis sur une des deux voies d'une source sonore numérique est retardé d'un nombre de points égal à tgd/ c'est-à-dire la voie gauche si le décalage tgd est positif, et la voie droite, si le décalage est négatif, dans les modules de traitement e7 (figure 1).
Les deux procédés de correction, par compensation de la différence du gain et de la différence de distance entre les haut-parleurs gauche et droit, peuvent être appliqués également en combinaison.
La deuxième application de ce procédé de localisation du conducteur, ou d'un passager dans un véhicule, à partir de ses paroles, concerne l'amélioration de certaines prestations, telles que le positionnement automatique des rétroviseurs extérieurs et intérieur, un réglage plus précis de la climatisation ou de la ventilation ou de l'ajustement d'un afficheur tête haute nécessitant la localisation de la tête. Pour cela, le véhicule doit être équipé de deux hautparleurs à l'avant et deux à l'arrière.
Les étapes du procédé décrites précédemment pour compenser la différence de distance entre les deux haut-parleurs à gauche et à droite de la planche de bord, doivent en plus être appliquées à deux autres couples de haut-parleurs, les deux haut-parleurs latéraux, gauches par exemple, et deux haut-parleurs en diagonale. La connaissance des décalages entre ces différents haut-parleurs permet le calcul de l'écart en distance qui les sépare de la tête de l'utilisateur, dont la localisation peut être considérée comme l'intersection de trois hyperboloïdes de révolution. En effet, comme le montre la figure 11 représentant la répartition géographique des quatre haut-parleurs Ho à
H3 dans un véhicule, repérés par leurs coordonnées cartésiennes (Xi, Yi, Zi), avec i nombre entier compris entre 1 et 3, dans le repère passant par le hautparleur gauche, Ho de coordonnées (0, 0, 0) par exemple, si la bouche du conducteur est repérée par ses coordonnées polaires, e et, sa position est déduite du système de trois équations à trois inconnues suivant: 2 *(c*di - Xi*cos#*cos# - Yi*sin#*cos# - Zi*sin#) = c2 *d2 - Xi2 - yi2 - Zi2 dans lesquelles c est la vitesse du son et di est le décalage temporel entre le haut-parleur avant gauche Ho de référence et un des trois autres haut-parleurs H1,
H2 ou H3.
Une compensation, calculée sur une moyenne d'individus, peut être ajoutée pour estimer la position de ses oreilles et celle de ses yeux en vue du réglage automatique de la position des rétroviseurs.
Cette connaissance de la position des yeux permet également d'optimiser l'efficacité des écrans dits "écrans tête-haute"présentant des informations visuelles au-delà du pare-brise.
La connaissance de la position de la bouche des passagers permettrait d'orienter automatiquement les aérateurs de ventilation ou de climatisation d'une manière plus optimale pour garantir des conditions de température confortables au voisinage de leurs corps et plus particulièrement à proximité de leur visage.
I1 est aussi possible de rechercher la localisation de tous les passagers d'un véhicule pour en connaître le nombre et avoir un aperçu de leur taille pour savoir s'il s'agit d'un adulte ou d'un enfant. De telles informations peuvent être envoyées à un centre d'assistance, par un réseau de téléphonie, qui pourra, à la suite d'un accident, dimensionner correctement les moyens de secours qu'il est nécessaire de mettre en oeuvre.
La présente invention offre plusieurs avantages par rapport à l'art antérieur, en particulier son coût limité car il ne nécessite pas de microphone. Par ailleurs, le processeur de traitement du signal nécessaire à la chaîne de restitution peut être employé pour évaluer les caractéristiques de ce déséquilibre, c'est-à-dire le rapport entre les spectres Hgd et le délai tgd entre les haut-parleurs.
I1 faut ajouter que l'ergonomie du dispositif de mise en oeuvre du procédé est nettement supérieure à celles des systèmes actuels, car l'utilisateur n'est pas contraint de déplacer un microphone ou une télécommande. La commande d'une correction de l'image stéréophonique peut être faite par la voix de l'utilisateur, par l'intermédiaire d'un système de reconnaissance vocale, la phase prononcée pouvant être utilisée elle-même pour évaluer les caractéristiques du déséquilibre stéréophonique.

Claims (10)

  1. deux haut-parleurs gauche et droit.
    du décalage temporel entre les signaux provenant des
    amplifiés ; - estimation du déséquilibre stéréophonique par calcul
    haut-parleurs gauche et droit (2g et 2d) ; - amplification (Ag et Ad) desdits signaux électriques; - numérisation (Ng et Nd) desdits signaux électriques
    (VHgd) et à l'inverse de la racine carrée du rapport (î/VHg)
  2. 2. Procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d'autre de l'habitacle du véhicule, entre les voies droite et gauche à partir des paroles prononcées par le passager, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par les
    respectivement égaux à la racine carrée du rapport
    rapport par bande de fréquences # (e5) calcul des gabarits des filtres inverses,
    gauche (Sg) et droit (Sd) et mémorisation de ce
    durée suffisante . (e2) calcul du rapport (Hgd) de ces deux spectres
    correspondant aux voies gauche et droite, sur une
    droite, comportant les étapes suivantes . (el) calcul des spectres moyens (Sg et Sd)
    des différences de gain entre les voies gauche et
    amplifiés - estimation du déséquilibre stéréophonique par calcul
    haut-parleurs gauche et droite (2g et 2d) - amplification (Ag et Ad) desdits signaux électriques; - numérisation (Ng et Nd) desdits signaux électriques
    REVENDICATIONS 1. Procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d d'autre de l'habitacle du véhicule, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par les
  3. 3. Procédé de localisation vocale selon la revendication 2, caractérisée en ce que le calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit est effectué dans le domaine temporel, par les étapes suivantes - (e9) corrélation (Cgd) entre les signaux mémorisés
    (Sg et Sd) pour une fenêtre temporelle de courte
    durée déterminée se déplaçant sur l'ensemble du
    signal capté par les deux haut-parleurs - (e10) estimation, pour chaque fenêtre temporelle (j),
    de l'instant correspondant au maximum de la
    corrélation [Cgd()] qui coïncide avec le décalage
    temporel [tgd (j)] entre les voies gauche et droite ; - (e1l) estimation du décalage (tgd) temporel, entre
    les signaux provenant des deux haut-parleurs gauche
    et droit, comme étant la valeur la plus fréquente des
    décalages temporels [tgd (j)] établis pour toutes les
    fenêtres temporelles (j).
  4. 4. Procédé de localisation vocale selon la revendication 3, caractérisée en ce que le calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit est effectué dans le domaine temporel, par - (E7) filtrage des signaux numériques mémorisés (Sgt
    Sd) sur une bande de fréquences correspondant à
    l'étendue spectrale de la voix ; - (E8) calcul de la corrélation normalisée [Cgd(t)]
    entre les signaux filtrés, pour chaque fenêtre
    temporelle (j) pour des temps correspondant à des
    différences de distance égales à la distance maximale
    entre deux points de l'habitacle d'un véhicule
    standard; - (Eg) calcul du temps [tg()] pour lequel la
    corrélation est maximale (Cm) - (E10) comparaison de cette corrélation maximale (Cm)
    avec un seuil prédéterminé indiquant la présence de
    paroles - (E11) mémorisation de la valeur de la corrélation
    maximale (Cm) - (E12) évaluation, après un nombre suffisant déterminé
    d'itérations, du délai le plus probable (tgd) - (E13) mémorisation du délai le plus probable (tgd)
  5. 5. Procédé de localisation vocale selon la revendication 2, caractérisé en ce que le calcul du décalage temporel entre les signaux provenant de ces deux haut-parleurs gauche et droit est effectué dans le domaine fréquentiel, selon les étapes suivantes - (E1) multiplication des signaux (Sg et sd) contenus
    dans les mémoires tampons (Mg et Md) par une fenêtre
    de "hamming", de longueur égale à celle des signaux
    mémorisés; - (E2) calcul de la transformée de Fourier rapide
    desdits signaux précédemment multipliés - (E14) calcul des excès de phase correspondant (Eg et
    Ed) ; - (E15) calcul du rapport (Eg/Ed) entre ces deux excès
    de phase (E16) interpolation linéaire sur un intervalle de
    fréquences limité délivrant la valeur du décalage - (E11) mémorisation du délai à chaque itération - (E12) évaluation, après un nombre suffisant déterminé
    d'itérations, du délai le plus probable (tgd) - (E13) mémorisation du délai le plus probable.
  6. 6. Procédé de localisation vocale selon la revendication 1, caractérisé en ce que le calcul des différences de gain entre les voies gauche et droite comporte les étapes suivantes - (E1) multiplication des signaux (sg et sd) contenus
    dans les mémoires tampons (Mg et Md) par une fenêtre
    de "hamming", de longueur égale à celle des signaux
    mémorisés -(E2) calcul de la transformée de Fourier rapide du
    signal émis sur une des deux voies - (E3) calcul du cepstre correspondant - (E4) détection d'un signal de paroles à partir de ce
    cepstre - (E'2) calcul de la transformée de Fourier rapide du
    signal émis sur l'autre voie - (E5) troncature des deux spectres sur un nombre de
    points correspondant à la moitié de la fréquence
    d'échantillonnage - < E6) calcul des valeurs absolues des transformées de
    Fourier tronquées pour délivrer les spectres (Sg et
    Sd) correspondant aux deux voies gauche et droite - (e2) calcul du rapport des deux spectres (S g et Sd)
    correspondant aux deux voies gauche et droite - (e3) mémorisation du rapport des spectres - (e4) calcul, à chaque itération (i), de la moyenne
    entre le rapport calculé et le rapport moyen
    précédent mémorisé, suivi de sa mémorisation selon
    l'étape (e3) - (e5) calcul des gabarits des filtres inverses
    respectivement égaux à la racine carrée du rapport
    (VHgd) et à l'inverse de cette racine carrée (l/ < Hgd)-
  7. 7. Procédé de correction automatique de l'image stéréophonique à partir d'un procédé de localisation vocale d'un passager d'un véhicule selon l'une des revendications 1 ou 2, caractérisé en ce que, en phase d'écoute, les signaux émis par la source sonore correspondant aux voies gauche et droite sont envoyés dans le processeur de traitement du signal qui leur applique, à l'étape (e7), les filtres inverses calculés (VHgd) et (1/iHg)/puis ils sont amplifiés à l'étape (e8) avant leur envoi vers les deux haut-parleurs (2g et 2d)
  8. 8. Procédé de correction automatique de l'image stéréophonique à partir d'un procédé de localisation vocale d'un passager d'un véhicule selon l'une des revendications 2, 3, 4 ou 5, caractérisé en ce que, en phase d'écoute, le signal émis sur une des deux voies de la source sonore est retardé d'un nombre de points égal au décalage temporel estimé (tgd)' si ce décalage est négatif.
  9. 9. Procédé de localisation de la tête d'un passager d'un véhicule automobile, équipés de deux haut-parleurs à l'avant et de deux haut-parleurs à l'arrière du véhicule, relié à partir d'un procédé de localisation vocale selon l'une des revendications 2, 3, 4 ou 5, caractérisé en ce qu'il effectue le calcul du décalage temporel entre trois couples de haut-parleurs définis à partir d'un haut-parleur choisi comme référence, et estime l'écart en distance qui les sépare de la tête du passager dont la localisation est considérée comme l'intersection de trois hyperboloïdes de révolution.
  10. 10. Procédé de localisation de la tête d'un passager d'un véhicule automobile selon la revendication 9, caractérisé en ce qu'il comporte une étape supplémentaire de compensation, calculée sur une moyenne d'individus, pour estimer - la position de ses oreilles et celle de ses yeux en vue du réglage automatique de la position des rétroviseurs et de l'optimisation de l'efficacité des écrans dits "écrans tête-haute", présentant des informations visuelles au-delà du pare-brise.
    - la position de la bouche en vue de l'orientation automatique des aérateurs de ventilation ou de climatisation, garantissant des conditions de température confortables au voisinage du corps et plus particulièrement à proximité du visage.
FR9716383A 1997-12-23 1997-12-23 Procede de localisation vocale d'un passager a l'interieur d'un vehicule Expired - Fee Related FR2772964B1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR9716383A FR2772964B1 (fr) 1997-12-23 1997-12-23 Procede de localisation vocale d'un passager a l'interieur d'un vehicule

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9716383A FR2772964B1 (fr) 1997-12-23 1997-12-23 Procede de localisation vocale d'un passager a l'interieur d'un vehicule

Publications (2)

Publication Number Publication Date
FR2772964A1 true FR2772964A1 (fr) 1999-06-25
FR2772964B1 FR2772964B1 (fr) 2000-02-18

Family

ID=9515022

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9716383A Expired - Fee Related FR2772964B1 (fr) 1997-12-23 1997-12-23 Procede de localisation vocale d'un passager a l'interieur d'un vehicule

Country Status (1)

Country Link
FR (1) FR2772964B1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10217778A1 (de) * 2002-04-18 2003-11-06 Volkswagen Ag Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3932858A1 (de) * 1988-12-07 1990-06-13 Onkyo Kk Stereophonisches wiedergabesystem
JPH02295269A (ja) * 1989-05-10 1990-12-06 Hitachi Ltd 対話音声定位方式
US5365592A (en) * 1990-07-19 1994-11-15 Hughes Aircraft Company Digital voice detection apparatus and method using transform domain processing
US5384851A (en) * 1990-10-11 1995-01-24 Yamaha Corporation Method and apparatus for controlling sound localization

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3932858A1 (de) * 1988-12-07 1990-06-13 Onkyo Kk Stereophonisches wiedergabesystem
JPH02295269A (ja) * 1989-05-10 1990-12-06 Hitachi Ltd 対話音声定位方式
US5365592A (en) * 1990-07-19 1994-11-15 Hughes Aircraft Company Digital voice detection apparatus and method using transform domain processing
US5384851A (en) * 1990-10-11 1995-01-24 Yamaha Corporation Method and apparatus for controlling sound localization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 15, no. 74 (E - 1036) 21 February 1991 (1991-02-21) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8054988B2 (en) 1920-04-18 2011-11-08 Volkswagen Ag Communications device for transmitting acoustic signals in a motor vehicle
DE10217778A1 (de) * 2002-04-18 2003-11-06 Volkswagen Ag Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug

Also Published As

Publication number Publication date
FR2772964B1 (fr) 2000-02-18

Similar Documents

Publication Publication Date Title
EP2293594B1 (fr) Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique &#34;mains libres&#34; pour véhicule automobile
EP2530673B1 (fr) Equipement audio comprenant des moyens de débruitage d&#39;un signal de parole par filtrage à délai fractionnaire
EP2518724B1 (fr) Combiné audio micro/casque comprenant des moyens de débruitage d&#39;un signal de parole proche, notamment pour un système de téléphonie &#34;mains libres&#34;
US7813923B2 (en) Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
FR2808371A1 (fr) Appareil et procede pour reduire un bruit
EP2430825B1 (fr) Procede de selection d&#39;un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu&#39;un dispositif telephonique &#34;mains libres&#34; operant dans un environnement bruite
EP3011758B1 (fr) Casque doté d&#39;un réseau de microphones à rayonnement longitudinal, et étalonnage automatique d&#39;un réseau à rayonnement longitudinal
EP2772916B1 (fr) Procédé de débruitage d&#39;un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
US8054989B2 (en) Acoustic correction apparatus and method for vehicle audio system
EP2680262A1 (fr) Procédé de débruitage d&#39;un signal acoustique pour un dispositif audio multi-microphone opérant dans un milieu bruité
JP2011515897A (ja) 複数のデバイス上の複数のマイクロフォンを用いた音声強調
FR2950461A1 (fr) Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique &#34;mains libres&#34; pour vehicule automobile
EP1558056A1 (fr) Système acoustique pour véhicule et dispositif correspondant
WO2015128160A1 (fr) Procede et systeme d&#39;egalisation acoustique automatise
CN112435682A (zh) 车辆降噪***、方法、装置、车辆及存储介质
WO1997027723A1 (fr) Systeme de prise de son et d&#39;ecoute pour equipement de tete en ambiance bruitee
JP5292345B2 (ja) 音質自動調整機能を備える音響再生装置、およびそれを組み込んだハンズフリー電話装置
FR3113760A1 (fr) Dispositif électronique et procédé de réduction de diaphonie, système audio pour appuis-têtes de sièges et programme d’ordinateur associés
FR2772964A1 (fr) Procede de localisation vocale d&#39;un passager a l&#39;interieur d&#39;un vehicule
WO2015144708A1 (fr) Appareil acoustique comprenant au moins un microphone électroacoustique, un microphone ostéophonique et des moyens de calcul d&#39;un signal corrigé, et équipement de tête associé
FR2906071A1 (fr) Reduction de bruit multibande avec une reference de bruit non acoustique
WO2017207286A1 (fr) Combine audio micro/casque comprenant des moyens de detection d&#39;activite vocale multiples a classifieur supervise
EP4040810A1 (fr) Procédé pour le réglage automatisé de paramètres de traitements numériques appliqués à des signaux avant diffusion par des haut-parleurs et dispositif pour la mise en oeuvre d&#39;un tel procédé
EP0989544A1 (fr) Dispositif et procédé de filtrage d&#39;un signal de parole, récepteur et système de communications téléphonique
FR2945904A1 (fr) Dispositif acoustique

Legal Events

Date Code Title Description
TP Transmission of property
ST Notification of lapse

Effective date: 20070831