FR2772964A1 - Procede de localisation vocale d'un passager a l'interieur d'un vehicule - Google Patents
Procede de localisation vocale d'un passager a l'interieur d'un vehicule Download PDFInfo
- Publication number
- FR2772964A1 FR2772964A1 FR9716383A FR9716383A FR2772964A1 FR 2772964 A1 FR2772964 A1 FR 2772964A1 FR 9716383 A FR9716383 A FR 9716383A FR 9716383 A FR9716383 A FR 9716383A FR 2772964 A1 FR2772964 A1 FR 2772964A1
- Authority
- FR
- France
- Prior art keywords
- calculation
- signals
- passenger
- speakers
- stereophonic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
L'invention concerne un procédé de localisation vocale d'un passager d'un véhicule doté d'une source sonore numérique stéréophonique, associée à un processeur de traitement du signal et à au moins deux haut-parleurs, positionnés de part et d'autre de l'habitacle du véhicule, lors d'une estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, tel que cette estimation est faite soit par calcul des différences de gain entre les voies gauche et droite, réalisé par calcul des spectres moyens (Sg et Sd ) correspondant aux deux voies, par calcul du rapport (Hgd ) de ces deux spectres gauche (Sg ) et droit (Sd ) et mémorisation de ce rapport par bande de fréquences, soit par calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit.
Description
PROCEDE DE LOCALISATION VOCALE D'UN PASSAGER
A L'INTERIEUR D'UN VEHICULE
L'invention concerne un procédé de localisation du conducteur, ou d'un passager, dans l'habitacle d'un véhicule automobile, à partir de ses paroles captées par les hauts-parleurs d'un auto-radio par exemple.
A L'INTERIEUR D'UN VEHICULE
L'invention concerne un procédé de localisation du conducteur, ou d'un passager, dans l'habitacle d'un véhicule automobile, à partir de ses paroles captées par les hauts-parleurs d'un auto-radio par exemple.
Cette localisation vocale a essentiellement deux applications : la correction de l'image stéréophonique générée par une chaîne haute fidélité dans l'habitacle d'une voiture et l'amélioration de certaines prestations à l'intérieur du véhicule, telles que le réglage automatique de la position des rétroviseurs ou de la climatisation.
L'habitacle d'un véhicule automobile est un environnement particulièrement défavorable à l'écoute haute fidélité des sons émis par une source sonore stéréophonique, telle qu'un auto-radio ou un lecteur de disques compacts. Les passagers sont fortement décentrés par rapport à la position des haut-parleurs droits et gauches d'une part, et les sons émis se réfléchissent contre les parois intérieures du véhicule, perturbant leur diffusion dans les oreilles des passagers d'autre part. Le conducteur perçoit la musique principalement sur sa gauche, alors que le passager à côté de lui la perçoit plutôt sur sa droite.
Cette dissymétrie de l'image stéréophonique limite la qualité globale de la restitution sonore. Lorsque le conducteur est le seul passager, il peut ajuster le centrage de l'image stéréophonique à l'aide d'un potentiomètre généralement appelé balance, qui modifie le niveau relatif des voix gauche et droite. Cependant, cette correction reste partielle car le même gain correctif est apporté à la totalité du signal.
En fait, la réalité du champ sonore dans l'habitacle d'une voiture est différente car le déséquilibre des signaux reçus par les oreilles droite et gauche dépend de la fréquence du signal sonore.
Actuellement, pour améliorer l'image stéréophonique, il existe des dispositifs proposant une correction automatique des déséquilibres droite/gauche pour différentes bandes de fréquences, mais la position des oreilles des passagers par rapport aux haut-parleurs n'étant pas connue a priori, un tel traitement du signal sonore est difficile à réaliser. De plus, les écarts de niveau entre les signaux reçus par les voies droite et gauche dépendent beaucoup des caractéristiques de l'habitacle du véhicule.
Une solution actuelle est décrite dans le brevet
US 5,386,478, déposé au nom de Harman International
Industries, consistant en un microphone, associé à un autoradio, intégré dans une télécommande. L'utilisateur place ce micro à proximité de ses oreilles et sort du véhicule. L'autoradio génère alors un signal test, qui est amplifié par les haut-parleurs puis capté par le microphone placé à proximité de la zone d'écoute. Les informations déduites des signaux captés sont transmises à l'autoradio par une liaison infrarouge. Le signal reçu est analysé et est comparé au signal test.
US 5,386,478, déposé au nom de Harman International
Industries, consistant en un microphone, associé à un autoradio, intégré dans une télécommande. L'utilisateur place ce micro à proximité de ses oreilles et sort du véhicule. L'autoradio génère alors un signal test, qui est amplifié par les haut-parleurs puis capté par le microphone placé à proximité de la zone d'écoute. Les informations déduites des signaux captés sont transmises à l'autoradio par une liaison infrarouge. Le signal reçu est analysé et est comparé au signal test.
Le rapport des deux signaux permet de déduire les caractéristiques du déséquilibre stéréophonique.
L'autoradio peut ensuite corriger l'image stéréophonique à partir de ces données.
Les inconvénients de cette solution viennent du fait que l'utilisateur est contraint de déplacer un microphone, qu'un signal désagréable est émis dans le véhicule et que le coût est élevé car elle nécessite une télécommande avec liaison infra-rouge et probablement des moyens de traitement du signal.
Le but de la présente invention est de pallier ces inconvénients en proposant un dispositif qui exploite les signaux électriques générés par les haut-parleurs, à partir de l'onde acoustique correspondant aux paroles du conducteur ou d'un passager, pour déterminer différentes informations. Ce dispositif permet notamment la correction automatique de l'image stéréophonique.
Pour cela, l'objet de l'invention est un procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique, associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d'autre de l'habitacle du véhicule, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par les
haut-parleurs gauche et droit; - amplification desdits signaux électriques - numérisation desdits signaux électriques amplifiés - estimation du déséquilibre stéréophonique par calcul
des différences de gain entre les voies gauche et
droite, comportant les étapes suivantes . calcul des spectres moyens correspondant aux voies
gauche et droite, sur une durée suffisante . calcul du rapport de ces deux spectres gauche et
droit et mémorisation de ce rapport par bande de
fréquences ;
calcul des gabarits des filtres inverses, respectivement égaux à la racine carrée du rapport des deux spectres et à l'inverse de la racine carrée dudit rapport.
haut-parleurs gauche et droit; - amplification desdits signaux électriques - numérisation desdits signaux électriques amplifiés - estimation du déséquilibre stéréophonique par calcul
des différences de gain entre les voies gauche et
droite, comportant les étapes suivantes . calcul des spectres moyens correspondant aux voies
gauche et droite, sur une durée suffisante . calcul du rapport de ces deux spectres gauche et
droit et mémorisation de ce rapport par bande de
fréquences ;
calcul des gabarits des filtres inverses, respectivement égaux à la racine carrée du rapport des deux spectres et à l'inverse de la racine carrée dudit rapport.
Selon une autre caractéristique de l'invention, l'estimation du déséquilibre stéréophonique est obtenue par calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit.
D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture de la description d'un exemple de réalisation du procédé, illustré par les figures suivantes qui sont - la figure 1 : les étapes constitutives du procédé de
localisation du conducteur et de deux types
d'application, selon l'invention - la figure 2 : un schéma électronique d'un exemple de
réalisation du calcul du déséquilibre stéréophonique
entre les voies gauche et droite, selon l'invention - les figures 3a et 3b : un exemple du signal capté par
les deux haut-parleurs gauche et droit
respectivement, en réception de paroles - la figure 4 : un exemple de spectres calculés à
partir des signaux captés par les deux haut-parleurs
selon les figures 3a et 3b - la figure 5 : un exemple de rapport des deux spectres
représentés sur la figure 4 - la figure 6 : un exemple de spectre calculé à partir
du signal gauche capté, représenté sur la figure 3a - les figures 7 et 8 : le schéma électronique de deux
exemples de réalisation du calcul du délai temporel
entre les deux haut-parleurs - la figure 9 : le signal résultant de la corrélation
des signaux droit et gauche - la figure 10 : un exemple de répartition des délais
entre les haut-parleurs - la figure 11 : la prise en compte des haut-parleurs
du véhicule pour le calcul de la position du
conducteur.
localisation du conducteur et de deux types
d'application, selon l'invention - la figure 2 : un schéma électronique d'un exemple de
réalisation du calcul du déséquilibre stéréophonique
entre les voies gauche et droite, selon l'invention - les figures 3a et 3b : un exemple du signal capté par
les deux haut-parleurs gauche et droit
respectivement, en réception de paroles - la figure 4 : un exemple de spectres calculés à
partir des signaux captés par les deux haut-parleurs
selon les figures 3a et 3b - la figure 5 : un exemple de rapport des deux spectres
représentés sur la figure 4 - la figure 6 : un exemple de spectre calculé à partir
du signal gauche capté, représenté sur la figure 3a - les figures 7 et 8 : le schéma électronique de deux
exemples de réalisation du calcul du délai temporel
entre les deux haut-parleurs - la figure 9 : le signal résultant de la corrélation
des signaux droit et gauche - la figure 10 : un exemple de répartition des délais
entre les haut-parleurs - la figure 11 : la prise en compte des haut-parleurs
du véhicule pour le calcul de la position du
conducteur.
Les éléments portant les mêmes références dans les différentes figures remplissent les mêmes fonctions en vue des mêmes résultats.
L'invention propose une solution au problème du déséquilibre stéréophonique des voix droite et gauche dans un véhicule automobile, basée sur les deux principes physiques suivants - le théorème de réciprocité qui stipule que la
fonction de transfert mesurée entre une source sonore
omnidirectionnelle, positionnée en un premier point,
et un capteur omnidirectionnel, positionné en un
autre point distinct du premier, est identique à la
fonction de transfert mesurée lorsque les positions
réciproques de la source et du capteur sont
inversées; - un haut-parleur utilisé généralement comme
transducteur d'une onde électrique en une onde
acoustique peut également convertir une onde
acoustique en onde électrique.
fonction de transfert mesurée entre une source sonore
omnidirectionnelle, positionnée en un premier point,
et un capteur omnidirectionnel, positionné en un
autre point distinct du premier, est identique à la
fonction de transfert mesurée lorsque les positions
réciproques de la source et du capteur sont
inversées; - un haut-parleur utilisé généralement comme
transducteur d'une onde électrique en une onde
acoustique peut également convertir une onde
acoustique en onde électrique.
Le déséquilibre stéréophonique est dû à deux causes la première concerne les différences de gain des voix gauche et droite liées à la dissymétrie de l'habitacle, la seconde concerne la différence de distance entre les haut-parleurs droits et gauches et les oreilles des passagers.
Selon une première caractéristique de l'invention, le procédé permet de compenser la première cause, soit la différence de gain.
Pendant une première phase du procédé, représenté sur la figure 1, commandée par l'utilisateur 1, les paroles qu'il prononce sont reçues et converties en ondes électriques par les haut-parleurs droit 2d et gauche 2gt placés de part et d'autre de la planche de bord du véhicule par exemple, de préférence à l'arrêt du véhicule.
Quand le véhicule se déplace, un bruit important s'ajoute aux paroles captées par les haut-parleurs et il est alors nécessaire d'appliquer une étape de débruitage par un traitement classique du signal.
Ces signaux électriques subissent une amplification Ad et Agi puis une numérisation Nd et Nui avant d'être mémorisés dans des mémoires tampon Md et M g à chaque itération i, soit toutes les 0,05 secondes par exemple correspondant à 1024 points à 11 KHz.
Les figures 3a et 3b sont un exemple de ces deux signaux captés par les haut-parleurs gauche et droit respectivement, en réception de paroles, représentés par leur amplitude A en fonction du temps t.
Une étape el de traitement du signal calcule, à partir de ces signaux numériques obtenus, les spectres moyens Sd et 5g correspondant aux voies droite et gauche respectivement, sur une durée suffisante.
La figure 4 montre les spectres des signaux gauche et droit, respectivement en trait continu et en pointillés, calculés à partir des signaux des figures 3a et 3b, soit l'amplitude A en fonction de la fréquence f.
Une seconde étape e2 de traitement consiste à calculer le rapport de ces deux spectres Sd et Sg, référencé et et à le stocker par bande de fréquences dans une mémoire M de l'autoradio à l'étape e3.
La figure 5 est la représentation du rapport des spectres de la figure 4.
L'étape suivante e4 calcule, à chaque itération i, soit toutes les 0,05 secondes, la moyenne entre le rapport calculé H'gd et le rapport moyen précédent Hgd(i-1) mémorisé, établie selon la formule suivante
Hgd(i) = 1/i {[(i-1) x Hgd(i-1)] + H'gd}
Puis, le rapport Hgd(i), établi à l'itération i, est mémorisé en remplacement du rapport Hgd( i-l) établi à l'itération précédente.
Hgd(i) = 1/i {[(i-1) x Hgd(i-1)] + H'gd}
Puis, le rapport Hgd(i), établi à l'itération i, est mémorisé en remplacement du rapport Hgd( i-l) établi à l'itération précédente.
Le rapport obtenu Hgd lorsque l'étape est terminée au bout d'un certain temps, correspondant à la durée d'une phrase courte, soit 3 secondes par exemple, représente le déséquilibre stéréophonique.
Le procédé comporte une étape suivante e5 de calcul des coefficients des filtres inverses, de gabarits respectivement égaux à la racine carrée du rapport Hgd, çHgd et à l'inverse de cette racine carrée l/VHg destinés à réaliser la compensation des déformations stéréophoniques, puis une étape e6 de mémorisation de ces filtres dans une mémoire tampon de l'autoradio.
Selon un exemple de réalisation non limitatif, représenté sur la figure 2, les signaux sd et Sg contenus dans les mémoires tampons Md et Mgt sous forme de 1024 points, et représentés sur les figures 3b et 3a respectivement, sont multipliés par une fenêtre, de "hamming" par exemple, de longueur correspondante égale à 1024 points, tous les 512 points à 11 kHz soit toutes les 0,05 secondes, lors d'une étape E1. Le calcul des spectres correspondant aux voies droite et gauche peut être réalisé tout d'abord par une étape E2 de calcul de la transformée de Fourier rapide d'une des voies, la gauche par exemple. Lors d'une étape E3, le cepstre correspondant est calculé, puis une étape E4 détecte un signal de paroles à partir de ce cepstre.
La figure 6 est la représentation du cepstre C e calculé à partir du signal de la voie de gauche, apparaissant à la figure 3a.
Si aucun signal de paroles n' est détecté, le procédé s'arrête jusqu'aux portions de signaux suivants définis dans la fenêtre suivante, 512 points plus tard. Si un signal de paroles a bien été détecté, l'étape E'2 effectue la transformée de Fourier rapide du signal correspondant à la voie droite.
Une étape E5 de troncature des deux spectres sur 513 points, le 513ème point correspondant à la fréquence de
Nyquist, soit la moitié de la fréquence d'échantillonnage, suivie d'une étape E6 de calcul des valeurs absolues des transformées de Fourier tronquées, permet l'obtention des spectres Sd et Sg correspondant aux voies droite et gauche. Les étapes suivantes ont déjà été décrites.
Nyquist, soit la moitié de la fréquence d'échantillonnage, suivie d'une étape E6 de calcul des valeurs absolues des transformées de Fourier tronquées, permet l'obtention des spectres Sd et Sg correspondant aux voies droite et gauche. Les étapes suivantes ont déjà été décrites.
En vue de son application à la correction automatique de l'image stéréophonique en phase d'écoute, les signaux, émis par une source sonore numérique, sont envoyés dans des modules qui assurent leur traitement e7 par les filtres inverses de gabarits égaux à çHgd et l/ < Hgd. Dans le cas d'une source sonore analogique, un récepteur radio par exemple, les signaux correspondant aux deux voies doivent être numérisées au préalable.
Une fois traités, une étape e8 d'amplification modifie leurs gains avant leur envoi vers les haut-parleurs 2d et 2g I1 est possible de supprimer les modules E6 de calcul des valeurs absolues, de sorte que l'étape e2 de calcul du rapport de deux spectres est effectuée sur les fonctions de transfert complexes, ce qui permet de prendre en compte la phase.
Selon une autre caractéristique de l'invention, le procédé compense la différence de distance entre les haut-parleurs gauche et droit et le conducteur, ou un passager, qui fait que les ondes acoustiques émises par ces haut-parleurs arrivent à des instants tg et td différents aux oreilles de l'utilisateur.
Le procédé comporte pour cela une étape e9 de calcul de la corrélation Cgd entre les signaux mémorisés sd et Sg pour une fenêtre temporelle de courte durée se déplaçant sur l'ensemble du signal capté. Pour chaque fenêtre temporelle j, le procédé estime, à l'étape e10, l'instant correspondant au maximum de la corrélation
Cgd (j) qui coïncide avec le décalage temporel tgd (j).
Cgd (j) qui coïncide avec le décalage temporel tgd (j).
Ce calcul est renouvelé sur l'ensemble du signal. Le procédé estime alors, à l'étape e1l, que le décalage tgd est la valeur la plus fréquente des décalages temporels tgd (j).
Dans son application à la correction automatique de l'image stéréophonique en phase d'écoute, la voie droite, ou la voie gauche si le décalage tgd est négatif, est retardée du temps tgd
La figure 7 est le schéma électronique d'un premier exemple de réalisation de ce calcul du délai temporel entre les deux haut-parleurs gauche et droit effectué dans le domaine temporel. Toutes les 0,05 secondes, les signaux numériques mémorisés sg et sd, sont filtrés lors d'une étape E7 sur une bande de fréquences correspondant à l'étendue spectrale de la voix, entre 500 Hz et 3kHz par exemple.
La figure 7 est le schéma électronique d'un premier exemple de réalisation de ce calcul du délai temporel entre les deux haut-parleurs gauche et droit effectué dans le domaine temporel. Toutes les 0,05 secondes, les signaux numériques mémorisés sg et sd, sont filtrés lors d'une étape E7 sur une bande de fréquences correspondant à l'étendue spectrale de la voix, entre 500 Hz et 3kHz par exemple.
L'étape E8 suivante calcule la corrélation normalisée
Cgd(t) entre les signaux filtrés pour des temps t variant entre 10 et + 10 millisecondes, ce qui correspond à des différences de distance de 3 mètres, distance maximale généralement atteinte dans un véhicule automobile de tourisme.
Cgd(t) entre les signaux filtrés pour des temps t variant entre 10 et + 10 millisecondes, ce qui correspond à des différences de distance de 3 mètres, distance maximale généralement atteinte dans un véhicule automobile de tourisme.
La figure 9 montre la corrélation calculée à partir des signaux gauche et droit de la figure 3. Le maximum Cm de Cgdt) est élevé si les signaux correspondent à des paroles et il est faible s'ils correspondent à du bruit.
L'étape Eg calcule ensuite le temps tgd(j) pour lequel la corrélation est maximale Cm temps qui est stocké à l'étape E11 si l'étape E10 de comparaison de ce maximum Cm avec un seuil prédéterminé, égal à 0,7 par exemple, indique la présence de parole.
La figure 10 illustre un exemple de répartition des temps tgd (j), calculés pour différentes fenêtres temporelles successives j.
L'étape E12 suivante évalue, après un nombre déterminé suffisant d'itérations, le délai le plus probable tgd qui est alors mémorisé à l'étape E13.
Le seuil de corrélation permet de déterminer la présence d'une source sonore ponctuelle. I1 est de plus possible d'ajouter un test à partir du cepstre, défini précédemment, pour vérifier que ces signaux correspondent à des paroles.
I1 est également possible de faire le calcul du délai temporel entre deux haut-parleurs dans le domaine fréquentiel, selon un procédé qui est représenté sur la figure 8.
Les signaux sg et sd contenus dans les mémoires tampons M g et Md sont multipliés par une fenêtre de "hamming" de longueur égale à celle des signaux mémorisés soit 1024 points, lors d'une étape E1, puis l'étape E2 calcule leur transformée de Fourier rapide, comme lors de la description de la figure 2. A l'étape E14, le procédé calcule les excès de phase correspondants E g et
Ed, puis à l'étape E15 le rapport entre ces deux excès de phase Eg/Ed. Une étape E16 d'interpolation sur un intervalle de fréquence limité, entre 800 Hz et 3kHz par exemple, permet d'en déduire le délai. Comme pour le délai dans le domaine temporel, ce délai est stocké en mémoire à l'étape E11, puis, au bout d'un nombre suffisant d'itérations, l'étape E12 évalue le délai le plus probable tg mémorisé à l'étape E13.
Ed, puis à l'étape E15 le rapport entre ces deux excès de phase Eg/Ed. Une étape E16 d'interpolation sur un intervalle de fréquence limité, entre 800 Hz et 3kHz par exemple, permet d'en déduire le délai. Comme pour le délai dans le domaine temporel, ce délai est stocké en mémoire à l'étape E11, puis, au bout d'un nombre suffisant d'itérations, l'étape E12 évalue le délai le plus probable tg mémorisé à l'étape E13.
Le signal correspondant à la parole est un signal dit "quasi-stationnaire" : son autocorrélation est relativement élevée. La différence de niveau entre les lobes secondaires et le lobe principal de son autocorrélation est limitée. Aussi, le calcul du délai dans le domaine fréquentiel peut être limité aux portions du signal correspondant au début d'un mot, comme le montre la figure 3. Dans ce cas, la différence entre le lobe principal et les lobes secondaires de la corrélation est plus importante, ce qui est visible sur la figure 9. Pour déterminer ces portions de signal, il suffit de vérifier que la valeur maximale sur 0.1 seconde, au début du signal est au moins trois fois inférieure à la valeur maximale sur la suite du signal.
Dans son application à la correction automatique de l'image stéréophonique en phase d'écoute, le signal émis sur une des deux voies d'une source sonore numérique est retardé d'un nombre de points égal à tgd/ c'est-à-dire la voie gauche si le décalage tgd est positif, et la voie droite, si le décalage est négatif, dans les modules de traitement e7 (figure 1).
Les deux procédés de correction, par compensation de la différence du gain et de la différence de distance entre les haut-parleurs gauche et droit, peuvent être appliqués également en combinaison.
La deuxième application de ce procédé de localisation du conducteur, ou d'un passager dans un véhicule, à partir de ses paroles, concerne l'amélioration de certaines prestations, telles que le positionnement automatique des rétroviseurs extérieurs et intérieur, un réglage plus précis de la climatisation ou de la ventilation ou de l'ajustement d'un afficheur tête haute nécessitant la localisation de la tête. Pour cela, le véhicule doit être équipé de deux hautparleurs à l'avant et deux à l'arrière.
Les étapes du procédé décrites précédemment pour compenser la différence de distance entre les deux haut-parleurs à gauche et à droite de la planche de bord, doivent en plus être appliquées à deux autres couples de haut-parleurs, les deux haut-parleurs latéraux, gauches par exemple, et deux haut-parleurs en diagonale. La connaissance des décalages entre ces différents haut-parleurs permet le calcul de l'écart en distance qui les sépare de la tête de l'utilisateur, dont la localisation peut être considérée comme l'intersection de trois hyperboloïdes de révolution. En effet, comme le montre la figure 11 représentant la répartition géographique des quatre haut-parleurs Ho à
H3 dans un véhicule, repérés par leurs coordonnées cartésiennes (Xi, Yi, Zi), avec i nombre entier compris entre 1 et 3, dans le repère passant par le hautparleur gauche, Ho de coordonnées (0, 0, 0) par exemple, si la bouche du conducteur est repérée par ses coordonnées polaires, e et, sa position est déduite du système de trois équations à trois inconnues suivant: 2 *(c*di - Xi*cos#*cos# - Yi*sin#*cos# - Zi*sin#) = c2 *d2 - Xi2 - yi2 - Zi2 dans lesquelles c est la vitesse du son et di est le décalage temporel entre le haut-parleur avant gauche Ho de référence et un des trois autres haut-parleurs H1,
H2 ou H3.
H3 dans un véhicule, repérés par leurs coordonnées cartésiennes (Xi, Yi, Zi), avec i nombre entier compris entre 1 et 3, dans le repère passant par le hautparleur gauche, Ho de coordonnées (0, 0, 0) par exemple, si la bouche du conducteur est repérée par ses coordonnées polaires, e et, sa position est déduite du système de trois équations à trois inconnues suivant: 2 *(c*di - Xi*cos#*cos# - Yi*sin#*cos# - Zi*sin#) = c2 *d2 - Xi2 - yi2 - Zi2 dans lesquelles c est la vitesse du son et di est le décalage temporel entre le haut-parleur avant gauche Ho de référence et un des trois autres haut-parleurs H1,
H2 ou H3.
Une compensation, calculée sur une moyenne d'individus, peut être ajoutée pour estimer la position de ses oreilles et celle de ses yeux en vue du réglage automatique de la position des rétroviseurs.
Cette connaissance de la position des yeux permet également d'optimiser l'efficacité des écrans dits "écrans tête-haute"présentant des informations visuelles au-delà du pare-brise.
La connaissance de la position de la bouche des passagers permettrait d'orienter automatiquement les aérateurs de ventilation ou de climatisation d'une manière plus optimale pour garantir des conditions de température confortables au voisinage de leurs corps et plus particulièrement à proximité de leur visage.
I1 est aussi possible de rechercher la localisation de tous les passagers d'un véhicule pour en connaître le nombre et avoir un aperçu de leur taille pour savoir s'il s'agit d'un adulte ou d'un enfant. De telles informations peuvent être envoyées à un centre d'assistance, par un réseau de téléphonie, qui pourra, à la suite d'un accident, dimensionner correctement les moyens de secours qu'il est nécessaire de mettre en oeuvre.
La présente invention offre plusieurs avantages par rapport à l'art antérieur, en particulier son coût limité car il ne nécessite pas de microphone. Par ailleurs, le processeur de traitement du signal nécessaire à la chaîne de restitution peut être employé pour évaluer les caractéristiques de ce déséquilibre, c'est-à-dire le rapport entre les spectres Hgd et le délai tgd entre les haut-parleurs.
I1 faut ajouter que l'ergonomie du dispositif de mise en oeuvre du procédé est nettement supérieure à celles des systèmes actuels, car l'utilisateur n'est pas contraint de déplacer un microphone ou une télécommande. La commande d'une correction de l'image stéréophonique peut être faite par la voix de l'utilisateur, par l'intermédiaire d'un système de reconnaissance vocale, la phase prononcée pouvant être utilisée elle-même pour évaluer les caractéristiques du déséquilibre stéréophonique.
Claims (10)
- deux haut-parleurs gauche et droit.du décalage temporel entre les signaux provenant desamplifiés ; - estimation du déséquilibre stéréophonique par calculhaut-parleurs gauche et droit (2g et 2d) ; - amplification (Ag et Ad) desdits signaux électriques; - numérisation (Ng et Nd) desdits signaux électriques(VHgd) et à l'inverse de la racine carrée du rapport (î/VHg)
- 2. Procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d'autre de l'habitacle du véhicule, entre les voies droite et gauche à partir des paroles prononcées par le passager, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par lesrespectivement égaux à la racine carrée du rapportrapport par bande de fréquences # (e5) calcul des gabarits des filtres inverses,gauche (Sg) et droit (Sd) et mémorisation de cedurée suffisante . (e2) calcul du rapport (Hgd) de ces deux spectrescorrespondant aux voies gauche et droite, sur unedroite, comportant les étapes suivantes . (el) calcul des spectres moyens (Sg et Sd)des différences de gain entre les voies gauche etamplifiés - estimation du déséquilibre stéréophonique par calculhaut-parleurs gauche et droite (2g et 2d) - amplification (Ag et Ad) desdits signaux électriques; - numérisation (Ng et Nd) desdits signaux électriquesREVENDICATIONS 1. Procédé de localisation vocale d'un passager d'un véhicule automobile doté d'une source sonore numérique stéréophonique associée à un processeur de traitement du signal et à au moins deux haut-parleurs positionnés de part et d d'autre de l'habitacle du véhicule, lors d'une phase, commandée par le passager, d'estimation du déséquilibre stéréophonique entre les voies droite et gauche à partir des paroles prononcées par le passager, caractérisé en ce qu'il comprend les étapes suivantes - conversion des paroles en signaux électriques par les
- 3. Procédé de localisation vocale selon la revendication 2, caractérisée en ce que le calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit est effectué dans le domaine temporel, par les étapes suivantes - (e9) corrélation (Cgd) entre les signaux mémorisés(Sg et Sd) pour une fenêtre temporelle de courtedurée déterminée se déplaçant sur l'ensemble dusignal capté par les deux haut-parleurs - (e10) estimation, pour chaque fenêtre temporelle (j),de l'instant correspondant au maximum de lacorrélation [Cgd()] qui coïncide avec le décalagetemporel [tgd (j)] entre les voies gauche et droite ; - (e1l) estimation du décalage (tgd) temporel, entreles signaux provenant des deux haut-parleurs gaucheet droit, comme étant la valeur la plus fréquente desdécalages temporels [tgd (j)] établis pour toutes lesfenêtres temporelles (j).
- 4. Procédé de localisation vocale selon la revendication 3, caractérisée en ce que le calcul du décalage temporel entre les signaux provenant des deux haut-parleurs gauche et droit est effectué dans le domaine temporel, par - (E7) filtrage des signaux numériques mémorisés (SgtSd) sur une bande de fréquences correspondant àl'étendue spectrale de la voix ; - (E8) calcul de la corrélation normalisée [Cgd(t)]entre les signaux filtrés, pour chaque fenêtretemporelle (j) pour des temps correspondant à desdifférences de distance égales à la distance maximaleentre deux points de l'habitacle d'un véhiculestandard; - (Eg) calcul du temps [tg()] pour lequel lacorrélation est maximale (Cm) - (E10) comparaison de cette corrélation maximale (Cm)avec un seuil prédéterminé indiquant la présence deparoles - (E11) mémorisation de la valeur de la corrélationmaximale (Cm) - (E12) évaluation, après un nombre suffisant déterminéd'itérations, du délai le plus probable (tgd) - (E13) mémorisation du délai le plus probable (tgd)
- 5. Procédé de localisation vocale selon la revendication 2, caractérisé en ce que le calcul du décalage temporel entre les signaux provenant de ces deux haut-parleurs gauche et droit est effectué dans le domaine fréquentiel, selon les étapes suivantes - (E1) multiplication des signaux (Sg et sd) contenusdans les mémoires tampons (Mg et Md) par une fenêtrede "hamming", de longueur égale à celle des signauxmémorisés; - (E2) calcul de la transformée de Fourier rapidedesdits signaux précédemment multipliés - (E14) calcul des excès de phase correspondant (Eg etEd) ; - (E15) calcul du rapport (Eg/Ed) entre ces deux excèsde phase (E16) interpolation linéaire sur un intervalle defréquences limité délivrant la valeur du décalage - (E11) mémorisation du délai à chaque itération - (E12) évaluation, après un nombre suffisant déterminéd'itérations, du délai le plus probable (tgd) - (E13) mémorisation du délai le plus probable.
- 6. Procédé de localisation vocale selon la revendication 1, caractérisé en ce que le calcul des différences de gain entre les voies gauche et droite comporte les étapes suivantes - (E1) multiplication des signaux (sg et sd) contenusdans les mémoires tampons (Mg et Md) par une fenêtrede "hamming", de longueur égale à celle des signauxmémorisés -(E2) calcul de la transformée de Fourier rapide dusignal émis sur une des deux voies - (E3) calcul du cepstre correspondant - (E4) détection d'un signal de paroles à partir de cecepstre - (E'2) calcul de la transformée de Fourier rapide dusignal émis sur l'autre voie - (E5) troncature des deux spectres sur un nombre depoints correspondant à la moitié de la fréquenced'échantillonnage - < E6) calcul des valeurs absolues des transformées deFourier tronquées pour délivrer les spectres (Sg etSd) correspondant aux deux voies gauche et droite - (e2) calcul du rapport des deux spectres (S g et Sd)correspondant aux deux voies gauche et droite - (e3) mémorisation du rapport des spectres - (e4) calcul, à chaque itération (i), de la moyenneentre le rapport calculé et le rapport moyenprécédent mémorisé, suivi de sa mémorisation selonl'étape (e3) - (e5) calcul des gabarits des filtres inversesrespectivement égaux à la racine carrée du rapport(VHgd) et à l'inverse de cette racine carrée (l/ < Hgd)-
- 7. Procédé de correction automatique de l'image stéréophonique à partir d'un procédé de localisation vocale d'un passager d'un véhicule selon l'une des revendications 1 ou 2, caractérisé en ce que, en phase d'écoute, les signaux émis par la source sonore correspondant aux voies gauche et droite sont envoyés dans le processeur de traitement du signal qui leur applique, à l'étape (e7), les filtres inverses calculés (VHgd) et (1/iHg)/puis ils sont amplifiés à l'étape (e8) avant leur envoi vers les deux haut-parleurs (2g et 2d)
- 8. Procédé de correction automatique de l'image stéréophonique à partir d'un procédé de localisation vocale d'un passager d'un véhicule selon l'une des revendications 2, 3, 4 ou 5, caractérisé en ce que, en phase d'écoute, le signal émis sur une des deux voies de la source sonore est retardé d'un nombre de points égal au décalage temporel estimé (tgd)' si ce décalage est négatif.
- 9. Procédé de localisation de la tête d'un passager d'un véhicule automobile, équipés de deux haut-parleurs à l'avant et de deux haut-parleurs à l'arrière du véhicule, relié à partir d'un procédé de localisation vocale selon l'une des revendications 2, 3, 4 ou 5, caractérisé en ce qu'il effectue le calcul du décalage temporel entre trois couples de haut-parleurs définis à partir d'un haut-parleur choisi comme référence, et estime l'écart en distance qui les sépare de la tête du passager dont la localisation est considérée comme l'intersection de trois hyperboloïdes de révolution.
- 10. Procédé de localisation de la tête d'un passager d'un véhicule automobile selon la revendication 9, caractérisé en ce qu'il comporte une étape supplémentaire de compensation, calculée sur une moyenne d'individus, pour estimer - la position de ses oreilles et celle de ses yeux en vue du réglage automatique de la position des rétroviseurs et de l'optimisation de l'efficacité des écrans dits "écrans tête-haute", présentant des informations visuelles au-delà du pare-brise.- la position de la bouche en vue de l'orientation automatique des aérateurs de ventilation ou de climatisation, garantissant des conditions de température confortables au voisinage du corps et plus particulièrement à proximité du visage.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9716383A FR2772964B1 (fr) | 1997-12-23 | 1997-12-23 | Procede de localisation vocale d'un passager a l'interieur d'un vehicule |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9716383A FR2772964B1 (fr) | 1997-12-23 | 1997-12-23 | Procede de localisation vocale d'un passager a l'interieur d'un vehicule |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2772964A1 true FR2772964A1 (fr) | 1999-06-25 |
FR2772964B1 FR2772964B1 (fr) | 2000-02-18 |
Family
ID=9515022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9716383A Expired - Fee Related FR2772964B1 (fr) | 1997-12-23 | 1997-12-23 | Procede de localisation vocale d'un passager a l'interieur d'un vehicule |
Country Status (1)
Country | Link |
---|---|
FR (1) | FR2772964B1 (fr) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10217778A1 (de) * | 2002-04-18 | 2003-11-06 | Volkswagen Ag | Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3932858A1 (de) * | 1988-12-07 | 1990-06-13 | Onkyo Kk | Stereophonisches wiedergabesystem |
JPH02295269A (ja) * | 1989-05-10 | 1990-12-06 | Hitachi Ltd | 対話音声定位方式 |
US5365592A (en) * | 1990-07-19 | 1994-11-15 | Hughes Aircraft Company | Digital voice detection apparatus and method using transform domain processing |
US5384851A (en) * | 1990-10-11 | 1995-01-24 | Yamaha Corporation | Method and apparatus for controlling sound localization |
-
1997
- 1997-12-23 FR FR9716383A patent/FR2772964B1/fr not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3932858A1 (de) * | 1988-12-07 | 1990-06-13 | Onkyo Kk | Stereophonisches wiedergabesystem |
JPH02295269A (ja) * | 1989-05-10 | 1990-12-06 | Hitachi Ltd | 対話音声定位方式 |
US5365592A (en) * | 1990-07-19 | 1994-11-15 | Hughes Aircraft Company | Digital voice detection apparatus and method using transform domain processing |
US5384851A (en) * | 1990-10-11 | 1995-01-24 | Yamaha Corporation | Method and apparatus for controlling sound localization |
Non-Patent Citations (1)
Title |
---|
PATENT ABSTRACTS OF JAPAN vol. 15, no. 74 (E - 1036) 21 February 1991 (1991-02-21) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8054988B2 (en) | 1920-04-18 | 2011-11-08 | Volkswagen Ag | Communications device for transmitting acoustic signals in a motor vehicle |
DE10217778A1 (de) * | 2002-04-18 | 2003-11-06 | Volkswagen Ag | Kommunikationseinrichtung zur Übertragung akustischer Signale in einem Kraftfahrzeug |
Also Published As
Publication number | Publication date |
---|---|
FR2772964B1 (fr) | 2000-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2293594B1 (fr) | Procédé de filtrage des bruits latéraux non-stationnaires pour un dispositif audio multi-microphone, notamment un dispositif téléphonique "mains libres" pour véhicule automobile | |
EP2530673B1 (fr) | Equipement audio comprenant des moyens de débruitage d'un signal de parole par filtrage à délai fractionnaire | |
EP2518724B1 (fr) | Combiné audio micro/casque comprenant des moyens de débruitage d'un signal de parole proche, notamment pour un système de téléphonie "mains libres" | |
US7813923B2 (en) | Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset | |
FR2808371A1 (fr) | Appareil et procede pour reduire un bruit | |
EP2430825B1 (fr) | Procede de selection d'un microphone parmi deux microphones ou plus, pour un systeme de traitement de la parole tel qu'un dispositif telephonique "mains libres" operant dans un environnement bruite | |
EP3011758B1 (fr) | Casque doté d'un réseau de microphones à rayonnement longitudinal, et étalonnage automatique d'un réseau à rayonnement longitudinal | |
EP2772916B1 (fr) | Procédé de débruitage d'un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement | |
US8054989B2 (en) | Acoustic correction apparatus and method for vehicle audio system | |
EP2680262A1 (fr) | Procédé de débruitage d'un signal acoustique pour un dispositif audio multi-microphone opérant dans un milieu bruité | |
JP2011515897A (ja) | 複数のデバイス上の複数のマイクロフォンを用いた音声強調 | |
FR2950461A1 (fr) | Procede de filtrage optimise des bruits non stationnaires captes par un dispositif audio multi-microphone, notamment un dispositif telephonique "mains libres" pour vehicule automobile | |
EP1558056A1 (fr) | Système acoustique pour véhicule et dispositif correspondant | |
WO2015128160A1 (fr) | Procede et systeme d'egalisation acoustique automatise | |
CN112435682A (zh) | 车辆降噪***、方法、装置、车辆及存储介质 | |
WO1997027723A1 (fr) | Systeme de prise de son et d'ecoute pour equipement de tete en ambiance bruitee | |
JP5292345B2 (ja) | 音質自動調整機能を備える音響再生装置、およびそれを組み込んだハンズフリー電話装置 | |
FR3113760A1 (fr) | Dispositif électronique et procédé de réduction de diaphonie, système audio pour appuis-têtes de sièges et programme d’ordinateur associés | |
FR2772964A1 (fr) | Procede de localisation vocale d'un passager a l'interieur d'un vehicule | |
WO2015144708A1 (fr) | Appareil acoustique comprenant au moins un microphone électroacoustique, un microphone ostéophonique et des moyens de calcul d'un signal corrigé, et équipement de tête associé | |
FR2906071A1 (fr) | Reduction de bruit multibande avec une reference de bruit non acoustique | |
WO2017207286A1 (fr) | Combine audio micro/casque comprenant des moyens de detection d'activite vocale multiples a classifieur supervise | |
EP4040810A1 (fr) | Procédé pour le réglage automatisé de paramètres de traitements numériques appliqués à des signaux avant diffusion par des haut-parleurs et dispositif pour la mise en oeuvre d'un tel procédé | |
EP0989544A1 (fr) | Dispositif et procédé de filtrage d'un signal de parole, récepteur et système de communications téléphonique | |
FR2945904A1 (fr) | Dispositif acoustique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TP | Transmission of property | ||
ST | Notification of lapse |
Effective date: 20070831 |