FR2864860A1 - Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile - Google Patents

Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile Download PDF

Info

Publication number
FR2864860A1
FR2864860A1 FR0500119A FR0500119A FR2864860A1 FR 2864860 A1 FR2864860 A1 FR 2864860A1 FR 0500119 A FR0500119 A FR 0500119A FR 0500119 A FR0500119 A FR 0500119A FR 2864860 A1 FR2864860 A1 FR 2864860A1
Authority
FR
France
Prior art keywords
noise
signal
unit
audio
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0500119A
Other languages
English (en)
Other versions
FR2864860B1 (fr
Inventor
Manabu Otsuka
Ichiro Akahori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Publication of FR2864860A1 publication Critical patent/FR2864860A1/fr
Application granted granted Critical
Publication of FR2864860B1 publication Critical patent/FR2864860B1/fr
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Traffic Control Systems (AREA)
  • Navigation (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Système d'annulation de bruit à performance améliorée pour supprimer d'un signal d'entrée d'un microphone une composante de bruit affectant le son reproduit d'un système audio reproduisant de multiples voies de son, pourvu d'un annulateur de bruit pour acquérir des signaux audio de deux voies et les traiter par des coefficients des filtrage par traitement convolutionnel de manière à produire des signaux d'annulation de bruit dans des filtres adaptatifs (23L, 23R), un additionneur (21) pour additionner le signal d'entrée du microphone et les signaux d'annulation de bruit, supprimer la composante de bruit du signal sonore, et délivrer le signal après l'annulation du bruit, des convertisseurs non linéaires (27L, 27R) pour la conversion non linéaire du signal après la suppression du bruit, et des unités d'apprentissage de filtrage (25L, 25R) pour calculer les coefficients de filtrage à établir ensuite d'après le signal soumis à une conversion non linéaire.

Description

SYSTEME D'ANNULATION DE BRUIT, SYSTEME DE RECONNAISSANCE
VOCALE ET SYSTEME DE NAVIGATION D'AUTOMOBILE La présente invention est relative à un système d'annulation de bruit servant à annuler une composante de bruit pour le son reproduit par un système audio à partir d'un signal vocal entré à l'aide d'un microphone, à un système de reconnaissance vocale contenant celui-ci et à un système de navigation d'automobile équipé d'un tel système de reconnaissance vocale.
On connaît dans la technique antérieure un système de reconnaissance vocale qui intercepte les paroles d'un utilisateur par un microphone, qui compare celles-ci avec des modèles de paroles enregistrés à l'avance comme mots de reconnaissance et qui reconnaît des mots de reconnaissance à forte correspondance comme mots prononcés par l'utilisateur. Ce type de système de reconnaissance vocale est par exemple installé dans un système de navigation d'automobile.
On sait que la vitesse de reconnaissance vocale d'un système de reconnaissance vocale est régie par l'ampleur de la composante de bruit présente dans le signal vocal entré à partir du microphone. Lors d'un fonctionnement d'un système audio pour véhicule monté dans l'habitacle d'une automobile, etc., la musique diffusée par une enceinte acoustique du système audio finit par être interceptée en tant que bruit par le microphone avec les paroles de l'utilisateur. Par conséquent, dans la technique antérieure, la pratique avait consisté inactiver le système audio au moment de la reconnaissance vocale afin d'empêcher la musique ou autre d'entrer dans le microphone. (On se reportera par exemple à "Public News Release, 'Five Car AV & Navigation '99 Summer Models Released', [en ligne], 18 mai 1999, Fujitsu-Ten, [recherche du 16 octobre 2003], Internet <URL: HYPERLINK "http://www.fujitsu-ten.co.jp/release/1999/ 0518. html", http://www.fujitsuten. co. jp/release/ 1999/0518.html>).
Cependant, dans un système ainsi configuré selon la technique antérieure, comme la reproduction de la musique ou autre finit par être momentanément interrompue au moment de la reconnaissance vocale, l'utilisateur risque d'être très insatisfait. Par conséquent, on envisage depuis quelques années de munir le système de reconnaissance vocale d'un système d'annulation de bruit qui intercepte le signal audio entré dans l'enceinte acoustique, estime la composante de bruit incluse dans le signal vocal obtenu à partir du microphone d'après ce signal audio et annule la composante de bruit dans le signal vocal.
On connaît comme système d'annulation de bruit un système utilisant un algorithme de moindres carrés moyens (MCM) pour le procédé d'estimation de la composante de bruit. Ce type de système d'annulation de bruit acquiert le signal audio entré dans une enceinte acoustique du système audio, filtre le signal audio à l'aide d'un filtre adaptatif de manière à produire un signal d'annulation de bruit pour annuler la composante de bruit dans le signal vocal et, d'après ce signal d'annulation de bruit, annule la composante de bruit incluse dans le signal vocal acquis à partir du microphone.
Par ailleurs, ce système d'annulation de bruit est muni d'une unité d'apprentissage de filtrage pour modifier la caractéristique du filtre adaptatif (coefficient de filtrage) à l'aide du procédé de MCM normalisés (procédé MCMN, également appelé procédé d'identification par apprentissage) à partir du signal vocal sans bruit. Du fait du fonctionnement répété de l'unité d'apprentissage de filtrage, la composante de bruit incluse dans le signal vocal est convenablement annulée par le signal d'annulation de bruit.
Comme systèmes audio montés à bord de véhicules, les systèmes audio à fonctions de lecture stéréophonique (ci-après également appelées "systèmes audio stéréo") sont devenues très courants, aussi est-il préférable, dans les systèmes d'annulation de bruit montés à bord de véhicules, que la composante de bruit produite du fait de la musique ou autre interceptée par le microphone puisse être correctement supprimée. Cependant, si on se contente de modifier la conception du système d'annulation de bruit pour le remplacer par un système d'annulation pour un système audio stéréo, le problème est que la composante de bruit des diverses voies n'a pas pu être correctement annulée dans le signal de bruit.
A titre d'exemple de la configuration d'un système d'annulation de bruit pour un système audio stéréo, par exemple, un système comportant un filtre adaptatif et une unité d'apprentissage de filtrage pour chaque voie peut être envisagé (par exemple, cf. publication de brevet japonais non examinée (Kokai) n 2001-100 784, Fig. 25). Dans cette configuration, des unités d'apprentissage de filtrage correspondant aux voies actualisent les coefficients de filtrage d'après le signal vocal sans bruit avec des composantes résiduelles de bruit d'autres voies, aussi les processus d'apprentissage interfèrent-ils les uns avec les autres et les unités d'apprentissage de filtrage des voies apprennent de façon erronée les coefficients de filtrage à partir du signal vocal. Par conséquent, un système d'annulation de bruit ayant cette configuration ne peut pas annuler dans un signal vocal la totalité de la composante de bruit d'une pluralité de voies.
Compte tenu de ce problème, le système de reconnaissance vocale selon la publication de brevet japonais non examinée (Kokai) n 2001-100 785 est conçu pour acquérir les signaux audio des voies appliqués aux enceintes d'un système audio stéréo, pour les convertir en signal monophonique, estimer la composante de bruit d'après ce signal monophonique et annuler la composante de bruit dans le signal vocal.
Par ailleurs, la publication de brevet japonais non examinée (Kokai) n 10-190 848 décrit un procédé de suppression d'écho de bruit qui convertit d'une manière non linéaire les signaux audio de différentes voies appliqués à des enceintes acoustiques du système audio stéréo de manière à réduire la correspondance entre les voies pour le son reproduit d'un système audio stéréo intercepté par un microphone et de ce fait empêcher les erreurs d'apprentissage des coefficients de filtrage dans les unités d'apprentissage de filtrage correspondant aux voies.
Pour résumer les problèmes à résoudre par l'invention, le système de reconnaissance vocale décrit dans la publication de brevet japonais non examinée (Kokai) n 2001-100 785 estimait la composante de bruit relative à la musique à lecture stéréophonique, etc. à partir d'un signal monophonique des signaux audio obtenus à partir du système audio stéréo, si bien que le problème consistait en ce que l'erreur d'estimation était forte et la composante de bruit ne pouvait pas être supprimée avec une précision suffisante dans le signal d'entrée du microphone.
Par ailleurs, le procédé de suppression d'écho audio décrit dans la publication de brevet japonais non examinée (Kokai) n 10-190 848 convertissait les signaux audio des différentes voies et utilisait les signaux audio convertis pour produire du bruit à partir des enceintes acoustiques, aussi y avait-il un problème de dégradation de la qualité du son. Par conséquent, si on applique ce procédé de suppression d'écho audio dans le système d'annulation de bruit pour système audio stéréo conçue principalement pour diffuser de la musique ou autre, la qualité de la musique ou autre se dégrade et l'utilisateur est fréquemment insatisfait.
La présente invention vise à réaliser un système d'annulation de bruit pour acquérir des signaux audio de différentes voies à partir d'un système audio stéréo reproduisant de multiples voies de son et pour supprimer la composante de bruit relative au son lu par le système audio stéréo, dans le signal vocal entré à partir d'un microphone, d'après les signaux audio des différentes voies et dont les performances de suppression de bruit soient améliorées.
La présente invention vise également à réaliser un système de reconnaissance vocale facile à utiliser et un système de navigation d'automobile utilisant un tel système d'annulation de bruit à excellente aptitude à l'annulation du bruit.
Selon un premier aspect de l'invention, il est proposé un système d'annulation de bruit pour acquérir des signaux audio de différentes voies à partir d'un système audio reproduisant de multiples voies de son et pour supprimer une composante de bruit relative au son reproduit du système audio à partir d'un signal vocal entré depuis un microphone, muni d'une unité de sortie de signaux vocaux sans bruit, d'une unité de conversion et d'une unité de génération de signal d'annulation de bruit pour chaque voie.
Chaque unité de génération de signal d'annulation de bruit est pourvue d'un élément filtrant pour filtrer le signal audio de sa propre voie, acquis à partir du système audio, filtre celui-ci conformément à un coefficient de filtrage préétabli et supprime la composante de bruit dans le signal vocal.
L'unité de sortie de signal vocal sans bruit utilise chaque signal d'annulation de bruit généré par l'unité de génération de signal d'annulation de bruit des différentes voies pour supprimer la composante de bruit incluse dans un signal vocal entré à partir du microphone et pour délivrer un signal vocal sans bruit.
L'unité de conversion est conçue pour convertir d'une manière non linéaire le signal vocal que délivre l'unité de sortie de signal vocal sans bruit. Chaque unité de génération de signal d'annulation de bruit est pourvue d'un élément d'actualisation de coefficient pour actualiser le coefficient de filtrage établi dans l'élément filtrant d'après le signal audio de sa propre voie acquis à partir du système audio et du signal vocal converti d'une manière non linéaire par l'unité de conversion.
Comme le système d'annulation de bruit ainsi configuré selon le premier aspect de l'invention convertit d'une manière non linéaire le signal vocal sans bruit délivré par l'unité de sortie de signal vocal sans bruit et utilise le signal vocal à conversion non linéaire pour actualiser le coefficient de filtrage de l'élément filtrant prévu pour chaque voie par l'élément d'actualisation de filtre correspondant à chaque voie, les éléments d'actualisation de filtre n'interfèrent pas facilement les uns avec les autres et une erreur d'apprentissage des coefficients de filtrage ne se produit pas facilement dans les éléments d'actualisation de coefficient.
Ainsi, l'opération d'apprentissage de coefficient de filtrage dans l'élément d'actualisation de coefficient de chaque voie a été très susceptible aux composantes de bruit de voies autres que sa propre voie, mais selon le système d'annulation de bruit de la présente invention, comme un signal vocal à conversion non linéaire est utilisé pour l'apprentissage des coefficients de filtrage, cet effet peut rester faible. Par conséquent, il est possible de supprimer l'apprentissage erroné du coefficient de filtrage dans chaque élément d'actualisation de coefficient du fait des composantes de bruit d'autres voies ou du comportement des éléments d'actualisation de coefficient d'autres voies.
Par conséquent, selon le premier aspect, il est possible de supprimer d'une manière plus appropriée la composante de bruit de musique ou autre dans un signal vocal auquel est superposée une composante de bruit de musique ou autre reproduite dans de multiples voies (lecture stéréophonique) par un système audio, et par conséquent d'améliorer l'aptitude du système d'annulation de bruit à annuler le bruit.
En outre, l'unité de conversion peut utiliser une fonction tgh (tangente hyperbolique), une fonction signe ou autre fonction non linéaire pour une conversion non linéaire. En outre, le système d'annulation de bruit peut être configuré d'une manière spécifique comme dans un second aspect de l'invention.
Dans le système d'annulation de bruit selon le deuxième aspect de la présente invention, l'élément filtrant traite un coefficient de filtrage préétabli W[k] et un signal audio X(t) de sa propre voie par traitement convolutionnel conformément à l'équation (1) suivante: k C(t) = EW[k] É X(t k) ... (1) k=1 de manière à filtrer le signal audio X(t) et à générer le signal C(t) d'annulation de bruit.
En outre, l'unité de conversion entre un signal vocal U(t), que l'unité de sortie de signal vocal sans bruit délivre, dans une fonction non linéaire f(x), sachant que x=U(t), pour générer un signal vocal f(U(t)) à conversion non linéaire. De plus, l'élément d'actualisation de coefficient calcule un coefficient de filtrage F[k] à partir du signal vocal f(U(t)) sans bruit à conversion non linéaire, généré par l'unité de conversion, du signal audio X(t) de sa propre voie et du coefficient de filtrage W[k] déjà établi dans l'élément filtrant conformément aux équations (2) et (3) suivantes, contenant des constantes préétablies a et, 6: F[k] W[k] a f (U(t)) x (t k) (2) norm+ k norm = 1 É E(X(t k)I.. . (3) k k=1 où la constante K est un nombre dérivé qui est un entier égal ou supérieur à 2, et la variable t est une variable indiquant le temps, qui est un entier et qui établit ce coefficient de filtrage F[k] dans l'élément filtrant de manière à actualiser le coefficient de filtrage W[k] .
Dans le système d'annulation de bruit selon le deuxième aspect, ainsi configuré, comme dans le premier aspect, il est possible d'annuler d'une manière plus appropriée la composante de bruit d'une musique ou autre reproduite par un système audio à partir du signal vocal et de ce fait d'améliorer l'aptitude du système d'annulation de bruit à l'annulation du bruit.
L'unité de conversion, dans les systèmes d'annulation de bruit selon le premier et le deuxième aspects de l'invention, peut être configurée pour utiliser une fonction tgh d'une fonction non linéaire pour la conversion non linéaire. Selon une autre possibilité, l'unité de conversion peut utiliser une fonction signe d'une fonction non linéaire pour la conversion non linéaire. Selon une autre possibilité, l'unité de conversion peut utiliser une fonction g(x) d'une fonction non linéaire pour la conversion non linéaire: 1 (1/m <. x) g(x)= mÉx (-1/m(x(1/m) ...(4) -1 (x < -1/m) où la variable m est un nombre réel positif supérieur à 1.
Selon le type de fonction non linéaire, les performances d'annulation de bruit du système et la charge de traitement de l'unité de conversion du système seront différentes, mais, avec le système d'annulation de bruit selon le troisième aspect de l'invention utilisant une fonction tgh, il est possible de supprimer la charge de traitement dans l'unité de conversion et d'améliorer suffisamment les performances d'annulation de bruit.
En outre, si on utilise une fonction signe comme dans le système d'annulation de bruit selon le quatrième aspect de l'invention, alors que les performances d'annulation de bruit diminuent en comparaison du système d'annulation de bruit selon le troisième aspect de l'invention, il est possible de réduire la charge de traitement dans l'unité de conversion. De plus, si on utilise la fonction g(x) comme dans le système d'annulation de bruit selon le cinquième aspect de l'invention, il est possible de réduire la charge de traitement tout en obtenant des performances d'annulation de bruit du même ordre que dans le système d'annulation de bruit selon le troisième aspect de l'invention.
Par ailleurs, les systèmes d'annulation de bruit selon les premier et deuxième aspects de l'invention peuvent également utiliser d'autres fonctions non linéaires que celles présentées plus haut. Les fonctions non linéaires peuvent être choisies d'après la découverte de l'analyse de composantes indépendantes connues (ACI). Pour l'analyse de composantes indépendantes, on se reportera par exemple à A. J. Bell, T. J. Sejnowski, "An information-maximization approach to blind separation and blind deconvolution", Neural Computation, 7(6), pp. 1129-1159, 1995, H. Mathis, S. Douglas, "On optimal and universal nonlinearities for blind signal separation", Proc. of Intnl. Conf. on Acoustics, Speech and Signal Processing (ICASSP), 2001, etc. On a expliqué ci-dessus des systèmes d'annulation de bruit selon la présente invention, mais ceux-ci peuvent également être inclus dans des systèmes de reconnaissance vocale. Le système de reconnaissance vocale selon le sixième aspect de l'invention est pourvu d'un système d'annulation de bruit selon le premier aspect de l'invention et d'une unité de reconnaissance vocale pour reconnaître les paroles d'un utilisateur entrées dans un microphone d'après le signal vocal sans bruit obtenu à partir du système d'annulation de bruit.
Le système de reconnaissance vocale selon le sixième aspect de l'invention supprime la composante de bruit incluse dans le signal vocal par un système d'annulation de bruit ayant une grande aptitude à la suppression du bruit et utilise le signal vocal sans bruit pour reconnaître les paroles de l'utilisateur entrées dans le microphone, ce qui améliore donc remarquablement la vitesse de reconnaissance vocale en comparaison du passé.
Dans les systèmes selon la technique antérieure, lorsqu'un signal audio était superposé à un signal vocal en tant que composante de bruit, la vitesse de reconnaissance vocale diminuait, aussi la pratique consistaitelle à inactiver temporairement le système audio au moment de la reconnaissance vocale, mais, dans le système de reconnaissance vocale selon la présente invention, il est possible de reconnaître avec précision des paroles sans inactiver le système audio. Par conséquent, selon le sixième aspect de l'invention, il est possible de supprimer les désagréments subis par l'utilisateur du fait de l'interruption temporaire de lecture de musique ou autre au moment de la reconnaissance vocale.
Si on utilise le système d'annulation de bruit selon la présente invention, il devient possible de reconnaître des paroles pendant la diffusion d'une musique ou autre, mais si on reconnaît des paroles pendant la diffusion d'une musique ou autre, plusieurs problèmes risquent de survenir. Ainsi, dans la technique antérieure, au début de la reconnaissance vocale, la pratique a consisté à inactiver le système audio et à ne pas diffuser de musique ou autre ou à émettre un avertissement sonore pendant l'exécution de la musique ou autre pour signaler à l'utilisateur le début de la reconnaissance vocale, mais si la reconnaissance vocale débute pendant la diffusion d'une musique ou autre, même si un avertissement sonore est émis, celui-ci risque d'être masqué par la musique ou autre, en empêchant l'utilisateur de le remarquer. Ainsi, dans la technique antérieure, au début de la reconnaissance vocale pendant la diffusion d'une musique ou autre, l'utilisateur éprouvait souvent des difficultés à déterminer le moment où commençait la reconnaissance vocale.
Par conséquent, dans un système de reconnaissance vocale pour reconnaître des paroles pendant la diffusion d'une musique ou autre (c'est-à-dire pendant que du son continue à être reproduit par le système audio), il est préférable de modifier le volume du son reproduit par le système audio au moment de la reconnaissance vocale.
Le système de reconnaissance vocale selon un septième aspect de l'invention est pourvu d'une unité d'annulation de bruit pour acquérir des signaux audio de différentes voies à partir d'un système audio reproduisant de multiples voies de son et pour supprimer une composante de bruit liée au son reproduit du système audio à partir d'un signal vocal entré depuis un microphone d'après les signaux audio des voies, d'une unité de reconnaissance vocale pour reconnaître les paroles d'un utilisateur entrées dans le microphone d'après un signal vocal sans bruit obtenu de l'unité d'annulation de bruit, et d'une unité de commande pour faire fonctionner l'unité de reconnaissance de signal vocal lorsqu'une instruction de début de reconnaissance vocale est appliquée de l'extérieur. L'unité de commande fait passer à une valeur prédéterminée (sauf zéro) le volume du son reproduit par le système audio, puis fait fonctionner l'unité de reconnaissance vocale lorsque l'instruction de début de reconnaissance vocale est entrée au moment du fonctionnement du système audio.
L'unité de reconnaissance vocale ainsi configurée selon le septième aspect de l'invention modifie le volume de la musique ou autre lu par le système audio avant et après la reconnaissance vocale pour informer l'utilisateur quant au début de la reconnaissance vocale, de façon que l'utilisateur puisse être informé d'une manière fiable du début de la reconnaissance vocale par le changement de volume. Par conséquent, selon le septième aspect, il est possible de supprimer le problème résultant du fait qu'un avertissement sonore est masqué par la musique ou autre.
Par ailleurs, au moment du réglage du volume, il est possible d'utiliser l'effet Lombard pour amener l'utilisateur à parler d'une voix forte. L'effet Lombard est le phénomène selon lequel le volume des paroles d'un utilisateur augmente dans un environnement très bruyant.
Le système de reconnaissance vocale selon un huitième aspect de la présente invention comporte une unité de réalisation d'historique pour préparer des informations historiques relatives à un volume de paroles d'un utilisateur d'après le signal vocal sans bruit obtenu à partir de l'unité d'annulation de bruit au moment du fonctionnement de l'unité de reconnaissance vocale et l'unité de détermination de volume pour déterminer un volume à établir dans le système audio au moment de la reconnaissance vocale suivante à partir des informations historiques préparées par l'unité de réalisation d'historique. L'unité de commande présente dans le système de reconnaissance vocale modifie le volume du son reproduit par le système audio pour le faire passer à un volume déterminé par l'unité de détermination de volume, puis fait fonctionner l'unité de reconnaissance vocale lorsqu'une instruction de début de reconnaissance vocale est appliquée de l'extérieur.
Dans le système de reconnaissance vocale selon le huitième aspect de l'invention, il est possible de modifier le volume d'après les informations historiques de façon que l'effet Lombard se manifeste, ce qui permet d'accroître le volume des paroles d'un utilisateur à faible voix et permet d'améliorer la vitesse de reconnaissance vocale.
Plus particulièrement, pour utiliser l'effet Lombard afin d'améliorer la vitesse de reconnaissance vocale, il suffit de configurer l'unité de détermination de volume de manière à évaluer un niveau de volume de paroles de l'utilisateur d'après les informations d'historique et de déterminer un volume reproduit le système audio au moment de la reconnaissance vocale pour passer à un volume supérieur à une valeur de référence prédéterminée lorsque cette valeur évaluée est inférieure à un critère d'évaluation prédéterminé. Dans le système de reconnaissance vocale ainsi configuré selon le neuvième aspect de l'invention, la vitesse de reconnaissance vocale est améliorée.
En outre, si le système de reconnaissance vocale selon la présente invention est installé dans un système de navigation d'automobile, il devient possible, pour le conducteur d'un véhicule, etc., de commander avec précision le système de navigation de l'automobile sans utiliser une télécommande. Par conséquent, dans les systèmes de navigation d'automobile selon les dixième et onzième aspects de l'invention, l'exploitabilité du système est améliorée.
L'invention sera mieux comprise à l'étude de la description détaillée d'un mode de réalisation pris à titre d'exemple non limitatif et illustré par les dessins annexés, sur lesquels: - la Fig. 1 est un schéma de principe de la configuration générale d'un système de navigation d'automobile dans lequel est mise en oeuvre la présente invention; - la Fig. 2 est un schéma de principe des fonctions d'un annulateur de bruit; - la Fig. 3 est une vue de fonctions non linéaires f(x) utilisées dans des convertisseurs non linéaires; - la Fig. 4 est un organigramme du traitement d'annulation de bruit exécuté par l'annulateur de bruit; - la Fig. 5A est un organigramme d'un premier traitement d'apprentissage de filtrage exécuté par un annulateur de bruit; - la Fig. 5B est un organigramme d'un second traitement d'apprentissage de filtrage exécuté par un annulateur de bruit; - les figures 6A et 6B sont des organigrammes d'un traitement lié à la reconnaissance vocale, exécuté par un dispositif de commande; et - la Fig. 7 est un chronogramme d'un mode de fonctionnement d'un système de navigation d'automobile.
En référence aux figures annexées, on va maintenant décrire en détail des formes préférées de réalisation de la présente invention.
La Fig. 1 est un schéma de principe de la configuration générale du système de navigation 1 d'automobile dans lequel est mise en oeuvre la présente invention. Le système de navigation 1 d'automobile selon la présente forme de réalisation est muni d'un système de reconnaissance vocale 10 connecté à un microphone 3 et à un système audio 5 monté dans l'automobile, d'un dispositif de commande 40 pourvu d'une unité centrale, d'une mémoire 41, etc. pour commander l'affichage de l'écran 7 ou pour commander les autres parties du système, et d'un générateur 50 de sons connecté aux enceintes SR et SL du système audio 5, générant un signal vocal conformément à des signaux d'instruction délivrés par le dispositif de commande 40, et appliquant celui-ci aux enceintes SR et SL.
Le système de navigation 1 d'automobile exécute divers traitements à l'aide du dispositif de commande 40 en fonction des signaux d'instructions appliqués depuis les interrupteurs de commande (alternat 9, etc.). On peut citer comme traitements qu'exécute le dispositif de commande 40 du système de navigation 1 d'automobile la recherche et le guidage de l'itinéraire jusqu'à la destination, le guidage vers des locaux situés aux environs, des changements de région et d'échelle de la carte routière affichée à l'écran 7, et d'autres traitements exécutés par des systèmes de navigation d'automobile selon la technique antérieure. De plus, le dispositif de commande 40 du système de navigation 1 d'automobile exécute le traitement, expliqué plus loin, lié à la reconnaissance vocale (cf. Fig. 6).
Le système audio 5 a une fonction de reproduction de son sur plusieurs voies (fonction de lecture stéréoscopique) et est pourvue d'une platine 6 de système audio et d'enceintes SR et SL pour plusieurs voies. La platine 6 du système audio est pourvue d'un régulateur 6A de volume pour réguler le volume du son délivré par les enceintes SR et SL. Il commande le régulateur 6a de volume pour régler le volume du son délivré par les enceintes SR et SL conformément à des signaux d'instructions introduits depuis un tableau de commande (non représenté) de la platine 6 système audio et du dispositif de commande 40 du système de navigation 1 de l'automobile. En outre, les signaux audio des voies délivrés par la platine 6 du système audio sont appliqués aux enceintes SR et SL correspondant aux voies et au système de reconnaissance vocale 10.
Le système de reconnaissance vocale 10 est pourvu d'un convertisseur A/N 11 servant à convertir d'un format analogique à un format numérique un signal vocal émis depuis un microphone 3, d'un convertisseur A/N 13 pour convertir d'un format analogique à un format numérique un signal audio sur la voie L entré depuis le système audio 5, d'un convertisseur A/N 15 pourconvertir d'un format analogique à un format numérique un signal audio sur la voie R entré depuis le système audio 5, d'un convertisseur A/N 15 pour convertir d'un format analogique à un format numérique un signal audio sur la voie R entré depuis le système audio 5, d'un annulateur 20 de bruit et d'une unité de reconnaissance vocale 30.
En outre, l'annulateur de bruit 20, comme représenté sur la Fig. 2, est pourvu d'un additionneur 21 et de filtres adaptatifs 23L et 23R, d'unités d'apprentissage de filtrage 25L et 25R et de convertisseurs non linéaires 27L et 27R pour chaque voie. La Fig. 2 est un schéma de principe des fonctions, représentant la configuration générale de l'annulateur 20 de bruit.
Le filtre adaptatif 23L présent dans l'annulateur de bruit 20 exécute un traitement convolutionnel sur le signal audio XL(t) de la voie L à conversion numérique, entré depuis le convertisseur A/N 13 via la borne S1 et sur le coefficient de filtrage préétabli WL[k] conformément à l'équation (5) de façon à filtrer le signal audio XL(t) par le coefficient de filtrage WL[k] et à générer un signal UL(t) d'annulation de bruit pour annuler, dans le signal vocal entré à l'aide du microphone 3, la composante de bruit relative au son délivré par l'enceinte SL. Par ailleurs, la variable k utilisée ici a une valeur qui est un entier satisfaisant la relation 1 c. Par ailleurs, la constante K exprime un nombre dérivé et prend une valeur qui est un entier égal ou supérieur à 2. De plus, la variable t est une variable de temps ayant comme unité la période d'échantillonnage T et prend une valeur qui est un entier.
K
UL(t) = E WL[k].XL(t k) ... (5) k=1 D'autre part, le filtre adaptatif 23R exécute un traitement convolutionnel sur le signal audio XR(t) sur la voie R à conversion numérique, appliqué depuis le convertisseur A/N 15 via la borne S3 et sur le coefficient de filtrage préétabli WR[k] conformément à l'équation (6) de manière à filtrer le signal audio XR(t) à l'aide du coefficient de filtrage WR[k] et à générer un signal UR(t) d'annulation de bruit pour supprimer dans le signal vocal appliqué depuis le microphone 3 la composante de bruit relative à la sortie de son de l'enceinte SR.
UR(t) = EWR [k] .XR(t k) ... (6) k=1 Par ailleurs, l'additionneur 21 additionne le signal vocal XM(t) à conversion numérique appliqué par le convertisseur A/N 11 via la borne S2, le signal UL(t) 35 d'annulation de bruit délivré par le filtre adaptatif 23L et le signal UR(t) d'annulation de bruit délivré par le filtre adaptatif 23R pour supprimer la composante de bruit liée à l'émission de son par les enceintes SL et SR d'après le signal vocal XM(t) et pour délivrer le signal vocal U(t) sans bruit.
U(t) = XM (t) + UL (t) + UR (t) ... (7) En outre, dans la présente forme de réalisation, les valeurs que peuvent prendre les signaux XM(t), XL(t), XR(t), UL(t), UR(t) et U(t) sont des nombres réels de -1 à 1.
Les convertisseurs non linéaires 27L et 27R acquièrent le signal vocal U(t) sans bruit délivré par l'additionneur 21, entrent celui-ci dans les fonctions non linéaires f(x) et délivrent le signal vocal f(U(t)) à conversion non linéaire. Par ailleurs, la Fig. 3 est une vue d'un exemple des fonctions non linéaires f(x) utilisées dans les convertisseurs non linéaires 27L et 27R. La Fig. 3(a) est une courbe représentant y=f(x) =tgh(aÉx), tandis que la Fig. 3(b) est une courbe représentant y=f(x) =signe(x). En outre, le signe (x) est une fonction qui prend la valeur 1 si x est un nombre réel positif, qui prend la valeur -1 si x est un nombre réel négatif et qui prend la valeur 0 si x est égal à O. En outre, la Fig. 3 (c) est une courbe de y=f(x)=g(x) (cf. équation (4)).
L'unité d'apprentissage de filtrage 25L acquiert le signal vocal f(U(t)) à conversion non linéaire délivré par le convertisseur non linéaire 27L et calcule le coefficient de filtrage FL[k] à établir ensuite dans le filtre adaptatif 23L conformément à l'équation (8) d'après le signal f(U(t)), le signal audio XL(t) de voie L à conversion numérique, entré depuis le convertisseur A/N 13, et le coefficient de filtrage WL[k] déjà établi dans le filtre adaptatif 23L.
FL[k] = WL[k]- Lf(U(t))'XL(t-k)... (8) a L = a...(9) (normL +f) Ensuite, l'unité d'apprentissage de filtrage 25L établit le coefficient de filtrage calculé FL[k] pour le filtre adaptatif 23L au lieu du coefficient XL[k] déjà établi pour actualiser le coefficient de filtrage WL[k].
De même, l'unité d'apprentissage de filtrage 25R acquiert le signal vocal f(U(t)) à conversion non linéaire délivré par le convertisseur non linéaire 27R et calcule le coefficient de filtrage FR[k] à établir ensuite dans le filtre adaptatif 23R conformément à l'équation (10) d'après le signal f(U(t)), le signal audio XR(t) sur la voie R à conversion numérique appliqué depuis le convertisseur A/N 15, et le coefficient de filtrage WR[k] déjà établi dans le filtre adaptatif 23R.
FR[k] = WR[k]-aR f(U(t))'XR(t-k)... (10) a R= a (11) (normR+/3) Ensuite, l'unité d'apprentissage de filtrage 25R établit le coefficient de filtrage calculé FR[k] pour le filtre adaptatif 23R au lieu du coefficient WR[k] déjà 10 établi pour actualiser le coefficient de filtrage WR[k].
On a expliqué ci-dessus la configuration de base de l'annulateur de bruit 20, mais on va maintenant expliquer le déroulement du traitement qu'exécute l'annulateur de bruit 20. La Fig. 4 est un organigramme du traitement d'annulation de bruit qu'exécute l'annulateur 20 de bruit configuré comme décrit ci-dessus. Ce traitement d'annulation de bruit est exécuté au moment de la mise en marche du système de navigation 1 d'automobile ou au moment de la mise en marche du système audio 5.
L'annulateur de bruit 20 procède tout d'abord à l'initialisation et établit les coefficients de filtrage WL[k] et WR[k] aux valeurs initiales (S110). Ensuite, l'annulateur audio 20 acquiert le signal vocal XM(t) délivré par le convertisseur A/N 11, acquiert le signal audio XL(5) de la voie L délivré par le convertisseur A/N 13 et acquiert le signal audio XR(t) de la voie R délivré par le convertisseur A/N 15 (S120). En outre, il produit le signal d'annulation de bruit UL(t) conformément à l'équation (5) (S 130) et produit le signal d'annulation de bruit UR(t) conformément à l'équation (6) (S140).
Ensuite, l'annulateur de bruit 20 ajoute au signal vocal XM(5) le signal d'annulation de bruit UL(5) et le signal d'annulation de bruit UR(5) pour générer le signal vocal U(t) (S 150). En outre, il calcule la moyenne normL de l'amplitude du signal audio de la voie L de la période passée KÉT (S 160) et calcule la moyenne normR de l'amplitude du signal audio de la voie R de la période KÉT passée (S 170).
normL = K k-1 normR = k=lXL(t-k)l...(12) XR(t 4...(13) En outre, il juge si la valeur moyenne normL de l'amplitude du signal audio de la voie L calculée est plus grande qu'une valeur seuil prédéterminée AL. S'il juge que normL>AL (OUI en S180), il exécute un premier traitement d'apprentissage de filtrage (cf. Fig. 5 (a), les détails étant expliqués plus loin) (S190) puis passe à S200.
En revanche, s'il juge que normL 1L (NON en S180), il passe à S200 sans exécuter le premier traitement d'apprentissage de filtrage.
En S200, il juge si la valeur moyenne normR de l'amplitude du signal audio de la voie R calculé est supérieure à une valeur seuil prédéterminée AR. S'il juge que normR>AR (OUI en S200), il exécute un deuxième traitement d'apprentissage de filtrage (cf. Fig. 5(b), les détails étant expliqués plus loin) (S210), puis il passe à S220. En revanche, s'il juge que normR BAR (NON en S200), il passe à S220 sans exécuter le second traitement d'apprentissage de filtrage.
En S220, il juge si un signal d'instruction de fin a été appliqué par le système de commande 40. S'il juge que le signal d'instruction de fin a été appliqué, il met fin au traitement d'annulation de bruit, tandis que s'il juge que le signal d'instruction de fin n'a pas été appliqué, il revient au traitement de S 120, il acquiert les nouveaux signaux XM(t), XL(t) et XR(t) et il exécute à nouveau les étapes S120 à S220.
La Fig. 5(a) est un organigramme du premier traitement d'apprentissage de filtrage exécuté par l'annulateur de bruit 20. Lors du premier traitement d'apprentissage de filtrage, l'annulateur de bruit 20 calcule la vitesse d'apprentissage aL conformément à l'équation (9) (S191) et calcule le coefficient de filtrage FL[k] conformément à l'équation (8) (S193). Ensuite, il établit le coefficient de filtrage FL[k] au coefficient de filtrage WL[k] utilisé lors de l'étape S130 suivante (S195) et il met fin au premier traitement d'apprentissage de filtrage.
En outre, la Fig. 5(b) est un organigramme du second traitement d'apprentissage de filtrage exécuté par l'annulateur de bruit 20. S'il exécute le second traitement d'apprentissage de filtrage, l'annulateur de bruit 20 calcule la vitesse d'apprentissage aR conformément à l'équation (11) (S211) et calcule le coefficient de filtrage FR[k] conformément à l'équation (10) (S213). En outre, il établit le coefficient de filtrage FR[k] au coefficient de filtrage WR[k] utilisé lors de l'étape S140 suivante (S215) et il met fin au second traitement d'apprentissage de filtrage.
Le signal vocal U(t) après annulation de bruit produit par l'annulateur de bruit 20 ainsi configuré est appliqué à l'unité de reconnaissance vocale 30 par l'intermédiaire de la borne S0. L'unité de reconnaissance vocale 30 se met en marche conformément à un signal d'instruction de mise en marche délivré par le système de commande 40, acquiert la valeur d'une période prédéterminée du signal vocal U(t) délivré par l'annulateur de bruit 20, analyse le son de la valeur d'une période prédéterminée du signal vocal U(t) acquis, et obtient la grandeur caractéristique du signal vocal U(t) ( par exemple, le cepstre). Par ailleurs, la période prédéterminée pour l'acquisition du signal vocal U(t) est exprimée ci- après par l'intervalle de reconnaissance vocale.
Ensuite, l'unité de reconnaissance vocale 30 utilise une technique connue pour comparer la grandeur caractéristique avec les modèles vocaux enregistrés dans un dictionnaire vocal non représenté, autonome, reconnaît des mots correspondant à des motifs vocaux à grande correspondance comme mots prononcés par l'utilisateur lors de l'intervalle de reconnaissance vocale, et applique les résultats de la reconnaissance au système de commande 40.
En outre, l'unité de reconnaissance vocale 30 est pourvue d'un calculateur de puissance 31. Le calculateur de puissance 31 calcule la puissance des paroles (moyenne dans le temps, du carré de la pression du son) émises par l'utilisateur au cours de l'intervalle de reconnaissance vocale. Ce calculateur de puissance 31 applique au système de commande 40 la puissance Pl(z) des paroles au cours de l'intervalle de reconnaissance vocale calculé d'après le signal vocal U(t) à chaque reconnaissance vocale.
La Fig. 6 est un organigramme du traitement lié à la reconnaissance vocale, exécuté par le système de commande 40. Le système de commande 40 exécute de manière répétée le traitement lié à la reconnaissance vocale jusqu'à ce que le système de navigation 1 de l'automobile soit arrêté au moment où le système de navigation 1 d'automobile est mis en marche.
Lors de l'exécution du traitement lié à la reconnaissance vocale, le système de commande 40 attend jusqu'à ce qu'un signal d'instruction de début de reconnaissance vocale soit appliqué par l'alternat 9. S'il est jugé qu'un signal d'instruction de début de reconnaissance vocale est appliqué par l'alternat 9 (OUI en S310), le signal d'instruction de génération d'avertissement sonore est appliqué au générateur 50 de son et un avertissement sonore est délivré par les enceintes SL et SR (S320). Ensuite, le système de commande 40 demande à la platine 6 du système audio d'accroître le volume de reproduction du son (musique, etc.) à fois le volume immédiat et amène la platine 6 du système audio à changer le volume du son délivré par les enceintes SR et SL pour le faire passer à y- fois la valeur immédiate (S330).
En outre, le système de commande 40 applique un signal d'instruction de mise en marche à l'unité de reconnaissance vocale 30 pour amener l'unité de reconnaissance vocale 30 à se mettre en marche (S340). Ensuite, il attend jusqu'à ce que la reconnaissance vocale par l'unité de reconnaissance vocale soit terminée. S'il est jugé que la reconnaissance vocale prend fin (OUI en S530), il change le volume de reproduction du système audio 5 pour le rétablir au réglage d'origine (S360). Ainsi, le système de commande 40 divise par y le volume augmenté 'y fois, sur demande en S330 dans le système audio 5 pour le faire passer au volume d'origine. Ensuite, le système de commande 40 exécute un traitement en fonction de paroles émises par l'utilisateur et appliquées au microphone 3 d'après les résultats de la reconnaissance obtenus à partir de l'unité de reconnaissance vocale 30 (S370).
Par ailleurs, le système de commande 40 acquiert la valeur calculée P1(z) concernant la puissance des paroles de l'utilisateur à partir de l'unité de reconnaissance vocale 30 dans l'intervalle de reconnaissance vocale immédiat (S380). En outre, elle additionne la valeur P1(z) avec le fichier de données d'historique stocké dans la mémoire 41 (S390). La variable z est une variable indiquant le nombre d'opérations de reconnaissance vocale.
Ensuite, le système de commande 40 juge si la valeur d'au moins S fois la valeur calculée P 1 a été inscrite dans le fichier de données historique stocké dans la mémoire 41 (S400). S'il juge qu'une valeur de S fois la valeur calculée P1 n'a pas été inscrite (NON en S400), il met fin au traitement correspondant de reconnaissance vocale, tandis que s'il juge que la valeur de S fois la valeur calculée P1 a été inscrite (OUI en S 400), il passe à s 410.
En outre, il calcule la valeur moyenne P0(z) de la valeur des S fois passées des valeurs calculées P 1(z), P 1(z-1), P 1(z-2), ... P 1(z-S+1) (S410) contenant la valeur calculée instantanée P 1(z) et inscrit la valeur calculée P0(z) dans la mémoire 41 (S420).
En outre, le système de commande 40 calcule la valeur 1 d'après la valeur calculée P0(z) inscrite dans la mémoire 41, la limite supérieure admissible préétablie Pup du critère d'évaluation et la limite inférieure admissible préétablie PDOWN du critère d'évaluation (S440).
= h ('y, P0(z), Pup, PDOWN) ... (14) En outre, pour le calcul de 1, il est utilisé une fonction prédéterminée h ayant comme variables les valeurs -y, P0(z), Pup et PDOWN précitées. Ici, la fonction h prend une valeur inférieure à y si la valeur P0(z) est supérieure à la valeur Pur, prend une valeur supérieure à 'y si la valeur P0(z) est inférieure à la valeur PDOWN et prend une valeur identique à 'y si la valeur P0(z) est non inférieure à la valeur PDOWN et non supérieure à la valeur Pte. Plus particulièrement, 'y est calculée conformément à l'équation ci-après. En outre, est un coefficient réel positif établi à l'avance de manière appropriée.
y-EÉ{PO(z) PuP} (Pup<PO(s)) Y (PDOWN:-ÇP0(Z) PuP)... (15) y+ E É {PODOWN PO(z)} (PO(z) < PDOWN) Ensuite, le système de commande 40 applique la valeur calculée à la variable 'y et actualise la valeur de la variable Éy (S450). Ainsi, le système de commande 40 modifie le rapport de réglage du volume, en S330, à la valeur de calculée d'après la valeur précédente. Si cette étape en fin, le système de commande 40 met fin au traitement lié à la reconnaissance vocale.
La Fig. 7 est un chronogramme illustrant le mode de fonctionnement du système de navigation 1 d'automobile à configuration expliquée ci-dessus. Le système de navigation 1 d'automobile délivre un avertissement sonore depuis les enceintes SL et SR lorsqu'il y a un déclenchement appliqué, comme signal d'instruction de début de reconnaissance vocale, par l'alternat 9 et il signale à l'utilisateur le début de la reconnaissance vocale. Ensuite, il amène l'unité de reconnaissance vocale 30 à acquérir le signal vocal U(t) pour les paroles de l'utilisateur d'une période prédéterminée (intervalle de reconnaissance vocale) pour la reconnaissance vocale. Par ailleurs, lors de l'intervalle de reconnaissance vocale, il établit à 'y-fois le volume du son (musique ou autre) émis par les enceintes SL et SR.
On a expliqué ci-dessus la configuration du système de navigation 1 d'automobile mais, selon ce système de navigation 1 d'automobile, un système d'annulation de bruit comprenant les convertisseurs A/N 11, 13 et 15 et un annulateur de bruit 20 acquiert les signaux audio des différentes voies (voie L et voie R) et supprime la composante de bruit affectant le son reproduit du système audio 5 d'après le signal vocal XM(t) appliqué depuis le microphone 3 d'après les signaux audio des différentes voies.
Dans cet annulateur de bruit 20, les convertisseurs non linéaires 27L et 27R servant d'unités de conversion convertissent d'une manière non linéaire le signal vocal U(t) sans bruit délivré par l'additionneur 21 qui sert d'unité de délivrance de signal vocal sans bruit. En outre, l'unité d'apprentissage de filtrage 25L qui sert d'élément d'actualisation de coefficient calcule le coefficient de filtrage FL[k] à établir dans le filtre adaptatif 23L servant d'élément filtrant conformément à l'équation 8 d'après le signal f(U(t)) à conversion non linéaire et le signal audio de la voie L attribué à lui-même, établit celui-ci dans le filtre adaptatif 23L et actualise le coefficient de filtrage WL[k].
De même, l'unité d'apprentissage de filtrage 25R qui sert d'élément d'actualisation de coefficient calcule le coefficient de filtrage FR[k] à établir dans le filtre adaptatif 23R servant d'élément filtrant conformément à l'équation 10 d'après le signal f(U(t)) à conversion non linéaire et le signal audio de la voie R attribué à lui-même. Il établit celui-ci dans le filtre adaptatif 23R et il actualise le coefficient de filtrage WR[k].
De la sorte, dans l'annulateur de bruit 20 selon la présente forme de réalisation, l'unité d'apprentissage de filtrage 25L (l'unité d'apprentissage de filtrage 25R) est affectée par la composante de bruit de la voie R (voie L) ou par le comportement de l'unité d'apprentissage de filtrage 25R (unité d'apprentissage de filtrage 25L). Pour supprimer les erreurs d'apprentissage des coefficients de filtrage, le signal vocal U(t) délivré par l'additionneur 21 est soumis à une conversion non linéaire dans les convertisseurs non linéaires 27L et 27R, et les signaux vocaux f(U(t)) à conversion non linéaire servent à apprendre et actualiser les coefficients de filtrage dans les unités d'apprentissage de filtrage 25L et 25R.
Par conséquent, dans l'annulateur de bruit 20 selon la présente forme de réalisation, il est possible d'annuler la composante de bruit liée aux sons reproduits du système audio 5, inclus dans le signal vocal XM(t) obtenu à partir d'un microphone 3, d'une manière plus appropriée qu'avec un dispositif selon la technique antérieure.
Par conséquent, dans ce système de navigation 1 d'automobile, il est possible de reconnaître avec précision les paroles de l'utilisateur appliquées au microphone 3 par l'unité de reconnaissance vocale 30 et d'exécuter le traitement correspondant même sans interrompre la lecture de musique pendant la lecture dans le système audio 5 en inactivant le système audio 5 au moment de la reconnaissance vocale.
Ainsi, selon le système de navigation 1 d'automobile, même si une musique ou autre est émise par le système audio 5, la reconnaissance vocale est exécutée avec précision, le traitement correspondant à celle-ci peut être exécuté et l'exploitabilité du dispositif est améliorée. Plus particulièrement, il est possible de supprimer le désagrément, chez l'utilisateur, résultant de l'interruption de la lecture de la musique au moment de la reconnaissance vocale.
En outre, si les convertisseurs non linéaires 27L et 27R utilisent la fonction tgh d'une fonction non linéaire pour une conversion non linéaire, il est possible d'annuler avec précision le bruit par un simple calcul, les performances d'annulation de bruit de l'annulateur de bruit 20 sont améliorées, la charge de traitement de l'annulateur de bruit 20 peut être supprimée et un annulateur de bruit 20 peut être fabriqué d'une manière peu coûteuse.
En outre, si les convertisseurs non linéaires 27L et 27R utilisent la fonction signe d'une fonction non linéaire pour une conversion non linéaire, les performances d'annulation de bruit diminuent un peu par rapport au cas de l'utilisation de la fonction tgh, mais la charge de traitement de l'annulateur de bruit 20 peut être supprimée et l'annulateur de bruit 20 peut être fabriqué d'une manière peu coûteuse.
En outre, si les convertisseurs non linéaires 27L et 27R utilisent la fonction g(x) de la fonction non linéaire exprimée par l'équation (4) pour une conversion non linéaire, on obtient des performances d'annulation de bruit d'une valeur sensiblement égale au cas de l'utilisation de la fonction tgh, la charge de traitement de l'annulateur de bruit 20 peut être supprimée et l'annulateur de bruit 20 peut être fabriqué d'une manière peu coûteuse.
En outre, dans le système de navigation 1 d'automobile selon la présente forme de réalisation, au moment du fonctionnement du système audio 5, lorsqu'un signal d'instruction de début de reconnaissance vocale est appliqué par l'alternat 9, le système de commande 40 règle le volume du son délivré par les enceintes SL et SR du système audio 5 (le volume du son reproduit du système audio 5) à fois (S330), puis fait fonctionner l'unité de reconnaissance vocale 30 (S340).
L'unité de reconnaissance vocale (30) évalue le volume des paroles de l'utilisateur d'après le signal vocal U(t) sans bruit obtenu de l'annulateur de bruit 20 et applique la valeur d'évaluation Pl(z) au système de commande 40. Le système de commande 40 inscrit la valeur d'évaluation P 1(z) dans le fichier de données historique et prépare des informations historiques concernant le volume des paroles de l'utilisateur (S390). Par ailleurs, le système de commande 40 détermine le volume à établir pour le système audio 5 au moment de la reconnaissance vocale suivante (c'est-à-dire la valeur 'y) d'après la valeur Pl(z) des S fois passées enregistrées dans le fichier d'historique (S440, S450).
De la sorte, dans le système de navigation 1 d'automobile selon la présente forme de réalisation, le volume de la musique ou autre reproduite par le système audio 5 est modifié avant et après la reconnaissance vocale et le début de la reconnaissance vocale est signalé à l'utilisateur, aussi l'utilisateur peut-il prendre connaissance d'une manière fiable du début de la reconnaissance vocale par le changement de volume. Par conséquent, dans le dispositif de navigation 1 d'automobile selon la présente forme de réalisation, le problème consistant, pour l'utilisateur, à trouver plus difficile la prise de conscience du moment du début d'une reconnaissance vocale du fait que l'avertissement sonore délivré au moment du début de la reconnaissance vocale est masqué par la musique ou autre, peut être éliminé.
De plus, dans la présente forme de réalisation, la force des paroles de l'utilisateur est évaluée d'après le fichier de données historique (S410). Le système de commande 40 est conçu de façon que, lorsque la valeur évaluée P0(z) est supérieure à une limite supérieure admissible Pup du critère d'évaluation, la valeur 'y est rendue inférieure à la valeur type prédéterminée (valeur 'y précédente), alors que lorsque la valeur évaluée P0(z) est inférieure à une limite inférieure admissible PDOWN du critère d'évaluation, la valeur 7 est rendue supérieure à la valeur type prédéterminée (valeur 'y précédente) (S440, S450).
Par conséquent, dans le système de navigation d'automobile selon la présente forme de réalisation, l'effet Lombard peut être escompté et un utilisateur à voix faible peut être amené à parler pour la reconnaissance vocale avec une voix forte. Ainsi, dans le système de navigation 1 d'automobile selon la présente invention, il est possible d'améliorer la vitesse de reconnaissance de parole par l'effet Lombard.
Par ailleurs, l'unité d'acquisition de signal audio selon la présente invention est mise en oeuvre par les convertisseurs A/N 13 et 15 et le traitement de S120 exécuté par l'annulateur de bruit 20. L'unité de commande est mise en oeuvre par le traitement de S310 à S360 exécuté par le système de commande 40. En outre, l'unité de réalisation d'information historique est mise en oeuvre par le calculateur de puissance 31 et le traitement des étapes S380 et S390 exécuté par le système de commande 40. De plus, l'unité de détermination de volume est mise en oeuvre par le traitement de S410 à S450.
En outre, le système d'annulation de bruit, le système de reconnaissance vocale et le système de navigation d'automobile selon la présente invention ne se limitent pas aux formes de réalisation ci-dessus. Diverses formes de réalisation peuvent être employées. Par exemple, dans la forme de réalisation ci-dessus, on a cité comme coefficient non linéaire utilisé dans l'annulateur de bruit 20 la fonction tgh, la fonction signe et la fonction (g) indiquées dans l'équation (4), mais il est également possible d'utiliser une autre fonction non linéaire.
En outre, dans la forme de réalisation ci-dessus, un annulateur de bruit 20 pour un système audio 5 émettant des sons grâce à un total de deux voies comprenant la voie L et la voie R a été présenté, mais par exemple il est également possible de configurer l'annulateur de bruit 20 pour gérer ce qu'on appelle une chaîne haute fidélité à 5.1 voies en disposant des enceintes à l'avant gauche, à l'avant droit, au centre, à l'arrière gauche et à l'arrière droit pour générer un son en trois dimensions, ainsi qu'en disposant un haut-parleur de graves (enceinte pour la reproduction des Io fréquences basses) en un même endroit pour renforcer l'effet des basses fréquences audio.

Claims (11)

REVENDICATIONS
1. Système d'annulation de bruit pour supprimer une composante de bruit affectant le son reproduit par un système audio (5), dans un signal vocal appliqué 5 depuis un microphone (3), comprenant: une unité de génération de signal d'annulation de bruit pour chaque voie afin de générer un signal d'annulation de bruit pour supprimer ladite composante de bruit d'après le signal audio de chaque voie acquis à partir d'un système audio (5) pour reproduire de multiples voies de son, une unité de sortie pour utiliser chaque signal d'annulation de bruit afin de supprimer une composante de bruit incluse dans un signal vocal appliqué depuis ledit microphone (3) et pour délivrer un signal vocal sans bruit, et une unité de conversion pour convertir d'une manière non linéaire ledit signal vocal sans bruit, chaque unité de génération de signal d'annulation de bruit comportant: un élément filtrant servant à filtrer ledit signal audio acquis à partir dudit système audio conformément à un coefficient de filtrage préétabli de manière à générer un signal d'annulation de bruit; et un élément d'actualisation de coefficient pour actualiser ledit coefficient de filtrage établi dans ledit élément filtrant d'après ledit signal vocal sans bruit converti de manière non linéaire par ladite unité de conversion et d'après ledit signal audio.
2. Système d'annulation de bruit selon la revendication 1, caractérisé en ce que: C(t) = tW[k}X(t k) k=1 de manière à filtrer ledit signal audio X(t) et à générer ledit signal d'annulation de bruit C(t), ladite unité de conversion entre un signal vocal U(t) sans bruit que ladite unité de sortie de signal vocal sans bruit entre dans une fonction non linéaire f(x) pour générer un signal vocal sans bruit f(U(t)) converti après ladite conversion non-linéaire, et ledit élément filtrant traite un coefficient de filtrage préétabli W[k] et un signal audio X(t) par traitement convolutionnel conformément à l'équation suivante: ledit élément d'actualisation de coefficient calcule un coefficient de filtrage F[k] d'après ledit signal vocal f(U(t)) sans bruit converti, ledit signal audio X(t) et ledit coefficient de filtrage W[k] conformément à l'équation ci-après contenant des constantes préétablies a et a: F[kJ = W[k] a.J(U(t X(t k) norm+f(3 Norm = 1 X(t k) Kk où la constante K est un nombre dérivé constitué par un entier égal à 2 ou plus, et la variable t est une variable indiquant le temps et un entier et ce coefficient de filtrage F[k] établissant dans ledit élément filtrant de manière à actualiser ledit coefficient de filtrage W(k].
3. Système d'annulation de bruit selon la revendication 1, caractérisé en ce que ladite unité de conversion utilise une fonction tgh et une fonction non linéaire pour ladite conversion non linéaire.
4. Système d'annulation de bruit selon la revendication 1, caractérisé en ce que ladite unité de conversion utilise une fonction signe d'une fonction non linéaire pour ladite conversion non linéaire.
5. Système d'annulation de bruit selon la revendication 1, caractérisé en ce que ladite unité de conversion utilise une fonction g(x) d'une fonction non linéaire: 1 (1/m x) g(x) = mÉx (-1/m<x<1/m) L -1 (x 1/m) où la variable m est un nombre réel positif supérieur à 1, pour ladite conversion non linéaire.
6. Système de reconnaissance vocale pour reconnaître des paroles d'après un signal vocal sans bruit obtenu en supprimant une composante de bruit liée à un son reproduit d'un système audio (5) d'après un signal vocal appliqué depuis un microphone (3), comprenant: une unité de génération de signal d'annulation de bruit pour chaque voie afin de générer un signal d'annulation de bruit pour supprimer ladite composante de bruit d'après le signal audio de chaque voie, acquis à partir d'un système audio pour reproduire de multiples voies de son, une unité de sortie pour utiliser chaque signal d'annulation de bruit afin d'éliminer une composante de bruit incluse dans un signal vocal appliqué depuis ledit microphone (3) et pour délivrer un signal vocal sans bruit, une unité de conversion pour convertir d'une manière non linéaire ledit signal vocal sans bruit, et une unité de reconnaissance vocale (30) pour reconnaître les paroles appliquées audit microphone (3) d'après ledit signal vocal sans bruit, ladite unité de génération de signal d'annulation de bruit comportant: un élément filtrant pour filtrer ledit signal audio acquis à partir dudit système audio suivant un coefficient de filtrage préétabli de manière à générer un signal d'annulation de bruit; et un élément d'actualisation de coefficient pour actualiser ledit coefficient de filtrage établi dans ledit élément filtrant d'après ledit signal vocal sans bruit converti d'une manière non linéaire par ladite unité de conversion et d'après ledit signal audio.
7. Système de reconnaissance vocale, caractérisé en ce qu'il comprend une unité d'annulation de bruit pour acquérir des signaux audio de voies d'un système audio (5) reproduisant des voies de son et pour annuler une composante de bruit affectant le son reproduit dudit système audio (5) à partir d'un signal vocal appliqué depuis un microphone (3), d'après lesdits signaux audio des voies, une unité de reconnaissance vocale (30) pour reconnaître des paroles appliquées audit microphone (3), d'après un signal vocal sans bruit obtenu de ladite unité d'annulation de bruit, et une unité de commande pour faire fonctionner ladite unité de reconnaissance de signal lorsqu'une instruction de début de reconnaissance vocale est appliquée depuis l'extérieur, ladite unité de commande faisant passer à une valeur prédéterminée le volume du son reproduit par ledit système audio (5), puis faisant fonctionner ladite unité de reconnaissance vocale (30) lorsque ladite instruction de début de reconnaissance vocale est appliquée au moment du fonctionnement dudit système audio (5).
8. Système de reconnaissance vocale selon la revendication 7, caractérisé en ce qu'il comprend en outre: une unité de réalisation d'historique pour préparer des informations historiques concernant un volume de parole d'un utilisateur d'après ledit signal vocal sans bruit obtenu de ladite unité d'annulation de bruit au moment du fonctionnement de ladite unité de reconnaissance vocale (30), et une unité de détermination de volume pour déterminer un volume à établir dans ledit système audio (5) au moment de la reconnaissance vocale suivante, d'après lesdites informations historiques réalisées par ladite unité de préparation d'historique, ladite unité de commande modifiant le volume du son reproduit par ledit système audio (5) en le faisant passer à un volume déterminé par ladite unité de détermination de volume puis en faisant fonctionner ladite unité de reconnaissance vocale lorsqu'une instruction de début de reconnaissance vocale est appliquée de l'extérieur.
9. Système de reconnaissance vocale selon la revendication 8, caractérisé en ce que ladite unité de détermination de volume évalue la force des paroles de l'utilisateur d'après lesdites informations historiques et détermine un volume à établir dans ledit système audio au moment de la reconnaissance vocale suivante, à un plus grand volume qu'une valeur de référence prédéterminée lorsque cette valeur évaluée est inférieure à un niveau d'évaluation prédéterminé.
10. Système de navigation (1) d'automobile fonctionnant d'après un signal vocal sans bruit obtenu en supprimant une composante de bruit affectant le son reproduit d'un système audio (5) d'après un signal vocal appliqué depuis un microphone (3), caractérisé en ce qu'il comprend: une unité de génération de signal d'annulation de bruit pour chaque voie afin de générer un signal d'annulation de bruit pour supprimer ladite composante de bruit d'après le signal audio de chaque voie, acquis dans un système audio (5) pour reproduire de multiples voies de son, une unité de sortie pour utiliser chaque signal d'annulation de bruit afin de supprimer une composante de bruit incluse dans un signal vocal délivré par ledit microphone (3) et pour délivrer un signal vocal sans bruit, une unité de conversion pour convertir d'une manière non linéaire ledit signal vocal sans bruit, et une unité de reconnaissance vocale (30) pour reconnaître les paroles appliquées audit microphone (3) d'après ledit signal vocal sans bruit, chaque unité de génération de signal d'annulation de bruit comportant: un élément filtrant pour filtrer ledit signal audio acquis dudit système audio (5) suivant un coefficient de filtrage préétabli afin de générer un signal d'annulation de bruit, et un élément d'actualisation de coefficient pour actualiser ledit coefficient de filtrage établi dans ledit élément filtrant d'après ledit signal vocal sans bruit soumis à une conversion non linéaire par ladite unité de conversion et ledit signal audio.
11. Système de navigation (1) d'automobile exécutant une opération reconnue par une unité de reconnaissance vocal (30), caractérisé en ce qu'il comprend: une unité d'annulation de bruit pour acquérir des signaux audio de canaux d'un système audio reproduisant de multiples voies de son et annulant une composante de bruit liée au son reproduit dudit système audio (5) d'après des signaux audio appliqués par un microphone (3) d'après les signaux audio des voies, une unité de reconnaissance vocale (30) pour reconnaître des paroles appliquées audit microphone (3) d'après le signal vocal sans bruit obtenu de ladite unité d'annulation de bruit, et une unité de commande pour mettre en marche ladite unité de reconnaissance vocale (30) lorsqu'une instruction de début de reconnaissance vocale est appliquée de l'extérieur, ladite unité de commande faisant passer à une valeur prédéterminée le volume du son reproduit par ledit système audio, puis faisant fonctionner ladite unité de reconnaissance vocale (30).
FR0500119A 2004-01-07 2005-01-06 Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile Expired - Fee Related FR2864860B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004002387A JP4333369B2 (ja) 2004-01-07 2004-01-07 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置

Publications (2)

Publication Number Publication Date
FR2864860A1 true FR2864860A1 (fr) 2005-07-08
FR2864860B1 FR2864860B1 (fr) 2007-04-13

Family

ID=34675450

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0500119A Expired - Fee Related FR2864860B1 (fr) 2004-01-07 2005-01-06 Systeme d'annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d'automobile

Country Status (5)

Country Link
US (1) US8010354B2 (fr)
JP (1) JP4333369B2 (fr)
CN (2) CN1971709B (fr)
DE (1) DE102005000818A1 (fr)
FR (1) FR2864860B1 (fr)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005039621A1 (de) * 2005-08-19 2007-03-01 Micronas Gmbh Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
KR100751921B1 (ko) 2005-11-11 2007-08-24 고려대학교 산학협력단 멀티채널 음성신호의 잡음제거 방법 및 장치
US7769593B2 (en) * 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
JP5034605B2 (ja) * 2007-03-29 2012-09-26 カシオ計算機株式会社 撮像装置、雑音除去方法及びプログラム
WO2011126716A2 (fr) * 2010-03-30 2011-10-13 Nvoq Incorporated Rétroaction de client de dictée facilitant la qualité audio
CN103050125A (zh) * 2011-10-12 2013-04-17 苏州阔地网络科技有限公司 一种网页上实现回音消除的方法
US8731822B2 (en) * 2012-01-17 2014-05-20 Motorola Mobility Llc Systems and methods for interleaving navigational directions with additional audio in a mobile device
US9482296B2 (en) 2012-06-05 2016-11-01 Apple Inc. Rendering road signs during navigation
US9230556B2 (en) 2012-06-05 2016-01-05 Apple Inc. Voice instructions during navigation
US9997069B2 (en) * 2012-06-05 2018-06-12 Apple Inc. Context-aware voice guidance
US9418672B2 (en) 2012-06-05 2016-08-16 Apple Inc. Navigation application with adaptive instruction text
US9886794B2 (en) 2012-06-05 2018-02-06 Apple Inc. Problem reporting in maps
US9052197B2 (en) 2012-06-05 2015-06-09 Apple Inc. Providing navigation instructions while device is in locked mode
US9111547B2 (en) 2012-08-22 2015-08-18 Kodak Alaris Inc. Audio signal semantic concept classification method
US8880444B2 (en) 2012-08-22 2014-11-04 Kodak Alaris Inc. Audio based control of equipment and systems
US20140112496A1 (en) * 2012-10-19 2014-04-24 Carlo Murgia Microphone placement for noise cancellation in vehicles
KR20140052661A (ko) * 2012-10-25 2014-05-07 현대모비스 주식회사 신호처리를 이용한 차량용 마이크로 폰 시스템
CN103813241B (zh) * 2012-11-09 2016-02-10 辉达公司 移动电子设备及其音频播放装置
KR101445186B1 (ko) 2013-08-27 2014-10-01 (주) 로임시스템 비선형 보정 반향 제거장치
JP2015052466A (ja) * 2013-09-05 2015-03-19 株式会社デンソー 車両用装置及び音声切換制御プログラム
US9508345B1 (en) 2013-09-24 2016-11-29 Knowles Electronics, Llc Continuous voice sensing
US9431013B2 (en) * 2013-11-07 2016-08-30 Continental Automotive Systems, Inc. Co-talker nulling for automatic speech recognition systems
US9953634B1 (en) 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
US9466310B2 (en) 2013-12-20 2016-10-11 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Compensating for identifiable background content in a speech recognition device
US20150179181A1 (en) * 2013-12-20 2015-06-25 Microsoft Corporation Adapting audio based upon detected environmental accoustics
US10043532B2 (en) * 2014-03-17 2018-08-07 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
US9437188B1 (en) 2014-03-28 2016-09-06 Knowles Electronics, Llc Buffered reprocessing for multi-microphone automatic speech recognition assist
CN103928026B (zh) * 2014-05-12 2017-04-12 安徽江淮汽车集团股份有限公司 一种汽车语音指令采集处理***及方法
US9743213B2 (en) 2014-12-12 2017-08-22 Qualcomm Incorporated Enhanced auditory experience in shared acoustic space
WO2017064839A1 (fr) * 2015-10-16 2017-04-20 パナソニックIpマネジメント株式会社 Dispositif conçu pour faciliter la conversation bidirectionnelle et procédé conçu pour faciliter la conversation bidirectionnelle
CN106098074A (zh) * 2016-05-20 2016-11-09 北京奇虎科技有限公司 一种数据处理方法和便携式多功能设备
EP3467818B1 (fr) * 2016-05-30 2020-04-22 Sony Corporation Dispositif de création de champ acoustique atténué localement, procédé et programme d'ordinateur correspondants
US20170371615A1 (en) * 2016-06-22 2017-12-28 Qualcomm Incorporated Alerting a user to a change in an audio stream
CN105979442B (zh) * 2016-07-22 2019-12-03 北京地平线机器人技术研发有限公司 噪声抑制方法、装置和可移动设备
CN106328137A (zh) * 2016-08-19 2017-01-11 镇江惠通电子有限公司 语音控制方法、装置及***
CN106356068A (zh) * 2016-11-02 2017-01-25 北京中星微电子有限公司 音频播放方法和装置
US20180166073A1 (en) * 2016-12-13 2018-06-14 Ford Global Technologies, Llc Speech Recognition Without Interrupting The Playback Audio
CN106846803B (zh) * 2017-02-08 2023-06-23 广西交通科学研究院有限公司 基于音频的交通事件检测装置及方法
US20210320684A1 (en) * 2018-07-31 2021-10-14 Sony Corporation Information processing device, information processing method, and program
KR20200033617A (ko) * 2018-09-20 2020-03-30 현대자동차주식회사 차량용 음성 인식 장치 및 그 제어 방법
JP7153191B2 (ja) * 2018-11-26 2022-10-14 トヨタ自動車株式会社 情報提供装置及び車載装置
EP3667662B1 (fr) * 2018-12-12 2022-08-10 Panasonic Intellectual Property Corporation of America Dispositif d'annulation d'écho acoustique, procédé d'annulation d'écho acoustique et programme d'annulation d'écho acoustique
US10963316B2 (en) 2019-03-25 2021-03-30 Flaist, Inc. Artificial intelligence-powered cloud for the financial services industry
US11017792B2 (en) * 2019-06-17 2021-05-25 Bose Corporation Modular echo cancellation unit
CN110475180A (zh) * 2019-08-23 2019-11-19 科大讯飞(苏州)科技有限公司 车载多音区音频处理***及方法
CN112545547A (zh) * 2020-11-25 2021-03-26 北京积水潭医院 呼吸音分析方法及呼吸音分析***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999053674A1 (fr) * 1998-04-08 1999-10-21 British Telecommunications Public Limited Company Annulation d'echo
WO2000068936A1 (fr) * 1999-05-07 2000-11-16 Imagination Technologies Limited Annulation de signaux brouilleurs non fixes pour la reconnaissance vocale
JP2001100785A (ja) * 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2001100784A (ja) * 1999-09-30 2001-04-13 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4574389A (en) * 1983-07-15 1986-03-04 Larry Schotz Stereophonic receiver having a noise reduction control circuit
US6020782A (en) * 1994-05-25 2000-02-01 The United States Of America As Represented By The Secretary Of The Navy Noise assisted signal processor with nonlinearly coupled arrays of nonlinear dynamic elements
US5828756A (en) 1994-11-22 1998-10-27 Lucent Technologies Inc. Stereophonic acoustic echo cancellation using non-linear transformations
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
JPH10257583A (ja) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd 音声処理装置およびその音声処理方法
US6665645B1 (en) 1999-07-28 2003-12-16 Matsushita Electric Industrial Co., Ltd. Speech recognition apparatus for AV equipment
US20030040910A1 (en) * 1999-12-09 2003-02-27 Bruwer Frederick J. Speech distribution system
US6529872B1 (en) * 2000-04-18 2003-03-04 Matsushita Electric Industrial Co., Ltd. Method for noise adaptation in automatic speech recognition using transformed matrices
US20020152255A1 (en) * 2001-02-08 2002-10-17 International Business Machines Corporation Accessibility on demand
US7487084B2 (en) * 2001-10-30 2009-02-03 International Business Machines Corporation Apparatus, program storage device and method for testing speech recognition in the mobile environment of a vehicle
US7165028B2 (en) * 2001-12-12 2007-01-16 Texas Instruments Incorporated Method of speech recognition resistant to convolutive distortion and additive distortion
US7142678B2 (en) * 2002-11-26 2006-11-28 Microsoft Corporation Dynamic volume control
US20050089177A1 (en) * 2003-10-23 2005-04-28 International Business Machines Corporation Method, apparatus, and program for intelligent volume control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999053674A1 (fr) * 1998-04-08 1999-10-21 British Telecommunications Public Limited Company Annulation d'echo
WO2000068936A1 (fr) * 1999-05-07 2000-11-16 Imagination Technologies Limited Annulation de signaux brouilleurs non fixes pour la reconnaissance vocale
JP2001100785A (ja) * 1999-07-28 2001-04-13 Matsushita Electric Ind Co Ltd Av機器用音声認識装置
JP2001100784A (ja) * 1999-09-30 2001-04-13 Sony Corp 情報処理装置および情報処理方法、並びに記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PATENT ABSTRACTS OF JAPAN vol. 2000, no. 21 3 August 2001 (2001-08-03) *

Also Published As

Publication number Publication date
CN1971709B (zh) 2012-07-04
FR2864860B1 (fr) 2007-04-13
US20050159945A1 (en) 2005-07-21
CN1971709A (zh) 2007-05-30
US8010354B2 (en) 2011-08-30
JP4333369B2 (ja) 2009-09-16
DE102005000818A1 (de) 2005-09-22
CN1637857A (zh) 2005-07-13
CN1637857B (zh) 2010-05-26
JP2005195895A (ja) 2005-07-21

Similar Documents

Publication Publication Date Title
FR2864860A1 (fr) Systeme d&#39;annulation de bruit, systeme de reconnaissance vocale et systeme de navigation d&#39;automobile
JP4283212B2 (ja) 雑音除去装置、雑音除去プログラム、及び雑音除去方法
US11348595B2 (en) Voice interface and vocal entertainment system
US8271279B2 (en) Signature noise removal
EP1154405B1 (fr) Procédé et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
US20100036659A1 (en) Noise-Reduction Processing of Speech Signals
US8352257B2 (en) Spectro-temporal varying approach for speech enhancement
CN109389990B (zh) 加强语音的方法、***、车辆和介质
EP2772916B1 (fr) Procédé de débruitage d&#39;un signal audio par un algorithme à gain spectral variable à dureté modulable dynamiquement
KR101244232B1 (ko) 오디오 신호 분석 및 변경을 위한 시스템 및 방법
US20060116873A1 (en) Repetitive transient noise removal
CN108281153A (zh) 用于车内通信的回声抑制的***和方法
JP5649488B2 (ja) 音声判別装置、音声判別方法および音声判別プログラム
JP2008299221A (ja) 発話検知装置
CN111489750B (zh) 声音处理设备和声音处理方法
EP3580755A1 (fr) Methode et appareil de modification dynamique du timbre de la voix par decalage en fréquence des formants d&#39;une enveloppe spectrale
CN110696756A (zh) 一种车辆的音量控制方法及装置、汽车、存储介质
FR3012929A1 (fr) Modificateur de la presence de probabilite de la parole perfectionnant les performances de suppression du bruit reposant sur le log-mmse
JP2000330597A (ja) 雑音抑圧装置
FR3012927A1 (fr) Estimation precise du rapport signal a bruit par progression reposant sur une probabilite de la presence de la parole mmse
JP2008070877A (ja) 音声信号前処理装置、音声信号処理装置、音声信号前処理方法、及び音声信号前処理用のプログラム
JP7052008B2 (ja) 有声音声検出の複雑性低減およびピッチ推定
JP4924652B2 (ja) 音声認識装置及びカーナビゲーション装置
WO2024161995A1 (fr) Dispositif, procédé et programme de traitement de signaux

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 11

PLFP Fee payment

Year of fee payment: 12

PLFP Fee payment

Year of fee payment: 13

PLFP Fee payment

Year of fee payment: 14

PLFP Fee payment

Year of fee payment: 15

ST Notification of lapse

Effective date: 20200910