FR2974655A1 - Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres". - Google Patents

Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres". Download PDF

Info

Publication number
FR2974655A1
FR2974655A1 FR1153572A FR1153572A FR2974655A1 FR 2974655 A1 FR2974655 A1 FR 2974655A1 FR 1153572 A FR1153572 A FR 1153572A FR 1153572 A FR1153572 A FR 1153572A FR 2974655 A1 FR2974655 A1 FR 2974655A1
Authority
FR
France
Prior art keywords
signal
speech
headset
frequency
physiological sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR1153572A
Other languages
English (en)
Other versions
FR2974655B1 (fr
Inventor
Michael Herve
Guillaume Vitte
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Parrot Drones SAS
Original Assignee
Parrot SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Parrot SA filed Critical Parrot SA
Priority to FR1153572A priority Critical patent/FR2974655B1/fr
Priority to US13/450,361 priority patent/US8751224B2/en
Priority to EP12164777.0A priority patent/EP2518724B1/fr
Priority to CN201210124682.8A priority patent/CN102761643B/zh
Priority to JP2012100555A priority patent/JP6017825B2/ja
Publication of FR2974655A1 publication Critical patent/FR2974655A1/fr
Application granted granted Critical
Publication of FR2974655B1 publication Critical patent/FR2974655B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1083Reduction of ambient noise
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02085Periodic noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/13Hearing devices using bone conduction transducers

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Set Structure (AREA)

Abstract

Ce casque comprend : un capteur physiologique (18), apte à être couplé à la joue ou à la tempe du porteur du casque et à capter les vibrations vocales non acoustiques transmises par conduction osseuse interne ; des moyens de filtrage passe-bas (48) du signal capté ; un ensemble de microphones (20, 22) captant les vibrations vocales acoustiques transmises par voie aérienne depuis la bouche du porteur du casque ; des moyens de filtrage passe-haut (50, 52) et de réduction de bruit (56) des signaux captés par ces microphones ; et des moyens de mixage (54), pour combiner les signaux filtrés et donner en sortie un signal représentatif de la parole émise par le porteur du casque. Le signal du capteur physiologique (18) est également utilisé par des moyens de calcul de la fréquence de coupure (44) des filtres passe-bas et passe-haut et par des moyens de calcul de probabilité d'absence de parole (64, 66).

Description

L'invention concerne un casque audio du type micro/casque combinés. Un tel casque peut notamment être utilisé pour des fonctions de communication telles que des fonctions de téléphonie "mains libres", en complément de l'écoute d'une source audio (musique par exemple) provenant d'un appareil sur lequel est branché le casque. Dans les fonctions de communication, l'une des difficultés est d'assurer une intelligibilité suffisante du signal capté par le micro, c'est-à-dire le signal de parole du locuteur proche (le porteur du casque). Le casque peut en effet être utilisé dans un environnement bruyant (mé- tro, rue passante, train, etc.), de sorte que le micro captera non seulement la parole du porteur du casque, mais également les bruits parasites environnants. Le porteur peut être protégé de ces bruits par le casque, notamment s'il s'agit d'un modèle à écouteurs fermés isolant l'oreille de l'extérieur, et en- core plus si le casque est pourvu d'un "contrôle actif de bruit". En revanche le locuteur distant (celui se trouvant à l'autre bout du canal de communication) souffrira des bruits parasites captés par le micro, venant se superposer et interférer avec le signal de parole du locuteur proche (le porteur du casque).
En particulier, certains formants de la parole essentiels à la compréhension de la voix sont souvent noyés dans des composantes de bruit couramment rencontrées dans les environnements habituels, composantes qui sont majoritairement concentrées dans les basses fréquences. Le problème général de l'invention est, dans un tel contexte, de procéder à une réduction de bruit efficace, permettant de délivrer au locuteur dis-tant un signal vocal représentatif de la parole émise par le locuteur proche, signal qui soit débarrassé des composantes parasites de bruits extérieurs présents dans l'environnement du locuteur proche. Un aspect important de ce problème est la nécessité de restituer un signal de parole naturel et intelligible, c'est-à-dire non distordu et dont la plage des fréquences utiles ne soit pas amputée par les traitements de débruitage. L'une des idées de base de l'invention consiste à recueillir certaines vibrations vocales au moyen d'un capteur physiologique appliqué contre la joue 35 ou la tempe du porteur du casque, de manière à accéder à de nouvelles informations concernant le contenu de la parole. Ces informations seront ensuite utilisées pour le débruitage ainsi que pour diverses fonctions auxiliaires que l'on exposera plus bas, notamment le calcul d'une fréquence de coupure d'un filtre dynamique.
En effet, lorsqu'une personne émet un son voisé (c'est-à-dire une composante de parole dont la production s'accompagne d'une vibration des cor-des vocales), une vibration se propage depuis les cordes vocales jusqu'au pharynx et à la cavité bucco-nasale, où elle est modulée, amplifiée et articulée. La bouche, le voile du palais, le pharynx, les sinus les fosses nasa- les servent de caisse de résonance ce son voisé et, leurs parois étant élastiques, elles vibrent à leur tour, et ces vibrations sont transmises par conduction osseuse interne et sont perceptibles au niveau de la joue et de la tempe. Ces vibrations vocales au niveau de la joue et de la tempe présentent la caractéristique d'être, par nature, très peu corrompues par le bruit environnant : en effet, en présence de bruits extérieurs, les tissus de la joue et de la tempe ne vibrent quasiment pas et ceci, quelle que soit la composition spectrale du bruit extérieur. L"invention repose sur la possibilité de capter ces vibrations vocales dé- pourvues de bruit par l'intermédiaire d'un capteur physiologique appliqué directement sur la joue ou sur la tempe. Bien sûr, les signaux ainsi captés ne sont pas à proprement parler de la parole puisque la parole n'est pas seulement formée de sons voisés, elle contient des composantes qui ne naissent pas au niveau des cordes vocales : le contenu fréquentiel est par exemple beaucoup plus riche avec le son provenant de la gorge et émis par la bouche. De plus, la conduction osseuse interne et la traversée de la peau a pour effet de filtrer certaines composantes vocales. Il s'agit toutefois là d'un signal représentatif du contenu vocal voisé, qui pourra être utilisé de façon efficace pour la réduction de bruit et/ou pour 30 diverses autres fonctions. Par ailleurs, en raison du filtrage engendré par la propagation des vibrations jusqu'à la tempe, le signal recueilli par le capteur physiologique est utilisable uniquement dans les basses fréquences. Mais comme les bruits généralement rencontrés dans un environnement habituel (rue, métro, 35 train, ...) sont majoritairement concentrés dans les basses fréquences, le capteur physiologique qui délivre dans les basses fréquences un signal naturellement dépourvu de composante parasite de bruit (ce qui n'est pas possible avec un micro classique) présente un avantage considérable pour la réduction du bruit.
Plus précisément, l'invention propose d'opérer le débruitage du signal de parole proche par un combiné micro/casque comprenant, de manière en elle-même connue, des écouteurs réunis par un arceau de maintien et comportant chacun un transducteur de reproduction sonore d'un signal audio logé dans une coque pourvue d'un coussinet circumaural, et au moins un microphone apte à recueillir la parole du porteur du casque. De façon caractéristique de l'invention, ce combiné micro/casque comprend des moyens de débruitage d'un signal de parole proche émis par le porteur du casque, comprenant : un capteur physiologique, incorporé au coussinet circumaural et placé dans une région de celui-ci apte à venir en contact avec la joue ou la tempe du porteur du casque pour y être couplé et capter les vibrations vocales non acoustiques transmises par conduction osseuse interne, ce capteur physiologique délivrant un premier signal de parole ; un ensemble microphonique, comprenant le(s) microphone(s) apte(s) à capter les vibrations vocales acoustiques transmises par voie aérienne depuis la bouche du porteur du casque, cet ensemble microphonique délivrant un second signal de parole ; des moyens de débruitage du second signal de parole ; et des moyens de mixage, pour combiner le premier signal de parole et le second signal de parole, et donner en sortie un troisième signal de parole représentatif de la parole émise par le por- teur du casque. De préférence, le combiné micro/casque comprend des moyens de filtrage passe-bas du premier signal de parole avant combinaison par les moyens de mixage, et/ou des moyens de filtrage passe-haut du second signal de parole avant débruitage et combinaison par les moyens de mixage. Avantageusement, les moyens de filtrage passe-bas et/ou passe-haut comprennent un filtre à fréquence de coupure ajustable, et le casque comprend des moyens de calcul de la fréquence de coupure, opérant en fonction du signal délivré par le capteur physiologique. Les moyens de calcul de la fréquence de coupure peuvent en particulier comprendre des moyens d'analyse du contenu spectral du signal délivré par le capteur physiologique, aptes à déterminer la fréquence de coupure en fonction des niveaux relatifs du rapport signal/bruit évalué dans une pluralité de bandes de fréquences distinctes du signal délivré par le capteur physiologique.
De préférence, les moyens de débruitage du second signal de parole sont des moyens de réduction de bruit non fréquentielle avec, dans une forme de réalisation particulière de l'invention, l'ensemble microphonique qui comprend deux microphones, et les moyens de réduction de bruit non fréquentielle qui comprennent un combineur apte à appliquer un retard au signal délivré par l'un des microphones et à soustraire ce signal retardé du signal délivré par l'autre microphone. Les deux microphones peuvent en particulier être alignés en un réseau linéaire suivant une direction principale dirigée vers la bouche du porteur du casque.
De préférence également, il est prévu des moyens de débruitage du troisième signal de parole délivré par les moyens de mixage, notamment des moyens de réduction de bruit fréquentielle. Selon un aspect original de l'invention, il est prévu des moyens recevant en entrée et opérant une intercorrélation entre le premier et le troisième signal de parole, et délivrant en sortie un signal de probabilité de présence de parole fonction du résultat de l'intercorrélation. Les moyens de débruitage du troisième signal de parole reçoivent en entrée ce signal de probabilité de présence de parole pour, sélectivement : i) opérer une réduction de bruit différenciée selon les bandes de fréquences en fonction de la valeur du signal de probabilité de présence de parole, et ii) opérer une réduction de bruit maximale sur toutes les bandes de fréquences en l'absence de parole. Il peut en outre être prévu des moyens de post-traitement, aptes à opérer une égalisation sélective par bandes de fréquences dans la partie du spectre correspondant au signal recueilli par le capteur physiologique. Ces moyens déterminent un gain d'égalisation pour chacune des bandes de fréquences, ce gain étant calculé à partir des coefficients fréquentiels respectifs des signaux délivrés par le(s) microphones et des signaux délivrés par le capteur physiologique, considérés dans le domaine fréquentiel.
Ils opèrent en outre un lissage sur une pluralité des trames successives de signal du gain d'égalisation calculé.
0 On va maintenant décrire un exemple de mise en oeuvre du dispositif de l'invention, en référence aux dessins annexés où les mêmes références numériques désignent d'une figure à l'autre des éléments identiques ou fonctionnellement semblables.
La Figure 1 illustre de façon générale le casque de l'invention, posé sur la tête d'un utilisateur. La Figure 2 est un schéma d'ensemble, sous forme de blocs fonctionnels, expliquant la manière dont est réalisé le traitement du signal permettant de délivrer en sortie un signal débruité représentatif de la parole émise par le porteur du casque. La Figure 3 est une représentation spectrale amplitude/fréquence illustrant le calcul d'intercorrélation servant à évaluer une probabilité de présence de parole. La Figure 4 est une représentation spectrale amplitude/fréquence illus- trant le traitement final d'égalisation automatique opéré après la réduction de bruit. 0
Sur la Figure 1, la référence 10 désigne de façon générale le casque se- Ion l'invention, qui comporte deux oreillettes 12 réunies par un arceau. Chacune des oreillettes est de préférence constituée d'une coque fermée 12, logeant un transducteur de reproduction sonore, appliquée autour de l'oreille de l'utilisateur avec interposition d'un coussinet isolant 16 isolant l'oreille de l'extérieur.
De façon caractéristique de l'invention, ce casque est pourvu d'un capteur physiologique 18 permettant de recueillir les vibrations produites par un signal voisé émis par le porteur du casque, et qui peuvent être captées au niveau de la joue ou de la tempe. Le capteur 18 est de préférence un accéléromètre intégré dans le coussinet 16 de manière à venir s'appliquer contre la joue ou la tempe de l'utilisateur avec un couplage le plus étroit possible. Le capteur physiologique peut notamment être placé sur la face intérieure de la peau du coussinet de sorte que, une fois le casque mis en place, le capteur physiologique soit appliqué contre la joue ou la tempe de l'utilisateur sous l'effet une légère pression résultant de l'écrasement du matériau du coussinet, avec seulement interposition de la peau du coussinet. Le casque comporte également un réseau ou antenne de microphones, par exemple deux micros omnidirectionnels 20, 22, placés sur la coque de l'écouteur 12. Ces deux micros avant 20 et arrière 22 sont des micros omnidirectionnels disposés l'un par rapport à l'autre de manière que leur direction d'alignement 24 soit approximativement dirigée vers la bouche 26 du porteur du casque. La Figure 2 est un schéma par blocs montrant les différents blocs et fonctions mis en oeuvre par le procédé de l'invention ainsi que leurs interac-15 tions. Le procédé de l'invention est mis en oeuvre par des moyens logiciels, qu'il est possible de décomposer et schématiser par un certain nombre de blocs 30 à 64 illustrés Figure 2. Ces traitements sont mis en oeuvre sous forme d'algorithmes appropriés exécutés par un microcontrôleur ou un 20 processeur numérique de signal. Bien que, pour la clarté de l'exposé, ces divers traitements soient présentés sous forme de blocs distincts, ils mettent en oeuvre des éléments communs et correspondent en pratique à une pluralité de fonctions globalement exécutées par un même logiciel. On retrouve sur cette figure le capteur physiologique 18 et les deux micros 25 omnidirectionnels avant 20 et arrière 22. La référence 28 désigne par ail-leurs le transducteur de reproduction sonore placé à l'intérieur de la coque de l'écouteur. Ces divers éléments délivrent des signaux qui font l'objet d'un traitement par le bloc référencé 30, qui peut être couplé à une inter-face 32 aux circuits de communication (circuits téléphoniques) et reçoit en 30 entrée E le son destiné à être reproduit par le transducteur 28 (parole du locuteur distant pendant une communication téléphonique, source musicale hors des périodes de communication téléphonique), et délivre sur la sortie S un signal représentatif de la parole du locuteur proche, c'est-à-dire du porteur du casque.
Le signal à reproduire appliqué sur l'entrée E est un signal numérique converti en analogique par le convertisseur 34, puis amplifié par l'amplificateur 36 pour reproduction par le transducteur 28. On va maintenant décrire la manière dont est produit le signal débruité re- présentatif de la parole du locuteur proche, à partir des signaux respectifs recueillis par le capteur physiologique 18 et les micros 20 et 22. Le signal recueilli par le capteur physiologique 18 est un signal comprenant principalement des composantes dans la région inférieure du spectre sonore (typiquement 0-1500 Hz). Comme on l'a expliqué plus haut, ce si- gnal est naturellement non bruité. Les signaux recueillis par les micros 20, 22 seront utilisés principalement pour le haut du spectre (au-dessus de 1500 Hz), mais ces signaux sont fortement bruités et il sera indispensable d'opérer un traitement de débruitage fort pour en éliminer les composantes de bruit parasites, dont le ni- veau peut être tel, dans certains environnements, qu'elles occultent complètement le signal de parole capté par ces micros 20, 22. La première étape du traitement est un traitement anti-écho, appliqué aux signaux du capteur physiologique et des micros. En effet, le son reproduit par le transducteur 28 est capté par le capteur physiologique 18 et les micros 20, 22, générant un écho qui perturbe le fonctionnement du système, et qui doit donc être éliminé en amont. Ce traitement anti-écho est mis en oeuvre par les blocs 38, 40 et 42, chacun de ces blocs recevant sur une première entrée le signal émis par le capteur 18, 20 ou bien 22 et sur une second entrée le signal reproduit par le transducteur 28 (signal générateur d'écho), et délivre en sortie, pour traitement ultérieur, un signal dont l'écho a été éliminé. Le traitement anti-écho est par exemple réalisé par un traitement à algorithme adaptatif tel que celui décrit dans le FR 2 792 146 Al (Parrot SA), auquel on pourra se reporter pour plus de détails. Il s'agit d'une technique d'annulation d'écho ou AEC consistant à définir de façon dynamique un filtre de compensation modélisant le couplage acoustique entre le transducteur 28 et le capteur physiologique 18 (ou le micro 20, ou le micro 22, respectivement) par une transformation linéaire entre le signal reproduit par le transducteur 28 (c'est-à-dire le signal E appliqué en entrée des blocs 38, 40 ou 42) et l'écho capté par le capteur physiologique 18 (ou le micro 20 ou 22). Cette transformation définit un filtre adaptatif qui est appliqué au signal incident reproduit, et le résultat de ce filtrage est soustrait du signal recueilli par le capteur physiologique 18 (ou le micro 20 ou 22), ce qui a pour effet d'annuler la majeure partie de l'écho acoustique.
Cette modélisation repose sur la recherche d'une corrélation entre le signal reproduit par le transducteur 28 et le signal recueilli par le capteur physiologique 18 (ou le micro 20 ou 22), c'est-à-dire sur une estimation de la réponse impulsionnelle du couplage constituée par le corps de l'écouteur 12 supportant ces divers éléments.
Le traitement est notamment opéré par un algorithme de type APA (Affine Projection Algorithm) adaptatif, qui assure une convergence rapide, bien adaptée à des applications de type "mains libres" avec un débit vocal intermittent et un niveau pouvant rapidement varier. Avantageusement, l'algorithme itératif est exécuté avec un pas variable, comme décrit dans le FR 2 792 146 Al précité. Avec cette technique, le pas ,u varie de façon continue en fonction des niveaux d'énergie du signal capté par le micro, avant et après filtrage. Ce pas est accru lorsque l'énergie du signal capté est dominée par l'énergie de l'écho, et, inverse-ment, réduit lorsque l'énergie du signal capté est dominée par l'énergie du bruit de fond et/ou de la parole du locuteur distant. Le signal recueilli par le capteur physiologique 18 après le traitement antiécho par le bloc 38 sera utilisé comme signal d'entrée d'un bloc 44 de cal-cul d'une fréquence de coupure FC. L'étape suivante consiste à opérer un filtrage des signaux, avec un filtre passe-bas 48 pour le signal du capteur physiologique 18 et avec un filtre passe-haut 50, 52 pour les signaux recueillis par les micros 20, 22, respectivement. Ces filtres 48, 50 et 52 sont de préférence des filtres numériques du type à réponse impulsionnelle infinie IIR (filtres récursifs), qui présentent une 30 transition relativement abrupte entre la bande passante et la bande reje- tée. Avantageusement, ces filtres sont des filtres adaptatifs dont la fréquence de coupure est variable et déterminée dynamiquement par le bloc 44. Ceci permet d'adapter le filtrage aux conditions particulières d'utilisation 35 du casque : voix plus ou moins haute du porteur lorsqu'il parle, couplage plus ou moins étroit entre le capteur physiologique 18 et la joue ou la tempe du porteur, etc. La fréquence de coupure FC, qui est de préférence la même pour le filtre passe-bas 48 et les filtres passe-haut 50 et 52, est déterminée à partir du signal du capteur physiologique 18 après le traite- ment anti-écho 38. Pour cela, un algorithme calcule le rapport signal/bruit pour plusieurs bandes de fréquence situées dans une plage comprise entre par exemple 0 et 2500 Hz (le niveau de bruit étant donné par un calcul de l'énergie dans une bande de fréquences plus haute, par exemple entre 3000 et 4000 Hz, car l'on sait que dans cette zone le signal ne peut être que du bruit, du fait des propriétés du composant constituant le capteur physiologique 18). La fréquence de coupure choisie correspondra à la fréquence maximale pour laquelle le rapport signal/bruit dépasse un seuil prédéterminé, par exemple 10 dB. L'étape suivante consiste à opérer au moyen du bloc 54 un mixage pour reconstruire le spectre complet avec, d'une part, la région inférieure du spectre donnée par le signal filtré du capteur physiologique 18 et, d'autre part, le haut du spectre donné par le signal filtré des micros 20 et 22 après passage dans un combineur-déphaseur 56 permettant d'opérer un débruitage dans cette partie du spectre. Cette reconstruction est opérée par sommation des deux signaux, qui sont appliqués en synchronisme au bloc de mixage 54 de manière à éviter toute déformation. On va maintenant décrire plus précisément la manière dont est opérée la réduction du bruit par le combineur-déphaseur 56. Le signal que l'on souhaite débruiter (c'est-à-dire le signal du locuteur pro- che situé dans la partie haute du spectre, typiquement les composantes de fréquence supérieure à 1500 Hz) est issu des deux micros 20, 22 dis-posés à quelques centimètres l'un de l'autre sur la coque 14 de l'un des écouteurs du casque. Comme on l'a indiqué, ces deux micros sont disposés l'un par rapport à l'autre de manière que la direction 24 qu'ils définis- sent soit approximativement orientée dans la direction de la bouche 26 du porteur du casque. De ce fait, un signal de parole émis depuis la bouche atteindra le micro avant 20 puis le micro arrière 22 avec un retard, et donc un déphasage, sensiblement constant, tandis que les bruits ambiants seront captés sans déphasage par les deux micros 20 et 22 (qui sont des micros omnidirectionnels), compte tenu de l'éloignement des sources de bruits parasites par rapport aux deux micros 20 et 22. La réduction de bruit sur les signaux captés par les micros 20 et 22 n'est pas opérée dans le domaine fréquentiel (comme cela est souvent le cas), mais dans le domaine temporel, au moyen du combineur-déphaseur 56 qui comprend un déphaseur 58 appliquant un retard i au signal du micro arrière 22 et un combineur 60 permettant de soustraire ce signal retardé au signal issu du micro avant 20. On constitue ainsi un réseau différentiel de micros du premier ordre, équi- valent à un microphone virtuel unique dont la directivité pourra être ajustée en fonction de la valeur de i, avec 0 i <_ TA (TA étant la valeur correspondant au déphasage naturel entre les deux micros 20 et 22, égale à la distance entre les deux micros divisée par la vitesse du son, soit un retard d'environ 30 las pour un espacement de 1 cm). Une valeur 'c = TA donnera un diagramme de directivité cardioïde, une valeur i = TA /3 un diagramme hypercardioïde, et une valeur i = 0 un diagramme dipolaire. On peut obtenir par un choix approprié de ce paramètre une atténuation d'environ 6dB sur des bruits diffus environnants. Pour plus de détails sur cette technique, on pourra par exemple se référer à : [1] M. Buck et M. RdfRler, First Order Differential Microphones Arrays for Automotive Applications, Proceedings of the 7th International Work- shop on Acoustic echo and Noise control (IWAENC), Darmstadt, 10- 13 Sept 2001. On va maintenant décrire les traitements opérés sur le signal global (haut et bas du spectre) délivré en sortie des moyens de mixage 54. Ce signal est ensuite soumis par le bloc 62 à une réduction de bruit fréquentielle. De préférence, cette réduction de bruit fréquentielle est opérée de façon différente en présence ou en l'absence de parole, en évaluant une proba-30 bilité p d'absence de parole à partir du signal recueilli par le capteur phy- siologique 18. Avantageusement, cette probabilité d'absence de parole est dérivée de l'information donnée par le capteur physiologique. En effet, comme on l'a indiqué plus haut, le signal délivré par ce capteur 35 présente un très bon rapport signal/bruit jusqu'à la fréquence de coupure FC déterminée par le bloc 44. Mais au-delà de cette fréquence de cou-pure le rapport signal/bruit reste encore bon, et souvent meilleur que celui des micros 20 et 22. L'information du capteur est exploitée en calculant (bloc 64) l'intercorrélation fréquentielle entre le signal combiné délivré par le bloc de mixage 54 et le signal non filtré du capteur physiologique, avant filtrage par le filtre passe-bas 48. Ainsi, pour chaque fréquence f comprise par exemple entre FC et 4000 Hz, et pour chaque trame n, le calcul suivant est réalisé par le bloc 64 : étant les représentations vectorielles (complexes) fréquentielles, pour la trame n, respectivement du signal combiné délivré par le bloc de mixage 54, et du signal du capteur physiologique 18. Pour évaluer une probabilité d'absence de parole, l'algorithme recherche les fréquences pour lesquelles il n'y a que du bruit (situation d'absence de parole) : sur le spectrogramme du signal délivré par le bloc de mixage 54 certaines harmoniques sont noyées dans le bruit, alors qu'elles ressortent plus sur le signal du capteur physiologique. Le calcul d'intercorrélation par la formule décrite ci-dessus produit un résultat dont la figure 3 montre un exemple, dans le domaine fréquentiel Les pics PI, P2, P3, P4, ... de ce calcul d'intercorrélation indiquent une forte corrélation entre le signal combiné délivré par le bloc de mixage 54, et le signal du capteur physiologique 18, et l'émergence de ces fréquences corrélées indique la présence probable de parole pour ces fréquences.
Pour obtenir une probabilité d'absence de parole (bloc 66), on considère la valeur complémentaire : La valeur coefficient_ normalisation permet de régler la répartition des probabilités en fonction de la valeur de l'intercorrélation, et obtenir des va-30 leurs entre 0 et 1.
La probabilité p d'absence de parole ainsi obtenue est appliquée au bloc 62 qui opère sur le signal délivré par le bloc de mixage 54 une réduction de bruit fréquentielle de façon sélective par rapport à un seuil donné de probabilité d'absence de parole : - en l'absence probable de parole, la réduction de bruit est appliquée sur toutes les bandes de fréquences, c'est-à-dire que le gain maximal de réduction est appliqué de la même façon sur toutes les composantes du signal (puisque dans ce cas celui-ci ne contient vraisemblablement pas de composante utile) ; en revanche, en présence probable de parole, la réduction de bruit est une réduction de bruit fréquentielle appliquée sélectivement selon les différentes bandes de fréquences en fonction de la valeur p de la pro- babilité de présence de parole, selon un schéma classique, par exem- ple comparable à celui décrit dans le WO 2007/099222 Al (Parrot).
Le système que l'on vient de décrire permet d'obtenir d'excellentes performances globales, typiquement de l'ordre de 30 à 40 dB de réduction de bruit sur le signal de parole du locuteur proche. Grâce à l'élimination de tous les bruits parasites, notamment les plus gênants (train, métro, etc.) qui sont concentrés dans les basses fréquences, cela donne l'impression au locuteur distant (celui avec lequel le porteur du casque est en communication) que son interlocuteur (le porteur du casque) se trouve dans une pièce silencieuse. Enfin, il est avantageux d'appliquer au signal une égalisation finale (bloc 68), notamment sur le bas du spectre.
En effet, le contenu basse fréquence recueilli au niveau de la joue ou de la tempe par le capteur physiologique 18 est différent du contenu basse fréquence du son émis par la bouche de l'utilisateur, tel qu'il serait capté par un micro situé à quelques centimètres de la bouche, ou même par l'oreille d'un interlocuteur. L'utilisation du capteur physiologique et le fil- trage que l'on a décrit plus haut permet certes d'obtenir un signal très bon en termes de rapport signal/bruit, mais qui peut présenter pour l'interlocuteur qui l'entend un timbre un peu sourd et peu naturel. Pour pallier cette difficulté, il est avantageux d'opérer une égalisation du signal de sortie avec des gains ajustés sélectivement sur différentes ban-35 des de fréquences dans la région du spectre correspondant au signal re- cueilli par le capteur physiologique. L'égalisation peut être réalisée de manière automatique, à partir du signal délivré par les micros 20, 22, avant filtrage. La Figure 4 montre un exemple, dans le domaine fréquentiel (donc après transformée de Fourier) du signal ACC produit par le capteur physiologique 18, par rapport à un signal microphonique MIC qui serait capté à quelques centimètres de la bouche. De manière à optimiser le rendu du signal recueilli par le capteur physiologique, des gains différenciés Gl, G2, G3, G4, ... sont appliqués à différen- tes bandes de fréquences de la partie du spectre située dans les basses fréquences. Ces gains sont évalués par comparaison des signaux captés, dans une bande de fréquences commune, à la fois par le capteur physiologique 18 et par les micros 20 et/ou 22.
Plus précisément, l'algorithme calcule les transformées de Fourier respectives de ces deux signaux, donnant une série de coefficients fréquentiels (exprimés en dB) NormPhysioFreq_dB(i) et NormMicFreq_dB(i), correspon- dant respectivement à la norme du iième coefficient de Fourier du signal du capteur physiologique et à la norme du i'ème coefficient Fourier du signal microphonique. Pour chaque coefficient fréquentiel de rang i, si la différence :
DifferenceFreq_dB(i) = NormPhysioFreq_dB(i) - NormMicFreq_dB(i). est positive, le gain qui sera appliqué sera inférieur à l'unité (négatif en dB) ; réciproquement si la différence est négative le gain à appliquer sera supérieur à l'unité (positif en dB). Si le gain était appliqué tel quel, les différences n'étant pas exactement constantes d'une trame à une autre, notamment lorsqu'il ne s'agit pas de sons voisés, il y aurait des variations importantes d'égalisation dans le timbre. Pour éviter ces variations, l'algorithme opère un lissage de la différence, qui permet d'affiner l'égalisation :
Gain_dB(i) = 2.GaindB(i) - (1-2) DifferenceFreqdB(i).35 Plus le coefficient 2 sera proche de 1, moins l'information de la trame courante sera prise en compte pour le calcul du gain du i'ème coefficient. In-versement, plus le coefficient 2 sera proche de 0, plus l'information instantanée sera prise en compte. En pratique, pour que le lissage soit efficace, on prendra une valeur 2 proche de 1, par exemple 2= 0,99. Le gain appliqué sur chaque bande de fréquence du signal issu du capteur physiologique donnera, pour la ,ème fréquence modifiée :
NormPhysioFreq_dB_corrigée(i) = NormPhysioFreq_dB(i) + Gain dB(i) C'est cette norme qui sera utilisée par l'algorithme d'égalisation. L'application de gains différenciés permet de rendre plus naturel le signal de parole dans le bas du spectre. Une étude subjective a montré que, dans un environnement silencieux et lorsqu'une telle égalisation est appli- quée, la différence entre un signal microphonique de référence et le signal produit par le capteur physiologique dans le bas du spectre est pratique-ment imperceptible.

Claims (6)

  1. REVENDICATIONS1. Un casque audio (10) du type combiné micro/casque, comprenant : - des écouteurs (12) réunis par un arceau de maintien et comportant chacun un transducteur (28) de reproduction sonore d'un signal audio logé dans une coque (14) pourvue d'un coussinet circumaural (16), et - au moins un microphone apte à recueillir la parole du porteur du cas- que, caractérisé en ce qu'il comprend des moyens (30) de débruitage d'un si- gnal de parole proche émis par le porteur du casque, comprenant : un capteur physiologique (18), incorporé au coussinet circumaural et placé dans une région de celui-ci apte à venir en contact avec la joue ou la tempe du porteur du casque pour y être couplé et capter les vibrations vocales non acoustiques transmises par conduction osseuse in-terne, ce capteur physiologique délivrant un premier signal de parole ; un ensemble microphonique, comprenant le(s)dit(s) microphone(s) (20, 22) apte(s) à capter les vibrations vocales acoustiques transmises par voie aérienne depuis la bouche du porteur du casque, cet ensemble microphonique délivrant un second signal de parole ; - des moyens (56) de débruitage du second signal de parole ; et - des moyens de mixage (54), pour combiner le premier signal de parole et le second signal de parole, et donner en sortie un troisième signal de parole représentatif de la parole émise par le porteur du casque.
  2. 2. Le casque audio de la revendication 1, comprenant en outre : - des moyens (48) de filtrage passe-bas du premier signal de parole 25 avant combinaison par les moyens de mixage ; et/ou - des moyens (50, 52) de filtrage passe-haut du second signal de parole avant débruitage et combinaison par les moyens de mixage.
  3. 3. Le casque audio de la revendication 2, dans lequel : 30 - les moyens de filtrage passe-bas et/ou passe-haut (48, 50, 52) com- prennent un filtre à fréquence de coupure ajustable, et le casque comprend en outre des moyens (44) de calcul de la fréquence de coupure, opérant en fonction du signal délivré par le capteur physiologique.
  4. 4. Le casque audio de la revendication 3, dans lequel les moyens (44) de calcul de la fréquence de coupure comprennent des moyens d'analyse du contenu spectral du signal délivré par le capteur physiologique, aptes à déterminer la fréquence de coupure en fonction des niveaux relatifs du rapport signal/bruit évalué dans une pluralité de bandes de fréquences distinctes du signal délivré par le capteur physiologique.
  5. 5. Le casque audio de la revendication 1, dans lequel les moyens (56) de débruitage du second signal de parole sont des moyens de réduction de bruit non fréquentielle.
  6. 6. Le casque audio de la revendication 5, dans lequel : - l'ensemble microphonique comprend deux microphones (20, 22), et - lesdits moyens (56) de réduction de bruit non fréquentielle compren- nent un combineur apte à appliquer un retard au signal délivré par l'un des microphones et à soustraire ce signal retardé du signal délivré par l'autre microphone. 9. Le casque audio de la revendication 6, dans lequel les deux microphones (20, 22) sont alignés en un réseau linéaire suivant une direction prin-25 cipale (24) dirigée vers la bouche (26) du porteur du casque. 10. Le casque audio de la revendication 1, comprenant en outre : - des moyens (62) de débruitage du troisième signal de parole délivré par les moyens de mixage. 9. Le casque audio de la revendication 8, dans lequel les moyens (62) de débruitage du troisième signal de parole sont des moyens de réduction de bruit fréquentielle. 30 10. Le casque audio de la revendication 9, comprenant en outre des moyens recevant en entrée et opérant une intercorrélation entre ledit premier et ledit troisième signal de parole, et délivrant en sortie un signal de probabilité de présence de parole fonction du résultat de ladite inter- corrélation. 11. Le casque audio de la revendication 10, dans lequel les moyens (62) de débruitage du troisième signal de parole reçoivent en entrée ledit signal de probabilité de présence de parole et sont aptes à, sélectivement : i) opérer une réduction de bruit différenciée selon les bandes de fréquen- ces en fonction de la valeur dudit signal de probabilité de présence de parole, et ii) opérer une réduction de bruit maximale sur toutes les bandes de fréquences en l'absence de parole. 12. Le casque audio de la revendication 1, comprenant en outre : - des moyens (64) de post-traitement, aptes à opérer une égalisation sé- lective par bandes de fréquences dans la partie du spectre correspon- dant au signal recueilli par le capteur physiologique. 13. Le casque audio de la revendication 12, dans lequel les moyens de post-traitement sont aptes à déterminer un gain d'égalisation pour chacune desdites bandes de fréquences, ce gain étant calculé à partir des coefficients fréquentiels respectifs des signaux délivrés par le(s) micro- phones et des signaux délivrés par le capteur physiologique, considérés dans le domaine fréquentiel. 14. Le casque audio de la revendication 13, dans lequel les moyens de post-traitement sont en outre aptes à opérer un lissage sur une pluralité 30 des trames successives de signal dudit gain d'égalisation calculé.
FR1153572A 2011-04-26 2011-04-26 Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres". Active FR2974655B1 (fr)

Priority Applications (5)

Application Number Priority Date Filing Date Title
FR1153572A FR2974655B1 (fr) 2011-04-26 2011-04-26 Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".
US13/450,361 US8751224B2 (en) 2011-04-26 2012-04-18 Combined microphone and earphone audio headset having means for denoising a near speech signal, in particular for a “hands-free” telephony system
EP12164777.0A EP2518724B1 (fr) 2011-04-26 2012-04-19 Combiné audio micro/casque comprenant des moyens de débruitage d'un signal de parole proche, notamment pour un système de téléphonie "mains libres"
CN201210124682.8A CN102761643B (zh) 2011-04-26 2012-04-25 组合话筒和耳机的音频头戴式耳机
JP2012100555A JP6017825B2 (ja) 2011-04-26 2012-04-26 特に「ハンズフリー」電話システム向けの近接音声信号を雑音除去するための手段を有するマイクロホンとイヤホンの組合せ型のオーディオ・ヘッドセット

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1153572A FR2974655B1 (fr) 2011-04-26 2011-04-26 Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".

Publications (2)

Publication Number Publication Date
FR2974655A1 true FR2974655A1 (fr) 2012-11-02
FR2974655B1 FR2974655B1 (fr) 2013-12-20

Family

ID=45939241

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1153572A Active FR2974655B1 (fr) 2011-04-26 2011-04-26 Combine audio micro/casque comprenant des moyens de debruitage d'un signal de parole proche, notamment pour un systeme de telephonie "mains libres".

Country Status (5)

Country Link
US (1) US8751224B2 (fr)
EP (1) EP2518724B1 (fr)
JP (1) JP6017825B2 (fr)
CN (1) CN102761643B (fr)
FR (1) FR2974655B1 (fr)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9247346B2 (en) 2007-12-07 2016-01-26 Northern Illinois Research Foundation Apparatus, system and method for noise cancellation and communication for incubators and related devices
US9135915B1 (en) * 2012-07-26 2015-09-15 Google Inc. Augmenting speech segmentation and recognition using head-mounted vibration and/or motion sensors
US9704486B2 (en) 2012-12-11 2017-07-11 Amazon Technologies, Inc. Speech recognition power management
CN103208291A (zh) * 2013-03-08 2013-07-17 华南理工大学 一种可用于强噪声环境的语音增强方法及装置
US9560444B2 (en) * 2013-03-13 2017-01-31 Cisco Technology, Inc. Kinetic event detection in microphones
JP6123503B2 (ja) * 2013-06-07 2017-05-10 富士通株式会社 音声補正装置、音声補正プログラム、および、音声補正方法
CN104254049B (zh) 2013-06-28 2018-12-21 哈曼国际工业有限公司 头戴式耳机响应测量和均衡
DE102013216133A1 (de) * 2013-08-14 2015-02-19 Sennheiser Electronic Gmbh & Co. Kg Hörer oder Headset
US9180055B2 (en) * 2013-10-25 2015-11-10 Harman International Industries, Incorporated Electronic hearing protector with quadrant sound localization
US20150118960A1 (en) * 2013-10-28 2015-04-30 Aliphcom Wearable communication device
US9036844B1 (en) 2013-11-10 2015-05-19 Avraham Suhami Hearing devices based on the plasticity of the brain
EP2882203A1 (fr) 2013-12-06 2015-06-10 Oticon A/s Dispositif d'aide auditive pour communication mains libres
FR3019422B1 (fr) * 2014-03-25 2017-07-21 Elno Appareil acoustique comprenant au moins un microphone electroacoustique, un microphone osteophonique et des moyens de calcul d'un signal corrige, et equipement de tete associe
FR3021180B1 (fr) * 2014-05-16 2016-06-03 Parrot Casque audio a controle actif de bruit anc avec prevention des effets d'une saturation du signal microphonique "feedback"
WO2016032523A1 (fr) * 2014-08-29 2016-03-03 Harman International Industries, Inc. Casque à réduction de bruit à auto-étalonnage
US9942848B2 (en) * 2014-12-05 2018-04-10 Silicon Laboratories Inc. Bi-directional communications in a wearable monitor
CN104486286B (zh) * 2015-01-19 2018-01-05 武汉邮电科学研究院 一种连续子载波ofdma***的上行帧同步方法
US9905216B2 (en) * 2015-03-13 2018-02-27 Bose Corporation Voice sensing using multiple microphones
US9847093B2 (en) * 2015-06-19 2017-12-19 Samsung Electronics Co., Ltd. Method and apparatus for processing speech signal
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
US9633672B1 (en) * 2015-10-29 2017-04-25 Blackberry Limited Method and device for suppressing ambient noise in a speech signal generated at a microphone of the device
FR3044197A1 (fr) 2015-11-19 2017-05-26 Parrot Casque audio a controle actif de bruit, controle anti-occlusion et annulation de l'attenuation passive, en fonction de la presence ou de l'absence d'une activite vocale de l'utilisateur de casque.
GB2552178A (en) * 2016-07-12 2018-01-17 Samsung Electronics Co Ltd Noise suppressor
CN106211012B (zh) * 2016-07-15 2019-11-29 成都定为电子技术有限公司 一种耳机时频响应的测量与校正***及其方法
JP6634354B2 (ja) * 2016-07-20 2020-01-22 ホシデン株式会社 緊急通報システム用ハンズフリー通話装置
WO2018053159A1 (fr) * 2016-09-14 2018-03-22 SonicSensory, Inc. Système de diffusion audio en continu à dispositifs multiples avec une synchronisation
WO2018083511A1 (fr) * 2016-11-03 2018-05-11 北京金锐德路科技有限公司 Appareil et procédé de lecture audio
US10311889B2 (en) * 2017-03-20 2019-06-04 Bose Corporation Audio signal processing for noise reduction
EP3613216A4 (fr) * 2017-04-23 2020-12-02 Audio Zoom Pte Ltd Appareil transducteur destiné à une intelligibilité élevée de la parole dans des environnements bruyants
US10341759B2 (en) * 2017-05-26 2019-07-02 Apple Inc. System and method of wind and noise reduction for a headphone
CN107180627B (zh) * 2017-06-22 2020-10-09 潍坊歌尔微电子有限公司 去除噪声的方法和装置
US10706868B2 (en) 2017-09-06 2020-07-07 Realwear, Inc. Multi-mode noise cancellation for voice detection
US10701470B2 (en) 2017-09-07 2020-06-30 Light Speed Aviation, Inc. Circumaural headset or headphones with adjustable biometric sensor
US10764668B2 (en) 2017-09-07 2020-09-01 Lightspeed Aviation, Inc. Sensor mount and circumaural headset or headphones with adjustable sensor
CN109729463A (zh) * 2017-10-27 2019-05-07 北京金锐德路科技有限公司 用于脖戴式语音交互耳机的声麦骨麦复合收音装置
JP7194912B2 (ja) * 2017-10-30 2022-12-23 パナソニックIpマネジメント株式会社 ヘッドセット
CN107886967B (zh) * 2017-11-18 2018-11-13 中国人民解放军陆军工程大学 一种深度双向门递归神经网络的骨导语音增强方法
US10438605B1 (en) * 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
CN110931027A (zh) * 2018-09-18 2020-03-27 北京三星通信技术研究有限公司 音频处理方法、装置、电子设备及计算机可读存储介质
CN109413539A (zh) * 2018-12-25 2019-03-01 珠海蓝宝石声学设备有限公司 一种耳机及其调节装置
EP3737115A1 (fr) * 2019-05-06 2020-11-11 GN Hearing A/S Appareil auditif avec capteur de conduction osseuse
CN110265056B (zh) * 2019-06-11 2021-09-17 安克创新科技股份有限公司 音源的控制方法以及扬声设备、装置
CN110121129B (zh) * 2019-06-20 2021-04-20 歌尔股份有限公司 耳机的麦克风阵列降噪方法、装置、耳机及tws耳机
KR20220062598A (ko) 2019-09-12 2022-05-17 썬전 샥 컴퍼니 리미티드 오디오 신호 생성을 위한 시스템 및 방법
WO2021068120A1 (fr) * 2019-10-09 2021-04-15 大象声科(深圳)科技有限公司 Procédé d'extraction de parole à apprentissage profond et réduction de bruit qui fusionne des signaux d'un capteur de vibrations osseuses et d'un microphone
TWI735986B (zh) * 2019-10-24 2021-08-11 瑞昱半導體股份有限公司 收音裝置及方法
CN113038318B (zh) * 2019-12-25 2022-06-07 荣耀终端有限公司 一种语音信号处理方法及装置
TWI745845B (zh) * 2020-01-31 2021-11-11 美律實業股份有限公司 耳機及耳機組
KR20220017080A (ko) * 2020-08-04 2022-02-11 삼성전자주식회사 음성 신호를 처리하는 방법 및 이를 이용한 장치
CN111935573B (zh) * 2020-08-11 2022-06-14 Oppo广东移动通信有限公司 音频增强方法、装置、存储介质及可穿戴设备
CN114339569B (zh) * 2020-08-29 2023-05-26 深圳市韶音科技有限公司 一种获取振动传递函数的方法和***
EP4214707A1 (fr) * 2020-09-15 2023-07-26 Dolby Laboratories Licensing Corporation Procédé et dispositif pour le traitement d'un enregistrement binaural
US11259119B1 (en) 2020-10-06 2022-02-22 Qualcomm Incorporated Active self-voice naturalization using a bone conduction sensor
US11337000B1 (en) * 2020-10-23 2022-05-17 Knowles Electronics, Llc Wearable audio device having improved output
JP7467317B2 (ja) * 2020-11-12 2024-04-15 株式会社東芝 音響検査装置及び音響検査方法
EP4273860A4 (fr) * 2020-12-31 2024-07-24 Shenzhen Shokz Co Ltd Procédé et système de génération d'audio
US11943601B2 (en) 2021-08-13 2024-03-26 Meta Platforms Technologies, Llc Audio beam steering, tracking and audio effects for AR/VR applications
US12041427B2 (en) * 2021-08-13 2024-07-16 Meta Platforms Technologies, Llc Contact and acoustic microphones for voice wake and voice processing for AR/VR applications
US20230253002A1 (en) * 2022-02-08 2023-08-10 Analog Devices International Unlimited Company Audio signal processing method and system for noise mitigation of a voice signal measured by air and bone conduction sensors
CN114724574B (zh) * 2022-02-21 2024-07-05 大连理工大学 一种期望声源方向可调的双麦克风降噪方法
CN114333883B (zh) * 2022-03-12 2022-05-31 广州思正电子股份有限公司 一种头戴式智能语音识别装置
US11978468B2 (en) * 2022-04-06 2024-05-07 Analog Devices International Unlimited Company Audio signal processing method and system for noise mitigation of a voice signal measured by a bone conduction sensor, a feedback sensor and a feedforward sensor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0683621A2 (fr) * 1994-05-18 1995-11-22 Nippon Telegraph And Telephone Corporation Emetteur-récepteur ayant un transducteur acoustique du type embout auriculaire
JPH08214391A (ja) * 1995-02-03 1996-08-20 Iwatsu Electric Co Ltd 骨導気導複合型イヤーマイクロホン装置
WO2000021194A1 (fr) * 1998-10-08 2000-04-13 Resound Corporation Systeme de transmission de la voix a capteurs jumeles
JP2000261534A (ja) * 1999-03-10 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 送受話器

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5394918A (en) * 1977-01-28 1978-08-19 Masahisa Ikegami Combtned mtcrophone
JPH08223677A (ja) * 1995-02-15 1996-08-30 Nippon Telegr & Teleph Corp <Ntt> 送話器
JPH11265199A (ja) * 1998-03-18 1999-09-28 Nippon Telegr & Teleph Corp <Ntt> 送話器
FR2792146B1 (fr) 1999-04-07 2001-05-25 Parrot Sa Procede de suppression de l'echo acoustique d'un signal audio, notamment dans le signal capte par un microphone
JP2002125298A (ja) * 2000-10-13 2002-04-26 Yamaha Corp マイク装置およびイヤホンマイク装置
JP2003264883A (ja) * 2002-03-08 2003-09-19 Denso Corp 音声処理装置および音声処理方法
WO2004034734A1 (fr) * 2002-10-08 2004-04-22 Nec Corporation Dispositif reseau et terminal portatif
CN1701528A (zh) * 2003-07-17 2005-11-23 松下电器产业株式会社 通话装置
US7383181B2 (en) * 2003-07-29 2008-06-03 Microsoft Corporation Multi-sensory speech detection system
US7492889B2 (en) * 2004-04-23 2009-02-17 Acoustic Technologies, Inc. Noise suppression based on bark band wiener filtering and modified doblinger noise estimate
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7930178B2 (en) * 2005-12-23 2011-04-19 Microsoft Corporation Speech modeling and enhancement based on magnitude-normalized spectra
FR2898209B1 (fr) 2006-03-01 2008-12-12 Parrot Sa Procede de debruitage d'un signal audio
JP2007264132A (ja) * 2006-03-27 2007-10-11 Toshiba Corp 音声検出装置及びその方法
CN102084668A (zh) * 2008-05-22 2011-06-01 伯恩同通信有限公司 处理信号的方法和***
JP5499633B2 (ja) * 2009-10-28 2014-05-21 ソニー株式会社 再生装置、ヘッドホン及び再生方法
FR2976111B1 (fr) * 2011-06-01 2013-07-05 Parrot Equipement audio comprenant des moyens de debruitage d'un signal de parole par filtrage a delai fractionnaire, notamment pour un systeme de telephonie "mains libres"
US9020168B2 (en) * 2011-08-30 2015-04-28 Nokia Corporation Apparatus and method for audio delivery with different sound conduction transducers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0683621A2 (fr) * 1994-05-18 1995-11-22 Nippon Telegraph And Telephone Corporation Emetteur-récepteur ayant un transducteur acoustique du type embout auriculaire
JPH08214391A (ja) * 1995-02-03 1996-08-20 Iwatsu Electric Co Ltd 骨導気導複合型イヤーマイクロホン装置
WO2000021194A1 (fr) * 1998-10-08 2000-04-13 Resound Corporation Systeme de transmission de la voix a capteurs jumeles
JP2000261534A (ja) * 1999-03-10 2000-09-22 Nippon Telegr & Teleph Corp <Ntt> 送受話器

Also Published As

Publication number Publication date
FR2974655B1 (fr) 2013-12-20
EP2518724B1 (fr) 2013-10-02
JP6017825B2 (ja) 2016-11-02
US20120278070A1 (en) 2012-11-01
CN102761643B (zh) 2017-04-12
US8751224B2 (en) 2014-06-10
CN102761643A (zh) 2012-10-31
JP2012231468A (ja) 2012-11-22
EP2518724A1 (fr) 2012-10-31

Similar Documents

Publication Publication Date Title
EP2518724B1 (fr) Combiné audio micro/casque comprenant des moyens de débruitage d&#39;un signal de parole proche, notamment pour un système de téléphonie &#34;mains libres&#34;
JP7134192B2 (ja) 複数のマイクロホンを使用する音声感知
EP3171612A1 (fr) Casque audio à contrôle actif de bruit, contrôle anti-occlusion et annulation de l&#39;atténuation passive, en fonction de la présence ou de l&#39;absence d&#39;une activité vocale de l&#39;utilisateur de casque
EP2597889B1 (fr) Casque audio a controle actif de bruit de type non-adaptatif
EP2530673B1 (fr) Equipement audio comprenant des moyens de débruitage d&#39;un signal de parole par filtrage à délai fractionnaire
EP2945399B1 (fr) Casque audio à contrôle actif de bruit anc avec prévention des effets d&#39;une saturation du signal microphonique feedback
JP4631939B2 (ja) ノイズ低減音声再生装置およびノイズ低減音声再生方法
US9094749B2 (en) Head-mounted sound capture device
EP2930942A1 (fr) Casque audio à contrôle actif de bruit anc avec réduction du souffle électrique
US20160142815A1 (en) Headset with end-firing microphone array and automatic calibration of end-firing array
EP0919096A1 (fr) Procede d&#39;annulation d&#39;echo acoustique multi-voies et annuleur d&#39;echo acoustique multi-voies
EP0818121B1 (fr) Systeme de prise de son et d&#39;ecoute pour equipement de tete en ambiance bruitee
WO2004004298A1 (fr) Dispositifs de traitement d&#39;echo pour systemes de communication de type monovoie ou multivoies
FR2857551A1 (fr) Dispositif pour capter ou reproduire des signaux audio
FR2764469A1 (fr) Procede et dispositif de traitement optimise d&#39;un signal perturbateur lors d&#39;une prise de son
WO2017207286A1 (fr) Combine audio micro/casque comprenant des moyens de detection d&#39;activite vocale multiples a classifieur supervise
US11533555B1 (en) Wearable audio device with enhanced voice pick-up
US20230328462A1 (en) Method, device, headphones and computer program for actively suppressing the occlusion effect during the playback of audio signals
JP7043344B2 (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
FR2566658A1 (fr) Prothese auditive multivoie
FR3136308A1 (fr) Casque audio à réducteur de bruit

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 6

TP Transmission of property

Owner name: PARROT DRONES, FR

Effective date: 20161010

PLFP Fee payment

Year of fee payment: 7