FR2695750A1 - Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif. - Google Patents

Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif. Download PDF

Info

Publication number
FR2695750A1
FR2695750A1 FR9211080A FR9211080A FR2695750A1 FR 2695750 A1 FR2695750 A1 FR 2695750A1 FR 9211080 A FR9211080 A FR 9211080A FR 9211080 A FR9211080 A FR 9211080A FR 2695750 A1 FR2695750 A1 FR 2695750A1
Authority
FR
France
Prior art keywords
event
speech
processing device
processing
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9211080A
Other languages
English (en)
Other versions
FR2695750B1 (fr
Inventor
Lefevre Frank
Guillarm Gilles
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to FR9211080A priority Critical patent/FR2695750B1/fr
Priority to AU54689/94A priority patent/AU5468994A/en
Priority to PCT/FR1993/001134 priority patent/WO1995014297A1/fr
Priority claimed from PCT/FR1993/001134 external-priority patent/WO1995014297A1/fr
Publication of FR2695750A1 publication Critical patent/FR2695750A1/fr
Application granted granted Critical
Publication of FR2695750B1 publication Critical patent/FR2695750B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B21/00Teaching, or communicating with, the blind, deaf or mute
    • G09B21/009Teaching or communicating with deaf persons
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B19/00Teaching not covered by other main groups of this subclass
    • G09B19/04Speaking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L2021/065Aids for the handicapped in understanding

Landscapes

  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Dispositif de traitement d'un signal sonore (10) comportant un détecteur d'évènements, apte à reconnaître les différents phénomènes sonores et comprenant un analyseur (12) de structure temporelle de chaque évènement pour distinguer les séquences où ledit évènement est continu de celles où il est du type à explosion, et un modificateur (21) d'évènements comprenant une unité de modification (21c) pour modifier ladite structure temporelle.

Description

DISPOSITIF DE TRAITEMENT D'UN SIGNAL SONORE ET
APPAREIL COMPORTANT UN TEL DISPOSITIF
La présente invention a pour objet un dispositif de traitement d'un signal sonore, destiné à être utilisé en perception de la parole dans le bruit, rééducation orthophonique, apprentissage de langues étrangères, systèmes radio, télécommunications, implants cochléaires, traitement du signal de parole des plongeurs, amplificateurs (musique, chant, sons de films...), ainsi que notamment pour le traitement de la surdité.
La surdité est habituellement considérée comme un affaiblissement de la sensation d'intensité. Cette altération est mesurée, chez le sujet sourd, par l'intensité minimale en décibels qui provoque, sur chaque oreille, une sensation auditive, et ceci pour différentes fréquences du champ auditif : les résultats sont représentés par l'audiogramme tonal. Si la courbe représentative de la perte en décibels en fonction des fréquences est, chez le sujet sain, une courbe plate, celle du sujet sourd peut montrer des points plus ou moins éloignés du zéro décibel en fonction de la fréquence : par exemple un sujet sourd pourra entendre relativement bien certaines fréquences et faiblement d'autres fréquences.
Les appareils auditifs actuellement commercialisés corrigent la perte de la sensation d'intensité en amplifiant le signal avec des courbes de réponses adaptées à la forme de l'audiogramme tonal.
La surdité, dès lors qu'elle est provoquée par des lésions du système auditif neurosensoriel, n'engendre pas seulement un affaiblissement de la sensation d'intensité; elle induit également deux types de déformations de la sensation auditive : des déformations d'ordre temporel et des déformations d'ordre fréquentiel, avec des interactions entre déformation temporelle, déformation fréquentielle et déformation de l'intensité.
Cela implique que, même si un sujet sourd entend la parole avec un appareil auditif traditionnel convenablement adapté, il continuera à entendre la parole d'une façon insuffisamment nette, en particulier en milieu bruyant, et ne comprendra pas correctement le message qui lui est adressé.
Pour que la parole soit correctement perçue, il est nécessaire que le système auditif humain soit en mesure d'en discerner suffisamment de composantes spectrales utiles. Ces composantes spectrales utiles de la parole se nomment indices pertinents. Les indices pertinents, selon leur valeur temporelle, fréquentielle et énergétique, sont caractéristiques de telle voyelle, de telle consonne ou de telle syllabe. Les voyelles, les consonnes, les syllabes sont prononcées les unes après les autres dans le temps. Un sujet sourd aura des difficultés à comprendre la parole parce qu'il n'est pas en mesure d'en discerner correctement suffisamment d'indices.
Le dispositif de traitement d'un signal sonore, selon la présente invention, est un système électronique de traitement du signal, en temps réel ou quasi-réel, permettant électroniquement de détecter les indices pertinents utiles à la reconnaissance de la parole et de les modifier, selon leur type et leur nature, en particulier par rapport au temps : rallongement ou raccourcissement de l'indice détecté, décalage de son apparition ou de sa disparition dans le temps.
Ainsi, grâce au dispositif de traitement de l'invention, la modification temporelle, notamment, de chaque indice pertinent sera réglée en fonction de la surdité pour obtenir une perception plus nette de chacun d'entre eux; en outre, il est possible, également, de procéder au raccourcissement de silences entre des mots ou des phrases pour compenser le rallongement opté pour certains indices pertinents.
Le dispositif de traitement d'un signal sonore, selon l'invention, comporte un détecteur d'évènements, apte à reconnaître les différents phénomènes sonores et comprenant un analyseur de structure temporelle de chaque évènement pour distinguer les séquences où ledit évènement est continu de celles où il est du type à explosion, et un modificateur d'évènements comprenant une unité de modification pour modifier ladite structure temporelle.
Avantageusement, les informations délivrées par ledit analyseur sont envoyées à un détecteur opérateur, qui détermine le type de l'évènement en cours.
De préférence, le type de ltévènement en cours est choisi dans le groupe formé par une voyelle, une consonne à formants, une consonne à friction, une consonne à explosion, une transition, et un silence de parole, durant lequel du bruit sera présent, ainsi que tout son porté par un signal.
Deux évènements consécutifs sont séparés l'un de l'autre par un segmenteur temporel ; le modificateur d'évènements comprend une unité de traitement spécifique prévue pour chacun des types d'évènement; un sélecteur d'évènements oriente l'évènement vers son unité de traitement spécifique; l'orientation de l'évènement par le sélecteur d'évènements est contrôlée par le détecteur opérateur; l'unité de traitement spécifique comprend six circuits de traitement spécialisés pour le traitement des voyelles, des consonnes à formants, à friction et à explosion, des transitions et des silences de parole ou du bruit.
De préférence, le détecteur d'évènements comprend également un analyseur de l'énergie du signal de chaque évènement, ledit modificateur d'évènements comprenant, en outre, une unité de modification pour modifier l'énergie d'au moins l'un des évènements.
Avantageusement, le détecteur d'évènements comprend également un analyseur de structure fréquentielle pour distinguer les séquences où ledit évènement a une structure harmonique, composée de formants, de celles où il a une structure aléatoire, ledit modificateur d'évènements comprenant, en outre, une unité de modification pour modifier la structure fréquentielle d'au moins l'un des évènements.
Bien entendu, la mesure des distorsions auditives temporelles et fréquentielles permet d'orienter les réglages du dispositif de traitement, et, ainsi, de l'adapter à une surdité donnée. Le dispositif de traitement, selon l'invention, effectue un traitement différent, d'une part selon le type de composante détectée dans la parole, pour permettre la meilleure perception possible de chaque indice pertinent par une oreille sourde donnée, les difficultés de perception étant fonction du type d'indice pertinent, ou, d'autre part, selon qu'il s'agisse d'absence de parole, donc présence de bruit.
On aura compris que, lorsque le dispositif de traitement d'un signal sonore, selon l'invention, comporte un détecteur d'évènements, apte à reconnaître les différents phénomènes sonores et comprenant un analyseur de l'énergie du signal de chaque événement, un analyseur de structure temporelle pour distinguer les séquences où ledit événement est continu de celles où il est du type à explosion, et un analyseur de structure fréquentielle pour distinguer les séquences où ledit évènement a une structure harmonique, composée de formants, de celles où il a une structure aléatoire, ledit dispositif de traitement comportant, en outre, un modificateur d'événements apte à modifier l'énergie, la structure temporelle et la structure fréquentielle d'au moins l'un des événements, la meilleure perception possible sera obtenue, pour une oreille sourde donnée.
Le détecteur d'événements intervient dans la distinction des séquences caractérisées par l'importance et la variabilité de leur énergie, ainsi que dans la distinction du bruit.
Ainsi, avantageusement, le modificateur d'événements comprend trois unités de modification, pour modifier l'énergie, la structure temporelle, et la structure fréquentielle d'au moins l'un des événements.
L'unité de modification de la structure temporelle est reliée à un incrémenteur temporel de décalage qui enregistre le temps d'allongement ou de raccourcissement résultant de la modification de la structure temporelle ; l'incrémenteur réduit également le silence supérieur à une valeur donnée de parole ou du bruit.
De préférence, les événements traités sont reclassés chronologiquement dans un additionneur de séquences temporelles dont la sortie constitue le signal de sortie du dispositif de traitement.
L'invention a également pour objet un appareil, comportant des moyens de réception d'un signal sonore, des moyens de traitement dudit signal et des moyens de restitution du signal sonore modifié, lesdits moyens de traitement dudit signal comprenant le dispositif de traitement selon l'invention.
Pour mieux faire comprendre l'objet de l'invention, on va en décrire, maintenant, à titre d'exemple purement illustratif et non limitatif, des schémas de réalisation représentés sur les dessins annexés.
Sur ces dessins
- la figure 1 représente le synoptique fonctionnel du dispositif de traitement selon l'invention;
- la figure 2 représente la partie du modificateur d'événements de la figure 1 qui traite une voyelle;
- la figure 3 représente la partie du modificateur d'événements de la figure 1 qui traite une consonne à formants
- la figure 4 représente la partie du modificateur d'événements de la figure 1 qui traite une consonne à explosion;
- la figure 5 représente la partie du modificateur d'événements de la figure 1 qui traite une consonne à friction;
- la figure 6 représente la partie du modificateur d'événements de la figure 1 qui traite des transitions
- la figure 7 représente la partie du modificateur d'événements de la figure 1 qui traite du silence de parole ou du bruit;
- la figure 8 montre une variante d'une partie du circuit de traitement;;
- la figure 9 est analogue à la figure 2 à laquelle on a rajouté la variante selon la figure 8.
La figure 1 représente le synoptique fonctionnel du dispositif de traitement selon la présente invention. Le dispositif de traitement comprend un détecteur d'événements : voyelle, consonne, transitions, silence de parole ou bruit, destiné à segmenter le signal sur l'axe du temps, pour qu'ensuite chaque type d'événement soit envoyé dans un circuit de traitement spécifique à l'événement dont chaque indice pertinent sera spécifiquement modifié sur les plans temps-fréquencesénergie pour être adapté à la perception du sujet sourd.
Le détecteur d'événements a pour rôle de reconnaître les différents événements qui surviennent dans le temps et que sont une voyelle, des transitions, une consonne à formants, une consonne à friction, une consonne à explosion, un silence de parole (ou du bruit) supérieur à 300 ms.
Le détecteur d'événements se compose d'un analyseur d'énergie 11 qui enregistre la courbe d'intensité et à quel moment celleci est à un niveau minimum, moyen, maximum, brutalement variable, ou à un niveau de silence de parole (ou présence de bruit), d'un analyseur de structure temporelle 12 qui enregistre quelles sont les séquences où l'événement est continu et celles où il est de type explosion, d'un analyseur de structure fréquentielle 13 qui enregistre les séquences où l'événement a une structure fréquentielle harmonique, composée de formants, et celles où l'événement a une structure fréquentielle de type aléatoire (bruit de friction, bruit d'explosion).
Le signal 10 est envoyé simultanément sur les trois analyseurs qui adressent leurs informations à un détecteur opérateur 14 qui en effectue la synthèse et détermine lequel des événements est en cours. Le type d'événement est sélectionné par les caractéristiques suivantes : une voyelle par une structure temporelle continue, une énergie maximum, une structure fréquentielle harmonique (formants) les transitions par leur structure temporelle continue, une énergie montante au début d'une transition, une énergie descendante à la fin d'une transition, leur structure fréquentielle harmonique (formants) une consonne à formants par une structure temporelle continue, une énergie moyenne, une structure fréquentielle harmonique (formants) une consonne à friction par une structure temporelle continue, une structure fréquentielle aléatoire, une énergie moyenne ; une consonne à explosion par une structure temporelle interrompue, une structure fréquentielle aléatoire (explosion), une énergie minimum.
Le signal est ensuite acheminé par une ligne 18 vers un segmenteur temporel d'entrée 15 dont le rôle est de sectionner l'événement en cours pour le séparer de l'événement suivant l'événement en cours est ensuite envoyé par la ligne 20 vers un sélecteur d'événements 16 sous contrôle 17 du détecteur opérateur 14.
Le rôle du sélecteur d'événements est d'orienter l'événement en cours selon son type vers son propre circuit de traitement spécifique.
Pour son traitement, le signal est envoyé, par la ligne 26, dans un modificateur d'événements 21. Le modificateur d'événements 21 comprend des unités de modification de l'énergie 21 a, de la structure fréquentielle 21 b et de la structure temporelle 21 c, chaque unité comprenant un ensemble de six circuits, chacun étant spécialisé dans le traitement d'un des types d'événements.
Un incrémenteur temporel de décalage 22, relié en 24 à l'unité de modification temporelle 21 c, enregistre le temps d'allongement ou de raccourcissement résultant du traitement temporel d'un événement ; cet incrémenteur réduit les silences de parole ou du bruit supérieurs à 300 ms dans le discours d'un locuteur pour annuler à chaque silence de parole le retard temporel induit par le traitement du signal.
La sortie 27 du modificateur d'événements 21 est reliée à un additionneur de séquences temporelles de sortie 23 qui remet bout à bout, dans le temps, les événements après qu'ils aient subi chacun un traitement spécifique du signal ; le signal est ensuite acheminé vers la sortie 25 du dispositif de traitement selon l'invention.
Nous allons décrire maintenant, plus en détails, le modificateur d'événements 21 et son fonctionnement.
La figure 2 traite le cas d'une voyelle ; lorsqu'un événement de type voyelle est détecté, le sélecteur d'événements 16 adresse ce signal, à l'entrée du dispositif traitement de voyelle du modificateur 21, dans quatre filtres passe-bande Fl, F2, F3, F4 ; le filtre F1 a le rôle d'isoler le fondamental laryngé; le réglage 212 permet, suivant la surdité, d'atténuer l'amplitude du fondamental laryngé de 0 à - 30 dB car celui-ci est un indice faiblement pertinent dans la perception des voyelles ; le filtre F2 a le rôle d'isoler fréquentiellement le premier renforcement spectral RF1 de la voyelle ; selon la voyelle, le RF1 a une valeur située entre 250 et 750 Hz, c'est pourquoi le filtre F2 est paramétré pour laisser passer cette bande de fréquences; le filtre F3 a le rôle d'isoler fréquentiellement le RF2 de la voyelle ; selon la voyelle, le RF2 a une valeur située entre 750 et 2400 Hz, d'où les valeurs fréquentielles du filtre F3 ; le filtre F4 a pour rôle de laisser passer les composantes spectrales de la voyelle supérieures à 2400 Hz; les valeurs fréquentielles des filtres F2, F3, F4, valables pour la langue française et de nombreuses langues étrangères, peuvent légèrement varier en fonction des autres langues ; le réglage 219 permet d'atténuer l'amplitude de ces formants de 0 à - 30 dB suivant la surdité, car ceuxci sont des indices faiblement pertinents dans la perception des voyelles.
Le RFI et le RF2 de la voyelle, passant respectivement dans les filtres F2 et F3, vont chacun subir un traitement de leur enveloppe fréquentielle pour être mieux perçus par le sourd ; ces deux formants constituent en effet les deux indices pertinents caractérisant une voyelle donnée. Le traitement fréquentiel du RF1 doit être réglé séparément de celui du RF2 puisque les problèmes de perception ne sont généralement pas les mêmes dans leur zone respective de fréquences; c'est pourquoi il y a deux circuits de traitement, l'un pour RF1 et l'autre pour RF2.
Chacun de ces deux circuits est composé d'un expandeur de dynamique 201, 203 réglable (202, 204) pour augmenter l'amplitude du formant et donner à l'oreille sourde plus de facilité à avoir une juste sensation de hauteur fréquentielle du formant en question.
A la sortie de l'expandeur de dynamique, le formant est envoyé dans un détecteur max 208, 209 qui détermine la fréquence la plus intense de l'enveloppe fréquentielle du formant. Ce détecteur est couplé à un ajouteur de fréquences inférieures 210, 215 à la fréquence la plus intense et à un ajouteur 211, 216 de fréquences supérieures à la fréquence la plus intense ; le rôle de l'ajouteur 210, 215 est d'étirer l'enveloppe fréquentielle du formant vers les basses fréquences, celui de l'ajouteur 211, 216 est d'étirer l'enveloppe fréquentielle du formant vers les hautes fréquences.Chaque ajouteur est doté d'un réglage 213, 214, 217, 218 déterminant la pente de l'enveloppe à partir du maximum détecté, laquelle est réglable par une atténuation et permet de favoriser la stimulation de zones de fréquences moins perturbées que celle du formant chez un sourd donné, et donc d'en favoriser la perception.
L'ensemble constitué par le détecteur max 208, 209, les ajouteurs de fréquences inférieures 210, 215 et supérieures 211, 216 dotés des réglages 213, 214, 217, 218 constitue, comme on l'aura compris, un transformateur d'enveloppe, ici l'enveloppe du signal sortant de l'expandeur 201, 203.
L'ensemble des signaux sortant des filtres, des expandeurs de dynamique via les lignes 205, 206 et des ajouteurs de fréquences sont additionnés par un additionneur de fréquences 220 pour reconstituer un spectre entier et déformé de la voyelle. Le signal 222 est ensuite envoyé à un réducteur de temps 221 réglable par 224, qui va réduire la durée effective de la voyelle de 0 à 40 % : en effet, le fait d'obtenir une voyelle plus courte permettra d'atténuer le phénomène de masquage temporel de cette voyelle sur les événements suivants dans le temps.
Les valeurs de réduction de la durée de la voyelle permettent de ne pas altérer la perception de celle-ci, la durée résultante étant suffisante pour une correcte perception.
La figure 3 traite le cas d'une consonne à formants lorsqu'un événement de type consonne à formants est détecté, le sélecteur d'événements 16 adresse ce signal à l'entrée du dispositif traitement de consonnes à formants du modificateur 21 ; le traitement est identique à celui des voyelles avec cependant les différences suivantes liées à un problème de perception propre aux consonnes à formants le choix de l'amplitude de chaque indice pertinent composant la consonne à formants et le choix de l'enveloppe fréquentielle résultante de chaque formant sont généralement différents de ceux des voyelles.
Les éléments de la figure 3 jouant le même rôle que ceux de la figure 2 ont été repérés par un numéro en 300 au lieu d'un numéro en 200.
Un opérateur de prolongation 322 permettra non pas de raccourcir mais de rallonger la durée de la consonne à formant pour en faciliter la perception puisque ce type de consonne est fréquemment mal perçu par l'oreille sourde la durée du rallongement est sélectionnée par un réglage 324 ; elle peut être augmentée de 0 à 40 % suivant la surdité.
La figure 4 traite le cas d'une consonne à explosion; lorsqu'un événement de type consonne à explosion est détecté, le sélecteur d'événement 16 adresse ce signal à l'entrée du circuit traitement consonne à explosion du modificateur 21 ; l'événement est envoyé dans deux filtres passe-bande : le filtre CF1 destiné à laisser passer l'éventuel fondamental laryngé de la consonne,le filtre CF5 passe-haut pour les fréquences supérieures à 400 Hz destiné à laisser passer l'explosion de la consonne.
L'amplitude de l'éventuel fondamental est choisie par le réglage 412 de 0 à + 30 dB pour permettre une perception plus prononcée de celui-ci. Il est ensuite adressé à un opérateur de prolongation 421 qui augmente la durée de la consonne en utilisant un réglage 424 de 0 à 40 %.
Après être passé par le filtre CF5, l'enveloppe fréquentielle de l'explosion est traitée de la même façon que le formant d'une voyelle, à ceci près que les réglages 402, 413, 414 seront différents pour adapter l'enveloppe spectrale de l'explosion à la perception du sujet sourd. Le fait d'étirer l'enveloppe spectrale vers les aigus diminuera la trainée temporelle de l'explosion tandis que l'étirement de l'enveloppe spectrale vers les graves aura pour effet d'augmenter la tramée temporelle de l'explosion.
La nouvelle forme de l'enveloppe fréquentielle de l'explosion, après avoir été reconstituée et ajoutée en 432 à un éventuel fondamental par un additionneur de fréquences 420, est envoyée en 422 dans un retardateur 425 contrôlé en 434 par l'opérateur de prolongation 421 et retardant la production de l'explosion.
La figure 5 traite le cas d'une consonne à friction lorsqu'une consonne à friction est détectée, elle est adressée par le sélecteur d'événements 16 au circuit traitement consonne à friction du modificateur 21 ; comme pour la consonne à explosion, un éventuel fondamental laryngé est isolé par un filtre CF1, dont l'amplitude pourra être augmentée par un réglage 412 de 0 à 30 dB. Le bruit de friction passe dans le filtre CF5; son enveloppe fréquentielle est traitée comme le formant d'une voyelle, à ceci près qu'il s'agit de bruit aléatoire et que les réglages 402, 413, 414 sont choisis pour adapter l'enveloppe fréquentielle de la friction au sujet sourd pour qu'il puisse mieux la percevoir.
Après avoir été reconstitué par un additionneur de fréquences 420, le signal est envoyé en 436 dans un opérateur de prolongation 421 ; l'augmentation de la durée de l'événement est sélectionnée de 0 à 40 % par le réglage 424 en fonction de la surdité.
La figure 6 traite le cas des transitions ; une fois détecté, l'événement de type transitions est envoyé par le sélecteur d'événements dans le circuit traitement transitions du modificateur 21 une première modification temporelle du signal est réalisée par un opérateur d'insertion de phases 500 ; celui-ci ajoute une ou plusieurs phases supplémentaires (réglage 531 suivant la surdité) entre deux phases du signal d'entrée; la ou les phases ajoutées ont un spectre correspondant à la moyenne des spectres des phases précédente et suivante. Cette opération a pour effet de rallonger chaque transition par rapport au temps et d'adoucir la pente de chacune d'entre elles. Chaque transition sera ainsi plus facilement perçue par l'oreille sourde.
Le signal est ensuite envoyé dans un dispositif qui permet un traitement de l'enveloppe fréquentielle de la transition du premier formant TF2 et celle de la transition du deuxième formant TF3 ; à chaque instant, ce traitement de l'enveloppe fréquentielle est identique à celui du Rlil et du RF2 des voyelles, avec cependant une différence au niveau des réglages 502 , 504, 504, 513, 514, 517, 518, ainsi que des réglages 512 et 519, ceci afin d'adapter spécifiquement la forme et l'énergie de chaque transition pour qu'elle soit mieux perçue par l'oreille sourde.
Chaque transition est envoyée dans un calculateur de pente et de prolongation 525, 526, 527 qui calcule la variation fréquentielle dans le temps de la transition et détermine quel prolongement il faut lui ajouter pour rendre plus marqué son caractère de variation fréquentielle.
Un opérateur de prolongement 521 ajoute à chaque transition le segment temporel déterminé par le calculateur de pente et de prolongation. La durée du prolongement à ajouter aux transitions est choisie à l'aide du réglage 524.
La figure 7 traite du cas de l'absence de parole, donc de la présence des bruits pendant cette durée ; lorsqu'un silence de parole supérieur à 300 ms est détecté, le sélecteur d'événements adresse ce signal à un atténuateur réglable 223 pour réduire l'intensité du bruit, puis à un réducteur temporel 221 contrôlé par l'incrémenteur temporel de décalage 22. En effet, ce dernier a enregistré le retard cumulé au fil des événements par le traitement du signal et détermine le retard à rattraper par rapport au temps strictement réel de prononciation des mots par un orateur.
Lorsque le réducteur temporel soustrait à la durée du silence de parole le retard cumulé par les traitements successifs, l'incrémenteur temporel de décalage est remis à zéro si, bien évidemment, la durée du retard est inférieure à celle de l'absence de parole.
En se reportant à la figure 8, pour mieux exploiter les zones fréquentielles les moins perturbées, par exemple pour une oreille sourde donnée, il est avantageux d'ajouter, dans les circuits de traitement, à la sortie 103 de l'expandeur de dynamique 102, un détecteur d'enveloppe fréquentielle 104 ; les fréquences de l'enveloppe sont ensuite divisées en 107 par un nombre entier n, par exemple 2, et multipliées en 108 par un nombre entier n', par exemple 2 également, puis envoyées sur 1' additionneur de fréquences 114 ; des réglages 109 et 110 permettent l'adaptation à la surdité. L'ensemble de cette disposition particulière est notée 100 sur la figure 8.
En appliquant, par exemple, cette disposition au traitement des voyelles, le synoptique correspondant est montré figure 9, qui est analogue à la figure 2, mais sur laquelle ont été ajoutées deux dispositions 100 ; on notera que, bien entendu, la disposition 100 appliquée, dans cet exemple, au traitement des voyelles, peut également, avantageusement, être appliquée aux autres traitements tels que décrits ci-dessus.
Le transformateur d'enveloppe, tel que défini à propos de la figure 2, et schématisé, sur cette figure 9, par le trait mixte désigné par le repère 600, peut, en variante, être utilisé pour transformer toute enveloppe du signal à quelque niveau de traitement que ce soit, notamment après division en 107 et/ou multiplication en 108 selon la disposition notée 100 sur la figure 8 ; une telle variante est schématisée sur cette figure 8 par les traits mixtes notés 600 ; cette disposition constitue un moyen supplémentaire d'adaptation de l'enveloppe du signal de sortie aux capacités auditives du sujet traité.
Le dispositif de traitement selon l'invention a été décrit en application à la correction de la surdité ; mais, bien entendu, il n'est pas limité à cette application; il peut également être utilisé en perception de la parole dans le bruit, rééducation orthophonique, apprentissage de langues étrangères, systèmes radio, télécommunications, implants cochléaires, traitement du signal de parole des plongeurs, amplificateurs (musique, chant, sons de films...).

Claims (15)

REVENDICATIONS
1. Dispositif de traitement d'un signal sonore (10) comportant un détecteur d'événements, apte à reconnaître les différents phénomènes sonores et comprenant un analyseur (12) de structure temporelle de chaque événement pour distinguer les séquences où ledit événement est continu de celles où il est du type à explosion, et un modificateur (21) d'événements comprenant une unité de modification (21c) pour modifier ladite structure temporelle.
2. Dispositif de traitement selon la revendication 1 caractérisé par le fait que les informations délivrées par ledit analyseur (12) sont envoyées à un détecteur opérateur (14) qui détermine le type de l'événement en cours.
3. Dispositif de traitement selon la revendication 2, caractérisé par le fait que le type de l'événement en cours est choisi dans le groupe formé par une voyelle, une consonne à formants, une consonne à friction, une consonne à explosion, une transition, un silence de parole, durant lequel du bruit sera présent, et tout son porté par un signal.
4. Dispositif de traitement selon l'une des revendications 2 ou 3, caractérisé par le fait que deux événements consécutifs sont séparés l'un de l'autre par un segmenteur temporel (15).
5. Dispositif de traitement selon l'une des revendications 2 à4, caractérisé par le fait que le modificateur d'événements (21) comprend une unité de traitement spécifique prévue pour chacun des types d'événement.
6. Dispositif de traitement selon la revendication 5, caractérisé par le fait qu'un sélecteur (16) d'événements oriente l'événement vers son unité de traitement spécifique.
7. Dispositif de traitement selon les revendications 2 et 6, caractérisé par le fait que l'orientation de l'événement par le sélecteur d'événements est contrôlée (17) par le détecteur opérateur (14).
8. Dispositif de traitement selon les revendications 5 et 7, caractérisé par le fait que l'unité de traitement spécifique comprend six circuits de traitement spécialisés pour le traitement des voyelles, des consonnes à formants, à friction et à explosion, des transitions et des silences de parole.
9. Dispositif de traitement selon l'une des revendications 1 à 8, caractérisé par le fait que le détecteur d'évènements comprend également un analyseur de l'énergie (11) du signal de chaque événement, ledit modificateur (21) d'événements comprenant, en outre, une unité de modification (21a) pour modifier l'énergie d'au moins l'un des événements.
10. Dispositif de traitement selon l'une des revendications 1 à 8, caractérisé par le fait que le détecteur d'événements comprend également un analyseur de structure fréquentielle (13) pour distinguer les séquences où ledit événement a une structure harmonique, composée de formants, de celles où il a une structure aléatoire, ledit modificateur (21) d'événements comprenant, en outre, une unité de modification (21b) pour modifier la structure fréquentielle d'au moins l'un des événements.
11. Dispositif de traitement selon les revendications 1, 9 et 10, caractérisé par le fait que le modificateur d'événements (21) comprend trois unités de modification (21a, 21b, 21c), pour modifier l'énergie, la structure temporelle, et la structure fréquentielle d'au moins l'un des événements.
12. Dispositif de traitement selon la revendication 1, caractérisé par le fait que l'unité de modification (21c) de la structure temporelle est reliée à un incrémenteur (22) temporel de décalage qui enregistre le temps d'allongement ou de raccourcissement résultant de la modification de la structure temporelle.
13. Dispositif de traitement selon la revendication 12, caractérisé par le fait que l'incrémenteur (22) réduit le silence de parole supérieur à une valeur donnée.
14. Dispositif de traitement selon l'une des revendications 1 à 13, caractérisé par le fait que les événements traités sont reclassés chronologiquement dans un additionneur (23) de séquences temporelles dont la sortie (25) constitue le signal de sortie du dispositif de traitement.
15. Appareil comportant des moyens de réception d'un signal sonore, des moyens de traitement dudit signal et des moyens de restitution du signal sonore modifié, caractérisé par le fait que les moyens de traitement dudit signal comprennent le dispositif de traitement selon les revendications 1 à 14 précédentes.
FR9211080A 1992-09-17 1992-09-17 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif. Expired - Fee Related FR2695750B1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR9211080A FR2695750B1 (fr) 1992-09-17 1992-09-17 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.
AU54689/94A AU5468994A (en) 1992-09-17 1993-11-18 Device for processing a sound signal and apparatus comprising such a device
PCT/FR1993/001134 WO1995014297A1 (fr) 1992-09-17 1993-11-18 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9211080A FR2695750B1 (fr) 1992-09-17 1992-09-17 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.
PCT/FR1993/001134 WO1995014297A1 (fr) 1992-09-17 1993-11-18 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif

Publications (2)

Publication Number Publication Date
FR2695750A1 true FR2695750A1 (fr) 1994-03-18
FR2695750B1 FR2695750B1 (fr) 1994-11-10

Family

ID=9433602

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9211080A Expired - Fee Related FR2695750B1 (fr) 1992-09-17 1992-09-17 Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif.

Country Status (2)

Country Link
AU (1) AU5468994A (fr)
FR (1) FR2695750B1 (fr)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995014297A1 (fr) * 1992-09-17 1995-05-26 Frank Lefevre Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif
EP0727768A1 (fr) * 1995-02-17 1996-08-21 Sony Corporation Procédé et appareil pour réduire le bruit dans des signaux vocaux
EP0797822A1 (fr) * 1994-12-08 1997-10-01 The Regents Of The University Of California Procede et dispositif d'amelioration de la reconnaissance de la parole chez des individus atteints de troubles de la parole
WO1999034345A1 (fr) * 1997-12-30 1999-07-08 Cohen Gal A Procede et appareil d'entrainement des capacites auditives
US6019607A (en) * 1997-12-17 2000-02-01 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI systems
WO2000021056A1 (fr) * 1998-10-07 2000-04-13 Scientific Learning Corporation Test universel pour sujets handicapes en vue de l'apprentissage de langues
US6159014A (en) * 1997-12-17 2000-12-12 Scientific Learning Corp. Method and apparatus for training of cognitive and memory systems in humans
US8210851B2 (en) 2004-01-13 2012-07-03 Posit Science Corporation Method for modulating listener attention toward synthetic formant transition cues in speech stimuli for training
US9302179B1 (en) 2013-03-07 2016-04-05 Posit Science Corporation Neuroplasticity games for addiction

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2087032A5 (fr) * 1970-04-17 1971-12-31 Etd Telecommi Centre Nat
EP0076687A1 (fr) * 1981-10-05 1983-04-13 Signatron, Inc. Procédé et dispositif pour améliorer l'intelligibilité de la parole
JPS5982608A (ja) * 1982-11-01 1984-05-12 Nippon Telegr & Teleph Corp <Ntt> 音声の再生速度制御方式
US4468804A (en) * 1982-02-26 1984-08-28 Signatron, Inc. Speech enhancement techniques
WO1991006944A1 (fr) * 1989-10-25 1991-05-16 Motorola, Inc. Technique de compression de forme d'onde vocale

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2087032A5 (fr) * 1970-04-17 1971-12-31 Etd Telecommi Centre Nat
EP0076687A1 (fr) * 1981-10-05 1983-04-13 Signatron, Inc. Procédé et dispositif pour améliorer l'intelligibilité de la parole
US4468804A (en) * 1982-02-26 1984-08-28 Signatron, Inc. Speech enhancement techniques
JPS5982608A (ja) * 1982-11-01 1984-05-12 Nippon Telegr & Teleph Corp <Ntt> 音声の再生速度制御方式
WO1991006944A1 (fr) * 1989-10-25 1991-05-16 Motorola, Inc. Technique de compression de forme d'onde vocale

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
EUROSPEECH 89 (EUROPEAN CONFERENCE ON SPEECH COMMUNICATION AND TECHNOLOGY, Paris, 26-29 septembre 1989, vol. 1, pages 596-599), CEP Consultants, Edinburgh, GB; S.T. JOVICIC et al.: "An algorithm for time-scaling of speech signal" *
ICASSP 88 (1988 INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, New York, 11-14 avril 1988), vol. 1, pages 343-346, IEEE, New York, US; V. GONCHAROFF et al.: "Adaptive speech modification by spectral warping" *
ICC'84: "LINKS FOR THE FUTURE"/IEEE INTERNATIONAL CONFERENCE ON COMMUNICATIONS, Amsterdam, 14-17 mai 1984, vol. 3, pages 1504-1507, Elsevier Science Publishers B.V., Amsterdam, NL; E. BRAZDA: "High quality bandwidth reduction of speech signals" *
IECON'87 (1987 INTERNATIONAL CONFERENCE ON INDUSTRIAL ELECTRONICS, CONTROL, AND INSTRUMENTATION, Cambridge, 3-6 novembre 1987), vol. 2, pages 997-1002, IEEE, New York, US; R.J. CONWAY et al.: "Adaptive processing with feature extraction of enhance the intelligibility of noise-corrupted speech" *
IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, vol. ASSP-24, no. 6, décembre 1976, pages 473-480, New York, US; S.G. KNORR: "A hearing aid for subjects with extreme high-frequency losses" *
PATENT ABSTRACTS OF JAPAN, vol. 8, no. 196 (P-299)(1633), 8 septembre 1984; & JP-A-59 82 608 (NIPPON DENSHIN DENWA KOSHA) 12-05-1984 *
THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN, vol. 33, no. 8, août 1977, pages 405-411, Tokyo, JP; H. SUZUKI et al.: "Extraction of speech in noise by digital filtering" *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995014297A1 (fr) * 1992-09-17 1995-05-26 Frank Lefevre Dispositif de traitement d'un signal sonore et appareil comportant un tel dispositif
US6123548A (en) * 1994-12-08 2000-09-26 The Regents Of The University Of California Method and device for enhancing the recognition of speech among speech-impaired individuals
EP0797822A1 (fr) * 1994-12-08 1997-10-01 The Regents Of The University Of California Procede et dispositif d'amelioration de la reconnaissance de la parole chez des individus atteints de troubles de la parole
EP0797822A4 (fr) * 1994-12-08 1998-12-30 Univ California Procede et dispositif d'amelioration de la reconnaissance de la parole chez des individus atteints de troubles de la parole
US6302697B1 (en) 1994-12-08 2001-10-16 Paula Anne Tallal Method and device for enhancing the recognition of speech among speech-impaired individuals
EP0727768A1 (fr) * 1995-02-17 1996-08-21 Sony Corporation Procédé et appareil pour réduire le bruit dans des signaux vocaux
US5752226A (en) * 1995-02-17 1998-05-12 Sony Corporation Method and apparatus for reducing noise in speech signal
AU695585B2 (en) * 1995-02-17 1998-08-20 Sony Corporation Method and apparatus for reducing noise in speech signal
CN1083183C (zh) * 1995-02-17 2002-04-17 索尼公司 用来降低语音信号中噪声的方法和装置
US6159014A (en) * 1997-12-17 2000-12-12 Scientific Learning Corp. Method and apparatus for training of cognitive and memory systems in humans
US6019607A (en) * 1997-12-17 2000-02-01 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI systems
WO1999034345A1 (fr) * 1997-12-30 1999-07-08 Cohen Gal A Procede et appareil d'entrainement des capacites auditives
WO2000021056A1 (fr) * 1998-10-07 2000-04-13 Scientific Learning Corporation Test universel pour sujets handicapes en vue de l'apprentissage de langues
US8210851B2 (en) 2004-01-13 2012-07-03 Posit Science Corporation Method for modulating listener attention toward synthetic formant transition cues in speech stimuli for training
US9302179B1 (en) 2013-03-07 2016-04-05 Posit Science Corporation Neuroplasticity games for addiction
US9308445B1 (en) 2013-03-07 2016-04-12 Posit Science Corporation Neuroplasticity games
US9308446B1 (en) 2013-03-07 2016-04-12 Posit Science Corporation Neuroplasticity games for social cognition disorders
US9601026B1 (en) 2013-03-07 2017-03-21 Posit Science Corporation Neuroplasticity games for depression
US9824602B2 (en) 2013-03-07 2017-11-21 Posit Science Corporation Neuroplasticity games for addiction
US9886866B2 (en) 2013-03-07 2018-02-06 Posit Science Corporation Neuroplasticity games for social cognition disorders
US9911348B2 (en) 2013-03-07 2018-03-06 Posit Science Corporation Neuroplasticity games
US10002544B2 (en) 2013-03-07 2018-06-19 Posit Science Corporation Neuroplasticity games for depression

Also Published As

Publication number Publication date
FR2695750B1 (fr) 1994-11-10
AU5468994A (en) 1995-06-06

Similar Documents

Publication Publication Date Title
Patterson et al. Complex sounds and auditory images
Ghitza On the upper cutoff frequency of the auditory critical-band envelope detectors in the context of speech perception
Anzalone et al. Determination of the potential benefit of time-frequency gain manipulation
US5274711A (en) Apparatus and method for modifying a speech waveform to compensate for recruitment of loudness
US20030216907A1 (en) Enhancing the aural perception of speech
US20090262969A1 (en) Hearing assistance apparatus
EP2113913B1 (fr) Procédé et système de reconstitution de basses fréquences dans un signal audio
FR2475390A1 (fr) Appareil pour conditionnner l&#39;ouie d&#39;un patient
EP0867856A1 (fr) &#34;Méthode et dispositif de detection d&#39;activité vocale&#34;
EP0994464A1 (fr) Procédé destiné à génére un signal large bande a partir d&#39;un signal en bande étroite, appareil pour realiser un tel procédé et equipement téléphonique comportant un tel appareil
EP1352543B1 (fr) Generateur de signaux auditifs destines a des personnes atteintes d&#39;acouphenes
WO2018146305A1 (fr) Methode et appareil de modification dynamique du timbre de la voix par decalage en fréquence des formants d&#39;une enveloppe spectrale
FR2695750A1 (fr) Dispositif de traitement d&#39;un signal sonore et appareil comportant un tel dispositif.
WO2004015652A1 (fr) Procede de calibrage d&#39;audio-intonation
CN111107478A (zh) 一种声音增强方法及声音增强***
EP0365378B1 (fr) Appareil électronique de traitement d&#39;un signal sonore
FR2645999A1 (fr) Procede de reconnaissance de la parole
US7672842B2 (en) Method and system for FFT-based companding for automatic speech recognition
JPH0675595A (ja) 音声加工装置と補聴器
WO1995014297A1 (fr) Dispositif de traitement d&#39;un signal sonore et appareil comportant un tel dispositif
JPH06289897A (ja) 音声信号処理装置
Yasu et al. Frequency compression of critical band for digital hearing aids
FR2647249A1 (fr) Procede de reconnaissance de la parole
JP3303446B2 (ja) 音声信号処理装置
Freyman et al. Consonant confusions in amplitude-expanded speech

Legal Events

Date Code Title Description
AU Other action affecting the ownership or exploitation of an industrial property right
ST Notification of lapse