FR3016709A1

FR3016709A1 - Procede et dispositif de traitement de la parole d'un utilisateur

Info

Publication number: FR3016709A1
Application number: FR1450585A
Authority: FR
Inventors: Benoit Desnoues; Fazel Sara Sadvandi
Original assignee: Peugeot Citroen Automobiles SA
Current assignee: PSA Automobiles SA
Priority date: 2014-01-23
Filing date: 2014-01-23
Publication date: 2015-07-24

Abstract

L'invention concerne un procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone, de la parole de l'utilisateur, - Application (22) d'une fonction de reconnaissance vocale sur la parole reçue, - Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, - Réception (25) par l'intermédiaire du microphone d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée.

Description

16 709 1 PROCEDE ET DISPOSITIF DE TRAITEMENT DE LA PAROLE D'UN UTILISATEUR L'invention concerne les systèmes de reconnaissance vocale et, plus particulièrement, ceux permettant une correction d'erreur de reconnaissance. Les systèmes de reconnaissance vocale selon l'art connu comprennent généralement un microphone pour enregistrer la parole d'un utilisateur. La parole est numérisée puis analysée de sorte à identifier une succession de mots. Malgré les progrès effectués ces dernières années, ces systèmes commettent parfois des erreurs de reconnaissance, en restituant des mots différents de ceux prononcés par l'utilisateur. Ceci est particulièrement vrai dans un environnement bruyant tel que peut l'être un habitacle de véhicule. Une étape de correction est alors nécessaire. On connait, par exemple, par le document US 5,386,494, un système de reconnaissance de commande vocale, présentant une étape de correction. A chaque fois que le système effectue une reconnaissance, celui-ci affiche la commande reconnue ainsi qu'une liste de commandes alternatives. Lorsque le système commet une erreur de reconnaissance, l'utilisateur sélectionne, à l'aide d'une souris, une des commandes proposées et affichées par le système. Ce système a notamment pour inconvénient de ne fonctionner qu'avec un nombre limité de commandes. En outre, la lecture et la sélection de commandes alternatives proposées par le système nécessite une attention soutenue de la part de l'utilisateur, ce qui est incompatible avec la conduite d'un véhicule.

On connait aussi par le document EP 2 278 581 un système de reconnaissance vocale présentant une étape de correction. Le système détermine pour chaque mot identifié une « meilleure liste » (best list) de N mots. Pour corriger une erreur de reconnaissance, l'utilisateur peut remplacer un mot par un mot de la meilleure liste qui lui est associé. Comme la solution précédente, une correction nécessite une attention soutenue de la part de l'utilisateur, ce qui est incompatible avec la conduite d'un véhicule. L'invention a donc pour but de proposer un procédé et un dispositif de 3016 709 2 reconnaissance vocale permettant une correction efficace d'une erreur de reconnaissance vocale, cette correction ne nécessitant pas une attention soutenue de la part de l'utilisateur et étant compatible avec la conduite d'un véhicule notamment de type automobile. 5 Elle propose plus précisément à cet effet un procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone (11), de la parole de l'utilisateur, Application (22) d'une fonction de reconnaissance vocale sur la 10 parole reçue, Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, 15 - Réception (25) par l'intermédiaire du microphone (11) d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée. 20 Le procédé selon l'invention permet à un utilisateur de corriger un message dicté sans accaparer son attention et sans nécessiter une manipulation. Les corrections à apporter à une séquence de mots sont indiquées directement au dispositif en dictant une correction associée à un marqueur. La correction s'effectue ainsi entièrement par dictée vocale ce qui 25 libère l'attention visuelle de l'utilisateur. En outre l'utilisation d'un marqueur permet de ne pas répéter un mot mal orthographié en le désignant par son marqueur. Ce procédé est compatible avec la conduite d'un véhicule car il requiert beaucoup moins d'attention visuelle qu'une correction reposant 30 uniquement sur une interaction avec un afficheur.

Selon une caractéristique de l'invention, la commande de correction est choisie parmi, la suppression du au moins un mot sélectionné, le remplacement du au moins un mot sélectionné, l'ajout d'au moins un mot après ou avant le mot sélectionné.

Avantageusement, le marqueur comprend un symbole alphanumérique. L'utilisation d'un symbole alphanumérique, en particulier un chiffre, facilite la reconnaissance vocale du marqueur. Avantageusement, le marqueur comprend une couleur. L'utilisation d'une couleur facilite la reconnaissance du marqueur par l'utilisateur.

Avantageusement, chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot. La bordure permet d'identifier facilement les mots les uns des autres et réduits l'attention nécessitée par l'opération de correction. Avantageusement, le procédé de traitement de la parole selon l'invention comprend en outre une étape de demande de correction désignant un marqueur et, en réponse à la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de corrections. Cette étape supplémentaire permet à un utilisateur ne connaissant pas les types de corrections disponibles, de se les remémorer.

Avantageusement, le procédé de traitement de la parole selon l'invention comprend en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection de façon à signaler à l'utilisateur que ladite zone a été sélectionnée. L'utilisateur si il est interrompu au cours d'une correction, peut facilement retrouver le mot qu'il a sélectionné pour la correction. L'invention concerne aussi un dispositif de traitement de la parole d'un utilisateur comportant un microphone pour enregistrer la parole d'un utilisateur, une unité de traitement apte à commander une fonction de reconnaissance vocale sur la parole enregistré et un moyen d'affichage apte à afficher une séquence de mots reconnus par la fonction de reconnaissance, caractérisé en ce que l'unité de traitement est adaptée pour mettre oeuvre le procédé selon l'invention. L'invention concerne aussi un véhicule comportant un dispositif de traitement de la parole selon l'invention. D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés, sur lesquels: - la figure 1 illustre un diagramme montrant une schématique d'un dispositif selon l'invention ; - la figure 2 illustre un diagramme présentant le procédé selon l'invention. - les figures 3a et 3b montrent un premier exemple d'affichages générés avec le dispositif selon l'invention. Les dessins annexés pourront non seulement servir à compléter l'invention, mais aussi contribuer à sa définition, le cas échéant. En référence à la figure 1, le dispositif 10 de traitement de la parole d'un utilisateur comporte : un microphone 11, une unité de traitement 12, un moyen d'affichage 13. Le microphone 11 permet d'enregistrer la parole d'un utilisateur situé dans l'habitacle du véhicule. L'unité de traitement 12 est un calculateur, comprenant une mémoire et un processeur, apte à exécuter ou à commander l'exécution d'une fonction de reconnaissance vocale. L'unité de traitement 12 est reliée au microphone 11 et est apte à commander le moyen d'affichage 13. La fonction de reconnaissance vocale est une fonction connue de l'état de la technique qui permet de reconnaitre des mots à partir d'une parole prononcé par un utilisateur et préalablement numérisée. Le moyen d'affichage 13, par exemple un écran LCD, permet notamment d'afficher des mots reconnus par la fonction de reconnaissance vocale. L'invention concerne aussi un procédé de traitement de la parole d'un utilisateur. En référence à la figure 2, le procédé comporte les étapes suivantes. Le procédé comporte, tout d'abord, une étape d'acquisition 21, par l'intermédiaire du microphone 11, de la parole de l'utilisateur. Le procédé comporte aussi l'application 22 d'une fonction de reconnaissance vocale sur la parole reçue. L'unité de traitement exécute ou commande l'exécution de la fonction de reconnaissance vocale sur la parole de l'utilisateur enregistrée, par le microphone 11, et numérisée. La reconnaissance vocale peut être effectuée sur un calculateur dans le véhicule ou à distance sur un calculateur débarquée, la parole numérisée et le résultat la de la reconnaissance étant, dans ce second cas, échangés par le biais d'une communication sans fils. Le procédé comporte aussi l'affichage 23 d'une séquence de mots reconnus sur le moyen d'affichage. Les mots reconnus par la fonction de reconnaissance sont affichées sur l'écran de sorte que l'utilisateur peut vérifier 15 s'il y a une erreur de reconnaissance. Avantageusement, le procédé comporte aussi une étape de synthèse vocale de la séquence de mots reconnus, permettant à l'utilisateur d'écouter cette séquence et de vérifier s'il y a une erreur de reconnaissance sans regarder l'écran. Cependant, il faut noter que la synthèse vocale de la 20 séquence de mots reconnus ne permet pas forcément de détecter une erreur, car on peut avoir des homophones comme dans l'adresse rue des eaux/ rue des hauts. Le procédé comporte aussi la création 24 et l'affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun 25 des mots reconnus. De façon avantageuse, l'unité de traitement crée autant de marqueurs de sélection que de mots reconnus. De cette façon, l'utilisateur peut sélectionner facilement les mots erronés, autrement dit, les mots mal reconnus par la fonction de reconnaissance. Les marqueurs comprennent au 30 moins un symbole alphanumérique et/ou une couleur. Par exemple, les marqueurs peuvent être des chiffres (1, 2, 3, ...) ou des combinaisons de lettres et de chiffres (A1, B2, ...) qui permettent d'éviter une ambiguïté avec le numéro d'une adresse.

Selon un mode de réalisation avantageux, chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot. De cette façon, l'utilisateur identifie facilement chacun des mots s'il souhaite effectuer une correction.

Le procédé comporte aussi la réception 25 par l'intermédiaire du microphone 11 d'une commande de correction désignant un marqueur affiché. Selon une caractéristique de l'invention, la commande de correction est choisie parmi, la suppression d'un ou des mot(s) sélectionné(s), le remplacement d'un ou des mot(s) sélectionné(s), l'ajout d'un ou de plusieurs mot(s) après ou avant un mot sélectionné. Le procédé comporte aussi la modification 26 de la séquence de mots reconnus en fonction de la commande de correction. Enfin, le procédé comporte l'affichage 27 de la séquence de mots reconnus corrigée. De cette façon, l'utilisateur peut s'assurer que les mots à nouveau prononcés ont été correctement reconnus. Dans le cas contraire, l'utilisateur peut à nouveau sélectionner les mots erronés. Avantageusement, le procédé comporte aussi une étape de synthèse vocale de la séquence de mots corrigés, permettant à l'utilisateur d'écouter cette séquence et de vérifier s'il y a une erreur de correction sans regarder l'écran. Selon un mode de réalisation, le procédé de traitement de la parole selon l'invention comprend outre une étape de demande de correction désignant un marqueur et, en réponse la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de corrections. Avantageusement, le procédé comporte en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection de façon à signaler à l'utilisateur que ladite zone a été sélectionnée. De la sorte, l'utilisateur s'il est interrompu lors de la correction, peut facilement poursuivre sa correction sans devoir la recommencer en totalité. Dans ce mode de réalisation, l'utilisateur qui souhaite procéder à une correction mais qui ignore le type de correction disponible, indique au système qu'il souhaite faire correction et sur quel mot (à l'aide du marqueur associé) en prononçant par exemple : « correction 2 ». En réponse, le système indique le mot sélectionné (par exemple, par un changement de couleur de la zone graphique ou du mot) et indique le type de correction disponible.

Les figures 3a et 3b montrent un premier exemple d'affichages générés avec le dispositif selon l'invention. Sur l'affichage de la figure 3a, on peut voir une fenêtre d'une application de navigation dans laquelle sont affichés des mots reconnus par la fonction de reconnaissance. On suppose que l'utilisateur a prononcé la phrase suivante : « 6 rue Andrée Salel Fontenay-aux-Roses ». Chacun des mots est entouré d'une bordure délimitant une zone graphique associée au mot. La phrase affichée est la suivante : « 6 rue Andrée Sastel Fontenay-aux-Roses ». L'affichage comporte les marqueurs associés aux mots. Dans l'exemple, il s'agit des chiffres de 1 à 5. Pour indiquer à l'utilisateur quels mots sont associés à quels marqueurs, chaque couple de mot-marqueur est affiché dans une zone graphique distincte. Ces zones sont matérialisées par une bordure entourant le mot et le marqueur associé. Dans l'exemple, le mot « 6 » est associé au marqueur 1, le mot « rue » au marqueur 2, le mot « Andrée » au marqueur 3, le mot « Sastel » au marqueur 3, le mot « Fontenay-aux-Roses » au marqueur 5. L'affichage comporte en outre, de façon optionnelle, une zone indiquant les commandes de corrections disponibles (non représentée). L'affichage de la figure 3b montre la même fenêtre de messagerie après que l'utilisateur a prononcé la commande « remplace par 4 S-A-S-T-E- L ». Le système a appliqué la correction « remplacer par » au mot associé au marqueur sélectionné. La phrase reconnue devient donc « 6 rue Andrée Salel Fontenay-aux-Roses ». Avec ce système, l'utilisateur peut très facilement remplacer un mot mal reconnu par un autre.

Claims

REVENDICATIONS1. Procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone (11), de la parole de l'utilisateur, - Application (22) d'une fonction de reconnaissance vocale sur la parole 1 o reçue, - Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, 15 - Réception (25) par l'intermédiaire du microphone (11) d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée. 20
2. Procédé de traitement de la parole selon la revendication 1, dans lequel la commande de correction est choisie parmi, la suppression du au moins un mot sélectionné, le remplacement du au moins un mot sélectionné, l'ajout d'au moins un mot après ou avant le au moins un mot sélectionné. 25
3. Procédé de traitement de la parole selon l'une des revendications précédentes dans lequel le marqueur comprend un symbole alphanumérique.
4. Procédé de traitement de la parole selon l'une des revendications 30 précédentes dans lequel le marqueur comprend une couleur.
5. Procédé de traitement de la parole selon l'une des revendications précédentes, dans lequel chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot.
6. Procédé de traitement de la parole selon l'une des revendications précédentes caractérisé en ce qu'il comprend en outre une étape de demande de correction désignant un marqueur et, en réponse la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de l a corrections.
7. Procédé de traitement de la parole selon les revendications 5 et 6 prises en combinaison, comportant, en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection 15 de façon à signaler à l'utilisateur que ladite zone a été sélectionnée.
8. Dispositif de traitement de la parole (10) d'un utilisateur comportant un microphone (11) pour enregistrer la parole d'un utilisateur, une unité de traitement (12) apte à commander une fonction de reconnaissance vocale sur 20 la parole enregistré et un moyen d'affichage (13) apte à afficher une séquence de mots reconnus par la fonction de reconnaissance, caractérisé en ce que l'unité de traitement (12) est adaptée pour mettre oeuvre le procédé selon l'une des revendication précédentes. 25
9. Véhicule comportant un dispositif de traitement de la parole (10) selon la revendication 8.