FR3016709A1 - Procede et dispositif de traitement de la parole d'un utilisateur - Google Patents

Procede et dispositif de traitement de la parole d'un utilisateur Download PDF

Info

Publication number
FR3016709A1
FR3016709A1 FR1450585A FR1450585A FR3016709A1 FR 3016709 A1 FR3016709 A1 FR 3016709A1 FR 1450585 A FR1450585 A FR 1450585A FR 1450585 A FR1450585 A FR 1450585A FR 3016709 A1 FR3016709 A1 FR 3016709A1
Authority
FR
France
Prior art keywords
user
speech
words
correction
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR1450585A
Other languages
English (en)
Inventor
Benoit Desnoues
Fazel Sara Sadvandi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PSA Automobiles SA
Original Assignee
Peugeot Citroen Automobiles SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peugeot Citroen Automobiles SA filed Critical Peugeot Citroen Automobiles SA
Priority to FR1450585A priority Critical patent/FR3016709A1/fr
Publication of FR3016709A1 publication Critical patent/FR3016709A1/fr
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Navigation (AREA)

Abstract

L'invention concerne un procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone, de la parole de l'utilisateur, - Application (22) d'une fonction de reconnaissance vocale sur la parole reçue, - Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, - Réception (25) par l'intermédiaire du microphone d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée.

Description

16 709 1 PROCEDE ET DISPOSITIF DE TRAITEMENT DE LA PAROLE D'UN UTILISATEUR L'invention concerne les systèmes de reconnaissance vocale et, plus particulièrement, ceux permettant une correction d'erreur de reconnaissance. Les systèmes de reconnaissance vocale selon l'art connu comprennent généralement un microphone pour enregistrer la parole d'un utilisateur. La parole est numérisée puis analysée de sorte à identifier une succession de mots. Malgré les progrès effectués ces dernières années, ces systèmes commettent parfois des erreurs de reconnaissance, en restituant des mots différents de ceux prononcés par l'utilisateur. Ceci est particulièrement vrai dans un environnement bruyant tel que peut l'être un habitacle de véhicule. Une étape de correction est alors nécessaire. On connait, par exemple, par le document US 5,386,494, un système de reconnaissance de commande vocale, présentant une étape de correction. A chaque fois que le système effectue une reconnaissance, celui-ci affiche la commande reconnue ainsi qu'une liste de commandes alternatives. Lorsque le système commet une erreur de reconnaissance, l'utilisateur sélectionne, à l'aide d'une souris, une des commandes proposées et affichées par le système. Ce système a notamment pour inconvénient de ne fonctionner qu'avec un nombre limité de commandes. En outre, la lecture et la sélection de commandes alternatives proposées par le système nécessite une attention soutenue de la part de l'utilisateur, ce qui est incompatible avec la conduite d'un véhicule.
On connait aussi par le document EP 2 278 581 un système de reconnaissance vocale présentant une étape de correction. Le système détermine pour chaque mot identifié une « meilleure liste » (best list) de N mots. Pour corriger une erreur de reconnaissance, l'utilisateur peut remplacer un mot par un mot de la meilleure liste qui lui est associé. Comme la solution précédente, une correction nécessite une attention soutenue de la part de l'utilisateur, ce qui est incompatible avec la conduite d'un véhicule. L'invention a donc pour but de proposer un procédé et un dispositif de 3016 709 2 reconnaissance vocale permettant une correction efficace d'une erreur de reconnaissance vocale, cette correction ne nécessitant pas une attention soutenue de la part de l'utilisateur et étant compatible avec la conduite d'un véhicule notamment de type automobile. 5 Elle propose plus précisément à cet effet un procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone (11), de la parole de l'utilisateur, Application (22) d'une fonction de reconnaissance vocale sur la 10 parole reçue, Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, 15 - Réception (25) par l'intermédiaire du microphone (11) d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée. 20 Le procédé selon l'invention permet à un utilisateur de corriger un message dicté sans accaparer son attention et sans nécessiter une manipulation. Les corrections à apporter à une séquence de mots sont indiquées directement au dispositif en dictant une correction associée à un marqueur. La correction s'effectue ainsi entièrement par dictée vocale ce qui 25 libère l'attention visuelle de l'utilisateur. En outre l'utilisation d'un marqueur permet de ne pas répéter un mot mal orthographié en le désignant par son marqueur. Ce procédé est compatible avec la conduite d'un véhicule car il requiert beaucoup moins d'attention visuelle qu'une correction reposant 30 uniquement sur une interaction avec un afficheur.
Selon une caractéristique de l'invention, la commande de correction est choisie parmi, la suppression du au moins un mot sélectionné, le remplacement du au moins un mot sélectionné, l'ajout d'au moins un mot après ou avant le mot sélectionné.
Avantageusement, le marqueur comprend un symbole alphanumérique. L'utilisation d'un symbole alphanumérique, en particulier un chiffre, facilite la reconnaissance vocale du marqueur. Avantageusement, le marqueur comprend une couleur. L'utilisation d'une couleur facilite la reconnaissance du marqueur par l'utilisateur.
Avantageusement, chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot. La bordure permet d'identifier facilement les mots les uns des autres et réduits l'attention nécessitée par l'opération de correction. Avantageusement, le procédé de traitement de la parole selon l'invention comprend en outre une étape de demande de correction désignant un marqueur et, en réponse à la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de corrections. Cette étape supplémentaire permet à un utilisateur ne connaissant pas les types de corrections disponibles, de se les remémorer.
Avantageusement, le procédé de traitement de la parole selon l'invention comprend en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection de façon à signaler à l'utilisateur que ladite zone a été sélectionnée. L'utilisateur si il est interrompu au cours d'une correction, peut facilement retrouver le mot qu'il a sélectionné pour la correction. L'invention concerne aussi un dispositif de traitement de la parole d'un utilisateur comportant un microphone pour enregistrer la parole d'un utilisateur, une unité de traitement apte à commander une fonction de reconnaissance vocale sur la parole enregistré et un moyen d'affichage apte à afficher une séquence de mots reconnus par la fonction de reconnaissance, caractérisé en ce que l'unité de traitement est adaptée pour mettre oeuvre le procédé selon l'invention. L'invention concerne aussi un véhicule comportant un dispositif de traitement de la parole selon l'invention. D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés, sur lesquels: - la figure 1 illustre un diagramme montrant une schématique d'un dispositif selon l'invention ; - la figure 2 illustre un diagramme présentant le procédé selon l'invention. - les figures 3a et 3b montrent un premier exemple d'affichages générés avec le dispositif selon l'invention. Les dessins annexés pourront non seulement servir à compléter l'invention, mais aussi contribuer à sa définition, le cas échéant. En référence à la figure 1, le dispositif 10 de traitement de la parole d'un utilisateur comporte : un microphone 11, une unité de traitement 12, un moyen d'affichage 13. Le microphone 11 permet d'enregistrer la parole d'un utilisateur situé dans l'habitacle du véhicule. L'unité de traitement 12 est un calculateur, comprenant une mémoire et un processeur, apte à exécuter ou à commander l'exécution d'une fonction de reconnaissance vocale. L'unité de traitement 12 est reliée au microphone 11 et est apte à commander le moyen d'affichage 13. La fonction de reconnaissance vocale est une fonction connue de l'état de la technique qui permet de reconnaitre des mots à partir d'une parole prononcé par un utilisateur et préalablement numérisée. Le moyen d'affichage 13, par exemple un écran LCD, permet notamment d'afficher des mots reconnus par la fonction de reconnaissance vocale. L'invention concerne aussi un procédé de traitement de la parole d'un utilisateur. En référence à la figure 2, le procédé comporte les étapes suivantes. Le procédé comporte, tout d'abord, une étape d'acquisition 21, par l'intermédiaire du microphone 11, de la parole de l'utilisateur. Le procédé comporte aussi l'application 22 d'une fonction de reconnaissance vocale sur la parole reçue. L'unité de traitement exécute ou commande l'exécution de la fonction de reconnaissance vocale sur la parole de l'utilisateur enregistrée, par le microphone 11, et numérisée. La reconnaissance vocale peut être effectuée sur un calculateur dans le véhicule ou à distance sur un calculateur débarquée, la parole numérisée et le résultat la de la reconnaissance étant, dans ce second cas, échangés par le biais d'une communication sans fils. Le procédé comporte aussi l'affichage 23 d'une séquence de mots reconnus sur le moyen d'affichage. Les mots reconnus par la fonction de reconnaissance sont affichées sur l'écran de sorte que l'utilisateur peut vérifier 15 s'il y a une erreur de reconnaissance. Avantageusement, le procédé comporte aussi une étape de synthèse vocale de la séquence de mots reconnus, permettant à l'utilisateur d'écouter cette séquence et de vérifier s'il y a une erreur de reconnaissance sans regarder l'écran. Cependant, il faut noter que la synthèse vocale de la 20 séquence de mots reconnus ne permet pas forcément de détecter une erreur, car on peut avoir des homophones comme dans l'adresse rue des eaux/ rue des hauts. Le procédé comporte aussi la création 24 et l'affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun 25 des mots reconnus. De façon avantageuse, l'unité de traitement crée autant de marqueurs de sélection que de mots reconnus. De cette façon, l'utilisateur peut sélectionner facilement les mots erronés, autrement dit, les mots mal reconnus par la fonction de reconnaissance. Les marqueurs comprennent au 30 moins un symbole alphanumérique et/ou une couleur. Par exemple, les marqueurs peuvent être des chiffres (1, 2, 3, ...) ou des combinaisons de lettres et de chiffres (A1, B2, ...) qui permettent d'éviter une ambiguïté avec le numéro d'une adresse.
Selon un mode de réalisation avantageux, chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot. De cette façon, l'utilisateur identifie facilement chacun des mots s'il souhaite effectuer une correction.
Le procédé comporte aussi la réception 25 par l'intermédiaire du microphone 11 d'une commande de correction désignant un marqueur affiché. Selon une caractéristique de l'invention, la commande de correction est choisie parmi, la suppression d'un ou des mot(s) sélectionné(s), le remplacement d'un ou des mot(s) sélectionné(s), l'ajout d'un ou de plusieurs mot(s) après ou avant un mot sélectionné. Le procédé comporte aussi la modification 26 de la séquence de mots reconnus en fonction de la commande de correction. Enfin, le procédé comporte l'affichage 27 de la séquence de mots reconnus corrigée. De cette façon, l'utilisateur peut s'assurer que les mots à nouveau prononcés ont été correctement reconnus. Dans le cas contraire, l'utilisateur peut à nouveau sélectionner les mots erronés. Avantageusement, le procédé comporte aussi une étape de synthèse vocale de la séquence de mots corrigés, permettant à l'utilisateur d'écouter cette séquence et de vérifier s'il y a une erreur de correction sans regarder l'écran. Selon un mode de réalisation, le procédé de traitement de la parole selon l'invention comprend outre une étape de demande de correction désignant un marqueur et, en réponse la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de corrections. Avantageusement, le procédé comporte en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection de façon à signaler à l'utilisateur que ladite zone a été sélectionnée. De la sorte, l'utilisateur s'il est interrompu lors de la correction, peut facilement poursuivre sa correction sans devoir la recommencer en totalité. Dans ce mode de réalisation, l'utilisateur qui souhaite procéder à une correction mais qui ignore le type de correction disponible, indique au système qu'il souhaite faire correction et sur quel mot (à l'aide du marqueur associé) en prononçant par exemple : « correction 2 ». En réponse, le système indique le mot sélectionné (par exemple, par un changement de couleur de la zone graphique ou du mot) et indique le type de correction disponible.
Les figures 3a et 3b montrent un premier exemple d'affichages générés avec le dispositif selon l'invention. Sur l'affichage de la figure 3a, on peut voir une fenêtre d'une application de navigation dans laquelle sont affichés des mots reconnus par la fonction de reconnaissance. On suppose que l'utilisateur a prononcé la phrase suivante : « 6 rue Andrée Salel Fontenay-aux-Roses ». Chacun des mots est entouré d'une bordure délimitant une zone graphique associée au mot. La phrase affichée est la suivante : « 6 rue Andrée Sastel Fontenay-aux-Roses ». L'affichage comporte les marqueurs associés aux mots. Dans l'exemple, il s'agit des chiffres de 1 à 5. Pour indiquer à l'utilisateur quels mots sont associés à quels marqueurs, chaque couple de mot-marqueur est affiché dans une zone graphique distincte. Ces zones sont matérialisées par une bordure entourant le mot et le marqueur associé. Dans l'exemple, le mot « 6 » est associé au marqueur 1, le mot « rue » au marqueur 2, le mot « Andrée » au marqueur 3, le mot « Sastel » au marqueur 3, le mot « Fontenay-aux-Roses » au marqueur 5. L'affichage comporte en outre, de façon optionnelle, une zone indiquant les commandes de corrections disponibles (non représentée). L'affichage de la figure 3b montre la même fenêtre de messagerie après que l'utilisateur a prononcé la commande « remplace par 4 S-A-S-T-E- L ». Le système a appliqué la correction « remplacer par » au mot associé au marqueur sélectionné. La phrase reconnue devient donc « 6 rue Andrée Salel Fontenay-aux-Roses ». Avec ce système, l'utilisateur peut très facilement remplacer un mot mal reconnu par un autre.

Claims (9)

  1. REVENDICATIONS1. Procédé de traitement de la parole d'un utilisateur comportant des étapes de : - Acquisition (21), par l'intermédiaire d'un microphone (11), de la parole de l'utilisateur, - Application (22) d'une fonction de reconnaissance vocale sur la parole 1 o reçue, - Affichage (23) d'une séquence de mots reconnus, caractérisé en ce qu'il comporte en outre des étapes de : - Création (24) et affichage de marqueurs associés à des mots reconnus, lesdits marqueurs étant différents pour chacun des mots reconnus, 15 - Réception (25) par l'intermédiaire du microphone (11) d'une commande de correction désignant un marqueur affiché, - Modification (26) de la séquence de mots reconnus en fonction de la commande de correction, - Affichage (27) de la séquence de mots reconnus corrigée. 20
  2. 2. Procédé de traitement de la parole selon la revendication 1, dans lequel la commande de correction est choisie parmi, la suppression du au moins un mot sélectionné, le remplacement du au moins un mot sélectionné, l'ajout d'au moins un mot après ou avant le au moins un mot sélectionné. 25
  3. 3. Procédé de traitement de la parole selon l'une des revendications précédentes dans lequel le marqueur comprend un symbole alphanumérique.
  4. 4. Procédé de traitement de la parole selon l'une des revendications 30 précédentes dans lequel le marqueur comprend une couleur.
  5. 5. Procédé de traitement de la parole selon l'une des revendications précédentes, dans lequel chacun des mots est représenté dans une zone graphique délimitée par une bordure entourant le mot.
  6. 6. Procédé de traitement de la parole selon l'une des revendications précédentes caractérisé en ce qu'il comprend en outre une étape de demande de correction désignant un marqueur et, en réponse la demande, l'émission, à destination de l'utilisateur, d'une liste de commande de l a corrections.
  7. 7. Procédé de traitement de la parole selon les revendications 5 et 6 prises en combinaison, comportant, en outre, en réponse à une demande de correction d'un utilisateur, une étape de modification graphique de la zone de sélection 15 de façon à signaler à l'utilisateur que ladite zone a été sélectionnée.
  8. 8. Dispositif de traitement de la parole (10) d'un utilisateur comportant un microphone (11) pour enregistrer la parole d'un utilisateur, une unité de traitement (12) apte à commander une fonction de reconnaissance vocale sur 20 la parole enregistré et un moyen d'affichage (13) apte à afficher une séquence de mots reconnus par la fonction de reconnaissance, caractérisé en ce que l'unité de traitement (12) est adaptée pour mettre oeuvre le procédé selon l'une des revendication précédentes. 25
  9. 9. Véhicule comportant un dispositif de traitement de la parole (10) selon la revendication 8.
FR1450585A 2014-01-23 2014-01-23 Procede et dispositif de traitement de la parole d'un utilisateur Withdrawn FR3016709A1 (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
FR1450585A FR3016709A1 (fr) 2014-01-23 2014-01-23 Procede et dispositif de traitement de la parole d'un utilisateur

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR1450585A FR3016709A1 (fr) 2014-01-23 2014-01-23 Procede et dispositif de traitement de la parole d'un utilisateur

Publications (1)

Publication Number Publication Date
FR3016709A1 true FR3016709A1 (fr) 2015-07-24

Family

ID=50549107

Family Applications (1)

Application Number Title Priority Date Filing Date
FR1450585A Withdrawn FR3016709A1 (fr) 2014-01-23 2014-01-23 Procede et dispositif de traitement de la parole d'un utilisateur

Country Status (1)

Country Link
FR (1) FR3016709A1 (fr)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006042943A1 (fr) * 2004-10-19 2006-04-27 France Telecom Procede de reconnaissance vocale comprenant une etape d ' insertion de marqueurs temporels et systeme correspondant
EP2131355A2 (fr) * 2008-05-28 2009-12-09 LG Electronics Inc. Terminal mobile et procédé de correction de texte associé

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006042943A1 (fr) * 2004-10-19 2006-04-27 France Telecom Procede de reconnaissance vocale comprenant une etape d ' insertion de marqueurs temporels et systeme correspondant
EP2131355A2 (fr) * 2008-05-28 2009-12-09 LG Electronics Inc. Terminal mobile et procédé de correction de texte associé

Similar Documents

Publication Publication Date Title
KR102416405B1 (ko) 차량 기반의 멀티 모달 인터페이스
US10710607B2 (en) Systems and methods for identifying first route to destination as involving less human driving of vehicle than second route to destination
EP3201913A1 (fr) Plate-forme vocale et de connexion
US20170286785A1 (en) Interactive display based on interpreting driver actions
US20150339031A1 (en) Context-based vehicle user interface reconfiguration
KR20170089328A (ko) 자동차 제어 시스템과 그의 운영 방법
US10297092B2 (en) System and method for vehicular dynamic display
WO2019038487A1 (fr) Systeme de commande d'un moniteur principal de vehicule autonome
US10386853B2 (en) Method for accessing a vehicle-specific electronic device
US11364804B2 (en) Display system for mode information display
CN113961114A (zh) 主题替换方法、装置、电子设备及存储介质
KR20220065669A (ko) 온-디바이스 캐시를 이용한 하이브리드 페칭
FR3016709A1 (fr) Procede et dispositif de traitement de la parole d'un utilisateur
FR3011353A1 (fr) Procede et dispositif de traitement de la parole d'un utilisateur
US20170003135A1 (en) Intelligent global positioning system service
EP0645604A1 (fr) Dispositif d'édition d'informations pour calculateur notamment d'aide à la navigation de véhicule automobile
WO2022084598A1 (fr) Procédé et dispositif de détermination d'un temps de manœuvre d'un véhicule autonome pour atteindre une vitesse cible
CN113791842A (zh) 一种管理方法、装置、设备及存储介质
WO2016079398A1 (fr) Procédé et dispositif pour commander un moyen d'affichage
US20140343832A1 (en) Using pass code verification to organize a vehicle caravan
US20240140200A1 (en) Displaying method and displaying system for vehicle
EP3126951A1 (fr) Interface homme machine pour véhicule automobile
WO2021037599A1 (fr) Système et procédé de commande tactile pour véhicule
FR3144889A1 (fr) Procédé et dispositif de contrôle d’une interface utilisateur d’un véhicule
US11269351B2 (en) Modifying navigation commands

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20150930