DE19646634A1 - Verfahren zur Befehlseingabe mit Sprache - Google Patents

Verfahren zur Befehlseingabe mit Sprache

Info

Publication number
DE19646634A1
DE19646634A1 DE1996146634 DE19646634A DE19646634A1 DE 19646634 A1 DE19646634 A1 DE 19646634A1 DE 1996146634 DE1996146634 DE 1996146634 DE 19646634 A DE19646634 A DE 19646634A DE 19646634 A1 DE19646634 A1 DE 19646634A1
Authority
DE
Germany
Prior art keywords
commands
command
entering
entering commands
confirmation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1996146634
Other languages
English (en)
Inventor
Joachim Dr Wietzke
Michael Opatz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Robert Bosch GmbH
Original Assignee
Robert Bosch GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Robert Bosch GmbH filed Critical Robert Bosch GmbH
Priority to DE1996146634 priority Critical patent/DE19646634A1/de
Priority to PCT/DE1997/002429 priority patent/WO1998021711A1/de
Publication of DE19646634A1 publication Critical patent/DE19646634A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Description

Stand der Technik
Die Erfindung geht aus von einem Verfahren zur Befehlseingabe mit Sprache nach der Gattung des Hauptanspruchs.
Es sind bereits aus der Technik verschiedenste Anwendungen der Spracheingabe bekannt. Aus der EP 0 519 360 ist eine Einrichtung und ein Verfahren zum Erkennen von Sprache bekannt, das zur automatischen Telefonanwahl per Spracheingabe dient. Dabei werden die Namen der Personen, die angerufen werden sollen, über Sprache aufgerufen. Die Einrichtung vergleicht das Kommando mit einer Liste von gespeicherten Kommandos, bzw. Namen, und prüft auf weitgehende Ähnlichkeit. Zusätzlich kann die Einrichtung über ein lernfähiges neuronales Netzwerk trainiert und erweitert werden. Das Problem bei solchen Verfahren, ist eine sehr aufwendige Technik, die es ermöglicht, eindeutige Sprachbefehle herauszukristallisieren und auch Störgeräusche zu unterdrücken. Dieses aufwendige Spracherkennungsverfahren wird auf den Benutzer trainiert. Das gestaltet die Spracherkennung zwar sicherer und störungsunabhängiger, aber der technische Aufwand für die Spracherkennung steigt.
Vorteile der Erfindung
Das erfindungsgemäße Verfahren zur Befehlseingabe mit den kennzeichnenden Merkmalen des Hauptanspruchs hat demgegenüber den Vorteil, daß die Befehlseingabe in einzelnen Schritten erfolgt, und nach jedem Befehl die erkannte Sequenz für den Benutzer dargestellt wird, der die Eingabe entweder bestätigen oder verwerfen kann.
Durch die in den Unteransprüchen aufgeführten Maßnahmen ist eine vorteilhafte Weiterbildung und Verbesserung des im Hauptanspruch angegebenen Verfahrens zur Befehlseingabe möglich.
Besonders vorteilhaft ist es, wenn die Bestätigung vom Benutzer durch eine einfache JA/NEIN-Antwort erfolgen kann. Das ist eine sehr sichere und fehlerrobuste Art der Spracheingabe. Weiterhin ist es von Vorteil, z. B. bei sehr hohen Störgeräuschpegeln, die Bestätigung in Form der Betätigung einer Taste zu erledigen. Die Darstellung des von der Spracherkennung erkannten Befehlsequenz kann vorteilhafterweise akustisch erfolgen.
Ein weitere Ausbildung der Darstellung der erkannten Befehlsequenz ist die Ausgabe auf einen für den Benutzer sichtbaren Bildschirm. Vorteilhafterweise wird bei einer nicht eindeutigen Erkennung der Befehlsequenz eine Auswahl der möglichen Befehle auf einem Display dargestellt. Auch dazu kann man sich für den Einzelfall vorteilhafterweise eine akustische Ausgabe vorstellen. Bei Nichterkennen der Befehlsfolge kann dem Gerät durch eine erneute Eingabe des Befehls der Startbefehl wieder gegeben werden.
Vorteilhafterweise ist es auch möglich, den Befehl zu buchstabieren. Eine Eingabe zu buchstabieren ist schneller und leichter durchzuführen, als eine Eingabe über eine Tastatur. Zudem kann in einer sehr lauten Umgebung der Störpegel so groß werden, daß nur über eine Buchstabierung der Befehle eine Spracheingabe noch möglich ist.
Es ist ein Vorteil, daß die Befehle in zwei Gruppen unterteilt werden, wobei nur die kritischen Befehle vom Gerät dargestellt werden müssen.
Ein erfindungsgemäßes Gerät, insbesondere ein Autoradiogerät, muß ein Mikrofon und einen Spracherkennungseinheit aufweisen. Dadurch muß der Fahrer des Fahrzeugs keine Hand zur Bedienung einsetzen.
Zeichnungen
Ein Ausführungsbeispiel der Erfindung ist in der nachfolgenden Zeichnung dargestellt und in der folgenden Beschreibung näher erläutert.
Es zeigt
Fig. 1 ein Verfahrensschema der erfindungsgemäßen Befehlseingabe,
Fig. 2 ein Gerät mit Möglichkeiten zur Spracheingabe.
Beschreibung des Ausführungsbeispiels
Fig. 1 zeigt den Verfahrensablauf für die Befehlseingabe über Sprache. Der Sprachbefehl 1 wird über ein Mikrofon, z. B. eine Freisprecheinrichtung wie sie aus Telefongeräten seit langem bekannt ist, in das Gerät eingegeben. Im Gerät nimmt die Signalerkennung 2 den gesprochenen Befehl auf und entschlüsselt ihn. Dabei wird der Befehl im allgemeinen mit einem in der Spracherkennungsystem 2 vorliegenden Tabelle mit den vorhandenen und zu verstehenden Befehlen verglichen. Wählt das Gerät einen Befehl aus, wird er auf geeignete Art und Weise dargestellt 3. Die Darstellung kann dabei durch eine akustische Ausgabe des verstandenen Befehls erfolgen, oder über ein vorhandenes Display dem Benutzer angezeigt werden. Der Benutzer wird in einem nächsten Schritt die vom Gerät erkannte Befehlsequenz entweder bestätigen oder verwerfen. Hat die Spracherkennung den Befehl korrekt erkannt, wird der Befehl in Schritt 5 ausgeführt. Die Bestätigung des Benutzers ist im allgemeinen eine JA/NEIN-Aus­ sage 6, die ebenfalls akustisch eingegeben wird. Für den Fall, daß eine Befehlsequenz nicht eindeutig zugeordnet werden kann, wird die Spracherkennung 2 auf der Darstellung 3 eine Auswahl der möglichen Befehle darstellen. Der Benutzer wählt dann im Schritt 4 z. B. per Spracheingabe 1 einen dieser Befehle aus. Sollte durch einen erhöhten Geräuschpegel im Hintergrund des Gerätes keine Spracheingabe mehr vernünftig möglich sein, ist es für den Benutzer in diesem Schritt auch möglich, den Befehl zu buchstabieren oder über eine Tastatur 6 einzugeben. Der buchstabierte Befehl ist von der Spracherkennung leichter zu verstehen und die Ausführung des Befehls wird störungsunanfälliger. Es ist auch möglich, die Befehle, die für das Gerät zu verstehen sind, in zwei Gruppen einzuteilen. Dabei unterscheidet man unkritische Befehlskommandos, die ohne ein erneutes Darstellen und Bestätigen des Kommandos direkt ausgeführt werden können. Zum Beispiel gehören dazu Kommandos zu Lautstärkeregelung, Helligkeitsdarstellung usw. Kritische Befehle in der Gruppe 2 müssen allerdings immer dargestellt und bestätigt werden. Dazu gehören Befehle wie "Löschen", "Zurücksetzen", usw. Für die Ausführung der Befehle der Gruppe 1 kann ein Reset-Kommando definiert werden, z. B. die Spracheingabe "Falsch". Mit einer solchen Befehlsequenz ist der vorher getroffene und ausgeführte Befehl rückgängig zu machen.
Fig. 2 zeigt ein Ausführungsbeispiel für die Steuerung eines Autoradiogerätes 15 unter den Bedingungen, daß in einem fahrenden Kraftfahrzeug stets ein erhöhter Geräuschpegel vorzufinden ist. Über ein Mikrofon 7 wird der Sprachbefehl vom Gerät aufgenommen. Das Gerät besitzt einen Spracherkennungsmodul 8, in dem sich auch die Liste der bekannten und möglichen Befehle befindet. Im Spracherkennungsmodul 8 wird die Spracheingabe ausgewertet und das Ergebnis der Auswertung vom Prozessor 9 auf dem Display 10 dargestellt. Alternativ könnte man sich auch eine Ausgabe auf einen Lautsprecher 12 vorstellen. Sollte es sich um einen Befehl der Gruppe 1, also um einen unkritischen Befehl handeln, kann der Prozessor 9 über die Schaltung 14 den Befehl gleich zur Ausführung 11 weitergeben. Im Falle, daß es sich um kritische, gegebenenfalls irreversible Befehle handelt, muß der Prozessor zunächst den Befehl akustisch und/oder optisch darstellen und über die Schaltung 14 die Ausführung des Befehls unterbrechen. Erst nach einer erneuten Eingabe, wobei die Eingabe wieder über das Mikrofon 7 oder aber über eine Tastatur 13 erfolgen kann, kann der Prozessor den Befehl zur Ausführung 11 weitergeben.
Die Schaltung 13 ist im allgemeinen im Prozessor integriert und wird über eine geeignete Software verwirklicht.

Claims (11)

1. Verfahren zur Befehlseingabe bei elektrischen Geräten, insbesondere Autoradiogeräten, mit Hilfe von Sprachbefehlen (1) in einer Umgebung mit hohen Störgeräuschpegeln, dadurch gekennzeichnet, daß nach jedem Eingabeschritt (2) der erkannte Sprachbefehl für den Benutzer dargestellt wird (3) und vor der Ausführung (5) des erkannten Sprachbefehls eine Bestätigung (1, 6) des Benutzers erfolgt.
2. Verfahren zur Befehlseingabe nach Anspruch 1, dadurch gekennzeichnet, daß die Bestätigung in Form einer JA/NEIN-Ant­ wort akustisch erfolgt.
3. Verfahren zur Befehlseingabe nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Bestätigung in Form einer Eingabe über eine Tastatur erfolgt.
4. Verfahren zur Befehlseingabe nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß die erkannte Befehlsequenz akustisch am Gerät ausgegeben wird.
5. Verfahren zur Befehlseingabe nach Anspruch 1 bis 4, dadurch gekennzeichnet, daß bei einem Nichterkennen der Befehlsequenz eine Auswahl ähnlicher Befehle dargestellt wird.
6. Verfahren zur Befehlseingabe nach Anspruch 1 bis 5, dadurch gekennzeichnet, daß die Auswahl der möglichen Befehle auf einem Display dargestellt wird.
7. Verfahren zur Befehlseingabe nach Anspruch 1 bis 6, dadurch gekennzeichnet, daß die Auswahl der möglichen Befehle akustisch ausgegeben wird.
8. Verfahren zur Befehlseingabe nach Anspruch 1 bis 7, dadurch gekennzeichnet, daß bei Nichterkennen der Befehlsequenz der Befehl vom Benutzer als Buchstabenfolge eingegeben wird.
9. Verfahren zur Befehlseingabe nach Anspruch 1 bis 8, dadurch gekennzeichnet, daß die Eingabe der Buchstabenfolge akustisch erfolgt.
10. Verfahren zur Befehlseingabe nach Anspruch 1 bis 9, dadurch gekennzeichnet, daß die Spracherkennung zwischen zwei verschiedenen Gruppen von Befehlen unterscheidet, wobei die eine Gruppe nicht zur Anzeige gebracht werden muß.
11. Autoradiogerät (15) zur Durchführung des Verfahrens nach den vorhergehenden Ansprüchen mit einem Prozessor (9) und mit einer mit ihm verbundenen Spracherkennung (8), mit Eingabe- (7, 13) und Ausgabeeinheiten (12, 10), dadurch gekennzeichnet, daß der Prozessor (9) eine Schaltung (14) steuert, die bei einer ersten Gruppe von Befehlen die Ausführung der Befehle bis zu einer Bestätigung unterbricht und die eine zweite Gruppe von Befehlen ohne Unterbrechung ausführt.
DE1996146634 1996-11-12 1996-11-12 Verfahren zur Befehlseingabe mit Sprache Withdrawn DE19646634A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE1996146634 DE19646634A1 (de) 1996-11-12 1996-11-12 Verfahren zur Befehlseingabe mit Sprache
PCT/DE1997/002429 WO1998021711A1 (de) 1996-11-12 1997-10-21 Verfahren zur befehlseingabe mit sprache

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1996146634 DE19646634A1 (de) 1996-11-12 1996-11-12 Verfahren zur Befehlseingabe mit Sprache

Publications (1)

Publication Number Publication Date
DE19646634A1 true DE19646634A1 (de) 1998-05-14

Family

ID=7811373

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1996146634 Withdrawn DE19646634A1 (de) 1996-11-12 1996-11-12 Verfahren zur Befehlseingabe mit Sprache

Country Status (2)

Country Link
DE (1) DE19646634A1 (de)
WO (1) WO1998021711A1 (de)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023982A1 (de) * 1998-10-16 2000-04-27 Volkswagen Aktiengesellschaft Verfahren und vorrichtung zur ausgabe von informationen und/oder meldungen per sprache
EP1001406A1 (de) * 1998-11-09 2000-05-17 Philips Corporate Intellectual Property GmbH Verfahren zur Benutzerunterstützung durch ein automatisches Spracherkennungssystem
DE10006008A1 (de) * 2000-02-11 2001-08-02 Audi Ag Geschwindigkeitskontrollvorrichtung und Verfahren zur Kontrolle der Geschwindigkeit eines Fahrzeugs
DE10120679A1 (de) * 2001-04-27 2002-05-02 Siemens Ag Vorrichtung zur Sprachbedienung von gegebenenfalls sicherheitsrelevanten Funktionen
DE10126020A1 (de) * 2001-05-28 2003-01-09 Olaf Berberich Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung
DE102010054242A1 (de) 2010-12-11 2012-06-14 Volkswagen Ag Verfahren zum Bereitstellen einer Bedienvorrichtung in einem Fahrzeug und Bedienvorrichtung
DE10134908B4 (de) * 2000-07-21 2013-05-08 Denso Corporation Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden
US11417319B2 (en) * 2017-09-21 2022-08-16 Kabushiki Kaisha Toshiba Dialogue system, dialogue method, and storage medium

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5022081A (en) * 1987-10-01 1991-06-04 Sharp Kabushiki Kaisha Information recognition system
NL8802350A (nl) * 1988-09-23 1990-04-17 Philips Nv Werkstation voor een computersysteem voorzien van een afbeeldelement, een ingavesysteem, en een audiokommunikatiesysteem, alsmede computersysteem bevattende zulke werkstations.
DE4408086A1 (de) * 1994-03-10 1995-09-14 Telefonbau & Normalzeit Gmbh Verfahren zur Erkennung von buchstabierten Namen oder Begriffen für Kommunikations-Vermittlungsanlagen
CA2143980A1 (en) * 1994-04-06 1995-10-07 Raziel Haimi-Cohen User display in speech recognition system
DE4427444B4 (de) * 1994-08-03 2004-07-29 Robert Bosch Gmbh Einrichtung und Verfahren zur Sprachsteuerung eines Geräts

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000023982A1 (de) * 1998-10-16 2000-04-27 Volkswagen Aktiengesellschaft Verfahren und vorrichtung zur ausgabe von informationen und/oder meldungen per sprache
US7991618B2 (en) 1998-10-16 2011-08-02 Volkswagen Ag Method and device for outputting information and/or status messages, using speech
EP1001406A1 (de) * 1998-11-09 2000-05-17 Philips Corporate Intellectual Property GmbH Verfahren zur Benutzerunterstützung durch ein automatisches Spracherkennungssystem
DE10006008A1 (de) * 2000-02-11 2001-08-02 Audi Ag Geschwindigkeitskontrollvorrichtung und Verfahren zur Kontrolle der Geschwindigkeit eines Fahrzeugs
DE10134908B4 (de) * 2000-07-21 2013-05-08 Denso Corporation Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden
DE10120679A1 (de) * 2001-04-27 2002-05-02 Siemens Ag Vorrichtung zur Sprachbedienung von gegebenenfalls sicherheitsrelevanten Funktionen
DE10126020A1 (de) * 2001-05-28 2003-01-09 Olaf Berberich Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung
DE102010054242A1 (de) 2010-12-11 2012-06-14 Volkswagen Ag Verfahren zum Bereitstellen einer Bedienvorrichtung in einem Fahrzeug und Bedienvorrichtung
US11417319B2 (en) * 2017-09-21 2022-08-16 Kabushiki Kaisha Toshiba Dialogue system, dialogue method, and storage medium

Also Published As

Publication number Publication date
WO1998021711A1 (de) 1998-05-22

Similar Documents

Publication Publication Date Title
EP0540570B1 (de) Verfahren zur durchführung eines variablen dialogs mit technischen geräten
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
EP0994461A2 (de) Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung
DE2240557A1 (de) Spracherkennungsvorrichtung zum steuern von maschinen
EP1721245B1 (de) Verfahren zur auswahl eines listeneintrags und informations- oder unterhaltungssystem, insbesondere für kraftfahrzeuge
WO2016082904A1 (de) Kraftfahrzeug-bedienvorrichtung mit korrekturstrategie für spracherkennung
EP3526790B1 (de) Multimodaler dialog in einem kraftfahrzeug
DE19914631A1 (de) Eingabeverfahren in ein Fahrerinformationssystem
DE19646634A1 (de) Verfahren zur Befehlseingabe mit Sprache
EP0202404A1 (de) System zur Erkennung einzeln gesprochener Wörter
EP1282897A1 (de) Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems
DE102018215293A1 (de) Multimodale Kommunikation mit einem Fahrzeug
WO2001067435A9 (de) Verfahren zum sprachgesteuerten initiieren von in einem gerät ausführbaren aktionen durch einen begrenzten benutzerkreis
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE4225475A1 (de) Einrichtung zur Spracherkennung
EP0983906B1 (de) Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs
DE10129005B4 (de) Verfahren zur Spracherkennung und Spracherkennungssystem
DE19804047C2 (de) Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen
EP1457966A1 (de) Verfahren zum Ermitteln der Verwechslungsgefahr von Vokabulareinträgen bei der phonembasierten Spracherkennung
DE102017011415A1 (de) Vorrichtung und Verfahren zur Ermittlung akustischer Sprachsignale
DE102009058151A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems mit semantischer Bewertung und Sprachdialogsystem dazu
EP0519360B1 (de) Einrichtung und Verfahren zum Erkennen von Sprache
DE19711365A1 (de) Elektrisches Gerät
DE102022208762A1 (de) Textextraktion aus Audiodaten in einem Fahrzeug
DE102013019208A1 (de) Kraftfahrzeug-Sprachbedienung

Legal Events

Date Code Title Description
8139 Disposal/non-payment of the annual fee