DE19646634A1 - Verfahren zur Befehlseingabe mit Sprache - Google Patents
Verfahren zur Befehlseingabe mit SpracheInfo
- Publication number
- DE19646634A1 DE19646634A1 DE1996146634 DE19646634A DE19646634A1 DE 19646634 A1 DE19646634 A1 DE 19646634A1 DE 1996146634 DE1996146634 DE 1996146634 DE 19646634 A DE19646634 A DE 19646634A DE 19646634 A1 DE19646634 A1 DE 19646634A1
- Authority
- DE
- Germany
- Prior art keywords
- commands
- command
- entering
- entering commands
- confirmation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012790 confirmation Methods 0.000 claims description 7
- 230000001755 vocal effect Effects 0.000 abstract 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Mechanical Engineering (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Description
Die Erfindung geht aus von einem Verfahren zur
Befehlseingabe mit Sprache nach der Gattung des
Hauptanspruchs.
Es sind bereits aus der Technik verschiedenste Anwendungen
der Spracheingabe bekannt. Aus der EP 0 519 360 ist eine
Einrichtung und ein Verfahren zum Erkennen von Sprache
bekannt, das zur automatischen Telefonanwahl per
Spracheingabe dient. Dabei werden die Namen der Personen,
die angerufen werden sollen, über Sprache aufgerufen. Die
Einrichtung vergleicht das Kommando mit einer Liste von
gespeicherten Kommandos, bzw. Namen, und prüft auf
weitgehende Ähnlichkeit. Zusätzlich kann die Einrichtung
über ein lernfähiges neuronales Netzwerk trainiert und
erweitert werden. Das Problem bei solchen Verfahren, ist
eine sehr aufwendige Technik, die es ermöglicht, eindeutige
Sprachbefehle herauszukristallisieren und auch Störgeräusche
zu unterdrücken. Dieses aufwendige Spracherkennungsverfahren
wird auf den Benutzer trainiert. Das gestaltet die
Spracherkennung zwar sicherer und störungsunabhängiger, aber
der technische Aufwand für die Spracherkennung steigt.
Das erfindungsgemäße Verfahren zur Befehlseingabe mit den
kennzeichnenden Merkmalen des Hauptanspruchs hat
demgegenüber den Vorteil, daß die Befehlseingabe in
einzelnen Schritten erfolgt, und nach jedem Befehl die
erkannte Sequenz für den Benutzer dargestellt wird, der die
Eingabe entweder bestätigen oder verwerfen kann.
Durch die in den Unteransprüchen aufgeführten Maßnahmen ist
eine vorteilhafte Weiterbildung und Verbesserung des im
Hauptanspruch angegebenen Verfahrens zur Befehlseingabe
möglich.
Besonders vorteilhaft ist es, wenn die Bestätigung vom
Benutzer durch eine einfache JA/NEIN-Antwort erfolgen kann.
Das ist eine sehr sichere und fehlerrobuste Art der
Spracheingabe. Weiterhin ist es von Vorteil, z. B. bei sehr
hohen Störgeräuschpegeln, die Bestätigung in Form der
Betätigung einer Taste zu erledigen. Die Darstellung des von
der Spracherkennung erkannten Befehlsequenz kann
vorteilhafterweise akustisch erfolgen.
Ein weitere Ausbildung der Darstellung der erkannten
Befehlsequenz ist die Ausgabe auf einen für den Benutzer
sichtbaren Bildschirm. Vorteilhafterweise wird bei einer
nicht eindeutigen Erkennung der Befehlsequenz eine Auswahl
der möglichen Befehle auf einem Display dargestellt. Auch
dazu kann man sich für den Einzelfall vorteilhafterweise
eine akustische Ausgabe vorstellen. Bei Nichterkennen der
Befehlsfolge kann dem Gerät durch eine erneute Eingabe des
Befehls der Startbefehl wieder gegeben werden.
Vorteilhafterweise ist es auch möglich, den Befehl zu
buchstabieren. Eine Eingabe zu buchstabieren ist schneller
und leichter durchzuführen, als eine Eingabe über eine
Tastatur. Zudem kann in einer sehr lauten Umgebung der
Störpegel so groß werden, daß nur über eine Buchstabierung
der Befehle eine Spracheingabe noch möglich ist.
Es ist ein Vorteil, daß die Befehle in zwei Gruppen
unterteilt werden, wobei nur die kritischen Befehle vom
Gerät dargestellt werden müssen.
Ein erfindungsgemäßes Gerät, insbesondere ein
Autoradiogerät, muß ein Mikrofon und einen
Spracherkennungseinheit aufweisen. Dadurch muß der Fahrer
des Fahrzeugs keine Hand zur Bedienung einsetzen.
Ein Ausführungsbeispiel der Erfindung ist in der
nachfolgenden Zeichnung dargestellt und in der folgenden
Beschreibung näher erläutert.
Es zeigt
Fig. 1 ein
Verfahrensschema der erfindungsgemäßen Befehlseingabe,
Fig. 2 ein Gerät mit Möglichkeiten zur Spracheingabe.
Fig. 1 zeigt den Verfahrensablauf für die Befehlseingabe
über Sprache. Der Sprachbefehl 1 wird über ein Mikrofon,
z. B. eine Freisprecheinrichtung wie sie aus Telefongeräten
seit langem bekannt ist, in das Gerät eingegeben. Im Gerät
nimmt die Signalerkennung 2 den gesprochenen Befehl auf und
entschlüsselt ihn. Dabei wird der Befehl im allgemeinen mit
einem in der Spracherkennungsystem 2 vorliegenden Tabelle
mit den vorhandenen und zu verstehenden Befehlen verglichen.
Wählt das Gerät einen Befehl aus, wird er auf geeignete Art
und Weise dargestellt 3. Die Darstellung kann dabei durch
eine akustische Ausgabe des verstandenen Befehls erfolgen,
oder über ein vorhandenes Display dem Benutzer angezeigt
werden. Der Benutzer wird in einem nächsten Schritt die vom
Gerät erkannte Befehlsequenz entweder bestätigen oder
verwerfen. Hat die Spracherkennung den Befehl korrekt
erkannt, wird der Befehl in Schritt 5 ausgeführt. Die
Bestätigung des Benutzers ist im allgemeinen eine JA/NEIN-Aus
sage 6, die ebenfalls akustisch eingegeben wird. Für den
Fall, daß eine Befehlsequenz nicht eindeutig zugeordnet
werden kann, wird die Spracherkennung 2 auf der Darstellung
3 eine Auswahl der möglichen Befehle darstellen. Der
Benutzer wählt dann im Schritt 4 z. B. per Spracheingabe 1
einen dieser Befehle aus. Sollte durch einen erhöhten
Geräuschpegel im Hintergrund des Gerätes keine Spracheingabe
mehr vernünftig möglich sein, ist es für den Benutzer in
diesem Schritt auch möglich, den Befehl zu buchstabieren
oder über eine Tastatur 6 einzugeben. Der buchstabierte
Befehl ist von der Spracherkennung leichter zu verstehen und
die Ausführung des Befehls wird störungsunanfälliger. Es ist
auch möglich, die Befehle, die für das Gerät zu verstehen
sind, in zwei Gruppen einzuteilen. Dabei unterscheidet man
unkritische Befehlskommandos, die ohne ein erneutes
Darstellen und Bestätigen des Kommandos direkt ausgeführt
werden können. Zum Beispiel gehören dazu Kommandos zu
Lautstärkeregelung, Helligkeitsdarstellung usw. Kritische
Befehle in der Gruppe 2 müssen allerdings immer dargestellt
und bestätigt werden. Dazu gehören Befehle wie "Löschen",
"Zurücksetzen", usw. Für die Ausführung der Befehle der
Gruppe 1 kann ein Reset-Kommando definiert werden, z. B. die
Spracheingabe "Falsch". Mit einer solchen Befehlsequenz ist
der vorher getroffene und ausgeführte Befehl rückgängig zu
machen.
Fig. 2 zeigt ein Ausführungsbeispiel für die Steuerung
eines Autoradiogerätes 15 unter den Bedingungen, daß in
einem fahrenden Kraftfahrzeug stets ein erhöhter
Geräuschpegel vorzufinden ist. Über ein Mikrofon 7 wird der
Sprachbefehl vom Gerät aufgenommen. Das Gerät besitzt einen
Spracherkennungsmodul 8, in dem sich auch die Liste der
bekannten und möglichen Befehle befindet. Im
Spracherkennungsmodul 8 wird die Spracheingabe ausgewertet
und das Ergebnis der Auswertung vom Prozessor 9 auf dem
Display 10 dargestellt. Alternativ könnte man sich auch eine
Ausgabe auf einen Lautsprecher 12 vorstellen. Sollte es sich
um einen Befehl der Gruppe 1, also um einen unkritischen
Befehl handeln, kann der Prozessor 9 über die Schaltung 14
den Befehl gleich zur Ausführung 11 weitergeben. Im Falle,
daß es sich um kritische, gegebenenfalls irreversible
Befehle handelt, muß der Prozessor zunächst den Befehl
akustisch und/oder optisch darstellen und über die Schaltung
14 die Ausführung des Befehls unterbrechen. Erst nach einer
erneuten Eingabe, wobei die Eingabe wieder über das Mikrofon
7 oder aber über eine Tastatur 13 erfolgen kann, kann der
Prozessor den Befehl zur Ausführung 11 weitergeben.
Die Schaltung 13 ist im allgemeinen im Prozessor integriert
und wird über eine geeignete Software verwirklicht.
Claims (11)
1. Verfahren zur Befehlseingabe bei elektrischen Geräten,
insbesondere Autoradiogeräten, mit Hilfe von Sprachbefehlen
(1) in einer Umgebung mit hohen Störgeräuschpegeln, dadurch
gekennzeichnet, daß nach jedem Eingabeschritt (2) der
erkannte Sprachbefehl für den Benutzer dargestellt wird (3)
und vor der Ausführung (5) des erkannten Sprachbefehls eine
Bestätigung (1, 6) des Benutzers erfolgt.
2. Verfahren zur Befehlseingabe nach Anspruch 1, dadurch
gekennzeichnet, daß die Bestätigung in Form einer JA/NEIN-Ant
wort akustisch erfolgt.
3. Verfahren zur Befehlseingabe nach Anspruch 1 oder 2,
dadurch gekennzeichnet, daß die Bestätigung in Form einer
Eingabe über eine Tastatur erfolgt.
4. Verfahren zur Befehlseingabe nach Anspruch 1 bis 3,
dadurch gekennzeichnet, daß die erkannte Befehlsequenz
akustisch am Gerät ausgegeben wird.
5. Verfahren zur Befehlseingabe nach Anspruch 1 bis 4,
dadurch gekennzeichnet, daß bei einem Nichterkennen der
Befehlsequenz eine Auswahl ähnlicher Befehle dargestellt
wird.
6. Verfahren zur Befehlseingabe nach Anspruch 1 bis 5,
dadurch gekennzeichnet, daß die Auswahl der möglichen
Befehle auf einem Display dargestellt wird.
7. Verfahren zur Befehlseingabe nach Anspruch 1 bis 6,
dadurch gekennzeichnet, daß die Auswahl der möglichen
Befehle akustisch ausgegeben wird.
8. Verfahren zur Befehlseingabe nach Anspruch 1 bis 7,
dadurch gekennzeichnet, daß bei Nichterkennen der
Befehlsequenz der Befehl vom Benutzer als Buchstabenfolge
eingegeben wird.
9. Verfahren zur Befehlseingabe nach Anspruch 1 bis 8,
dadurch gekennzeichnet, daß die Eingabe der Buchstabenfolge
akustisch erfolgt.
10. Verfahren zur Befehlseingabe nach Anspruch 1 bis 9,
dadurch gekennzeichnet, daß die Spracherkennung zwischen
zwei verschiedenen Gruppen von Befehlen unterscheidet, wobei
die eine Gruppe nicht zur Anzeige gebracht werden muß.
11. Autoradiogerät (15) zur Durchführung des Verfahrens nach
den vorhergehenden Ansprüchen mit einem Prozessor (9) und
mit einer mit ihm verbundenen Spracherkennung (8), mit
Eingabe- (7, 13) und Ausgabeeinheiten (12, 10), dadurch
gekennzeichnet, daß der Prozessor (9) eine Schaltung (14)
steuert, die bei einer ersten Gruppe von Befehlen die
Ausführung der Befehle bis zu einer Bestätigung unterbricht
und die eine zweite Gruppe von Befehlen ohne Unterbrechung
ausführt.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996146634 DE19646634A1 (de) | 1996-11-12 | 1996-11-12 | Verfahren zur Befehlseingabe mit Sprache |
PCT/DE1997/002429 WO1998021711A1 (de) | 1996-11-12 | 1997-10-21 | Verfahren zur befehlseingabe mit sprache |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996146634 DE19646634A1 (de) | 1996-11-12 | 1996-11-12 | Verfahren zur Befehlseingabe mit Sprache |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19646634A1 true DE19646634A1 (de) | 1998-05-14 |
Family
ID=7811373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1996146634 Withdrawn DE19646634A1 (de) | 1996-11-12 | 1996-11-12 | Verfahren zur Befehlseingabe mit Sprache |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE19646634A1 (de) |
WO (1) | WO1998021711A1 (de) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000023982A1 (de) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Verfahren und vorrichtung zur ausgabe von informationen und/oder meldungen per sprache |
EP1001406A1 (de) * | 1998-11-09 | 2000-05-17 | Philips Corporate Intellectual Property GmbH | Verfahren zur Benutzerunterstützung durch ein automatisches Spracherkennungssystem |
DE10006008A1 (de) * | 2000-02-11 | 2001-08-02 | Audi Ag | Geschwindigkeitskontrollvorrichtung und Verfahren zur Kontrolle der Geschwindigkeit eines Fahrzeugs |
DE10120679A1 (de) * | 2001-04-27 | 2002-05-02 | Siemens Ag | Vorrichtung zur Sprachbedienung von gegebenenfalls sicherheitsrelevanten Funktionen |
DE10126020A1 (de) * | 2001-05-28 | 2003-01-09 | Olaf Berberich | Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung |
DE102010054242A1 (de) | 2010-12-11 | 2012-06-14 | Volkswagen Ag | Verfahren zum Bereitstellen einer Bedienvorrichtung in einem Fahrzeug und Bedienvorrichtung |
DE10134908B4 (de) * | 2000-07-21 | 2013-05-08 | Denso Corporation | Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5022081A (en) * | 1987-10-01 | 1991-06-04 | Sharp Kabushiki Kaisha | Information recognition system |
NL8802350A (nl) * | 1988-09-23 | 1990-04-17 | Philips Nv | Werkstation voor een computersysteem voorzien van een afbeeldelement, een ingavesysteem, en een audiokommunikatiesysteem, alsmede computersysteem bevattende zulke werkstations. |
DE4408086A1 (de) * | 1994-03-10 | 1995-09-14 | Telefonbau & Normalzeit Gmbh | Verfahren zur Erkennung von buchstabierten Namen oder Begriffen für Kommunikations-Vermittlungsanlagen |
CA2143980A1 (en) * | 1994-04-06 | 1995-10-07 | Raziel Haimi-Cohen | User display in speech recognition system |
DE4427444B4 (de) * | 1994-08-03 | 2004-07-29 | Robert Bosch Gmbh | Einrichtung und Verfahren zur Sprachsteuerung eines Geräts |
-
1996
- 1996-11-12 DE DE1996146634 patent/DE19646634A1/de not_active Withdrawn
-
1997
- 1997-10-21 WO PCT/DE1997/002429 patent/WO1998021711A1/de active Application Filing
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000023982A1 (de) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Verfahren und vorrichtung zur ausgabe von informationen und/oder meldungen per sprache |
US7991618B2 (en) | 1998-10-16 | 2011-08-02 | Volkswagen Ag | Method and device for outputting information and/or status messages, using speech |
EP1001406A1 (de) * | 1998-11-09 | 2000-05-17 | Philips Corporate Intellectual Property GmbH | Verfahren zur Benutzerunterstützung durch ein automatisches Spracherkennungssystem |
DE10006008A1 (de) * | 2000-02-11 | 2001-08-02 | Audi Ag | Geschwindigkeitskontrollvorrichtung und Verfahren zur Kontrolle der Geschwindigkeit eines Fahrzeugs |
DE10134908B4 (de) * | 2000-07-21 | 2013-05-08 | Denso Corporation | Spracherkennungsvorrichtung und Verfahren, welche zwei gegenteilige Wörter verwenden |
DE10120679A1 (de) * | 2001-04-27 | 2002-05-02 | Siemens Ag | Vorrichtung zur Sprachbedienung von gegebenenfalls sicherheitsrelevanten Funktionen |
DE10126020A1 (de) * | 2001-05-28 | 2003-01-09 | Olaf Berberich | Hybrides Diktier-/Dialogsystem für Spracheingabe und Tastaturbestätigung |
DE102010054242A1 (de) | 2010-12-11 | 2012-06-14 | Volkswagen Ag | Verfahren zum Bereitstellen einer Bedienvorrichtung in einem Fahrzeug und Bedienvorrichtung |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
WO1998021711A1 (de) | 1998-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0540570B1 (de) | Verfahren zur durchführung eines variablen dialogs mit technischen geräten | |
DE60215272T2 (de) | Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen | |
EP0994461A2 (de) | Verfahren zur automatischen Erkennung einer buchstabierten sprachlichen Äusserung | |
DE2240557A1 (de) | Spracherkennungsvorrichtung zum steuern von maschinen | |
EP1721245B1 (de) | Verfahren zur auswahl eines listeneintrags und informations- oder unterhaltungssystem, insbesondere für kraftfahrzeuge | |
WO2016082904A1 (de) | Kraftfahrzeug-bedienvorrichtung mit korrekturstrategie für spracherkennung | |
EP3526790B1 (de) | Multimodaler dialog in einem kraftfahrzeug | |
DE19914631A1 (de) | Eingabeverfahren in ein Fahrerinformationssystem | |
DE19646634A1 (de) | Verfahren zur Befehlseingabe mit Sprache | |
EP0202404A1 (de) | System zur Erkennung einzeln gesprochener Wörter | |
EP1282897A1 (de) | Verfahren zum erzeugen einer sprachdatenbank für einen zielwortschatz zum trainieren eines spracherkennungssystems | |
DE102018215293A1 (de) | Multimodale Kommunikation mit einem Fahrzeug | |
WO2001067435A9 (de) | Verfahren zum sprachgesteuerten initiieren von in einem gerät ausführbaren aktionen durch einen begrenzten benutzerkreis | |
EP3115886B1 (de) | Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem | |
DE4225475A1 (de) | Einrichtung zur Spracherkennung | |
EP0983906B1 (de) | Verfahren und Steuereinrichtung zur Bedienung technischer Einrichtungen eines Fahrzeugs | |
DE10129005B4 (de) | Verfahren zur Spracherkennung und Spracherkennungssystem | |
DE19804047C2 (de) | Verfahren und Einrichtung zur Erhöhung der Erkennungswahrscheinlichkeit von Spracherkennungssystemen | |
EP1457966A1 (de) | Verfahren zum Ermitteln der Verwechslungsgefahr von Vokabulareinträgen bei der phonembasierten Spracherkennung | |
DE102017011415A1 (de) | Vorrichtung und Verfahren zur Ermittlung akustischer Sprachsignale | |
DE102009058151A1 (de) | Verfahren zum Betreiben eines Sprachdialogsystems mit semantischer Bewertung und Sprachdialogsystem dazu | |
EP0519360B1 (de) | Einrichtung und Verfahren zum Erkennen von Sprache | |
DE19711365A1 (de) | Elektrisches Gerät | |
DE102022208762A1 (de) | Textextraktion aus Audiodaten in einem Fahrzeug | |
DE102013019208A1 (de) | Kraftfahrzeug-Sprachbedienung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |