DE19646634A1 - Command entry method using speech - Google Patents
Command entry method using speechInfo
- Publication number
- DE19646634A1 DE19646634A1 DE1996146634 DE19646634A DE19646634A1 DE 19646634 A1 DE19646634 A1 DE 19646634A1 DE 1996146634 DE1996146634 DE 1996146634 DE 19646634 A DE19646634 A DE 19646634A DE 19646634 A1 DE19646634 A1 DE 19646634A1
- Authority
- DE
- Germany
- Prior art keywords
- commands
- command
- entering
- entering commands
- confirmation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000012790 confirmation Methods 0.000 claims description 7
- 230000001755 vocal effect Effects 0.000 abstract 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B60—VEHICLES IN GENERAL
- B60R—VEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
- B60R16/00—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
- B60R16/02—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
- B60R16/037—Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
- B60R16/0373—Voice control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mechanical Engineering (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
Die Erfindung geht aus von einem Verfahren zur Befehlseingabe mit Sprache nach der Gattung des Hauptanspruchs.The invention is based on a method for Command entry with language according to the genus of Main claim.
Es sind bereits aus der Technik verschiedenste Anwendungen der Spracheingabe bekannt. Aus der EP 0 519 360 ist eine Einrichtung und ein Verfahren zum Erkennen von Sprache bekannt, das zur automatischen Telefonanwahl per Spracheingabe dient. Dabei werden die Namen der Personen, die angerufen werden sollen, über Sprache aufgerufen. Die Einrichtung vergleicht das Kommando mit einer Liste von gespeicherten Kommandos, bzw. Namen, und prüft auf weitgehende Ähnlichkeit. Zusätzlich kann die Einrichtung über ein lernfähiges neuronales Netzwerk trainiert und erweitert werden. Das Problem bei solchen Verfahren, ist eine sehr aufwendige Technik, die es ermöglicht, eindeutige Sprachbefehle herauszukristallisieren und auch Störgeräusche zu unterdrücken. Dieses aufwendige Spracherkennungsverfahren wird auf den Benutzer trainiert. Das gestaltet die Spracherkennung zwar sicherer und störungsunabhängiger, aber der technische Aufwand für die Spracherkennung steigt. There are various applications in technology known by voice input. One is known from EP 0 519 360 Device and method for recognizing speech known that for automatic telephone dialing by Voice input is used. The names of the people which should be called, called via voice. The Setup compares the command to a list of stored commands, or names, and checks for broad similarity. In addition, the facility trained via a learnable neural network and be expanded. The problem with such procedures is a very elaborate technique that makes it clear Crystallize voice commands and noise to suppress. This complex speech recognition process is trained on the user. That shapes the Speech recognition is more secure and independent of interference, but the technical effort for speech recognition increases.
Das erfindungsgemäße Verfahren zur Befehlseingabe mit den kennzeichnenden Merkmalen des Hauptanspruchs hat demgegenüber den Vorteil, daß die Befehlseingabe in einzelnen Schritten erfolgt, und nach jedem Befehl die erkannte Sequenz für den Benutzer dargestellt wird, der die Eingabe entweder bestätigen oder verwerfen kann.The inventive method for entering commands with the has characteristic features of the main claim in contrast, the advantage that the command entry in steps and after each command the recognized sequence is displayed for the user who the Can either confirm or reject the entry.
Durch die in den Unteransprüchen aufgeführten Maßnahmen ist eine vorteilhafte Weiterbildung und Verbesserung des im Hauptanspruch angegebenen Verfahrens zur Befehlseingabe möglich.By the measures listed in the subclaims advantageous training and improvement of the Main claim specified method for entering commands possible.
Besonders vorteilhaft ist es, wenn die Bestätigung vom Benutzer durch eine einfache JA/NEIN-Antwort erfolgen kann. Das ist eine sehr sichere und fehlerrobuste Art der Spracheingabe. Weiterhin ist es von Vorteil, z. B. bei sehr hohen Störgeräuschpegeln, die Bestätigung in Form der Betätigung einer Taste zu erledigen. Die Darstellung des von der Spracherkennung erkannten Befehlsequenz kann vorteilhafterweise akustisch erfolgen.It is particularly advantageous if the confirmation from User can be done with a simple YES / NO answer. This is a very safe and robust type of Voice input. It is also advantageous, for. B. at very high noise levels, confirmation in the form of Pressing a button. The representation of the of the command sequence recognized by the speech recognition advantageously done acoustically.
Ein weitere Ausbildung der Darstellung der erkannten Befehlsequenz ist die Ausgabe auf einen für den Benutzer sichtbaren Bildschirm. Vorteilhafterweise wird bei einer nicht eindeutigen Erkennung der Befehlsequenz eine Auswahl der möglichen Befehle auf einem Display dargestellt. Auch dazu kann man sich für den Einzelfall vorteilhafterweise eine akustische Ausgabe vorstellen. Bei Nichterkennen der Befehlsfolge kann dem Gerät durch eine erneute Eingabe des Befehls der Startbefehl wieder gegeben werden.A further training of the representation of the recognized Command sequence is output to one for the user visible screen. Advantageously, one ambiguous detection of the command sequence a selection of the possible commands shown on a display. Also this can be advantageous for the individual case present an acoustic output. If the Command sequence can be the device by entering the Command the start command can be given again.
Vorteilhafterweise ist es auch möglich, den Befehl zu buchstabieren. Eine Eingabe zu buchstabieren ist schneller und leichter durchzuführen, als eine Eingabe über eine Tastatur. Zudem kann in einer sehr lauten Umgebung der Störpegel so groß werden, daß nur über eine Buchstabierung der Befehle eine Spracheingabe noch möglich ist.It is also advantageously possible to close the command spell. Spelling an entry is faster and easier to carry out than an entry via Keyboard. In addition, in a very noisy environment the Noise levels become so great that only by spelling the commands a voice input is still possible.
Es ist ein Vorteil, daß die Befehle in zwei Gruppen unterteilt werden, wobei nur die kritischen Befehle vom Gerät dargestellt werden müssen.It is an advantage that the commands are in two groups are divided, with only the critical commands from Device must be displayed.
Ein erfindungsgemäßes Gerät, insbesondere ein Autoradiogerät, muß ein Mikrofon und einen Spracherkennungseinheit aufweisen. Dadurch muß der Fahrer des Fahrzeugs keine Hand zur Bedienung einsetzen.A device according to the invention, in particular a Car radio, must have a microphone and one Have speech recognition unit. This means the driver do not use a hand to operate the vehicle.
Ein Ausführungsbeispiel der Erfindung ist in der nachfolgenden Zeichnung dargestellt und in der folgenden Beschreibung näher erläutert.An embodiment of the invention is in the shown in the following drawing and in the following Description explained in more detail.
Es zeigt It shows
Fig. 1 ein Verfahrensschema der erfindungsgemäßen Befehlseingabe, Fig. 1 is a process diagram of the command input according to the invention,
Fig. 2 ein Gerät mit Möglichkeiten zur Spracheingabe. Fig. 2 shows a device with options for voice input.
Fig. 1 zeigt den Verfahrensablauf für die Befehlseingabe über Sprache. Der Sprachbefehl 1 wird über ein Mikrofon, z. B. eine Freisprecheinrichtung wie sie aus Telefongeräten seit langem bekannt ist, in das Gerät eingegeben. Im Gerät nimmt die Signalerkennung 2 den gesprochenen Befehl auf und entschlüsselt ihn. Dabei wird der Befehl im allgemeinen mit einem in der Spracherkennungsystem 2 vorliegenden Tabelle mit den vorhandenen und zu verstehenden Befehlen verglichen. Wählt das Gerät einen Befehl aus, wird er auf geeignete Art und Weise dargestellt 3. Die Darstellung kann dabei durch eine akustische Ausgabe des verstandenen Befehls erfolgen, oder über ein vorhandenes Display dem Benutzer angezeigt werden. Der Benutzer wird in einem nächsten Schritt die vom Gerät erkannte Befehlsequenz entweder bestätigen oder verwerfen. Hat die Spracherkennung den Befehl korrekt erkannt, wird der Befehl in Schritt 5 ausgeführt. Die Bestätigung des Benutzers ist im allgemeinen eine JA/NEIN-Aus sage 6, die ebenfalls akustisch eingegeben wird. Für den Fall, daß eine Befehlsequenz nicht eindeutig zugeordnet werden kann, wird die Spracherkennung 2 auf der Darstellung 3 eine Auswahl der möglichen Befehle darstellen. Der Benutzer wählt dann im Schritt 4 z. B. per Spracheingabe 1 einen dieser Befehle aus. Sollte durch einen erhöhten Geräuschpegel im Hintergrund des Gerätes keine Spracheingabe mehr vernünftig möglich sein, ist es für den Benutzer in diesem Schritt auch möglich, den Befehl zu buchstabieren oder über eine Tastatur 6 einzugeben. Der buchstabierte Befehl ist von der Spracherkennung leichter zu verstehen und die Ausführung des Befehls wird störungsunanfälliger. Es ist auch möglich, die Befehle, die für das Gerät zu verstehen sind, in zwei Gruppen einzuteilen. Dabei unterscheidet man unkritische Befehlskommandos, die ohne ein erneutes Darstellen und Bestätigen des Kommandos direkt ausgeführt werden können. Zum Beispiel gehören dazu Kommandos zu Lautstärkeregelung, Helligkeitsdarstellung usw. Kritische Befehle in der Gruppe 2 müssen allerdings immer dargestellt und bestätigt werden. Dazu gehören Befehle wie "Löschen", "Zurücksetzen", usw. Für die Ausführung der Befehle der Gruppe 1 kann ein Reset-Kommando definiert werden, z. B. die Spracheingabe "Falsch". Mit einer solchen Befehlsequenz ist der vorher getroffene und ausgeführte Befehl rückgängig zu machen. Fig. 1 shows the procedure for the command input via voice. The voice command 1 is a microphone, for. B. a hands-free device as it has long been known from telephone devices, entered into the device. In the device, signal recognition 2 picks up the spoken command and decrypts it. The command is generally compared with a table present in the speech recognition system 2 with the commands available and to be understood. If the device selects a command, it is displayed in a suitable manner. The display can take place by an acoustic output of the command understood, or can be shown to the user via an existing display. In a next step, the user will either confirm or reject the command sequence recognized by the device. If the speech recognition has recognized the command correctly, the command is carried out in step 5. The user's confirmation is generally a YES / NO from 6 , which is also entered acoustically. In the event that a command sequence cannot be clearly assigned, the speech recognition 2 on the representation 3 will represent a selection of the possible commands. The user then selects z in step 4. B. by voice 1 from one of these commands. If, due to an increased noise level in the background of the device, speech input is no longer reasonably possible, it is also possible for the user in this step to spell the command or to enter it via a keyboard 6 . The spelled command is easier to understand by speech recognition and the execution of the command is less prone to interference. It is also possible to divide the commands that are to be understood by the device into two groups. A distinction is made between uncritical command commands, which can be executed directly without having to display and confirm the command again. For example, this includes commands for volume control, brightness display, etc. Critical commands in group 2 must always be displayed and confirmed. This includes commands such as "delete", "reset", etc. A reset command can be defined to execute group 1 commands, e.g. B. the voice input "wrong". With such a command sequence, the command that was previously taken and executed must be undone.
Fig. 2 zeigt ein Ausführungsbeispiel für die Steuerung eines Autoradiogerätes 15 unter den Bedingungen, daß in einem fahrenden Kraftfahrzeug stets ein erhöhter Geräuschpegel vorzufinden ist. Über ein Mikrofon 7 wird der Sprachbefehl vom Gerät aufgenommen. Das Gerät besitzt einen Spracherkennungsmodul 8, in dem sich auch die Liste der bekannten und möglichen Befehle befindet. Im Spracherkennungsmodul 8 wird die Spracheingabe ausgewertet und das Ergebnis der Auswertung vom Prozessor 9 auf dem Display 10 dargestellt. Alternativ könnte man sich auch eine Ausgabe auf einen Lautsprecher 12 vorstellen. Sollte es sich um einen Befehl der Gruppe 1, also um einen unkritischen Befehl handeln, kann der Prozessor 9 über die Schaltung 14 den Befehl gleich zur Ausführung 11 weitergeben. Im Falle, daß es sich um kritische, gegebenenfalls irreversible Befehle handelt, muß der Prozessor zunächst den Befehl akustisch und/oder optisch darstellen und über die Schaltung 14 die Ausführung des Befehls unterbrechen. Erst nach einer erneuten Eingabe, wobei die Eingabe wieder über das Mikrofon 7 oder aber über eine Tastatur 13 erfolgen kann, kann der Prozessor den Befehl zur Ausführung 11 weitergeben. Fig. 2 shows an embodiment for the control of a car radio 15 under the conditions that there is always an increased noise level in a moving motor vehicle. The voice command is picked up by the device via a microphone 7 . The device has a speech recognition module 8 , which also contains the list of known and possible commands. The speech input is evaluated in the speech recognition module 8 and the result of the evaluation is shown by the processor 9 on the display 10 . Alternatively, one could also imagine an output on a loudspeaker 12 . If it is a group 1 command, that is to say an uncritical command, the processor 9 can pass on the command to the execution 11 via the circuit 14 . In the event that critical, possibly irreversible commands are involved, the processor must first represent the command acoustically and / or optically and interrupt the execution of the command via circuit 14 . The processor can only pass on the command for execution 11 after a new entry, in which case the entry can be made again via the microphone 7 or via a keyboard 13 .
Die Schaltung 13 ist im allgemeinen im Prozessor integriert und wird über eine geeignete Software verwirklicht.The circuit 13 is generally integrated in the processor and is implemented using suitable software.
Claims (11)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996146634 DE19646634A1 (en) | 1996-11-12 | 1996-11-12 | Command entry method using speech |
PCT/DE1997/002429 WO1998021711A1 (en) | 1996-11-12 | 1997-10-21 | Method for entering vocal orders |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996146634 DE19646634A1 (en) | 1996-11-12 | 1996-11-12 | Command entry method using speech |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19646634A1 true DE19646634A1 (en) | 1998-05-14 |
Family
ID=7811373
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1996146634 Withdrawn DE19646634A1 (en) | 1996-11-12 | 1996-11-12 | Command entry method using speech |
Country Status (2)
Country | Link |
---|---|
DE (1) | DE19646634A1 (en) |
WO (1) | WO1998021711A1 (en) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000023982A1 (en) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Method and device for information and/or messages by means of speech |
EP1001406A1 (en) * | 1998-11-09 | 2000-05-17 | Philips Corporate Intellectual Property GmbH | User support method by an automatic speech recognition system |
DE10006008A1 (en) * | 2000-02-11 | 2001-08-02 | Audi Ag | Speed control of a road vehicle is made by spoken commands processed and fed to an engine speed controller |
DE10120679A1 (en) * | 2001-04-27 | 2002-05-02 | Siemens Ag | Device for voice control of safety-relevant functions has connection between voice recognition and subsequent stages only released by operator signal after successful indication |
DE10126020A1 (en) * | 2001-05-28 | 2003-01-09 | Olaf Berberich | Automatic conversion of words spoken by speaker into digitally coded terms for processing by computer involves displaying term rejections in correction window for direct entry correction |
DE102010054242A1 (en) | 2010-12-11 | 2012-06-14 | Volkswagen Ag | Method for providing operating device for operating telephone device mounted in vehicle, involves determining input sequence fragment indicating continuation and completion of voice input, and providing graphic object for fragment |
DE10134908B4 (en) * | 2000-07-21 | 2013-05-08 | Denso Corporation | Speech recognition apparatus and methods using two opposite words |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5022081A (en) * | 1987-10-01 | 1991-06-04 | Sharp Kabushiki Kaisha | Information recognition system |
NL8802350A (en) * | 1988-09-23 | 1990-04-17 | Philips Nv | WORKSTATION FOR A COMPUTER SYSTEM INCLUDING AN IMAGE ELEMENT, AN ENTRY SYSTEM, AND AN AUDIO COMMUNICATION SYSTEM, AND A COMPUTER SYSTEM CONTAINING SUCH WORKSTATIONS. |
DE4408086A1 (en) * | 1994-03-10 | 1995-09-14 | Telefonbau & Normalzeit Gmbh | Method for recognizing spelled names or terms for communication switching systems |
CA2143980A1 (en) * | 1994-04-06 | 1995-10-07 | Raziel Haimi-Cohen | User display in speech recognition system |
DE4427444B4 (en) * | 1994-08-03 | 2004-07-29 | Robert Bosch Gmbh | Device and method for voice control of a device |
-
1996
- 1996-11-12 DE DE1996146634 patent/DE19646634A1/en not_active Withdrawn
-
1997
- 1997-10-21 WO PCT/DE1997/002429 patent/WO1998021711A1/en active Application Filing
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000023982A1 (en) * | 1998-10-16 | 2000-04-27 | Volkswagen Aktiengesellschaft | Method and device for information and/or messages by means of speech |
US7991618B2 (en) | 1998-10-16 | 2011-08-02 | Volkswagen Ag | Method and device for outputting information and/or status messages, using speech |
EP1001406A1 (en) * | 1998-11-09 | 2000-05-17 | Philips Corporate Intellectual Property GmbH | User support method by an automatic speech recognition system |
DE10006008A1 (en) * | 2000-02-11 | 2001-08-02 | Audi Ag | Speed control of a road vehicle is made by spoken commands processed and fed to an engine speed controller |
DE10134908B4 (en) * | 2000-07-21 | 2013-05-08 | Denso Corporation | Speech recognition apparatus and methods using two opposite words |
DE10120679A1 (en) * | 2001-04-27 | 2002-05-02 | Siemens Ag | Device for voice control of safety-relevant functions has connection between voice recognition and subsequent stages only released by operator signal after successful indication |
DE10126020A1 (en) * | 2001-05-28 | 2003-01-09 | Olaf Berberich | Automatic conversion of words spoken by speaker into digitally coded terms for processing by computer involves displaying term rejections in correction window for direct entry correction |
DE102010054242A1 (en) | 2010-12-11 | 2012-06-14 | Volkswagen Ag | Method for providing operating device for operating telephone device mounted in vehicle, involves determining input sequence fragment indicating continuation and completion of voice input, and providing graphic object for fragment |
US11417319B2 (en) * | 2017-09-21 | 2022-08-16 | Kabushiki Kaisha Toshiba | Dialogue system, dialogue method, and storage medium |
Also Published As
Publication number | Publication date |
---|---|
WO1998021711A1 (en) | 1998-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0540570B1 (en) | Process for carrying out a variable dialogue with technical equipment | |
DE60215272T2 (en) | Method and apparatus for inputting linguistic data under unfavorable conditions | |
EP0994461A2 (en) | Method for automatically recognising a spelled speech utterance | |
EP1342054B1 (en) | Method for controlling a voice input and output | |
DE2240557A1 (en) | VOICE RECOGNITION DEVICE FOR CONTROLLING MACHINERY | |
EP1721245B1 (en) | Method for selecting a list item and information or entertainment system, especially for motor vehicles | |
WO2016082904A1 (en) | Motor vehicle operating device with a correction strategy for voice recognition | |
EP3526790B1 (en) | Multimodal dialog in a motor vehicle | |
DE19914631A1 (en) | Input procedure in a driver information system | |
DE19646634A1 (en) | Command entry method using speech | |
EP0202404A1 (en) | Isolated words recognition system | |
WO2001086634A1 (en) | Method for creating a speech database for a target vocabulary in order to train a speech recognition system | |
DE102018215293A1 (en) | Multimodal communication with a vehicle | |
WO2001067435A9 (en) | Method for the voice-controlled initiation of actions by means of a limited circle of users, whereby said actions can be carried out in an appliance | |
EP3115886B1 (en) | Method for operating a voice controlled system and voice controlled system | |
DE4225475A1 (en) | Speech recognition device | |
EP0983906B1 (en) | Procedure and control device for operating vehicle technical devices | |
DE10129005B4 (en) | Method for speech recognition and speech recognition system | |
DE19804047C2 (en) | Method and device for increasing the probability of recognition of speech recognition systems | |
EP1063633A2 (en) | Method of training an automatic speech recognizer | |
EP1457966A1 (en) | Method for determining the risk of confusability of vocabulary entries for phoneme-based speech recognition | |
DE102017011415A1 (en) | Device and method for determining acoustic speech signals | |
DE102009058151A1 (en) | Speech dialog system operating method for e.g. operation of devices of car, involves differentiating graphical element with equal representation feature and other graphical element with unequal representation feature from each other | |
EP0519360B1 (en) | Apparatus and method for speech recognition | |
EP1414223B1 (en) | Text entry for a terminal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8139 | Disposal/non-payment of the annual fee |