DE102009058151A1 - Speech dialog system operating method for e.g. operation of devices of car, involves differentiating graphical element with equal representation feature and other graphical element with unequal representation feature from each other - Google Patents
Speech dialog system operating method for e.g. operation of devices of car, involves differentiating graphical element with equal representation feature and other graphical element with unequal representation feature from each other Download PDFInfo
- Publication number
- DE102009058151A1 DE102009058151A1 DE102009058151A DE102009058151A DE102009058151A1 DE 102009058151 A1 DE102009058151 A1 DE 102009058151A1 DE 102009058151 A DE102009058151 A DE 102009058151A DE 102009058151 A DE102009058151 A DE 102009058151A DE 102009058151 A1 DE102009058151 A1 DE 102009058151A1
- Authority
- DE
- Germany
- Prior art keywords
- dialog
- dialogues
- speech
- dialogue system
- inputs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011017 operating method Methods 0.000 title description 2
- 238000000034 method Methods 0.000 claims abstract description 39
- 230000006870 function Effects 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 11
- 230000009471 action Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
Die vorliegende Erfindung betrifft ein Verfahren zum Betreiben eines Sprachdialogsystems, bei dem zu einem Dialog gehörige Spracheingaben erfasst und gespeichert werden und gespeicherte Dialoge durch graphische Elemente, die jeweils einem Dialog zugeordnet sind, auf einer Anzeigefläche dargestellt werden. Die Erfindung betrifft ferner ein entsprechend ausgestaltetes Sprachdialogsystem.The present invention relates to a method for operating a speech dialogue system in which speech inputs belonging to a dialog are recorded and stored and stored dialogues are displayed on a display surface by graphical elements, which are each associated with a dialog. The invention further relates to a correspondingly designed speech dialogue system.
Sprachdialogsysteme finden ein breites Anwendungsspektrum für Bediensysteme. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Auch hat sich die Bedienung von Einrichtungen eines Fahrzeugs über Spracheingaben als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Zur Eingabe komplexer Sachverhalte wird eine entsprechende Information von einem Sprachdialogsystem sequentiell vom Benutzer abgefragt. Dies geschieht durch einen von dem Sprachdialogsystem geführten Dialog, welcher sich dem Benutzer als eine logisch aufeinander aufbauende Reihe von Fragen darstellt. Die Fragen dienen dabei insbesondere zur Eingrenzung eines Sachverhalts, bis das Sprachdialogsystem zu einer eindeutigen Reaktion in der Lage ist.Speech dialogue systems find a wide range of applications for operating systems. This applies equally to the operation of devices and the completion of telephone tasks using voice computers, such as telephone banking. Also, the operation of facilities of a vehicle via voice inputs has become established as an essential feature of current user interfaces in the vehicle. For inputting complex facts, corresponding information from a speech dialogue system is requested sequentially by the user. This is done by a dialog conducted by the speech dialogue system, which presents itself to the user as a logically consecutive series of questions. In particular, the questions serve to narrow down the facts until the speech dialogue system is able to respond unequivocally.
Dabei wird der Dialog primär sprachlich beziehungsweise akustisch zwischen dem Sprachdialogssystem und dem Benutzer geführt. Bei einigen nach dem Stand der Technik bekannten Sprachdialogsystemen wird die akustische Ausgabe des Sprachdialogssystems zusätzlich als Text auf einer Anzeigefläche dargestellt. Die Anzeigefläche kann dabei über eine berührungsempfindliche Oberfläche verfügen. Der Benutzer muss bei den heute bekannten Sprachdialogsystemen bei einer Spracheingabe typischerweise auf eine bestimmte Taste („Push-To-Talk”-Taste) drücken, welche einen Spracherkenner aktiviert, um die Spracheingabe des Benutzers aufzuzeichnen.In this case, the dialogue is primarily conducted linguistically or acoustically between the speech dialogue system and the user. In some known in the art speech dialogue systems, the acoustic output of the speech dialogue system is additionally displayed as text on a display surface. The display surface can have a touch-sensitive surface. The user must typically press on a particular key ("push-to-talk" key), which activates a speech recognizer to record the speech input of the user in the speech dialogue systems known today at voice input.
In der
Die
In der
Als nachteilig hat sich herausgestellt, dass es dem Nutzer nur schwer möglich ist, innerhalb eines Dialogs zu einer beliebigen Stelle zurückzuspringen, um eine bereits getätigte Eingabe zu wiederholen oder abzuändern. Dies ist jedoch in der Praxis wünschenswert, da in manchen Fällen erst nach der entsprechenden Reaktion des Sprachdialogsystems auf eine Eingabe, des Benutzers der Sinn oder die semantische Wirkung der Eingabe von dem Benutzer eingeschätzt werden kann. Ferner kann es sich um einen zu einem in der Vergangenheit getätigten ähnlichen Sprachdialog handeln, der nur noch leicht modifiziert werden müsste, um somit die Interaktion zwischen dem Sprachdialogsystem und dem Benutzer abzukürzen.A disadvantage has been found that it is difficult for the user to jump back to any point within a dialogue to repeat or modify an input already made. However, this is desirable in practice, since in some cases, only after the appropriate response of the speech dialogue system to an input, the user's sense, or the semantic effect of the input can be estimated by the user. Furthermore, it may be a similar speech dialogue that has taken place in the past, which would only have to be slightly modified in order to shorten the interaction between the speech dialogue system and the user.
Selbst wenn Sprachdialoge zusätzlich als Text auf einer Anzeige dargestellt werden, kann insbesondere bei einer entsprechend großen Anzahl an dargestellten Dialogen oder bei langen Dialogverläufen das Auffinden und manuelle Navigieren zu einem gesuchten Dialogbaustein sehr zeit- und interaktionsaufwändig sein. Dies ist insbesondere bei einem Einsatz in einem Fahrzeug nachteilig.Even if speech dialogues are additionally displayed as text on a display, finding and manually navigating to a sought-after dialog building block can be very time-consuming and expensive, especially in the case of a correspondingly large number of displayed dialogs or in the case of long dialog histories. This is particularly disadvantageous when used in a vehicle.
Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren zum Betreiben eines Sprachdialogsystems sowie ein entsprechendes Sprachdialogsystem der eingangs erwähnten Art anzugeben, bei denen bestimmte, auf einer Anzeigefläche dargestellte Dialoge oder Teile davon schnell aufgefunden werden können.It is the object of the present invention to provide a method for operating a speech dialogue system as well as a corresponding speech dialogue system of the kind mentioned in which certain dialogues or parts thereof displayed on a display surface can be found quickly.
Diese Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Anspruchs 1 und einem Sprachdialogsystem mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Aus- und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.This object is achieved by a method having the features of
Das erfindungsgemäße Verfahren ist dadurch gekennzeichnet, dass die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zugewiesen werden und graphische Elemente, die zu Dialogen gleicher Kategorie gehören mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht. Dies ermöglicht das schnelle Auffinden in der Vergangenheit aufgezeichneter Dialoge oder Dialogbausteine. Das Verfahren ist insbesondere für den Fahrer eines Fahrzeugs vorteilhaft, da er mit einem kurzen Blick schnell die für die Situation relevanten Dialoge oder Dialogbausteine erkennen kann, kann, dabei vom Straßenverkehr abgelenkt zu werden.The method according to the invention is characterized in that the dialogues are assigned to different categories depending on the content of the speech inputs belonging to the dialogs, and graphic elements which belong to dialogues of the same category have at least one same display feature, and graphic elements which are used for dialogues of different categories belong, have at least one unequal representation feature that makes them visually distinguishable from each other. This allows you to quickly find in the past recorded dialogues or dialog blocks. The method is particularly advantageous for the driver of a vehicle, since he can quickly recognize the relevant for the situation dialogues or dialog blocks can be distracted while driving from the road.
Insbesondere können die Spracheingaben semantisch analysiert werden und die Dialoge in Abhängigkeit von Schlüsselwörtern, die in den Spracheingaben der Dialoge vorkommen, verschiedenen Kategorien zugewiesen werden. Für den Fall, dass ein Dialog mangels fehlender semantischer Erkennung keiner bestimmten Kategorie zugeordnet werden kann, beispielsweise durch eine unvollständige Eingabe oder einen Dialogabbruch, besteht die Möglichkeit, solche Dialoge einer gesonderten Kategorie zuzuordnen, die alle undefinierten oder neutralen Dialoge enthält. Werden solche Dialoge ausgewählt und erweitert oder abgeändert, so kann gegebenenfalls zu einem späteren Zeitpunkt eine Zuordnung zu einer bestimmten Kategorie erfolgen. In particular, the speech inputs can be semantically analyzed and the dialogues assigned to different categories depending on keywords that appear in the speech inputs of the dialogues. In the event that a dialog can not be assigned to a specific category due to a lack of semantic recognition, for example by an incomplete input or a dialog abort, it is possible to assign such dialogs to a separate category containing all undefined or neutral dialogs. If such dialogues are selected and expanded or modified, an assignment to a specific category can optionally be made at a later date.
Die Spracheingaben werden typischerweise als Dialogbausteine erfasst, wobei die dargestellten graphischen Elemente der Dialoge auswählbar sind. Nach Auswahl eines graphischen Elements werden die Dialogbausteine des zugehörigen Dialogs angezeigt. Ein Dialog setzt sich somit aus mehreren Dialogbausteinen zusammen. Um bei dem erfindungsgemäßen Verfahren zu einem bestimmten Dialogbaustein zu navigieren, wählt der Nutzer zunächst das graphische Element eines zugehörigen Dialogs aus. Den zugehörigen Dialog kann der Nutzer leicht anhand der zu den Kategorien gehörigen Darstellungsmerkmale erkennen. Nach der Auswahl des graphischen Elements kann der Nutzer den gewünschten Dialogbaustein auswählen. Auf diese Weise ist es innerhalb des Sprachdialogsystems möglich, schnell zu einer bestimmten Spracheingabe zu gelangen und den Dialog dann fortzusetzen. Es müssen insbesondere nicht alle Spracheingaben zu Dialogbausteinen wiederholt werden, welche dem ausgewählten Dialogbaustein in dem betreffenden Dialog vorangehen. Auf diese Weise kann die Spracheingabe erheblich verkürzt und vereinfacht werden.The voice inputs are typically recorded as dialog blocks, the displayed graphical elements of the dialogs are selectable. After selecting a graphical element, the dialog modules of the corresponding dialog are displayed. A dialog thus consists of several dialog modules. In order to navigate in the method according to the invention to a specific dialog module, the user first selects the graphical element of an associated dialog. The associated dialog can be easily recognized by the user based on the display features associated with the categories. After selecting the graphic element, the user can select the desired dialog module. In this way it is possible within the speech dialogue system, to quickly get to a specific voice input and then continue the dialogue. In particular, it is not necessary to repeat all speech inputs for dialog blocks which precede the selected dialog block in the relevant dialog. In this way, the speech input can be significantly shortened and simplified.
Dialogbausteine können neben einer erfassten Spracheingabe auch durch Ausgaben des Sprachdialogsystems, beispielsweise eine Rückfrage an den Benutzer oder eine Ankündigung zur Ausführung einer Aktion, gebildet werden. Das Auswählen von Dialogen oder Dialogbausteinen kann dabei auf verschiedene Art, beispielsweise akustisch oder manuell erfolgen. Die semantische Analyse der Schlüsselwörter in den Dialogbausteinen, der hierarchische Aufbau der Dialoge sowie deren Darstellung in aus den Schlüsselwörtern abgeleiteten visuell differenzierten Kategorien ermöglicht ein bequemes und zielgerichtetes Navigieren durch die auf der Anzeigefläche dargestellten Dialoge.Dialog modules can be formed in addition to a recorded speech input also by outputs of the speech dialogue system, such as a query to the user or an announcement to perform an action. The selection of dialogs or dialog modules can be done in various ways, for example, acoustically or manually. The semantic analysis of the keywords in the dialog modules, the hierarchical structure of the dialogues as well as their representation in the visually differentiated categories derived from the keywords enables a comfortable and targeted navigation through the dialogues displayed on the display area.
Vorteilhafterweise kann das erfindungsgemäße Verfahren so ausgestaltet sein, dass eine neue Spracheingabe als Dialogbaustein erfasst oder ein auf der Anzeigefläche dargestellter Dialogbaustein ausgewählt wird, wobei dann in dem Dialogbaustein Schlüsselwörter identifiziert werden, mittels denen eine sortierte Trefferliste zu assoziierten Funktionen, die über das Sprachdialogsystem ausführbar sind, erzeugt wird und die Trefferliste nach Beendigung der Spracheingabe oder nach der Auswahl des auf der Anzeigefläche dargestellten Dialogbausteins auf der Anzeigefläche angezeigt wird.Advantageously, the inventive method can be configured so that a new speech input detected as a dialog module or a displayed on the display dialog module is selected, then in the dialog module keywords are identified by means of which a sorted list of hits to associated functions that are executable through the speech dialogue system , is generated and the hit list after completion of the voice input or after the selection of the displayed on the display surface dialog box is displayed on the display surface.
Die Trefferliste kann einen oder mehrere Einträge haben oder auch leer sein. Zweckmäßigerweise wird eine längere Liste mit typischerweise mehr als drei bis fünf Einträgen nach der Relevanz sortiert, da alle Einträge nicht mehr auf einen Blick vom Benutzer visuell erfassbar wären. Wenn kein passender Eintrag gefunden wird, kann entweder als Ergebnis eine leere Liste ausgegeben werden oder eine Liste der nächstbesten, möglicherweise nicht relevanten Treffer. Auch kann ein sogenanntes Konfidenzmaß, beispielsweise in Prozent, angezeigt werden, das als Relevanzmaß der Einträge in der Trefferliste dient.The hit list can have one or more entries or be empty. Conveniently, a longer list of typically more than three to five entries is sorted by relevance since all entries would no longer be visually detectable by the user at a glance. If no matching entry is found, either an empty list can be output as a result or a list of the next best, possibly irrelevant, hits. It is also possible to display a so-called confidence measure, for example in percent, which serves as relevance measure of the entries in the hit list.
Eine solche Trefferliste ermöglicht eine gute Vernetzung zwischen den Dialogbausteinen. Will beispielsweise ein Benutzer einen speziellen, komplexen Bedienvorgang starten, der in ähnlicher Form bereits früher eingegeben wurde, so kann er mittels der visuell differenzierten Kategorien schnell einen relevanten Dialog auffinden, diesen auswählen, wodurch die dazugehörigen Dialogbausteine zur Anzeige gebracht werden. Nach Auswahl eines Dialogbausteins werden ihm alle semantisch ähnlichen Dialogbausteine aus diesem und anderen Dialogen nach einer semantischen Relevanz berechnet und sortiert in einer Liste, dargestellt.Such a list of hits enables good networking between the dialog modules. If, for example, a user wants to start a special, complex operating procedure which has already been entered in a similar form earlier, he can quickly find a relevant dialog by means of the visually differentiated categories, select the latter, whereby the associated dialog modules are displayed. After selecting a dialog module, all semantically similar dialog modules from this and other dialogs are calculated for a semantic relevance and sorted into a list.
In einer Ausgestaltung des erfindungsgemäßen Verfahrens wird durch Auswahl eines Dialogbausteins, welcher eine Angabe einer über das Sprachdialogsystem ausführbaren Funktion umfasst, die entsprechende Funktion nochmals ausgeführt.In one embodiment of the method according to the invention, the corresponding function is executed again by selecting a dialog module which includes an indication of a function that can be executed via the speech dialog system.
Bei dem erfindungsgemäßen Verfahren sind die systemseitig bekannten Schlüsselwörter aus vorherigen Spracheingaben extrahiert worden und/oder im Sprachdialogsystem vordefiniert. Letzteres hat den Vorteil, dass zu den über das Sprachdialogsystem ausführbaren Funktionen passende Schlüsselwörter systemseitig definiert sind, ohne dass ein Benutzer die Funktion vorher hätte benutzt haben müssen. Die Extraktion aus vorherigen Spracheingaben ist vorteilhaft, um ein nutzerspezifisches Verhalten besser berücksichtigen zu können. Insbesondere immer wieder gewählte Navigationsziele, Rufnummern oder Radiosender können so systemseitig als hochrelevante Schlüsselwörter erkannt und für die semantische Bewertung von Spracheingaben eines Benutzers berücksichtigt werden. Die Schlüsselwörter können dabei durch ein von Suchmaschinen bekanntes Verfahren zur Informationskonsolidierung, dem sogenannten „automatic summarization”, ermittelt werden.In the method according to the invention, the keywords known from the system have been extracted from previous voice inputs and / or predefined in the voice dialogue system. The latter has the advantage that suitable keywords are defined on the system side for the functions that can be executed via the speech dialogue system, without a user having to have used the function beforehand. The extraction from previous voice inputs is advantageous in order to better take into account user-specific behavior. In particular, repeatedly selected navigation destinations, phone numbers or radio stations can be recognized on the system side as highly relevant keywords and taken into account for the semantic evaluation of a user's speech input. The keywords can be identified by a method known by search engines for information consolidation, the so-called "automatic summarization", are determined.
Insbesondere können zu Schlüsselwörtern auch Synonyme, Antonyme und assoziierte Begriffe gebildet werden, die bei der semantischen Analyse berücksichtigt werden. Dabei können Synonyme oder assoziierte Begriffe eine den dazugehörigen Schlüsselwörtern äquivalente Wirkung besitzen, vor allem für die Kategoriezuordnung und für die Relevanzbewertung bei der Bildung der Trefferlisten. Die Funktion der Antonyme kann unterschiedlich ausfallen. Sie können Hinweise für die Nichtrelevanz eines Dialogbausteins liefern, kontextspezifisch aber auch eine besondere Relevanz andeuten, beispielsweise wenn eine kurz zuvor ausgeführte Aktion rückgängig gemacht werden soll. In diesem Falle könnte bei Eingabe desselben Navigationsziels kurz hintereinander zu dem Dialogbaustein „Ziel Eingeben” auch der relevante Dialogbaustein „Ziel löschen” angezeigt werden.In particular, keywords, synonyms, antonyms and associated terms can be formed, which are taken into account in the semantic analysis. Synonyms or associated terms can have an equivalent effect on the associated keywords, especially for category assignment and relevance assessment in the formation of hit lists. The function of the antonyms may vary. They can provide pointers to the non-relevance of a dialog module, but may also indicate specific relevance for the context, for example, if an action performed shortly before is to be undone. In this case, when entering the same navigation destination in quick succession, the relevant dialog block "Delete target" could also be displayed for the "Enter target" dialog box.
In einer Ausgestaltung des erfindungsgemäßen Verfahrens umfassen graphische Elemente zur Darstellung eines Dialogs eine Textdarstellung, die aus je einem aus Schlüsselwörtern gebildetem Objekt und Prädikat besteht. Vorteilhafterweise wird die Darstellung dabei so an die Anzeigefläche angepasst, dass eine einzeilige Darstellung möglich ist. Idealerweise werden Prädikat und Objekt aus der letzten Systemaktion des Dialogs gebildet. Dies ermöglicht dem Benutzer, den Kern eines Dialogs schnell semantisch zu erfassen, was die Interaktionszeit mit dem System weiter optimiert.In one embodiment of the method according to the invention, graphic elements for representing a dialog comprise a text representation which consists of an object and a predicate composed of keywords. Advantageously, the presentation is adapted to the display surface so that a one-line representation is possible. Ideally, the predicate and the object are formed from the last system action of the dialog. This allows the user to quickly semantically capture the core of a conversation, further optimizing interaction time with the system.
Alternativ oder auch zusätzlich kann ein Darstellungsmerkmal eines graphischen Elements zur optischen Unterscheidbarkeit der Kategorien der Dialoge aus einer Farbcodierung und/oder einem Zusatzelement bestehen. Ein solches Zusatzelement ist beispielsweise ein Logo oder eine Ikone. Werden dabei, gemäß einer typischen Anwendung des erfindungsgemäßen Verfahrens, die Kategorien, denen die Dialoge zugewiesen werden, aus den durch das Sprachdialogsystem ausführbaren Funktionen und/oder den dazugehörigen Funktionseinrichtungen gebildet, z. B. einem Navigationsgerät oder einer Mobilfunkeinrichtung in einem Fahrzeug, so können diese durch entsprechende Logos, beispielsweise einem symbolischen Kartenausschnitt oder einem symbolischen Telefon, gekennzeichnet werden.Alternatively or additionally, a representation feature of a graphic element for the optical differentiation of the categories of the dialogues can consist of a color coding and / or an additional element. Such an additional element is for example a logo or an icon. In this case, according to a typical application of the method according to the invention, the categories to which the dialogues are assigned are formed from the functions executable by the speech dialogue system and / or the associated functional devices, eg. As a navigation device or a mobile device in a vehicle, they can be characterized by appropriate logos, such as a symbolic map or a symbolic phone.
Das erfindungsgemäße Sprachdialogsystem umfasst Mittel zum Erfassen von Spracheingaben, insbesondere als Dialogbausteine, eine Speichervorrichtung zum Speichern der erfassten Spracheingaben, eine Anzeigefläche zur Darstellung von graphischen Elementen, die jeweils einem Dialog zugeordnet sind, eine Steuervorrichtung zum Steuern der graphischen Darstellung der den Dialogen zugeordneten Elemente auf der Anzeigefläche und eine Schnittstelle zu einer durch das Sprachdialogsystem zu steuernde Funktionseinrichtung. Das erfindungsgemäße Sprachdialogsystem ist dadurch gekennzeichnet, dass es eine semantische Bewertungseinrichtung umfasst, mittels derer die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind und mittels der Steuervorrichtung die Anzeigefläche so ansteuerbar ist, dass graphische Elemente, die zu Dialogen gleicher Kategorie gehören, mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht.The speech dialogue system according to the invention comprises means for detecting speech inputs, in particular as dialog blocks, a memory device for storing the detected speech inputs, a display area for displaying graphical elements, each associated with a dialog, a control device for controlling the graphical representation of the elements associated with the dialogues the display area and an interface to a functional device to be controlled by the speech dialogue system. The speech dialogue system according to the invention is characterized in that it comprises a semantic evaluation device by means of which the dialogues are assignable to different categories depending on the content of the speech inputs belonging to the dialogs and the display surface can be controlled by the control device in such a way that graphic elements that become dialogues belong to the same category, have at least one same display feature, and graphical elements that belong to dialogues of different categories, have at least one unequal representation feature that makes them visually distinguishable from each other.
Typischerweise umfasst die Funktionseinrichtung eine Infotainment- und/oder Fahrerassistenzeinrichtung in einem Fahrzeug. Zu Infotainmenteinrichtungen gehören insbesondere Rundfunk- oder Fernsehempfänger, Mobilfunkgeräte, Kassetten- oder CD-Spieler sowie andere Unterhaltungselektronik. Unter den Begriff Fahrerassistenzeinrichtung fallen insbesondere Navigationsgeräte und Geräte zu den Fahrzeugeinstellungen wie die Klimaanlage.Typically, the functional device includes an infotainment and / or driver assistance device in a vehicle. Infotainment facilities include in particular radio or television receivers, mobile devices, cassette or CD players and other consumer electronics. The term driver assistance device includes in particular navigation devices and devices to the vehicle settings such as the air conditioning.
Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug zu den Figuren näher erläutert.The invention will now be explained in more detail by means of embodiments with reference to the figures.
In
Mittels der Steuervorrichtung
Erfindungsgemäß umfasst das Sprachdialogsystem
Die Steuervorrichtung
Typischerweise wird die Schnittstelle
Vorzugsweise ist das erfindungsgemäße Sprachdialogsystem
In
Die Dialogbausteine
Ferner kann in der semantischen Bewertungsinstanz
In
Die graphischen Elemente
Die graphischen Elemente
In
Die Trefferliste
Um das Verfahren und die oben erläuterten prinzipiellen Verfahrensschritte weiter zu veranschaulichen, werden im Folgenden ein paar Beispiele mit Bezug zu den
Beispiel 1:Example 1:
Ein Benutzer führt einen Dialog
Beispiel 2:Example 2:
Der Benutzer vom ersten Beispiel möchte den Radiosender neu einstellen. Er sucht in der auf der Anzeigefläche
Beispiel 3:Example 3:
Ein Benutzer möchte über die Kommunikationseinrichtung
BezugszeichenlisteLIST OF REFERENCE NUMBERS
- 1010
- SprachdialogsystemVoice control system
- 1111
- Mittel zum Erfassen von SpracheingabenMeans for detecting speech input
- 1212
- Speichervorrichtungstorage device
- 1313
- Anzeigeflächedisplay area
- 1414
- Steuervorrichtungcontrol device
- 1515
- semantische Bewertungseinrichtungsemantic evaluation device
- 1616
- Schnittstelleinterface
- 1717
- Benutzeruser
- 1818
- Funktionseinrichtungfunctional device
- 18a18a
- Navigationssystemnavigation system
- 18b18b
- Infotainmenteinrichtunginfotainment device
- 18c18c
- Kommunikationseinrichtungcommunicator
- 18d18d
- Fahrzeugeinstellungenvehicle settings
- 1919
- Lautsprecherspeaker
- 2020
- Dialogdialog
- 2121
- DialogbausteinText block
- 21a21a
- ausgewählter DialogbausteinSelected dialog module
- 2222
- Schlüsselwortkeyword
- 2323
- Trefferlistehit list
- 2424
- graphisches Elementgraphic element
- 24a–d24a-d
- Ausgestaltungsbeispiele der zu den Funktionseinrichtungen gehörigen ElementeExemplary embodiments of the elements belonging to the functional devices
- 2525
- Textdarstellungtext display
- 2626
- Anzeigefelddisplay
- 2727
- Semantische ProzedurSemantic procedure
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- DE 102007037567 A1 [0004] DE 102007037567 A1 [0004]
- DE 60309822 T2 [0005] DE 60309822 T2 [0005]
- EP 1959430 A2 [0006] EP 1959430 A2 [0006]
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102009058151.0A DE102009058151B4 (en) | 2009-12-12 | 2009-12-12 | Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102009058151.0A DE102009058151B4 (en) | 2009-12-12 | 2009-12-12 | Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102009058151A1 true DE102009058151A1 (en) | 2011-06-16 |
DE102009058151B4 DE102009058151B4 (en) | 2020-08-20 |
Family
ID=43992893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102009058151.0A Expired - Fee Related DE102009058151B4 (en) | 2009-12-12 | 2009-12-12 | Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102009058151B4 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013019208A1 (en) * | 2013-11-15 | 2015-05-21 | Audi Ag | Motor vehicle voice control |
DE102022000387A1 (en) | 2022-02-01 | 2023-08-03 | Mercedes-Benz Group AG | Method for processing voice inputs and operating device for controlling vehicle functions |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10218680A1 (en) * | 2002-04-26 | 2003-11-06 | Bosch Gmbh Robert | Method for operating control of electronic devices and electronic device therefor |
DE60309822T2 (en) | 2002-12-31 | 2007-10-11 | Samsung Electro-Mechanics Co., Ltd., Suwon | Method and device for speech recognition |
EP1959430A2 (en) | 2007-02-19 | 2008-08-20 | Deutsche Telekom AG | Method for automatically generating voiceXML speech applications from speech dialog models |
DE102007037567A1 (en) | 2007-08-09 | 2009-02-12 | Volkswagen Ag | Method for multimodal operation of at least one device in a motor vehicle |
DE102007042289A1 (en) * | 2007-09-06 | 2009-03-12 | Continental Automotive Gmbh | Device for replaying multimedia information for mobile application in vehicle or outside vehicle, has display device for visualization of display of information of multimedia information |
DE112007000946T5 (en) * | 2006-04-20 | 2009-04-02 | Mitac International Corp. | Navigation system and content delivery framework for an end user |
DE102008051756A1 (en) * | 2007-11-12 | 2009-05-14 | Volkswagen Ag | Multimodal user interface of a driver assistance system for entering and presenting information |
DE102008008948A1 (en) * | 2008-02-13 | 2009-08-20 | Volkswagen Ag | System architecture for dynamic adaptation of information display for navigation system of motor vehicle i.e. car, has input modalities with input interacting to modalities so that system inputs result about user interfaces of output module |
DE102008027958A1 (en) * | 2008-03-03 | 2009-10-08 | Navigon Ag | Method for operating a navigation system |
DE102009017177A1 (en) * | 2008-04-23 | 2009-10-29 | Volkswagen Ag | Speech recognition arrangement for the acoustic operation of a function of a motor vehicle |
DE102008053548A1 (en) * | 2008-10-28 | 2010-04-29 | Volkswagen Ag | Method for controlling indicating device in vehicle, involves defining multiple contexts, and assigning context to each elements, where contexts are arranged on context scale |
-
2009
- 2009-12-12 DE DE102009058151.0A patent/DE102009058151B4/en not_active Expired - Fee Related
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10218680A1 (en) * | 2002-04-26 | 2003-11-06 | Bosch Gmbh Robert | Method for operating control of electronic devices and electronic device therefor |
DE60309822T2 (en) | 2002-12-31 | 2007-10-11 | Samsung Electro-Mechanics Co., Ltd., Suwon | Method and device for speech recognition |
DE112007000946T5 (en) * | 2006-04-20 | 2009-04-02 | Mitac International Corp. | Navigation system and content delivery framework for an end user |
EP1959430A2 (en) | 2007-02-19 | 2008-08-20 | Deutsche Telekom AG | Method for automatically generating voiceXML speech applications from speech dialog models |
DE102007037567A1 (en) | 2007-08-09 | 2009-02-12 | Volkswagen Ag | Method for multimodal operation of at least one device in a motor vehicle |
DE102007042289A1 (en) * | 2007-09-06 | 2009-03-12 | Continental Automotive Gmbh | Device for replaying multimedia information for mobile application in vehicle or outside vehicle, has display device for visualization of display of information of multimedia information |
DE102008051756A1 (en) * | 2007-11-12 | 2009-05-14 | Volkswagen Ag | Multimodal user interface of a driver assistance system for entering and presenting information |
DE102008008948A1 (en) * | 2008-02-13 | 2009-08-20 | Volkswagen Ag | System architecture for dynamic adaptation of information display for navigation system of motor vehicle i.e. car, has input modalities with input interacting to modalities so that system inputs result about user interfaces of output module |
DE102008027958A1 (en) * | 2008-03-03 | 2009-10-08 | Navigon Ag | Method for operating a navigation system |
DE102009017177A1 (en) * | 2008-04-23 | 2009-10-29 | Volkswagen Ag | Speech recognition arrangement for the acoustic operation of a function of a motor vehicle |
DE102008053548A1 (en) * | 2008-10-28 | 2010-04-29 | Volkswagen Ag | Method for controlling indicating device in vehicle, involves defining multiple contexts, and assigning context to each elements, where contexts are arranged on context scale |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013019208A1 (en) * | 2013-11-15 | 2015-05-21 | Audi Ag | Motor vehicle voice control |
DE102022000387A1 (en) | 2022-02-01 | 2023-08-03 | Mercedes-Benz Group AG | Method for processing voice inputs and operating device for controlling vehicle functions |
Also Published As
Publication number | Publication date |
---|---|
DE102009058151B4 (en) | 2020-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE102009017177B4 (en) | Speech recognition arrangement and method for acoustically operating a function of a motor vehicle | |
EP1721245B1 (en) | Method for selecting a list item and information or entertainment system, especially for motor vehicles | |
EP2013054B1 (en) | Multifunctional operator control and radio navigation system for a motor vehicle | |
DE102011109932B4 (en) | Method for controlling functional devices in a vehicle during voice command operation | |
EP2026328B1 (en) | Method for multimodal control of at least one device in a motor vehicle | |
WO2005064438A2 (en) | Operating system for a vehicle | |
DE102009037658A1 (en) | Vehicle i.e. passenger car, has control device changing distance of cursor indication to graphical objects, and voice recognition device detecting voice command and selecting function from selected group of functions based on voice command | |
DE10328200B4 (en) | Navigation device for a motor vehicle | |
DE102013001884A1 (en) | System-initiated help function for the operation of a device associated with a vehicle - input of spaces | |
DE102009058151B4 (en) | Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition | |
EP3115886B1 (en) | Method for operating a voice controlled system and voice controlled system | |
DE102009030263A1 (en) | Method for controlling menu-based operation and information system of vehicle, involves displaying menu and forming controlling element for controlling menu | |
EP1321851B1 (en) | Method and system for the usage of user selectable markers as entry points in the structure of a menu of a speech dialogue system | |
EP3469581B1 (en) | Method for operating a motor vehicle with an operating device | |
DE102009018590A1 (en) | Motor vehicle has operating device for menu-guided operation of motor vehicle, where computing device is provided for displaying list of sub-menus on display | |
DE102010049869B4 (en) | Method for providing a voice interface in a vehicle and device therefor | |
DE102013223972A1 (en) | System-wide search in driver information systems | |
DE102008033441B4 (en) | Method for operating an operating system for a vehicle and operating system for a vehicle | |
DE102013001885A1 (en) | System-initiated help function per trip and / or per user for the operation of a device associated with a vehicle | |
DE102008025532B4 (en) | A communication system and method for performing communication between a user and a communication device | |
WO2020200557A1 (en) | Method and apparatus for interaction with an environment object in the surroundings of a vehicle | |
EP1164464B1 (en) | Method for controlling a system, in particular an electrical and/or electronic system with at least one application device | |
DE102019201413A1 (en) | Method for operating and / or controlling a dialog system | |
DE102018218790A1 (en) | Method for outputting at least text information on an associated information symbol in a vehicle, and an information system | |
DE112018006615T5 (en) | Operation restriction control apparatus and operation restriction control method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |