DE102009058151A1 - Speech dialog system operating method for e.g. operation of devices of car, involves differentiating graphical element with equal representation feature and other graphical element with unequal representation feature from each other - Google Patents

Speech dialog system operating method for e.g. operation of devices of car, involves differentiating graphical element with equal representation feature and other graphical element with unequal representation feature from each other Download PDF

Info

Publication number
DE102009058151A1
DE102009058151A1 DE102009058151A DE102009058151A DE102009058151A1 DE 102009058151 A1 DE102009058151 A1 DE 102009058151A1 DE 102009058151 A DE102009058151 A DE 102009058151A DE 102009058151 A DE102009058151 A DE 102009058151A DE 102009058151 A1 DE102009058151 A1 DE 102009058151A1
Authority
DE
Germany
Prior art keywords
dialog
dialogues
speech
dialogue system
inputs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102009058151A
Other languages
German (de)
Other versions
DE102009058151B4 (en
Inventor
Christoph Dr. Wäller
Moritz Dr. Neugebauer
Gordon Seitz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102009058151.0A priority Critical patent/DE102009058151B4/en
Publication of DE102009058151A1 publication Critical patent/DE102009058151A1/en
Application granted granted Critical
Publication of DE102009058151B4 publication Critical patent/DE102009058151B4/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

The method involves detecting and storing speech inputs recorded in a dialog (20), and representing the stored dialog on a display surface (13) by graphical elements (24) assigned to the dialog. The dialog is assigned depending on contents of the speech inputs of different categories. One graphical element with equal representation feature of same categories and another graphical element with unequal representation feature of different categories are optically differentiated from each other. The speech inputs are semantically analyzed. An independent claim is also included for a speech dialog system comprising a storage device.

Description

Die vorliegende Erfindung betrifft ein Verfahren zum Betreiben eines Sprachdialogsystems, bei dem zu einem Dialog gehörige Spracheingaben erfasst und gespeichert werden und gespeicherte Dialoge durch graphische Elemente, die jeweils einem Dialog zugeordnet sind, auf einer Anzeigefläche dargestellt werden. Die Erfindung betrifft ferner ein entsprechend ausgestaltetes Sprachdialogsystem.The present invention relates to a method for operating a speech dialogue system in which speech inputs belonging to a dialog are recorded and stored and stored dialogues are displayed on a display surface by graphical elements, which are each associated with a dialog. The invention further relates to a correspondingly designed speech dialogue system.

Sprachdialogsysteme finden ein breites Anwendungsspektrum für Bediensysteme. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Auch hat sich die Bedienung von Einrichtungen eines Fahrzeugs über Spracheingaben als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Zur Eingabe komplexer Sachverhalte wird eine entsprechende Information von einem Sprachdialogsystem sequentiell vom Benutzer abgefragt. Dies geschieht durch einen von dem Sprachdialogsystem geführten Dialog, welcher sich dem Benutzer als eine logisch aufeinander aufbauende Reihe von Fragen darstellt. Die Fragen dienen dabei insbesondere zur Eingrenzung eines Sachverhalts, bis das Sprachdialogsystem zu einer eindeutigen Reaktion in der Lage ist.Speech dialogue systems find a wide range of applications for operating systems. This applies equally to the operation of devices and the completion of telephone tasks using voice computers, such as telephone banking. Also, the operation of facilities of a vehicle via voice inputs has become established as an essential feature of current user interfaces in the vehicle. For inputting complex facts, corresponding information from a speech dialogue system is requested sequentially by the user. This is done by a dialog conducted by the speech dialogue system, which presents itself to the user as a logically consecutive series of questions. In particular, the questions serve to narrow down the facts until the speech dialogue system is able to respond unequivocally.

Dabei wird der Dialog primär sprachlich beziehungsweise akustisch zwischen dem Sprachdialogssystem und dem Benutzer geführt. Bei einigen nach dem Stand der Technik bekannten Sprachdialogsystemen wird die akustische Ausgabe des Sprachdialogssystems zusätzlich als Text auf einer Anzeigefläche dargestellt. Die Anzeigefläche kann dabei über eine berührungsempfindliche Oberfläche verfügen. Der Benutzer muss bei den heute bekannten Sprachdialogsystemen bei einer Spracheingabe typischerweise auf eine bestimmte Taste („Push-To-Talk”-Taste) drücken, welche einen Spracherkenner aktiviert, um die Spracheingabe des Benutzers aufzuzeichnen.In this case, the dialogue is primarily conducted linguistically or acoustically between the speech dialogue system and the user. In some known in the art speech dialogue systems, the acoustic output of the speech dialogue system is additionally displayed as text on a display surface. The display surface can have a touch-sensitive surface. The user must typically press on a particular key ("push-to-talk" key), which activates a speech recognizer to record the speech input of the user in the speech dialogue systems known today at voice input.

In der DE 10 2007 037 567 A1 ist ein Verfahren zur automatischen Ansteuerung eines Geräts durch Spracheingaben beschrieben.In the DE 10 2007 037 567 A1 a method for automatic control of a device is described by voice inputs.

Die DE 603 09 822 T2 beschreibt ein Verfahren und eine Vorrichtung zum Verbessern der Leistungsfähigkeit bei der Spracherkennung.The DE 603 09 822 T2 describes a method and apparatus for improving speech recognition performance.

In der EP 1 959 430 A2 ist ein Verfahren zur automatischen Generierung von Sprachanwendungen mittels Sprachdialogmodellen beschrieben, wobei insbesondere eine dazu passende effiziente Entwicklungsumgebung beschrieben wird.In the EP 1 959 430 A2 a method for the automatic generation of voice applications by means of speech dialogue models is described, wherein in particular a suitable efficient development environment is described.

Als nachteilig hat sich herausgestellt, dass es dem Nutzer nur schwer möglich ist, innerhalb eines Dialogs zu einer beliebigen Stelle zurückzuspringen, um eine bereits getätigte Eingabe zu wiederholen oder abzuändern. Dies ist jedoch in der Praxis wünschenswert, da in manchen Fällen erst nach der entsprechenden Reaktion des Sprachdialogsystems auf eine Eingabe, des Benutzers der Sinn oder die semantische Wirkung der Eingabe von dem Benutzer eingeschätzt werden kann. Ferner kann es sich um einen zu einem in der Vergangenheit getätigten ähnlichen Sprachdialog handeln, der nur noch leicht modifiziert werden müsste, um somit die Interaktion zwischen dem Sprachdialogsystem und dem Benutzer abzukürzen.A disadvantage has been found that it is difficult for the user to jump back to any point within a dialogue to repeat or modify an input already made. However, this is desirable in practice, since in some cases, only after the appropriate response of the speech dialogue system to an input, the user's sense, or the semantic effect of the input can be estimated by the user. Furthermore, it may be a similar speech dialogue that has taken place in the past, which would only have to be slightly modified in order to shorten the interaction between the speech dialogue system and the user.

Selbst wenn Sprachdialoge zusätzlich als Text auf einer Anzeige dargestellt werden, kann insbesondere bei einer entsprechend großen Anzahl an dargestellten Dialogen oder bei langen Dialogverläufen das Auffinden und manuelle Navigieren zu einem gesuchten Dialogbaustein sehr zeit- und interaktionsaufwändig sein. Dies ist insbesondere bei einem Einsatz in einem Fahrzeug nachteilig.Even if speech dialogues are additionally displayed as text on a display, finding and manually navigating to a sought-after dialog building block can be very time-consuming and expensive, especially in the case of a correspondingly large number of displayed dialogs or in the case of long dialog histories. This is particularly disadvantageous when used in a vehicle.

Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren zum Betreiben eines Sprachdialogsystems sowie ein entsprechendes Sprachdialogsystem der eingangs erwähnten Art anzugeben, bei denen bestimmte, auf einer Anzeigefläche dargestellte Dialoge oder Teile davon schnell aufgefunden werden können.It is the object of the present invention to provide a method for operating a speech dialogue system as well as a corresponding speech dialogue system of the kind mentioned in which certain dialogues or parts thereof displayed on a display surface can be found quickly.

Diese Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Anspruchs 1 und einem Sprachdialogsystem mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Aus- und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.This object is achieved by a method having the features of claim 1 and a speech dialogue system with the features of claim 9. Advantageous training and further developments emerge from the dependent claims.

Das erfindungsgemäße Verfahren ist dadurch gekennzeichnet, dass die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zugewiesen werden und graphische Elemente, die zu Dialogen gleicher Kategorie gehören mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht. Dies ermöglicht das schnelle Auffinden in der Vergangenheit aufgezeichneter Dialoge oder Dialogbausteine. Das Verfahren ist insbesondere für den Fahrer eines Fahrzeugs vorteilhaft, da er mit einem kurzen Blick schnell die für die Situation relevanten Dialoge oder Dialogbausteine erkennen kann, kann, dabei vom Straßenverkehr abgelenkt zu werden.The method according to the invention is characterized in that the dialogues are assigned to different categories depending on the content of the speech inputs belonging to the dialogs, and graphic elements which belong to dialogues of the same category have at least one same display feature, and graphic elements which are used for dialogues of different categories belong, have at least one unequal representation feature that makes them visually distinguishable from each other. This allows you to quickly find in the past recorded dialogues or dialog blocks. The method is particularly advantageous for the driver of a vehicle, since he can quickly recognize the relevant for the situation dialogues or dialog blocks can be distracted while driving from the road.

Insbesondere können die Spracheingaben semantisch analysiert werden und die Dialoge in Abhängigkeit von Schlüsselwörtern, die in den Spracheingaben der Dialoge vorkommen, verschiedenen Kategorien zugewiesen werden. Für den Fall, dass ein Dialog mangels fehlender semantischer Erkennung keiner bestimmten Kategorie zugeordnet werden kann, beispielsweise durch eine unvollständige Eingabe oder einen Dialogabbruch, besteht die Möglichkeit, solche Dialoge einer gesonderten Kategorie zuzuordnen, die alle undefinierten oder neutralen Dialoge enthält. Werden solche Dialoge ausgewählt und erweitert oder abgeändert, so kann gegebenenfalls zu einem späteren Zeitpunkt eine Zuordnung zu einer bestimmten Kategorie erfolgen. In particular, the speech inputs can be semantically analyzed and the dialogues assigned to different categories depending on keywords that appear in the speech inputs of the dialogues. In the event that a dialog can not be assigned to a specific category due to a lack of semantic recognition, for example by an incomplete input or a dialog abort, it is possible to assign such dialogs to a separate category containing all undefined or neutral dialogs. If such dialogues are selected and expanded or modified, an assignment to a specific category can optionally be made at a later date.

Die Spracheingaben werden typischerweise als Dialogbausteine erfasst, wobei die dargestellten graphischen Elemente der Dialoge auswählbar sind. Nach Auswahl eines graphischen Elements werden die Dialogbausteine des zugehörigen Dialogs angezeigt. Ein Dialog setzt sich somit aus mehreren Dialogbausteinen zusammen. Um bei dem erfindungsgemäßen Verfahren zu einem bestimmten Dialogbaustein zu navigieren, wählt der Nutzer zunächst das graphische Element eines zugehörigen Dialogs aus. Den zugehörigen Dialog kann der Nutzer leicht anhand der zu den Kategorien gehörigen Darstellungsmerkmale erkennen. Nach der Auswahl des graphischen Elements kann der Nutzer den gewünschten Dialogbaustein auswählen. Auf diese Weise ist es innerhalb des Sprachdialogsystems möglich, schnell zu einer bestimmten Spracheingabe zu gelangen und den Dialog dann fortzusetzen. Es müssen insbesondere nicht alle Spracheingaben zu Dialogbausteinen wiederholt werden, welche dem ausgewählten Dialogbaustein in dem betreffenden Dialog vorangehen. Auf diese Weise kann die Spracheingabe erheblich verkürzt und vereinfacht werden.The voice inputs are typically recorded as dialog blocks, the displayed graphical elements of the dialogs are selectable. After selecting a graphical element, the dialog modules of the corresponding dialog are displayed. A dialog thus consists of several dialog modules. In order to navigate in the method according to the invention to a specific dialog module, the user first selects the graphical element of an associated dialog. The associated dialog can be easily recognized by the user based on the display features associated with the categories. After selecting the graphic element, the user can select the desired dialog module. In this way it is possible within the speech dialogue system, to quickly get to a specific voice input and then continue the dialogue. In particular, it is not necessary to repeat all speech inputs for dialog blocks which precede the selected dialog block in the relevant dialog. In this way, the speech input can be significantly shortened and simplified.

Dialogbausteine können neben einer erfassten Spracheingabe auch durch Ausgaben des Sprachdialogsystems, beispielsweise eine Rückfrage an den Benutzer oder eine Ankündigung zur Ausführung einer Aktion, gebildet werden. Das Auswählen von Dialogen oder Dialogbausteinen kann dabei auf verschiedene Art, beispielsweise akustisch oder manuell erfolgen. Die semantische Analyse der Schlüsselwörter in den Dialogbausteinen, der hierarchische Aufbau der Dialoge sowie deren Darstellung in aus den Schlüsselwörtern abgeleiteten visuell differenzierten Kategorien ermöglicht ein bequemes und zielgerichtetes Navigieren durch die auf der Anzeigefläche dargestellten Dialoge.Dialog modules can be formed in addition to a recorded speech input also by outputs of the speech dialogue system, such as a query to the user or an announcement to perform an action. The selection of dialogs or dialog modules can be done in various ways, for example, acoustically or manually. The semantic analysis of the keywords in the dialog modules, the hierarchical structure of the dialogues as well as their representation in the visually differentiated categories derived from the keywords enables a comfortable and targeted navigation through the dialogues displayed on the display area.

Vorteilhafterweise kann das erfindungsgemäße Verfahren so ausgestaltet sein, dass eine neue Spracheingabe als Dialogbaustein erfasst oder ein auf der Anzeigefläche dargestellter Dialogbaustein ausgewählt wird, wobei dann in dem Dialogbaustein Schlüsselwörter identifiziert werden, mittels denen eine sortierte Trefferliste zu assoziierten Funktionen, die über das Sprachdialogsystem ausführbar sind, erzeugt wird und die Trefferliste nach Beendigung der Spracheingabe oder nach der Auswahl des auf der Anzeigefläche dargestellten Dialogbausteins auf der Anzeigefläche angezeigt wird.Advantageously, the inventive method can be configured so that a new speech input detected as a dialog module or a displayed on the display dialog module is selected, then in the dialog module keywords are identified by means of which a sorted list of hits to associated functions that are executable through the speech dialogue system , is generated and the hit list after completion of the voice input or after the selection of the displayed on the display surface dialog box is displayed on the display surface.

Die Trefferliste kann einen oder mehrere Einträge haben oder auch leer sein. Zweckmäßigerweise wird eine längere Liste mit typischerweise mehr als drei bis fünf Einträgen nach der Relevanz sortiert, da alle Einträge nicht mehr auf einen Blick vom Benutzer visuell erfassbar wären. Wenn kein passender Eintrag gefunden wird, kann entweder als Ergebnis eine leere Liste ausgegeben werden oder eine Liste der nächstbesten, möglicherweise nicht relevanten Treffer. Auch kann ein sogenanntes Konfidenzmaß, beispielsweise in Prozent, angezeigt werden, das als Relevanzmaß der Einträge in der Trefferliste dient.The hit list can have one or more entries or be empty. Conveniently, a longer list of typically more than three to five entries is sorted by relevance since all entries would no longer be visually detectable by the user at a glance. If no matching entry is found, either an empty list can be output as a result or a list of the next best, possibly irrelevant, hits. It is also possible to display a so-called confidence measure, for example in percent, which serves as relevance measure of the entries in the hit list.

Eine solche Trefferliste ermöglicht eine gute Vernetzung zwischen den Dialogbausteinen. Will beispielsweise ein Benutzer einen speziellen, komplexen Bedienvorgang starten, der in ähnlicher Form bereits früher eingegeben wurde, so kann er mittels der visuell differenzierten Kategorien schnell einen relevanten Dialog auffinden, diesen auswählen, wodurch die dazugehörigen Dialogbausteine zur Anzeige gebracht werden. Nach Auswahl eines Dialogbausteins werden ihm alle semantisch ähnlichen Dialogbausteine aus diesem und anderen Dialogen nach einer semantischen Relevanz berechnet und sortiert in einer Liste, dargestellt.Such a list of hits enables good networking between the dialog modules. If, for example, a user wants to start a special, complex operating procedure which has already been entered in a similar form earlier, he can quickly find a relevant dialog by means of the visually differentiated categories, select the latter, whereby the associated dialog modules are displayed. After selecting a dialog module, all semantically similar dialog modules from this and other dialogs are calculated for a semantic relevance and sorted into a list.

In einer Ausgestaltung des erfindungsgemäßen Verfahrens wird durch Auswahl eines Dialogbausteins, welcher eine Angabe einer über das Sprachdialogsystem ausführbaren Funktion umfasst, die entsprechende Funktion nochmals ausgeführt.In one embodiment of the method according to the invention, the corresponding function is executed again by selecting a dialog module which includes an indication of a function that can be executed via the speech dialog system.

Bei dem erfindungsgemäßen Verfahren sind die systemseitig bekannten Schlüsselwörter aus vorherigen Spracheingaben extrahiert worden und/oder im Sprachdialogsystem vordefiniert. Letzteres hat den Vorteil, dass zu den über das Sprachdialogsystem ausführbaren Funktionen passende Schlüsselwörter systemseitig definiert sind, ohne dass ein Benutzer die Funktion vorher hätte benutzt haben müssen. Die Extraktion aus vorherigen Spracheingaben ist vorteilhaft, um ein nutzerspezifisches Verhalten besser berücksichtigen zu können. Insbesondere immer wieder gewählte Navigationsziele, Rufnummern oder Radiosender können so systemseitig als hochrelevante Schlüsselwörter erkannt und für die semantische Bewertung von Spracheingaben eines Benutzers berücksichtigt werden. Die Schlüsselwörter können dabei durch ein von Suchmaschinen bekanntes Verfahren zur Informationskonsolidierung, dem sogenannten „automatic summarization”, ermittelt werden.In the method according to the invention, the keywords known from the system have been extracted from previous voice inputs and / or predefined in the voice dialogue system. The latter has the advantage that suitable keywords are defined on the system side for the functions that can be executed via the speech dialogue system, without a user having to have used the function beforehand. The extraction from previous voice inputs is advantageous in order to better take into account user-specific behavior. In particular, repeatedly selected navigation destinations, phone numbers or radio stations can be recognized on the system side as highly relevant keywords and taken into account for the semantic evaluation of a user's speech input. The keywords can be identified by a method known by search engines for information consolidation, the so-called "automatic summarization", are determined.

Insbesondere können zu Schlüsselwörtern auch Synonyme, Antonyme und assoziierte Begriffe gebildet werden, die bei der semantischen Analyse berücksichtigt werden. Dabei können Synonyme oder assoziierte Begriffe eine den dazugehörigen Schlüsselwörtern äquivalente Wirkung besitzen, vor allem für die Kategoriezuordnung und für die Relevanzbewertung bei der Bildung der Trefferlisten. Die Funktion der Antonyme kann unterschiedlich ausfallen. Sie können Hinweise für die Nichtrelevanz eines Dialogbausteins liefern, kontextspezifisch aber auch eine besondere Relevanz andeuten, beispielsweise wenn eine kurz zuvor ausgeführte Aktion rückgängig gemacht werden soll. In diesem Falle könnte bei Eingabe desselben Navigationsziels kurz hintereinander zu dem Dialogbaustein „Ziel Eingeben” auch der relevante Dialogbaustein „Ziel löschen” angezeigt werden.In particular, keywords, synonyms, antonyms and associated terms can be formed, which are taken into account in the semantic analysis. Synonyms or associated terms can have an equivalent effect on the associated keywords, especially for category assignment and relevance assessment in the formation of hit lists. The function of the antonyms may vary. They can provide pointers to the non-relevance of a dialog module, but may also indicate specific relevance for the context, for example, if an action performed shortly before is to be undone. In this case, when entering the same navigation destination in quick succession, the relevant dialog block "Delete target" could also be displayed for the "Enter target" dialog box.

In einer Ausgestaltung des erfindungsgemäßen Verfahrens umfassen graphische Elemente zur Darstellung eines Dialogs eine Textdarstellung, die aus je einem aus Schlüsselwörtern gebildetem Objekt und Prädikat besteht. Vorteilhafterweise wird die Darstellung dabei so an die Anzeigefläche angepasst, dass eine einzeilige Darstellung möglich ist. Idealerweise werden Prädikat und Objekt aus der letzten Systemaktion des Dialogs gebildet. Dies ermöglicht dem Benutzer, den Kern eines Dialogs schnell semantisch zu erfassen, was die Interaktionszeit mit dem System weiter optimiert.In one embodiment of the method according to the invention, graphic elements for representing a dialog comprise a text representation which consists of an object and a predicate composed of keywords. Advantageously, the presentation is adapted to the display surface so that a one-line representation is possible. Ideally, the predicate and the object are formed from the last system action of the dialog. This allows the user to quickly semantically capture the core of a conversation, further optimizing interaction time with the system.

Alternativ oder auch zusätzlich kann ein Darstellungsmerkmal eines graphischen Elements zur optischen Unterscheidbarkeit der Kategorien der Dialoge aus einer Farbcodierung und/oder einem Zusatzelement bestehen. Ein solches Zusatzelement ist beispielsweise ein Logo oder eine Ikone. Werden dabei, gemäß einer typischen Anwendung des erfindungsgemäßen Verfahrens, die Kategorien, denen die Dialoge zugewiesen werden, aus den durch das Sprachdialogsystem ausführbaren Funktionen und/oder den dazugehörigen Funktionseinrichtungen gebildet, z. B. einem Navigationsgerät oder einer Mobilfunkeinrichtung in einem Fahrzeug, so können diese durch entsprechende Logos, beispielsweise einem symbolischen Kartenausschnitt oder einem symbolischen Telefon, gekennzeichnet werden.Alternatively or additionally, a representation feature of a graphic element for the optical differentiation of the categories of the dialogues can consist of a color coding and / or an additional element. Such an additional element is for example a logo or an icon. In this case, according to a typical application of the method according to the invention, the categories to which the dialogues are assigned are formed from the functions executable by the speech dialogue system and / or the associated functional devices, eg. As a navigation device or a mobile device in a vehicle, they can be characterized by appropriate logos, such as a symbolic map or a symbolic phone.

Das erfindungsgemäße Sprachdialogsystem umfasst Mittel zum Erfassen von Spracheingaben, insbesondere als Dialogbausteine, eine Speichervorrichtung zum Speichern der erfassten Spracheingaben, eine Anzeigefläche zur Darstellung von graphischen Elementen, die jeweils einem Dialog zugeordnet sind, eine Steuervorrichtung zum Steuern der graphischen Darstellung der den Dialogen zugeordneten Elemente auf der Anzeigefläche und eine Schnittstelle zu einer durch das Sprachdialogsystem zu steuernde Funktionseinrichtung. Das erfindungsgemäße Sprachdialogsystem ist dadurch gekennzeichnet, dass es eine semantische Bewertungseinrichtung umfasst, mittels derer die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind und mittels der Steuervorrichtung die Anzeigefläche so ansteuerbar ist, dass graphische Elemente, die zu Dialogen gleicher Kategorie gehören, mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht.The speech dialogue system according to the invention comprises means for detecting speech inputs, in particular as dialog blocks, a memory device for storing the detected speech inputs, a display area for displaying graphical elements, each associated with a dialog, a control device for controlling the graphical representation of the elements associated with the dialogues the display area and an interface to a functional device to be controlled by the speech dialogue system. The speech dialogue system according to the invention is characterized in that it comprises a semantic evaluation device by means of which the dialogues are assignable to different categories depending on the content of the speech inputs belonging to the dialogs and the display surface can be controlled by the control device in such a way that graphic elements that become dialogues belong to the same category, have at least one same display feature, and graphical elements that belong to dialogues of different categories, have at least one unequal representation feature that makes them visually distinguishable from each other.

Typischerweise umfasst die Funktionseinrichtung eine Infotainment- und/oder Fahrerassistenzeinrichtung in einem Fahrzeug. Zu Infotainmenteinrichtungen gehören insbesondere Rundfunk- oder Fernsehempfänger, Mobilfunkgeräte, Kassetten- oder CD-Spieler sowie andere Unterhaltungselektronik. Unter den Begriff Fahrerassistenzeinrichtung fallen insbesondere Navigationsgeräte und Geräte zu den Fahrzeugeinstellungen wie die Klimaanlage.Typically, the functional device includes an infotainment and / or driver assistance device in a vehicle. Infotainment facilities include in particular radio or television receivers, mobile devices, cassette or CD players and other consumer electronics. The term driver assistance device includes in particular navigation devices and devices to the vehicle settings such as the air conditioning.

Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug zu den Figuren näher erläutert.The invention will now be explained in more detail by means of embodiments with reference to the figures.

1 zeigt schematisch die Systemarchitektur gemäß einem Ausführungsbeispiel des erfindungsgemäßen Sprachdialogsystems, 1 schematically shows the system architecture according to an embodiment of the speech dialogue system according to the invention,

2 zeigt graphische Darstellungen von Sprachdialogen, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden, sowie die dazugehörigen wesentlichen Verfahrenschritte, 2 shows graphical representations of speech dialogues, which were generated according to an embodiment of the method according to the invention, and the associated essential procedural steps,

3 zeigt gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens eine Zuordnung von Kategorien, die durch Funktionseinrichtungen gebildet werden, und graphischen Elementen zur Darstellung der den Kategorien zugewiesenen Dialoge und 3 shows according to an embodiment of the method according to the invention an assignment of categories, which are formed by functional means, and graphical elements representing the assigned to the categories dialogues and

4 zeigt weitere graphische Darstellungen von Sprachdialogen, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden, sowie die dazugehörigen wesentlichen Verfahrenschritte. 4 shows further graphical representations of speech dialogues, which were generated according to an embodiment of the method according to the invention, and the associated essential procedural steps.

In 1 ist ein Ausführungsbeispiel eines erfindungsgemäßen Sprachdialogsystems 10 dargestellt. Es umfasst Mittel 11 zum Erfassen von Spracheingaben – beispielsweise ein Mikrophon mit einem Spracherkennungsmodul –, die von einem Nutzer 17 gesprochen werden, und eine Speichervorrichtung 12 zum Speichern dieser Spracheingaben. Die Spracheingaben können dabei in analoger oder digitaler Form abgespeichert werden, wobei eine Digitalisierung, für die weiteren Schritte zweckmäßig ist. Insbesondere können die Spracheingaben in Textform konvertiert abgespeichert werden. Die Speichervorrichtung 12 ist mit einer Steuervorrichtung 14 verbunden, welche die graphische Darstellung auf der Anzeigefläche 13 steuert, wie es später im Detail erläutert wird. Die Anzeigefläche 13 kann mit einer berührungsempfindlichen Oberfläche ausgestattet sein, so dass als Schaltflächen dargestellte Anzeigeinhalte manuell ausgewählt werden können. Das Sprachdialogsystem kann über einen Lautsprecher 19 verfügen, über den akustische Ausgaben, beispielsweise Rückfragen an den Benutzer 17, ausgeben werden können.In 1 is an embodiment of a speech dialogue system according to the invention 10 shown. It includes funds 11 for detecting voice input - for example a microphone with a voice recognition module - by a user 17 and a storage device 12 to save these voice inputs. The voice inputs can be stored in analog or digital form, whereby digitization is expedient for the further steps. In particular, the voice inputs can be stored converted in text form. The storage device 12 is with a control device 14 connected to the graphical representation on the display surface 13 controls, as explained in detail later. The display area 13 can be equipped with a touch-sensitive surface so that display contents displayed as buttons can be manually selected. The voice dialogue system can be controlled via a loudspeaker 19 have, on the acoustic outputs, for example, queries to the user 17 , can be spent.

Mittels der Steuervorrichtung 12 werden aus den Spracheingaben Dialogbausteine 21 gebildet, wobei sich ein Dialog 20 aus mehreren Dialogbausteinen 21 zusammensetzt. Wie es später im Detail erläutert wird, ist jedem Dialog 20 ein graphisches Element 24 zugeordnet, welches zum Beispiel in einer Liste mittels der Steuervorrichtung 14 auf der Anzeigefläche 13 anzeigbar ist. Bei einer Auswahl eines graphischen Elements 24 steuert die Steuervorrichtung 14 die Anzeigefläche 13 so an, dass die Dialogbausteine 21 zum Beispiel an einer Liste angezeigt werden, die zu dem Dialog 20 des ausgewählten graphischen Elements 24 gehört.By means of the control device 12 become from the language inputs dialog blocks 21 formed, with a dialogue 20 from several dialog modules 21 composed. As will be explained in detail later, every dialogue is 20 a graphic element 24 associated, for example, in a list by means of the control device 14 on the display surface 13 can be displayed. For a selection of a graphic element 24 controls the control device 14 the display area 13 so on, that the dialog building blocks 21 for example, to be displayed on a list accompanying the dialog 20 of the selected graphic element 24 belongs.

Erfindungsgemäß umfasst das Sprachdialogsystem 10 ferner eine semantisch Bewertungseinrichtung 15, mittels derer die Dialoge 20 in Abhängigkeit von dem Inhalt der zu den Dialogen 20 gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind. Die Steuervorrichtung 14 leitet dabei gezielt ausgewählte Dialoge 20 oder darin enthaltene Dialogbausteine 21 an die semantische Bewertungseinrichtung 15 weiter, in der dann in einer Prozedur eine semantische Analyse oder Bewertung vorgenommen wird. Das Ergebnis wird an, die Steuervorrichtung 14 signalisiert, die die daraus resultierende Änderung der Darstellung auf der Anzeigefläche 13 steuert.According to the invention, the speech dialogue system comprises 10 Furthermore, a semantic evaluation device 15 , by means of which the dialogues 20 depending on the content of the dialogues 20 corresponding voice inputs are assignable to different categories. The control device 14 directs selected dialogues 20 or dialog modules contained in it 21 to the semantic evaluation device 15 Next, in which a semantic analysis or evaluation is then performed in a procedure. The result becomes, the control device 14 signals the resulting change in appearance on the display area 13 controls.

Die Steuervorrichtung 14 ist über eine Schnittstelle 16 mit einer Funktionseinrichtung 18 verbunden, dessen Funktionen über das Sprachdialogsystem 10 steuerbar sind. Die Schnittstelle 16 kann eine beliebige Schnittstelle sein, die für elektronische Geräte üblich ist.The control device 14 is via an interface 16 with a functional device 18 its functions via the voice dialogue system 10 are controllable. the interface 16 can be any interface that is common for electronic devices.

Typischerweise wird die Schnittstelle 16 mit einem Datenbus verbunden sein, an den auch die Funktionseinrichtung 18 angebunden ist. Die Schnittstelle 16 kann auch drahtgebundene oder drahtlose Telekommunikationsverbindungen umfassen.Typically, the interface becomes 16 be connected to a data bus, to which also the functional device 18 is connected. the interface 16 may also include wired or wireless telecommunications connections.

Vorzugsweise ist das erfindungsgemäße Sprachdialogsystem 10 in einem Fahrzeug angeordnet. Die Funktionseinrichtung 18 kann dann insbesondere ein Navigationssystem 18a, eine Infotainmenteinrichtung 18b, eine Kommunikationseinrichtung 18c oder die Fahrzeugeinstellungen 18d umfassen. Eine Infotainmenteinrichtung 18b umfasst dabei typischerweise einen Rundfunkempfänger und/oder Datenträgerabspielgeräte zur Wiedergabe von Audio- und oder Videosignalen und eine Kommunikationseinrichtung 18c umfasst typischerweise ein in das Fahrzeug integriertes oder lösbar befestigtes Mobilfunkgerät. Die Fahrzeugeinstellungen 18d werden insbesondere durch die Funktionen einer Klimaanlage dargestellt, können aber weitere Funktionen umfassen, beispielsweise die Steuerung der Lichtmaschine, automatische Einparkhilfen oder andere Fahrerassistenzfunktionen.Preferably, the speech dialogue system according to the invention 10 arranged in a vehicle. The functional device 18 can then in particular a navigation system 18a , an infotainment facility 18b , a communication device 18c or the vehicle settings 18d include. An infotainment facility 18b typically includes a radio receiver and / or disk players for playback of audio and or video signals and a communication device 18c typically includes a mobile device integrated or detachably mounted in the vehicle. The vehicle settings 18d are shown in particular by the functions of an air conditioner, but may include other functions, such as the control of the alternator, automatic parking aids or other driver assistance functions.

In 2 sind graphische Darstellungen von Dialogen 20 gezeigt, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden. Die Dialoge 20 sind beispielsweise auf nach den Stand der Technik bekannte Art und Weise durch Interaktion eines Benutzer mit dem erfindungsgemäßen Sprachdialogsystem 10 entstanden und bestehen aus Dialogbausteinen 21, die aus Spracheingaben des Benutzers oder aus Ausgaben des Sprachdialogssystems 10, beispielsweise Rückfragen an den Benutzer oder Ankündigungen zum Ausführen von Aktionen, gebildet werden. Der Inhalt der Dialogbausteine 21 kann zunächst als beliebig angenommen werden; konkrete Inhalte zur Veranschaulichung des Verfahrens werden weiter unten in Beispielen näher erläutert.In 2 are graphical representations of dialogues 20 shown, which were produced according to an embodiment of the method according to the invention. The dialogs 20 are, for example, in a manner known from the prior art by interaction of a user with the speech dialogue system according to the invention 10 originated and consist of dialog modules 21 from the user's speech input or from the speech dialog system output 10 For example, queries to the user or announcements to perform actions are formed. The content of the dialog modules 21 can be initially accepted as arbitrary; concrete contents to illustrate the process are explained in more detail below in examples.

Die Dialogbausteine 21 eines Dialogs 20 werden nun in einer semantischen Prozedur 27, die in der semantischen Bewertungseinrichtung 15 abläuft, auf Schlüsselwörter 22 oder dazugehörige Synonyme, Antonyme oder assoziierte Begriffe analysiert. Nach Abschluss der Analyse erfolgt mit einer Bewertung eine Zuordnung des Dialogs 20 zu einer Kategorie, die durch ein graphisches Element 24 graphisch repräsentiert und der Dialog 20 mit diesem graphischen Element 24 auf der Anzeigefläche 13 dargestellt wird.The dialog modules 21 a dialogue 20 are now in a semantic procedure 27 included in the semantic evaluation facility 15 expires on keywords 22 or related synonyms, antonyms or associated terms analyzed. After completion of the analysis, the evaluation is assigned to the dialog 20 to a category by a graphic element 24 represented graphically and the dialogue 20 with this graphic element 24 on the display surface 13 is pictured.

Ferner kann in der semantischen Bewertungsinstanz 15 aus den Schlüsselwörtern 22 in den Dialogbausteinen 21 der Inhalt des Dialogs 20 zusammengefasst und als Textdarstellung 25 dargestellt werden. Um dabei dem Benutzer ein schnelles Erfassen des Dialoginhalts zu ermöglichen, ist es zweckmäßig, diese Zusammenfassung so kurz zu gestalten, dass sie einzeilig auf der Anzeigefläche 13 darstellbar ist. Besonders aussagekräftig wird eine solche Textdarstellung 25, wenn sie aus einem Objekt und einem Prädikat gebildet wird, die vorteilhafterweise aus dem Dialogbaustein 21, der die letzte Systemaktion des Dialogs 20 darstellt, herausgefiltert werden.Furthermore, in the semantic evaluation instance 15 from the keywords 22 in the dialog modules 21 the content of the dialogue 20 summarized and as a text representation 25 being represented. In order to allow the user to quickly capture the dialog content, it is expedient to make this summary so short that they single-line on the display area 13 is representable. Particularly meaningful is such a text representation 25 if it is formed from an object and a predicate, advantageously from the dialog module 21 , the last one System action of the dialog 20 represents, be filtered out.

In 3 ist gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens eine Zuordnung von den Kategorien und den graphischen Elementen 24 zur Darstellung der Kategorien dargestellt. Die Kategorien werden durch die Funktionen der Funktionseinrichtungen 18 aus 1 gebildet. Das Navigationssystem 18a wird beispielsweise durch einen Wegepfeil 24a dargestellt, die Infotainmenteinrichtung 18b durch einen Violinschlüssel 24b, die Kommunikationseinrichtung 18c durch einen Telefonhörer 24c und die Fahrzeugeinstellungen 18d durch ein Symbol 24d einer Klimaanlage. Die graphischen Elemente 24 stellen sicher, dass Dialoge 20 gleicher Kategorien mit mindestens einem gleichen Darstellungsmerkmal dargestellt werden und Dialoge 20 unterschiedlicher Kategorien mit mindestens einem ungleichen Darstellungsmerkmal, das sie optisch voneinander unterscheidbar macht. Beispielsweise wird ein Dialog für eine Zielführung, die für das Navigationssystem 18a angegeben wurde, anhand eines graphischen Elements 24 gekennzeichnet, welches als Darstellungsmerkmal den Wegepfeil 24a enthält. Anhand dieses Darstellungsmerkmals kann der Nutzer somit schnell und intuitiv erfassen, dass der zugehörige Dialog 20 einer zu dem Navigationssystem 18a gehörigen Kategorie zugeordnet ist. Allgemein erkennt der Benutzer auf einen Blick, zu welchem Themengebiet ein Dialog 20 und damit auch die zu steuernde Funktion der Funktionseinrichtung 18a bis 18d gehört.In 3 is according to an embodiment of the method according to the invention an assignment of the categories and the graphical elements 24 to display the categories. The categories are determined by the functions of the functional devices 18 out 1 educated. The navigation system 18a is for example by a directional arrow 24a represented, the infotainment facility 18b through a treble clef 24b , the communication device 18c through a telephone receiver 24c and the vehicle settings 18d by a symbol 24d an air conditioner. The graphic elements 24 make sure dialogues 20 of the same categories with at least one identical display feature and dialogues 20 different categories with at least one unequal representation feature that makes them visually distinguishable from each other. For example, a dialog for a route guidance, for the navigation system 18a indicated by a graphic element 24 marked, which as display feature the way arrow 24a contains. Based on this representation feature, the user can thus quickly and intuitively grasp that the associated dialog 20 one to the navigation system 18a belonging to the appropriate category. Generally, the user recognizes at a glance which topic a dialogue 20 and thus also the function to be controlled of the functional device 18a to 18d belongs.

Die graphischen Elemente 24 können auch eine farbliche Unterscheidung der Kategorien vorsehen und beispielsweise die auch bei schlechter Beleuchtung schnell unterscheidbaren Grundfarben benutzen. Es können auch andere visuelle Effekte eingesetzt werden, um beispielsweise Funktionen, bei denen eine schnelle Interaktion des Benutzers nötig ist, durch Blinken zu unterstützen. Es ist auch möglich, dass mehrere Sätze von Kategorien gebildet werden, so dass ein Dialog 20 aus verschiedenen Blickwinkeln des Benutzungshintergrunds kategorisiert werden kann, beispielsweise unter dem Aspekt des Fahrzeugbetriebs oder dem Aspekt der Nutzerintention. Auf diese Weise könnte ein privates und dienstliches Telefonat unterschieden werden oder auch das Suchen eines Radiosenders mit Verkehrsnachrichten (Fahrzeugbetrieb) gegenüber einem Musiksender (Nutzerintention).The graphic elements 24 can also provide a color distinction between the categories and, for example, use the basic colors which can be quickly distinguished even in poor lighting conditions. Other visual effects can also be used to flash, for example, functions that require quick user interaction. It is also possible that several sets of categories are formed, making a dialogue 20 can be categorized from different points of view of the user background, for example, in terms of vehicle operation or the user intention aspect. In this way, a private and official telephone call could be distinguished or even the search for a radio station with traffic news (vehicle operation) in relation to a music station (user intention).

Die graphischen Elemente 24a bis 24d können beispielsweise in einer Auswahlliste von Symbolen vom Benutzer den jeweiligen Funktionseinrichtungen 18a bis 18d entsprechend konfiguriert werden. In der Steuervorrichtung 14 können auch Standardsymbole für Klassen von Funktionseinrichtungen 18 vorinstalliert sein, die sich über die Schnittstelle 16 in einer Art „Handshake-Prozedur” der Steuervorrichtung 14 als solche zu erkennen geben.The graphic elements 24a to 24d For example, in a selection list of icons, the user may select the respective functional devices 18a to 18d be configured accordingly. In the control device 14 You can also use standard symbols for classes of functional devices 18 be pre-installed, located across the interface 16 in a kind of "handshake procedure" of the control device 14 to identify as such.

In 4 sind graphische Darstellungen von Dialogen 20 gezeigt, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden. Wählt der Benutzer einen Dialog 20 aus, so werden ihm die dazugehörigen Dialogbausteine 21 angezeigt. Wählt er nun weiter einen bestimmten Dialogbaustein 21a aus, so werden darin Schlüsselwörter 22 identifiziert. In einer semantischen Prozedur 27, die in der semantischen Bewertungseinrichtung 15 abläuft, wird in anderen Dialogbausteinen nach Inhalten mit gleichen oder ähnlichen Schlüsselwörtern 22 oder Synonymen, assoziierten Begriffen und ggf. auch Antonymen gesucht. Die Dialogbausteine 21 werden je nach Relevanz oder Ähnlichkeit mit dem Dialogbaustein 21a in einer Trefferliste 23 abgespeichert. Gleichzeitig wird für jeden verglichenen Dialogbaustein 21 ein sogenanntes Konfidenzmaß berechnet und ebenfalls in der Trefferliste 23 abgespeichert.In 4 are graphical representations of dialogues 20 shown, which were produced according to an embodiment of the method according to the invention. If the user chooses a dialog 20 out, so it will be the associated dialog modules 21 displayed. Now he chooses a certain dialog module 21a out, it becomes keywords 22 identified. In a semantic procedure 27 included in the semantic evaluation facility 15 will expire in other dialog building blocks for content with the same or similar keywords 22 or synonyms, associated terms and possibly also antonyms sought. The dialog modules 21 depending on relevance or similarity with the dialog module 21a in a hit list 23 stored. At the same time, for each compared dialog block 21 calculated a so-called confidence measure and also in the hit list 23 stored.

Die Trefferliste 23 kann nun mit allen Dialogbausteine 21 oberhalb eines gewissen Konfidenzmaßes angezeigt werden. Eine lange Trefferliste 23 wird dabei vorteilhafterweise nur gekürzt dargestellt, wobei die nicht angezeigten Listeneinträge beispielsweise durch Betätigung eines Rollbalkens oder über ein funktionales Anzeigefeld 26 darstellbar sind. Ferner könnte in einem weiteren Anzeigefeld 26 das Konfidenzmaß der angezeigten Listeneinträge oder die Anzahl der Treffer oberhalb eines festgesetzten Konfidenzmaßes dargestellt werden. Wenn kein passender Eintrag gefunden wird, kann entweder als Ergebnis eine leere Liste ausgegeben werden oder eine Liste mit den nächstbesten, möglicherweise nicht oder nur wenig relevanten Treffern.The hit list 23 can now with all dialog modules 21 above a certain confidence level. A long list of hits 23 is advantageously shown only shortened, the non-displayed list entries, for example, by pressing a scroll bar or a functional display panel 26 are representable. Further, in another display panel 26 the confidence measure of the displayed list entries or the number of hits are displayed above a set confidence measure. If no matching entry is found, either an empty list may be output as a result or a list of the next best, possibly unimportant, or little relevant hits.

Um das Verfahren und die oben erläuterten prinzipiellen Verfahrensschritte weiter zu veranschaulichen, werden im Folgenden ein paar Beispiele mit Bezug zu den 2 und 4 angegeben.In order to further illustrate the method and the basic method steps explained above, a few examples with reference to FIGS 2 and 4 specified.

Beispiel 1:Example 1:

Ein Benutzer führt einen Dialog 20 mit dem Sprachdialogsystem 10 zu einem bislang neuen Thema, indem er über das Autoradio in einem neuen Sendegebiet einen Radiosender mit aktuellen Wirtschaftsnachrichten sucht. Der aufgezeichnete Dialog 20 wird mittels der Schlüsselwörter 22 in den Dialogbausteinen 21 der Kategorie Infotainment und alternativ der Kategorie „Business” zugeordnet und mit entsprechenden Darstellungsmerkmalen auf der Anzeigefläche 13 dargestellt.A user leads a dialog 20 with the speech dialogue system 10 to a hitherto new topic by looking over the car radio in a new coverage area a radio station with current business news. The recorded dialogue 20 becomes by means of the keywords 22 in the dialog modules 21 the category Infotainment and alternatively the category "Business" assigned and with appropriate display features on the display area 13 shown.

Beispiel 2:Example 2:

Der Benutzer vom ersten Beispiel möchte den Radiosender neu einstellen. Er sucht in der auf der Anzeigefläche 13 dargestellten Dialogliste den zuvor aufgezeichneten Dialog 20 aus, den er Aufgrund des graphischen Elements 24 schnell erkennt. Die Auswahl kann mittels eines Cursors oder auch direkt über die berührungsempfindliche Oberfläche erfolgen. Durch einen geeigneten Befehl, beispielsweise einem Doppelklick, öffnet sich der Inhalt des Dialogs 20 und die darin enthaltenen Dialogbausteine 21 werden angezeigt. Der Benutzer wählt nun einen Dialogbaustein 21 „SENDER ANZEIGEN” aus, der die Ankündigung des Systems enthält, die empfangbaren oder unter den Favoriten gespeicherten Radiosender anzuzeigen, wodurch diese zur Anzeige gebracht werden. Der Benutzer hat somit die Möglichkeit, aufgrund vorheriger Eingaben im Bedienmenü eine Abkürzung zu nehmen und kann jetzt weiter im Sprachdialog verfahren, entweder durch weitere Spracheingaben oder durch Auswahl weiterer Anzeigeinhalte.The user of the first example wants to reset the radio station. He's looking up in the the display area 13 displayed dialogue list the previously recorded dialogue 20 due to the graphic element 24 quickly recognizes. The selection can be made by means of a cursor or directly via the touch-sensitive surface. A suitable command, for example a double-click, opens the contents of the dialog 20 and the dialog modules contained in it 21 are shown. The user now chooses a dialog module 21 "DISPLAY TRANSMITTER", which contains the announcement of the system to display the receivable or favorite radio stations, indicating them. The user thus has the opportunity to take a shortcut due to previous entries in the operating menu and can now proceed further in the speech dialogue, either by further voice inputs or by selecting more display contents.

Beispiel 3:Example 3:

Ein Benutzer möchte über die Kommunikationseinrichtung 18c in seinem Fahrzeug, einem lösbar mit dem Fahrzeug verbundenen Mobilfunkgerät, einen Herrn Bielefeld anrufen. Dazu drückt er auf das Anzeigefeld 26 unter den dargestellten Dialogen 20, woraufhin eine „Push-To-Talk”-Funktion ausgelöst wird. Der Nutzer macht eine neue Spracheingabe und nennt den Namen „Bielefeld”, der von dem Sprachdialogsystem 10 erfasst wird. Wie mit Bezug zu 4 beschrieben, wird die Spracheingabe als Dialogbaustein 21 auf Schlüsselwörter 22 analysiert und in einer semantischen Prozedur 27 in anderen Dialogbausteinen nach Inhalten mit gleichen oder ähnlichen Schlüsselwörtern 22 gesucht. Aus früheren Dialogbausteinen 21 wird nun eine Trefferliste 23 generiert, die auf der Anzeigefläche 13 dargestellt wird. Der Inhalt der Trefferliste 23 bestehe beispielsweise aus zwei Einträgen: „Navigation nach Bielefeld” und „Herrn Bielefeld anrufen”. Der Benutzer erkennt sofort anhand der Darstellungsmerkmale, dass sich der eine Eintrag nicht auf sein Vorhaben zu telefonieren bezieht und kann so schnell den passensten alten Dialogbaustein 21 wiederverwenden, durch dessen Auswahl direkt die Mobilfunkverbindung aufgebaut wird.A user wants to use the communication device 18c in his vehicle, a mobile device detachably connected to the vehicle, call a Mr. Bielefeld. He presses on the display field 26 under the dialogues shown 20 , whereupon a "push-to-talk" function is triggered. The user makes a new voice input and calls the name "Bielefeld", which comes from the voice dialogue system 10 is detected. As related to 4 described, the speech input is used as a dialog block 21 on keywords 22 analyzed and in a semantic procedure 27 in other dialog building blocks for content with the same or similar keywords 22 searched. From earlier dialog modules 21 will now be a hit list 23 generated on the display surface 13 is pictured. The content of the hit list 23 For example, consist of two entries: "Navigation to Bielefeld" and "Call Mr. Bielefeld". The user recognizes immediately on the basis of the representation characteristics that the entry does not refer to his intention to telephone and can thus quickly the most appropriate old dialogue building block 21 reuse, by selecting the mobile connection is established directly.

BezugszeichenlisteLIST OF REFERENCE NUMBERS

1010
SprachdialogsystemVoice control system
1111
Mittel zum Erfassen von SpracheingabenMeans for detecting speech input
1212
Speichervorrichtungstorage device
1313
Anzeigeflächedisplay area
1414
Steuervorrichtungcontrol device
1515
semantische Bewertungseinrichtungsemantic evaluation device
1616
Schnittstelleinterface
1717
Benutzeruser
1818
Funktionseinrichtungfunctional device
18a18a
Navigationssystemnavigation system
18b18b
Infotainmenteinrichtunginfotainment device
18c18c
Kommunikationseinrichtungcommunicator
18d18d
Fahrzeugeinstellungenvehicle settings
1919
Lautsprecherspeaker
2020
Dialogdialog
2121
DialogbausteinText block
21a21a
ausgewählter DialogbausteinSelected dialog module
2222
Schlüsselwortkeyword
2323
Trefferlistehit list
2424
graphisches Elementgraphic element
24a–d24a-d
Ausgestaltungsbeispiele der zu den Funktionseinrichtungen gehörigen ElementeExemplary embodiments of the elements belonging to the functional devices
2525
Textdarstellungtext display
2626
Anzeigefelddisplay
2727
Semantische ProzedurSemantic procedure

ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • DE 102007037567 A1 [0004] DE 102007037567 A1 [0004]
  • DE 60309822 T2 [0005] DE 60309822 T2 [0005]
  • EP 1959430 A2 [0006] EP 1959430 A2 [0006]

Claims (10)

Verfahren zum Betreiben eines Sprachdialogsystems (10), bei dem – zu einem Dialog (20) gehörige Spracheingaben erfasst und gespeichert werden und – gespeicherte Dialoge (20) durch graphische Elemente (24), die jeweils einem Dialog (20) zugeordnet sind, auf einer Anzeigefläche (13) dargestellt werden, dadurch gekennzeichnet, dass – die Dialoge (20) in Abhängigkeit von dem Inhalt der zu den Dialogen (20) gehörigen Spracheingaben verschiedenen Kategorien zugewiesen werden und – graphische Elemente (24), die zu Dialogen (20) gleicher Kategorie gehören mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente (24), die zu Dialogen (20) unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht.Method for operating a speech dialogue system ( 10 ), in which - to a dialogue ( 20 ) are recorded and stored and - saved dialogues ( 20 ) by graphic elements ( 24 ), each one a dialogue ( 20 ) are displayed on a display surface ( 13 ), characterized in that - the dialogues ( 20 ) depending on the content of the dialogues ( 20 ) are assigned to different categories of speech inputs and - graphic elements ( 24 ) leading to dialogues ( 20 ) of the same category have at least one identical representation feature, and graphic elements ( 24 ) leading to dialogues ( 20 ) of different categories, have at least one unequal representation feature that makes them visually distinguishable from each other. Verfahren nach Anspruch 1 dadurch gekennzeichnet, dass die Spracheingaben semantisch analysiert werden und die Dialoge (20) in Abhängigkeit von Schlüsselwörtern (22), die in den Spracheingaben der Dialoge (20) vorkommen, verschiedenen Kategorien zugewiesen werden.Method according to claim 1, characterized in that the voice inputs are analyzed semantically and the dialogues ( 20 ) depending on keywords ( 22 ) in the speech inputs of the dialogues ( 20 ) are assigned to different categories. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Spracheingaben als Dialogbausteine (21) erfasst werden, dass die dargestellten graphischen Elemente (24) der Dialoge (20) auswählbar sind und dass nach einer Auswahl eines graphischen Elements (24) die Dialogbausteine (21) des zugehörigen Dialogs (20) angezeigt werden.Method according to Claim 1 or 2, characterized in that the voice inputs are used as dialog modules ( 21 ) that the graphic elements shown ( 24 ) of the dialogues ( 20 ) and that after a selection of a graphical element ( 24 ) the dialog modules ( 21 ) of the associated dialog ( 20 ) are displayed. Verfahren nach Anspruch 3, dadurch gekennzeichnet, dass – eine neue Spracheingabe als Dialogbaustein (21) erfasst oder ein auf der Anzeigefläche (13) dargestellter Dialogbaustein (21) ausgewählt wird, – in dem Dialogbaustein (21) Schlüsselwörter (22) identifiziert werden, – mittels der identifizierten Schlüsselwörter (22) eine sortierte Trefferliste (23) zu assoziierten Funktionen, die über das Sprachdialogsystem (10) ausführbar sind, erzeugt wird und – die Trefferliste (23) nach Beendigung der Spracheingabe oder nach der Auswahl des auf der Anzeigefläche (13) dargestellten Dialogbausteins (21) auf der Anzeigefläche (13) angezeigt wird.A method according to claim 3, characterized in that - a new voice input as a dialog module ( 21 ) or on the display area ( 13 ) displayed dialog module ( 21 ) is selected, - in the dialog module ( 21 ) Keywords ( 22 ), - using the keywords identified ( 22 ) an sorted hit list ( 23 ) to associated functions via the speech dialogue system ( 10 ) are executable, is generated and - the hit list ( 23 ) after completion of the voice input or after selection of the on the display area ( 13 ) dialog modules ( 21 ) on the display area ( 13 ) is shown. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass durch Auswahl eines Dialogbausteins (21), welcher eine Angabe einer über das Sprachdialogsystem (10) ausführbaren Funktion umfasst, die entsprechende Funktion nochmals ausgeführt wird.Method according to one of the preceding claims, characterized in that by selecting a dialog module ( 21 ), which provides an indication of a speech dialogue system ( 10 ) executable function, the corresponding function is executed again. Verfahren nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass die systemseitig bekannten Schlüsselwörter (22) aus vorherigen Spracheingaben extrahiert wurden und/oder im Sprachdialogsystem (10) vordefiniert sind.Method according to one of claims 2 to 5, characterized in that the system-known keywords ( 22 ) were extracted from previous speech inputs and / or in the speech dialogue system ( 10 ) are predefined. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass graphische Elemente (24) zur Darstellung eines Dialogs (20) eine Textdarstellung (25) umfassen, die aus je einem aus Schlüsselwörtern (22) gebildetem Objekt und Prädikat besteht.Method according to one of the preceding claims, characterized in that graphic elements ( 24 ) to represent a dialogue ( 20 ) a text representation ( 25 ), each consisting of keywords ( 22 ) formed object and predicate exists. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Kategorien, denen die Dialoge (20) zugewiesen werden, aus den durch das Sprachdialogsystem (10) ausführbaren Funktionen und/oder den dazugehörigen Funktionseinrichtungen (18) gebildet werden.Method according to one of the preceding claims, characterized in that the categories to which the dialogues ( 20 ) from which the speech dialogue system ( 10 ) executable functions and / or the associated functional devices ( 18 ) are formed. Sprachdialogsystem, umfassend – Mittel (11) zum Erfassen von Spracheingaben, die zu einem Dialog (20) gehören, – eine Speichervorrichtung (12) zum Speichern der erfassten Spracheingaben, – eine Anzeigefläche (13) zur Darstellung von graphischen Elementen (24), die jeweils einem Dialog (20) zugeordnet sind, – eine Steuervorrichtung (14) zum Steuern der graphischen Darstellung der den Dialogen (20) zugeordneten Elemente (24) auf der Anzeigefläche (13) und – eine Schnittstelle (16) zu einer durch das Sprachdialogsystem (10) zu steuernde Funktionseinrichtung (18), dadurch gekennzeichnet, dass – das Sprachdialogsystem (10) eine semantische Bewertungseinrichtung (15) umfasst, mittels derer die Dialoge (20) in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind, und – mittels der Steuervorrichtung (14) die Anzeigefläche (13) so ansteuerbar ist, dass graphische Elemente (24), die zu Dialogen (20) gleicher Kategorie gehören, mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente (24), die zu Dialogen (20) unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht.Speech dialogue system, comprising - means ( 11 ) for capturing speech input that leads to a dialogue ( 20 ), - a storage device ( 12 ) for storing the recorded voice inputs, - a display area ( 13 ) for the representation of graphic elements ( 24 ), each one a dialogue ( 20 ), - a control device ( 14 ) for controlling the graphical representation of the dialogues ( 20 ) associated elements ( 24 ) on the display area ( 13 ) and - an interface ( 16 ) to one through the speech dialogue system ( 10 ) to be controlled functional device ( 18 ), characterized in that - the speech dialogue system ( 10 ) a semantic evaluation device ( 15 ), by means of which the dialogues ( 20 ) are assignable to different categories depending on the contents of the speech inputs belonging to the dialogs, and - by means of the control device ( 14 ) the display area ( 13 ) is controllable such that graphic elements ( 24 ) leading to dialogues ( 20 belong to the same category, have at least one similar representation feature, and graphic elements ( 24 ) leading to dialogues ( 20 ) of different categories, have at least one unequal representation feature that makes them visually distinguishable from each other. Sprachdialogsystem nach Anspruch 9, dadurch gekennzeichnet, dass die Funktionseinrichtung (18) eine Infotainment- und/oder Fahrerassistenzeinrichtung in einem Fahrzeug ist.Speech dialogue system according to claim 9, characterized in that the functional device ( 18 ) is an infotainment and / or driver assistance device in a vehicle.
DE102009058151.0A 2009-12-12 2009-12-12 Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition Expired - Fee Related DE102009058151B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102009058151.0A DE102009058151B4 (en) 2009-12-12 2009-12-12 Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102009058151.0A DE102009058151B4 (en) 2009-12-12 2009-12-12 Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition

Publications (2)

Publication Number Publication Date
DE102009058151A1 true DE102009058151A1 (en) 2011-06-16
DE102009058151B4 DE102009058151B4 (en) 2020-08-20

Family

ID=43992893

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102009058151.0A Expired - Fee Related DE102009058151B4 (en) 2009-12-12 2009-12-12 Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition

Country Status (1)

Country Link
DE (1) DE102009058151B4 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013019208A1 (en) * 2013-11-15 2015-05-21 Audi Ag Motor vehicle voice control
DE102022000387A1 (en) 2022-02-01 2023-08-03 Mercedes-Benz Group AG Method for processing voice inputs and operating device for controlling vehicle functions

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10218680A1 (en) * 2002-04-26 2003-11-06 Bosch Gmbh Robert Method for operating control of electronic devices and electronic device therefor
DE60309822T2 (en) 2002-12-31 2007-10-11 Samsung Electro-Mechanics Co., Ltd., Suwon Method and device for speech recognition
EP1959430A2 (en) 2007-02-19 2008-08-20 Deutsche Telekom AG Method for automatically generating voiceXML speech applications from speech dialog models
DE102007037567A1 (en) 2007-08-09 2009-02-12 Volkswagen Ag Method for multimodal operation of at least one device in a motor vehicle
DE102007042289A1 (en) * 2007-09-06 2009-03-12 Continental Automotive Gmbh Device for replaying multimedia information for mobile application in vehicle or outside vehicle, has display device for visualization of display of information of multimedia information
DE112007000946T5 (en) * 2006-04-20 2009-04-02 Mitac International Corp. Navigation system and content delivery framework for an end user
DE102008051756A1 (en) * 2007-11-12 2009-05-14 Volkswagen Ag Multimodal user interface of a driver assistance system for entering and presenting information
DE102008008948A1 (en) * 2008-02-13 2009-08-20 Volkswagen Ag System architecture for dynamic adaptation of information display for navigation system of motor vehicle i.e. car, has input modalities with input interacting to modalities so that system inputs result about user interfaces of output module
DE102008027958A1 (en) * 2008-03-03 2009-10-08 Navigon Ag Method for operating a navigation system
DE102009017177A1 (en) * 2008-04-23 2009-10-29 Volkswagen Ag Speech recognition arrangement for the acoustic operation of a function of a motor vehicle
DE102008053548A1 (en) * 2008-10-28 2010-04-29 Volkswagen Ag Method for controlling indicating device in vehicle, involves defining multiple contexts, and assigning context to each elements, where contexts are arranged on context scale

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10218680A1 (en) * 2002-04-26 2003-11-06 Bosch Gmbh Robert Method for operating control of electronic devices and electronic device therefor
DE60309822T2 (en) 2002-12-31 2007-10-11 Samsung Electro-Mechanics Co., Ltd., Suwon Method and device for speech recognition
DE112007000946T5 (en) * 2006-04-20 2009-04-02 Mitac International Corp. Navigation system and content delivery framework for an end user
EP1959430A2 (en) 2007-02-19 2008-08-20 Deutsche Telekom AG Method for automatically generating voiceXML speech applications from speech dialog models
DE102007037567A1 (en) 2007-08-09 2009-02-12 Volkswagen Ag Method for multimodal operation of at least one device in a motor vehicle
DE102007042289A1 (en) * 2007-09-06 2009-03-12 Continental Automotive Gmbh Device for replaying multimedia information for mobile application in vehicle or outside vehicle, has display device for visualization of display of information of multimedia information
DE102008051756A1 (en) * 2007-11-12 2009-05-14 Volkswagen Ag Multimodal user interface of a driver assistance system for entering and presenting information
DE102008008948A1 (en) * 2008-02-13 2009-08-20 Volkswagen Ag System architecture for dynamic adaptation of information display for navigation system of motor vehicle i.e. car, has input modalities with input interacting to modalities so that system inputs result about user interfaces of output module
DE102008027958A1 (en) * 2008-03-03 2009-10-08 Navigon Ag Method for operating a navigation system
DE102009017177A1 (en) * 2008-04-23 2009-10-29 Volkswagen Ag Speech recognition arrangement for the acoustic operation of a function of a motor vehicle
DE102008053548A1 (en) * 2008-10-28 2010-04-29 Volkswagen Ag Method for controlling indicating device in vehicle, involves defining multiple contexts, and assigning context to each elements, where contexts are arranged on context scale

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102013019208A1 (en) * 2013-11-15 2015-05-21 Audi Ag Motor vehicle voice control
DE102022000387A1 (en) 2022-02-01 2023-08-03 Mercedes-Benz Group AG Method for processing voice inputs and operating device for controlling vehicle functions

Also Published As

Publication number Publication date
DE102009058151B4 (en) 2020-08-20

Similar Documents

Publication Publication Date Title
DE102009017177B4 (en) Speech recognition arrangement and method for acoustically operating a function of a motor vehicle
EP1721245B1 (en) Method for selecting a list item and information or entertainment system, especially for motor vehicles
EP2013054B1 (en) Multifunctional operator control and radio navigation system for a motor vehicle
DE102011109932B4 (en) Method for controlling functional devices in a vehicle during voice command operation
EP2026328B1 (en) Method for multimodal control of at least one device in a motor vehicle
WO2005064438A2 (en) Operating system for a vehicle
DE102009037658A1 (en) Vehicle i.e. passenger car, has control device changing distance of cursor indication to graphical objects, and voice recognition device detecting voice command and selecting function from selected group of functions based on voice command
DE10328200B4 (en) Navigation device for a motor vehicle
DE102013001884A1 (en) System-initiated help function for the operation of a device associated with a vehicle - input of spaces
DE102009058151B4 (en) Method for operating a speech dialogue system with semantic evaluation and speech dialogue system in addition
EP3115886B1 (en) Method for operating a voice controlled system and voice controlled system
DE102009030263A1 (en) Method for controlling menu-based operation and information system of vehicle, involves displaying menu and forming controlling element for controlling menu
EP1321851B1 (en) Method and system for the usage of user selectable markers as entry points in the structure of a menu of a speech dialogue system
EP3469581B1 (en) Method for operating a motor vehicle with an operating device
DE102009018590A1 (en) Motor vehicle has operating device for menu-guided operation of motor vehicle, where computing device is provided for displaying list of sub-menus on display
DE102010049869B4 (en) Method for providing a voice interface in a vehicle and device therefor
DE102013223972A1 (en) System-wide search in driver information systems
DE102008033441B4 (en) Method for operating an operating system for a vehicle and operating system for a vehicle
DE102013001885A1 (en) System-initiated help function per trip and / or per user for the operation of a device associated with a vehicle
DE102008025532B4 (en) A communication system and method for performing communication between a user and a communication device
WO2020200557A1 (en) Method and apparatus for interaction with an environment object in the surroundings of a vehicle
EP1164464B1 (en) Method for controlling a system, in particular an electrical and/or electronic system with at least one application device
DE102019201413A1 (en) Method for operating and / or controlling a dialog system
DE102018218790A1 (en) Method for outputting at least text information on an associated information symbol in a vehicle, and an information system
DE112018006615T5 (en) Operation restriction control apparatus and operation restriction control method

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
R012 Request for examination validly filed
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee