-
Die vorliegende Erfindung betrifft ein Verfahren zum Betreiben eines Sprachdialogsystems, bei dem zu einem Dialog gehörige Spracheingaben erfasst und gespeichert werden und gespeicherte Dialoge durch graphische Elemente, die jeweils einem Dialog zugeordnet sind, auf einer Anzeigefläche dargestellt werden. Die Erfindung betrifft ferner ein entsprechend ausgestaltetes Sprachdialogsystem.
-
Sprachdialogsysteme finden ein breites Anwendungsspektrum für Bediensysteme. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Auch hat sich die Bedienung von Einrichtungen eines Fahrzeugs über Spracheingaben als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Zur Eingabe komplexer Sachverhalte wird eine entsprechende Information von einem Sprachdialogsystem sequentiell vom Benutzer abgefragt. Dies geschieht durch einen von dem Sprachdialogsystem geführten Dialog, welcher sich dem Benutzer als eine logisch aufeinander aufbauende Reihe von Fragen darstellt. Die Fragen dienen dabei insbesondere zur Eingrenzung eines Sachverhalts, bis das Sprachdialogsystem zu einer eindeutigen Reaktion in der Lage ist.
-
Dabei wird der Dialog primär sprachlich beziehungsweise akustisch zwischen dem Sprachdialogssystem und dem Benutzer geführt. Bei einigen nach dem Stand der Technik bekannten Sprachdialogsystemen wird die akustische Ausgabe des Sprachdialogssystems zusätzlich als Text auf einer Anzeigefläche dargestellt. Die Anzeigefläche kann dabei über eine berührungsempfindliche Oberfläche verfügen. Der Benutzer muss bei den heute bekannten Sprachdialogsystemen bei einer Spracheingabe typischerweise auf eine bestimmte Taste („Push-To-Talk“-Taste) drücken, welche einen Spracherkenner aktiviert, um die Spracheingabe des Benutzers aufzuzeichnen.
-
In der
DE 10 2007 037 567 A1 ist ein Verfahren zur automatischen Ansteuerung eines Geräts durch Spracheingaben beschrieben.
-
Die
DE 603 09 822 T2 beschreibt ein Verfahren und eine Vorrichtung zum Verbessern der Leistungsfähigkeit bei der Spracherkennung.
-
In der
EP 1 959 430 A2 ist ein Verfahren zur automatischen Generierung von Sprachanwendungen mittels Sprachdialogmodellen beschrieben, wobei insbesondere eine dazu passende effiziente Entwicklungsumgebung beschrieben wird.
-
Die Druckschrift
DE 11 2007 000 946 T5 beschreibt ein Sprachdialogsystem, bei dem von einem Benutzer ausführbare Funktionen jeweils verschiedenen Kategorien zugewiesen werden und anhand der Kategorien angesteuert werden können. Zudem werden diese Kategorien durch unterschiedliche graphische Elemente für den Nutzer visuell unterscheidbar gemacht.
-
Die Druckschrift
DE 102 18 680 A1 offenbart eine hierarchische Anordnung von Funktionen innerhalb von Kategorieslisten, wobei die Auswahl der Funktionen mittels Sprachsteuerung erfolgen kann.
-
Als nachteilig hat sich herausgestellt, dass es dem Nutzer nur schwer möglich ist, innerhalb eines Dialogs zu einer beliebigen Stelle zurückzuspringen, um eine bereits getätigte Eingabe zu wiederholen oder abzuändern. Dies ist jedoch in der Praxis wünschenswert, da in manchen Fällen erst nach der entsprechenden Reaktion des Sprachdialogsystems auf eine Eingabe des Benutzers der Sinn oder die semantische Wirkung der Eingabe von dem Benutzer eingeschätzt werden kann. Ferner kann es sich um einen zu einem in der Vergangenheit getätigten ähnlichen Sprachdialog handeln, der nur noch leicht modifiziert werden müsste, um somit die Interaktion zwischen dem Sprachdialogsystem und dem Benutzer abzukürzen.
-
Selbst wenn Sprachdialoge zusätzlich als Text auf einer Anzeige dargestellt werden, kann insbesondere bei einer entsprechend großen Anzahl an dargestellten Dialogen oder bei langen Dialogverläufen das Auffinden und manuelle Navigieren zu einem gesuchten Dialogbaustein sehr zeit- und interaktionsaufwändig sein. Dies ist insbesondere bei einem Einsatz in einem Fahrzeug nachteilig.
-
Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren zum Betreiben eines Sprachdialogsystems sowie ein entsprechendes Sprachdialogsystem der eingangs erwähnten Art anzugeben, bei denen bestimmte, auf einer Anzeigefläche dargestellte Dialoge oder Teile davon schnell aufgefunden werden können.
-
Diese Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Anspruchs 1 und einem Sprachdialogsystem mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Aus- und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.
-
Das erfindungsgemäße Verfahren ist dadurch gekennzeichnet, dass die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zugewiesen werden und graphische Elemente, die zu Dialogen gleicher Kategorie gehören mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht. Dies ermöglicht das schnelle Auffinden in der Vergangenheit aufgezeichneter Dialoge oder Dialogbausteine. Das Verfahren ist insbesondere für den Fahrer eines Fahrzeugs vorteilhaft, da er mit einem kurzen Blick schnell die für die Situation relevanten Dialoge oder Dialogbausteine erkennen kann, ohne dabei vom Straßenverkehr abgelenkt zu werden.
-
Insbesondere können die Spracheingaben semantisch analysiert werden und die Dialoge in Abhängigkeit von Schlüsselwörtern, die in den Spracheingaben der Dialoge vorkommen, verschiedenen Kategorien zugewiesen werden. Für den Fall, dass ein Dialog mangels fehlender semantischer Erkennung keiner bestimmten Kategorie zugeordnet werden kann, beispielsweise durch eine unvollständige Eingabe oder einen Dialogabbruch, besteht die Möglichkeit, solche Dialoge einer gesonderten Kategorie zuzuordnen, die alle undefinierten oder neutralen Dialoge enthält. Werden solche Dialoge ausgewählt und erweitert oder abgeändert, so kann gegebenenfalls zu einem späteren Zeitpunkt eine Zuordnung zu einer bestimmten Kategorie erfolgen.
-
Die Spracheingaben werden typischerweise als Dialogbausteine erfasst, wobei die dargestellten graphischen Elemente der Dialoge auswählbar sind. Nach Auswahl eines graphischen Elements werden die Dialogbausteine des zugehörigen Dialogs angezeigt. Ein Dialog setzt sich somit aus mehreren Dialogbausteinen zusammen. Um bei dem erfindungsgemäßen Verfahren zu einem bestimmten Dialogbaustein zu navigieren, wählt der Nutzer zunächst das graphische Element eines zugehörigen Dialogs aus. Den zugehörigen Dialog kann der Nutzer leicht anhand der zu den Kategorien gehörigen Darstellungsmerkmale erkennen. Nach der Auswahl des graphischen Elements kann der Nutzer den gewünschten Dialogbaustein auswählen. Auf diese Weise ist es innerhalb des Sprachdialogsystems möglich, schnell zu einer bestimmten Spracheingabe zu gelangen und den Dialog dann fortzusetzen. Es müssen insbesondere nicht alle Spracheingaben zu Dialogbausteinen wiederholt werden, welche dem ausgewählten Dialogbaustein in dem betreffenden Dialog vorangehen. Auf diese Weise kann die Spracheingabe erheblich verkürzt und vereinfacht werden.
-
Dialogbausteine können neben einer erfassten Spracheingabe auch durch Ausgaben des Sprachdialogsystems, beispielsweise eine Rückfrage an den Benutzer oder eine Ankündigung zur Ausführung einer Aktion, gebildet werden. Das Auswählen von Dialogen oder Dialogbausteinen kann dabei auf verschiedene Art, beispielsweise akustisch oder manuell erfolgen. Die semantische Analyse der Schlüsselwörter in den Dialogbausteinen, der hierarchische Aufbau der Dialoge sowie deren Darstellung in aus den Schlüsselwörtern abgeleiteten visuell differenzierten Kategorien ermöglicht ein bequemes und zielgerichtetes Navigieren durch die auf der Anzeigefläche dargestellten Dialoge.
-
Vorteilhafterweise kann das erfindungsgemäße Verfahren so ausgestaltet sein, dass eine neue Spracheingabe als Dialogbaustein erfasst oder ein auf der Anzeigefläche dargestellter Dialogbaustein ausgewählt wird, wobei dann in dem Dialogbaustein Schlüsselwörter identifiziert werden, mittels denen eine sortierte Trefferliste zu assoziierten Funktionen, die über das Sprachdialogsystem ausführbar sind, erzeugt wird und die Trefferliste nach Beendigung der Spracheingabe oder nach der Auswahl des auf der Anzeigefläche dargestellten Dialogbausteins auf der Anzeigefläche angezeigt wird.
-
Die Trefferliste kann einen oder mehrere Einträge haben oder auch leer sein. Zweckmäßigerweise wird eine längere Liste mit typischerweise mehr als drei bis fünf Einträgen nach der Relevanz sortiert, da alle Einträge nicht mehr auf einen Blick vom Benutzer visuell erfassbar wären. Wenn kein passender Eintrag gefunden wird, kann entweder als Ergebnis eine leere Liste ausgegeben werden oder eine Liste der nächstbesten, möglicherweise nicht relevanten Treffer. Auch kann ein sogenanntes Konfidenzmaß, beispielsweise in Prozent, angezeigt werden, das als Relevanzmaß der Einträge in der Trefferliste dient.
-
Eine solche Trefferliste ermöglicht eine gute Vernetzung zwischen den Dialogbausteinen. Will beispielsweise ein Benutzer einen speziellen, komplexen Bedienvorgang starten, der in ähnlicher Form bereits früher eingegeben wurde, so kann er mittels der visuell differenzierten Kategorien schnell einen relevanten Dialog auffinden, diesen auswählen, wodurch die dazugehörigen Dialogbausteine zur Anzeige gebracht werden. Nach Auswahl eines Dialogbausteins werden ihm alle semantisch ähnlichen Dialogbausteine aus diesem und anderen Dialogen nach einer semantischen Relevanz berechnet und sortiert in einer Liste dargestellt.
-
In einer Ausgestaltung des erfindungsgemäßen Verfahrens wird durch Auswahl eines Dialogbausteins, welcher eine Angabe einer über das Sprachdialogsystem ausführbaren Funktion umfasst, die entsprechende Funktion nochmals ausgeführt.
-
Bei dem erfindungsgemäßen Verfahren sind die systemseitig bekannten Schlüsselwörter aus vorherigen Spracheingaben extrahiert worden und/oder im Sprachdialogsystem vordefiniert. Letzteres hat den Vorteil, dass zu den über das Sprachdialogsystem ausführbaren Funktionen passende Schlüsselwörter systemseitig definiert sind, ohne dass ein Benutzer die Funktion vorher hätte benutzt haben müssen. Die Extraktion aus vorherigen Spracheingaben ist vorteilhaft, um ein nutzerspezifisches Verhalten besser berücksichtigen zu können. Insbesondere immer wieder gewählte Navigationsziele, Rufnummern oder Radiosender können so systemseitig als hochrelevante Schlüsselwörter erkannt und für die semantische Bewertung von Spracheingaben eines Benutzers berücksichtigt werden. Die Schlüsselwörter können dabei durch ein von Suchmaschinen bekanntes Verfahren zur Informationskonsolidierung, dem sogenannten „automatic summarization“, ermittelt werden.
-
Insbesondere können zu Schlüsselwörtern auch Synonyme, Antonyme und assoziierte Begriffe gebildet werden, die bei der semantischen Analyse berücksichtigt werden. Dabei können Synonyme oder assoziierte Begriffe eine den dazugehörigen Schlüsselwörtern äquivalente Wirkung besitzen, vor allem für die Kategoriezuordnung und für die Relevanzbewertung bei der Bildung der Trefferlisten. Die Funktion der Antonyme kann unterschiedlich ausfallen. Sie können Hinweise für die Nichtrelevanz eines Dialogbausteins liefern, kontextspezifisch aber auch eine besondere Relevanz andeuten, beispielsweise wenn eine kurz zuvor ausgeführte Aktion rückgängig gemacht werden soll. In diesem Falle könnte bei Eingabe desselben Navigationsziels kurz hintereinander zu dem Dialogbaustein „Ziel Eingeben“ auch der relevante Dialogbaustein „Ziel löschen“ angezeigt werden.
-
In einer Ausgestaltung des erfindungsgemäßen Verfahrens umfassen graphische Elemente zur Darstellung eines Dialogs eine Textdarstellung, die aus je einem aus Schlüsselwörtern gebildetem Objekt und Prädikat besteht. Vorteilhafterweise wird die Darstellung dabei so an die Anzeigefläche angepasst, dass eine einzeilige Darstellung möglich ist. Idealerweise werden Prädikat und Objekt aus der letzten Systemaktion des Dialogs gebildet. Dies ermöglicht dem Benutzer, den Kern eines Dialogs schnell semantisch zu erfassen, was die Interaktionszeit mit dem System weiter optimiert.
-
Alternativ oder auch zusätzlich kann ein Darstellungsmerkmal eines graphischen Elements zur optischen Unterscheidbarkeit der Kategorien der Dialoge aus einer Farbcodierung und/oder einem Zusatzelement bestehen. Ein solches Zusatzelement ist beispielsweise ein Logo oder eine Ikone. Werden dabei, gemäß einer typischen Anwendung des erfindungsgemäßen Verfahrens, die Kategorien, denen die Dialoge zugewiesen werden, aus den durch das Sprachdialogsystem ausführbaren Funktionen und/oder den dazugehörigen Funktionseinrichtungen gebildet, z.B. einem Navigationsgerät oder einer Mobilfunkeinrichtung in einem Fahrzeug, so können diese durch entsprechende Logos, beispielsweise einem symbolischen Kartenausschnitt oder einem symbolischen Telefon, gekennzeichnet werden.
-
Das erfindungsgemäße Sprachdialogsystem umfasst Mittel zum Erfassen von Spracheingaben, insbesondere als Dialogbausteine, eine Speichervorrichtung zum Speichern der erfassten Spracheingaben, eine Anzeigefläche zur Darstellung von graphischen Elementen, die jeweils einem Dialog zugeordnet sind, eine Steuervorrichtung zum Steuern der graphischen Darstellung der den Dialogen zugeordneten Elemente auf der Anzeigefläche und eine Schnittstelle zu einer durch das Sprachdialogsystem zu steuernde Funktionseinrichtung. Das erfindungsgemäße Sprachdialogsystem ist dadurch gekennzeichnet, dass es eine semantische Bewertungseinrichtung umfasst, mittels derer die Dialoge in Abhängigkeit von dem Inhalt der zu den Dialogen gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind und mittels der Steuervorrichtung die Anzeigefläche so ansteuerbar ist, dass graphische Elemente, die zu Dialogen gleicher Kategorie gehören, mindestens ein gleiches Darstellungsmerkmal aufweisen, und graphische Elemente, die zu Dialogen unterschiedlicher Kategorien gehören, mindestens ein ungleiches Darstellungsmerkmal aufweisen, das sie optisch voneinander unterscheidbar macht.
-
Typischerweise umfasst die Funktionseinrichtung eine Infotainment- und/oder Fahrerassistenzeinrichtung in einem Fahrzeug. Zu Infotainmenteinrichtungen gehören insbesondere Rundfunk- oder Fernsehempfänger, Mobilfunkgeräte, Kassetten- oder CD-Spieler sowie andere Unterhaltungselektronik. Unter den Begriff Fahrerassistenzeinrichtung fallen insbesondere Navigationsgeräte und Geräte zu den Fahrzeugeinstellungen wie die Klimaanlage.
-
Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug zu den Figuren näher erläutert.
- 1 zeigt schematisch die Systemarchitektur gemäß einem Ausführungsbeispiel des erfindungsgemäßen Sprachdialogsystems,
- 2 zeigt graphische Darstellungen von Sprachdialogen, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden, sowie die dazugehörigen wesentlichen Verfahrenschritte,
- 3 zeigt gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens eine Zuordnung von Kategorien, die durch Funktionseinrichtungen gebildet werden, und graphischen Elementen zur Darstellung der den Kategorien zugewiesenen Dialoge und
- 4 zeigt weitere graphische Darstellungen von Sprachdialogen, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden, sowie die dazugehörigen wesentlichen Verfahrenschritte.
-
In 1 ist ein Ausführungsbeispiel eines erfindungsgemäßen Sprachdialogsystems 10 dargestellt. Es umfasst Mittel 11 zum Erfassen von Spracheingaben - beispielsweise ein Mikrophon mit einem Spracherkennungsmodul -, die von einem Nutzer 17 gesprochen werden, und eine Speichervorrichtung 12 zum Speichern dieser Spracheingaben. Die Spracheingaben können dabei in analoger oder digitaler Form abgespeichert werden, wobei eine Digitalisierung für die weiteren Schritte zweckmäßig ist. Insbesondere können die Spracheingaben in Textform konvertiert abgespeichert werden. Die Speichervorrichtung 12 ist mit einer Steuervorrichtung 14 verbunden, welche die graphische Darstellung auf der Anzeigefläche 13 steuert, wie es später im Detail erläutert wird. Die Anzeigefläche 13 kann mit einer berührungsempfindlichen Oberfläche ausgestattet sein, so dass als Schaltflächen dargestellte Anzeigeinhalte manuell ausgewählt werden können. Das Sprachdialogsystem kann über einen Lautsprecher 19 verfügen, über den akustische Ausgaben, beispielsweise Rückfragen an den Benutzer 17, ausgeben werden können.
-
Mittels der Steuervorrichtung 12 werden aus den Spracheingaben Dialogbausteine 21 gebildet, wobei sich ein Dialog 20 aus mehreren Dialogbausteinen 21 zusammensetzt. Wie es später im Detail erläutert wird, ist jedem Dialog 20 ein graphisches Element 24 zugeordnet, welches zum Beispiel in einer Liste mittels der Steuervorrichtung 14 auf der Anzeigefläche 13 anzeigbar ist. Bei einer Auswahl eines graphischen Elements 24 steuert die Steuervorrichtung 14 die Anzeigefläche 13 so an, dass die Dialogbausteine 21 zum Beispiel an einer Liste angezeigt werden, die zu dem Dialog 20 des ausgewählten graphischen Elements 24 gehört.
-
Erfindungsgemäß umfasst das Sprachdialogsystem 10 ferner eine semantische Bewertungseinrichtung 15, mittels derer die Dialoge 20 in Abhängigkeit von dem Inhalt der zu den Dialogen 20 gehörigen Spracheingaben verschiedenen Kategorien zuweisbar sind. Die Steuervorrichtung 14 leitet dabei gezielt ausgewählte Dialoge 20 oder darin enthaltene Dialogbausteine 21 an die semantische Bewertungseinrichtung 15 weiter, in der dann in einer Prozedur eine semantische Analyse oder Bewertung vorgenommen wird. Das Ergebnis wird an die Steuervorrichtung 14 signalisiert, die die daraus resultierende Änderung der Darstellung auf der Anzeigefläche 13 steuert.
-
Die Steuervorrichtung 14 ist über eine Schnittstelle 16 mit einer Funktionseinrichtung 18 verbunden, dessen Funktionen über das Sprachdialogsystem 10 steuerbar sind. Die Schnittstelle 16 kann eine beliebige Schnittstelle sein, die für elektronische Geräte üblich ist. Typischerweise wird die Schnittstelle 16 mit einem Datenbus verbunden sein, an den auch die Funktionseinrichtung 18 angebunden ist. Die Schnittstelle 16 kann auch drahtgebundene oder drahtlose Telekommunikationsverbindungen umfassen.
-
Vorzugsweise ist das erfindungsgemäße Sprachdialogsystem 10 in einem Fahrzeug angeordnet. Die Funktionseinrichtung 18 kann dann insbesondere ein Navigationssystem 18a, eine Infotainmenteinrichtung 18b, eine Kommunikationseinrichtung 18c oder die Fahrzeugeinstellungen 18d umfassen. Eine Infotainmenteinrichtung 18b umfasst dabei typischerweise einen Rundfunkempfänger und/oder Datenträgerabspielgeräte zur Wiedergabe von Audio- und oder Videosignalen und eine Kommunikationseinrichtung 18c umfasst typischerweise ein in das Fahrzeug integriertes oder lösbar befestigtes Mobilfunkgerät. Die Fahrzeugeinstellungen 18d werden insbesondere durch die Funktionen einer Klimaanlage dargestellt, können aber weitere Funktionen umfassen, beispielsweise die Steuerung der Lichtmaschine, automatische Einparkhilfen oder andere Fahrerassistenzfunktionen.
-
In 2 sind graphische Darstellungen von Dialogen 20 gezeigt, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden. Die Dialoge 20 sind beispielsweise auf nach den Stand der Technik bekannte Art und Weise durch Interaktion eines Benutzer mit dem erfindungsgemäßen Sprachdialogsystem 10 entstanden und bestehen aus Dialogbausteinen 21, die aus Spracheingaben des Benutzers oder aus Ausgaben des Sprachdialogssystems 10, beispielsweise Rückfragen an den Benutzer oder Ankündigungen zum Ausführen von Aktionen, gebildet werden. Der Inhalt der Dialogbausteine 21 kann zunächst als beliebig angenommen werden; konkrete Inhalte zur Veranschaulichung des Verfahrens werden weiter unten in Beispielen näher erläutert.
-
Die Dialogbausteine 21 eines Dialogs 20 werden nun in einer semantischen Prozedur 27, die in der semantischen Bewertungseinrichtung 15 abläuft, auf Schlüsselwörter 22 oder dazugehörige Synonyme, Antonyme oder assoziierte Begriffe analysiert. Nach Abschluss der Analyse erfolgt mit einer Bewertung eine Zuordnung des Dialogs 20 zu einer Kategorie, die durch ein graphisches Element 24 graphisch repräsentiert und der Dialog 20 mit diesem graphischen Element 24 auf der Anzeigefläche 13 dargestellt wird.
-
Ferner kann in der semantischen Bewertungsinstanz 15 aus den Schlüsselwörtern 22 in den Dialogbausteinen 21 der Inhalt des Dialogs 20 zusammengefasst und als Textdarstellung 25 dargestellt werden. Um dabei dem Benutzer ein schnelles Erfassen des Dialoginhalts zu ermöglichen, ist es zweckmäßig, diese Zusammenfassung so kurz zu gestalten, dass sie einzeilig auf der Anzeigefläche 13 darstellbar ist. Besonders aussagekräftig wird eine solche Textdarstellung 25, wenn sie aus einem Objekt und einem Prädikat gebildet wird, die vorteilhafterweise aus dem Dialogbaustein 21, der die letzte Systemaktion des Dialogs 20 darstellt, herausgefiltert werden.
-
In 3 ist gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens eine Zuordnung von den Kategorien und den graphischen Elementen 24 zur Darstellung der Kategorien dargestellt. Die Kategorien werden durch die Funktionen der Funktionseinrichtungen 18 aus 1 gebildet. Das Navigationssystem 18a wird beispielsweise durch einen Wegepfeil 24a dargestellt, die Infotainmenteinrichtung 18b durch einen Violinschlüssel 24b, die Kommunikationseinrichtung 18c durch einen Telefonhörer 24c und die Fahrzeugeinstellungen 18d durch ein Symbol 24d einer Klimaanlage. Die graphischen Elemente 24 stellen sicher, dass Dialoge 20 gleicher Kategorien mit mindestens einem gleichen Darstellungsmerkmal dargestellt werden und Dialoge 20 unterschiedlicher Kategorien mit mindestens einem ungleichen Darstellungsmerkmal, das sie optisch voneinander unterscheidbar macht. Beispielsweise wird ein Dialog für eine Zielführung, die für das Navigationssystem 18a angegeben wurde, anhand eines graphischen Elements 24 gekennzeichnet, welches als Darstellungsmerkmal den Wegepfeil 24a enthält. Anhand dieses Darstellungsmerkmals kann der Nutzer somit schnell und intuitiv erfassen, dass der zugehörige Dialog 20 einer zu dem Navigationssystem 18a gehörigen Kategorie zugeordnet ist. Allgemein erkennt der Benutzer auf einen Blick, zu welchem Themengebiet ein Dialog 20 und damit auch die zu steuernde Funktion der Funktionseinrichtung 18a bis 18d gehört.
-
Die graphischen Elemente 24 können auch eine farbliche Unterscheidung der Kategorien vorsehen und beispielsweise die auch bei schlechter Beleuchtung schnell unterscheidbaren Grundfarben benutzen. Es können auch andere visuelle Effekte eingesetzt werden, um beispielsweise Funktionen, bei denen eine schnelle Interaktion des Benutzers nötig ist, durch Blinken zu unterstützen. Es ist auch möglich, dass mehrere Sätze von Kategorien gebildet werden, so dass ein Dialog 20 aus verschiedenen Blickwinkeln des Benutzungshintergrunds kategorisiert werden kann, beispielsweise unter dem Aspekt des Fahrzeugbetriebs oder dem Aspekt der Nutzerintention. Auf diese Weise könnte ein privates und dienstliches Telefonat unterschieden werden oder auch das Suchen eines Radiosenders mit Verkehrsnachrichten (Fahrzeugbetrieb) gegenüber einem Musiksender (Nutzerintention).
-
Die graphischen Elemente 24a bis 24d können beispielsweise in einer Auswahlliste von Symbolen vom Benutzer den jeweiligen Funktionseinrichtungen 18a bis 18d entsprechend konfiguriert werden. In der Steuervorrichtung 14 können auch Standardsymbole für Klassen von Funktionseinrichtungen 18 vorinstalliert sein, die sich über die Schnittstelle 16 in einer Art „Handshake-Prozedur“ der Steuervorrichtung 14 als solche zu erkennen geben.
-
In 4 sind graphische Darstellungen von Dialogen 20 gezeigt, die gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens erzeugt wurden. Wählt der Benutzer einen Dialog 20 aus, so werden ihm die dazugehörigen Dialogbausteine 21 angezeigt. Wählt er nun weiter einen bestimmten Dialogbaustein 21a aus, so werden darin Schlüsselwörter 22 identifiziert. In einer semantischen Prozedur 27, die in der semantischen Bewertungseinrichtung 15 abläuft, wird in anderen Dialogbausteinen nach Inhalten mit gleichen oder ähnlichen Schlüsselwörtern 22 oder Synonymen, assoziierten Begriffen und ggf. auch Antonymen gesucht. Die Dialogbausteine 21 werden je nach Relevanz oder Ähnlichkeit mit dem Dialogbaustein 21a in einer Trefferliste 23 abgespeichert. Gleichzeitig wird für jeden verglichenen Dialogbaustein 21 ein sogenanntes Konfidenzmaß berechnet und ebenfalls in der Trefferliste 23 abgespeichert.
-
Die Trefferliste 23 kann nun mit allen Dialogbausteine 21 oberhalb eines gewissen Konfidenzmaßes angezeigt werden. Eine lange Trefferliste 23 wird dabei vorteilhafterweise nur gekürzt dargestellt, wobei die nicht angezeigten Listeneinträge beispielsweise durch Betätigung eines Rollbalkens oder über ein funktionales Anzeigefeld 26 darstellbar sind. Ferner könnte in einem weiteren Anzeigefeld 26 das Konfidenzmaß der angezeigten Listeneinträge oder die Anzahl der Treffer oberhalb eines festgesetzten Konfidenzmaßes dargestellt werden. Wenn kein passender Eintrag gefunden wird, kann entweder als Ergebnis eine leere Liste ausgegeben werden oder eine Liste mit den nächstbesten, möglicherweise nicht oder nur wenig relevanten Treffern.
-
Um das Verfahren und die oben erläuterten prinzipiellen Verfahrensschritte weiter zu veranschaulichen, werden im Folgenden ein paar Beispiele mit Bezug zu den 2 und 4 angegeben.
-
Beispiel 1:
-
Ein Benutzer führt einen Dialog 20 mit dem Sprachdialogsystem 10 zu einem bislang neuen Thema, indem er über das Autoradio in einem neuen Sendegebiet einen Radiosender mit aktuellen Wirtschaftsnachrichten sucht. Der aufgezeichnete Dialog 20 wird mittels der Schlüsselwörter 22 in den Dialogbausteinen 21 der Kategorie Infotainment und alternativ der Kategorie „Business“ zugeordnet und mit entsprechenden Darstellungsmerkmalen auf der Anzeigefläche 13 dargestellt.
-
Beispiel 2:
-
Der Benutzer vom ersten Beispiel möchte den Radiosender neu einstellen. Er sucht in der auf der Anzeigefläche 13 dargestellten Dialogliste den zuvor aufgezeichneten Dialog 20 aus, den er Aufgrund des graphischen Elements 24 schnell erkennt. Die Auswahl kann mittels eines Cursors oder auch direkt über die berührungsempfindliche Oberfläche erfolgen. Durch einen geeigneten Befehl, beispielsweise einem Doppelklick, öffnet sich der Inhalt des Dialogs 20 und die darin enthaltenen Dialogbausteine 21 werden angezeigt. Der Benutzer wählt nun einen Dialogbaustein 21 „SENDER ANZEIGEN“ aus, der die Ankündigung des Systems enthält, die empfangbaren oder unter den Favoriten gespeicherten Radiosender anzuzeigen, wodurch diese zur Anzeige gebracht werden. Der Benutzer hat somit die Möglichkeit, aufgrund vorheriger Eingaben im Bedienmenü eine Abkürzung zu nehmen und kann jetzt weiter im Sprachdialog verfahren, entweder durch weitere Spracheingaben oder durch Auswahl weiterer Anzeigeinhalte.
-
Beispiel 3:
-
Ein Benutzer möchte über die Kommunikationseinrichtung 18c in seinem Fahrzeug, einem lösbar mit dem Fahrzeug verbundenen Mobilfunkgerät, einen Herrn Bielefeld anrufen. Dazu drückt er auf das Anzeigefeld 26 unter den dargestellten Dialogen 20, woraufhin eine „Push-To-Talk“-Funktion ausgelöst wird. Der Nutzer macht eine neue Spracheingabe und nennt den Namen „Bielefeld“, der von dem Sprachdialogsystem 10 erfasst wird. Wie mit Bezug zu 4 beschrieben, wird die Spracheingabe als Dialogbaustein 21 auf Schlüsselwörter 22 analysiert und in einer semantischen Prozedur 27 in anderen Dialogbausteinen nach Inhalten mit gleichen oder ähnlichen Schlüsselwörtern 22 gesucht. Aus früheren Dialogbausteinen 21 wird nun eine Trefferliste 23 generiert, die auf der Anzeigefläche 13 dargestellt wird. Der Inhalt der Trefferliste 23 bestehe beispielsweise aus zwei Einträgen: „Navigation nach Bielefeld“ und „Herrn Bielefeld anrufen“. Der Benutzer erkennt sofort anhand der Darstellungsmerkmale, dass sich der eine Eintrag nicht auf sein Vorhaben zu telefonieren bezieht und kann so schnell den passensten alten Dialogbaustein 21 wiederverwenden, durch dessen Auswahl direkt die Mobilfunkverbindung aufgebaut wird.
-
Bezugszeichenliste
-
- 10
- Sprachdialogsystem
- 11
- Mittel zum Erfassen von Spracheingaben
- 12
- Speichervorrichtung
- 13
- Änzeigefläche
- 14
- Steuervorrichtung
- 15
- semantische Bewertungseinrichtung
- 16
- Schnittstelle
- 17
- Benutzer
- 18
- Funktionseinrichtung
- 18a
- Navigationssystem
- 18b
- Infotainmenteinrichtung
- 18c
- Kommunikationseinrichtung
- 18d
- Fahrzeugeinstellungen
- 19
- Lautsprecher
- 20
- Dialog
- 21
- Dialogbaustein
- 21a
- ausgewählter Dialogbaustein
- 22
- Schlüsselwort
- 23
- Trefferliste
- 24
- graphisches Element
- 24a-d
- Ausgestaltungsbeispiele der zu den Funktionseinrichtungen gehörigen Elemente
- 25
- Textdarstellung
- 26
- Anzeigefeld
- 27
- Semantische Prozedur