DE102010054217A1 - Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu - Google Patents

Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu Download PDF

Info

Publication number
DE102010054217A1
DE102010054217A1 DE201010054217 DE102010054217A DE102010054217A1 DE 102010054217 A1 DE102010054217 A1 DE 102010054217A1 DE 201010054217 DE201010054217 DE 201010054217 DE 102010054217 A DE102010054217 A DE 102010054217A DE 102010054217 A1 DE102010054217 A1 DE 102010054217A1
Authority
DE
Germany
Prior art keywords
input
function
cluster
vehicle
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
DE201010054217
Other languages
English (en)
Inventor
Stefan Winger
Silvio Federau
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE201010054217 priority Critical patent/DE102010054217A1/de
Publication of DE102010054217A1 publication Critical patent/DE102010054217A1/de
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

Die vorliegende Erfindung betrifft Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und ein dazugehöriges Sprachbediensystem. Bei dem erfindungsgemäßen Verfahren wird eine Spracheingabe erfasst und die Spracheingabe wird mit einer strukturierten Menge von Dateneinträgen (31–39), die jeweils einem oder mehreren Cluster(n) (20–29; 35) zugeordnet werden, verglichen. In Abhängigkeit von diesem Vergleich wird/werden ein oder mehrere Cluster (20–29; 35) ausgewählt, einem ausgewählten Cluster (20–29; 35) wird eine Funktionskategorie zugeordnet und in Abhängigkeit von den ermittelten Cluster-Funktionskategorie-Paaren wird ein Steuersignal zum Ausführen einer Funktion im Fahrzeug erzeugt.

Description

  • Die vorliegende Erfindung betrifft Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und ein dazugehöriges Sprachbediensystem.
  • Sprachbediensysteme finden ein breites Anwendungsspektrum. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Zur Eingabe komplexer Sachverhalte wird eine entsprechende Information von einem Sprachdialogsystem sequentiell vom Benutzer abgefragt. Dies geschieht durch einen von dem Sprachdialogsystem geführten Dialog, welcher sich dem Benutzer als eine logisch aufeinander aufbauende Reihe von Fragen darstellt. Die Fragen dienen dabei insbesondere zur Eingrenzung eines Sachverhalts, bis das Sprachdialogsystem zu einer eindeutigen Reaktion in der Lage ist.
  • Die US 2010/0161446 A1 beschreibt ein Verfahren zum elektronischen Bestellen von Waren. Dabei werden aus einer Nutzereingabe, z. B. einer freien Spracheingabe, mehrere Informationen extrahiert, um beispielsweise Hinweise auf die zu bestellende Ware und/oder einen Verkäufer zu identifizieren. Auch kann ein Nutzerprofil und eine Nutzerposition (z. B. über GPS) automatisch erkannt werden und bei der Ermittlung möglicher Treffer berücksichtigt werden.
  • Die US 7 519 534 B2 beschreibt eine Sprachschnittstelle zum Steuern und Bedienen eines Fernsehers. Eine erfolgte Spracheingabe kann grammatikalisch interpretiert werden und damit verschiedene Äußerungen des Nutzers identifiziert und den im Fernsehsystem gespeicherten Informationen und Befehlen zugeordnet werden.
  • Die EP 0 992 919 B1 schließlich beschreibt ein Verfahren zum Verarbeiten einer natürlichen Spracheingabe. Dabei werden Eingabedaten mit Bezugsdaten verglichen, wobei zu den Eingabedaten in einem Vergleichsschritt Bedeutungsdaten erzeugt werden, die unter anderem Äquivalente oder verwandte Begriffe berücksichtigen.
  • Sprachbediensysteme kommen zunehmend auch in Fahrzeugen zum Einsatz. Dadurch wird der Nutzungskomfort der zahlreichen Fahrzeugeinrichtungen verbessert, wie beispielsweise das Bedienen eines Navigationssystem, einer Telekommunikationseinrichtung oder einer Infotainmenteinrichtung. Einer Spracheingabe wird ein Steuerbefehl zugeordnet, der eine dazugehörige Fahrzeugfunktion auslöst. Eine erfasste Spracheingabe wird dazu zunächst in ein datentechnisches digitales Signal umgewandelt und durch einen Algorithmus einem ebenfalls datentechnisch gespeicherten Steuerbefehl zugeordnet, der wiederum in der Regel über einen elektrischen Steuerimpuls in ein physikalisches Signal umgewandelt wird. Über verschiedene Wandler können so die einzelnen Fahrzeugeinrichtungen gesteuert werden.
  • Die Informationsmenge und die Funktionsvielfalt in Fahrzeugen ist in den letzten Jahren stark angestiegen. Neben einer stetig steigenden Anzahl von datentechnisch gespeicherten Bedienmenüs zum Steuern von diversen Fahrzeugeinrichtungen, insbesondere im Navigationssystem, ist insbesondere die Funktionsvielfalt in modernen Infotainmenteinrichtungen stark angestiegen. Dem Nutzer muss es ermöglicht werden, im Fahrzeug auch ohne Kenntnisse der Informationsarchitektur zielsicher eine Datei oder Funktion auffinden oder auslösen zu lassen. Dies ist insbesondere wichtig, wenn es sich bei dem Nutzer um den Fahrer des Fahrzeugs handelt, damit dieser durch die Bedienaktionen nicht vom Straßenverkehr abgelenkt wird.
  • Es ist die Aufgabe der vorliegenden Erfindung, ein Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und ein dazugehöriges Sprachbediensystem bereitzustellen, die auch ohne die genaue Kenntnis der Systemarchitektur eine intuitive und schnelle Bedienung ermöglichen.
  • Diese Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Anspruchs 1 sowie einem Sprachbediensystem mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Aus- und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen.
  • Bei dem erfindungsgemäßen Verfahren wird eine Spracheingabe erfasst, und die Spracheingabe wird mit einer strukturierten Menge von Dateneinträgen, die jeweils einem oder mehreren Cluster(n) zugeordnet werden, verglichen. In Abhängigkeit von diesem Vergleich wird/werden ein oder mehrere Cluster ausgewählt, einem ausgewählten Cluster wird eine Funktionskategorie zugeordnet und in Abhängigkeit von den ermittelten Cluster-Funktionskategorie-Paaren wird ein Steuersignal zum Ausführen einer Funktion im Fahrzeug erzeugt. Eine Spracheingabe kann fehlerhaft sein oder sich nicht direkt auf einen Dateneintrag im Sprachbediensystem abbilden lassen. Der Vergleich der Spracheingabe mit einem Cluster von Informationen hat den Vorteil gegenüber einem Vergleich mit konkreten Dateneinträgen, dass hierdurch einerseits im Rahmen der gesamten Spracheingabe fehlertoleranter gesucht werden kann, andererseits auch bewusst unscharfe Suchbegriffe erlaubt sind. Dies ist insbesondere vorteilhaft für Funktionen im Fahrzeug, die auf Basis einer Parametermenge und nicht auf Basis eines scharf definierten Parameters auszuführen sind.
  • Ein Cluster ist im Sinne der Erfindung eine gemäß Ähnlichkeit oder Gemeinsamkeit festgelegte Gruppierung von Dateneinträgen. Es können auch Teil-Cluster gebildet werden, so dass mehrere dieser Teil-Cluster zu einem höherrangigen Teil-Cluster oder Cluster gruppiert werden. Ein Cluster kann auch nur aus einem einzigen Dateneintrag bestehen. Cluster können statisch im Sprachbediensystem gespeichert sein, das heißt, dass einzelne Dateneinträge einem oder mehreren Clustern fest zugewiesen sind. Cluster können aber auch in Verbindung mit weiteren Systemparametern dynamisch gebildet werden. Insbesondere kann vorgesehen sein, dass einem Cluster die Funktionskategorie in Abhängigkeit von der Spracheingabe zugeordnet wird.
  • Bei der Sprachbedienung kann es sich um eine über einen Sprachdialog gesteuerte oder abgefragte Spracheingabe handeln. Insbesondere ist die Spracheingabe eine Freieingabe ohne vorgegebene Struktur. Die Sprachbedienung kann aber auch nach einem gemischten Ansatz erfolgen, so dass beispielsweise der Nutzer die Spracheingaben immer als Freieingaben machen kann, ihm aber als Einstieg oder in dem Falle, wenn er Hilfe benötigt, ein strukturierter Sprachdialog angeboten wird. Eine Freieingabe unterscheidet sich von einer gesteuerten Spracheingabe dadurch, dass der Nutzer bei einer Freieingabe einen beliebigen Freitext sprechen kann, der dann systemseitig interpretiert wird, ohne den auszuführenden Funktionsumfang vorab zu beschränken.
  • In einer Ausgestaltung des erfindungsgemäßen Verfahrens gehört die ausgeführte Funktion zu einer Infotainmenteinrichtung oder einem Fahrerassistenzsystem, insbesondere einem Navigationssystem, im Fahrzeug. Insbesondere bei Navigationssystemen in Fahrzeugen ergeben sich vielfältige Funktionsmöglichkeiten mit unscharfer Ausführungsbasis. Durch das erfindungsgemäße Verfahren ergibt sich die Möglichkeit, durch die Sprachbedienung Funktionsinhalte zu variieren oder zu kombinieren, wie dies durch ein starr vorgegebenes Sprachdialogsystem oder ein manuelles Bediensystem nicht möglich ist.
  • Erfindungsgemäß kann dabei die Spracheingabe in Eingabefragmente unterteilt werden und ein Eingabefragment einem Cluster zugeordnet werden. Ein Eingabefragment ist beispielsweise ein Eigenname, ein Substantiv oder Adjektiv, das sich Dateneinträgen zuordnen lässt, die dann gemäß einer Ähnlichkeit oder Gemeinsamkeit einem Cluster zugeordnet werden.
  • In einer Weiterbildung des erfindungsgemäßen Verfahrens kann das zu einem ausgewählten Cluster gehörige Eingabefragment der Spracheingabe systemseitig automatisch erweitert und/oder verändert werden. Insbesondere kann das Eingabefragment mithilfe einer Positionsbestimmung und/oder einer Navigationsinformation erweitert und/oder verändert werden. So kann eine situationsabhängige Ortsangabe, z. B. „hier”, „entlang der Route” oder „am Ziel” als Eingabefragment ausgewählt werden und in Abhängigkeit von den Navigationsdaten realen, den Dateneinträgen entsprechenden Parametern zugeordnet werden.
  • Wenn systemseitig mehrere Alternativen, das Eingabefragment zu erweitern oder zu verändern, gefunden wurden, kann eine Rückmeldung ausgegeben werden. Dabei kann systemseitig ein Vorschlag gemacht werden oder auch eine Auswahlliste oder eine Rückfrage zur Verfügung gestellt werden.
  • Das erfindungsgemäße Sprachbediensystem umfasst Mittel zum Erfassen von Spracheingaben sowie eine Datenbank mit einer strukturierten Menge an Dateneinträgen, die jeweils einem oder mehreren Cluster(n) zugeordnet sind. Es umfasst des Weiteren eine Steuervorrichtung, die mit den Mitteln zum Erfassen von Spracheingaben und der Datenbank verbunden ist. Das erfindungsgemäße Sprachbediensystem ist dadurch gekennzeichnet, dass mittels der Steuervorrichtung die Spracheingabe mit der strukturierten Menge von Dateneinträgen vergleichbar ist und in Abhängigkeit von diesem Vergleich ein oder mehrere Cluster auswählbar ist/sind. Einem ausgewähltn Cluster ist eine Funktionskategorie zuordenbar und in Abhängigkeit von den ermittelten Cluster-Funktionskategorie-Paaren ist ein Steuersignal zum Ausführen einer Funktion im Fahrzeug erzeugbar. Das erfindungsgemäße Sprachbediensystem ist insbesondere zum Durchführen des erfindungsgemäßen Verfahrens geeignet. Es weist somit auch die Vorteile des erfindungsgemäßen Verfahrens auf.
  • Erfindungsgemäß ist des Weiteren ein Fahrzeug mit einem solchen Sprachbediensystem ausgestattet.
  • Die Erfindung wird nun anhand eines Ausführungsbeispiels mit Bezug zu den Figuren näher erläutert.
  • 1 zeigt schematisch den Aufbau eines Ausführungsbeispiels des erfindungsgemäßen Sprachbediensystems,
  • 2 zeigt schematisch eine Clusterstruktur mit Teil-Clustern, denen erfindungsgemäß Dateneinträge des erfindungsgemäßen Sprachbediensystems zugeordnet werden, und
  • 3 zeigt schematisch hierarchisch strukturierte Dateneinträge, die erfindungsgemäß teilweise Clustern zugeordnet sind.
  • In 1 ist schematisch der Aufbau eines Ausführungsbeispiels des erfindungsgemäßen Sprachbediensystems dargestellt. Eine Anzeigefläche 1 in einem Fahrzeug ist über eine Steuervorrichtung 4 mit einem manuellen Bedienelement 2 verbunden, über das ein Nutzer Steuerbefehle oder Eingaben für die Anzeigefläche 1 machen kann. Die Anzeigefläche 1 ist eine frei programmierbare Anzeigefläche, z. B. ein an sich bekanntes TFT- oder OLED-Display. Das manuelle Bedienelement 2 kann beispielsweise eine Push-To-Talk-Taste zum Aktivieren der Sprachbedienung sein. Über das Bedienelement 2 können aber auch andere Interaktionen des Nutzers mit dem Sprachbediensystem vorgenommen werden. Auf der Anzeigefläche 1 können verschiedene Informationen graphisch dargestellt werden. Insbesondere handelt es sich bei den Informationen um eine graphische Ausgabe 10 mit z. B. Anzeigeergebnissen 11 einer Navigationsfunktion und gegebenenfalls der aktuellen Position 12 des Fahrzeugs.
  • Die Steuervorrichtung 4 ist des Weiteren mit Mitteln 3 zum Erfassen einer Spracheingabe und einem Datenbus 6 im Fahrzeug verbunden, über den sie Zugriff auf eine oder mehrere Datenbanken 7A, 7B verschiedener Fahrzeugeinrichtung 8A, 8B hat, in denen die zu der jeweiligen Fahrzeugeinrichtung 8A, 8B spezifischen Daten und datentechnisch gespeicherten Steuerbefehle gespeichert sind. Es sind beispielhaft ein Navigationssystem 8A und eine Infotainmenteinrichtung 8B dargestellt, es kann sich aber auch um nur eine oder eine Vielzahl solcher Einrichtungen handeln.
  • Die Mittel 3 zum Erfassen einer Spracheingabe umfassen ein Mikrophon zum Empfang akustischer Signale, ein Softwaremodul zur Sprachaktivitätserkennung sowie einen adaptiven Filter zur Störgeräuschunterdrückung. Die Sprachaktivitätserkennung und der adaptive Filter können alternativ auch in anderer Hardware lokalisiert sein und beispielsweise über die Steuervorrichtung 4 mit den Mitteln 3 zum Erfassen der Spracheingabe in Verbindung stehen.
  • Die Steuervorrichtung 4 umfasst eine Speichereinheit 5 zum Speichern verschiedener Cluster, denen Dateneinträge aus den Datenbanken 7A, 7B zugewiesen werden können. Des Weiteren können mittels der Steuervorrichtung 4 aus Spracheingaben Eingabefragmente gefiltert werden, in deren Abhängigkeit einem Cluster eine Funktionskategorie zugeordnet werden kann. Dies wird nun gemäß einem Ausführungsbeispiel des erfindungsgemäßen Verfahrens für einige Navigationsfunktionen und anhand der 2 und 3 näher erläutert.
  • In der 2 ist schematisch eine Clusterstruktur mit einem Cluster 20, Teil-Clustern 2129 und dem Teil-Cluster 29 untergeordnete Teil-Cluster 29-1, 29-2 und 29-3 dargestellt. Diesen Clustern können erfindungsgemäß Dateneinträge des per Sprachbedienung bedienbaren Navigationssystems 8A zugeordnet werden.
  • Ein Cluster 20 umfasst beispielsweise alle Sonderziele (sogenannte „Points of Interest”, POI). Ein darunterliegender Teil-Cluster 21 umfasst z. B. alle Sonderziele, die „türkisch” enthalten. Dies können türkische Restaurants, türkische Bäder oder türkische Vereine sein. Ein weiterer Teil-Cluster 22 umfasst z. B. alle Sonderziele, die mit „chinesisch” assoziiert sind, wobei hierbei auch beispielsweise taiwanesisch oder vietnamesisch enthalten sein kann. Noch ein Teil-Cluster 29 umfasst z. B. alle Sonderziele, die Restaurants repräsentieren, wobei dies z. B. weiter unterteilt ist in einen untergeordneten Teil-Cluster 29-1 für „Restaurants”, einen untergeordneten Teil-Cluster 29-2 für „ Cafés” und einen untergeordneten Teil-Cluster 29-3 für „Bars”.
  • Bei dem Vergleich der Spracheingabe oder eines Eingabefragments mit einem Cluster kann bereits berücksichtigt werden, dass eine Spracheingabe inkorrekt sein kann, weil sich der Nutzer z. B. versprochen hat, oder systemseitig falsch erkannt wurde. Beispielsweise werden einem Eingabefragment mehrere ähnlich klingende Cluster zugeordnet, die dann im Gesamtzusammenhang bewertet werden und einer von ihnen ausgewählt wird.
  • Dateneinträge der gesamten Datenbank 7A des Navigationssystems 8A können diversen Clustern zugeordnet sein. Die Zuordnung ist insbesondere voreingestellt, kann aber z. B. mittels des Bedienelements 2 nutzerseitig verändert werden. Beispielsweise kann der Nutzer einen neuen Cluster definieren. Insbesondere können so auch die Dateneinträge zu Städtenamen, Straßennamen, geographischen Koordinaten oder Zugehörigkeiten zu einem Gebiet, z. B. einer Stadt oder einem Landkreis gruppiert werden.
  • Ein Cluster 20 oder Teil-Cluster 2129 kann auch implizite Informationen umfassen. Beispielsweise können in einem Cluster alle Positionsdaten in einem definierten Umkreis der aktuellen Position des Fahrzeugs oder alle Positionsdaten entlang einer gespeicherten Navigationsroute umfasst sein. Systemseitig kann dann die Position bestimmt und dem jeweiligen Cluster dynamisch die entsprechenden Dateneinträge zugeordnet werden.
  • In der 3 sind schematisch hierarchisch strukturierte Dateneinträge 3139 einer Datenbankhierarchieebene 30 dargestellt. Es handelt sich hierbei z. B. um Städtenamen, wie sie als Objekt in der Datenbank 7A abgelegt sind. Diese umfassen jeweils den vollständigen Stadtnamen inklusive aller Zusätze zum Stadtnamen. Jedem Dateneintrag 3139 ist eine geographische Position und weitere Parameter und Dateneinträge zugeordnet. Erfindungsgemäß sind die Dateneinträge 35-135-N in dem Cluster 35 zusammengefasst. Es handelt sich beispielsweise um Städte oder Stadtteile, die „Neustadt” enthalten. Es können auch gleiche Straßennamen sein, z. B. „Berliner Straße”, die gegebenenfalls durch Hausnummern oder Zusätze (Haltestelle) erweitert sein können. Auch ist eine Zusammenfassung in Teil-Cluster möglich, z. B. alle Dateneinträge mit „Berliner”, die dann sowohl „Berliner Straße”, „Berliner Platz” oder „Berliner Damm” umfassen.
  • Ein Nutzer kann nun mit einer Freieingabe das Sprachbediensystem bedienen, ohne sich an eine vorgegebene Struktur halten zu müssen. Er sagt z. B.: „Zeige mir alle türkischen Restaurants in der Umgebung”. Die Spracheingabe wird über das Mikrophon der Mittel 3 zum Erfassen einer Spracheingabe erfasst und die Spracheingabe in einzelne Eingabefragmente zerlegt. Dabei werden die Wörter „türkische” und „Restaurants” und das Satzfragment „in der Umgebung” herausgefiltert und mit den Clustern 2129 verglichen. Daraufhin werden das Cluster 21 „türkisch” und das Cluster 29 „Restaurant” ausgewählt und ihnen die Funktionskategorie „Zeige Sonderziel” zugeordnet.
  • Außerdem wird aus den Positionsdaten des Fahrzeugs dynamisch ein Cluster „Umgebung” erzeugt. Der Umgebungsradius kann beispielsweise als Defaultwert „1 km” betragen, kann aber insbesondere auch je nach Situation (z. B. je nachdem, ob das Fahrzeug sich in einer Stadt oder in einem ländlichen Raum aufhält) oder je nach Suchergebnis verändert werden.
  • Alle Dateneinträge, die den Clustern 21, 29 und dem dynamisch erzeugten Cluster der geographischen Positionen, die in der Umgebung liegen, zugeordnet sind, werden sodann gemäß der Funktionskategorie als Anzeigeergebnis 11 der Navigationsfunktion „Zeige spezifizierte Sonderziele in der Umgebung” zusammen mit der aktuellen Position 12 des Fahrzeugs auf der Anzeigefläche 1 angezeigt. Der Umgebungsradius könnte z. B. systemseitig selbständig erhöht werden, wenn keine Treffer gefunden werden.
  • Gemäß dem erfindungsgemäßen Verfahren hat ein Nutzer vielfältige weitere Möglichkeiten, durch eine Freieingabe eine beliebige Funktion des Navigationssystems 8A auszulösen, die er in einem geregelten Sprachdialog nur sehr mühsam hätte eingeben können. So kann er sich bequem Sonderziele entlang einer Route oder in einem Gebiet, z. B. in einer Stadt, anzeigen lassen. Ferner kann er Navigationsrouten mit mehreren Zwischenzielen, ohne systemseitig vorgegebene Struktur eingeben.
  • Stadtnamen und Straßennamen müssen dabei nicht immer gemäß dem entsprechenden Datenbankeintrag 35-1 bis 35-N eingegeben werden. Beispielsweise sind in der Datenbank 7A eine Vielzahl von Einträgen gespeichert, die mit „Neustadt” beginnen, aber noch Namenszusätze haben. Die Dateneinträge 35-1 bis 35-N sind dem Cluster 35 „Neustadt” zugeordnet. Eine Freieingabe mit „Neustadt” wird somit vorerst ohne Rückfrage an den Nutzer gemäß dem obenbeschriebenen Verfahren weiterbehandelt. Beispielsweise wird ein „Golfplatz in Neustadt” gesucht. Dabei kann automatisch die relevante Menge der Dateneinträge 35-1 bis 35-N reduziert werden, wenn für einige der Dateneinträge 35-1 bis 35-N gar kein dazugehöriger Golfplatz gefunden wird. Auch kann systemseitig erkannt werden, dass es in der Nähe nur ein „Neustadt” gibt, so dass gezielt die Rückfrage gestellt wird „Meinten Sie Neustadt an der Weinstraße?” oder dass auf Basis dieses Dateneintrags die Funktion automatisch ausgeführt wird.
  • Das erfindungsgemäße Verfahren ist auch für andere Funktionen geeignet, beispielsweise um im Infotainmentsystem 8B einen lokalen Radiosender zu suchen. Eine entsprechende Freieingabe könnte lauten „Suche mir klassische Musik mit lokalen Verkehrsnachrichten”, woraufhin beispielsweise die Spracheingabe in Eingabefragmente „klassische Musik” und „mit lokalen Verkehrsnachrichten” zerlegt wird und mit den Clustern 2029 verglichen wird. In einem weiteren Schritt kann dann diesen Clustern die Funktionskategorie „Starte Sendersuchlauf” zugeordnet werden.
  • Bezugszeichenliste
  • 1
    Anzeigefläche
    2
    Bedienelement
    3
    Mittel zum Erfassen von Spracheingaben
    4
    Steuervorrichtung
    5
    Speichereinheit
    6
    Datenbus im Fahrzeug
    7A, 7B
    Datenbanken
    8A
    Navigationssystem
    8B
    Infotainmenteinrichtung
    10
    graphische Ausgabe
    11
    Anzeigeergebnisse einer Navigationsfunktion
    12
    Anzeigeelement der aktuellen Position des Fahrzeugs
    20
    Cluster
    21–29
    Teil-Cluster
    29-1, -2, -3
    untergeordnete Teil-Cluster
    30
    Datenbankhierarchieebene
    31–39
    Dateneinträge der Datenbankhierarchieebene
    35
    Cluster der Dateneinträge derselben Hierarchie
    35-1–35-N
    Dateneinträge der geclusterten Datenbankhierarchieebene
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • US 2010/0161446 A1 [0003]
    • US 7519534 B2 [0004]
    • EP 0992919 B1 [0005]

Claims (10)

  1. Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug, bei dem – eine Spracheingabe erfasst wird, – die Spracheingabe mit einer strukturierten Menge von Dateneinträgen (3139), die jeweils einem oder mehreren Cluster(n) (2029; 35) zugeordnet werden, verglichen wird, – in Abhängigkeit von diesem Vergleich ein oder mehrere Cluster (2029; 35) ausgewählt wird/werden, – einem ausgewählten Cluster (2029; 35) eine Funktionskategorie zugeordnet wird, und – in Abhängigkeit von den ermittelten Cluster-Funktionskategorie-Paaren ein Steuersignal zum Ausführen einer Funktion im Fahrzeug erzeugt wird.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass einem Cluster (2029; 35) die Funktionskategorie in Abhängigkeit von der Spracheingabe zugeordnet wird.
  3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass die Spracheingabe eine Freieingabe ohne vorgegebene Struktur ist.
  4. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die ausgeführte Funktion zu einer Infotainmenteinrichtung (8B) oder einem Fahrerassistenzsystem, insbesondere einem Navigationssystem (8A), im Fahrzeug gehört.
  5. Verfahren nach einem der vorangegangenen Ansprüche, dadurch gekennzeichnet, dass die Spracheingabe in Eingabefragmente unterteilt wird, und ein Eingabefragment einem Cluster (2029; 35) zugeordnet wird.
  6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, dass das zu einem ausgewählten Cluster (2029; 35) gehörige Eingabefragment der Spracheingabe systemseitig automatisch erweitert und/oder verändert wird.
  7. Verfahren nach Anspruch 6, dadurch gekennzeichnet, dass das Eingabefragment mithilfe einer Positionsbestimmung und/oder einer Navigationsinformation erweitert und/oder verändert wird.
  8. Verfahren nach Anspruch 6 oder 7, dadurch gekennzeichnet, dass eine Rückmeldung ausgegeben wird, wenn systemseitig mehrere Alternativen, das Eingabefragment zu erweitern oder zu verändern, gefunden wurden.
  9. Sprachbediensystem, umfassend – Mittel (3) zum Erfassen von Spracheingaben, – eine Datenbank (7A; 7B) mit einer strukturierten Menge an Dateneinträgen (3139), die jeweils einem oder mehreren Cluster(n) (2029; 35) zugeordnet sind, – eine Steuervorrichtung (4), die mit den Mitteln (3) zum Erfassen von Spracheingaben und der Datenbank (7A; 7B) verbunden ist, dadurch gekennzeichnet, dass mittels der Steuervorrichtung (4) – die Spracheingabe mit der strukturierten Menge von Dateneinträgen (3139) vergleichbar ist, – in Abhängigkeit von diesem Vergleich ein oder mehrere Cluster (2029; 35) auswählbar ist/sind, – einem ausgewählten Cluster (2029; 35) eine Funktionskategorie zuordenbar ist und – in Abhängigkeit von den ermittelten Cluster-(2029; 35)Funktionskategorie-Paaren ein Steuersignal zum Ausführen einer Funktion im Fahrzeug erzeugbar ist.
  10. Fahrzeug mit einem Sprachbediensystem nach Anspruch 9.
DE201010054217 2010-12-11 2010-12-11 Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu Pending DE102010054217A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE201010054217 DE102010054217A1 (de) 2010-12-11 2010-12-11 Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE201010054217 DE102010054217A1 (de) 2010-12-11 2010-12-11 Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu

Publications (1)

Publication Number Publication Date
DE102010054217A1 true DE102010054217A1 (de) 2012-06-14

Family

ID=46144358

Family Applications (1)

Application Number Title Priority Date Filing Date
DE201010054217 Pending DE102010054217A1 (de) 2010-12-11 2010-12-11 Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu

Country Status (1)

Country Link
DE (1) DE102010054217A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020212580A1 (de) 2020-10-06 2022-04-07 Ford Global Technologies, Llc Verfahren zum Erzeugen eines Bild-Datensatzes zur Wiedergabe mit einem Infotainmentsystem eines Kraftfahrzeugs

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4216455C2 (de) * 1991-05-20 1994-02-10 Ricoh Kk Sprachsteuereinrichtung
DE10334400A1 (de) * 2003-07-28 2005-02-24 Siemens Ag Verfahren zur Spracherkennung und Kommunikationsgerät
EP0992919B1 (de) 1998-10-08 2006-12-13 Canon Kabushiki Kaisha Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
US7519534B2 (en) 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
US20100161446A1 (en) 2008-12-19 2010-06-24 At&T Intellectual Property I, L.P. System and method for wireless ordering using speech recognition

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4216455C2 (de) * 1991-05-20 1994-02-10 Ricoh Kk Sprachsteuereinrichtung
EP0992919B1 (de) 1998-10-08 2006-12-13 Canon Kabushiki Kaisha Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache
US7519534B2 (en) 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
DE10334400A1 (de) * 2003-07-28 2005-02-24 Siemens Ag Verfahren zur Spracherkennung und Kommunikationsgerät
US20100161446A1 (en) 2008-12-19 2010-06-24 At&T Intellectual Property I, L.P. System and method for wireless ordering using speech recognition

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102020212580A1 (de) 2020-10-06 2022-04-07 Ford Global Technologies, Llc Verfahren zum Erzeugen eines Bild-Datensatzes zur Wiedergabe mit einem Infotainmentsystem eines Kraftfahrzeugs
US11436772B2 (en) 2020-10-06 2022-09-06 Ford Global Technologies, Llc Method for generating an image data set for reproduction by means of an infotainment system of a motor vehicle

Similar Documents

Publication Publication Date Title
EP2567194B1 (de) Verfahren und vorrichtung zum betreiben einer nutzerschnittstelle
DE102014109121A1 (de) Systeme und Verfahren zur Arbitrierung eines Sprachdialogdienstes
DE112014002747T5 (de) Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten
DE102008008948A1 (de) Systemarchitektur und Verfahren zur multimodalen Informationseingabe
DE102011110978A1 (de) Verfahren zum Bedienen einer elektronischen Einrichtung oder einer Applikation und entsprechende Vorrichtung
EP2516965B1 (de) Navigationssystem, insbesondere für ein kraftfahrzeug
EP3152753B1 (de) Assistenzsystem, das mittels spracheingaben steuerbar ist, mit einer funktionseinrichtung und mehreren spracherkennungsmodulen
DE102017219616A1 (de) Sprachsteuerung für ein Fahrzeug
DE102019130104A1 (de) Standortmarkierung für universellen zugriff
EP2718672B1 (de) Verfahren und vorrichtung zum bereitstellen einer nutzerschnittstelle
DE102009030263A1 (de) Bedienverfahren für ein menübasiertes Bedien- und Informationssystem eines Fahrzeugs
DE102017211447B4 (de) Verfahren zum Auswählen eines Listeneintrags aus einer Auswahlliste einer Bedienvorrichtung mittels Sprachbedienung sowie Bedienvorrichtung
EP3074265B1 (de) Systemweite suche in fahrerinformationssystemen
EP3115886B1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE102010054217A1 (de) Verfahren zum Bereitstellen eines Sprachbediensystems in einem Fahrzeug und Sprachbediensystem dazu
EP2997333B1 (de) Verfahren zum betreiben eines navigationssystems, navigationssystem und kraftfahrzeug
DE102009018590B4 (de) Kraftfahrzeug mit einer Bedienvorrichtung und dazugehöriges Verfahren
DE102006051331A1 (de) Verfahren zur Auswahl eines Fahrziels
DE102010049869B4 (de) Verfahren zum Bereitstellen einer Sprachschnittstelle in einem Fahrzeug und Vorrichtung dazu
DE102013001885A1 (de) Systeminitiierte Hilfefunktion pro Fahrt und/oder pro Nutzer für die Bedienung von einer, einem Fahrzeug zugeordneten Vorrichtung
WO2018015041A1 (de) Verfahren zum konfigurieren einer sprachgesteuerten bedienvorrichtung, bedienvorrichtung mit sprachsteuerung und kraftfahrzeug
EP2290327A1 (de) Verfahren zum Betrieb eines Navigationssystems
DE102019217751A1 (de) Verfahren zum Betreiben eines Sprachdialogsystems und Sprachdialogsystem
DE102016215898A1 (de) Verfahren zum Betreiben einer Navigationsvorrichtung, Navigationsvorrichtung und Kraftfahrzeug
DE102013019208A1 (de) Kraftfahrzeug-Sprachbedienung

Legal Events

Date Code Title Description
R163 Identified publications notified
R012 Request for examination validly filed