-
Die Erfindung betrifft einen Getränkeautomaten. Insbesondere betrifft die Erfindung die Steuerung eines Getränkeautomaten mittels eines Sprachkommandos.
-
Ein Getränkeautomat ist dazu eingerichtet, ein vorbestimmtes Getränk wie Kaffee, Tee oder heiße Schokolade bereitzustellen. Der Getränkeautomat kann mittels eines Sprachkommandos gesteuert werden, um beispielsweise ein Getränk auszuwählen oder eine Zubereitungsart des Getränks zu steuern. Das Sprachkommando kann üblicherweise erst erkannt werden, nachdem ein vorbestimmtes Schlüsselwort erkannt wurde. So kann verhindert werden, dass Gesprächsfetzen oder eine nicht an den Getränkeautomaten gerichtete Aussage zur irrtümlichen Bereitstellung eines Getränks führt.
-
Ein Benutzer kann das „Aufwecken“ des Getränkeautomaten durch Sprechen des Schlüsselworts als unangenehm empfinden. Sind mehrere sprachgesteuerte Assistenten vorgesehen, so kann sich der Benutzer verschiedene Schlüsselwörter merken müssen. Auch ein aktives Betätigen eines Bedienelements, um eine Sprachsteuerung zu aktivieren, kann als lästig empfunden werden.
-
Eine der vorliegenden Erfindung zugrunde liegende Aufgabe besteht in der Verbesserung einer Sprachsteuerung eines Getränkeautomaten. Die Erfindung löst diese Aufgabe mittels der Gegenstände der unabhängigen Ansprüche. Unteransprüche geben bevorzugte Ausführungsformen wieder.
-
Ein Getränkeautomat umfasst eine Ausgabevorrichtung zur Ausgabe eines Getränks; ein Mikrofon zur Erfassung von Geräuschen; einen Sensor zur Erkennung eines im Bereich der Ausgabevorrichtung platzierten Gefäßes; und eine Steuervorrichtung. Die Steuervorrichtung ist dazu eingerichtet, ein Sprachkommando auf der Basis der Geräusche zu erkennen, nachdem ein Gefäß erkannt wurde, und um den Getränkeautomaten in Abhängigkeit eines erkannten Sprachkommandos zu steuern.
-
Im Unterschied zu bekannten Lösungen kann das Erkennen des Sprachkommandos beginnen, nachdem das Gefäß in den Getränkeautomaten eingelegt wurde. Das Einlegen kann eine zumindest sinnvolle Voraussetzung für die Bereitstellung eines Getränks durch den Automaten sein, sodass ein Sprechen eines Schlüsselworts oder ein Betätigen eines dedizierten Bedienelements (push to talk, PTT) eingespart werden kann. Ein Benutzer kann direkter und unmittelbarer sprachlich mit dem Getränkeautomaten kommunizieren. Ein Erkennen eines nicht an den Getränkeautomaten gerichteten Sprachkommandos kann trotzdem mit hoher Zuverlässigkeit verhindert sein.
-
In einer ersten Variante ist die Steuervorrichtung dazu eingerichtet, solange Sprachkommandos zu erkennen, wie das Gefäß im Bereich der Ausgabevorrichtung erkannt wird. Es wurde erkannt, dass es unüblich ist, das Gefäß über längere Zeit im Bereich der Ausgabevorrichtung zu lassen. So kann das Erkennen des Sprachkommandos auf intuitive Weise auf einen Gerätezustand beschränkt werden, der einen bestimmten Vorgang, insbesondere das Bereitstellen eines Getränks, begleitet.
-
In einer zweiten Variante ist die Steuervorrichtung dazu eingerichtet, das Sprachkommando innerhalb einer vorbestimmten Zeit nach einem ersten Erkennen des Gefäßes zu erkennen. Beispielsweise kann die Erkennung eines Sprachkommandos deaktiviert werden, wenn das Gefäß länger als 5 Sekunden im Bereich der Ausgabevorrichtung steht. Die vorbestimmte Zeit kann verlängert werden, wenn eine Interaktion mit dem Getränkeautomaten erfolgt.
-
Der Getränkeautomat kann eine akustische Ausgabevorrichtung umfassen, wobei die Steuervorrichtung dazu eingerichtet ist, in Abhängigkeit eines erkannten Sprachkommandos einen akustischen Dialog mit einem Benutzer zu führen. Der Dialog kann natürlichsprachig erfolgen, indem der Getränkeautomat eine gesprochene Frage oder Aussage mittels der Ausgabevorrichtung bereitstellt. Die Ausgabevorrichtung kann einen Lautsprecher oder eine Schnittstelle zur Bereitstellung von Audiodaten über eine externe Einrichtung umfassen. Die Schnittstelle kann beispielsweise Bluetooth umfassen und die externe Einrichtung kann ein Mobilgerät wie ein Smartphone oder etwa einen externen Lautsprecher umfassen.
-
Die Steuervorrichtung ist bevorzugt dazu eingerichtet, die Ausgabevorrichtung zur Bereitstellung eines Getränks in Abhängigkeit des erkannten Sprachkommandos zu steuern. Insbesondere kann das Getränk in Abhängigkeit eines zuvor erkannten Sprachkommandos zubereitet und in das Gefäß ausgegeben werden. Ist das Getränk vollständig ausgegeben, so kann das Erkennen des Sprachkommandos beendet werden.
-
In einer weiteren Ausführungsform ist die Steuervorrichtung dazu eingerichtet, ein erstes vorbestimmtes Sprachkommando zu erkennen, nachdem das Gefäß erkannt wurde, und ein zweites vorbestimmtes Sprachkommando unabhängig vom Erkennen eines Gefäßes. Das zweite Sprachkommando kann einen Vorgang betreffen, der unabhängig vom Gefäß und insbesondere unabhängig von einer Bereitstellung eines Getränks ist. Beispielsweise kann das zweite Sprachkommando eine Option des Getränkeautomaten steuern oder den Getränkeautomaten vollständig abschalten.
-
Die Steuervorrichtung kann dazu eingerichtet sein, die Bereitstellung des Getränks in Abhängigkeit eines Sprachkommandos zu steuern, das alternativ nach dem Erfassen des Gefäßes oder nach dem Erkennen des zweiten Sprachkommandos erfasst wurde. Das zweite Sprachkommando kann ein vorbestimmtes Schlüsselwort umfassen, dessen Erkennung leicht implementiert werden kann. In einer Ausführungsform kann das Schlüsselwort mittels einer speziellen Verarbeitungseinrichtung erkannt werden, die das Schlüsselwort dediziert erkennt, etwa mittels neuronaler Mustererkennung. Durch das zweite Sprachkommando kann ein alternativer Weg zur Aktivierung der Spracherkennung zur Steuerung des Getränkeautomaten bereitgestellt werden.
-
Der Sensor kann ein bildgebendes Element wie eine Kamera oder einen LiDAR-Sensor umfassen, wobei die Steuervorrichtung dazu eingerichtet ist, das Gefäß auf der Basis eines bereitgestellten Bilds, im Fall der Kamera eines Kamerabilds, zu erkennen. Die Kamera kann auch dazu verwendet werden, das Gefäß genauer zu klassifizieren, beispielsweise bezüglich Größe, Füllgrad oder Form. Sollte ein gewähltes Getränk nicht zum Gefäß passen, beispielsweise weil das Gefäß zu klein oder bereits zu voll ist, so kann das bereitgestellte Getränk angepasst werden, etwa bezüglich seiner Art oder Menge, oder der Benutzer kann auf den Zusammenhang hingewiesen werden. Der Hinweis kann auf beliebige Weise gegeben werden und Teil eines Dialogs mit dem Benutzer sein. Ein Ergebnis des Dialogs kann ein durch den Getränkeautomaten in das Gefäß bereitgestelltes Getränk steuern.
-
Nach einem weiteren Aspekt der vorliegenden Erfindung umfasst ein Verfahren zum Steuern eines Getränkeautomaten Schritte des Erkennens eines Gefäßes im Bereich einer Ausgabevorrichtung des Getränkeautomaten; des Erfassens von Geräuschen im Bereich des Getränkeautomaten; des Erkennens eines Sprachkommandos auf der Basis der Geräusche; und des Steuerns des Getränkeautomaten in Abhängigkeit des erkannten Sprachkommandos.
-
Das Verfahren kann dazu eingerichtet sein, ganz oder teilweise mittels einer hierin beschriebenen Steuervorrichtung ausgeführt zu werden. Dazu kann die Steuervorrichtung einen programmierbaren Mikrocomputer oder Mikrocontroller umfassen und das Verfahren kann in Form eines Computerprogrammprodukts mit Programmcodemitteln vorliegen. Das Computerprogrammprodukt kann auch auf einem computerlesbaren Datenträger abgespeichert sein. Merkmale oder Vorteile des Verfahrens können auf die Vorrichtung übertragen werden oder umgekehrt.
-
In einer bevorzugten Ausführungsform wird das Erfassen von Geräuschen begonnen, nachdem ein Platzieren des Gefäßes im Bereich der Ausgabevorrichtung erkannt wurde. Alternativ können Geräusche auch schon vor dem Platzieren des Gefäßes erfasst werden und die Erkennung des Sprachkommandos auf der Basis der Geräusche beginnt erst mit dem Platzieren des Gefäßes. Der Getränkeautomat kann durch das Platzieren des Gefäßes in einen Zustand versetzt werden, in dem er ein Sprachkommando akzeptiert.
-
In noch einer weiter bevorzugten Ausführungsform wird ein Erfassen von Geräuschen oder ein Erkennen eines Sprachkommandos auf der Basis von erfassten Geräuschen beendet, nachdem ein Entfernen des Gefäßes aus dem Bereich der Ausgabevorrichtung erkannt wurde. Durch das Entfernen des Gefäßes kann der Getränkeautomat in einen Zustand versetzt werden, in dem er ein Sprachkommando nicht akzeptiert.
-
Die Erfindung wird nun unter Bezug auf die beiliegenden Figuren genauer beschrieben, in denen:
- 1 einen beispielhaften Getränkeautomaten;
- 2 ein Ablaufdiagramm eines beispielhaften Verfahrens zum Steuern eines Getränkeautomaten
darstellt.
-
1 zeigt einen beispielhaften Getränkeautomaten 100, der dazu eingerichtet ist, eines oder mehrere verschiedene Getränke bereitzustellen. Dazu kann der Getränkeautomat 100 gesteuert werden, das bereitgestellte Getränk in Abhängigkeit eines Benutzerwunschs bereitzustellen. So können beispielsweise die Art des Getränks, seine Menge, seine Temperatur, seine Zutaten oder seine Zubereitungsweise steuerbar sein.
-
Der Getränkeautomat 100 umfasst eine Steuervorrichtung 105, die mit einer Ausgabevorrichtung 110, einem Mikrofon 115 und einem Sensor 120 verbunden ist. Das Mikrofon 115 ist zur Erfassung von Geräuschen im Bereich des Getränkeautomaten 100 eingerichtet. Die Ausgabevorrichtung 110 ist zur Bereitstellung eines Getränks nach vorbestimmten Vorgaben eingerichtet. Beispielsweise kann die Ausgabevorrichtung eine Heiz- oder Kühleinrichtung, einen Kaffeebrüher, einen Teefilter oder einen Milchschäumer umfassen.
-
Es können eines oder mehrere Mikrofone 115 vorgesehen sein, die beispielsweise in unterschiedliche Raumrichtungen orientiert sind und/oder unterschiedliche Charakteristiken aufweisen. Der Sensor 120 ist dazu eingerichtet, ein Gefäß 125 im Bereich der Ausgabevorrichtung 110 zu bestimmen. Der Sensor 120 kann beispielsweise einen einfachen Schalter, eine Lichtschranke oder ein bildgebendes Element wie eine Kamera umfassen. Dazu kann ein durch den Sensor 120 bereitgestelltes Signal ausgewertet werden, um neben dem Vorhandensein des Gefäßes 125 optional eine seiner Eigenschaften zu bestimmen. Beispielsweise können eine Größe, ein verbleibendes Volumen, eine Temperatur oder eine Art des Gefäßes 125 bestimmt werden. Das Gefäß 125 kann insbesondere ein Trinkgefäß umfassen, etwa ein Glas, eine Tasse oder einen Becher.
-
Optional kann eine akustische Ausgabevorrichtung 130 vorgesehen sein, die zur Ausgabe von Tönen und/oder gesprochenen Informationen eingerichtet sein kann. Ferner kann eine Interaktionseinrichtung 135 vorgesehen sein, die eine optische und/oder taktile Eingabe und/oder Ausgabe bereitstellen kann. Ein Benutzer kann den Getränkeautomaten 100 einseitig oder interaktiv steuern, wozu er die Interaktionseinrichtung 135 und/oder eines der akustischen Elemente 115, 130 verwenden kann.
-
Die Steuereinrichtung 105 ist dazu eingerichtet, ein Sprachkommando auf der Basis von Geräuschen zu erkennen, die mittels des Mikrofons 115 im Bereich des Getränkeautomaten gesprochen wurde. Eine Funktion des Getränkeautomaten 100, insbesondere die Bereitstellung eines Getränks mittels der Ausgabevorrichtung 110, kann dann in Abhängigkeit des Sprachkommandos gesteuert werden.
-
Es wird vorgeschlagen, dass die Erkennung des Sprachkommandos durch ein benutzersteuerbares Ereignis aktiviert wird. Das Ereignis kann insbesondere ein Platzieren des Gefäßes 125 im Bereich der Ausgabevorrichtung 110 umfassen. Optional kann alternativ auch ein vorbestimmtes, im Bereich des Getränkeautomaten 100 gesprochenes Schlüsselwort erkannt werden. Die Spracherkennung kann beendet werden, wenn eine vorbestimmte Zeit abgelaufen ist, wenn eine Funktion des Getränkeautomaten 100, die durch ein erkanntes Sprachkommando gesteuert wird, beendet ist, oder wenn ein Entfernen des Gefäßes 125 erkannt wurde. Andere Ereignisse zur Beendigung der Spracherkennung sind ebenfalls möglich.
-
2 zeigt ein Ablaufdiagramm eines Verfahrens 200 zur Steuerung eines Getränkeautomaten 100. In einem Schritt 205 befindet sich der Getränkeautomat 100 in einem Zustand, der Standby genannt werden kann. Dabei ist eine Funktion des Getränkeautomaten 100 üblicherweise eingeschränkt. Beispielsweise kann eine Getränkeheizung abgeschaltet sein oder eine Interaktionsfähigkeit des Getränkeautomaten 100 kann auf die Erkennung vorbestimmter Ereignisse oder Eingaben reduziert sein. Die Interaktionseinrichtung 135 kann deaktiviert sein oder auf den reduzierten Zustand hinweisen. In diesem Zustand kann hauptsächlich ein Ereignis erkannt werden, das eine weitere akustische Interaktion mit dem Automaten 100 ermöglicht. Insbesondere kann das Ereignis einem Erkennen eines Sprachkommandos vorausgehen, das der Getränkeautomat auswerten und befolgen kann.
-
In einem Schritt 210 kann ein im Bereich des Getränkeautomaten 100 gesprochenes Schlüsselwort erkannt werden. Alternativ kann auch ein manuelles Betätigen eines dedizierten Bedienelements erkannt werden. In einer weiteren Ausführungsform kann im Schritt 210 ein weiteres Schlüsselwort erkannt werden, das zu einer unmittelbaren Funktionssteuerung des Getränkeautomaten 100 führt. Diese Funktion umfasst bevorzugt nicht ein Bereitstellen eines Getränks.
-
In einem Schritt 215, der alternativ oder nebenläufig zum Schritt 210 erfolgen kann, kann ein Platzieren eines Gefäßes 125 im Bereich der Ausgabevorrichtung 110 erkannt werden.
-
In einer Ausführungsform kann zunächst ein beliebiges Objekt im Bereich der Ausgabevorrichtung 110 bestimmt werden, das dann als Gefäß 125 erkannt werden kann.
-
In einem Schritt 220 kann der Getränkeautomat 100 beziehungsweise die Steuervorrichtung 105 in einen Zustand versetzt werden, in dem ein Sprachkommando erkannt werden kann. Dazu kann das Erfassen von Geräuschen mittels des Mikrofons 115 begonnen werden oder kontinuierlich erfasste Geräusche können ab dem Schritt 220 verarbeitet werden, um ihnen ein Sprachkommando zu entnehmen.
-
In einem Schritt 225 kann ein Sprachkommando in den Geräuschen erkannt werden. Das Sprachkommando kann als Ganzes oder als Aneinanderreihung mehrerer akustischer Elemente, etwa Floskeln, Wörtern, Silben oder Nmenonics, erkannt werden. Dem erkannten Sprachkommando kann eine vorbestimmte Funktion des Getränkeautomaten 100 zugeordnet sein, die insbesondere das Bereitstellen eines Getränks betreffen kann. Beispielsweise kann ein Getränk ausgewählt werden oder eine Menge, eine Zubereitungsart oder eine Temperatur eines Getränks können eingestellt werden.
-
In einem Schritt 230 kann eine Rückmeldung über das erkannte Sprachkommando an einen Benutzer ausgegeben werden. Die Rückmeldung kann akustisch bereitgestellt werden und insbesondere eine Bestätigung des erkannten Inhalts umfassen. Optional kann auf ein erkanntes Problem hingewiesen werden, beispielsweise auf einander widersprechende Eingaben oder ein nicht erkanntes Sprachkommando. Die Schritte 225 und 230 können mehrfach durchlaufen werden, um in der Art eines Dialogs zwischen einem Benutzer und dem Getränkeautomaten 100 die Bereitstellung eines Getränks vorzubereiten und bevorzugt auch auszulösen.
-
In einem Schritt 235 kann eine vorbestimmte Funktion, die dem erkannten Sprachkommando zugeordnet ist, gesteuert werden. Die Funktion kann insbesondere die Bereitstellung eines Getränks in das Gefäß 125 umfassen.
-
Das Erkennen eines Sprachkommandos kann enden, wenn die Funktion erfüllt ist, wenn eine vorbestimmte Zeit seit dem Erkennen des Platzierens des Gefäßes 125 im Bereich der Ausgabevorrichtung 110 verstrichen ist, wenn eine vorbestimmte Zeit nach dem letzten Interaktionsschritt 225, 230 verstrichen ist, oder wenn in einem Schritt 240 erkannt wird, dass das Gefäß 125 aus dem Bereich der Ausgabevorrichtung 110 entfernt wurde. In diesem Fall kann der Getränkeautomat 100 beziehungsweise die Steuervorrichtung 105 in einen Zustand versetzt werden, in dem keine Erkennung eines Sprachkommandos erfolgt, oder zumindest keines Sprachkommandos, das ein Bereitstellen eines Getränks umfasst. Dieser Zustand kann dem Standby-Zustand im Schritt 205 entsprechen. Das Verfahren 200 kann somit aus dem Schritt 245 auch zum Anfang zurückkehren und erneut durchlaufen.
-
Bezugszeichenliste
-
- 100
- Getränkeautomat
- 105
- Steuervorrichtung
- 110
- Ausgabevorrichtung
- 115
- Mikrofon
- 120
- Sensor zur Erfassung eines Gefäßes
- 125
- Gefäß
- 130
- akustische Ausgabevorrichtung
- 135
- Interaktionseinrichtung
- 200
- Verfahren
- 205
- Standby
- 210
- Schlüsselwort erkannt
- 215
- Erkennen: Gefäß platziert
- 220
- Spracherkennung beginnen
- 225
- Sprachkommando erkennen
- 230
- Sprachausgabe
- 235
- Funktion steuern
- 240
- Erkennen: Gefäß entfernt
- 245
- Spracherkennung beenden