DE102006058758B4 - Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung - Google Patents

Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung Download PDF

Info

Publication number
DE102006058758B4
DE102006058758B4 DE102006058758.8A DE102006058758A DE102006058758B4 DE 102006058758 B4 DE102006058758 B4 DE 102006058758B4 DE 102006058758 A DE102006058758 A DE 102006058758A DE 102006058758 B4 DE102006058758 B4 DE 102006058758B4
Authority
DE
Germany
Prior art keywords
user
input
communication
signals
terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102006058758.8A
Other languages
English (en)
Other versions
DE102006058758A1 (de
Inventor
Dr. Liu Jin
Christel Müller
Fred Runge
Arnold Zimmermann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE102006058758.8A priority Critical patent/DE102006058758B4/de
Publication of DE102006058758A1 publication Critical patent/DE102006058758A1/de
Application granted granted Critical
Publication of DE102006058758B4 publication Critical patent/DE102006058758B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Verfahren zum Steuern einer Telekommunikationsendeinrichtung (200, 201, 202) mit den Schritten a) Registrieren wenigstens zweier mittels unterschiedlicher erster Eingabeeinrichtungen (11–17) generierter Eingabesignale, b) Umwandeln der zwei mittels unterschiedlicher erster Eingabeeinrichtungen (11–17) generierter Eingabesignale in einen gemeinsamen ersten Datensatz, c) Automatisches Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) durch Auswerten des ersten Datensatzes (10) in Abhängigkeit von vorgegebenen variablen Regeln (30), d) Überwachen des Kommunikationsbereitschafts-Zustands des Benutzers, um eine Änderung des Kommunikationsbereitschafts-Zustands feststellen zu können, e) Ausführen einer vorgegebenen Funktion der Telekommunikationsendeinrichtung (200, 201, 202) bei Feststellung einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers, dadurch gekennzeichnet, dass die Eingabesignale zum Erkennen eines Kommunikationswunsches zumindest eines der folgenden Signale umfassen: – eine Laufzeitdifferenz (43) von akustischen Signalen zu räumlich auf der Telekommunikationsendeinrichtung unterschiedlich angeordneten Mikrofonen, die innerhalb einer festgelegten Toleranz gleich oder nahe Null ist, oder – wenn nach einer vorbestimmten, durch einen Bewegungssensor erfassten Bewegung der Telekommunikationsendeinrichtung das Gesicht des Nutzers im Kamerabild erscheint, oder über das Auswerten von Sensoren und/oder Mikrofonen in intelligenter Kleidung die relative Lage des Endgerätes zum Nutzer erfasst wird.

Description

  • Die Erfindung betrifft ein Verfahren und eine Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung.
  • In der Telekommunikation werden unterschiedliche Verfahren eingesetzt, um die Bedienung von Endgeräten sowie die Sprachqualität für den Benutzer zu vereinfachen bzw. zu verbessern. Zu diesem Zweck wird in Endgeräten beispielsweise eine Freisprechfunktion integriert oder es werden Maßnahmen zur Unterdrückung von Hintergrundgeräuschen vorgesehen.
  • Aus EP 0 930 761 A2 ist ferner beispielsweise ein Telefon mit adaptivem Kurzwahl-Verfahren, wobei das Telefon den Kurzwahlspeicher beispielsweise in Abhängigkeit der Anrufhistorie aktualisiert, wobei zum Beispiel häufig angerufene Telefonnummern in den Kurzwahlspeicher aufgenommen und selten angerufene Telefonnummern aus diesem wieder entfernt werden oder auch die Telefonnummern im Kurzwahlspeicher in Abhängigkeit der Häufigkeit sortiert werden, mit der sie angerufen werden.
  • Die Bedienung von Endgeräten kann auch durch den Einsatz von Makro-Befehlen vereinfacht werden. Ein entsprechendes Verfahren zum Steuern von Mobilfunkendgeräten wird beispielsweise in DE 101 17 654 A1 beschrieben, wobei Makrobefehle zur Steuerung des Mobilfunkendgerätes verwendet werden, die vom Benutzer selbst erstellt oder vom Internet oder dem Mobilfunknetz heruntergeladen werden können und auf dem Mobilfunkendgerät oder dessen Chipkarte gespeichert und zur Ausführung gebraucht werden.
  • Um die Bedienung zu vereinfachen, werden auch Steuerungsfunktionen zunehmend in einer Weise bereitgestellt, dass diese berührungslos ausführbar sind, da beispielsweise in bestimmten Umgebungen wie in einem Fahrzeug die manuelle Bedienung eines Telekommunikationsgerätes durch einen Benutzer nicht möglich oder nicht erwünscht ist. Alternativ zur manuellen Bedienung kann die Bedienung beispielsweise mittels Sprachbefehlen erfolgen, wenn entsprechende Methoden zur Spracherkennung bereitgestellt werden.
  • In EP 0 141 289 A2 wird beispielsweise eine Teilnehmersprechstelleneinrichtung beschrieben, in der über ein Mikrofon eingegebene Sprachsignale direkt zur Telefonwahl benutzt werden, wobei zu diesem Zweck eine Auswahlsteuerung vorgesehen ist, die aus einer Prüf- und Umschaltlogik, einem Auswahlsteuercomputer, einem Telefonregisterspeicher, einer Anzeigeeinheit, einer Eingabetastatur und einem bidirektionalem Bussystem besteht, wobei das Bussystem die genannten Bestandteile der Auswahlsteuerung untereinander verbindet und über ein erstes Interface mit einer Spracherkennungseinrichtung, über ein zweites Interface mit einer Datenträgereinheit und über eine Wahl- und Sprachsignalumsetzereinrichtung mit einer Teilnehmerleitung verbunden ist, wobei der Telefonregisterspeicher und/oder die Datenträgereinheit für die Aufnahme eines Teilnehmervokabulars und die zugehörigen akustischen Referenzmusterdaten vorgesehen sind, und wobei das Mikrofon, die Spracherkennungseinrichtung und die Wahl- und Sprachsignalumsetzereinrichtung über Signalleitungen an die Prüf- und Umschaltlogik angeschlossen sind.
  • Aus DE 101 30 852 A1 ist ferner ein sprachgesteuertes Fernbedienungssystem für elektrische Geräte bekannt, welches wenigstens ein Handgerät und wenigstens ein Basisgerät umfasst, wobei das Basisgerät zur Ansteuerung der elektrischen Geräte in Abhängigkeit von codierten Steuersignalen ausgebildet ist, die von den Handgeräten an die Basisstation übertragen werden. Die codierten Steuersignale werden von den Handgeräten durch Mustervergleich von über ein Mikrofon des jeweiligen Handgerätes eingegebenen Sprachbefehlen und in einem Sprachmusterspeicher gespeicherten Daten sowie durch Zuordnung der Spracherkennung zu jeweils einem codierten Steuersignal erzeugt, wobei die Zuordnung der Spracherkennung zu den codierten Steuersignalen im Handgerät mittels einer Zuordnungselektronik individuell einstellbar ist, wobei eine Sprecher abhängige Sprachmustererkennung in den Handgeräten vorgesehen sein kann.
  • In DE 102 51 112 A1 wird ein Verfahren und ein System zur Spracherkennung beschrieben, bei welchem ein Sprachsignal eines Benutzers zur Erkennung einer im Sprachsignal enthaltenen Sprachinformation analysiert wird und innerhalb einer Prüfprozedur das mit größter Wahrscheinlichkeit passende Erkennungsergebnis wieder in ein Sprachsignal umgewandelt und zur Verifikation und/oder Korrektur an den Nutzer ausgegeben wird. Bei der Analyse werden eine Anzahl von alternativen Erkennungsergebnissen generiert, welche mit den nächst größten Wahrscheinlichkeiten zu dem zu erkennenden Sprachsignal passen, wobei die Ausgabe innerhalb der Prüfprozedur derart erfolgt, dass der Benutzer bei einer Fehlerhaftigkeit des ausgegebenen Erkennungsergebnisses die Ausgabe unterbrechen kann, wobei dann automatisch für einen vor einer Unterbrechung zuletzt ausgegebenen Abschnitt des betreffenden Erkennungsergebnisses jeweils die entsprechenden Abschnitte der alternativen Erkennungsergebnisse für eine Auswahl durch den Benutzer ausgegeben werden. Vorzugsweise wird zu diesem Zweck während der Ausgabe des Erkennungsergebnisses permanent die Sprachaktivität des Benutzers überwacht. In einem bevorzugten Ausführungsbeispiel werden alle alternativen Erkennungsergebnisse gemeinsam mit einem Indikator ausgegeben, und die Auswahl erfolgt durch Eingabe des Indikators, wobei zu diesem Zweck dem jeweiligen Indikator ein Tastensignal eines Kommunikationsendgerätes zugeordnet sein kann und die Auswahl durch Betätigen der entsprechenden Taste erfolgt.
  • In DE 10 2004 029 873 B3 wird ferner ein automatisches Sprachdialogsystem beschrieben, wobei das Spracherkennungsergebnis einer Nuterzäußerung zwischengespeichert und für eine Konfirmation durch den Nutzer ausgegeben wird, und wobei ein Vorgehen für Situationen vorgeschlagen wird, in denen der Nutzer die Richtigkeit des Spracherkennungsergebnisses verneint bei gleichzeitiger Nennung eines korrigierenden Kommandos.
  • Aus US 6 263 216 B1 ist ein insbesondere für den Einsatz in einem Kraftfahrzeug vorgesehenes sprachgesteuertes Funktelefon bekannt, bei welchem permanent Hintergrundgeräusche erfasst und analysiert werden, um ein mittleres gewichtetes Energiespektrum der Hintergrundgeräusche zu ermitteln, welches bei Durchführen der Spracherkennung vom erfassten Energiespektrum abgezogen wird, wobei die Spracherkennung wahlweise durch Tastendruck initiiert wird oder automatisch, wenn das erfasste Energiespektrum eine vorgegebene Schwelle überschreitet.
  • In der Vergangenheit gab es auch bereits Versuche, Teile eines in einem System befindlichen Spracherkenners durch Definition eines zu sprechenden Aktivierungsausdruckes wie zum Beispiel ”Wach auf” dazu zu bringen, auch weitere Äußerungen für einen bestimmten Zeitraum auszuwerten. Ein solcher Aktivierungsausdruck wird überlicherweise auch als ”Hot Word” bezeichnet. Allerdings führten dabei fehlinterpretierte Hintergrundgeräusche sowie ähnliche Äußerungen des Nutzers oder fremder Personen oft zu ungewollten Aktivierungen oder Deaktivierungen entsprechender Teile des Spracherkenners.
  • Für die Steuerung eines Endgerätes kann auch relevant sein, in welcher Position der Benutzer sich relativ zum Gerät befindet. Aus DE 101 56 954 B9 ist in diesem Zusammenhang ein Verfahren zur Kommunikation bekannt, bei dem mit Hilfe eines fest installierten Mikrofon-Arrays die relative Position eines Sprechers innerhalb eines Fahrzeugs bestimmt werden kann, um zum Beispiel Störgeräusche auszuschließen. Auch können Kameras, die heute typischerweise in mobilen Endgeräten wie zum Beispiel Mobiltelefonen vorgesehen sind, dazu genutzt werden, die Position eines Nutzers zu diesem Endgerät im Rahmen des Erfassungswinkels mit Hilfe entsprechend kalibrierter Software zu erfassen.
  • Beispielsweise in US 2002/0167392 A1 wird ein bewegungsaktivierbares sprachgesteuertes Kommunikationsgerät beschrieben, welches zum Speichern von Nachrichten ausgebildet ist und welches einen Bewegungs-Detektor und eine Einrichtung zur Spracherkennung umfasst, wobei in Anwesenheit gespeicherter Nachrichten bei Erkennen einer Bewegung eine automatische Ansage erfolgt, dass Nachrichten zur Abfrage bereitstehen, welche dann mittels Sprachbefehlen abgefragt werden können.
  • Aus US 5 255 341 A ist ferner eine Befehlseingabe-Einrichtung für ein sprachgesteuertes Fahrstuhl-System mit einem Anwesenheits-Detektor bekannt, welcher die Anwesenheit eines Benutzers in einem vorgegebenem Abstand zu einem Mikrofon detektiert, wobei eine Spracherkennungs-Einheit einen erkannten Sprachbefehl der Fahrstuhl-Steuerung zuleitet, sobald der Benutzer nicht mehr vom Anwesenheits-Detektor detektiert wird.
  • In EP 1 117 076 A2 wird ferner ein Selbstbedienungs-Terminal beschrieben, das eine akustische Schnittstelle für den Empfang und/oder die Ausgabe akustischer Informationen hat, wobei diese als eine Anordnung individuell steuerbarer akustischer Elemente ausgebildet ist, und wobei die akustischen Elemente von einer Steuereinheit in Abhängigkeit von Benutzerortinformationen gesteuert werden, welche die Steuereinheit von einem Benutzerlokalisierungsmechanismus empfängt, um jedes akustische Element auf den Ort des Benutzers zu fokussieren. Die akustischen Elemente sind Mikrofone bzw. Lautsprecher, die so gesteuert werden können, dass nur akustische Signale in örtlicher Nähe des Benutzers empfangen werden bzw. akustische Signale nur in örtlicher Nähe des Benutzers hörbar sind. Der Benutzerlokalisierungsmechanismus basiert vorzugsweise auf visueller Erfassung, alternativ kann aber beispielsweise auch ein Audioerfassungsmechanismus vorgesehen sein.
  • Aus DE 101 56 954 A1 ist eine für das Freisprechen, für die Spracherkennung und für die Insassen-Kommunikationssysteme, insbesondere im Fahrzeug, vorteilhafte bildgestützte adaptive Akustik bekannt, wobei mit individuellen, verteilten Mikrofon-/Lautsprecheranordnungen mehrere Mikrofone oder Mikrofonarrays und Lautsprecher oder Lautsprecherarrays derart adaptiert werden, dass bereits vor Sprachaktivität eine Initialisierung des Arrays auf den Sprecher erreicht wird, wobei die akustische Erkennung mit der Bildverarbeitung verbunden ist, um eine bessere Zuordnung und Erkennung des Sprechers zu erhalten.
  • In US 2002/0152010 A1 wird ein multimodales Identifikationssystem beschrieben, welches zum Erkennen von Personen dient, die autorisiert sind, eine oder mehrere Fahrzeugeinrichtungen zu aktivieren, wie zum Beispiel automatische Schlösser, einen Fahrzeugmotor, Beleuchtung oder einen Fahrzeug-Alarm.
  • Aus US 2005/0134117 A1 ist eine Schnittstelle zur Steuerung einer Vielzahl fahrzeuginterner Geräte bekannt, wobei das zu steuernde Gerät durch eine Kombination aus einer Geste und einer Spracheingabe spezifiziert wird.
  • Ferner ist es bekannt, mobile Endgeräte mit Bewegungs- und Neigungssensoren auszurüsten, um die Orientierung des Gerätes in den Raumachsen, statisch und in der Bewegung dynamisch, zu erfassen. Es sind entsprechend ausgerüstete Mobiltelefone bekannt, bei denen solche Sensoren direkt zur Ausführung bestimmter Steuerfunktionen eingesetzt werden. Ferner ist aus der DE 202 21 078 U1 beispielsweise ein mit Neigungssensoren ausgerüstetes Mobiltelefon bekannt, bei dem mit der gleichen Taste bei unterschiedlicher Neigung des Gerätes unterschiedliche Funktionen ausgeführt werden können.
  • Die aus dem Stand der Technik bekannten Methoden erlauben somit zwar die Bestimmung der Position eines Sprechers innerhalb eines Raumes oder der Orientierung eines Gerätes. Diese Informationen sind jedoch nicht geeignet, um mit ausreichender Sicherheit entscheiden zu können, ob bei einem Benutzer ein Kommunikationswunsch besteht.
  • Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren und eine Vorrichtung vorzuschlagen, mit deren Hilfe ein Zuwenden oder Abwenden eines Benutzers zu einem Telekommunikationsendgerät sicher erkannt werden kann.
  • Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 1, sowie eine Telekommunikationsvorrichtung nach Anspruch 13 gelöst. Vorteilhafte Ausführungsformen und Weiterbildungen sind in den jeweiligen Unteransprüchen umschrieben.
  • Dementsprechend umfasst ein erfindungsgemäßes Verfahren zum Steuern einer Telekommunikationsendeinrichtung das Registrieren wenigstens eines mittels einer ersten Eingabeeinrichtung generierten ersten Eingabesignals, das Erzeugen eines ersten Datensatzes aus diesem wenigstens einen ersten Eingabesignal, sowie das automatische Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung durch Auswerten des ersten Datensatzes in Abhängigkeit von vorgegebenen variablen Regeln. Um eine Änderung des Kommunikationsbereitschafts-Zustands feststellen zu können, wird dieser überwacht. Wird eine Änderung des Kommunikationsbereitschafts-Zustands des Benutzers festgestellt, so wird automatisch eine vorgegebene Funktion der Telekommunikationsendeinrichtung oder mindestens einer mit der Telekommunikationseinrichtung über ein Netzwerk assoziierten Einrichtung ausgeführt. Im einfachsten Fall besteht der Kommunikationsbereitschafts-Zustand eines Benutzers im Vorliegen oder Nicht-Vorliegen einer Kommunikationsbereitschaft eines Benutzers.
  • Vorzugsweise erfolgt das Überwachen des Kommunikationsbereitschafts-Zustands dadurch, dass zu vorgegebenen Zeitpunkten wenigstens ein erstes Eingabesignal registriert, daraus ein erster Datensatz erzeugt und durch Auswerten dieses ersten Datensatzes automatisch ein Kommunikationsbereitschafts-Zustand ermittelt wird. Vorteilhaft werden diese Schritte zyklisch in einem vorgegebenen Zeitintervall ausgeführt, um eine kontinuierliche Überwachung zu gewährleisten.
  • Die Telekommunikationsendeinrichtung, im Folgenden auch kurz als Endgerät bezeichnet, kann vorteilhaft als mobiles Telekommunikationsendgerät wie zum Beispiel als Mobiltelefon, Smartphone oder PDA ausgebildet sein. Je nach Einsatzzweck kann jedoch auch jedes andere zur Telekommunikation ausgebildete Gerät als Endgerät eingesetzt werden. In einer bevorzugten Ausführungsform des Verfahrens ist das Endgerät beispielsweise als fest installiertes, öffentliches Telefon oder als Internetstation ausgebildet, wobei die Internetstation zum Beispiel ein öffentlich zugängliches Zugangsterminal für den Zugriff auf das Internet umfasst.
  • Eine Änderung des Kommunikationsbereitschafts-Zustands eines Benutzers wird in der Regel immer dann erkannt, wenn ein Benutzer sich dem Endgerät zuwendet oder sich von diesem abwendet.
  • Das Verfahren ermöglicht somit vorteilhaft die Gewinnung wenigstens eines Aktivierungs- oder Deaktivierungssignals, wenn ein Zuwenden oder Abwenden eines Benutzers zu oder von dem Endgerät erkannt wird, wobei das Signal zur Aktivierung oder Deaktivierung einer vorbestimmten Komponente der Telekommunikationsendeinrichtung dient.
  • Das automatische Ausführen der vorgegebenen Funktion der Telekommunikationsendeinrichtung entspricht insofern vorteilhaft dem Aktivieren oder Deaktivieren mindestens einer vorbestimmten Komponente der Telekommunikationsendeinrichtung. Dementsprechend wird ein Aktivierungs- bzw. Deaktivierungssignal an die entsprechende Komponente übermittelt, beispielsweise in Abhängigkeit von der Position und der Bewegung des Nutzers im Verhältnis zum Endgerät, und zwar dann, wenn der Nutzer durch Handlungen mit dem Endgerät und/oder sprachliche Äußerungen seinen Kommunikationswunsch bzw. den Abschluss der Kommunikation zum Ausdruck bringt. Ein Signal wird somit immer dann generiert, wenn sich der Nutzer dem Endgerät zuwendet und beginnt, mit mindestens einer lokalen oder über ein Netzwerk assoziierten Anwendung und/oder einem entfernten Kommunikationspartner über Sprache zu kommunizieren bzw. wenn sich der Nutzer vom Endgerät abwendet und die Kommunikation mit der Anwendung und/oder einem entfernten Kommunikationspartner beendet, wobei der Kommunikationspartner Mensch und/oder Maschine sein kann.
  • In einer bevorzugten Ausführungsform des Verfahrens wird das Endgerät durch den Benutzer mittels Sprachsteuerung gesteuert, wobei die bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers auszuführende Funktion vorteilhaft das Aktivieren oder Deaktivieren mindestens einer Applikation der Endgerätes oder einer überein Netzwerk assoziierten Applikation umfasst, die der Kommunikation des Benutzers mit einem Anwendungsprogramm des Endgerätes dient oder diese unterstützt. Zu diesem Zweck umfasst die Applikation vorteilhaft mindestens eine Spracherkennungs-, Echokompensations-, Freisprech-, Sprecherverifizierungs-, Sprechererkennungs-, Sprecherklassifizierungs-, Sprachidentifizierungs-, Sprachsynthese-, Geräuschreduktionsfunktion und/oder mindestens eine Funktion zur Erfassung und Auswertung prosodischer Merkmale der Spracheingabe wie zum Beispiel Wortakzent, Silbenbetonung oder Satzmelodie.
  • Bei Einsatz berührungsloser Eingabeeinrichtungen wie beispielsweise Kameras oder Mikrofonen wird durch das Verfahren vorteilhaft die Benutzung von Endgeräten ohne direkten Kontakt von Nutzer und Endgerät, wie zum Beispiel das Abnehmen und Auflegen eines Hörers, ermöglicht. Zweckmäßigerweise sind auch entsprechende berührungslose Ausgabeeinrichtungen vorgesehen, wie zum Beispiel ein Bildschirm oder Lautsprecher.
  • Die Erfassung eines Kommunikationswunsches eines Nutzers eines Endgerätes erfolgt somit prinzipiell mittels festgelegter, deterministischer Regeln, die im Endgerät oder auch beispielsweise in einem entfernten Serversystem abgespeichert sind, wobei die Regeln festlegen, welche Bedingungen vorliegen müssen, um ein ”Zuwendungs”- bzw. ”Abwendungs”-Signal zu generieren. Die Bedingungen werden dabei beschrieben durch den ersten Datensatz, welcher jeweils mittels ausgewählter Eingabeeinrichtungen registrierte Eingabesignale repräsentiert. Beispiele einsetzbarer Eingabeeinrichtungen sind Mikrofone, Mikrofon-Arrays, Kameras, Neigungssensoren, Bewegungssensoren, Griffel, berührungsempfindliche Bildschirme (engl. Touchscreen), Mäuse und/oder Tasten.
  • Vorteilhaft umfasst das Registrieren des wenigstens einen ersten Eingabesignals das Registrieren wenigstens zweier mittels unterschiedlicher Eingabeeinrichtungen generierter Eingabesignale, da durch Auswerten unterschiedlicher Arten von Eingabesignalen eine Kommunikationsbereitschaft des Nutzers aufgrund komplexerer Regeln sicherer erkannt werden kann. Das Umwandeln der registrierten Eingabesignale in einen gemeinsamen Datensatz stellt eine Vorverarbeitung dar, bei der Merkmalsvektoren gewonnen werden, die vorteilhaft der Bildung eines zu trainierenden, statistischen Verhaltensmodells oder Medienmodells dienen, mit dessen Hilfe nach einem Trainings- bzw. Adaptionsprozess beim Auftreten bestimmter statischer und/oder dynamischer Eingabesignale ein Kommunikationsbeginn- bzw. Kommunikationsende-Signal generiert werden kann.
  • Ein Medienmodell, beispielsweise ein Sprachmodell, beschreibt die Reihenfolge, in der Eingaben wie zum Beispiel Wörter und/oder Sensorsignale von einem Medienerkenner wie zum Beispiel einem Spracherkenner erwartet werden.
  • Eine besonders bevorzugte Ausführungsform des Verfahrens sieht dementsprechend vor, den ersten, aus den ersten Eingabesignalen erstellten Datensatz zu speichern, sowie wenigstens ein zweites Eingabesignal mittels einer zweiten Eingabeeinrichtung zu registrieren und daraus einen zweiten Datensatz zu erzeugen. Durch Auswerten des zweiten Datensatzes in Abhängigkeit vorgegebener fester Regeln wird ein Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung ermittelt. In Abhängigkeit dieses Kommunikationsbereitschafts-Zustands und/oder einer Änderung dieses Kommunikationsbereitschafts-Zustands werden die variablen Regeln zur Auswertung des ersten Datensatzes auf Grundlage des gespeicherten ersten Datensatzes automatisch angepasst.
  • Das durch die variablen Regeln definierte Verhaltensmodell kann vor einem Trainings- bzw. Adaptionsprozess durch Werte vorbelegt werden, die für bestimmte Eingabesignale bereits eine Kommunikationsbereitschaft erkennen.
  • Wird ein Endgerät typischerweise immer von dem gleichen Benutzer bedient, werden durch wiederholtes automatisches Anpassen der variablen Regeln für diesen spezifischen Benutzer vorteilhaft im Wesentlichen benutzerspezifische Regeln zur Auswertung des ersten Datensatzes erzeugt.
  • Andererseits kann es auch besonders vorteilhaft sein, im Wesentlichen benutzerunspezifische Regeln zu erzeugen, beispielsweise um diese als Voreinstellung in einem Endgerät für einen neuen Benutzer bereitzustellen. Zu diesem Zweck erfolgt vorteilhaft ein wiederholtes automatisches Anpassen der variablen Regeln für eine Vielzahl unterschiedlicher Benutzer.
  • Nach Abschluss einzelner Trainingsprozesse für eine größere Anzahl von Nutzern eines Kommunikationsnetzes, die über einen Zugriff auf Endgeräte verfügen, welche zur Ausführung des beschriebenen Verfahrens ausgebildet sind, werden die trainierten Modelle der einzelnen Nutzer dementsprechend vorteilhaft dazu genutzt, um aus diesen ein nutzerunabhängiges Verhaltensmodell abzuleiten, welches als Anfangseinstellung oder Vorbelegung zum weiteren Training für neue Nutzer dient. Nach einem längeren Anwendungszeitraum mit einer großen Nutzerzahl kann damit für die meisten neuen Nutzer das Training des Verhaltensmodells zur Generierung des ”Kommunikationswunsch”-Signals entfallen.
  • Wie bereits oben beschrieben wird das wenigstens eine erste Eingabesignal vorzugsweise mittels berührungslos wirkender Eingabeeinrichtungen generiert, um eine berührungslose Steuerung durch den Benutzer zu ermöglichen.
  • Das Training oder Anpassen der variablen Regeln erfolgt in einer bevorzugten Ausführungsform des Verfahrens dadurch, dass bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands des Nutzers auf Grundlage des ausgewerteten zweiten Datensatzes die variablen Regeln derart angepasst werden, dass in Abhängigkeit der angepassten Regeln durch Auswerten des ersten Datensatzes der gleiche Kommunikationsbereitschafts-Zustand ermittelt wird wie durch Auswerten des zweiten Datensatzes. Zu diesem Zweck kann es auch vorteilhaft sein, den ersten Datensatz aus Eingabesignalen zu erstellen, die kurz vor oder kurz nach Registrieren des zweiten Eingabesignals registriert wurden.
  • Dementsprechend sieht das Verfahren vorteilhaft vor, dass der erste und zweite Datensatz aus Eingabesignalen erstellt werden, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.
  • Zweckmäßigerweise beinhaltet das automatische Ermitteln eines Kommunikationsbereitschafts-Zustands das Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters, welcher die Zuverlässigkeit des ermittelten Zustandes widerspiegelt, für das Vorliegen einer Kommunikationsbereitschaft und das Vergleichen des ermittelten Wahrscheinlichkeitswertes oder Parameters mit einem vorgegebenen Grenzwert.
  • Für das Training oder das Anpassen der variablen Regeln ist es von Vorteil, wenn aus dem zweiten Datensatz der Kommunikationsbereitschafts-Zustand mit hoher Sicherheit ermittelt werden kann. Zu diesem Zweck kann für das zweite Eingabesignal beispielsweise eine eng definierte, erfassbare Aktion wie das Drücken einer vorgegebenen Taste vorgesehen sein. Dementsprechend umfasst das Registrieren des wenigstens einen zweiten Eingabesignals vorteilhaft eine manuelle Benutzereingabe.
  • In den Fällen, in denen gemeinsam mit einem Eingabeergebnis zusätzlich ein hoher Zuverlässigkeits- oder Konfidenzwert geliefert wird, wie dies z. B. bei bestimmten Spracheingaben möglich sein kann, und dieser Wert eine hohe Sicherheit des erkannten Ergebnisses widerspiegelt, kann das Registrieren des wenigstens einen zweiten Eingabesignals vorteilhaft auch einen anderen als sicher bewerteten Eingabemodus umfassen.
  • Um einen Kommunikationsbereitschafts-Zustand für unterschiedliche Situationen oder Bedingungen sicher zu ermitteln, wird der erste Datensatz vorteilhaft aus mehreren Eingabesignalen erstellt, die mittels unterschiedlicher Eingabeeinrichtungen registriert werden. Der erste Datensatz umfasst somit vorteilhaft unterschiedliche Eingabesignale in digitalisierter Form und weist damit eine Vielzahl auswertbarer Merkmale auf.
  • Das Auswerten des ersten und/oder zweiten Datensatzes umfasst vorteilhaft das Auswerten einer Maus-/Griffel- oder Tastatureingabe und/oder das Ermitteln einer Laufzeitdifferenz akustischer, von einem Mikrofon-Array generierter Signale und/oder eine Spracherkennung akustischer Signale und/oder eine Sprechererkennung akustischer Signale und/oder eine Auswertung prosodischer Merkmale von Spracheingaben und/oder eine Bilderkennung eines von einer Kamera aufgenommenen Bildes und/oder eine Gesichtserkennung eines von einer Kamera aufgenommenen Bildes und/oder das Auswerten von Signalen eines Näherungs- oder Neigungssensors. Das beschriebene Verfahren ist jedoch nicht auf die angeführten Auswertungsmethoden beschränkt, sondern kann je nach Einsatzzweck weitere, auch zukünftige, Auswertemethoden umfassen.
  • Das Auswerten des ersten und/oder zweiten Datensatzes kann je nach Ausführung der Telekommunikationsendeinrichtung durch diese selbst oder durch eine separate Verarbeitungseinheit erfolgen. Beispielsweise bei mobilen Endgeräten kann die Rechenleistung unzureichend für das komplexe Auswerten des ersten und/oder zweiten Datensatzes sein, so dass die Auswertung vorteilhaft mittels eines entfernten Servers erfolgt, der über ein Kommunikationsnetz mit dem Endgerät verbindbar ist. Zu diesem Zweck wird der erste und/oder zweite Datensatz zu der vom Endgerät separaten Verarbeitungseinheit übertragen, die den ersten und/oder zweiten Datensatz auswertet, den durch Auswertung ermittelten Kommunikationsbereitschafts-Zustand überwacht und bei Ermitteln einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers zum Ausführen der vorgegebenen Funktion ein Steuersignal zum Endgerät überträgt.
  • Eine erfindungsgemäße Telekommunikationsvorrichtung umfasst eine Telekommunikationsendeinrichtung, wenigstens eine erste Eingabeeinrichtung zum Registrieren von ersten Eingabesignalen, eine Vorverarbeitungseinheit zum Umwandeln registrierter Eingabesignale in digitalisierte Daten, eine Auswerteeinheit zum Auswerten der digitalisierten Daten, eine Steuereinheit zum Steuern der Telekommunikationsendeinrichtung, und einen Speicher zum Speichern variabler Regeln, wobei die Auswerteeinheit dazu ausgebildet ist, durch Auswerten aus ersten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von den im Speicher abgelegten variablen Regeln automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung zu ermitteln, den Kommunikationsbereitschafts-Zustand des Benutzers zu überwachen und bei Feststellug einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers ein Steuersignal zu der Steuereinheit zu übertragen, wobei die Steuereinheit dazu ausgebildet ist, in Antwort auf den Empfang des Steuersignals eine vorgegebene Funktion der Telekommunikationsendeinrichtung auszuführen.
  • Zum Anpassen der in dem Speicher abgelegten variablen Regeln weist die Vorrichtung vorteilhaft eine zweite Eingabeeinrichtung zum Registrieren von zweiten Eingabesignalen auf. In dieser Ausführungsform ist die Auswerteeinheit ferner dazu ausgebildet, erste, aus ersten Eingabesignalen gewonnene digitalisierte Daten in dem Speicher abzulegen, durch Auswerten von zweiten, aus zweiten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von in dem Speicher abgelegten festen Regeln automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung zu ermitteln und zu überwachen, und in Abhängigkeit der aus den ausgewerteten zweiten digitaliserten Daten erkannten Kommunikationsbereitschafts-Zustands und/oder einer Änderung des Kommunikationsbereitschafts-Zustands und der gespeicherten ersten digitalisierten Daten automatisch die variablen Regeln anzupassen und die angepassten Regeln in dem Speicher abzulegen.
  • Um beispielsweise akustische Signale auswerten zu können, ist die Vorverarbeitungseinheit vorteilhaft dazu ausgebildet, die ersten und/oder zweiten digitalisierten Daten aus Eingabesignalen zu erstellen, die über einen vorgegebenen Zeitraumregistriert werden.
  • Die zweite Eingabeeinrichtung dient vorzugsweise der Bestätigung einer Zuwendung oder Abwendung eines Benutzers zum Endgerät, um ein Anpassen der variablen Regeln zu ermöglichen und damit das Ermitteln eines Kommunikationsbereitschafts-Zustands auf Grundlage von Eingabesignalen der wenigstens einen ersten Eingabeeinrichtung zu verbessern. Zu diesem Zweck erfolgt das Anpassen der variablen Regeln vorteilhaft in Abhängigkeit von ersten Eingabesignalen, die mittels der ersten Eingabeeinrichtung kurz vor, kurz nach oder während einer Bestätigung durch den Benutzer mittels der zweiten Eingabeeinrichtung registriert werden.
  • Dementsprechend ist die Vorverarbeitungseinheit vorteilhaft dazu ausgebildet, die ersten und zweiten digitalisierten Daten aus ersten beziehungsweise zweiten Eingabesignalen zu erstellen, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.
  • Die Bestätigung einer Änderung eines Kommunikationsbereitschafts-Zustands mittels der zweiten Eingabeeinrichtung durch den Benutzer kann vorzugsweise optional erfolgen, beispielsweise wenn ausgehend von den ersten Eingabesignalen ein Wahrscheinlichkeitswert für das Vorliegen einer Kommunikationsbereitschaft ermittelt wird, der nah bei einem vorgegebenen Grenzwert liegt. In diesem Fall löst die Bestätigung mittels der zweiten Eingabeeinrichtung vorzugsweise das Anpassen der variablen Regeln aus. Dementsprechend bewirkt das Feststellen einer Änderung des durch Auswerten der zweiten digitalisierten Daten durch die Auswerteeinheit ermittelten Kommunikationsbereitschafts-Zustands des Benutzers vorteilhaft das Anpassen der variablen Regeln.
  • Vorzugsweise wird ein Kommunikationsbereitschafts-Zustand auf der Grundlage mehrerer mittels unterschiedlicher Eingabeeinrichtungen registrierter Eingabesignale ermittelt. Dementsprechend umfasst die wenigstens eine erste Eingabeeinrichtung vorteilhaft wenigstens zwei erste Eingabeeinrichtungen, die jeweils zum Registrieren unterschiedlicher Arten von Eingabesignalen ausgebildet sind, wobei diese mit Vorteil zumindest eine berührungslos wirkende Eingabeeinrichtung wie zum Beispiel ein Mikrofon, ein Mikrofon-Array, eine Kamera oder einen Bewegungs- oder Neigungssensor umfassen.
  • Die zur Bestätigung einer Änderung des Kommunikationsbereitschafts-Zustands vorgesehene zweite Eingabeeinrichtung ist vorteilhaft als manuell durch den Benutzer zu bedienende Eingabeeinrichtung ausgebildet, beispielsweise als Griffel, Maus, Taste oder Touchscreen, um eine sichere Auswertung der entsprechenden zweiten Eingabesignale zu gewährleisten. Auch kann die zweite Eingabeeinrichtung vorteilhaft als Mikrofon ausgebildet sein, um ein akustisches Signal wie beispielsweise ein ”Hot Word”, zu registrieren. Ferner kann die erste Eingabeeinrichtung gleichzeitig als zweite Eingabeeinrichtung verwendet werden.
  • Die Auswerteeinheit ist vorteilhaft zur Auswertung einer Maus-/Griffel- oder Tastatureingabe und/oder zum Ermitteln einer Laufzeitdifferenz akustischer, von einem Mikrofon-Array generierter Signale und/oder zur Spracherkennung akustischer Signale und/oder zur Auswertung prosodischer Merkmale von Spracheingaben und/oder zur Sprechererkennung akustischer Signale in Abhängigkeit hinterlegter Sprecherprofile und/oder zur Bilderkennung eines von einer Kamera aufgenommenen Bildes und/oder zur Gesichtserkennung eines von einer Kamera aufgenommenen Bildes in Abhängigkeit hinterlegter Gesichtsprofile und/oder zum Auswerten von Signalen mindestens eines Näherungs- oder Neigungssensors ausgebildet.
  • Wie bereits oben beschrieben beinhaltet das Ermitteln eines Kommunikationsbereitschafts-Zustands vorteilhaft das Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters, welcher die Zuverlässigkeit des ermittelten Zustandes widerspiegelt. Zu diesem Zweck ist bevorzugt im Speicher ein Grenzwert für diesen Parameter hinterlegt, wobei die Auswerteeinheit zum Ermitteln eines Wahrscheinlichkeitswertes oder eines ähnlichen Parameters für das Vorliegen einer Kommunikationsbereitschaft und zum Vergleichen des ermittelten Wertes mit dem hinterlegten Grenzwert ausgebildet ist.
  • Je nach konkreter Ausgestaltung und Einsatzzweck des Endgerätes kann die Auswerteeinheit vorteilhaft in das Endgerät integriert sein. Alternativ ist die Auswerteeinheit in einer separaten Verarbeitungseinheit angeordnet, die mittels einer Kommunikationsverbindung mit dem Endgerät verbindbar ist.
  • Ferner sind in einer vorteilhaften Ausführungsform die erste und/oder zweite Eingabeeinrichtung als von der Telekommunikationsendeinrichtung separate Eingabeeinheiten ausgebildet, wobei die Eingabeeinheiten vorzugsweise dazu ausgebildet sind, mit der Telekommunikationsendeinrichtung drahtlos zu kommunizieren, beispielsweise mittels Bluetooth.
  • Eine bevorzugte Ausführungsform einer Telekommunikationsvorrichtung umfasst ein öffentliches Telefon als Endgerät, welches vorteilhaft mit berührungslos zu bedienenden Eingabeeinrichtungen und entsprechenden Ausgabeeinrichtungen ausgerüstet ist. Um eine Kommunikation zu ermöglichen, die von Umstehenden nicht mitgehört werden kann, umfasst die Vorrichtung in dieser Ausführungsform bevorzugt eine Ausgabeeinrichtung zur Ausgabe von gerichteten akustischen Signalen, beispielsweise ausgebildet als Ultraschall-Lautsprechersystem, mittels dessen durch ein moduliertes Ultraschallsignal ein akustischen Strahl auf einen vorgegebenen Raumbereich gerichtet werden kann.
  • Die Erfindung wird nachfolgend beispielhaft anhand bevorzugter Ausführungsformen und unter Bezugnahme auf die beigefügten Zeichnungen genauer beschrieben. Dabei bezeichnen gleiche Bezugszeichen in den Zeichnungen gleiche oder ähnliche Teile.
  • Es zeigen:
  • 1: eine schematische Darstellung der prinzipiellen Funktionsweise einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens,
  • 2: eine schematische Darstellung einer ersten bevorzugten Ausführungsform einer erfindungsgemäßen Telekommunikationsvorrichtung,
  • 3: eine schematische Darstellung einer zweiten bevorzugten Ausführungsform einer erfindungsgemäßen Telekommunikationsvorrichtung, und
  • 4: eine schematische Darstellung einer weiteren bevorzugten Ausführungsform einer erfindungsgemäßen Telekommunikationsvorrichtung, welche ein öffentliches Telefon umfasst.
  • 1 zeigt schematisch die prinzipielle Funktionsweise einer bevorzugten Ausführungsform des Verfahrens.
  • Mittels wenigstens einer ersten Eingabeeinrichtung wird wenigstens ein erstes Eingabesignal registriert. Als einsetzbare Eingabeeinrichtungen sind in 1 beispielhaft ein als Griffel oder Maus ausgebildete Zeigeeinrichtung 11, Touchscreen und/oder Tasten 12, ein Mikrofon-Array 13, eine Kamera 14, ein Näherungssensor 15, ein Bewegungssensor 17, sowie ein Neigungssensor 16 dargestellt. Eingabesignale einer oder mehrerer der Eingabeeinrichtungen 11 bis 17 werden zu wenigstens einem ersten Datensatz 10 umgewandelt und bei Bedarf vorverarbeitet. Dementsprechend umfasst der digitale Datensatz 10 in der dargestellten Ausführungsform eine Auswahl von digitalisierten Daten, die Griffel-/Mauseingaben 21, Tasten- und/oder Touchscreen-Eingaben 22, eine zwischen verschiedenen Mikrofonen des Mikrofon-Arrays 13 ermittelte Laufzeitdifferenz 23, eine mittels wenigstens eines Mikrofons aufgenommene Audiosequenz als Sprachprobe 24, ein digitales Kamerabild als Bildprobe 25, sowie Sensorwerte 26 der Näherungs-, Neigungs- und Bewegungssensoren 15 bis 17 umfassen kann.
  • Der Datensatz 10 wird einer Auswerteeinheit 40 zugeführt, in der durch Auswerten des Datensatzes in Abhängigkeit vorgegebener variabler Regeln 30 automatisch ein Kommunikationsbereitschafts-Zustand eines Benutzers eines Endgerätes ermittelt und überwacht wird. Bei Änderung des Kommunikationsbereitschafts-Zustands des Benutzers wird automatisch ein Aktivierungs- oder Deaktivierungssignal generiert und einer Steuereinheit des Endgerätes zugeführt, um eine vorgegebene Funktion des Endgerätes oder einer über ein Netzwerk assoziierten Applikation zu aktivieren oder zu deaktivieren. Diese Funktion kann beispielsweise der Auf bzw. Abbau einer Kommunikationsverbindung mit einem anderen Kommunikationsteilnehmer oder das Aktivieren bzw. Deaktivieren einer Applikation des Endgerätes wie zum Beispiel einer Sprachsteuerung sein.
  • Zur Auswertung des ersten Datensatzes sind in der dargestellten Ausführungsform verschiedene Auswerte-Module 41 bis 49 in der Auswerteeinheit 40 vorgesehen. Diese umfassen beispielhaft mindestens eine Griffel-/Mausauswertung 41, eine Tasten- und/oder Touchscreen-Auswertung 42, eine Auswertung einer Laufzeitdifferenz 43, eine Sensorenauswertung 44, eine Spracherkennung 45, eine Sprechererkennung 46, eine Auswertung prosodischer Merkmale von Spracheingaben 49, eine Bilderkennung 47, sowie eine Gesichtserkennung 48. Zur Ausführung der verschiedenen Auswerte-Module 41 bis 49 können zum Vergleich vorteilhaft benutzerspezifische Sprach- oder Bild-Profile hinterlegt sein.
  • Die variablen Regeln 30, die vorteilhaft ein Medienmodell beinhalten können, werden in einer bevorzugten Ausführungsform dynamisch angepasst.
  • Zu diesem Zweck wird ein erster Datensatz 10 gespeichert und wenigstens ein zweiter Datensatz erstellt, wobei der erste und zweite Datensatz typischerweise aus Eingabesignalen unterschiedlicher Gruppen von Eingabeeinrichtungen erstellt wird. Dabei werden für den zweiten Datensatz vorzugsweise Eingabesignale gewählt, auf Grundlage derer ein Kommunikationsbereitschafts-Zustand eines Benutzers in Abhängigkeit vorgegebener fester Regeln 20 sicher erkannt werden kann.
  • Wird mittels der Auswerteeinheit anhand des zweiten Datensatzes in Abhängigkeit der vorgegebenen festen Regeln 20 eine Änderung des Kommunikationsbereitschafts-Zustands eines Benutzers erkannt, so erfolgt ein automatisches Anpassen der variablen Regeln 30 in Abhängigkeit des gespeicherten ersten Datensatzes 10.
  • 2 zeigt eine bevorzugte Ausführungsform einer Telekommunikationsvorrichtung 110, welche als Telekommunikationsendgerät 200 ausgebildet ist. Das Endgerät 200 kann als mobiles oder stationäres Gerät, beispielsweise als Mobiltelefon, Smartphone, PDA, Autotelefon oder öffentliches Telefon, ausgebildet sein. Dementsprechend umfasst das Endgerät 200 nicht dargestellte Mittel wie zum Beispiel einen Transceiver, um über ein Kommunikationsnetz mit einem anderen Kommunikationsteilnehmer zu kommunizieren.
  • Ferner umfasst das Endgerät 200 in der dargestellten Ausführungsform Eingabeeinrichtungen 210, welche beispielsweise eine oder mehrere der in 1 dargestellten Einrichtungen 11 bis 17 umfassen können, mindestens eine Vorverarbeitungseinheit 220 zum Umwandeln registrierter Eingabesignale in digitalisierte Daten, sowie mindestens eine Auswerteeinheit 240 zum Auswerten der digitalisierten Daten, die im wesentlichen der Auswerteeinheit 40 in 1 entspricht. Gesteuert wird das Endgerät durch die Steuereinheit 230, die Zugriff auf einen Speicher 260 hat, in dem beispielsweise ein Steuerprogramm hinterlegt ist, und geeignete Ausgabeeinrichtungen 250 ansteuert.
  • Die Auswerteeinheit 240 ist mit der Steuereinheit 230 verbunden, um an diese bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands eines Benutzers ein entsprechendes Steuersignal zu übermitteln. Die für die Auswertung verwendeten Regeln sind ebenfalls in Speicher 260 abgelegt. Dementsprechend ist ferner ein direkter Zugriff der Auswerteeinheit 240 auf den Speicher 260 vorgesehen.
  • In 3 ist eine weitere vorteilhafte Ausführungsform einer Telekommunikationsvorrichtung 120 dargestellt, bei der die Auswerteeinheit 440 in einem vom Endgerät entfernten Server 400 angeordnet ist. In diesem Ausführungsbeispiel werden vorverarbeitete Eingabesignale mittels der Steuereinheit 230 des Endgerätes 201 und der Steuereinheit 430 des Servers 400 zur Auswerteeinheit 440 übertragen, und dort unter Verwendung entsprechender variabler Regeln, die in Speicher 460 abgelegt sind, ausgewertet, um einen Kommunikationsbereitschafts-Zustand eines Benutzers des Endgerätes 201 zu ermitteln und zu überwachen. Bei Feststellen einer Änderung des Kommunikationsbereitschafts-Zustands durch die Auswerteeinheit 440 werden entsprechende Steuersignale auf dem gleichen Weg zur Steuereinheit 230 des Endgerätes 201 übertragen. Zur Kommunikation des Endgerätes 201 über eine Kommunikationsverbindung 330 mit dem Server 400 sind entsprechende Schnittstellen 310 und 320 vorgesehen.
  • 4 zeigt eine weitere bevorzugte Ausführungsform einer Telekommunikationsvorrichtung 130, die ein öffentliches Telefon 202 umfasst, welches durch einen Benutzer berührungslos bedient werden kann. Zu diesem Zweck weist das Telefon 202 verschiedene berührungslose Eingabeeinrichtungen auf. Diese umfassen eine Kamera 212, sowie ein Array von Mikrofonen 213a bis 213d. Als weitere Eingabeeinrichtung ist ein Näherungssensor 211 vorgesehen, der mit dem Telefon 202 verbunden ist.
  • Als Ausgabeeinrichtungen dienen ein Bildschirm 251 sowie ein Lautsprechersystem 252, oder auch taktil wahrnehmbare veränderliche Oberflächen. Um eine Mithörmöglichkeit für Umstehende zu verhindern, ist das Lautsprechersystem 252 in dieser Ausführungsform als Ultraschall-Lautsprechersystem ausgebildet, mittels dessen ein auf den Benutzer gerichteter Schall erzeugt werden kann.
  • Optional kann das öffentliche Telefon eine Taste 214 aufweisen, mittels derer ein Benutzer seine Kommunikationsbereitschaft oder das Beenden seiner Kommunikationsbereitschaft bestätigen kann, um bei mangelnder automatischer Erkennung seines Kommunikationsbereitschafts-Zustands in einem Speicher des Telefons 202 hinterlegte variable Regeln zum Ermitteln eines Kommunikations bereitschafts-Zustands automatisch anzupassen.
  • Im Folgenden sind einige Beispiele aus Sensor- und Sprachsignalen ableitbarer variabler Regeln aufgeführt.
  • Ist zum Beispiel die Laufzeitdifferenz von Sprachsignalen zu räumlich auf dem Endgerät unterschiedlich angeordneten Mikrofonen innerhalb einer festgelegten Toleranz gleich oder nahe Null, so kann bereits in diesem einfachen Fall davon ausgegangen werden, dass der Nutzer mit einer lokalen und/oder netzbasierten Applikation und/oder einer anderen Person über das Endgerät kommunizieren möchte, so dass ein entsprechendes Aktivierungssignal generiert wird. Es können als Kriterium auch Entfernungsmessungen hinzugezogen werden, welche auf den Messungen der Winkel zum Nutzer über ein Kamera-Array basieren.
  • Die Auswertung der Laufzeiten kann mit einer Auswertung eines Bildsignals derart gekoppelt werden, dass durch Auswertung dieses Signals auf dem Endgerät oder einem entfernten Serversystem festgestellt werden kann, ob das Gesicht des Nutzers in einem oder einem von mehreren möglichen vordefinierten Winkeln zur Kamera erscheint, so dass in diesem Fall ein entsprechendes Aktivierungssignal generiert wird. Über einen Neigungssensor kann im Rahmen voreingestellter Toleranzen festgestellt werden, ob das Endgerät mit der Vorderseite nach unten oder soweit angewinkelt ist, dass von einer Abwendung des Nutzers vom Endgerät ausgegangen werden kann, was einen Kommunikationswunsch wenig wahrscheinlich erscheinen lässt. Der Bewegungssensor dient dabei der dynamischen Erfassung der Bewegungen. Erscheint zum Beispiel das Gesicht des Nutzers nach einer bestimmten Bewegung im Kamerabild, so kann unter Umständen mit einer relativ hohen Wahrscheinlichkeit oder Wichtung auf einen Kommunikationswunsch geschlossen werden.
  • Wenn dann zusätzlich zu den mit hoher Wahrscheinlichkeit auf einen Kommunikationswunsch hindeutenden Sensorsignalen ein ”Hot Word” mit ebenfalls hoher Wahrscheinlichkeit erkannt wird, so wird das Aktivierungssignal generiert.
  • Bei einer seitlich vertikalen Ausrichtung des Endgerätes mit Kamerabild ohne ein Gesicht kann zum Beispiel mit einer bestimmten Wahrscheinlichkeit davon ausgegangen werden, dass kein Kommunikationswunsch oder kein Kommunikationswunsch mehr besteht. Dementsprechend wird ein gegebenenfalls bestehender Aktivierungszustand deaktiviert oder ein Deaktivierungssignal übertragen.
  • Auf diese Art kann unter Berücksichtigung von Sensorsignalen und Spracherkennung ein Satz von Regeln, die auch als Verhaltensgrammatik bezeichnet werden können, definiert werden, welcher als Voreinstellung im Endgerät und/oder auf einem an das Kommunikationsnetz angeschlossenen Server endgeräte- und/oder nutzerbezogen gespeichert ist. Zusätzlich zu den im Endgerät installierten Sensoren und/oder Mikrofonen können sich diese auch in intelligenter Kleidung befinden und mit dem Endgerät drahtlos, z. B. über Bluetooth-Verbindungen kommunizieren, wodurch ermöglicht wird, die relative Lage des Nutzers zum Endgerät zu erfassen, zum Beispiel stehend, angelehnt, sitzend oder seitlich liegend. So kann zum Beispiel als Regel definiert werden, dass nur bei einem seitlich liegenden Nutzer und einer seitlichen Position des Endgerätes und/oder weiteren Bedingungen ein Kommunikationswunschsignal generiert wird. Steht der Nutzer, und wird das Endgerät in seitlicher Position gehalten, so wird die Wahrscheinlichkeit für einen Kommunikationswunsch als gering bewertet.
  • Die Signale der im und/oder am Endgerät und/oder in intelligenter Kleidung installierten Eingabeeinrichtungen können auch zeitlich getaktet zur Bildung von Merkmalsvektoren dienen, welche wiederum als Grundlage zum Training von Wahrscheinlichkeitsmodellen wie zu Beispiel einem Hidden Markov Modell dienen, die in diesem Fall auch als Medienmodelle oder Verhaltensmodelle bezeichnet werden können.
  • Mit diesem trainierten, nutzerabhängigen Verhaltensmodell wird bei eingeschaltetem Endgerät ständig das über die Eingabeeinrichtungen erfasste aktuelle Nutzerverhalten verglichen und ab einem bestimmten errechneten Zuverlässigkeitswert bzw. Wahrscheinlichkeit wird das Kommunikationswunschsignal oder Deaktivierungssignal generiert.
  • Das Training des Verhaltensmodells kann sowohl durch eine Software auf dem Endgerät, als auch auf einem über ein Kommunikationsnetz erreichbaren Server erfolgen. Dazu kann zum Beispiel der Nutzer in der Anfangsphase veranlasst werden, bei jedem Kommunikationswunsch eine Taste zu betätigen und/oder eine andere vorgeschriebene und eng definierte, erfassbare Aktion durchzuführen. Ähnliches gilt analog für den Abschluss der Kommunikation. Die vorher und gegebenenfalls kurz nachher innerhalb eines gewissen Zeitraums über die Eingabeeinrichtungen in mehreren Trainingsprozessen erfassten Merkmalsvektoren dienen dann der Bildung eines Referenz-Verhaltensmodells eines Nutzers.
  • Über ein Kommunikationsnetz können die über die Eingabeeinrichtungen während der Trainingsphasen erfassten Sensordaten bzw. Merkmalsvektoren einer großen Anzahl von Nutzern auch der Bildung eines gemittelten, nutzerunabhängigen Verhaltensmodells dienen. Zu diesem Zweck werden die Nutzer in der Anfangsphase beispielsweise wiederum veranlasst, bei jedem Kommunikationswunsch eine Taste zu betätigen und/oder eine andere vorgeschriebene und eng definierte, erfassbare Aktion durchzuführen. Die vorher und gegebenenfalls kurz nachher innerhalb eines gewissen Zeitraums über die Eingabeeinrichtungen in mehreren Trainingsprozessen erfassten Merkmalsvektoren bzw. Daten werden dann an mindestens ein am Kommunikationsnetz angeschlossenes Serversystem übermittelt. Ist eine hinreichende z. B. als Grenzwert definierte Anzahl von erfassten Daten einer großen Anzahl verschiedener Nutzer vorhanden, können diese zur Bildung eines nutzerunabhängigen Verhaltensmodells für einen Kommunikationswunsch genutzt werden.
  • Es können auch vorteilhaft verschiedene Verhaltensmodelle für einen Kommunikationswunsch vorgesehen sein, die unterschiedlichen Applikationen zugeordnet sind, wobei diese dementsprechend applikationsabhängig gespeichert werden.
  • Zur Verbesserung der berührungslosen Bedienung stationärer und/oder quasistationärer, zum Beispiel in Fahrzeugen eingebauter, Endgeräte und dabei speziell öffentlicher Telefone ist neben der berührungslosen Aktivierung und/oder Deaktivierung der Signale, die einen Kommunikationswunsch zum Ausdruck bringen, noch ein Ausgabemodus, gegebenenfalls mit Freisprechfunktionalität mit gerichtetem Schall erforderlich, der verhindert, dass Umstehende die Ausgaben mindestens eines Endgerätelautsprechers mithören. Hierzu kann ein aus dem Stand der Technik bekanntes Ultraschallverfahren Anwendung finden.
  • Ferner können in öffentlichen Telefonen vorteilhaft beweglich eingebaute und/oder über die Gerätehöhe verteilte Sensoren, wie Näherungssensoren, Kamerasysteme und Mikrofon-Arrays, sowohl der Ortung des Nutzers und der genauen Nachführung in Richtung des Nutzers, als auch der Steuerung eines ebenfalls beweglichen und/oder über die Gerätehöhe verteilten Lautsprechersystems dienen, um z. B. Anpassungen an die Nutzergröße durchzuführen (behindertengerechte Ausführung). Ebenfalls verteilt über die Gerätehöhe und/oder -fläche können Einrichtungen zur magnetischen Ankopplung von Hörgeräten verteilt werden, welche entsprechend der Nutzerlokalisierung angesteuert werden.
  • Ein Vorteil des beschriebenen Verfahrens besteht darin, dass nicht nur allein Sprachdaten oder allein andere Eingabemodi, sondern auch andere Daten der jeweils vorhandenen Eingabeeinrichtungen einer gemeinsamen Auswertung unterworfen werden, wodurch die Sicherheit zur Generierung bzw. Deaktivierung von Kommunikationswunschsignalen und damit die Nutzerakzeptanz wesentlich erhöht wird. Nutzer können sich, bei Bedarf nach Abschluss von Trainingsphasen, ohne zusätzliche Tastenbetätigungen über ein Endgerät einer Anwendung und/oder anderen Person als Kommunikationspartner ”zuwenden”. Ermöglicht werden auf diese Art öffentliche Telefone ohne über Kabel angeschlossene Hörer, die mit eingebautem Lautsprechersystem und Mikrofonarray und/oder Kamera und/oder Näherungssensoren ausgestattet sind, bei denen das Signal zur Kommunikation nicht mehr durch Abnehmen und Auflegen des Hörers aktiviert bzw. deaktiviert wird, sondern eine Aktivierung und Deaktivierung durch Überwachung der berührungslosen und/oder unimodalen und/oder multimodalen Eingabemöglichkeiten erfolgt. Die Geräte werden dadurch kompakter und weniger anfällig gegen Vandalismus. Auch ist eine separate Taste zum Beispiel zur Aktivierung und/oder Abbruch der Kommunikation, deren Betätigung ggf. scherzhaft vorgenommen oder vergessen werden kann, nicht unbedingt erforderlich.

Claims (27)

  1. Verfahren zum Steuern einer Telekommunikationsendeinrichtung (200, 201, 202) mit den Schritten a) Registrieren wenigstens zweier mittels unterschiedlicher erster Eingabeeinrichtungen (1117) generierter Eingabesignale, b) Umwandeln der zwei mittels unterschiedlicher erster Eingabeeinrichtungen (1117) generierter Eingabesignale in einen gemeinsamen ersten Datensatz, c) Automatisches Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) durch Auswerten des ersten Datensatzes (10) in Abhängigkeit von vorgegebenen variablen Regeln (30), d) Überwachen des Kommunikationsbereitschafts-Zustands des Benutzers, um eine Änderung des Kommunikationsbereitschafts-Zustands feststellen zu können, e) Ausführen einer vorgegebenen Funktion der Telekommunikationsendeinrichtung (200, 201, 202) bei Feststellung einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers, dadurch gekennzeichnet, dass die Eingabesignale zum Erkennen eines Kommunikationswunsches zumindest eines der folgenden Signale umfassen: – eine Laufzeitdifferenz (43) von akustischen Signalen zu räumlich auf der Telekommunikationsendeinrichtung unterschiedlich angeordneten Mikrofonen, die innerhalb einer festgelegten Toleranz gleich oder nahe Null ist, oder – wenn nach einer vorbestimmten, durch einen Bewegungssensor erfassten Bewegung der Telekommunikationsendeinrichtung das Gesicht des Nutzers im Kamerabild erscheint, oder über das Auswerten von Sensoren und/oder Mikrofonen in intelligenter Kleidung die relative Lage des Endgerätes zum Nutzer erfasst wird.
  2. Verfahren nach Anspruch 1, wobei das Überwachen des Kommunikationsbereitschafts-Zustands durch Ausführen der Schritte a) bis c) zu vorgegebenen Zeitpunkten erfolgt.
  3. Verfahren nach einem der vorstehenden Ansprüche, ferner umfassend die Schritte – Speichern des ersten Datensatzes (10), – Registrieren wenigstens eines mittels einer zweiten Eingabeeinrichtung (1117) generierten zweiten Eingabesignals, – Erzeugen eines zweiten Datensatzes (10) aus dem wenigstens einen zweiten Eingabesignal, – Automatisches Ermitteln eines Kommunikationsbereitschafts-Zustands eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) durch Auswerten des zweiten Datensatzes (10) in Abhängigkeit vorgegebener fester Regeln (20), – Automatisches Anpassen der variablen Regeln (30) zur Auswertung des ersten Datensatzes in Abhängigkeit des aus dem ausgewerteten zweiten Datensatz erkannten Kommunikationsbereitschafts-Zustand des Benutzers und des gespeicherten ersten Datensatzes.
  4. Verfahren nach Anspruch 3, wobei im Wesentlichen benutzerspezifische Regeln zur Auswertung des ersten Datensatzes (10) durch wiederholtes automatisches Anpassen der variablen Regeln (30) für einen spezifischen Benutzer erzeugt werden.
  5. Verfahren nach Anspruch 3, wobei im Wesentlichen benutzerunspezifische Regeln zur Auswertung des ersten Datensatzes (10) durch wiederholtes automatisches Anpassen der variablen Regeln (30) für eine Vielzahl unterschiedlicher Benutzer erzeugt werden.
  6. Verfahren nach einem der Ansprüche 3 bis 5, wobei der erste und zweite Datensatz (10) aus Eingabesignalen erstellt werden, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.
  7. Verfahren nach einem der vorstehenden Ansprüche, wobei das wenigstens eine erste Eingabesignal mittels berührungslos wirkender Eingabeeinrichtungen (1315, 17) generiert wird.
  8. Verfahren nach einem der Ansprüche 3 bis 7, wobei das Registrieren des wenigstens einen zweiten Eingabesignals eine manuelle Benutzereingabe oder eine andere Eingabe eines als sicher eingestuften Eingabemodus umfasst.
  9. Verfahren nach einem der vorstehenden Ansprüche, wobei das Auswerten des ersten und/oder zweiten Datensatzes – das Auswerten einer Maus-/Griffel- (41), Tastatur- oder Touchscreen-Eingabe (42) und/oder – das Ermitteln einer Laufzeitdifferenz (43) akustischer, von einem Mikrofon-Array generierter Signale und/oder – eine Spracherkennung (45) akustischer Signale und/oder – eine Auswertung prosodischer Merkmale akustischer Signale (49) und/oder – eine Sprechererkennung (46) akustischer Signale und/oder – eine Bilderkennung (47) eines von einer Kamera aufgenommenen Bildes und/oder – eine Gesichtserkennung (48) eines von einer Kamera aufgenommenen Bildes und/oder – das Auswerten von Signalen eines Näherungs-, Bewegungs- oder Neigungssensors (44) umfasst.
  10. Verfahren nach einem der vorstehenden Ansprüche, wobei das automatische Ermitteln eines Kommunikationsbereitschafts-Zustands die Schritte umfasst: – Ermitteln mindestens eines Wahrscheinlichkeitswertes oder eines Parameters, welcher die Zuverlässigkeit des ermittelten Zustandes widerspiegelt, für das Vorliegen einer Kommunikationsbereitschaft, – Vergleichen des ermittelten Wahrscheinlichkeitswertes oder Parameters mit einem vorgegebenen Grenzwert.
  11. Verfahren nach einem der vorstehenden Ansprüche, wobei das Auswerten des ersten und/oder zweiten Datensatzes (10) und das Überwachen des aus dem jeweils ausgewerteten Datensatz ermittelten Kommunikationsbereitschafts-Zustands durch die Telekommunikationsendeinrichtung (200) erfolgt.
  12. Verfahren nach einem der vorstehenden Ansprüche, wobei – der erste und/oder zweite Datensatz (10) zu einer von der Telekommunikationsendeinrichtung (201) separaten Verarbeitungseinheit (400) übertragen wird, – das Auswerten des ersten und/oder zweiten Datensatzes (10) und das Überwachen des aus dem jeweils ausgewerteten Datensatz ermittelten Kommunikationsbereitschafts-Zustands mittels der Verarbeitungseinheit (400) erfolgt, und – bei Feststellung einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers zum Ausführen der vorgegebenen Funktion ein Steuersignal von der Verarbeitungseinheit (400) zu der Telekommunikationsendeinrichtung (201) übertragen wird.
  13. Telekommunikationsvorrichtung (110, 120, 130), umfassend – eine Telekommunikationsendeinrichtung (200, 201, 202), – wenigstens zwei unterschiedliche erste Eingabeeinrichtungen (1117), die jeweils zum Registrieren unterschiedlicher Arten von Eingabesignalen ausgebildet sind, – eine Vorverarbeitungseinheit (220) zum Umwandeln registrierter Eingabesignale in digitalisierte Daten, wobei die Vorverarbeitungseinheit (220) dazu ausgebildet ist, die wenigstens zwei registrierten Eingabesignale in einen gemeinsamen Datensatz umzuwandeln, – eine Auswerteeinheit (240, 440) zum Auswerten der digitalisierten Daten, – eine Steuereinheit (230) zum Steuern der Telekommunikationsendeinrichtung (200, 201), und – einen Speicher (260, 460) zum Speichern variabler Regeln, wobei die Auswerteeinheit (240, 440) dazu ausgebildet ist, durch Auswerten aus ersten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von den im Speicher (260, 460) abgelegten variablen Regeln (30) automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) zu ermitteln, den Kommunikationsbereitschafts-Zustand des Benutzers zu überwachen und bei Feststellung einer Änderung des Kommunikationsbereitschafts-Zustands des Benutzers ein Steuersignal zu der Steuereinheit (230) zu übertragen, und wobei die Steuereinheit (230) dazu ausgebildet ist, in Antwort auf den Empfang des Steuersignals eine vorgegebene Funktion der Telekommunikationsendeinrichtung (200, 201, 202) auszuführen, dadurch gekennzeichnet, dass die Eingabesignale zum Erkennen eines Kommunikationswunsches zumindest eines der folgenden Signale umfassen: – eine Laufzeitdifferenz (43) von akustischen Signalen zu räumlich auf der Telekommunikationsendeinrichtung unterschiedlich angeordneten Mikrofonen, die innerhalb einer festgelegten Toleranz gleich oder nahe Null ist, oder – wenn nach einer vorbestimmten, durch einen Bewegungssensor erfassten Bewegung der Telekommunikationsendeinrichtung das Gesicht des Nutzers im Kamerabild einer Kamera erscheint, oder – Signale von Sensoren und/oder Mikrofonen in intelligenter Kleidung des Nutzers, mit denen die relative Lage des Nutzers zum Endgerät erfasst wird.
  14. Vorrichtung nach Anspruch 13, ferner umfassend eine zweite Eingabeeinrichtung (1117, 214) zum Registrieren von zweiten Eingabesignalen, wobei die Auswerteeinheit (240, 440) ferner dazu ausgebildet ist, – erste, aus ersten Eingabesignalen gewonnene digitalisierte Daten in dem Speicher (260) abzulegen, – durch Auswerten von zweiten, aus zweiten Eingabesignalen gewonnenen digitalisierten Daten in Abhängigkeit von in dem Speicher abgelegten festen Regeln (20) automatisch einen Kommunikationsbereitschafts-Zustand eines Benutzers der Telekommunikationsendeinrichtung (200, 201, 202) zu ermitteln und zu überwachen, – in Abhängigkeit des aus den ausgewerteten zweiten digitalisierten Daten ermittelten Kommunikationsbereitschafts-Zustands und/oder einer Änderung des Kommunikationsbereitschafts-Zustands und der gespeicherten ersten digitalisierten Daten automatisch die variablen Regeln (30) anzupassen und die angepassten Regeln in dem Speicher (260, 460) abzulegen.
  15. Vorrichtung nach einem der Ansprüche 13 oder 14, wobei die Vorverarbeitungseinheit (220) dazu ausgebildet ist, erste und/oder zweite digitalisierte Daten aus Eingabesignalen zu erstellen, die über einen vorgegebenen Zeitraum registriert werden.
  16. Vorrichtung nach Anspruch 15, wobei die Vorverarbeitungseinheit (220) dazu ausgebildet ist, die ersten und zweiten digitalisierten Daten aus ersten beziehungsweise zweiten Eingabesignalen zu erstellen, die über einen ersten beziehungsweise zweiten Zeitraum registriert werden, wobei der erste Zeitraum vor oder nach dem zweiten Zeitraum liegt oder der erste und zweite Zeitraum wenigstens teilweise übereinstimmen.
  17. Vorrichtung nach einem der Ansprüche 14 bis 16, wobei das Feststellen einer Änderung des durch Auswerten der zweiten digitalisierten Daten durch die Auswerteeinheit (240, 440) ermittelten Kommunikationsbereitschafts-Zustands des Benutzers das Anpassen der variablen Regeln (30) bewirkt.
  18. Vorrichtung nach einem der Ansprüche 13 bis 17, wobei die wenigstens eine erste Eingabeeinrichtung zumindest eine berührungslos wirkende Eingabeeinrichtung (1315, 17, 211, 212, 213a213d) umfasst.
  19. Vorrichtung nach einem der Ansprüche 13 bis 18, wobei die zweite Eingabeeinrichtung als manuell durch den Benutzer zu bedienende Eingabeeinrichtung (11, 12, 214) oder als Einrichtung zur Spracheingabe ausgebildet ist.
  20. Vorrichtung nach einem der Ansprüche 13 bis 19, wobei die Auswerteeinheit (240, 440) – zur Auswertung einer Maus-/Griffel-, Tastatur- oder Touchscreen-Eingabe (21, 22) und/oder – zum Ermitteln einer Laufzeitdifferenz akustischer, von einem Mikrofon-Array (13) generierter Signale und/oder – zur Spracherkennung akustischer Signale und/oder – zur Auswertung prosodischer Merkmale akustischer Signale (49) und/oder – zur Sprechererkennung akustischer Signale in Abhängigkeit hinterlegter Sprecherprofile und/oder – zur Bilderkennung eines von einer Kamera (14) aufgenommenen Bildes und/oder – zur Gesichtserkennung eines von einer Kamera (14) aufgenommenen Bildes in Abhängigkeit hinterlegter Gesichtsprofile und/oder – zum Auswerten von Signalen eines Näherungs- (15) oder Neigungssensors (16) ausgebildet ist.
  21. Vorrichtung nach einem der Ansprüche 13 bis 20, wobei im Speicher ein Grenzwert hinterlegt ist und die Auswerteeinheit (240, 440) zum Ermitteln eines Wahrscheinlichkeitswertes für das Vorliegen einer Kommunikationsbereitschaft und zum Vergleichen des ermittelten Wertes mit dem hinterlegten Grenzwert ausgebildet ist.
  22. Vorrichtung nach einem der Ansprüche 13 bis 21, wobei die Auswerteeinheit (240) in der Telekommunikationsendeinrichtung (200) angeordnet ist.
  23. Vorrichtung nach einem der Ansprüche 13 bis 22, wobei die Auswerteeinheit (440) in einer separaten Verarbeitungseinheit (400) angeordnet ist, die mittels einer Kommunikationsverbindung (330) mit der Telekommunikationsendeinrichtung (201) verbindbar ist.
  24. Vorrichtung nach einem der Ansprüche 13 bis 23, wobei die erste und/oder zweite Eingabeeinrichtung (211) als von der Telekommunikationsendeinrichtung (202) separate Eingabeeinheiten ausgebildet sind.
  25. Vorrichtung nach Anspruch 24, wobei die Eingabeeinheiten dazu ausgebildet sind, mit der Telekommunikationsendeinrichtung drahtlos zu kommunizieren.
  26. Vorrichtung nach einem der Ansprüche 13 bis 25, ausgebildet als öffentliches Telefon (202), ferner umfassend eine Ausgabeeinrichtung (252) zur Ausgabe von gerichteten akustischen Signalen.
  27. Vorrichtung nach Anspruch 26, wobei die Ausgabeeinrichtung (252) ein Ultraschall-Lautsprechersystem ist, das dazu ausgebildet ist, mittels eines modulierten Ultraschallsignals einen akustischen Strahl auf einen vorgegebenen Raumbereich zu richten.
DE102006058758.8A 2006-12-12 2006-12-12 Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung Expired - Fee Related DE102006058758B4 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102006058758.8A DE102006058758B4 (de) 2006-12-12 2006-12-12 Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006058758.8A DE102006058758B4 (de) 2006-12-12 2006-12-12 Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung

Publications (2)

Publication Number Publication Date
DE102006058758A1 DE102006058758A1 (de) 2008-06-19
DE102006058758B4 true DE102006058758B4 (de) 2018-02-22

Family

ID=39399547

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006058758.8A Expired - Fee Related DE102006058758B4 (de) 2006-12-12 2006-12-12 Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung

Country Status (1)

Country Link
DE (1) DE102006058758B4 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102011117289B4 (de) * 2011-10-31 2017-08-24 Volkswagen Ag Verfahren zum Betreiben einer mobilen Vorrichtung in einem Fahrzeug, Koppelvorrichtung, Fahrzeug sowie System
DE102016118007A1 (de) 2016-09-23 2018-03-29 Gira Giersiepen Gmbh & Co. Kg Verfahren für den Betrieb mindestens einer Gebäudegegensprechanlage und eine entsprechende Gebäudegegensprechanlage

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0141289A2 (de) * 1983-10-22 1985-05-15 Alcatel N.V. Teilnehmersprechstelleneinrichtung
US5255341A (en) * 1989-08-14 1993-10-19 Kabushiki Kaisha Toshiba Command input device for voice controllable elevator system
EP0930761A2 (de) * 1998-01-20 1999-07-21 Lucent Technologies Inc. Fernsprechstelle mit adaptiven Kurzwahl-Verfahren
US6263216B1 (en) * 1997-04-04 2001-07-17 Parrot Radiotelephone voice control device, in particular for use in a motor vehicle
EP1117076A2 (de) * 2000-01-13 2001-07-18 Ncr International Inc. Selbstbedienungsterminal
DE10130852A1 (de) * 2000-06-29 2002-05-29 Werner Maier Sprachgesteuertes Fernbedienungssystem für elektrische Geräte
DE10117654A1 (de) * 2001-04-09 2002-10-17 T Mobile Deutschland Gmbh Verfahren zum Steuern von Mobilfunkendgeräten
US20020152010A1 (en) * 2001-04-17 2002-10-17 Philips Electronics North America Corporation Automatic access to an automobile via biometrics
US20020167392A1 (en) * 2001-05-08 2002-11-14 Gene Williams Motion activated communication device
DE10251112A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren und System zur Spracherkennung
DE20221078U1 (de) * 2001-02-28 2004-12-23 Beckmann, Jürgen, Dr. Eingabevorrichtung, insbesondere für ein Mobiltelefon
US20050134117A1 (en) * 2003-12-17 2005-06-23 Takafumi Ito Interface for car-mounted devices
DE10156954B9 (de) * 2001-11-20 2005-07-14 Daimlerchrysler Ag Bildgestützte adaptive Akustik
DE102004029873B3 (de) * 2004-06-16 2005-12-29 Deutsche Telekom Ag Verfahren und Vorrichtung zur intelligenten Eingabekorrektur für automatische Sprachdialogsysteme

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0141289A2 (de) * 1983-10-22 1985-05-15 Alcatel N.V. Teilnehmersprechstelleneinrichtung
US5255341A (en) * 1989-08-14 1993-10-19 Kabushiki Kaisha Toshiba Command input device for voice controllable elevator system
US6263216B1 (en) * 1997-04-04 2001-07-17 Parrot Radiotelephone voice control device, in particular for use in a motor vehicle
EP0930761A2 (de) * 1998-01-20 1999-07-21 Lucent Technologies Inc. Fernsprechstelle mit adaptiven Kurzwahl-Verfahren
EP1117076A2 (de) * 2000-01-13 2001-07-18 Ncr International Inc. Selbstbedienungsterminal
DE10130852A1 (de) * 2000-06-29 2002-05-29 Werner Maier Sprachgesteuertes Fernbedienungssystem für elektrische Geräte
DE20221078U1 (de) * 2001-02-28 2004-12-23 Beckmann, Jürgen, Dr. Eingabevorrichtung, insbesondere für ein Mobiltelefon
DE10117654A1 (de) * 2001-04-09 2002-10-17 T Mobile Deutschland Gmbh Verfahren zum Steuern von Mobilfunkendgeräten
US20020152010A1 (en) * 2001-04-17 2002-10-17 Philips Electronics North America Corporation Automatic access to an automobile via biometrics
US20020167392A1 (en) * 2001-05-08 2002-11-14 Gene Williams Motion activated communication device
DE10156954B9 (de) * 2001-11-20 2005-07-14 Daimlerchrysler Ag Bildgestützte adaptive Akustik
DE10251112A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren und System zur Spracherkennung
US20050134117A1 (en) * 2003-12-17 2005-06-23 Takafumi Ito Interface for car-mounted devices
DE102004029873B3 (de) * 2004-06-16 2005-12-29 Deutsche Telekom Ag Verfahren und Vorrichtung zur intelligenten Eingabekorrektur für automatische Sprachdialogsysteme

Also Published As

Publication number Publication date
DE102006058758A1 (de) 2008-06-19

Similar Documents

Publication Publication Date Title
DE60036931T2 (de) Anwender-sprachschnittstelle für sprachgesteuerte systeme
EP1256936B1 (de) Verfahren zum Training oder zur Adaption eines Spracherkenners
EP0852051B1 (de) Verfahren zur automatischen steuerung eines oder mehrerer geräte durch sprachkommandos oder per sprachdialog im echtzeitbetrieb und vorrichtung zum ausführen des verfahrens
DE60217987T2 (de) Mobiltelefon mit Audio-moduliertem Vibrationsmodul
DE102018128006A1 (de) Natürlichsprachliche generierung basierend auf dem benutzersprachstil
DE102016103160B4 (de) Verfahren und Vorrichtung für eine Sprachsteuerungsbenutzerschnittstelle mit diskretem Betriebsmodus
DE102019111529A1 (de) Automatisierte spracherkennung unter verwendung einer dynamisch einstellbaren hörzeitüberschreitung
DE10251113A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE102018210534A1 (de) Vorrichtung und Verfahren zum Steuern eines Anwendungsprogramms unter Verwendung eines Sprachbefehls unter einer voreingestellten Bedingung
WO2002018897A1 (de) Sprachgesteuerte anordnung und verfahren zur spracheingabe und -erkennung
DE60212725T2 (de) Verfahren zur automatischen spracherkennung
DE10163213A1 (de) Verfahren zum Betrieb eines Spracherkennungssystems
DE102018103188A1 (de) Verbesserte Aufgabenerledigung bei der Spracherkennung
EP2373064B1 (de) Verfahren und Anordnung zur Sprachsteuerung von binaurales Hörgeräten
DE112018007242T5 (de) Datenverarbeitungsvorrichtung,Datenverarbeitungsverfahren, Programm undDatenverarbeitungssystem
EP2389753A1 (de) Konferenzsystem und zugeordnetes signalgebungsverfahren
DE102013208506A1 (de) Hierarchische Erkennung von Fahrzeugfahrer und Auswahlaktivierung von Fahrzeugeinstellungen auf der Grundlage der Erkennung
DE102018128003A1 (de) Neuronales netzwerk zum anwenden bei der spracherkennungsarbitrierung
CN101436404A (zh) 可会话的类生物装置及其会话方法
EP3873108A1 (de) Hörsystem mit mindestens einem im oder am ohr des nutzers getragenen hörinstrument sowie verfahren zum betrieb eines solchen hörsystems
DE102016217026A1 (de) Sprachsteuerung eines Kraftfahrzeugs
EP3396978B1 (de) Verfahren zum betrieb einer hörvorrichtung und hörvorrichtung
DE102017213249A1 (de) Verfahren und System zum Erzeugen einer auditiven Meldung in einem Innenraum eines Fahrzeugs
DE102006058758B4 (de) Verfahren und Vorrichtung zum Steuern einer Telekommunikationsendeinrichtung
DE102017213252A1 (de) Verfahren, Vorrichtung und Computerprogramm zum Variieren eines in einem Fahrzeug auszugebenden Audio-Inhalts

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
R012 Request for examination validly filed

Effective date: 20131115

R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R016 Response to examination communication
R018 Grant decision by examination section/examining division
R020 Patent grant now final
R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee