DE102005021524A1 - Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage - Google Patents

Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage Download PDF

Info

Publication number
DE102005021524A1
DE102005021524A1 DE102005021524A DE102005021524A DE102005021524A1 DE 102005021524 A1 DE102005021524 A1 DE 102005021524A1 DE 102005021524 A DE102005021524 A DE 102005021524A DE 102005021524 A DE102005021524 A DE 102005021524A DE 102005021524 A1 DE102005021524 A1 DE 102005021524A1
Authority
DE
Germany
Prior art keywords
characters
input
elements
output
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102005021524A
Other languages
English (en)
Inventor
Henry Feil
Ewald Frensch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE102005021524A priority Critical patent/DE102005021524A1/de
Publication of DE102005021524A1 publication Critical patent/DE102005021524A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

Offenbart sind ein Verfahren und eine Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage (MFG5). Dabei erfasst die akustische Eingabeeinrichtung (MIK) mehrere erste Sprachelemente nacheinander, von denen jedes ein Schriftzeichen repräsentiert. Eine Zeitmesseinrichtung (ZME) misst die zur Erfassung der Mehrzahl von ersten Sprachelementen vergangene Erfassungszeit. Schließlich berechnet eine Berechnungseinrichtung (BRE) eine Eingabegeschwindigkeit aus der Anzahl der erfassten ersten Sprachelemente pro Erfassungszeit. Mittels einer Erkennungseinrichtung (EKE) werden jeweilige Schriftzeichen von weiteren Sprachelementen ermittelt, wobei die ermittelten Schriftzeichen von einer akustischen Ausgabeeinrichtung (LS) nacheinander in einer Ausgabegeschwindigkeit akustisch ausgegeben werden, die von der eingabegeschwindigkeit abhängt. Somit ist eine Anpassung der Ausgabegeschwindigkeit individuell an einen Benutzer anpassbar.

Description

  • Die vorliegende Erfindung betrifft ein Verfahren und eine Vorrichtung zum Eingeben von Zeichen bzw. Schriftzeichen in eine Datenverarbeitungsanlage, sowie eine Datenverarbeitungsanlage, insbesondere in der Ausführung eines tragbaren elektronischen Geräts, welche eine Vorrichtung zum Eingeben von Schriftzeichen aufweist.
  • Die Miniaturisierung von tragbaren elektronischen Geräten, wie Mobiltelefonen oder Organizern, bringt eine Verringerung der Bedienungselemente mit sich, und führt teilweise bis zu einem vollkommenen Verzicht auf mechanische Tasten bzw. Tastaturen. Jedoch stellt sich dabei dann immer mehr das Problem der Eingabe von differenzierten Steueranweisungen, wie beispielsweise von Schriftzeichen bei einer Schrifteingabe. Bei größeren tragbaren Geräten ist hierzu herkömmlicher Weise ein berührungssensitives Display, ein so genannter "Touch Screen" vorgesehen, auf dem mittels eines speziellen Stifts Zeichen bzw. Schriftzeichen geschrieben werden können, welche dann mittels einer speziellen Schrifterkennungssoftware als Schriftzeichen oder Steueranweisungen erkannt werden. Bei kleineren tragbaren elektronischen Geräten, wie beispielsweise bei als Stift ausgebildeten Mobiltelefonen (sog. "Pen Phones"), welche zumeist ein kleines Display aufweisen, wird hingegen zum Eingeben von Schriftzeichen oder Steueranweisungen eine Bewegung eines Benutzers durch das tragbare elektronische Gerät erfasst. Die Erfassung der Bewegung kann dabei beispielsweise mittels optischer Sensoren, wie bei einer Computermaus oder mittels Beschleunigungssensoren erfolgen. In jedem Fall ist es auch hier notwendig, dass mit einer speziellen Schrifterkennungssoftware die entsprechenden Bewegungen als Schriftzeichen erkannt werden.
  • In jedem der gerade geschilderten Fälle kommt es jedoch vor, dass Schrifteingabeverfahren grundsätzlich das Problem haben, dass es zu Fehleingaben oder Falscherkennungen der Schriftzeichen kommen kann. Damit ein Benutzer eine Falscherkennung oder Fehleingabe erkennt, verfügen beispielsweise Mobiltelefone in der Ausführung eines Stifts über sog. "Text-zu-Sprache"-Systeme ("Text-to-Speech"-Systeme), bei denen der Benutzer die erkannten Schriftzeichen akustisch ausgegeben bekommt und somit ein Feedback bezüglich seiner Eingabe erhält. Genauer gesagt, wenn ein Benutzer ein Schriftzeichen eingegeben und das tragbare elektronische Gerät bzw. das Mobiltelefon das Zeichen erkannt hat, wird das erkannte Zeichen in Form eines Wortes über einen Audio-Kanal, (herkömmlicherweise dem Lautsprecher eines Mobiltelefons) vorgelesen. In der Regel ist jedoch die Schreibgeschwindigkeit von einem Benutzer zu dem nächsten Benutzer sehr unterschiedlich, wobei die Ausgabe der erkannten Schriftzeichen gewöhnlicher Weise immer mit der gleichen Geschwindigkeit erfolgt.
  • Diese Ausgabe mit gleicher Geschwindigkeit hat jedoch den Nachteil, dass insbesondere bei Benutzern, die Schriftzeichen mit hoher Eingabegeschwindigkeit eingeben, der Zeitpunkt der Eingabe des Schriftzeichens und der Zeitpunkt der Ausgabe des akustischen Feedbacks zeitlich weit auseinander liegen und somit von dem Benutzer eine große Erinnerungsleistung abverlangt wird, wenn er die eingegebenen Schriftzeichen auf deren Richtigkeit überprüfen muss.
  • Somit ist es die Aufgabe der vorliegenden Erfindung, eine Möglichkeit zur Eingabe von Schriftzeichen zu schaffen, bei der eine einfache Überprüfung der eingegebenen Schriftzeichen möglich ist.
  • Diese Aufgabe wird durch die unabhängigen Ansprüche gelöst. Vorteilhafte Ausgestaltungen der Erfindung sind Gegenstand der Unteransprüche.
  • Dabei umfasst ein Verfahren zum Eingeben von Zeichen bzw. Schriftzeichen in eine Datenverarbeitungsanlage folgende Schritte. Es wird zunächst eine Mehrzahl von ersten Sprachelementen nacheinander erfasst, von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen repräsentiert. Das bedeutet, es können Sprachelemente mit nur einzelnen Buchstaben oder einzelnen Ziffern, aber auch Sprachelemente mit mehreren Zeichen, welche zusammen beispielsweise ein Wort (einer Sprache) repräsentieren, erfasst werden. Nun wird die zur Erfassung der Mehrzahl von Sprachelementen benötigte bzw. vergangene Erfassungszeit bestimmt. Anschließend wird eine Eingabegeschwindigkeit aus der Anzahl der erfassten ersten Sprachelemente pro Erfassungszeit berechnet. Beispielsweise wird hierzu eine bestimmte Anzahl gerade erfasster Sprachelemente genommen, und für diese bestimmte Anzahl die benötigte Erfassungszeit bestimmt. Die Eingabegeschwindigkeit kann dann als ein Quotient aus der Anzahl der erfassten ersten Sprachelemente und der dafür benötigten Erfassungszeit berechnet werden. Die bis hierher durchgeführten Verfahrensschritte dienen mehr oder weniger zur Bestimmung der individuellen Sprach- oder Eingabegeschwindigkeit eines gerade aktuellen Benutzers. Nun werden ein oder mehrere weitere Sprachelemente erfasst, von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen repräsentiert. Aus den erfassten Sprachelementen werden dann die jeweiligen Schriftzeichen ermittelt, wobei die Ermittlung der jeweiligen Schriftzeichen dabei mittels speziellen Spracherkennungs-Verfahren erfolgt, welche üblicherweise mittels spezieller Software realisiert sind. Sind die Schriftzeichen ermittelt, so werden diese in einem nächsten Schritt nacheinander in einer Ausgabegeschwindigkeit ausgegeben, die von der Eingabegeschwindigkeit, welche zuvor berechnet worden ist, abhängt. Das bedeutet, durch das Lernen der individuellen Eingabegeschwindigkeit eines aktuellen Benutzers im ersten Teil des Verfahrens ist es möglich, die Sprachausgabe zur Überprüfung der Eingabe an die individuelle Eingabegeschwindigkeit des Benutzers anzupassen. Folglich laufen der Zeitpunkt der Eingabe und der Zeitpunkt der akustischen Ausgabe zeitlich nicht oder nicht stark aus einander. Die somit als Eingabe-Feedback gedachte akustische Sprachausgabe der erkannten Schriftzeichen korreliert nun unmittelbar mit der Eingabe und der Benutzer hat somit eine unmittelbare Kontrolle (er benötigt keine große Erinnerungsleistung, um die zuvor getätigte Eingabe überprüfen zu können). Des Weiteren hat die Anpassung der Sprachausgabegeschwindigkeit an die Eingabegeschwindigkeit von Sprachelementen bzw. Schriftzeichen eines Benutzers den Vorteil, dass gerade ein Benutzer, der eine Eingabe mit hoher Geschwindigkeit durchführt, nicht erst lange warten muss, bis die akustische Sprachausgabe der erkannten Schriftzeichen beendet ist, sondern quasi unmittelbar nach der Eingabe eine eingegebenen Folge von Schriftzeichen beispielsweise zur Verwendung in einer bestimmten Applikationen oder zur Übertragung an die Datenverarbeitungsanlage verwenden kann.
  • Wie gerade erwähnt, werden als akustisches Feedback die ermittelten Schriftzeichen nacheinander akustisch ausgegeben. Dabei können die ermittelten Schriftzeichen einzeln nacheinander ausgegeben werden, was vorteilhaft bei einer Folge von Ziffern ist. Es ist jedoch auch möglich, dass die ermittelten Schriftzeichen zu einer Folge von Zeichen zusammengesetzt werden, die sich nach der Reihenfolge des Erfassens der Sprachelemente bestimmt. Anschließend können innerhalb der Folge von Zeichen Wörter erkannt werden, wobei dann die erkannten Wörtern akustisch ausgegeben werden.
  • Gemäß einem weiteren Aspekt der Erfindung wird eine Vorrichtung zum Eingeben von Schriftzeichen in eine Datenverarbeitungsanlage geschaffen. Die Vorrichtung umfasst dabei eine Sensoreinrichtung zum Erfassen von Sprachelementen nacheinander, von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen repräsentiert. Des Weiteren umfasst die Vorrichtung eine Zeitmesseinrichtung zum Messen der zur Erfassung einer Mehrzahl von ersten Sprachelementen vergangenen bzw. benötigten Erfassungszeit. Außerdem ist eine Berechnungseinrichtung zum Berechnen einer Eingabegeschwindigkeit aus der Anzahl der erfassten ersten Sprachelemente pro Erfas sungszeit vorgesehen. Während die Sensoreinrichtung zum einen dafür dient, erste Sprachelemente zu erfassen, um anhand der Dauer zu deren Erfassung die Eingabegeschwindigkeit abzuleiten, dient die Sensoreinrichtung ferner dafür, weitere Sprachelemente zu erfassen. Schließlich ist eine Erkennungseinrichtung zum Ermitteln der jeweiligen Schriftzeichen aus den weiteren erfassten Sprachelementen vorgesehen. Eine akustische Ausgabeneinrichtung dient dann zum akustischen Ausgeben der jeweiligen ermittelten Sätze von Schriftzeichen nacheinander in einer Ausgabegeschwindigkeit, die von der Eingabegeschwindigkeit abhängt.
  • Gemäß einem weiteren Aspekt der Erfindung wird eine Datenverarbeitungsanlage geschaffen, welche eine gerade beschriebene Vorrichtung zum Eingeben von Schriftzeichen umfasst. Die Datenverarbeitungsanlage kann dabei als ein tragbares elektronisches Gerät ausgebildet sein. Insbesondere kann sie als ein Mobilfunkgerät oder Mobiltelefon, aber auch als ein kleiner tragbarer Computer beispielsweise in der Ausführung eines Organizers oder PDA (PDA: Personal Digital Assistant) ausgebildet sein.
  • Bevorzugte Ausführungsformen der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
  • 1 eine Zeitstruktur, in der die einzelnen Ereignislinien zum Eingeben von Schriftzeichen verschiedener Benutzer und zum akustischen Ausgeben der erkannten Schriftzeichen dargestellt sind;
  • 2 eine schematische Darstellung des Verfahrens zum Anpassen der Ausgabegeschwindigkeit des akustischen Feedbacks an einen bestimmten Benutzer;
  • 3 eine Zeitstruktur mit Ereignislinien zur Erläuterung der Eingabe von Schriftzeichen und der Ausgabe der erkannten Schriftzeichen in einer Ausgabege schwindigkeit, welche an die Eingabegeschwindigkeit eines ersten Benutzers angepasst ist;
  • 4 eine Zeitstruktur mit Ereignislinien zur Erläuterung der Eingabe von Schriftzeichen und der Ausgabe von erkannten Schriftzeichen mit einer Geschwindigkeit, die an die Eingabegeschwindigkeit eines zweiten Benutzers angepasst ist;
  • 5 eine Datenverarbeitungsanlage in der Form eines Mobiltelefons gemäß einer ersten Ausführungsform zur Eingabe von Schriftzeichen;
  • 6 eine Datenverarbeitungsanlage in der Form eines Mobiltelefon gemäß einer zweiten Ausführungsform zur Eingabe von Schriftzeichen;
  • 7 eine Datenverarbeitungsanlage in der Form eines Mobiltelefons gemäß einer dritten Ausführungsform zur Eingabe von Schriftzeichen;
  • 8 eine Datenverarbeitungsanlage in der Form eines Mobiltelefon gemäß einer vierten Ausführungsform zur Eingabe von Schriftzeichen;
  • 9 eine Datenverarbeitungsanlage in der Form eines Mobiltelefons gemäß einer fünften Ausführungsform zur Eingabe von Schriftzeichen.
  • Bevor nun ein Verfahren zum Eingeben von Zeichen bzw. Schriftzeichen und zur Anpassung der Ausgabegeschwindigkeit des akustischen Feedbacks der eingegebenen Schriftzeichen anhand der 1 bis 4 erläutert werden wird, soll zunächst eine mögliche Vorrichtung zum Eingeben von Schriftzeichen anhand der 5 bis 9 erläutert werden.
  • Dabei sei zunächst auf 5 verwiesen, in der ein Mobiltelefon MFG1 gezeigt ist. Das Mobiltelefon MFG1 weist eine her kömmliche Form in der Gestalt eines Quaders auf. Es hat eine akustische Ausgabeeinrichtung mit einem Lautsprecher LS. Die akustische Ausgabeeinrichtung dient hier als sog. "Text-zu-Sprache"-System ("Text-zu-Speach"-System). Ferner hat das Mobiltelefon eine akustische Eingabeeinrichtung mit einem Mikrofon MIK. Des Weiteren hat es eine Tastatur TAS mit mehreren Tasten zum Eingeben von Steueranweisungen. Unterhalb des Lautsprechers LS ist eine Anzeigeeinrichtung DSP angeordnet, die einen berührungssensitiven Bildschirm aufweist. Dieser berührungssensitive Bildschirm stellt dabei einen Berührungssensor BS dar. Mit einem Stift STI ist es dann möglich, durch Nachfahren von Schriftzeichen, während die Spitze des Stifts STI mit der Anzeigeeinrichtung DSP in Berührung steht, Handschriftelemente, welche ein oder mehrere Schriftzeichen repräsentieren, einzugeben. Dabei kann ein Benutzer beispielsweise die Spitze des Stifts STI auf die Anzeigeeinrichtung DSP aufsetzen, und eine Bewegung durchführen, die der Ziffer "0" oder "1" entspricht, wobei die von dem Berührungssensor BS erfasste Bewegungskurve der Stiftspitze an eine Erkennungseinrichtung EKE weitergeleitet wird, die dafür eingerichtet ist, aus den erfassten Bewegungen der Stiftspitze, d.h. den Handschriftelementen, die jeweiligen Schriftzeichen zu ermitteln. Die Erkennungseinrichtung EKE dient ferner dazu, erkannte Schriftzeichen oder Sätze von Schriftzeichen in eine Folge von Schriftzeichen einzureihen, nämlich in der Reihenfolge des Erfassens der den Schriftzeichen zugeordneten Handschriftelementen. Wie es noch später bzgl. den 1 bis 4 erläutert werden wird, dient eine Zeitmesseinrichtung ZME zum Messen der zur Erfassung einer Mehrzahl von ersten Handschriftelementen vergangenen Erfassungszeit, und dient eine Berechnungseinrichtung BRE zum Berechnen einer Eingabegeschwindigkeit aus der Anzahl der erfassten ersten Handschriftelemente pro Erfassungszeit. Anhand der berechneten Eingabegeschwindigkeit ist die akustische Ausgabeeinrichtung in der Lage, die jeweiligen ermittelten Schriftzeichen nacheinander in einer Ausgabegeschwindigkeit auszugeben, die von der Eingabegeschwindigkeit abhängt.
  • Es sei nun auf 6 verwiesen, in der eine Vorrichtung zum Eingeben von Schriftzeichen in der Form eines als Stift ausgebildeten Mobiltelefons MFG2 gezeigt ist. Das Mobiltelefon MFG2 umfasst im Wesentlichen die gleichen Komponenten mit gleicher Funktion wie das Mobiltelefon MFG1, weshalb für eine ausführliche Erläuterung gleicher Komponenten auf die Erläuterung bezüglich des Mobiltelefons MFG1 verwiesen wird. Auf Grund der Ausbildung des Mobiltelefons MFG2 als ein Stift ist die Anzahl der Tasten zur Bedienung des Mobiltelefons sehr reduziert. So ist beispielsweise in 6 lediglich eine Tastatur TAS1 mit zwei Tasten gezeigt. Als weiterer Unterschied zum Mobiltelefon MFG1 umfasst das Mobiltelefon MFG2 anstatt des Berührungssensor BS einen optischen Sensor OS, der im Spitzenabschnitt des Mobiltelefons vorgesehen ist. Der optische Sensor OS, der eine optische Kamera umfasst, dient dazu, in äquidistanten Zeitschritten Bilder einer Oberfläche OF aufzunehmen und mit jeweils vorhergehenden aufgenommenen Bildern zu vergleichen, um daraus Bewegungsvektoren der Spitze des Mobiltelefons MFG2, welches sich über die Oberfläche OF bewegt, zu berechnen. Anhand der Bewegungsvektoren lassen sich schließlich Positionspunkte berechnen, die dann zu einer Bewegungskurve oder Ortskurve zusammengefasst werden können. Die von dem optischen Sensor OS ermittelte Bewegungskurve der Spitze des Mobiltelefon MFG2 wird dann wiederum der Erkennungseinrichtung EKE zugeführt, die anhand der Bewegungskurve die den Bewegungskurven zugeordneten Schriftzeichen ermittelt. Entsprechend wird die Zeitmesseinrichtung ZME eine Erfassungszeit ermitteln, die zum Erfassen einer Mehrzahl von ersten Handschriftelementen benötigt worden ist. Gemäß einer vorteilhaften Ausgestaltung ist es dabei möglich, dass eine der Tasten der Tastatur TAS1 dazu verwendet wird, um den Beginn bzw. das Ende der Erfassung eines Schriftzeichens anzuzeigen. So ist es beispielsweise möglich, dass zu Beginn der Erfassung eines Schriftzeichens eine der Tasten der Tastatur TAS1 gedrückt wird, und solange gedrückt gehalten wird, bis die Erfassung des Schriftzeichens beendet wird. Aus dem Zeitintervall, in dem eine der Tasten der Tastatur TAS1 gedrückt gehalten wird, kann die Zeitmesseinrichtung ZME dann die Er fassungszeit für ein Schriftzeichen ermitteln. Es ist jedoch auch möglich, eine der Tasten der Tastatur TAS1 zu Beginn der Erfassung von Schriftzeichen zu drücken, und dann nach Beendigung der Erfassung von Schriftzeichen ein weiteres Mal zu drücken. Somit kann gemäß dieser Ausgestaltung die Zeitmesseinrichtung ZME das Zeitintervall zwischen dem ersten Drücken und dem weiteren Drücken einer der Tasten der Tastatur TAS1 als Erfassungszeit für ein oder mehrere Schriftzeichen messen. Eine entsprechende Funktion einer der Tasten der Tastatur TAS1 in Verbindung mit der Zeitmesseinrichtung ZME ist auch auf die Mobiltelefone MFG3 und MFG4 der 7 und 8 anwendbar. Wie schon bereits bzgl. 5 erwähnt, wird die Funktion der Berechnungseinrichtung BRE später bzgl. den 1 bis 4 näher erläutert werden.
  • Es sei nun auf 7 verwiesen, in der eine weitere Vorrichtung zum Eingeben von Schriftzeichen in der Form eines als Stift ausgebildeten Mobiltelefons MFG3 gezeigt ist. Das Mobiltelefon MFG3 entspricht im Aufbau im wesentlichen dem Mobiltelefon MFG2, weshalb zur Erläuterung gleicher Komponenten auf die Erläuterung des Mobiltelefons MFG2 verwiesen wird. Der wesentliche Unterschied des Mobiltelefons MFG3 liegt nun darin, dass dieses an Stelle des optischen Sensors OS bei dem Mobiltelefon MFG2 einen Berührungssensor BS1 aufweist. Dieser kann beispielsweise eine drehbar gelagerte Kugel an der Spitze des Mobiltelefons MFG3 aufweisen, deren Drehung dann messbar ist, wenn die Kugel bzw. der Berührungssensor BS1 bei Kontakt mit der Oberfläche OF über diese hinweg bewegt wird. Anhand der erfassten Drehung ist dann die Bewegung der Spitze des Mobiltelefons MFG3 über die Oberfläche OF hinweg erfassbar. Wird mit der Spitze ein Schriftzeichen beschrieben, so kann dies der Berührungssensor BS1 erfassen, in eine Bewegungskurve oder Ortskurve umwandeln und diese Bewegungskurve der Erkennungseinrichtung EKE zuführen. Wie schon anhand der anderen Ausführungsformen erläutert, ist die Erkennungseinrichtung EKE dann in der Lage, anhand der Bewegungskurve das jeweilige Schriftzeichen zu erkennen.
  • Schließlich sei noch auf 8 verwiesen, in der eine weitere Vorrichtung zum Eingeben von Schriftzeichen in der Form eines als Stift ausgebildeten Mobiltelefons MFG4 gezeigt ist. Dabei stimmt das Mobiltelefon MFG4 wieder im Wesentlichen mit den Mobiltelefonen MFG2 und MFG3 überein, weshalb zur Erläuterung gleicher Komponenten auf die oben erläuterten Mobiltelefone verwiesen wird. Kennzeichen des Mobiltelefons MFG4 ist, dass dieses zur Erfassung von Bewegungen nun einen Gyrosensor oder Beschleunigungssensor GS im Spitzenabschnitt des Telefons aufweist. Dieser Gyrosensor hat mindestens zwei Sensorabschnitte, vorteilhafter Weise jedoch drei Sensorabschnitte zum Erfassen von Beschleunigungen in zwei, vorteilhafter Weise in drei Dimensionen. Das bedeutet, wird das Mobiltelefon MFG4 bzw. dessen Spitzenabschnitt, in dem sich der Beschleunigungssensor GS befindet, über die Oberfläche OF hinweg bewegt, um beispielsweise Schriftzeichen zu beschreiben, so erfasst der Beschleunigungssensor GS die an der Spitze des Mobiltelefons MFG4 auftretenden Beschleunigungen. Durch zweifache Integration der Beschleunigungsdaten über die Zeit lässt sich eine Bewegungskurve bzw. Ortskurve der Bewegung der Spitze des Mobiltelefons MFG4 berechnen. Diese Ortskurve wird dann wiederum der Erkennungseinrichtung EKE zugeführt, die aus der Bewegungskurve ein Schriftzeichen oder mehrere Schriftzeichen ermittelt.
  • Es sei nun auf 9 verwiesen, in der eine weitere Vorrichtung zum Eingeben von Schriftzeichen gemäß einem weiteren Aspekt der Erfindung gezeigt ist. Während die Mobiltelefone MFG1 bis MFG4 darauf basierten, Schriftzeichen derart einzugeben, dass eine Bewegung eines Benutzers, mit welcher ein Schriftzeichen beschrieben wird, erfasst wird, ist das Mobiltelefon MFG5 dafür ausgelegt, Sprachelemente eines Benutzers zu erfassen, von denen jedes ein Schriftzeichen oder einen Satz bestehend aus zumindest einem Schriftzeichen repräsentiert. Ähnlich dem Mobiltelefon MFG1 umfasst das Mobiltelefon MFG5 eine Anzeigeeinrichtung DSP zum Anzeigen von grafischen Symbolen bzw. Schriftzeichen, sowie eine Tastatur TAS zum Bedienen des Mobiltelefons. Im Gegensatz zu den Mobiltelefonen MFG1 bis MFG4 besitzt das Mobiltelefon MFG5 jedoch keinen Sensor bzw. keine Sensoreinrichtung zum Erfassen von Handschriftelementen. Dafür hat das Mobiltelefon MFG5 eine akustische Eingabeeinrichtung mit einem Mikrofon MIK zum Erfassen von Sprachelementen nacheinander, von denen jedes ein Schriftzeichen bzw. einen Satz bestehend aus zumindest einem Schriftzeichen repräsentiert. Entsprechend dient nun die Zeitmesseinrichtung ZME zum Messer der zur Erfassung einer Mehrzahl von ersten Sprachelementen vergangenen Erfassungszeit, und dient eine Berechnungseinrichtung BRE zum Berechnen eine Eingabegeschwindigkeit aus der Anzahl der erfassten ersten Sprachelemente pro Erfassungszeit. Eine Erkennungseinrichtung EKE dient zum Ermitteln der jeweiligen Schriftzeichen oder Sätze von Schriftzeichen weiterer erfasster Sprachelemente, wobei eine akustische Ausgabeeinrichtung mit Lautsprechern LS dafür eingerichtet ist, die jeweiligen ermittelten Schriftzeichen oder Sätze von Schriftzeichen nacheinander in einer Ausgabegeschwindigkeit auszugeben, die von der Eingabegeschwindigkeit abhängt. Wie es in 9 zu sehen ist, sind die Lautsprecher LS als Ohrhörer ausgebildet, und dienen zusammen mit dem Mikrofon MIK als eine Art Freisprecheinrichtung. Insbesondere die Ausbildung der Lautsprecher LS als Ohrhörer ist dabei vorteilhaft, da somit eine Schallübertragung der Lautsprecher LS zum Mikrofon stark reduziert bzw. verhindert wird.
  • Nach der grundsätzlichen Erläuterung des Aufbaus einer möglichen Vorrichtung zum Erfassen von Schriftzeichen soll nun anhand der 1 bis 4 ein Verfahren zum Erfassen von Schriftzeichen bzw. zur Anpassung der Ausgabegeschwindigkeit der akustischen Rückmeldung erläutert werden.
  • 1 zeigt dabei in schematischer Form das Problem einer adäquaten Rückmeldung bei der Eingabe von Schriftzeichen von verschiedenen Benutzern mit verschiedenen Eingabegeschwindigkeiten. In einer ersten "Schrifteingabe"-Zeitlinie oder "Schrifteingabe"-Ereignislinie soll veranschaulicht werden, dass ein erster Benutzer die Ziffern SZ, nämlich "0", "1", "2", und "3" in jeweiligen ersten Zeitintervallen T1E eingibt. Es sei dabei erwähnt, dass die Zeit von links nach rechts voranschreitet. Entsprechend gibt ein zweiter Benutzer gemäß der zweiten "Schrifteingabe"-Zeitlinie die vier Ziffern SZ, nämlich "0", "1", "2", und "3" in jeweiligen Zeitintervallen T2E nacheinander ein, wobei ein jeweiliges Zeitintervall T2E größer als ein Zeitintervall T1E ist. Die Eingabe eines Schriftzeichens kann durch einen der Sensoren zur Erfassung einer Bewegung eines Benutzers gemäß den Mobiltelefonen MFG1 bis MFG4 erfolgen, oder kann durch Eingabe von Sprachelementen, welche ein oder mehrere Schriftzeichen repräsentieren, gemäß dem Mobiltelefon MFG5 erfolgen. Wichtig zu erkennen ist jedoch, dass die Eingabe von Schriftzeichen durch die verschiedenen Benutzer mit einer unterschiedlichen Geschwindigkeit erfolgt, wo hingegen eine in einer dritten "Sprachausgabe"-Ereignislinie dargestellte Sprachausgabe von Wörtern ESZ, die erkannte Zeichen oder Ziffern repräsentieren, immer mit gleicher Geschwindigkeit erfolgt, d.h. für jedes ausgegebene Sprachelement benötigt die akustische Sprachausgabeeinrichtung eines Mobiltelefons ein Zeitintervall T0A. Es ist dabei zu berücksichtigen, dass ein jeweiliges erfasstes bzw. eingegebenes Schriftzeichen SZ eines Benutzers zunächst einer Erkennungseinrichtung (entsprechend einer Erkennungseinrichtung EKE eines der Mobiltelefone MFG1 bis MFG5) zugeführt werden muss, wobei die Erkennungseinrichtung das hinter einem Handschriftelement oder Sprachelement stehende Schriftzeichen ermitteln muss und anschließend der akustischen Sprachausgabeeinrichtung zur akustischen Ausgabe übermitteln muss. Jedoch ist zu erkennen, dass insbesondere im Falle des ersten Benutzers, der seine Zeichen mit vergleichsweise hoher Geschwindigkeit eingibt, die akustische Rückmeldung in Form der Sprachausgabe hinterherhinkt, so dass beim Benutzer 1 eine immer größere gedankliche Erinnerungsleistung erforderlich ist, um gleichzeitig Zeichen einzugeben und die akustische Rückmeldung der eingegebenen Schriftzeichen zu verfolgen.
  • Somit wird gemäß 2 eine Anpassung der Ausgabegeschwindigkeit der akustischen Rückmeldung an die Eingabegeschwindigkeit bei der Erfassung von Schriftzeichen vorgeschlagenen. In Schritt S1 werden dabei zunächst eine Anzahl N von Schriftzeichen erfasst (entweder in der Form von Handschriftelementen oder von Sprachelementen). Eine derartige Erfassung ist beispielsweise in den 3 und 4 bezüglich der jeweiligen ersten "Schrifteingabe"-Ereignislinie gezeigt.
  • Anschließend wird in einem Schritt S2 die jeweilige Zeit oder Erfassungszeit bestimmt, die für die Eingabe der gerade eingegebenen Schriftzeichen benötigt worden ist. Bei Betrachtung von 3 erkennt man, dass der Benutzer 1 zur Eingabe seiner vier Ziffern bzw. Zeichen die Erfassungszeit T1R benötigt hat, während der Benutzer 2 zur Eingabe seiner vier Ziffern die Erfassungszeit T2R benötigt hat.
  • In einem Schritt S3 in wird nun die Anzahl N der Zeichen ermittelt, die während der jeweiligen Erfassungszeit erfasst worden sind. Wie bereits erwähnt, wurden während der jeweiligen Erfassungszeiten T1R und T2R jeweils vier Zeichen erfasst.
  • In einem Schritt S4 wird nun die Eingabegeschwindigkeit der jeweiligen Benutzer 1 und 2 bestimmt. Dabei berechnet sich die Eingabegeschwindigkeit V1R des Benutzers 1 aus dem Quotienten von der Anzahl der Zeichen N geteilt durch die Erfassungszeit T1R. Entsprechend berechnet sich die Eingabegeschwindigkeit V2R des Benutzers 2 ist aus dem Quotienten von der Anzahl der Zeichen N geteilt durch die Erfassungszeit T2R. Das bedeutet, aus einer Mehrzahl von gerade eingegebenen Zeichen (hier N) wird die für einen jeweiligen Benutzer individuelle Eingabegeschwindigkeit berechnet, um diese für die Ausgabe der folgenden Zeichen zu berücksichtigen. Anders ausgedrückt, wird eine Vorrichtung gemäß einer bevorzugten Ausführungsform der Erfindung durch eine bestimmte Anzahl von Schriftzeichen trainiert, so kann sie ihre Ausgabegeschwindigkeit bei der akustischen Rückmeldung an einen jeweiligen Benutzer anpassen. Während im Beispiel ein Training anhand der letzten vier erfassten Schriftzeichen erfolgt ist, ist auch ein Training anhand der letzten zehn oder zwanzig oder einer beliebigen ersten Anzahl von Schriftzeichen möglich.
  • Nach erfolgtem Training zur Anpassung an die individuelle Eingabegeschwindigkeit eines Benutzers werden nun weitere M Schriftzeichen eines Benutzers erfasst. Geht man zur Vereinfachung der Darstellung davon aus, dass wieder entsprechend den jeweiligen ersten Ereignislinien der 3 und 4 die Ziffern "0", "1", "2" und "3" mit jeweiligen benutzerspezifischen Eingabegeschwindigkeiten V1R und V2R erfasst worden sind, so erfolgt die akustische Sprachausgabe bzw. Rückmeldung gemäß den jeweiligen zweiten Ereignislinien in den 3 und 4 mit Ausgabegeschwindigkeiten V1A bzw. V2A, die von den jeweiligen Eingabegeschwindigkeiten V1R und V2R abhängen. Im vorliegenden Beispiel entspricht die Ausgabegeschwindigkeit V1A der Eingabegeschwindigkeit V1R und entspricht die Ausgabegeschwindigkeit V2A der Eingabegeschwindigkeit V2R. Anderes ausgedrückt, die jeweiligen Zeitintervalle T1A und T2A entsprechen den jeweiligen Eingabezeitintervallen T1E und T2E. Es ist jedoch möglich, dass auf Grund der Tatsache, dass eingegebene Schriftzeichens zunächst mittels der Erkennungseinrichtung ermittelt werden müssen, sich die akustische Sprachausgabe bzw. Rückmeldung um einen kleinen zeitlichen Betrag verschiebt oder hinterherhinkt. Auf Grund der Tatsache, dass nun die Eingabe und Ausgabe von Schriftzeichen kaum mehr auseinander fallen, muss der Benutzer keine große gedankliche Erinnerungsleistung mehr vollbringen, um die akustische Rückmeldung von erfassten Zeichen zu überprüfen. Er verliert somit seltener den Überblick bei der Eingabe von Schriftzeichen, was die Zuverlässigkeit der Überprüfung von Schriftzeichen durch die akustische Rückmeldung erhöht.

Claims (8)

  1. Verfahren zum Eingeben von Schriftzeichen in eine Datenverarbeitungsanlage (MFG5), mit folgenden Schritten: – Erfassen einer Mehrzahl von ersten Sprachelementen (SPE; N) nacheinander, von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen (SZ) repräsentiert; – Bestimmen der zur Erfassung der Mehrzahl von ersten Sprachelementen (SPE; N) vergangenen Erfassungszeit (T1R, T2R); – Berechnen einer Eingabegeschwindigkeit (V1R, V2R) aus der Anzahl (N) der erfassten ersten Sprachelemente pro Erfassungszeit (T1R, T2R); – Erfassen weiterer Sprachelemente (SPE; M), von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen (SZ) repräsentiert; – Ermitteln der jeweiligen Sätze von Schriftzeichen der weiteren Sprachelemente; – Akustisches Ausgeben der jeweiligen ermittelten Sätze von Schriftzeichen nacheinander in einer Ausgabegeschwindigkeit (V1A, V2A), die von der Eingabegeschwindigkeit (V1R, V2R) abhängt.
  2. Verfahren nach Anspruch 1, bei dem die aus den weiteren Sprachelementen ermittelten Schriftzeichen zu einer Folge von Zeichen zusammengesetzt werden, die sich nach der Reihenfolge des Erfassens der Handschriftelemente bestimmt.
  3. Verfahren nach Anspruch 2, bei dem innerhalb der Folge von Zeichen Wörter erkannt werden.
  4. Verfahren nach Anspruch 3, bei dem bei der akustischen Ausgabe die erkannten Wörter als Wörter ausgegeben werden.
  5. Vorrichtung zum Eingeben von Schriftzeichen in eine Datenverarbeitungsanlage (MFG5), mit folgenden Merkmalen: – eine akustische Eingabeeinrichtung (MIK) zum Erfassen von Sprachelementen (SPE; N) nacheinander, von denen jedes einen Satz bestehend aus zumindest einem Schriftzeichen (SZ) repräsentiert; – eine Zeitmesseinrichtung (ZME) zum Messen der zur Erfassung einer Mehrzahl (N) von ersten Sprachelementen (SPE) vergangenen Erfassungszeit (T1R, T2R); – einer Berechnungseinrichtung (BRE) zum Berechnen einer Eingabegeschwindigkeit (V1R, V2R) aus der Anzahl (N) der erfassten ersten Sprachelemente pro Erfassungszeit (T1R, T2R); – einer Erkennungseinrichtung (EKE) zum Ermitteln der jeweiligen Schriftzeichen (SZ) weiterer erfasster Sprachelemente (SPE; M); – einer akustischen Ausgabeeinrichtung (LS) zum akustischen Ausgeben der jeweiligen ermittelten Sätze von Schriftzeichen (ESZ) nacheinander in einer Ausgabegeschwindigkeit (V1A, V2A), die von der Eingabegeschwindigkeit (V1R, V2R) abhängt.
  6. Datenverarbeitungsanlage mit einer Vorrichtung zum Eingeben von Schriftzeichen nach Anspruch 5.
  7. Datenverarbeitungsanlage nach Anspruch 6, die als ein tragbares elektronisches Gerät (MFG5) ausgebildet ist.
  8. Datenverarbeitungsanlage nach Anspruch 7, die als ein Mobilfunkgerät (MFG5) oder ein tragbares Computer ausgebildet ist.
DE102005021524A 2005-05-10 2005-05-10 Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage Withdrawn DE102005021524A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102005021524A DE102005021524A1 (de) 2005-05-10 2005-05-10 Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005021524A DE102005021524A1 (de) 2005-05-10 2005-05-10 Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage

Publications (1)

Publication Number Publication Date
DE102005021524A1 true DE102005021524A1 (de) 2006-11-16

Family

ID=37295261

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005021524A Withdrawn DE102005021524A1 (de) 2005-05-10 2005-05-10 Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage

Country Status (1)

Country Link
DE (1) DE102005021524A1 (de)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3240386A1 (de) * 1982-11-02 1984-05-03 Horst 2055 Aumühle Habermann Verfahren zur akustischen identifikation der von einzeltasten eines tastenfeldes insbesondere von schreibmaschinen od.dgl. auf informationswiedergabemittel oder mittels informationsuebertragungseinrichtungen uebertragbaren symbole und eine vorr. zur durchf. d.verfahrens
JPH10224898A (ja) * 1997-01-31 1998-08-21 Sanyo Electric Co Ltd 補聴器
DE69421774T2 (de) * 1993-09-10 2000-08-10 Hitachi, Ltd. Verfahren und Vorrichtung zur Geschwindigkeitskonversion von Sprache
US20010032072A1 (en) * 2000-03-13 2001-10-18 Akira Inoue Apparatus and method for converting reproducing speed
DE10309834A1 (de) * 2003-03-05 2004-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Wiedergabe gesprochener Informationen

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3240386A1 (de) * 1982-11-02 1984-05-03 Horst 2055 Aumühle Habermann Verfahren zur akustischen identifikation der von einzeltasten eines tastenfeldes insbesondere von schreibmaschinen od.dgl. auf informationswiedergabemittel oder mittels informationsuebertragungseinrichtungen uebertragbaren symbole und eine vorr. zur durchf. d.verfahrens
DE69421774T2 (de) * 1993-09-10 2000-08-10 Hitachi, Ltd. Verfahren und Vorrichtung zur Geschwindigkeitskonversion von Sprache
JPH10224898A (ja) * 1997-01-31 1998-08-21 Sanyo Electric Co Ltd 補聴器
US20010032072A1 (en) * 2000-03-13 2001-10-18 Akira Inoue Apparatus and method for converting reproducing speed
DE10309834A1 (de) * 2003-03-05 2004-09-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur Wiedergabe gesprochener Informationen

Similar Documents

Publication Publication Date Title
EP1282112B1 (de) Verfahren zur Unterstützung des Korrekturlesens eines spracherkannten Textes mit an die Erkennungszuverlässigkeit angepasstem Wiedergabegeschwindigkeitsverlauf
DE69923379T2 (de) Nicht-interaktive Registrierung zur Spracherkennung
DE60010827T2 (de) Hintergrundsystem für Audiodatenbeseitigung
DE60215272T2 (de) Verfahren und Vorrichtung zur sprachlichen Dateneingabe bei ungünstigen Bedingungen
DE60124559T2 (de) Einrichtung und verfahren zur spracherkennung
DE602004010069T2 (de) Gerät und verfahren zur vertonung von sprachlauten, sowie tastatur zur bedienung eines solchen gerätes
DE112006000322T5 (de) Audioerkennungssystem zur Erzeugung von Antwort-Audio unter Verwendung extrahierter Audiodaten
CN113823323B (zh) 一种基于卷积神经网络的音频处理方法、装置及相关设备
DE102009021124A1 (de) Bediensystem für ein Fahrzeug
DE60312963T2 (de) Methode und gerät zur schnellen, durch mustererkennung gestützen transkription von gesprochenen und geschriebenen äusserungen
WO2022013045A1 (de) Verfahren zum automatischen lippenlesen mittels einer funktionskomponente und zum bereitstellen der funktionskomponente
DE102005021524A1 (de) Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage
EP3115886A1 (de) Verfahren zum betreiben eines sprachsteuerungssystems und sprachsteuerungssystem
DE102005021525A1 (de) Verfahren und Vorrichtung zum Eingeben von Schriftzeichen in eine Datenverarbeitungsanlage
DE102005021526A1 (de) Verfahren und Vorrichtung zum Eingeben von Schriftzeichen in eine Datenverarbeitungsanlage
DE102004008254A1 (de) Vorrichtung zum Erfassen von Bewegungen
WO2006105897A1 (de) Elektronisches leselernhilfegerät und verfahren unter nutzung eines elektronischen leselernhilfegeräts
DE102018101567A1 (de) Fahrzeuginformationsterminal und computerlesbares Speichermedium, das ein Informationssuchprogramm speichert
DE102006045719A1 (de) Medizinisches System mit einer Spracheingabevorrichtung
DE102022124133B3 (de) Verfahren zum Verarbeiten gestottert gesprochener Sprache mittels eines Sprachassistenten für ein Kraftfahrzeug
EP0962914B1 (de) Verfahren und Vorrichtung zum Ermitteln eines Zuverlässigkeitsmasses für die Spracherkennung
DE102016000836A1 (de) Verfahren zum Bestimmen einer Strukturinformation eines Wörterbuchs und Wörterbuchbereitstellungsvorrichtung
DE19547742C2 (de) Vorrichtung zur phonetischen Wiedergabe programmierter Zeichen
DE102023112337A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe
DE102020129603A1 (de) Verfahren zur steuerung von prozessen mittels einer sprachbefehlseingabe

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee