DE10062379A1 - Verfahren und System zum Umsetzen von Text in Sprache - Google Patents

Verfahren und System zum Umsetzen von Text in Sprache

Info

Publication number
DE10062379A1
DE10062379A1 DE10062379A DE10062379A DE10062379A1 DE 10062379 A1 DE10062379 A1 DE 10062379A1 DE 10062379 A DE10062379 A DE 10062379A DE 10062379 A DE10062379 A DE 10062379A DE 10062379 A1 DE10062379 A1 DE 10062379A1
Authority
DE
Germany
Prior art keywords
text
voice
receiving unit
unit
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10062379A
Other languages
English (en)
Inventor
Juan Dafcik
Stephan Mentz
Rainer Volland
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Priority to DE10062379A priority Critical patent/DE10062379A1/de
Priority to PCT/DE2001/004658 priority patent/WO2002049003A1/de
Publication of DE10062379A1 publication Critical patent/DE10062379A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/02Methods for producing synthetic speech; Speech synthesisers
    • G10L13/04Details of speech synthesis systems, e.g. synthesiser structure or memory management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Multimedia (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

Zum persönlichen Vorlesen bzw. Wiedergeben von in elektronischer Form vorliegenden Texten mittels der sogenannten "Text-to-Speech"-Technologie wird erfindungsgemäß vorgeschlagen, zusammen mit dem in elektronischer Form vorliegenden Text (TD) Stimmenparameter (SD) an eine zur Wiedergabe des Texts (TD) vorgesehene Empfangseinheit (2) zu übertragen, wobei die Empfangseinheit (2) den empfangenen Text (TD) unter Verwendung der zusammen mit dem Text empfangenen Stimmenparameter (SD) in Sprache umsetzt. Auf diese Weise ist das Vorlesen von in elektronischer Form vorliegenden Texten, wie beispielsweise von SMS-Mitteilungen oder E-Mails, mit der Stimme des Absenders möglich.

Description

Die vorliegende Erfindung betrifft ein Verfahren zum Umsetzen von in elektronischer Form vorliegendem Text in Sprache nach dem Oberbegriff des Anspruches 1 sowie ein entsprechend aus­ gestaltetes System nach dem Oberbegriff des Anspruches 9.
Werden auf einem elektronischen Gerät Texte in elektronischer Form gespeichert, so ist es in vielen Fällen günstig, diese von dem entsprechenden Gerät vorlesen zu lassen. Dies trifft insbesondere auf Situationen zu, bei denen man den Text sel­ ber nicht ablesen kann, wie beispielsweise beim Autofahren, bei Gebrauch eines Kopfhörers oder aber auch bei sehbehinder­ ten Menschen. Das Vorlesen des in elektronischer Form vorlie­ genden Textes erfolgt durch die sogenannte "Text-to-Speech"- Technologie (TTS), bei der die Textdaten durch synthetische Spracherzeugung in Sprache umgesetzt werden.
Bei herkömmlichen elektronischen Geräten ist die Stimme, mit welcher der in elektronischer Form vorliegende Text vorgele­ sen wird, sehr unpersönlich und in der Regel für jeden Text gleich. Besonders bei persönlichen Texten, wie beispielsweise bei SMS-Mitteilungen ("Short Message Service") oder bei e­ lektronischer Post ("E-Mail"), wäre ein Vorlesen beispiels­ weise mit der Stimme des Verfassers oder Absenders des jewei­ ligen Textes wünschenswert, um somit dem vorgelesenen Text eine persönliche Note zu verleihen.
Zur Lösung dieses Problems sind bisher keine Ansätze bekannt. Bei herkömmlichen elektronischen Geräten mit "Text-to- Speech"-Technologie, wie beispielsweise Mobiltelefonen, wel­ che zur Sprachwiedergabe von SMS-Mitteilungen oder E-Mails ausgestaltet sind, besteht lediglich die Möglichkeit, die zur Wiedergabe, des in elektronischer Form vorliegenden Textes vorgesehene Stimme grob einzustellen. So kann beispielsweise zwischen einer männlichen und einer weiblichen Stimme oder zwischen einer Stimme einer jüngeren Person und einer Stimme einer älteren Person ausgewählt werden.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, eine Möglichkeit bereitzustellen, um in elektronischer Form vorliegende Texte mit einer gewünschten Stimme einer indivi­ duellen Person wiederzugeben.
Diese Aufgabe wird erfindungsgemäß durch ein Verfahren mit den Merkmalen des Anspruches 1 bzw. ein System mit den Merk­ malen des Anspruches 9 gelöst. Die Unteransprüche definieren jeweils bevorzugte und vorteilhafte Ausführungsformen der vorliegenden Erfindung.
Erfindungsgemäß wird vorgeschlagen, dem jeweils vorzulesenden Text einen Stimmenparametersatz zuzuordnen, welcher eine für die Wiedergabe des Textes vorgesehene Stimme einer zuvor aus­ gewählten Person beschreibt. Dabei kann es sich insbesondere um die Stimme des Erstellers bzw. Absenders des jeweiligen, in elektronischer Form vorliegenden Textes handeln. Auf diese Weise könnte beispielsweise eine empfangene SMS-Mitteilung von einem Mobiltelefon mit der Stimme des Absenders vorgele­ sen werden. Hierzu ist lediglich erforderlich, dass auf dem Sendegerät, an dem der Text erstellt wird, einmalig eine Ex­ traktion der Stimmenparameter des Texterstellers bzw. Absen­ ders vorgenommen wird, wobei die Stimmenparameter dann für jeden von derselben Person erstellten Text auf Wunsch zusam­ men mit den Textdaten an das jeweilige Empfangsgerät gesendet werden kann.
Gemäß einer Variante der vorliegenden Erfindung ist auf dem Empfangsgerät bereits eine Datenbank mit Stimmenparametern verschiedener Kommunikationspartner gespeichert. In diesem Fall ist lediglich erforderlich, von dem Sendegerät zusammen mit den Textdaten eine Kennung ("Identifier", ID) zu übertra­ gen, welche den jeweiligen Absender oder Ersteller des Textes bzw. deren Stimme bezeichnet. Im Empfangsgerät wird dann an­ hand der zusammen mit den Textdaten empfangenen Kennung über­ prüft, ob bereits ein Stimmenparameter-Datensatz für die durch die Kennung bezeichnete Person vorliegt. Ist dies der Fall, werden die entsprechenden Stimmenparameter ausgelesen und für die Wiedergabe des in elektronischer Form vorliegen­ den Textes verwendet. Ist dies jedoch nicht der Fall, kann an das Sendegerät ein Befehl zurückgesendet werden, wodurch vom Sendegerät die gewünschten Stimmenparameter angefordert wer­ den.
Im Rahmen der vorliegenden Erfindung ist nicht nur vorgese­ hen, für die Wiedergabe des in elektronischer Form vorliegen­ den Textes die Stimmenparameter des Texterstellers zu verwen­ den. Vielmehr können vom Sendegerät auch Stimmenparameter be­ liebiger Personen zusammen mit den Textdaten übertragen wer­ den, um eine bestimmte Wirkung zu erzielen. Dies ist bei­ spielsweise insbesondere dann vorteilhaft, wenn der Texter­ steller nicht mit der eigentlichen Person des Absenders über­ einstimmt (beispielsweise für den Fall, dass eine Sekretärin eine E-Mail für ihren Chef verfasst und im Namen des Chefs versendet). Ebenso können zur Wiedergabe des Textes Stimmen­ parameter bekannter, prominenter Personen (beispielsweise von Schauspielern, Politikern etc.) vorgegeben werden.
Die vorliegende Erfindung eignet sich insbesondere für die Versendung und sprachliche Wiedergabe von E-Mails, SMS- Mitteilungen oder elektronischen Grußkarten über Computer o­ der mobile Endgeräte, wie beispielsweise Mobiltelefone, Schnurlostelefone oder Handheld-Organizer ("PDA"). Ebenso kann die vorliegende Erfindung auch zur Realisierung einer persönlichen Vorlesestimme zum Vorlesen von elektronischen Büchern verwendet werden. Die vorliegende Erfindung ist je­ doch nicht auf den Anwendungsfall des Versendens von in e­ lektronischer Form vorliegenden Texten (beispielsweise über kabellose Funkverbindungen) beschränkt, sondern kann grund­ sätzlich auch auf Anwendungsfälle angewendet werden, bei denen der vorzulesende elektronische Text bereits in dem jewei­ ligen Wiedergabegerät gespeichert ist.
Die vorliegende Erfindung wird nachfolgend anhand bevorzugter Ausführungsbeispiele unter Bezugnahme auf die beigefügte Zeichnung näher erläutert.
Fig. 1 zeigt eine schematische Darstellung zur Erläuterung der Übertragung und sprachlichen Wiedergabe von Textdaten ge­ mäß einem ersten Ausführungsbeispiel der vorliegenden Erfin­ dung, und
Fig. 2 zeigt eine schematische Darstellung zur Erläuterung der Übertragung und sprachlichen Wiedergabe von Textdaten ge­ mäß einem zweiten Ausführungsbeispiel der vorliegenden Erfin­ dung.
In Fig. 1 ist eine Kommunikation zwischen zwei Mobiltelefo­ nen 1, 2 dargestellt. Dabei wird davon ausgegangen, dass an dem Mobiltelefon 1 eine auch als SMS-Mitteilung bezeichnete Kurzmitteilung erstellt und über Funkverbindung an das Mobil­ telefon 2 übertragen wird. Von dem Mobiltelefon 2 wird der in elektronischer Form vorliegende Text der SMS-Mitteilung mit­ tels der sogenannten "Text-to-Speech"-Technologie durch syn­ thetische Spracherzeugung in Sprache umgesetzt und über den Lautsprecher des Mobiltelefons 2 wiedergegeben.
Bei dem in Fig. 1 gezeigten Ausführungsbeispiel umfasst das Mobiltelefon 1 eine Einheit 3, welche eine Sprachprobe be­ stimmter Länge des Benutzers des Mobiltelefons 1 aufnimmt und daraus bestimmte Stimmenparameter des Benutzers des Mobilte­ lefons 1 extrahiert, wobei die auf diese Weise gewonnenen Stimmenparameter möglichst exakt die Stimme des Benutzers des Mobiltelefons 1 beschreiben bzw. charakterisieren. Die auf diese Weise gewonnenen Stimmenparameter werden in einem Stim­ menparameter-Speicher 4 gespeichert, so dass im Prinzip le­ diglich eine einmalige Extraktion der Stimmenparameter des Benutzers des Mobiltelefons 1 erforderlich ist. Wird nunmehr von dem Benutzer des Mobiltelefons 1 eine SMS-Mitteilung durch Tasteneingabe erstellt, wird diese in einem SMS- Speicher 5 zwischengespeichert und anschließend auf Tasten­ druck in Form entsprechender Textdaten TD an das Mobiltelefon 2 des gewünschten Empfängers gesendet. Dabei ist das Mobilte­ lefon 1 derart ausgestaltet, dass auf Wunsch nicht nur die Textdaten TD der SMS-Mitteilung übertragen werden, sondern auch die dem Ersteller der SMS-Mitteilung zugeordneten und aus dem Stimmenparameter-Speicher 4 ausgelesenen Stimmenpara­ meter. Diese Stimmenparameter können beispielsweise wie in Fig. 1 gezeigt in Form entsprechender Stimmenparameterdaten SD an die Textdaten TD der SMS-Mitteilung angehängt und an das Mobiltelefon 2 übertragen werden.
Das empfangende Mobiltelefon 2 ist derart ausgestaltet, dass bei Empfang einer SMS-Mitteilung die Textdaten TD der empfan­ genen SMS-Mitteilung zunächst in einem SMS-Speicher 8 zwi­ schengespeichert werden. Darüber hinaus ist eine TTS-Einheit 6 vorgesehen, welche auf Tastendruck mittels synthetischer Spracherzeugung unter Anwendung der sogenannten "Text-to- Speech"-Technologie (TTS) eine empfangene und gespeicherte SMS-Mitteilung in Sprache umsetzt und über den Lautsprecher des Mobiltelefons 2 wiedergibt. Dabei erfolgt die Wiedergabe der SMS-Mitteilung in Abhängigkeit von den zusammen mit den entsprechenden Textdaten übertragenen Stimmenparameterdaten SD, welche bei Empfang der entsprechenden SMS-Mitteilung in einen Stimmenparameter-Speicher 7 zwischengespeichert und für eine spätere Sprachwiedergabe von der TTS-Einheit wieder aus­ gelesen werden können. Der in elektronischer Form vorliegende Text der empfangenen SMS-Mitteilung wird somit derart von der TTS-Einheit 6 mittels synthetischer Spracherzeugung unter Be­ rücksichtigung der entsprechenden Stimmenparameterdaten in Sprache umgesetzt, dass der Text der SMS-Mitteilung mit der Stimme des Verfassers bzw. Absenders der SMS-Mitteilung oder einer möglichst ähnlichen Stimme wiedergegeben wird.
Das in Fig. 2 dargestellte Ausführungsbeispiel ist in vielen Punkten ähnlich zu dem in Fig. 1 dargestellten Ausführungs­ beispiel. Es ist wieder eine Sendeeinheit in Form eines Mo­ biltelefons 1 vorgesehen, welche eine mit dem Mikrophon des Mobiltelefons 1 gekoppelte Einheit 3 zur Extraktion der Stim­ menparameter des jeweiligen Benutzers des Mobiltelefons 1, einen Stimmenparameter-Speicher 4 zum Speichern der somit ge­ wonnenen Stimmenparameter und einen SMS-Speicher 5 zum Spei­ chern von an dem Mobiltelefon 1 erstellten SMS-Mitteilungen umfasst. Ebenso ist eine Empfangseinheit in Form eines Mobil­ telefons 2 vorgesehen, welche eine TTS-Einheit 6 zur Umset­ zung von in elektronischer Form vorliegenden Text mittels synthetischer Spracherzeugung in Sprache und einen SMS- Speicher 8 zum Speichern von empfangenen SMS-Mitteilungen bzw. der entsprechenden Textdaten TD umfasst. Darüber hinaus weist das Mobiltelefon 2 anstelle des in Fig. 1 gezeigten Stimmenparameter-Speichers 7 einen Stimmenparameter-Speicher 9 auf, in dem bereits eine Datenbank mit Stimmenparametern verschiedener Kommunikationspartner gespeichert ist.
Bei dem in Fig. 2 gezeigten Ausführungsbeispiel werden nach Erstellung einer SMS-Mitteilung an dem Mobiltelefon 1 die Textdaten TD der SMS-Mitteilung wie bei dem in Fig. 1 ge­ zeigten Ausführungsbeispiel an das Mobiltelefon 2 übertragen. Im Gegensatz zu dem in Fig. 1 gezeigten Ausführungsbeispiel werden jedoch bei dem in Fig. 2 gezeigten Ausführungsbei­ spiel nicht die Stimmenparameter des Verfassers der SMS- Mitteilung an das Mobiltelefon 2 übertragen, sondern es wird zusammen mit den Textdaten TD der SMS-Mitteilung eine Kennung ID übertragen, welche das Mobiltelefon 1 bzw. den Benutzer oder Verfasser der SMS-Mitteilung eindeutig charakterisiert. Dabei kann es sich beispielsweise im einfachsten Fall um die Rufnummer des Mobiltelefons 1 handeln, welche ohnehin in di­ gitalen Kommunikationssystemen an das jeweils gerufene Endge­ rät mit übertragen wird.
Bei Empfang einer SMS-Mitteilung von dem Mobiltelefon 1 wer­ den die entsprechenden Textdaten TD in dem Mobiltelefon 2 bzw. in dem SMS-Speicher 8 zwischengespeichert. Darüber hin­ aus wird zu der empfangenen SMS-Mitteilung die Kennung ID des jeweiligen Absenders bzw. Verfassers der SMS-Mitteilung abge­ speichert.
Wird von dem Benutzer des Mobiltelefons 2 eine Sprachwieder­ gabe der empfangenen und zwischengespeicherten SMS-Mitteilung gewünscht, überprüft die TTS-Einheit 6, ob zu der entspre­ chenden Kennung ID bereits ein Stimmenparametersatz in dem Stimmenparameter-Speicher 9 gespeichert ist. Ist dies der Fall, werden die der Kennung ID entsprechenden Stimmenparame­ ter aus dem Stimmenparameter-Speicher 9 ausgelesen und von der TTS-Einheit der Spracherzeugung bzw. Sprachwiedergabe der Textdaten TD der jeweiligen SMS-Mitteilung zugrundegelegt. Ist hingegen für die jeweilige Kennung ID, d. h. für die der jeweiligen Kennung ID entsprechende Person, noch kein Stim­ menparametersatz in dem Stimmenparameter-Speicher 9 gespei­ chert, veranlasst die TTS-Einheit 6, dass von dem Mobiltele­ fon 2 eine Aufforderung an dasjenige Mobiltelefon 1 gesendet wird, von dem die wiederzugebende SMS-Mitteilung stammt, um somit von dem Mobiltelefon 1 die fehlenden Stimmenparameter anzufordern. Bei Empfang einer derartigen Aufforderung muss dann, wie zuvor anhand von Fig. 1 beschrieben worden ist, mit Hilfe der Einheit 3 eine Stimmenprobe des Benutzers des Mobiltelefons 1 aufgenommen und daraus die entsprechenden Stimmenparameter extrahiert werden. Anschließend können die Stimmenparameter über die Funkverbindung an das Mobiltelefon 2 gesendet werden, wo sie anschließend in dem Stimmenparame­ ter-Speicher 9 in Form eines entsprechenden Stimmenparameter­ satzes gespeichert werden und somit für die gewünschte Sprachwiedergabe der bereits zuvor von dem Mobiltelefon 1 an das Mobiltelefon 2 übertragenen SMS-Mitteilung durch die TTS- Einheit 6 zur Verfügung stehen.

Claims (14)

1. Verfahren zum Umsetzen von Text in Sprache,
wobei von einer Sendeeinheit (1) ein in elektronischer Form vorliegender Text (TD) an eine Empfangseinheit (2) übertragen und von der Empfangseinheit (2) mittels synthetischer Sprach­ erzeugung in Sprache umgesetzt und wiedergegeben wird,
dadurch gekennzeichnet,
dass von der Sendeeinheit (1) zusammen mit dem in elektroni­ scher Form vorliegenden Text (TD) personengebundene Informa­ tionen (SD, ID) an die Empfangseinheit (2) übertragen werden, und
dass von der Empfangseinheit (2) aus den personengebundenen Informationen (SD, ID) eine für die Wiedergabe des Textes (TD) vorgesehene Stimme abgeleitet und bei der Umsetzung so­ wie Wiedergabe des Textes (TD) verwendet wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
dass von der Sendeeinheit (1) als personengebundene Informa­ tionen personengebundene Stimmenparameter (SD) zusammen mit dem in elektronischer Form vorliegenden Text (TD) an die Emp­ fangseinheit (2) übertragen werden, wobei die personengebun­ denen Stimmenparameter (SD) eine für die Wiedergabe des Tex­ tes (TD) vorgesehene Stimme einer bestimmten Person beschrei­ ben, und
dass von der Empfangseinheit (2) der Text (TD) in Abhängig­ keit von den personengebundenen Stimmenparametern (SD) in Sprache umgesetzt und mit der entsprechenden Stimme wiederge­ geben wird.
3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass von der Sendeeinheit (1) die Stimme der den Text (TD) erstellenden Person in die personengebundenen Stimmenparame­ ter (SD) zerlegt und in Form der personengebundenen Stimmen­ parameter (SD) an die Empfangseinheit (2) übertragen wird.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet,
dass in der Empfangseinheit (2) mehrere Datensätze von perso­ nengebundenen Stimmenparametern (SD), welche die Stimmen un­ terschiedlicher Personen beschreiben, gespeichert werden,
dass von der Sendeeinheit (1) zusammen mit dem in elektroni­ scher Form vorliegenden Text (TD) als personengebundene In­ formationen eine für die Wiedergabe des Textes bestimmte Per­ son oder deren Stimme beschreibende Kennung (ID) an die Emp­ fangseinheit (2) übertragen wird, und
dass in der Empfangseinheit (2) die der Kennung (ID) entspre­ chenden Stimmenparameter ausgelesen und für die Umsetzung des in elektronischer Form vorliegenden Textes (TD) in Sprache verwendet werden.
5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass von der Empfangseinheit (2) von der Sendeeinheit (1) die der zuvor von der Sendeeinheit (1) übertragenen Kennung (ID) entsprechenden Stimmenparameter angefordert werden, falls in der Empfangseinheit (2) noch kein der Kennung (ID) entspre­ chender Datensatz von personengebundenen Stimmenparametern gespeichert ist.
6. Verfahren nach Anspruch 4 oder 5, dadurch gekennzeichnet, dass die von der Sendeeinheit (1) an die Empfangseinheit (2) zusammen mit dem in elektronischer Form vorliegenden Text (TD) übertragene Kennung (ID) diejenige Person oder deren Stimme bezeichnet, welche den Text (TD) auf der Sendeeinheit (1) erstellt hat.
7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass als Empfangseinheit (2) ein mit der Sendeeinheit (1) ka­ bellos kommunizierendes mobiles Gerät (2) verwendet wird.
8. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass als Sendeeinheit (1) ein mit der Empfangseinheit (2) ka­ bellos kommunizierendes mobiles Gerät verwendet wird.
9. System zum Umsetzen von Text in Sprache,
mit einer Sendeeinheit (1) zum Erstellen eines in elektroni­ scher Form vorliegenden Texts (TD) und zur Übertragung des in elektronischer Form vorliegenden Texts (TD) an eine Empfangs­ einheit (2),
wobei die Empfangseinheit (2) Spracherzeugungsmittel (6) zur Umsetzung des von der Sendeeinheit (1) empfangenen und in e­ lektronischen Form vorliegenden Texts (TD) in Sprache um­ fasst,
dadurch gekennzeichnet,
dass die Sendeeinheit (1) zur Übertragung von personengebun­ denen Informationen (SD, ID) zusammen mit dem in elektroni­ scher Form vorliegenden Text (TD) an die Empfangseinheit (2) ausgestaltet ist, und
dass die Spracherzeugungsmittel (6) der Empfangseinheit. (2) derart ausgestaltet sind, dass sie aus den von der Sendeein­ heit (1) empfangenen personengebundenen Informationen (SD, ID) personengebundene Stimmenparameter, welche eine für die Wiedergabe des Texts (TD) vorgesehene Stimme einer bestimmten Person beschreiben, ableiten und die Umsetzung des Texts in die Sprache auf Grundlage dieser personengebundenen Stimmen­ parameter durchführen.
10. System nach Anspruch 9, dadurch gekennzeichnet, dass die Sendeeinheit (1) zur Übertragung des in elektroni­ scher Form vorliegenden Texts (TD) zusammen mit den personen­ gebundenen Stimmenparametern (SD) als personengebundene In­ formationen an die Empfangseinheit (2) ausgestaltet ist, und dass die Spracherzeugungsmittel (6) der Empfangseinheit (2) derart ausgestaltet sind, dass sie den von der Empfangseinheit (1) empfangenen Text (TD) in Abhängigkeit von den eben­ falls von der Empfangseinheit (1) empfangenen personengebun­ denen Stimmenparametern (SD) in Sprache umsetzen und mit der entsprechenden Stimme wiedergeben.
11. System nach Anspruch 10, dadurch gekennzeichnet, dass die Sendeeinheit (1) Stimmenparametererzeugungsmittel (3) zur Erzeugung von Stimmenparametern (SD), welche die Stimme der den Text (TD) erstellenden Person beschreiben, um­ fassen.
12. System nach Anspruch 9, dadurch gekennzeichnet,
dass die Empfangseinheit (2) Speichermittel (9) zum Speichern mehrerer Datensätze von personengebundenen Stimmenparametern, welche die Stimmen unterschiedlicher Personen beschreiben, umfassen, und
dass die Sendeeinheit (1) derart ausgestaltet ist, dass sie zusammen mit dem in elektronischer Form vorliegenden Text (TD) als personengebundene Information eine Kennung (ID) an die Sendeeinheit (2) überträgt, wobei diese Kennung (ID) die­ jenige Person, deren Stimme für die Wiedergabe des Textes (TD) vorgesehen ist, oder deren Stimme beschreibt und
dass die Spracherzeugungsmittel (6) der Empfangseinheit (2) derart ausgestaltet sind, dass sie den der von der Sendeein­ heit (1) empfangenen Kennung entsprechenden Datensatz von personengebundenen Stimmenparametern aus den Speichermitteln (9) auslesen und für die Umsetzung des von der Sendeeinheit (1) empfangenen Texts (TD) in Sprache zugrundelegen.
13. System nach Anspruch 12, dadurch gekennzeichnet, dass die Empfangseinheit (2) derart ausgestaltet ist, dass sie für den Fall, dass in den Speichermitteln (9) kein der von der Sendeeinheit (1) empfangenen Kennung entsprechender Datensatz von personengebundenen Stimmenparametern gespeichert ist, einen Befehl zur Anforderung von der Kennung (ID) entsprechenden personengebundenen Stimmenparametern an die Sendeeinheit (1) sendet.
14. System nach Anspruch 12 oder 13, dadurch gekennzeichnet, dass die von der Sendeeinheit (1) an die Empfangseinheit. (2) übertragene Kennung (ID) diejenige Person bezeichnet, welche zuvor an der Sendeeinheit (1) den Text (TD) erstellt hat, o­ der deren Stimme bezeichnet.
DE10062379A 2000-12-14 2000-12-14 Verfahren und System zum Umsetzen von Text in Sprache Withdrawn DE10062379A1 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE10062379A DE10062379A1 (de) 2000-12-14 2000-12-14 Verfahren und System zum Umsetzen von Text in Sprache
PCT/DE2001/004658 WO2002049003A1 (de) 2000-12-14 2001-12-11 Verfahren und system zum umsetzen von text in sprache

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10062379A DE10062379A1 (de) 2000-12-14 2000-12-14 Verfahren und System zum Umsetzen von Text in Sprache

Publications (1)

Publication Number Publication Date
DE10062379A1 true DE10062379A1 (de) 2002-06-20

Family

ID=7667164

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10062379A Withdrawn DE10062379A1 (de) 2000-12-14 2000-12-14 Verfahren und System zum Umsetzen von Text in Sprache

Country Status (2)

Country Link
DE (1) DE10062379A1 (de)
WO (1) WO2002049003A1 (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004047466A2 (de) * 2002-11-20 2004-06-03 Siemens Aktiengesellschaft Verfahren zur wiedergabe von gesendeten textnachrichten
DE102007055420B4 (de) * 2007-11-20 2010-09-16 Stöcklin, Norbert Verfahren zur Informationssammlung und Anlage zum Verteilen und Sammeln von Informationen
US7805307B2 (en) 2003-09-30 2010-09-28 Sharp Laboratories Of America, Inc. Text to speech conversion system

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3589216B2 (ja) 2001-11-02 2004-11-17 日本電気株式会社 音声合成システム及び音声合成方法
DE10207875A1 (de) * 2002-02-19 2003-08-28 Deutsche Telekom Ag Parametergesteuerte Sprachsynthese
GB2389762A (en) * 2002-06-13 2003-12-17 Seiko Epson Corp A semiconductor chip which includes a text to speech (TTS) system, for a mobile telephone or other electronic product
AT7282U1 (de) 2002-09-06 2004-12-27 Telion Telematic Gmbh Verfahren und einrichtung zur übermittlung von in einem datenbanksystem gespeicherten textdaten über ein mobilfunknetz
US20040215461A1 (en) * 2003-04-24 2004-10-28 Visteon Global Technologies, Inc. Text-to-speech system for generating information announcements
US8005677B2 (en) 2003-05-09 2011-08-23 Cisco Technology, Inc. Source-dependent text-to-speech system
GB2412046A (en) * 2004-03-11 2005-09-14 Seiko Epson Corp Semiconductor device having a TTS system to which is applied a voice parameter set
JP2006197047A (ja) * 2005-01-12 2006-07-27 Nec Corp 携帯通信端末及びそれに用いる警告画面表示方法並びにそのプログラム
US20080086565A1 (en) * 2006-10-10 2008-04-10 International Business Machines Corporation Voice messaging feature provided for immediate electronic communications
WO2008132533A1 (en) * 2007-04-26 2008-11-06 Nokia Corporation Text-to-speech conversion method, apparatus and system
US20170310819A1 (en) * 2015-01-23 2017-10-26 Huawei Technologies Co., Ltd. Voice play method and voice play device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3287281B2 (ja) * 1997-07-31 2002-06-04 トヨタ自動車株式会社 メッセージ処理装置
FI115868B (fi) * 2000-06-30 2005-07-29 Nokia Corp Puhesynteesi

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004047466A2 (de) * 2002-11-20 2004-06-03 Siemens Aktiengesellschaft Verfahren zur wiedergabe von gesendeten textnachrichten
WO2004047466A3 (de) * 2002-11-20 2004-09-30 Siemens Ag Verfahren zur wiedergabe von gesendeten textnachrichten
US7805307B2 (en) 2003-09-30 2010-09-28 Sharp Laboratories Of America, Inc. Text to speech conversion system
DE102007055420B4 (de) * 2007-11-20 2010-09-16 Stöcklin, Norbert Verfahren zur Informationssammlung und Anlage zum Verteilen und Sammeln von Informationen

Also Published As

Publication number Publication date
WO2002049003A1 (de) 2002-06-20

Similar Documents

Publication Publication Date Title
DE10062379A1 (de) Verfahren und System zum Umsetzen von Text in Sprache
EP0644680B1 (de) Verfahren und Vorrichtung zum Erstellen und Bearbeiten von Textdokumenten
DE60124985T2 (de) Sprachsynthese
DE60314176T2 (de) Verfahren und vorrichtung zur bereitstellung von nachrichtenorientierten sprachkommunikationen zwischen mehreren partnern
DE19856441C2 (de) Verfahren zur Übertragung von Kurznachrichten
DE69333681T2 (de) Techniken zur Erzeugung von Personalcomputeranzeigen und gedruckten Transkripten aus Sprachpostnachrichten
DE3843662A1 (de) Vorrichtung und verfahren zum speichern und weitergeben von tonsignalen
DE69534561T2 (de) Sender-empfänger
EP0493703A1 (de) Kommunikationssystem, insbesondere Fernsprechkommunikationssystem
DE10117367B4 (de) Verfahren und System zur automatischen Umsetzung von Text-Nachrichten in Sprach-Nachrichten
EP1138163B1 (de) Übertragungsrahmen und funkeinheit für die übertragung von kurznachrichten mit verschiedenen datenformaten
DE10317244B4 (de) In einem Fahrzeug installierte Navigationsvorrichtung und Kommunikationsverfahren für diese
WO2003001827A2 (de) Verfahren und vorrichtung zum übermitteln von informationen
EP2073581A1 (de) Übertragung von aus Sprachnachrichten erzeugten Textnachrichten in Telekommunikationsnetzen
WO1998011745A1 (de) Einrichtung zum übermitteln einer gesprochenen nachricht
EP1071056B1 (de) Verfahren zur drahtlosen Übertragung von Nachrichten zwischen einem fahrzeuginternen Kommunikationssytem und einem fahrzeugexternen Zentralrechner
DE102006032510B4 (de) Verfahren und Einrichtung zum Bereitstellen und Verbreiten von Informationen
EP1122716A2 (de) Vorrichtung zur Umwandlung von gedruckten Texten in Sprache
WO2004047466A2 (de) Verfahren zur wiedergabe von gesendeten textnachrichten
DE10245456B4 (de) Verfahren, System und Einrichtung zum Versenden und Empfangen von Nachrichten, insbesondere von Multimedia- und/oder Textnachrichten und/oder Dateien, über ein Festnetz
WO2001039440A1 (de) Versand von e-mails mittels telefon
DE10122192B4 (de) Kommunikationseinrichtung
DE3731532C2 (de)
DE102004026021A1 (de) Verfahren sowie Vorrichtung zur Aufzeichnung und/oder zum Mithören von Telefongesprächen
DE68919355T2 (de) Sprachkommunikationssystem und Verfahren.

Legal Events

Date Code Title Description
8139 Disposal/non-payment of the annual fee