DE102016113781A1 - Vorrichtung zur Wiedergabe von Sprachinformation - Google Patents

Vorrichtung zur Wiedergabe von Sprachinformation Download PDF

Info

Publication number
DE102016113781A1
DE102016113781A1 DE102016113781.2A DE102016113781A DE102016113781A1 DE 102016113781 A1 DE102016113781 A1 DE 102016113781A1 DE 102016113781 A DE102016113781 A DE 102016113781A DE 102016113781 A1 DE102016113781 A1 DE 102016113781A1
Authority
DE
Germany
Prior art keywords
voice information
module
input module
translation
jack
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102016113781.2A
Other languages
English (en)
Inventor
Anmelder Gleich
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE102016113781.2A priority Critical patent/DE102016113781A1/de
Publication of DE102016113781A1 publication Critical patent/DE102016113781A1/de
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

Die Erfindung betrifft eine Vorrichtung zur Wiedergabe von Sprachinformation, umfassend ein Eingangsmodul (1) zum Empfangen von Sprachinformation, ein Übersetzungsmodul (2) zum Übersetzen der im Eingangsmodul empfangenen Sprachinformation sowie ein Ausgabemodul (3) zum Ausgeben der übersetzten Sprachinformation. Diese soll für einen Reisenden freizügig an beliebigen Orten zur Übersetzung in eine von diesem selbst bestimmte Zielsprache nutzbar sein. Dies wird erfindungsgemäß dadurch erreicht, dass das Eingangsmodul (1) einen als dreipoligen Stereostecker ausgeführten Klinkenstecker umfasst und zum Empfang von Tonsignalen über den Klinkenstecker eingerichtet ist.

Description

  • Die Erfindung betrifft eine Vorrichtung zur Wiedergabe von Sprachinformation, umfassend ein Eingangsmodul zum Empfangen von Sprachinformation, ein Übersetzungsmodul zum Übersetzen der im Eingangsmodul empfangenen Sprachinformation sowie ein Ausgabemodul zum Ausgeben der übersetzten Sprachinformation.
  • Derartige Vorrichtungen sind aus dem Stand der Technik bekannt und dienen der Simultanübersetzung von Fernseh- oder Hörfunk-Programmen.
  • So offenbart die WO 1997/001243 ein Verfahren, bei dem ein TV-Audio-Signal auf dem Übertragungsweg zwischen Sender und Empfangsgerät über ein Simultan-Übersetzungs-Zentrum geleitet wird. Die im Sendebereich eines solchen Senders bzw. Simultan-Übersetzungs-Zentrums angeordneten Empfangsgeräte empfangen also an ihrer jeweiligen Antennen- bzw. Luftschnittstelle ein bereits simultan übersetztes TV-Audio-Signal, dessen Sprachinformation nur noch durch das Empfangsgerät in herkömmlicher Weise wiedergegeben (also in aller Regel hörbar) gemacht werden muss.
  • Einen anderen Ansatz verfolgt die JP 2014-021485 A , welche ein Fernsehsystem offenbart, welches die Sprachinformation am TV-Eingangssignal abgreift, einer Übersetzung unterwirft und die übersetzte Sprachinformation dann über den Lautsprecher des Fernsehgerätes ausgibt. Zwar kann der Nutzer eines solchen Fernsehsystems verschiedene Zielsprachen am Gerät auswählen, allerdings beschränkt sich diese Auswahl auf die durch den Hersteller des Fernsehsystems vorgegebenen Zielsprachen.
  • Reisende in einer globalisierten Welt sind immer wieder mit Fernseh- oder Rundfunkprogrammen konfrontiert, deren Sprache sie nicht oder nur sehr schlecht verstehen. In aller Regel findet der Reisende in Hotelzimmern und an anderen ähnlichen Orten keine Fernsehgeräte vor, welche zur Simultan-Übersetzung in eine vom Zuschauer wählbare Zielsprache gemäß der technischen Lehre der JP 2014-021485 A eingerichtet sind. Und falls doch, wird von dem Fernsehgerät die vom Zuschauer favorisierte Zielsprache in vielen Fällen nicht unterstützt und stattdessen nur eine eingeschränkte Auswahl nicht-favorisierter Zielsprachen angeboten. Dieses Problem trifft insbesondere im Hinblick auf solche Zuschauer zu, deren Muttersprache keine gängige Weltsprache ist. Auch die Simultanübersetzung auf dem Übertragungsweg zwischen Sender und Empfangsgerät gemäß der technischen Lehre der WO 1997/001243 löst dieses Problem nicht, da auf Seiten des Senders meist nur sehr wenige Sprachen als typische Zielsprachen technisch unterstützt werden. In aller Regel sind dies nur die Amts- und Verkehrssprachen innerhalb des Sendegebietes oder die vom Sender offiziell unterstützen Auslandsprogramme.
  • Die Aufgabe der vorliegenden Erfindung besteht somit darin, eine Vorrichtung zur Wiedergabe von Sprachinformation, umfassend ein Eingangsmodul zum Empfangen von Sprachinformation, ein Übersetzungsmodul zum Übersetzen der im Eingangsmodul empfangenen Sprachinformation sowie ein Ausgabemodul zum Ausgeben der übersetzten Sprachinformation bereitzustellen, welche für den Reisenden freizügig an beliebigen Orten zur Übersetzung in eine von ihm selbst bestimmte Zielsprache nutzbar ist. Die bislang bestehende Abhängigkeit des Nutzers von den technischen Gegebenheiten der örtlich verfügbaren Fernseh- bzw. Radiogeräten und den zugehörigen Sendern soll beseitigt werden.
  • Dies wird erfindungsgemäß dadurch erreicht, dass das Eingangsmodul einen als dreipoligen Stereostecker ausgeführten Klinkenstecker umfasst und zum Empfang von Tonsignalen über den Klinkenstecker eingerichtet ist. Auf diese Weise wird eine gattungsgemäße Vorrichtung realisiert, die an den Kopfhörer-Ausgang nahezu sämtlicher gebräuchlicher Audio-Endgeräte anschließbar ist. Unter einem Audio-Endgerät ist in diesem Zusammenhang auch ein Video-Endgerät zu verstehen, sofern dieses neben dem bewegten Bild auch eine Toninformation liefert – was den Regelfall darstellt – und hierzu einen Kopfhörer-Ausgang vorsieht. Die erfindungsgemäße Wiedergabe-Vorrichtung kann somit als autonomes und mobiles Gerät eines Reisenden in dessen persönlichem Gepäck mitgeführt und bei den vor Ort jeweils angetroffenen Audio-Endgeräten, wie z.B. Fernseher oder Radiogerät, an deren Ausgangsbuchse zum Anschluss eines Kopfhörers angeschlossen werden. Die mittels des Klinkensteckers abgegriffenen analogen Sprachsignale werden im Eingangsmodul der erfindungsgemäßen Vorrichtung zunächst in akustische Teilsignale mit jeweils unterschiedlichen Frequenzbereichen aufgeteilt. Innerhalb eines Frequenzbereiches wird jedes akustische Teilsignal dann digitalisiert, zur besseren Unterscheidbarkeit gegen Umfeldgeräusche gefiltert und mittels an sich bekannter Spracherkennungsmodelle, wie z.B. Hidden-Markov-Modellen oder neuronaler Netze, dekodiert. Die solchermaßen erkannte Sprachinformation wird sodann in einem weiteren Schritt dem Übersetzungsmodul zugeführt und dort in eine vom Benutzer voreinstellbare Zielsprache übersetzt. Sowohl die Spracherkennungssoftware als auch die Übersetzungsoftware sind entweder fest in einem Speicher der erfindungsgemäßen Vorrichtung eingespeichert oder mittels des Internets aus anderen Datenquellen herunterladbar. Die letztgenannte Variante erhöht zwar die Flexibilität der erfindungsgemäßen Vorrichtung, da diese situationsabhängig eine Übersetzung der empfangenen und dekodierten Sprachinformation in unterschiedlichste und situationsabhängig frei wählbare Zielsprachen ermöglicht. Als nachteilig ist aber zu werten, dass die erfindungsgemäße Vorrichtung in technischer Hinsicht zum Datendownload aus dem Internet eingerichtet sein muss.
  • Gemäß einer ersten, besonders bevorzugten Ausführungsvariante umfasst das Ausgabemodul der erfindungsgemäßen Wiedergabevorrichtung einen Lautsprecher. Sofern die Buchse des Audio-Endgerätes mit einem entsprechenden Schaltkontakt ausgestattet ist, werden durch das Einstecken der erfindungsgemäßen Vorrichtung die Lautsprecher des Audio-Endgerätes und damit auch die Wiedergabe des nicht-übersetzten Audiosignals stummgeschaltet. Somit werden störende Nebengeräusche unterdrückt und es erfolgt ausschließlich die Ausgabe des in die Zielsprache übersetzten Tonsignals über den mindestens einen Lautsprecher der erfindungsgemäßen Wiedergabevorrichtung.
  • In einer hierzu alternativen oder aber auch ergänzenden Variante umfasst das Ausgabemodul der erfindungsgemäßen Wiedergabevorrichtung einen Bildschirm. Die Tonsignale können durch das Übersetzungsmodul in Ergänzung oder als Alternative zur sprachlichen Wiedergabe in eine schriftbildliche Wiedergabe überführt und am Bildschirm als visuell wahrnehmbare Zeichenketten ausgegeben werden. Sofern die Buchse des Kopfhörer-Ausgangs des jeweiligen Audio-Endgerätes in Verbindung mit einem an der Buchse eingesteckten Klinkenstecker keine selbsttätige Stummschaltung der eigenen Lautsprecher bewirkt, kann auf diese Weise die Wiedergabe sowohl des fremdsprachigen Original-Tons als auch gleichzeitig eines in die vom Benutzer ausgewählte Zielsprache übersetzten schriftlichen Untertitels – dargestellt auf dem Bildschirm des erfindungsgemäßen mobilen Wiedergabe-Gerätes – realisiert werden.
  • Die Erfindung betrifft ferner einen Kopfhörer, der eine gemäß der vorgenannten erfindungsgemäßen Merkmale ausgeführte Vorrichtung zur Wiedergabe von Sprachinformationen umfasst.
  • Die vorliegende Erfindung wird nachfolgend anhand eines Ausführungsbeispieles und dazugehöriger Zeichnung näher erläutert. Es zeigt:
  • 1: schematische Ansicht einer erfindungsgemäßen Wiedergabevorrichtung
  • Die erfindungsgemäße Wiedergabevorrichtung umfasst zunächst ein Eingangsmodul (1) mit einem als dreipoligem Stereostecker ausgeführten Klinkenstecker. Der Klinkenstecker ist zum Einstecken in die Buchse eines üblichen Kopfhörer-Ausgangs an einem ebenfalls üblichen Audio-Endgerät, wie z.B. einem Fernsehgerät oder Computer, ausgelegt und über ein flexibles und hinreichend langes Kabel an die Wiedergabevorrichtung angeschlossen. Mittels des Klinkensteckers werden die am Kopfhörer-Ausgang des Audio-Endgerätes bereitgestellten analogen Sprachsignale analogen Audio-Signale abgegriffen. Klinkenstecker und Kabel sind Bestandteil des Eingangsmoduls (1) der erfindungsgemäßen Wiedergabevorrichtung, in welchem die mittels des Klinkensteckers abgegriffenen analogen Audio-Signale in akustische Teilsignale mit jeweils unterschiedlichen Frequenzbereichen aufgeteilt und digitalisiert werden. Nach Herausfiltern der Umgebungsgeräusche werden die akustischen Teilsignale einer Spracherkennung unterworfen, welche ebenfalls noch Bestandteil des Eingangsmoduls (1) der erfindungsgemäßen Wiedergabevorrichtung ist. Die hierfür notwendige Spracherkennungssoftware ist fest in einem Speicher des Wiedergabegerätes abgespeichert. Die erfindungsgemäße Wiedergabevorrichtung umfasst ferner ein Übersetzungsmodul (2), welches über eine Datenleitung mit dem Eingangsmodul (1) verbunden ist, und der Übersetzung der empfangenen dekodierten Sprachinformation in eine zu definierende Zielsprache dient. Ferner umfasst die erfindungsgemäße Wiedergabevorrichtung noch einen Lautsprecher (3), welcher ebenfalls über eine Datenleitung mit dem Übersetzungsmodul (2) verbunden ist, und der vom Bediener der erfindungsgemäßen Wiedergabevorrichtung akustisch wahrnehmbaren Ausgabe des in die Zielsprache übersetzten Tonsignals dient. Alternativ oder in Ergänzung hierzu kann auch ein (in diesem Ausführungsbeispiel nicht dargestellter) Bildschirm an das Übersetzungsmodul (2) angeschlossen sein, auf dem die Tonsignale nach einer entsprechenden Bearbeitung und Übersetzung schriftbildlich dargestellt werden.
  • Bezugszeichenliste
  • 1
    Eingangsmodul
    2
    Übersetzungsmodul
    3
    Lautsprecher
  • ZITATE ENTHALTEN IN DER BESCHREIBUNG
  • Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
  • Zitierte Patentliteratur
    • WO 1997/001243 [0003, 0005]
    • JP 2014-021485 A [0004, 0005]

Claims (4)

  1. Vorrichtung zur Wiedergabe von Sprachinformation, umfassend ein Eingangsmodul (1) zum Empfangen von Sprachinformation, ein Übersetzungsmodul (2) zum Übersetzen der im Eingangsmodul empfangenen Sprachinformation sowie ein Ausgabemodul zum Ausgeben der übersetzten Sprachinformation, dadurch gekennzeichnet, dass das Eingangsmodul (1) einen als dreipoligen Stereostecker ausgeführten Klinkenstecker umfasst und zum Empfang von Tonsignalen über den Klinkenstecker eingerichtet ist.
  2. Vorrichtung zur Wiedergabe von Sprachinformationen nach Patentanspruch 1, dadurch gekennzeichnet, dass das Ausgabemodul mindestens einen Lautsprecher (3) umfasst.
  3. Vorrichtung zur Wiedergabe von Sprachinformationen nach einem der Patentansprüche 1 bis 2, dadurch gekennzeichnet, dass das Ausgabemodul einen Bildschirm umfasst.
  4. Kopfhörer umfassend eine Vorrichtung zur Wiedergabe von Sprachinformationen nach einem der Patentansprüche 1 oder 2.
DE102016113781.2A 2016-07-26 2016-07-26 Vorrichtung zur Wiedergabe von Sprachinformation Withdrawn DE102016113781A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102016113781.2A DE102016113781A1 (de) 2016-07-26 2016-07-26 Vorrichtung zur Wiedergabe von Sprachinformation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102016113781.2A DE102016113781A1 (de) 2016-07-26 2016-07-26 Vorrichtung zur Wiedergabe von Sprachinformation

Publications (1)

Publication Number Publication Date
DE102016113781A1 true DE102016113781A1 (de) 2018-02-01

Family

ID=60951364

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102016113781.2A Withdrawn DE102016113781A1 (de) 2016-07-26 2016-07-26 Vorrichtung zur Wiedergabe von Sprachinformation

Country Status (1)

Country Link
DE (1) DE102016113781A1 (de)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997001243A1 (fr) 1995-06-20 1997-01-09 Tovarischestvo S Ogranichennoi Otvetstvennostju 'universal Kommunications' Procede de diffusion d'emissions televisees avec interpretation simultanee
JP2014021485A (ja) 2012-07-20 2014-02-03 Tpv Display Technology (Xiamen) Co Ltd 多国言語音声翻訳を具えるテレビシステム及びその実現方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997001243A1 (fr) 1995-06-20 1997-01-09 Tovarischestvo S Ogranichennoi Otvetstvennostju 'universal Kommunications' Procede de diffusion d'emissions televisees avec interpretation simultanee
JP2014021485A (ja) 2012-07-20 2014-02-03 Tpv Display Technology (Xiamen) Co Ltd 多国言語音声翻訳を具えるテレビシステム及びその実現方法

Similar Documents

Publication Publication Date Title
EP1912474B1 (de) Verfahren zum Betreiben einer Hörhilfe, sowie Hörhilfe
DE19943875A1 (de) System zur Sprachsteuerung mit einem Mikrofonarray
DE112015006800T5 (de) Verfahren und Kopfhörersatz zur Verbesserung einer Tonqualität
WO2022106654A3 (en) Methods and systems for video translation
EP1912472A1 (de) Verfahren zum Betreiben einer Hörhilfe, sowie Hörhilfe
EP3430819A1 (de) Ohrhörer mit getrennten mikrofonen für binauralaufnahmen und zum telefonieren
EP2084937B1 (de) Verfahren und vorrichtung zur aufnahme, übertragung und wiedergabe von schallereignissen für kommunikationsanwendungen
EP2077059B1 (de) Verfahren zum betreiben einer hörhilfe, sowie hörhilfe
EP2047668A1 (de) Verfahren, sprachdialogsystem und telekommunikationsendgerät zur multilingualen sprachausgabe
DE102006001730A1 (de) Beschallungsanlage, Verfahren zur Verbesserung der Sprachqualität und/oder Verständlichkeit von Sprachdurchsagen sowie Computerprogramm
DE102020207482B4 (de) Verfahren zum Ausgaben von nutzerindividuellen akustischen Signalen mit einer Ausgabeeinheit, Computerprogrammprodukt und elektronisches Signalverarbeitungssystem
DE102019208742B4 (de) Sprachübersetzungssystem zum Bereitstellen einer Übersetzung eines Spracheingabesignals eines Sprechers in ein anderssprachiges Sprachausgabesignal für einen Hörer sowie Übersetzungsverfahren für ein derartiges Sprachübersetzungssystem
DE102016113781A1 (de) Vorrichtung zur Wiedergabe von Sprachinformation
DE102015212609A1 (de) Verfahren zum Betrieb eines Hörgerätesystems und Hörgerätesystem
EP2156654B1 (de) Mobile telekommunikationseinrichtung zum übertragen und übersetzen von informationen
DE102008023370A1 (de) Verfahren zum Betreiben eines Hörgeräts und Hörgerät
DE102007003551A1 (de) Medien-Playbacksystem mit Echtzeit-Kamerabildanzeige und zugehöriges Verfahren
EP1472906A2 (de) Virtueller assistent, der einem benutzer einer datenendeinrichtung hörbare informationen mittels mindestens zwei elektroakustischen wandlern ausgibt, und verfahren zur darbietung von hörbaren informationen eines virtuellen assistenten
DE112019005697T5 (de) Verfahren zur Bereitstellung von Dienstleistungen unter Verwendung eines Ohrbügels
DE69818238T2 (de) Verfahren zur dreidimensionalen lokalisierung von sprache
DE102018213367A1 (de) Verfahren und Telefonievorrichtung zur Geräuschunterdrückung eines systemgenerierten Audiosignals bei einem Telefonat sowie ein Fahrzeug mit der Telefonievorrichtung
DE102016204708A1 (de) Fortbewegungsmittel und Verfahren zur Anpassung einer Audiowiedergabelautstärke
DE202011105898U1 (de) Software-definiertes Hörgerät für ein Multimedia-Handy (Smartphone)
DE102019106187A1 (de) Vorrichtung zur selektiven Geräuschunterdrückung
DE10327053A1 (de) Audiosystem zum parallelen Hören unterschiedlicher Audioquellen

Legal Events

Date Code Title Description
R005 Application deemed withdrawn due to failure to request examination