DE19625455A1 - Vorrichtung und Verfahren zur Spracherkennung - Google Patents

Vorrichtung und Verfahren zur Spracherkennung

Info

Publication number
DE19625455A1
DE19625455A1 DE1996125455 DE19625455A DE19625455A1 DE 19625455 A1 DE19625455 A1 DE 19625455A1 DE 1996125455 DE1996125455 DE 1996125455 DE 19625455 A DE19625455 A DE 19625455A DE 19625455 A1 DE19625455 A1 DE 19625455A1
Authority
DE
Germany
Prior art keywords
channels
sound signals
sound
signals
takes place
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1996125455
Other languages
English (en)
Inventor
Guenther Weber
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Deutschland GmbH
Original Assignee
Nokia Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Deutschland GmbH filed Critical Nokia Deutschland GmbH
Priority to DE1996125455 priority Critical patent/DE19625455A1/de
Publication of DE19625455A1 publication Critical patent/DE19625455A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

Technisches Gebiet
Die Erfindung befaßt sich mit der Spracherkennung in Tondarbietungen, insbesondere mit der Spracherkennung in Tondarbietungen, welche in unregelmäßiger Reihenfolge rein Sprach- als auch reine Musikdarbietungen enthalten.
Stand der Technik
Gemäß dem Stand der Technik ist es bekannt, Tondarbietungen in Bezug auf die Wiedergabeparameter zu verändern bzw. anzupassen. So ist es beispielsweise bekannt, bestimmte Signalanteile verzögert abzugeben. Die Anordnungen zum automatischen Anpassen von Wiedergabeparametern können dabei analog oder auch digital aufgebaut sein, wobei digitale Anordnungen mit Rücksicht auf die Rechenzeit zur Anpassung der Wiedergabeparameter immer mehr in den Vordergrund rücken.
Wenngleich sich derartige Anordnungen zur Anpassung von Musikdarbietungen bewährt haben, treten bei solchen Anordnungen dann Probleme auf, wenn die Tondarbietung aus einer Abfolge von Musik- und Sprachdarbietungen besteht. Solche Bedingungen herrschen dann vor, wenn etwa ein Radio die Tonsignalquelle bildet, da dort die Tondarbietung neben der Musikwiedergabe auch Ansagen, Verkehrsdurchsagen und die Nachrichtenwiedergabe umfaßt. Dadurch, daß die Anordnungen zur Beeinflussung der Wiedergabeparameter lediglich in der Lage sind Musikdarbietungen optimal zu modifizieren, sinkt automatisch die Sprachverständlichkeit, wenn unmittelbar nach einer Musikdarbietung beispielsweise eine Ansage folgt.
Daher liegt der Erfindung die Aufgabe zugrunde, eine Anordnung und eine Methode anzugeben, welche die Nachteile gemäß dem Stand der Technik beseitigt und somit auch für eine optimale Sprachverständlichkeit sorgt.
Darstellung der Erfindung
Diese Aufgabe wird mit den in Anspruch 1 angegebenen Merkmalen gelöst. Methoden zur Realisierung sind in den Ansprüchen 4, 5 und 6 angegeben. Vorteilhafte Aus- und Weiterbildungen sind in Ansprüchen 2, 3 und 7 entnehmbar.
Der Erfindung liegt die Erkenntnis zugrunde, daß bei Radiodarbietungen bzw. darauf basierenden Bandaufzeichnungen die Musikdarbietungen im Stereoformat vorliegen, während die reine Sprachdarbietung im Monoformat vorliegt bzw. abgestrahlt wird. Diese unterschiedlichen Formate macht sich die Erfindung zunutze, indem sie Korrelationen zwischen den in beiden Stereokanälen liegenden Tondarbietungen ermittelt und bei Ermittlung von Übereinstimmungen, d. h. bei Vorliegen von Sprache, gemäß Anspruch 1 eine spezielle und von der bei Vorhandensein von verschiedenen Tonsignalen in beiden Kanälen gültigen Anpassung der Wiedergabeparameter verschiedene Anpassung der Wiedergabeparameter auslöst.
Eine besonders einfache Anpassung ist dann gegeben, wenn die Anordnung zum automatischen Anpassen und Verändern von Wiedergabeparameter eine Anordnung zu digitalen Modifizierung von Tonsignalen ist.
Im einfachsten Fall kann die Anpassung der Wiedergabeparameter an Sprachdarbietungen dadurch erfolgen, daß nach Feststellung von Sprache die für Musikdarbietungen gültigen Anpassungen der Wiedergabeparameter einfach inaktiv geschaltet werden.
Die in den Ansprüchen 2-7 angegebenen Methoden führen sämtlich zur Spracherkennung, wobei hier lediglich Unterschiede in den Voraussetzungen und in der Rechenzeit liegen.
So ist z. B. die in Anspruch 4 angegebene Methode sehr langwierig. Die Methode gemäß Anspruch 5 ist sehr aufwendig und setzt voraus, daß zur Elimination des Gleichspannungsanteils die Signale aus beiden Kanälen beispielsweise durch einen Hochpaß gefiltert werden.
Soll gemäß Anspruch 6 die Sprachermittlung mittels einer Differenzbildung in beiden Kanälen vollzogen werden, so müssen beide Kanäle eine gleich hohe Aussteuerung (Balance) aufweisen. Außerdem ist hierbei auch der Gleichspannungsanteil zu eliminieren.
Zur Ermittlung von Sprachanteilen in einer Tondarbietung ist die Methode gemäß Anspruch 7 sehr vorteilhaft, weil sie u. a. den Aufwand, welcher zur Ausführung einer Methode nach Anspruch 5 notwendig ist, deutlich reduziert. Auch läßt sich eine solche Methode sehr einfach in einer digitalen Anordnung zur Anpassung von Wiedergabeparametern realisieren.
Wege zum Ausführen der Erfindung
Die Erfindung soll nun anhand einer einzigen Figur näher erläutert werden.
Mit dem Bezugszeichen 10 ist im vorliegenden Ausführungsbeispiel eine stereophone Tonsignalquelle bezeichnet, welche vorliegend ein Radio ist. Diese Tonsignalquelle 10 kann in einem anderen Ausführungsbeispiel auch ein Telefon oder ein Casettenrecorder sein. Der Tonsignalquelle 10 nachgeordnet ist eine Anordnung 11 zum automatischen Anpassen von Wiedergabeparametern bei Tonsignaldarbietungen. Die Anordnung 11 ist hier nur schematisch gezeigt, indem sich die Darstellung nur auf die für diese Erfindung notwendigen Komponenten beschränkt.
Die Tonsignale der Tonsignalquelle 10 werden der Anordnung 11 kanalweise zur Verfügung gestellt, wobei das Symbol R für den rechten Kanal und Symbol L für den linken Kanal steht. Nur der Vollständigkeit halber sei darauf hingewiesen, daß die Anordnung 11 auch mit einer Mehrzahl von Tonsignalquellen 10 verbunden sein kann.
Innerhalb der Anordnung 11 wird jeder Kanal L. R einem Hochpaß 12 zugeführt, in welchem der Gleichspannungsanteil der Tonsignale in beiden Kanälen eliminiert wird. So dann werden die gleichgerichteten Tonsignale kanalweise je einer Umformeinheit 13 zugeführt, welche die Tonsignale in Rechtecksignale umwandelt. In der nachfolgenden Vergleichsanordnung 14 werden die beiden vorliegenden Rechtecksignale auf Identität geprüft. Im nachfolgenden Mittelungsglied 15 wird dann eine zeitliche Mittelung durchgeführt, um eine zufällige Identität in beiden Kanälen R, L auszuschließen. Ergibt sich nach dem Mittelungsglied 15 eine Identität in beiden Kanälen L, R so werden über die Steuerleitungen 16 die Klangparametereinsteller 17 in den abgezweigten Kanälen L′, R auf Sprachwiedergabe umgestellt werden.
Anstatt eine Umstellung der Klangparametereinsteller 17 auf Sprachwiedergabe, kann die Sprachverständlichkeit in einem anderen, nicht dargestellten Ausführungsbeispiel auch dadurch verbessert werden, daß bei Vorliegen einer Tonsignalidentität in beiden Kanälen L, R die für die Musikwiedergabe gültigen Einstellungen inaktiv geschaltet werden.

Claims (7)

1. Vorrichtung zur Steigerung der Sprachverständlichkeit im Rahmen von Tondarbietungen, mit einer zweikanaligen Tonsignalquelle (10) und mit einer Anordnung (11) zum automatischen Anpassen und Verändern von Wiedergabeparametern anhand der von der Tonsignalquelle (10) abgegebenen Tonsignale, dadurch gekennzeichnet, daß die Anordnung (11) eine Vergleichschaltung (14) umfaßt, die die Identität der Tonsignale in den beiden Kanälen L, R der Tonsignalquelle (10) überprüft und die bei Feststellung von identischen Tonsignalen in beiden Kanälen L, R eine spezielle und von der bei Vorhandensein von unterschiedlichen Tonsignalen in beiden Kanälen L, R gültigen Anpassung der Wiedergabeparameter verschiedene Anpassung der Wiedergabeparameter auslöst.
2. Vorrichtung nach Anspruch 1, dadurch gekennzeichnet, daß bei Feststellung von identischen Tonsignalen in beiden Kanälen L, R die für unterschiedliche Tonsignale in beiden Kanälen L, R gültigen Anpassungen der Wiedergabeparameter in den Klangparametereinstellern (17) abgeschaltet sind.
3. Vorrichtung nach Anspruch 1 und Anspruch 2, dadurch gekennzeichnet, daß die Anordnung zum automatischen Anpassen und Verändern von Wiedergabeparametern eine Anordnung zum digitalen Modifizieren von Tonsignalen ist.
4. Methode zur Ermittlung der Identität von Tonsignalen in den beiden Kanälen L, R gemäß Anspruch 1 oder Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt die mathematische Korrelation zwischen den Tonsignalen in den beiden Kanälen L, R ermittelt wird und
daß anschließend eine zeitliche Mittelung erfolgt.
5. Methode zu Ermittlung der Identität von Tonsignalen in den Kanälen L, R gemäß Anspruch 1 oder Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Phasenmessung der Tonsignale in den beiden Kanälen L, R erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
6. Methode zur Ermittlung der Identität der Kanalbelegung gemäß Anspruch 1 oder Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Differenzbildung zwischen den in den beiden Kanälen L, R gültigen Tonsignalen erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
7. Methode nach Anspruch 5 dadurch gekennzeichnet, daß die Phasenmeßung anschließend an Schnitt 1 vereinfacht abläuft, indem die gefilterten Tonsignale in beiden Kanäle L, in Rechtecksignale umgewandelt werden und dann, bevor die zeitliche Mittelung erfolgt, die gebildeten Rechtecksignale von beiden Kanälen L, R miteinander verglichen werden.
DE1996125455 1996-06-26 1996-06-26 Vorrichtung und Verfahren zur Spracherkennung Withdrawn DE19625455A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE1996125455 DE19625455A1 (de) 1996-06-26 1996-06-26 Vorrichtung und Verfahren zur Spracherkennung

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1996125455 DE19625455A1 (de) 1996-06-26 1996-06-26 Vorrichtung und Verfahren zur Spracherkennung

Publications (1)

Publication Number Publication Date
DE19625455A1 true DE19625455A1 (de) 1998-01-02

Family

ID=7797993

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1996125455 Withdrawn DE19625455A1 (de) 1996-06-26 1996-06-26 Vorrichtung und Verfahren zur Spracherkennung

Country Status (1)

Country Link
DE (1) DE19625455A1 (de)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3236000C2 (de) * 1982-09-29 1990-01-25 Blaupunkt-Werke Gmbh, 3200 Hildesheim, De
EP0517233A1 (de) * 1991-06-06 1992-12-09 Matsushita Electric Industrial Co., Ltd. Gerät zur Unterscheidung von Musik und Sprache
DE4141843A1 (de) * 1991-12-18 1993-06-24 Deutsche Aerospace Verfahren zur steuerung der signalwiedergabe von gemischten musik- und sprachsignalen sowie schaltungsanordnungen zum durchfuehren des verfahrens
US5298674A (en) * 1991-04-12 1994-03-29 Samsung Electronics Co., Ltd. Apparatus for discriminating an audio signal as an ordinary vocal sound or musical sound
US5333199A (en) * 1991-06-25 1994-07-26 Nec Corporation Digital signal processor for simultaneously processing left and right signals
WO1996002911A1 (en) * 1992-10-05 1996-02-01 Matsushita Electric Industrial Co., Ltd. Speech detection device

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3236000C2 (de) * 1982-09-29 1990-01-25 Blaupunkt-Werke Gmbh, 3200 Hildesheim, De
US5298674A (en) * 1991-04-12 1994-03-29 Samsung Electronics Co., Ltd. Apparatus for discriminating an audio signal as an ordinary vocal sound or musical sound
EP0517233A1 (de) * 1991-06-06 1992-12-09 Matsushita Electric Industrial Co., Ltd. Gerät zur Unterscheidung von Musik und Sprache
US5333199A (en) * 1991-06-25 1994-07-26 Nec Corporation Digital signal processor for simultaneously processing left and right signals
DE4141843A1 (de) * 1991-12-18 1993-06-24 Deutsche Aerospace Verfahren zur steuerung der signalwiedergabe von gemischten musik- und sprachsignalen sowie schaltungsanordnungen zum durchfuehren des verfahrens
WO1996002911A1 (en) * 1992-10-05 1996-02-01 Matsushita Electric Industrial Co., Ltd. Speech detection device

Similar Documents

Publication Publication Date Title
DE68927036T2 (de) Toneffekt-System
DE4209544C2 (de)
DE68928180T2 (de) Stereoeffektverbesserung und richtcharakteristikregelung
DE69214882T2 (de) Gerät zur Unterscheidung von Musik und Sprache
DE69420982T2 (de) Schaltung für mehrdimensionalen Schall
DE2355881A1 (de) Verfahren und anordnung zur reduzierung von rauscheffekten in stereogeraeten
DE2536682C3 (de) Schaltungsanordnung fur die stereophone Tonwiedergabe
DE19715498B4 (de) Stereoklangbildverbesserungsvorrichtungen und -verfahren unter Verwendung von Tabellen
DE3100135A1 (de) Vorrichtung und verfahren zum schulen des gehoers eines patienten
DE2460278A1 (de) Schaltungsanordnung zur mehrkanaltonwiedergabe
EP0825800A2 (de) Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
EP0712264B1 (de) Verfahren und Vorrichtung zur mehrkanaligen Tonwiedergabe
DE10148351A1 (de) Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus
DE19625455A1 (de) Vorrichtung und Verfahren zur Spracherkennung
DE4141843B4 (de) Verfahren zur Steuerung der Signalwiedergabe von gemischten Musik- und Sprachsignalen, Schaltungsanordnungen zum Durchführen des Verfahrens sowie Anwendungen des Verfahrens bzw. der Schaltungsanordnung
DE1085919B (de) Wiedergabevorrichtung mit selbsttaetiger Verstaerkungsregelung
DE19980688B3 (de) Audio-Wiedergabevorrichtung
DE2456376C2 (de) Decodierer für ein 4-2-4-Matrix-Stereosystem
DE3238399C2 (de)
DE3504407A1 (de) Frequenznachlaufeinrichtung in einem stereo-fm-rundfunkempfaenger
DE2109557B2 (de) Kompatibles Vierkanal-Rundfunkübertragungssystem
EP1024679A2 (de) Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
DE2528260C3 (de) Vierkanal-Aufzeichnungssystem für plattenförmige Tonträger mit Signalpegelregelung
EP1519628A2 (de) Verfahren und Vorrichtung zur Wiedergabe eines aus einem monauralen Eingangssignal erzeugten binauralen Ausgangssignals
DE2422424C2 (de) Verfahren zur Aufzeichnung von vier Kanalsignalen auf den beiden Seitenwänden der Rille einer Schallplatte

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee