DE19625455A1 - Vorrichtung und Verfahren zur Spracherkennung - Google Patents
Vorrichtung und Verfahren zur SpracherkennungInfo
- Publication number
- DE19625455A1 DE19625455A1 DE1996125455 DE19625455A DE19625455A1 DE 19625455 A1 DE19625455 A1 DE 19625455A1 DE 1996125455 DE1996125455 DE 1996125455 DE 19625455 A DE19625455 A DE 19625455A DE 19625455 A1 DE19625455 A1 DE 19625455A1
- Authority
- DE
- Germany
- Prior art keywords
- channels
- sound signals
- sound
- signals
- takes place
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 12
- 238000012935 Averaging Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims 3
- 238000001514 detection method Methods 0.000 claims 2
- 238000005259 measurement Methods 0.000 claims 2
- 230000006978 adaptation Effects 0.000 abstract description 3
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
Die Erfindung befaßt sich mit der Spracherkennung in Tondarbietungen, insbesondere mit der
Spracherkennung in Tondarbietungen, welche in unregelmäßiger Reihenfolge rein Sprach- als auch
reine Musikdarbietungen enthalten.
Gemäß dem Stand der Technik ist es bekannt, Tondarbietungen in Bezug auf die
Wiedergabeparameter zu verändern bzw. anzupassen. So ist es beispielsweise bekannt, bestimmte
Signalanteile verzögert abzugeben. Die Anordnungen zum automatischen Anpassen von
Wiedergabeparametern können dabei analog oder auch digital aufgebaut sein, wobei digitale
Anordnungen mit Rücksicht auf die Rechenzeit zur Anpassung der Wiedergabeparameter immer
mehr in den Vordergrund rücken.
Wenngleich sich derartige Anordnungen zur Anpassung von Musikdarbietungen bewährt haben,
treten bei solchen Anordnungen dann Probleme auf, wenn die Tondarbietung aus einer Abfolge
von Musik- und Sprachdarbietungen besteht. Solche Bedingungen herrschen dann vor, wenn etwa
ein Radio die Tonsignalquelle bildet, da dort die Tondarbietung neben der Musikwiedergabe auch
Ansagen, Verkehrsdurchsagen und die Nachrichtenwiedergabe umfaßt. Dadurch, daß die
Anordnungen zur Beeinflussung der Wiedergabeparameter lediglich in der Lage sind
Musikdarbietungen optimal zu modifizieren, sinkt automatisch die Sprachverständlichkeit, wenn
unmittelbar nach einer Musikdarbietung beispielsweise eine Ansage folgt.
Daher liegt der Erfindung die Aufgabe zugrunde, eine Anordnung und eine Methode anzugeben,
welche die Nachteile gemäß dem Stand der Technik beseitigt und somit auch für eine optimale
Sprachverständlichkeit sorgt.
Diese Aufgabe wird mit den in Anspruch 1 angegebenen Merkmalen gelöst. Methoden zur
Realisierung sind in den Ansprüchen 4, 5 und 6 angegeben. Vorteilhafte Aus- und
Weiterbildungen sind in Ansprüchen 2, 3 und 7 entnehmbar.
Der Erfindung liegt die Erkenntnis zugrunde, daß bei Radiodarbietungen bzw. darauf basierenden
Bandaufzeichnungen die Musikdarbietungen im Stereoformat vorliegen, während die reine
Sprachdarbietung im Monoformat vorliegt bzw. abgestrahlt wird. Diese unterschiedlichen
Formate macht sich die Erfindung zunutze, indem sie Korrelationen zwischen den in beiden
Stereokanälen liegenden Tondarbietungen ermittelt und bei Ermittlung von Übereinstimmungen,
d. h. bei Vorliegen von Sprache, gemäß Anspruch 1 eine spezielle und von der bei Vorhandensein
von verschiedenen Tonsignalen in beiden Kanälen gültigen Anpassung der Wiedergabeparameter
verschiedene Anpassung der Wiedergabeparameter auslöst.
Eine besonders einfache Anpassung ist dann gegeben, wenn die Anordnung zum automatischen
Anpassen und Verändern von Wiedergabeparameter eine Anordnung zu digitalen Modifizierung
von Tonsignalen ist.
Im einfachsten Fall kann die Anpassung der Wiedergabeparameter an Sprachdarbietungen
dadurch erfolgen, daß nach Feststellung von Sprache die für Musikdarbietungen gültigen
Anpassungen der Wiedergabeparameter einfach inaktiv geschaltet werden.
Die in den Ansprüchen 2-7 angegebenen Methoden führen sämtlich zur Spracherkennung, wobei
hier lediglich Unterschiede in den Voraussetzungen und in der Rechenzeit liegen.
So ist z. B. die in Anspruch 4 angegebene Methode sehr langwierig. Die Methode gemäß
Anspruch 5 ist sehr aufwendig und setzt voraus, daß zur Elimination des Gleichspannungsanteils
die Signale aus beiden Kanälen beispielsweise durch einen Hochpaß gefiltert werden.
Soll gemäß Anspruch 6 die Sprachermittlung mittels einer Differenzbildung in beiden Kanälen
vollzogen werden, so müssen beide Kanäle eine gleich hohe Aussteuerung (Balance) aufweisen.
Außerdem ist hierbei auch der Gleichspannungsanteil zu eliminieren.
Zur Ermittlung von Sprachanteilen in einer Tondarbietung ist die Methode gemäß Anspruch 7
sehr vorteilhaft, weil sie u. a. den Aufwand, welcher zur Ausführung einer Methode nach
Anspruch 5 notwendig ist, deutlich reduziert. Auch läßt sich eine solche Methode sehr einfach in
einer digitalen Anordnung zur Anpassung von Wiedergabeparametern realisieren.
Die Erfindung soll nun anhand einer einzigen Figur näher erläutert werden.
Mit dem Bezugszeichen 10 ist im vorliegenden Ausführungsbeispiel eine stereophone
Tonsignalquelle bezeichnet, welche vorliegend ein Radio ist. Diese Tonsignalquelle 10 kann in
einem anderen Ausführungsbeispiel auch ein Telefon oder ein Casettenrecorder sein. Der
Tonsignalquelle 10 nachgeordnet ist eine Anordnung 11 zum automatischen Anpassen von
Wiedergabeparametern bei Tonsignaldarbietungen. Die Anordnung 11 ist hier nur schematisch
gezeigt, indem sich die Darstellung nur auf die für diese Erfindung notwendigen Komponenten
beschränkt.
Die Tonsignale der Tonsignalquelle 10 werden der Anordnung 11 kanalweise zur Verfügung
gestellt, wobei das Symbol R für den rechten Kanal und Symbol L für den linken Kanal steht.
Nur der Vollständigkeit halber sei darauf hingewiesen, daß die Anordnung 11 auch mit einer
Mehrzahl von Tonsignalquellen 10 verbunden sein kann.
Innerhalb der Anordnung 11 wird jeder Kanal L. R einem Hochpaß 12 zugeführt, in welchem der
Gleichspannungsanteil der Tonsignale in beiden Kanälen eliminiert wird. So dann werden die
gleichgerichteten Tonsignale kanalweise je einer Umformeinheit 13 zugeführt, welche die
Tonsignale in Rechtecksignale umwandelt. In der nachfolgenden Vergleichsanordnung 14 werden
die beiden vorliegenden Rechtecksignale auf Identität geprüft. Im nachfolgenden Mittelungsglied
15 wird dann eine zeitliche Mittelung durchgeführt, um eine zufällige Identität in beiden Kanälen
R, L auszuschließen. Ergibt sich nach dem Mittelungsglied 15 eine Identität in beiden Kanälen L,
R so werden über die Steuerleitungen 16 die Klangparametereinsteller 17 in den abgezweigten
Kanälen L′, R auf Sprachwiedergabe umgestellt werden.
Anstatt eine Umstellung der Klangparametereinsteller 17 auf Sprachwiedergabe, kann die
Sprachverständlichkeit in einem anderen, nicht dargestellten Ausführungsbeispiel auch dadurch
verbessert werden, daß bei Vorliegen einer Tonsignalidentität in beiden Kanälen L, R die für die
Musikwiedergabe gültigen Einstellungen inaktiv geschaltet werden.
Claims (7)
1. Vorrichtung zur Steigerung der Sprachverständlichkeit im Rahmen von Tondarbietungen,
mit einer zweikanaligen Tonsignalquelle (10) und mit einer Anordnung (11) zum automatischen
Anpassen und Verändern von Wiedergabeparametern anhand der von der Tonsignalquelle
(10) abgegebenen Tonsignale,
dadurch gekennzeichnet,
daß die Anordnung (11) eine Vergleichschaltung (14) umfaßt, die die Identität der Tonsignale
in den beiden Kanälen L, R der Tonsignalquelle (10) überprüft und die bei Feststellung von
identischen Tonsignalen in beiden Kanälen L, R eine spezielle und von der bei
Vorhandensein von unterschiedlichen Tonsignalen in beiden Kanälen L, R gültigen
Anpassung der Wiedergabeparameter verschiedene Anpassung der Wiedergabeparameter
auslöst.
2. Vorrichtung nach Anspruch 1,
dadurch gekennzeichnet,
daß bei Feststellung von identischen Tonsignalen in beiden Kanälen L, R die für
unterschiedliche Tonsignale in beiden Kanälen L, R gültigen Anpassungen der
Wiedergabeparameter in den Klangparametereinstellern (17) abgeschaltet sind.
3. Vorrichtung nach Anspruch 1 und Anspruch 2,
dadurch gekennzeichnet,
daß die Anordnung zum automatischen Anpassen und Verändern von
Wiedergabeparametern eine Anordnung zum digitalen Modifizieren von Tonsignalen ist.
4. Methode zur Ermittlung der Identität von Tonsignalen in den beiden Kanälen L, R gemäß
Anspruch 1 oder Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt die mathematische Korrelation zwischen den Tonsignalen in den beiden Kanälen L, R ermittelt wird und
daß anschließend eine zeitliche Mittelung erfolgt.
dadurch gekennzeichnet,
daß in einem ersten Schritt die mathematische Korrelation zwischen den Tonsignalen in den beiden Kanälen L, R ermittelt wird und
daß anschließend eine zeitliche Mittelung erfolgt.
5. Methode zu Ermittlung der Identität von Tonsignalen in den Kanälen L, R gemäß Anspruch
1 oder Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Phasenmessung der Tonsignale in den beiden Kanälen L, R erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Phasenmessung der Tonsignale in den beiden Kanälen L, R erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
6. Methode zur Ermittlung der Identität der Kanalbelegung gemäß Anspruch 1 oder
Anspruch 2,
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Differenzbildung zwischen den in den beiden Kanälen L, R gültigen Tonsignalen erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
dadurch gekennzeichnet,
daß in einem ersten Schritt der Gleichspannungsanteil in beiden Kanälen L, R eliminiert wird,
daß in einem zweiten Schritt eine Differenzbildung zwischen den in den beiden Kanälen L, R gültigen Tonsignalen erfolgt und
daß anschließend eine zeitliche Mittelung erfolgt.
7. Methode nach Anspruch 5
dadurch gekennzeichnet,
daß die Phasenmeßung anschließend an Schnitt 1 vereinfacht abläuft, indem die gefilterten
Tonsignale in beiden Kanäle L, in Rechtecksignale umgewandelt werden und dann, bevor
die zeitliche Mittelung erfolgt, die gebildeten Rechtecksignale von beiden Kanälen L, R
miteinander verglichen werden.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996125455 DE19625455A1 (de) | 1996-06-26 | 1996-06-26 | Vorrichtung und Verfahren zur Spracherkennung |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE1996125455 DE19625455A1 (de) | 1996-06-26 | 1996-06-26 | Vorrichtung und Verfahren zur Spracherkennung |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19625455A1 true DE19625455A1 (de) | 1998-01-02 |
Family
ID=7797993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1996125455 Withdrawn DE19625455A1 (de) | 1996-06-26 | 1996-06-26 | Vorrichtung und Verfahren zur Spracherkennung |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19625455A1 (de) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3236000C2 (de) * | 1982-09-29 | 1990-01-25 | Blaupunkt-Werke Gmbh, 3200 Hildesheim, De | |
EP0517233A1 (de) * | 1991-06-06 | 1992-12-09 | Matsushita Electric Industrial Co., Ltd. | Gerät zur Unterscheidung von Musik und Sprache |
DE4141843A1 (de) * | 1991-12-18 | 1993-06-24 | Deutsche Aerospace | Verfahren zur steuerung der signalwiedergabe von gemischten musik- und sprachsignalen sowie schaltungsanordnungen zum durchfuehren des verfahrens |
US5298674A (en) * | 1991-04-12 | 1994-03-29 | Samsung Electronics Co., Ltd. | Apparatus for discriminating an audio signal as an ordinary vocal sound or musical sound |
US5333199A (en) * | 1991-06-25 | 1994-07-26 | Nec Corporation | Digital signal processor for simultaneously processing left and right signals |
WO1996002911A1 (en) * | 1992-10-05 | 1996-02-01 | Matsushita Electric Industrial Co., Ltd. | Speech detection device |
-
1996
- 1996-06-26 DE DE1996125455 patent/DE19625455A1/de not_active Withdrawn
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3236000C2 (de) * | 1982-09-29 | 1990-01-25 | Blaupunkt-Werke Gmbh, 3200 Hildesheim, De | |
US5298674A (en) * | 1991-04-12 | 1994-03-29 | Samsung Electronics Co., Ltd. | Apparatus for discriminating an audio signal as an ordinary vocal sound or musical sound |
EP0517233A1 (de) * | 1991-06-06 | 1992-12-09 | Matsushita Electric Industrial Co., Ltd. | Gerät zur Unterscheidung von Musik und Sprache |
US5333199A (en) * | 1991-06-25 | 1994-07-26 | Nec Corporation | Digital signal processor for simultaneously processing left and right signals |
DE4141843A1 (de) * | 1991-12-18 | 1993-06-24 | Deutsche Aerospace | Verfahren zur steuerung der signalwiedergabe von gemischten musik- und sprachsignalen sowie schaltungsanordnungen zum durchfuehren des verfahrens |
WO1996002911A1 (en) * | 1992-10-05 | 1996-02-01 | Matsushita Electric Industrial Co., Ltd. | Speech detection device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE68927036T2 (de) | Toneffekt-System | |
DE4209544C2 (de) | ||
DE68928180T2 (de) | Stereoeffektverbesserung und richtcharakteristikregelung | |
DE69214882T2 (de) | Gerät zur Unterscheidung von Musik und Sprache | |
DE69420982T2 (de) | Schaltung für mehrdimensionalen Schall | |
DE2355881A1 (de) | Verfahren und anordnung zur reduzierung von rauscheffekten in stereogeraeten | |
DE2536682C3 (de) | Schaltungsanordnung fur die stereophone Tonwiedergabe | |
DE19715498B4 (de) | Stereoklangbildverbesserungsvorrichtungen und -verfahren unter Verwendung von Tabellen | |
DE3100135A1 (de) | Vorrichtung und verfahren zum schulen des gehoers eines patienten | |
DE2460278A1 (de) | Schaltungsanordnung zur mehrkanaltonwiedergabe | |
EP0825800A2 (de) | Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal | |
EP0712264B1 (de) | Verfahren und Vorrichtung zur mehrkanaligen Tonwiedergabe | |
DE10148351A1 (de) | Verfahren und Vorrichtung zur Auswahl eines Klangalgorithmus | |
DE19625455A1 (de) | Vorrichtung und Verfahren zur Spracherkennung | |
DE4141843B4 (de) | Verfahren zur Steuerung der Signalwiedergabe von gemischten Musik- und Sprachsignalen, Schaltungsanordnungen zum Durchführen des Verfahrens sowie Anwendungen des Verfahrens bzw. der Schaltungsanordnung | |
DE1085919B (de) | Wiedergabevorrichtung mit selbsttaetiger Verstaerkungsregelung | |
DE19980688B3 (de) | Audio-Wiedergabevorrichtung | |
DE2456376C2 (de) | Decodierer für ein 4-2-4-Matrix-Stereosystem | |
DE3238399C2 (de) | ||
DE3504407A1 (de) | Frequenznachlaufeinrichtung in einem stereo-fm-rundfunkempfaenger | |
DE2109557B2 (de) | Kompatibles Vierkanal-Rundfunkübertragungssystem | |
EP1024679A2 (de) | Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen | |
DE2528260C3 (de) | Vierkanal-Aufzeichnungssystem für plattenförmige Tonträger mit Signalpegelregelung | |
EP1519628A2 (de) | Verfahren und Vorrichtung zur Wiedergabe eines aus einem monauralen Eingangssignal erzeugten binauralen Ausgangssignals | |
DE2422424C2 (de) | Verfahren zur Aufzeichnung von vier Kanalsignalen auf den beiden Seitenwänden der Rille einer Schallplatte |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
8139 | Disposal/non-payment of the annual fee |