-
Die
vorliegende Erfindung bezieht sich auf den Bereich der Tonwiedergabe
und insbesondere auf den Bereich der digitalen Audiosignalverarbeitung.
-
Die
vorliegende Erfindung bezieht sich auf ein Tonwiedergabesystem mit
einem digitalen Audiosignaleingang, einem digitalen Audiosignalprozessor
und einem digitalen Audiosignalausgang.
-
Die
vorliegende Erfindung bezieht sich auch auf einen Audiosignalprozessor
zum Verarbeiten eines eintreffenden Audiosignal zu einem Audioausgangssignal.
Insbesondere bezieht sich die vorliegende Erfindung auf eine digitale
Signalprozessorschaltung (DSP) oder ein derartiges Programm.
-
Die
vorliegende Erfindung bezieht sich ebenfalls auf ein Verfahren zum
verarbeiten eines digitalen Audiosignals.
-
Ein
Tonwiedergabesystem, wie beispielsweise ein Lautsprechertelefonsystem,
umfasst einen Ausgangswandler, oft als Lautsprecher bezeichnet,
und einen Eingang für
ein Audiosignal. Der Lautsprecher erzeugt Schalldruckwellen in Reaktion
auf das Eingangsaudiosignal, das für eine gewünschte Schalldruckwelle repräsentativ
ist.
-
Die
Verständlichkeit
des Schalls, wie dieser von dem Hörer erfahren wird, ist sehr
wichtig, insbesondere in einer störungsbehafteten Umgebung. Die
einfachste Art und Weise, die Verständlichkeit zu steigern ist, den
mittleren Schalldruckpegel SPL ("Sound
Pressure Level")
zu steigern, d.h. die Lautstärke
zu erhöhen. Aber
ein einfaches Hochdrehen der Lautstärke führt nicht immer zu einem besser
verständlichen
Schall. Auch ein zu hoher Ausgangswert kann zu einer Überlastung
eines Lautsprechers führen,
was zu einer weiteren Verringerung der Verständlichkeit führt.
-
Es
wurden bereits eine Anzahl Versuche angestellt, die Verständlichkeit
von Schall zu verbessern.
-
Die
US Patentanmeldung US 2002/001503 schlägt beispielsweise vor, die
Verständlichkeit
durch individuelle Einengung der Verstärkungsfaktoren für verschiedene
Frequenzbänder
zu steigern.
-
Die
bestehenden Systeme und Verfahren sind aber entweder sehr kompliziert,
indem sie komplizierte Berechnungen und dadurch eine komplizierte
Schaltungsan ordnung (Hardware) erfordern, oder in dem Fall, dass
ein Programm (Software) verwendet wird, ein komplexes Programm erfordern
oder nur einen geringen Vorteil bieten.
-
Trotz
der oben genannten Referenzen gibt es ein Bedürfnis in dem betreffenden Bereich
nach verbesserten Systemen und Verfahren, die eine verbesserte Verständlichkeit
schaffen.
-
Es
ist nun u. a. eine Aufgabe der vorliegenden Erfindung, ein Tonwiedergabesystem
und ein Verfahren mit einer besseren Verständlichkeit zu schaffen.
-
Dazu
weist das Tonwiedergabesystem nach der vorliegenden Erfindung das
Kennzeichen auf, dass das System einen digitalen Signalprozessor
aufweist, wobei der digitale Signalprozessor ein Hochpassfilter (HP)
mit einer Durchlassfrequenz zwischen einer ersten und einer zweiten
Frequenz aufweist, vorzugsweise zwischen 300 Hz und 2 kHz, einen
Kompressionsverstärker
(22) zur Kompression und Verstärkung eines Signals, wobei
wenigstens die Verstärkung
nach der HP-Filterung durchgeführt
wird, und einen Amplitudenbegrenzer zum Begrenzen des HP-gefilterten,
komprimierten und verstärkten
Signals über
einem Begrenzungspegel.
-
Dem
System nach der vorliegenden Erfindung liegen die nachfolgenden
Erkenntnisse zugrunde:
- 1. Das eintreffende
Signal wird verstärkt
um die Loudness zu steigern, aber
- 2. das Steigern des eintreffenden Signals könnte zu einem Signal höher als
das maximale digitale Signal führen,
unter solchen Umständen
würde das
Signal oft digital begrenzt werden, was zu einer Verzerrung des
Signals führt.
- 3. Niedrige Frequenzen werden aus dem Signal entfernt, dies
ermöglicht
es, dass der restliche Teil des Signals mit im Schnitt einem höheren Verstärkungsfaktor
verstärkt
werden muss. Dies geschieht durch das Hochpassfilter HP, das sich
vor der Verstärkung
befindet. Die niedrigeren Frequenzen sind, insofern es sich um die
Verständlichkeit
handelt, von geringerer Bedeutung. Die niedrigeren Frequenzen umfassen
einen großen
teil der Amplitude des Signals, so dass Entfernung der niedrigeren
Frequenzen die Amplitude des Signals stark beeinträchtigt,
wodurch Raum für
Verstärkung
geschaffen wird, d.h. eine höhere
Verstärkung für den restlichen
Teil des Signals. Ein großer
Teil der Amplitude insbesondere von Sprache befindet sich in den
niedrigeren Frequenzen, so dass Dämpfung der niedrigeren Frequenzen
eine wesentliche Steigerung an Kopfraum bietet (d.h. Verstärkung ohne
dass dadurch ein Begrenzungspegel getroffen wird).
- 4. Ein einfaches Beschneiden der niedrigeren Frequenzen und
eine Steigerung des Ausgangs würde
laute Töne
ebensoviel steigern wie die gedämpfte
Töne. Obschon
dies zu einer Verbesserung der Verständlichkeit führt, führt dies
nicht immer zu einer einfach wahrnehmbaren Steigerung der Verständlichkeit,
insbesondere nicht, wenn der Loudnessbereich, d.h. der komprimierte
Amplitudenbereich groß ist.
Zur weiteren Steigerung der Verständlichkeit umfasst die Anordnung
einen Kompressionsverstärker
zur Verstärkung
und Kompression eines Signals. Der Amplitudenbereich wird dann komprimiert
(sowie verstärkt).
Der Clipper begrenzt das Signal über
einem Begrenzungspegel, der Begrenzungspegel befindet sich innerhalb
des komprimierten Amplitudenbereichs, wobei die mittlere Loudnessdifferenz
reduziert wird. Die mehr gedämpfte
Töne erfahren
eine größere Verstärkung als
die lautere Töne
(was zu einer Kompression des Signals bis in den komprimierten Amplitudenbereich
führt),
was die Verständlichkeit
steigert, weil die mehr gedämpfte
Töne besser
unterschieden werden können.
Dies geschieht durch den Kompressionsverstärker. Jede beliebige gewünschte funktionelle
Form in Bezug auf die Signalamplitude EIN zu Signalamplitude AUS
kann als Kompressionsverhältnis
implementiert werden, beispielsweise mit einer Nachschlagtabelle. Die
lautesten Töne
werden dadurch begrenzt, dass der Begrunzungspegel innerhalb des
komprimierten Amplitudenbereichs gelegt wird, was die Verständlichkeit
weiter steigert. Dies geschieht durch den Clipper. Das Signal wird
bei einer bestimmten Amplitude (Begrenzungspegel) innerhalb des
komprimierten Amplitudenbereichs begrenzt, wobei die Grenzen, insbesondere
die obere Grenze, auf die Initialisierungszeit gesetzt wird. Die
Kompressionsaktion kann wenigstens teilweise vor oder nach der HP-Filterung
erfolgen, die Verstärkung
an sich (d.h. der Hauptteil der Verstärkung) erfolgt nach der HP-Filterung,
da dies die Entfernung der niedrigeren Frequenzanteile durch die
HP Filterung ist, was die im Schnitt höhere Verstärkung des restlichen Teils
(d.h. Steigerung des (Kopfraums) ermöglicht.
-
Das
Konzept des Begrenzers soll nicht als auf eine harte Begrenzung
beschränkt
verstanden werden (d.h. alle Werte über einem vorbestimmten Wert
C werden gleich C gesetzt), sondern soll auch weiche Begrenzungen
aufweisen, die in einem Subbereich bis zu der hohen Grenze des komprimierten
Amplitudenbereichs ein anderes vorbestimmtes Signalamplitude-EIN/Signalamplitude-AUS
Verhältnis
anwendet.
-
Vorzugsweise
wird der Kompressionsverstärker
vorgesehen nicht zum Verstärkern
eines Signals mit einer Signalstärke
unterhalb eines Schwellenwertes.
-
Unterhalb
eines Schwellenwertes (einer bestimmten minimalen Amplitude) ergibt
sich das Signal wahrscheinlich aus Rauschanteilen. Das nicht Verstärkern derartiger
Signal verbessert die Verständlichkeit,
da die Störung
reduziert wird. Weiterhin lässt
sich die Differenz zwischen Stille und Sprache besser unterscheiden,
was die Verständlichkeit
auch steigert. Die Schwelle kann bei der Auslösungszeit eingestellt werden.
-
Vorzugsweise
umfasst der digitale Schallprozessor ein Tiefpassfilter zur Filterung
des von dem komprimierenden Verstärker gelieferten Signals und
zum Schaffen eines Ausgangssignals, wobei die Durchlassfrequenz
des Tiefpassfilters in dem Bereich 2 kHz-Fs/2 liegt, wobei Fs die
Abtastfrequenz ist.
-
Der
Kompressionsvorgang, aber insbesondere der Begrenzungsvorgang kann
störende Übertöne einführen, welche
die Natürlichkeit
und die Verständlichkeit
des emittierten Tons reduzieren. Weiterhin umfasst durch die Verwendung
des Hochpassfilters das Signal bereits einen relativ hohen Anteil
an HF-Tönen.
Das Tiefpassfilter schneidet die von dem komprimierenden Verstärker erzeugten Übertöne aus oder
reduziert sie, was zu einem mehr natürlichen Schall führt und
die Verständlichkeit
steigert.
-
Das
Hochpassfilter ist vorzugsweise ein Filter erster Ordnung oder zweiter
Ordnung, d.h. ein Filter mit einer relativ allmählichen Neigung. Es ist vorteilhaft,
viel Energie der NF-Anteile des eintreffenden Signals zu entfernen
um Raum für
die Verstärkung
zu schaffen. Ein Filter aber mit einer Neigung, die relativ steil
ist (wobei ein Stufenfilter das meist extreme Beispiel einer derartigen
Filters ist), entfernt soviel der NF-Anteile, dass dies zu einer
unnatürlichen
Stimme führt.
Vorzugsweise umfasst die Anordnung ein Mittel, durch das der Benutzer die
Möglichkeit
hat, die Ordnung und/oder die Grenzfrequenz zu ändern Die Verwendung eines
Hochpassfilters zweiter Ordnung führt zu einer guten Sprachverständlichkeit
und/oder einer guten gehörrichtigen
Lautstärke
des Signals, während
die Verwendung eines Hochpassfilters erster Ordnung den mehr natürlichen
Ton des ursprünglichen
Signals beibehält.
-
Vorzugsweise
umfasst das System und/oder das Programm ein Mittel zur Aktivierung
und/oder Einstellung der Frequenzabhängigkeit des Tiefpassfilters
und/oder des Hochpassfilters zu einer Abhängigkeit von der mittleren
Verstärkung
in der einpegelnden Verstärkungsstufe.
Die mittlere Verstärkung
ist ein Maß für die mittlere
Verstärkung
des Signals und dadurch des Loudnesspegels des emittierten Schallsignals.
Es ist vorteilhaft, wenn die Grenzfrequenz des Hochpassfilters bei
steigendem mittleren Loudnesspegel des emittierten Signals zunimmt
und die Grenzfrequenz des Tiefpassfilters mit steigendem Loudnesspegel
abnimmt.
-
Bei
sehr hohen Verstärkungspegeln
(wie dies passieren könnte,
wenn die Anordnung in einer lauten störungsbehafteten Umgebung verwendet
wird) ist der Einpegelungsvorgang relativ umfangreich, dieser relativ
umfangreiche Einpegelungsvorgang führt eine relativ große Störung des
Signals ein, d.h. die unerwünschten,
unnatürlichen
Obertöne
des Signals enthalten viel Energie. Dies führt zu einem rauen Ton. Die
Rauheit des Tones, wie dies von dem Hörer erfahren wies, führt manchmal
und sogar oft dazu, dass der Hörer
den Lautsprecher, insbesondere bei Mobiltelefonen, in gewissem Abstand
vom Ohr hält.
Abgesehen von der Tatsache, dass der Lautsprecher in gewissem Abstand
vom Ohr gehalten wird, wird an sich zu einer wesentlichen Verringerung
des Störabstandes
führen,
da das Signal reduziert wird und die Störung zunimmt bedeutet die Tatsache,
dass der Schall an sich als rau erfahren wird, im Wesentlichen eine
Reduktion der Verständlichkeit der
gegebenen Nachricht. Für
stimmliche Nachrichten ist die Härte
der Stimme oft ein integraler Teil der Nachricht, welche die sprechende
Person an den Hörer
richten möchte,
manchmal noch wichtiger als die wirklichen Wörter der Nachricht. Deswegen
ist es für
die Verständlichkeit
wichtig, gesehen im Konzept breites als nur ob Wörter verstanden werden, dass
eine klare "natürliche" Übertragung der Stimme erreicht
wird. Bei niedrigeren Verstärkungspegeln
ist der "raue Ton" viel weniger hörbar. Selektive
Aktivierung oder Einstellung der Grenzfrequenz auf einer relativ
niedrige Frequenz des Tiefpassfilters auf hohen Verstärkungspegeln
reduziert den "rauen
Schalleffekt", während auf
niedrigen Verstärkungspegeln
die Notwendigkeit einer Verwendung des Hochpassfilters geringer
ist, und nicht Aktivierung des Hochpassfilters in Wirklichkeit zu
einem mehr natürlichen
Ton führt.
Kurz gesagt bei hohen Verstärkungspegeln
und bei einer starken Einpegelungsaktion ergib sich ein relativ
großer
Teil der Amplitude bei hohen Frequenzen aus künstlichen Artefakten wegen
der Einpegelungsaktion und Entfernung (völlig oder teilweise) der höheren Frequenzen
entfernt die Artefakte, was folglich zu einem mehr natürlichen
Ton führt,
bei relativ niedrigen Verstärkungspegeln
und einer relativ gemäßigten Einpegelungsaktion,
ist wesentlich mehr der Signalamplitude bei hohen Frequenzen von
natürlichem
Ursprung und viel weniger wegen künstlicher Artefakte, so dass
die nicht Verwendung des Tiefpassfilters (oder Einstellung der Grenzfrequenz
auf eine relativ hohe Frequenz dann bevorzugt wird. Durch selektive
Aktivierung des Hochpassfilters abhängig von der Verstärkung ist
eine bessere Tonwiedergabe möglich.
Statt einer Aktivierung/Deaktivierung des Tiefpassfilters (d.h.
eine EIN/AUS-Wahl) kann die Filtercharakteristik des Tiefpassfilters
von der Verstärkung
abhängig
gemacht werden, beispielsweise mit einer Filtergrenzfrequenz von
2 kHz für
eine hohe Verstärkung
(lautstarke Umgebungsstörung)
und Fs/2, oder 4 kHz, für
eine niedrige Verstärkung oder
ohne Umgebungsstörung,
oder mit anderen Worten, wobei die Grenzfrequenz abnimmt, je nachdem
der Loudnesspegel zunimmt.
-
Auf
alternative Weise kann die Anordnung ein Mittel aufweisen zur handmäßigen Einstellung
der Filterkennlinie des Tiefpassfilters, beispielsweise eine Knopf,
der ers ermöglicht,
dass der Benutzer die Filtergrenzfrequenz auf 2, 3 oder 4 kHz einstellt,
und zwar abhängig
von der Verständlichkeit
oder dem Mangel an Verständlichkeit,
oder je nach persönlichen
Vorzügen.
Ein ähnliches
Argument gilt für
das Hochpassfilter, bei niedrigen Verstärkungspegeln ist die Notwendigkeit
der Verwendung eines Hochpassfilters geringer als bei hohen Verstärkungspegeln,
so dass bei niedrigen Verstärkungspegeln
das Hochpassfilter deaktiviert werden kann oder dass ein niedriger
Grenzfrequenzpegel gegeben werden kann, während bei einem hohen Amplitudenpegel
(hohe Loudness) das Hochpassfilter aktiviert werden kann oder die
Grenzfrequenz kann auf eine relativ hohen Wert gesetzt werden, oder
mit anderen Worten, die Grenzfrequenz des Hochpassfilters nimmt
zu, je nachdem der Loudnesspegel zunimmt.
-
In
einer ersten Ausführungsform
umfasst das System das Hochpassfilter mit einer nachfolgenden AVR mit
einem nachfolgenden Begrenzer, vorzugsweise mit einem nachfolgenden
Tiefpassfilter. Diese Ausführungsform
wird bevorzugt, wenn unter Umständen,
in denen die Loudness von höchster
Bedeutung ist. Ein Begrenzer sucht nach Spitzen in dem Audiosignal
und dämpft
den Audioteil um die Spitze herum, wenn die Dämpfung notwendig ist, um den
Begrenzungsbetrag zu begrenzen, während dennoch für sehr laute
Signale Begrenzung gestattet wird.
-
In
einer zweiten Ausführungsform
umfasst das System einen automatischen Lautstärkenausgleicher, dem das Hochpassfilter
vorhergeht, oder vorzugsweise folgt, wobei ein ausgeglichenes Signal
geschaffen wird, mit einem nachfolgenden Verstärker und Begrenzer, dem vorzugsweise
ein Tiefpassfilter folgt. Diese Ausführungsform wird bevorzugt,
wenn geringer rechnerischer Aufwand bevorzugt wird.
-
Eine
(harte) Begrenzung ist ein einfacher Vorgang, bei dem alle Signale über einer
Schwellensignalstärke
auf die genannte bestimmte Schwellensignalstärke redu ziert wird, d.h. es
wird eine maximale Signalstärke
eingestellt. Der Vorteil einer derartigen Ausführungsform ist, dass eine einfache
Anordnung verwendet wird, der Nachteil ist, dass das Signal stärker gestört wird,
da alle Einzelheiten in dem Signal über dem Schwellensignal verloren
gehen.
-
In
bevorzugten Ausführungsformen
umfasst die Anordnung eine Messanordnung, wie ein Mikrophon, zum
Messen der Hintergrundstörpegel.
Die Anordnung umfasst einen Adapter zum Anpassen eines oder mehrerer
Parameter in Abhängigkeit
von dem gemessenen Hintergrundstörpegel.
Der artige Parameter sind beispielsweise die Grenzfrequenz und die
Ordnung des Hochpassfilters, die Grenzfrequenz und die Ordnung des Tiefpassfilters,
die Verstärkung,
der Begrenzungspegel.
-
Vorzugsweise
ist für
einen oder mehrere Parameter die Abhängigkeit von dem gemessenen
Störpegel nicht
linear.
-
Innerhalb
des Konzepts der vorliegenden Erfindung sollen "Begrenzer", "Kompressor", "Verstärker", "Filter", "Wandler", "Vergleichsanordnung" usw. im breiten
Sinne verstanden werden und beispielsweise jedes Stück Hardware
umfassen (wie einen Begrenzer, einen Kompressor, einen Verstärker, usw.),
jede Schaltungsanordnung oder Hilfsschaltungsanordnung, entworfen
zum Durchführen
einer Begrenzungs-, einer Kompressions-, einer Verstärkungsfunktion
usw., wie beschrieben, sowie jedes Stück Software (Computerprogramm oder
Hilfsprogramm oder einen Satz von Computerprogrammen oder Programmcode(s)),
entworfen oder programmiert zum Durchführen eines Begrenzungs-, Kompressions-,
Filtervorgangs nach der vorliegenden Erfindung, sowie jede beliebige
Kombination von Stücken
Hardware und Software, die als solche wirksam sind, allein oder
in Kombination mit einander, ohne dass sie auf die nachstehend gegebenen
Ausführungsbeispiele begrenzt
sind. Ein einziges Programm kann verschiedene Funktionen kombinieren.
-
Die
vorliegende Erfindung ist auch in jedem beliebigen Computerprogramm
mit Programmcodemitteln zum Durchführen eines Verfahrens nach
der vorliegenden Erfindung verkörpert,
wenn das genannte Programm in einem Computer läuft, sowie in jedem beliebigen
Computerprogrammprodukt, das Programmcodemittel aufweist, die auf
einem vom Computer auslesbaren Medium gespeichert sind zum Durchführen eines Verfahrens
nach der vorliegenden Erfindung, wenn das genannte Programm in einem
Computer läuft,
sowie jedes beliebige Programmprodukt mit Programmcodemitteln zur
Verwendung in einem Telefonsystem nach der vorliegenden Erfindung,
zum Durchführen
der für
die Erfindung spezifischen Aktion.
-
Ausführungsbeispiele
der vorliegenden Erfindung sind in der Zeichnung dargestellt und
werden im Folgenden näher
beschrieben. Es zeigen:
-
1 eine
schematische Darstellung eines Systems mit einem Lautsprecher und
einem DSP,
-
2 eine
schematische Darstellung eines DSPs nach der vorliegenden Erfindung,
-
3 zwei
Beispiele von Hochpassfiltern, die nach der vorliegenden Erfindung
verwendet werden können,
-
4 die
Wellenform eines typischen Sprachsignals,
-
5 eine
Darstellung der Wellenform, nachdem diese durch das Hochpassfilter
gefiltert worden ist,
-
6 das
Spektrum der Wellenform nach den 4 und 5,
-
7 eine
Art von Ausführungsformen
nach der vorliegenden Erfindung,
-
8 das
funktionelle Blockschaltbild eines Beispiels einer AVR, wie in 7 schematisch
dargestellt,
-
9 eine
andere Art von Ausführungsform,
-
10 ein
detailliertes Beispiel eines AVL-Elementes, wie in 9 schematisch
angegeben,
-
11 das
AVL-Verhalten des AVL-Elementes nach 10,
-
12 ein
Beispiel eines funktionellen Kompressionsverhältnisses,
-
13 eine
bevorzugte Ausführungsform,
wobei Parameter in Abhängigkeit
von einem gemessenen Rauschpegel angepasst sind,
-
14 eine
Abhängigkeit
erster, zweiter und dritter Ordnung eines Parameters P von dem Rauschpegel
S.
-
Die
vorliegende Erfindung wird nun nachstehend anhand der beiliegenden
Zeichnung näher
beschrieben, wobei bevorzugte Ausführungsformen der vorliegenden
Erfindung dargestellt sind. Diese Erfindung kann aber in vielen
verschiedenen Formen verkörpert
werden und soll nicht als auf die hier beschriebene Ausführungsform
beschränkt
betrachtet werden; stattdessen werden diese Ausführungsformen derart vorgesehen, dass
diese Beschreibung sorgfältig
und komplett ist, und wird dem Fachmann den Rahmen der vorliegenden Erfindung
völlig übertragen.
Gleiche Bezugszeichen bezeichnen entsprechende Elemente.
-
1 zeigt
schematisch ein Tonwiedergabesystem. Ein derartiges System kann
beispielsweise ein zellulares Freisprechfunktelefon mit Lautsprecher
zur Verwendung in einem Kraftwagen. Wenn als Freisprechzellulartelefon
implementiert werden von einem Fernende, d.h. von einer Partei auf
Abstand, empfangene Sprachsignale von einer (nicht dargestellten)
zellularen Basisstation übertragen,
von dem Transceiver des (nicht dargestellten) zellularen Telefon
empfangen und dem Eingang 1 für ein eintreffendes Fernsignal
als Eingangswellenform W zugeführt.
In diesem Beispiel wird vorausgesetzt, dass die Übertragung hin und zurück zwischen
dem System, in diesem Beispiel einem Telefonsystem, und dem fernen
Ende in digitaler Form stattfindet. Wenn die ursprünglichen
Signale in analoger Form sind, umfasst das System einen Analog-Digital-Wandler
um ein digitales Fernsignal zu schaffen, das dann dem Eingang 1 zugeführt wird.
-
Wie
in 1 dargestellt, wird die Wellenform in einem digitalen
Format dem Eingang 1 eines DSPs 2 zugeführt oder
wird damit verbunden, der mit einem digitalen Ausgang 3 verbunden
ist oder der diesen Ausgang enthält.
Der digitale Signalausgang wird mit Hilfe eines Digital-Analog-Wandlers 4 einem
analogen Format zugeführt
und wird in dieses Format umgewandelt und durch den Verstärker 5 zur
Verwendung durch einen Lautsprecher 6 verstärkt. Eine
Schalldruckwelle W1, die für
die Sprache der Fernpartei repräsentativ
ist, wird durch den Lautsprecher 5 emittiert. Auf entsprechende
Weise hört
das Funktelefon Schallwellenformen, die für die Sprache der Fernpartei
repräsentativ
sind.
-
Der
Hörer aber
hört nicht
nur den von dem Lautsprecher erzeugten Schall, sondern auch andere
Geräusche,
die machen können,
dass der von dem Lautsprecher erzeugte Schall schwer verständlich ist,
d.h. eine niedrige Verständlichkeit
hat.
-
Hochschrauben
der Lautstärke
scheint eine erste und auf der Hand liegende Möglichkeit zu sein, um die Verständlichkeit
zu steigern. Aber der maximale Ausgangspegel des Lautsprechers ist
oft begrenzt und ein einfaches Hochschrauben der Lautstärke führt zu mehr
Störung,
und nicht notwendigerweise zu einer besseren Verständlichkeit
des Signals.
-
Zur
Verbesserung der Verständlichkeit
werden in der Anordnung und in dem Verfahren nach der vorliegenden
Erfindung eine Anzahl zusammenarbeitender Maßnahmen getroffen.
-
2 zeigt
sehr schematisch einen DSP (digitalen Schallprozessor) zur Verwendung
in einer Anordnung nach der vorliegenden Erfindung. Der DSP umfasst
ein Hochpassfilter 21 mit einer Grenzfrequenz zwischen
300 Hz und 2 kHz, vorzugsweise zwischen 500 und 1500 Hz, aber noch
lieber zwischen 800 und 1200 Hz. Das Hochpassfilter entfernt oder
reduziert Frequenzanteile unterhalb der Grenzfrequenz f.
-
Der
Hauptteil der Energie des Signals ist dadurch entfernt. Dies ermöglicht es,
dass das restliche Signal viel mehr verstärkt wird (bevor es in die Probleme
Gerät in
Bezug auf eine digitale Begrenzung, d.h. ein Wert höher als
der maximale Wert). Die Verstärkung
erfolgt durch den komprimierenden Verstärker. Innerhalb des Konzeptes
der vorliegenden Erfindung ist ein komprimierender Verstärker ein
Verstärker,
der das Signal verstärkt,
aber aus den mittleren Schallpegel einpegelt, d.h. Töne mit einer
geringen Amplitude werden mehr verstärkt als Töne mit einem hohen Schallpegel,
wodurch auf diese Weise der Signalamplitudenbereich reduziert wird.
Dies kann verschiedenartig erfolgen, beispielsweise mit Hilfe einer
Begrenzungsanordnung, eines Kompressors oder eines AVLs (automatischen
Spannungsreglers) mit einem nachfolgenden Verstärker und Begrenzer. Es können eine
Anzahl verschiedener Techniken angewandt werden, einschließlich der
Verwendung von Nachschlagtabellen zum Durchführen der Verstärkung und
Kompression. Der Amplitudenbereich, insbesondere die obere Grenze
des Bereichs, kann vom Hersteller eingestellt oder durch den Benutzer
beeinflusst werden, beispielsweise mit Hilfe des Loudnessreglers
(eines Knopfes, mit dem der Benutzer die Loudness einstellen kann).
Nachstehend folgen mehrere Beispiele. Im Vergleich zu einer unkomplizierten
linearen Verstärkung
des Signals (d.h. für
alle Schallpegel einen gleichen Verstärkungsfaktor) führt die
komprimierte Verstärkung
zu einer besseren Verständlichkeit
des Schalls. Die Wörter
sind leichter voneinander zu unterscheiden und folglich wird die
Verständlichkeit
des Schalls verbessert. Es kann aber auch zu einer Verzerrung des
Schalls führen,
da die nicht lineare Verstärkung
des Schalls Übertöne einführte (hohe
Frequenzanteile mit der doppelten, dreifachen usw. ursprünglichen
Frequenz), was zu einer gesteigerten Rauheit des Schalls führt. Dies
wird von dem Hörer
als unangenehm erfahren und im Wesentlichen reduziert dies in wesentlichen
Maße die
Verständlichkeit
in breitem Sinne der gesprochenen Nachricht, da die Rauheit der
gesprochenen Wörter oft
ein wesentlicher Aspekt der vokalen Nachricht bildet. Dieser Effekt
ist sogar ohne Begrenzung vorhanden, das Begrenzen an sich führt auch
Obertöne
ein. Verständlichkeit
in breiterem Sinne bezieht sich nicht nur auf die Wörter an
sich, sonder auch auf die Nachricht, die der Sprecher zu dem Hörer übertragen
möchte.
Die Rauheit des Schalls, insbesondere bei einer höheren mittleren
Verstärkung
macht jeden schallzornig, folglich eine starke Reduktion der Feinheit
in Emotionen, die der Sprecher übertragen
möchte.
Die Applikation eines Tiefpassfilters, wie in der bevorzugten Ausführungsform
der Anordnung, dargestellt in 2, nachdem
der komprimierende Verstärker
die erfahrene Härte
der Stimme reduziert, wobei der ursprüngliche emotionelle Inhalt der
gesprochenen Wörter
wenigstens gewissermaßen
wieder hergestellt wird, d.h. wodurch ein mehr natürlicher
Schall gegeben wird. Es sei bemerkt, dass in den meisten westlichen
Sprachen die Tonhöhe
eines Wortes die emotionelle Auswirkung der Wörter beeinflusst, nicht aber
die Bedeutung des Wortes an sich. Es gibt aber Sprachen, in denen
die Tonhöhe
des Wortes eine viel größere Rolle
spielt, was zu einer völlig
anderen Bedeutung für
dasselbe Wort führt,
und zwar abhängig
von der Tonhöhe
des Wortes. Wenn derartige Sprachen verwendet werden (was nicht
ausgeschlossen werden kann), kann die Verwendung eines Tiefpassfilters
noch günstiger
werden. Die vorliegende Erfindung ist insbesondere günstig, wenn
sie im Zusammenhang mit automatischen Spracherkennungssystemen oder
in derartigen Systemen angewandt wird, insbesondere für Sprachen,
in denen die Tonhöhe
des gesprochenen Wortes die Bedeutung desselben beeinflusst. Was
oben in Bezug auf gesprochene Wörter
beschrieben worden ist, d.h. Stimme, gilt auch wenn das Tonwiedergabesystem zum
Wiedergeben von Musik verwendet wird. Auch in der Musik ist die
Art und Weise, wie Musik erfahren wird, selbstverständlich davon
abhängig,
ob die Töne
hören kann,
aber auch die Rauheit des Schalls ist sehr wichtig. Die vorliegende
Erfindung ist folglich, obschon von großer Bedeutung für Systeme,
bei denen mündliche
Nachrichten übertragen
werden, wie Telefonsystemen, nicht auf derartige Systeme beschränkt, Systeme
zum Wiedergeben von Musik können
auf gleiche Weise Vorteile aus der vorliegenden Erfindung ziehen.
-
Der
Einpegelungs- oder Kompressionsvorgang kann vor der Hochpassfilterung
des eintreffenden Signals oder nach derselben erfolgen. Die Verstärkung an
sich erfolgt nach der Hochpassfilterung. Die Begrenzung erfolgt
nach der Verstärkung
oder im Zusammenhang damit. Wenn ein Tiefpassilter verwendet wird,
befindet sich dies hinter dem Begrenzer.
-
3 zeigt
zwei Beispiele von Hochpassfiltern, verwendbar in einem System nach
der vorliegenden Erfindung.
-
Die
linke Seite der Figur zeigt ein Filter erster Ordnung, die rechte
Seite ein Filter zweiter Ordnung. Das dargestellte Hochpassfilter
hat eine Grenzfrequenz f von etwa 1 kHz. Die Hochpassfilter erster
und zweiter Ordnung (die eine relativ mäßige Steigung von 5-15 dB je
Oktave haben werden bevorzugt. Wenn zu viel des NF-Anteils entfernt
wird, führt
dies zu einer sehr unnatürlich
klingenden Stimme (oder unnatürlich
komisch klingenden Musik). Deswegen wird die Ordnung des Hochpassfilters
vorzugsweise auf 2 begrenzt. Auch dies reduziert den erforderlichen
Rechenaufwand. Vorzugsweise kann der Benutzer das Hochpassfilter
von der ersten in die zweite Ordnung und umgekehrt ändern, oder
das System weist einen automatischen Umschaltmechanismus auf, der
abhängig
von dem eintreffenden Signal funktioniert. Die Verwendung eines
Filters zweiter Ordnung führt
zu einer hohen Sprachverständlichkeit
(in begrenztem Sinne, d.h. nur die Wörter) und/oder einer Signallautheit,
während
das Hochpassfilter erster Ordnung den natürlichen Schall des ursprünglichen
Signals besser beibehält.
-
Das
Hochpassfilter kann beispielsweise aus einer Biquad bestehen, deren
Frequenzgrößenreaktion
in
3 dargestellt ist und deren Koeffizienten in der
Tabelle 1 aufgelistet sind, und zwar entsprechend dem nachfolgenden
Format
-
Tabelle
1 – Filterkoeffizienten
der in Fig. 3 dargestellten Hochpassfilter.
-
Die
Effekte der Applikation eines Hochpassfilters sind in den 4, 5 und 6 ersichtlich. 4 zeigt
die Wellenform eines typischen Sprachsignals, 5 die
Wellenform nachdem das Signal durch das Hochpassfilter gefiltert
worden ist (verarbeitet durch ein Hochpassfilter erster Ordnung,
Grenzfrequenz bei 1 kHz).
-
6 zeigt
das Spektrum der in den 4 und 5 dargestellten
Wellenform, wobei die Signalenergie der Wellenform aus 4 in
der oberen Kurve dargestellt ist, die Signalenergie der Wellenform
nach dem Hochpassfilter in der unteren Kurve dargestellt ist. Wie
in 6 ersichtlich, ist die Signalenergie der Wellenform
nach 4 vorwiegend in den niedrigeren Frequenzen (unterhalb
1 kHz) konzentriert.
-
Diese
Frequenzen liefern einen Beitrag vorwiegend zu dem spezifischen
Ton der Stimme, aber weniger zu der Verständlichkeit der Sprache. Diese
Eigenschaft bildet einen Aspekt der vorliegenden Erfindung.
-
Durch
Dämpfung
der niedrigeren Frequenzen wird die Signalamplitude wesentliche
abnehmen, wie in 6 ersichtlich, was Kopfraum
zum verstärken
des restlichen Signals bietet, das relativ mehr Frequenzen enthält, die
einen Beitrag zu der Verständlichkeit
der Sprache liefern, wie in 6 ersichtlich.
-
Wenn
das Sprachsignal nachher komprimiert und verstärkt wird, sogar wenn es begrenzt
wird, wird die Sprachverständlichkeit
besser sein als ohne die Verwendung des Hochpassfilters, und zwar
aus vorwiegend zwei Gründen:
- – das
Signal enthält
relativ mehr Frequenzen, die einen Beitrag zu der Verständlichkeit
der Sprache liefern,
- – die
niedrigen Frequenzen werden weniger hart begrenzt, was zu weniger
Harmonischen führt
(und zwar wegen der Begrenzung), welche die Verständlichkeit
der Sprache stören.
-
Wenn
aber zuviel niedrige Frequenzen entfernt werden wird dies zu einer
sehr unnatürlich
klingenden Stimme führen.
Deswegen wird bevorzugt, dass das Hochpassfilter nur von der ersten
Ordnung ist, beispielsweise ein Butterworth-Filter (IIR Filter erster
Ordnung). Dies hatte den Vorteil eines geringen rechnerischen Stromverbrauchs.
-
7 zeigt
eine Einzelheit in einem System nach einer Ausführungsform der vorliegenden
Erfindung.
-
Der
DSP umfasst ein Hochpassfilter (beispielsweise ein Filter, wie in 3 dargestellt,
in diesem Beispiel beispielsweise ein Butterworth Filter erster
oder zweiter Ordnung mit einem Grenzfrequenzwert von beispielsweise
1 kHz). Dem eine AVR folgt, hinter der ein Begrenzer vorgesehen
ist und zum Schluss ein Tiefpassfilter (LP).
-
In
diesem Beispiel können
alle Audioströme
mono sein. Die Abtastratenfrequenz kann beispielsweise eine der
nachfolgenden Frequenzen sein: 8 kHz, 11,025 kHz, 16 kHz, 22,05
kHz, 32 kHz, 44,1 kHz oder 48 kHz.
-
In
diesem Beispiel funktioniert die AVR auf Blockbasis, was bedeutet,
dass der Verstärkungsfaktor
nur blockartig sich ändert.
Auf diese Weise wird die rechnerische Leistung auf ein Minimum begrenzt.
-
8 zeigt
das funktionelle Blockschaltbild der AVR. Die Verstärkung wird
derart berechnet, dass das RMS des AVR-Ausgangsblocks dem RMS des
AVR-Eingangsblocks nahezu entspricht. Deswegen wird die Beziehung
des Eingangs-RMS zu dem Ausgangs-RMS (d.h. dem Zielwert) mit der
wirklichen Verstärkung
verglichen und diese Verstärkung
wird in Richtung des Zielwertes geregelt. Die Verstärkungsschwankungen
müssen
geglättet
werden, um zuviel Signalverzerrung zu vermeiden, verursacht durch örtliche
Wellenformunterbrechungen an den Blockrändern.
-
Der
Begrenzer steigert den Loudnesspegel indem Signalverzerrung innerhalb
Grenzen gehalten wird, vorzugsweise möglichst niedrig.
-
In
diesem Beispiel ist der Begrenzer eine auf Abtastwerte basierte
Verstärkung.
In üblichen
Kompressionstechniken ist die Verstärkung abhängig von dem verfügbaren Signalkopfraum.
-
Der
Begrenzer kann einen sog. Gipfelfaktor verwenden um die erlaubte
Verstärkung
zu berechnen. Der Gipfelfaktor ist im Wesentlichen die Beziehung
zwischen dem Spitzenwert und dem laufenden RMS-Wert der Signale.
In dem Begrenzer werden Signale mit einem hohen Gipfelfaktor, beispielsweise
Trommelschläge, ohne
stark hörbare
Verzerrung begrenzt. Wenn dies geschieht, kann die Verstärkung auf
einem höheren
Pegel bleiben, wobei der "Pumpeffekt" des üblichen
Kompressors reduziert wird.
-
Die
Verstärkung
wird wie in dem Ausführungsbeispiel
berechnet:
Allererst wird der laufende RMS-Wert des Eingangssignals
berechnet. Dieser RMS-Wert ist ein geglätteter Mittelwert auf Basis
einer jungen "Historie" der Signalwellenform.
Danach wird der Spitzenwert berechnet, und zwar unter Verwendung
einer Vorgriffszeit um auf kommenden Signalspitzen vorzugreifen.
-
Mit
dem RMS- und dem Spitzenwert wird der Gipfelfaktor berechnet. Ein
sog. "Entgipfelungs"-Faktor wird angewandt
um zu spezifizieren, wie hart der Algorithmus spitze Signale begrenzt
(hohe Werte werden mehr Begrenzung ergeben). Nachher wird die Verstärkung berechnet
und mit der maximal erlaubten Verstärkung verglichen, die durch
den Benutzer eingestellt werden kann, und der kleiner Wert der beiden
wird gewählt.
Obschon an dieser Stelle nicht dargestellt, kann die maximal erlaubte
Verstärkungsregelung
ein Eingang für
das Hochpassfilter sein, wobei die Grenzfrequenz eine Funktion (oder
im Allgemeinen eine oder mehrere Kennlinien des Filters, die abgesehen
von dem Wert der Grenzfrequenz auch oder auf alternative Weise beispielsweise
das Umschalten von einem Filter erster Ordnung zu einem Filter zweiter
Ordnung) der maximal erlaubten Verstärkungsregelung ist.
-
Das
Tiefpassfilter LP filtert die hohen Frequenzen mit der Folge eines
mehr natürlichen
Klangs. Obschon an dieser Stelle nicht dargestellt, kann die maximal
erlaubte Verstärkungsregelung
ein Eingang für
das Hochpassfilter sein, wobei die Grenzfrequenz eine Funktion (oder
im Allgemeinen eine oder mehrere Kennlinien des Filters, die nebst
dem Wert der Grenzfrequenz auch oder auf alternative Weise beispielsweise
das Umschalten von der ersten Ordnung in die zweite Ordnung umfassen
könnte)
der maximal erlaubten Verstärkungsregelung
ist.
-
7 und 8 zeigen
einen Typ von Ausführungsformen
der vorliegenden Erfindung, 9 und 10 richten
sich auf einen anderen Typ von Ausführungsformen.
-
Im
Grunde enthalten diese Ausführungsformen
4, vorzugsweise 5, Elemente oder Schritte:
- 1.
einen AVL (automatischen Lautstärke-Einpegler):
der AVL ist ein signalabhängiger
Verarbeitungsblock, der die Lautstärke des eintreffenden Signals
auf einem nahezu konstanten Pegel hält,
- 2. ein Hochpassfilter erster Ordnung: dieses Filter entfernt
einen Teil der niedrigeren Frequenzen, wodurch Kopfraum für die Verstärkung geschaffen
wird,
- 3. eine Verstärkung:
Steigerung des SPLs (Schalldruckpegel) des Signals,
- 4. einen begrenzer, vorzugsweise ein harter Begrenzer, wenn
eine einfache Anordnung bevorzugt wird: das Signal wird auf eine
bestimmte Amplitude begrenzt um einen linearen Betrieb des analogen
Verstärkers
zu gewährleisten
(nach Digital-Analog-Umwandlung). Statt eines harten Begrenzers,
der einfach das Signal über
dem Begrenzungspegel anschneidet, kann auch ein weicher Begrenzer
verwendet werden, der das Signal über einem Begrenzungspegel
abschneidet, aber auch das Signal auf einem Pegel in der Nähe des Begrenzungspegels
dämpft.
Die Verwendung eines weichen Begrenzers stellt das dynamische Verhalten des
Signals gewissermaßen
wieder her, wodurch die Verständlichkeit
gesteigert wird.
- 5. (vorzugsweise) ein Tiefpassfilter erster Ordnung: das Filter
stellt das Gleichgewicht zwischen den Mittenfrequenzen und den hohen
Frequenzen wieder her oder verbessert es wenigstens, wenn der Schall
unnatürlich
und ziemlich rau klingt; dieses Filter macht den verarbeiteten Schall
zum Anhören
angenehmer.
-
In
diesem Beispiel ist der Eingang ein Spracheingang, aber es sei bemerkt,
dass der Eingang jeder beliebige Schalleingang sein kann.
-
10 zeigt
eine detaillierte Darstellung des AVL-Elementes.
-
10 zeigt
das Blockschaltbild des AVLs. Teilung der maximalen Ausgangsamplitude
(in 10 bezeichnet durch: "Reference Clipping Lin") durch den Absolutwert
der maximalen Amplitude des Signals an dem ganzen Eingangsblock
ergibt die Verstärkung,
die ohne jegliche Begrenzung auf den Block angewandt werden kann,
(durch "Instant
gain" bezeichnet).
Der Parameter "GainUpdate" ist typischerweise
1/1000. Auf diese Weise wird das Signal nach der Summe jeden Block
um einen Betrag, abhängig
von der "Instant
gain" erhöht. Dadurch
wird die AVL-Verstärkung
für höhere Werte
der "Instant gain" schneller gesteigert.
-
Da
die mögliche
Verstärkung,
angewandt auf das Eingangssignal ("AVL gain" nicht höher sein soll als ("Instant gain"), wird die kleinere
derselben genommen ("Min"). Der minimale Block
gewährleistet
auch, dass die AVL-Verstärkung
unmittelbar verringert wird, wenn die Amplitude des eintreffenden
Signals ansteigt. Um zu vermeiden, dass lautlose Stellen in dem
Eingangssignal zu sehr verstärkt
werden, wird das Signal nach einem minimalen Block begrenzt (typischerweise
um 12 dB). Es sei bemerkt, dass da die maximale Ausgangsamplitude
nicht unbedingt dem linearen Pegel entsprechend ist, der 0 dB darstellt,
kann die AVL Verstärkung
kleiner als 1 sein.
-
Zuletzt,
wenn die Amplitude des Eingangssignals kleiner ist als ein bestimmter
Wert, beispielsweise der Signal-Rausch-Boden, wird keine Verstärkung angewandt.
Die ist eine sekundäre
Funktionalität,
bei bevorzugten Ausführungsformen,
die auch als eine Funktionalität
bei anderen Typen komprimierender Verstärker angewandt werden kann
um zu vermeiden, dass schwache Eingangssignal verstärkt werden,
Rauschanteile werden dann nicht verstärkt, was die Verständlichkeit
des Schalls steigert.
-
Zahlenbeispiel:
-
- – Abtastrate
ist 8 kHz
- – Blocklänge ist
80 Abtastwerte
- – Wortlänge ist
16 Bit
- – maximale
Ausgangsamplitude ist 32768 (0 dB)
- – Eingangssignal
ist sinusförmig
mit einer Amplitude 32768 (0 dB), Frequenz > 100 Hz wenigstens eine Sinusperiode je
Block)
- – aktuelle
AVL Verstärkung
ist 1 (0 dB)
- – Verstärkungsaktualisierung
= 0,001
- – AVL
Verstärkung
("Old value") ist auf 12 dB begrenzt.
-
Nun
nimmt die Amplitude des Eingangssignals um 40 dB ab (Faktor 100
auf einer linearen Skala). Die nachfolgende Tabelle zeigt, wie die
verschiedenen Signale innerhalb des AVLs sich mit der Zeit ändern.
-
-
Das
AVL-Verhalten ist auch in 11 dargestellt.
-
Die
linke Graphik zeigt die Schrittänderung
der Amplitude der drei Eingangssignale. Die rechte Graphik zeigt,
dass die AVL-Verstärkung
für große Änderungen
in der Amplitude schneller zunimmt. Dies ist eine bevorzugte Ausführungsform,
welche die Verständlichkeit
weiter verbessert.
-
12 zeigt
ein Beispiel einer Kompressionsfunktion. Bis an einen bestimmten
Wert wird das Signal unberührt
gelassen (mit Eins multipliziert) und über diesem Wert wird die Amplitude
des ausgelieferten Signals kleiner als die Amplitude des eingege benen
Signals, d.h. das Signal wird komprimiert. Eine funktionelle Form, die
nur Kompression in den höchsten
Gebieten, wie in 12 anwendet, kann für den Begrenzer
verwendet werden, während
eine funktionelle Form, die eine Kompressionsstrategie über ein
größeres Gebiet
schafft (beispielsweise den ganzen Eingangsbereich), kann für den komprimierenden
Verstärker
verwendet erden.
-
Die
vorliegende Erfindung kann in mehreren Anordnungen angewandt werden.
Die vorliegende Erfindung ist insbesondere nützlich für Freisprechtelefone. Sie ist
aber auch anwendbar für
alle Tonwiedergabesysteme, insbesondere für diejenigen, die in einer
Anordnung mit einer begrenzten Speisespannung und/oder mit einem
kleinen Lautsprecher angewandt werden. Eine Liste etwaiger Applikationen:
- – Handgeräte (Handys,
DECT, usw.);
- – tragbare
Anordnungen, beispielsweise tragbare DVD-Spieler;
- – PDAs,
- – Car
Kits
- – Fernseher;
Computer;
- – Web-Terminals;
- – Anrufbeantworter.
-
In
den bisher gegebenen Beispielen sind die meisten oder alle Daten
und Einstellungen für
die jeweiligen Elemente fest. In bevorzugten Ausführungsformen
der vorliegenden Erfindung aber sind die Einstellungen der jeweiligen
Elemente an eine Messung des Umgebungslärms anpassbar. 13 zeigt
ein derartiges Beispiel. Unter Verwendung einer Messanordnung 130 zum
Messen von Hintergrundlärm,
wie beispielsweise ein separates Mikrophon, und eines Adapters 131 werden
die Einstellungen für
ein oder mehrere verschiedene Elemente (AVL (Verstärkung),
Hochpassfilter (Grenzfrequenz), Verstärkung (G), harte Begrenzung
(Begrenzungspegel), Tiefpassfilter (Grenzfrequenz)) angepasst.
-
Die
verschiedenen Anpassungen sich durch 132 bis 136 bezeichnet.
-
Die
Lärmmessung
kann einen einzigen Datenausdruck der gesamten Störung S geben
oder sie kann eine Lärmzahl
für verschiedene
Rauschbänder
Sf1, Sf2, Sf3 usw. geben. Wenn Lärmzahlen für verschiedene Rauschbänder gemessen
werden kann ein mittlerer oder gesamter Rauschwert berechnet werden,
beispielsweise Sav = ΣSf1,
oder gewichtet ent sprechend einer dB(A) Skala beispielsweise Sav = ΣwiSf1, wobei wi Gewichtungskoeffizienten der dB(A) Skala
sind. Der Rauschpegel wird durch eine Amplitudenmessung gemessen.
-
Die
verschiedenen Anpassungen werden anhand von Beispielen beschrieben.
-
132: Anpassungen
der AVL-Einstellungen:
-
In
dem AVL wird die AVL Verstärkung
begrenzt (siehe 10, AVL Verstärkungsgrenze),
und unterhalb eines bestimmten Pegels wird keine Verstärkung angewandt
(siehe 10, Box unter dem erwähnt ist keine
Verstärkung,
wodurch der Rauschbodenschalter bestimmt wird). Abhängig von
dem gemessenen Rauschwert S wird der Rauschbodenschalter gesteigert
und die Begrenzung der AVL Verstärkung
wird gesteigert.
-
133: Anpassungen
an das Hochpassfilter:
-
Die
Grenzfrequenz wird an den gemessenen Rauschwert angepasst. Je höher der
Rauschpegel, umso höher
die Grenzfrequenz. Für
adaptive Ausführungsformen
kann die Grenzfrequenz auf vorteilhafte Weise über einen größeren Bereich
sich erstrecken als für
nicht adaptive Ausführungsformen.
Während
für nicht adaptive
Ausführungsformen
die Grenzfrequenz auf vorteilhafte Weise zwischen 300 Hz und 2 kHz
sich erstreckt, erstreckt sich für
adaptive Ausführungsformen
die Grenzfrequenz auf vorteilhafte Weise zwischen 50 Hz (für Situationen,
in denen es im Wesentlichen keine Rauschwerte gibt) und typischerweise
2 kHz für
Situationen mit einem hohen Rauschpegel.
-
In
der adaptiven Verarbeitungsmode wird die Filtergrenzfrequenz auf
diese Weise entsprechend dem Betrag an Umgebungslärm aktualisiert
und erstreckt sich typischerweise von einem sehr niedrigen Wert,
beispielsweise 50 Hz (kein Umgebungslärm) bis 20 kHz (starker Umgebungslärm). In
lautstarken Umgebungen werden mehr niedriger Frequenzen entfernt
um mehr Kopfraum zum Verstärkern
des Signals nachher zu schaffen. Ein Maximum von 2 kHz wird empfohlen
um eine Entfernung von Frequenzen zu vermeiden, die einen Beitrag
zu der Verständlichkeit
von Sprache liefern. Die Filterkoeffizienten werden in Laufzeit
berechnet.
-
Die
Beziehung zwischen der Grenzfrequenz und dem Rauschpegel wird vorzugsweise
wie folgt eingestellt: fcut-off = f0 + Δf
(S) wobei f0 die untere Rauschgrenze ist
(bei spielsweise (50, 100 oder 300 Hz) und Δf ist eine höher als lineare Funktion des
Rauschpegels ist (proportional zu S', wobei i größer ist als 1).
-
In
einer komplexeren Ausführungsform
kann nicht nur die Grenzfrequenz von dem gemessenen Rauschpegel
abhängig
sein, sondern auch die Form der Filterfunktion, beispielsweise ob
die Filterfunktion eine Filterfunktion erster oder zweiter Ordnung
ist.
-
134: Anpassungen
für die
Verstärkung
G.
-
Die
Verstärkung
G wird gesteigert, je nachdem der Rauschpegel steigt. Aber die Verstärkung steigt vorzugsweise
nicht linear mit dem Rauschpegel, sondern vielmehr wie folgt:
G(S)
= G0 + cSi, wobei
1 mehr ist als 1, beispielsweise 2 oder 3, und c eine Konstante
ist, wobei c Null sein kann unterhalb eines Schwellenwertes von
S. Eine einfache Beziehung ist beispielsweise G(S) = G0 +
cS2, d.h. die Verstärkung ist nicht linear abhängig von
dem Rauschwert, sondern bleibt auf dem Nennwert oder bleibt nahe
an demselben um bei hohen Rauschpegeln schnell zuzunehmen.
-
Die
Zunahme der Verstärkung
hat einen positiven Effekt, aber auch einen negativen. Durch nicht
lineare Steigerung der Verstärkung
als eine nicht lineare Rauschfunktion, kann ein besseres Gleichgewicht
zwischen dem positiven und negativen Effekt erzielt werden.
-
Der
Wert der Verstärkung
wird beispielsweise an den Betrag des Umgebungslärms angepasst (in der adaptiven
Verarbeitungsmode), der sich von 0 dB bis +18 dB erstreckt.
-
135: Anpassungen
für den
Begrenzer:
-
Der
Begrenzungsvorgang wird gesteigert, je nachdem der Rauschpegel ansteigt.
Dies ist vorzugsweise eine nicht lineare Rauschfunktion. Der maximale
Pegel, über
dem das Signal begrenzt wird, kann für hohe Rauschpegel um 12 dB
reduziert werden. So kann beispielsweise ohne Lärm der digitale Begrenzungspegel 0
dB sein, während
bei hohen Rauschpegeln die Begrenzung auf –12 dB gesetzt wird.
-
136: Anpassungen
für das
Tiefpassfilter.
-
Beim
Fehlen von Rauschwerten wird die Grenzfrequenz auf eine hohe Grenze
gesetzt, beispielsweise Fs/2. Für maximale
Rauschwerte wird die Grenzfrequenz auf eine niedrigere Grenze gesetzt,
beispielsweise 2 kHz.
-
In
der adaptiven Verarbeitungsmode wird die Filtergrenzfrequenz entsprechend
dem Betrag an Umgebungslärm
aktualisiert, und erstreckt sich beispielsweise von 3,900 kHz (kein
Umgebungslärm)
bis 2 kHz (starker Umgebungslärm)
für Schmalbandsprachapplikationen
(Abtastfrequenz ist 8 kHz). Die Filterkoeffizienten werden in Laufzeit
berechnet.
-
Vorzugsweise
ist das funktionelle Verhältnis
zwischen dem gemessenen Rauschpegel und der Grenzfrequenz fcut-offLP = L0LP – ΔfLP, wobei ΔfLP eine nicht lineare Funktion des gemessenen
Rauschpegels ist, beispielsweise proportional zu der Quadratur des
Rauschpegels.
-
In
diesen Ausführungsformen
wird der verwendete Algorithmus entworfen um adaptiv zu arbeiten,
betrieben durch den Betrag an Umgebungslärm (Nah-Ende). Dies führt zu einem
benutzerfreundlichen Anordnungsmerkmal, das es ermöglicht,
dass der Benutzer die Anordnung (beispielsweise eine GSM) unter
verschiedenen Umständen
in Bezug auf Umgebungslärm
verwenden kann, ohne dass eine weitere Interaktion zur Steuerung
des GSM Lautstärkepegels
erforderlich ist.
-
Wenn
in der adaptiven Verarbeitungsmode verwendet, werden die Parameter
der Verarbeitungsblöcke für eintreffende
Abtastwerte entsprechend dem Umgebungslärm angepasst. Der Algorithmus
passt Parameter entsprechend dem Umgebungslärm an. Der Betrag an Lärm kann
durch ein separates Mikrophon gemessen werden oder unter Verwendung
des Anordnungsmikrophons (GSM) (für eine einzelne Mikrophonapplikation) geschätzt werden.
-
Das
Hauptziel der vorliegenden Erfindung ist und bleibt Sprachverständlichkeit.
Die hat eine höhere Priorität als die
Natürlichkeit
und die Wärme
der Stimme. Wenn der Umgebungslärm
abnimmt (wobei in der adaptiven Verarbeitungsmode gearbeitet wird),
werden die Parameter vorzugsweise sehr schnell angepasst, so dass
die Natürlichkeit
und Wärme
des eintreffenden Signals wiederhergestellt werden.
-
In
der adaptiven Mode beeinflusst der Umgebungslärm die jeweiligen Verarbeitungsblockparameter. Der
Lärm kann
sich von "kein Umgebungslärm" bis "starker Umgebungslärm" erstrecken.
-
Der
Term "kein Umgebungslärm" bedeutet nicht eine
völlige
Stille, sondern normale Geräusche
wie Ventilatorgeräusche,
Hintergrundmusik, usw. In einer typischen Umgebung ist der Hintergrundlärm typischerweise
um 50 dB (A). Der Term "starker
Hintergrundlärm" bezieht sich auf
den Lärm
eines vorüber
donnernden Zuges, Lärm
innerhalb einer Disko, usw. Dieser Lärm kann auf 100 dB (A) gemessen
werden.
-
Der
Lärm kann
durch Messung der spektralen Amplitudeninformation des Umgebungslärms gemessen
werden und durch Berechnung eines einzigen Wertes, der den Lärmbetrag
darstellt. Ein oder mehrere, vorzugsweise die meisten, aber noch
besser alle Parameter der jeweiligen Elemente (AVL, Hochpassfilter,
Verstärker,
Begrenzer, Tiefpassfilter) werden entsprechend diesem einzigen Wert
durch Interpolation zwischen den minimalen und maximalen Wert angepasst.
-
Wie
oben erläutert,
ist diese Interpolation nicht unbedingt linear. Tests, bei denen
lineare Interpolation angewandt wurden, zeigten, dass für "mittleren" Umgebungslärm der Algorithmuseffekt
zu groß war.
-
Durch
Anwendung einer höheren
Interpolation, beispielsweise zweiter oder dritter Ordnung, ist
der Effekt im Vergleich zu der linearen Interpolation für denselben
Umgebungslärm
linear. Für
starken Umgebungslärm
ist der Effekt gleich.
-
14 zeigt
das adaptive Verhalten eines Parameters (beispielsweise die Verstärkung G,
eine Grenzfrequenz, den Begrenzungspegel). Der Parameter P variiert
in diesem Beispiel zwischen einem niedrigeren Grenzwert Plow in diesem Beispiel 2, und einem hohen
Grenzwert Phigh, in diesem Beispiel 7, als
eine Funktion des gemessenen Rauschpegels, in diesem Beispiel der
mittleren Rauschamplitude S. Die jeweiligen Kurven mit der Bezeichnung
1, 2 und 3 geben eine Abhängigkeit
des Parameters erster (linear), zweiter (quadratisch) und dritter
Ordnung von dem gemessenen Rauschpegel. Je höher die Ordnung, umso ausdrücklicher
der adaptive Effekt bei hohe Rauschpegeln.
-
Zusammengefasst
kann die vorliegende Erfindung wie folgt beschrieben werden:
Ein
Tonwiedergabesystem umfasst einen digitalen Audiosignaleingang (1),
einen digitalen Audiosignalprozessor (2, DSP) und einen
digitalen Audiosignalausgang (1), wobei der digitale Signalprozessor
(2, DSP) ein Hochpassfilter (21) mit einer Durchlassfrequenz
(f) zwischen 300 Hz und 2 kHz, einen Kompressionsverstärker (22)
zur Kompression und Verstärkung
eines Signals innerhalb eines Signalamplitudenbereichs und einen
Begrenzer zum begrenzen des Signals über einem Begrenzungspegel,
und vorzugsweise ein Tiefpassfilter (23) zum Filtern des
von dem Kompressionsverstärker
gelieferten Signals und zum Schaffen eines Ausgangssignals aufweist,
wobei die Durchlassfrequenz des Tiefpassfilters (f) in dem Bereich
von 2 kHz-Fs/2 liegt, wobei Fs die Abtastfrequenz ist. Fs/2 kann
beispielsweise 4 kHz sein.
-
Im
Rahmen der vorliegenden Erfindung, wie in den beiliegenden Patentansprüchen definiert,
sind viele weitere Abwandlungen möglich.
-
Text in der Zeichnung.
-
3
-
- Größe (dB)
- Frequenz (kHz)
-
7
-
- Eingang
- Hochpassfilter
- HP Eingang
- AVR Ausgang
- HP Ausgang
- Begrenzer
- Aus
- Tiefpassfilter
- Ausgang
-
8
-
- HP Eingang
- HP Ausgang
- Teilen
- Multiplizieren
- Produkt
- AVR Ausgang
-
9
-
- Spracheingang
- HP Filter
- Verstärkung
- Harte Begrenzung
- Tiefpassfilter
- Sprachausgang
-
10
-
- Eingangssignal Teilung
- Verstärkungsaktualisierung
- Eingangssignal
- Keine Verstärkung
- Anwendung AVL Verstärkung
- AVL Ausgang
-
11
-
- AVL Eingangsamplitudenschritt
- Eingangsamplitude (dB)
- Zeit
- AVL Verstärkung
- Zeit
-
13
-
- Spracheingang
- Umschaltung zur Umleitung des Hochpassfilters
- Umschaltung zur Umleitung des Tiefpassfilters
- Verstärkung
- Harte Begrenzung
- Tiefpassfilter
- Sprachausgang